CN112930359A - 蛋白质的分泌生产方法 - Google Patents

蛋白质的分泌生产方法 Download PDF

Info

Publication number
CN112930359A
CN112930359A CN201980069863.5A CN201980069863A CN112930359A CN 112930359 A CN112930359 A CN 112930359A CN 201980069863 A CN201980069863 A CN 201980069863A CN 112930359 A CN112930359 A CN 112930359A
Authority
CN
China
Prior art keywords
protein
gene
amino acid
ala
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980069863.5A
Other languages
English (en)
Inventor
松田吉彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN112930359A publication Critical patent/CN112930359A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0044Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on other nitrogen compounds as donors (1.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • C12N9/1044Protein-glutamine gamma-glutamyltransferase (2.3.2.13), i.e. transglutaminase or factor XIII
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/80Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/86Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in cyclic amides, e.g. penicillinase (3.5.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21014Microbial serine proteases (3.4.21.14)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/036Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/15Corynebacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y107/00Oxidoreductases acting on other nitrogenous compounds as donors (1.7)
    • C12Y107/02Oxidoreductases acting on other nitrogenous compounds as donors (1.7) with a cytochrome as acceptor (1.7.2)
    • C12Y107/02003Trimethylamine-N-oxide reductase (cytochrome c)(1.7.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/02Aminoacyltransferases (2.3.2)
    • C12Y203/02013Protein-glutamine gamma-glutamyltransferase (2.3.2.13), i.e. transglutaminase or factor XIII
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/13Protein-histidine kinases (2.7.13)
    • C12Y207/13003Histidine kinase (2.7.13.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21089Signal peptidase I (3.4.21.89)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/01Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in linear amides (3.5.1)
    • C12Y305/01044Protein-glutamine glutaminase (3.5.1.44)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/02Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amides (3.5.2)
    • C12Y305/02006Beta-lactamase (3.5.2.6)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Toxicology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明开发降低TorA信号肽的残余的新型的技术,并且提供通过棒状细菌并利用了TorA信号肽的高效的异源蛋白质的分泌生产方法。本发明通过利用TorA信号肽,培养具有分泌生产异源蛋白质的能力并且以使得LepB蛋白质的活性升高的方式进行了修饰的棒状细菌,来分泌生产异源蛋白质。

Description

蛋白质的分泌生产方法
技术领域
本发明涉及异源蛋白质的分泌生产方法。
背景技术
作为异源蛋白质的分泌生产方法,例如,已知有将棒状细菌等的微生物设为表达宿主的方法。为了高效分泌生产异源蛋白质,例如,可利用信号肽(也称为“信号序列”)。即,可通过将与宿主具有的蛋白质分泌途径相对应的信号肽与N末端融合并表达异源蛋白质,来高效地分泌生产异源蛋白质。
通常性的蛋白质分泌途径是广泛存在于原核生物至真核生物的被称为Sec系统的途径。在通过使用了Sec系统的棒状细菌进行的异源蛋白质的分泌生产中,例如,可通过在信号肽和异源蛋白质之间插入包含Gln-Glu-Thr或Ala-Glu-Thr的氨基酸序列来提高异源蛋白质的分泌生产。
另一方面,近年,在植物细胞的叶绿体的类囊体膜中发现了完全不同于Sec系统的蛋白质分泌途径(非专利文献1)。就该新型的分泌途径而言,由于其分泌的蛋白质的信号肽中共通存在有精氨酸-精氨酸的序列(非专利文献1),因此称为Tat系统(Twin-ArginineTranslocation system)。已知,在Sec系统的情况下蛋白质在形成高级结构前的状态下被分泌,而在Tat系统的情况下蛋白质在细胞内形成高级结构后通过细胞膜而被分泌(非专利文献2)。棒状细菌中,也报告有利用了TorA信号肽等的Tat系统依赖性信号肽的蛋白质的分泌生产(专利文献1、2等)。
信号肽,通常在蛋白质分泌到细胞外时被信号肽酶在C末端剪切而从蛋白质中除去。另一方面,蛋白质的分泌生产中,有时存在信号肽未被剪切而发生蛋白质积蓄在细胞内这样的问题的情况。该情况下,已知可通过高表达LepB蛋白质等的信号肽酶来提高蛋白质的分泌效率(专利文献3~8、非专利文献3~7)。
然而,尚未发现信号肽未在C末端被剪切而是在其内部被剪切,使得蛋白质在保持有信号肽的C末端侧部分序列的情况下被分泌至细胞外的现象。
现有技术文献
专利文献
专利文献1:WO2013/118544
专利文献2:日本专利第4730302号
专利文献3:EP444759
专利文献4:EP974654
专利文献5:WO2004/007740
专利文献6:DE102004035543
专利文献7:KR101077783
专利文献8:CN104611317
非专利文献
非专利文献1:EMBO J.,14,2715-2722(1995)
非专利文献2:J.Biol.Chem.,25;273(52),34868-74(1998)
非专利文献3:Biochem Biophys Res Commun.1999 255(2):444-50.
非专利文献4:Biotechnol Bioeng.2005 91(5):616-21.
非专利文献5:J Microbiol Biotechnol.2007Aug;17(8):1316-23.
非专利文献6:J Biol Chem.2011Dec 23;286(51):43601-10.
非专利文献7:J Appl Microbiol.2016Sep;121(3):704-12.
发明内容
发明所解决的技术问题
本发明人发现了,在通过棒状细菌并利用了TorA信号肽的异源蛋白质的分泌生产中,TorA信号肽未在正确的位置被剪切而产生C末端侧15残基的残余(mis-cleavage)。本发明的技术问题在于,开发降低TorA信号肽的残余的新型的技术,并且提供通过棒状细菌并利用了TorA信号肽的高效的异源蛋白质的分泌生产方法。
解决问题的技术手段
本发明人为了解决所述问题而进行深入研究的结果,发现了:通过对棒状细菌进行修饰使LepB蛋白质的活性提高,能够在通过该细菌并利用了TorA信号肽的异源蛋白质的分泌生产中降低TorA信号肽的残余,从而完成了本发明。
即,本发明如下所述。
[1]一种异源蛋白质的制造方法,其包含:
培养具有用于分泌表达异源蛋白质的基因构建体的棒状细菌;和
回收通过分泌生产而产生的异源蛋白质,
所述方法中,对所述棒状细菌进行了修饰,以使其与未修饰菌株相比,LepB蛋白质的活性升高,
所述基因构建体在5’至3’的方向上包含:在棒状细菌中发挥功能的启动子序列、编码TorA信号肽的核酸序列和编码异源蛋白质的核酸序列,
所述异源蛋白质作为与所述TorA信号肽的融合蛋白进行表达。
[2]上述方法,其中,
所述LepB蛋白质是下述(a)、(b)或(c)所述的蛋白质:
(a)包含序列编号2表示的氨基酸序列的蛋白质;
(b)包含下述氨基酸序列并且具有针对TorA信号肽的信号肽酶活性的蛋白质,所述氨基酸序列是在序列编号2表示的氨基酸序列中包含1~10个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列;
(c)包含相对于序列编号2表示的氨基酸序列具有90%以上的一致性的氨基酸序列并且具有针对TorA信号肽的信号肽酶活性的蛋白质。
[3]上述方法,其中,
通过提高lepB基因的表达,而提高了所述LepB蛋白质的活性。
[4]上述方法,其中,
所述lepB基因的表达,通过提高该基因的拷贝数和/或修饰该基因的表达调节序列而得到了提高。
[5]上述方法,其中,
所述TorA信号肽是下述(a)、(b)或(c)所述的肽:
(a)包含序列编号46表示的氨基酸序列的肽;
(b)包含下述氨基酸序列并且具有作为Tat系统依赖性信号肽的功能的肽,所述氨基酸序列是在序列编号46表示的氨基酸序列中包含1~3个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列;
(c)包含相对于序列编号46表示的氨基酸序列具有90%以上的一致性的氨基酸序列并且具有作为Tat系统依赖性信号肽的功能的肽。
[6]上述方法,其中,
所述TorA信号肽包含序列编号46表示的氨基酸序列。
[7]上述方法,其中,
所述通过分泌生产而产生的异源蛋白质是完全除去了所述TorA信号肽的异源蛋白质。
[8]上述方法,其中,
对所述棒状细菌进一步进行了修饰,以使其保持编码变异型PhoS蛋白质的phoS基因。
[9]上述方法,其中,
所述变异是野生型PhoS蛋白质中与序列编号29的302位的色氨酸残基相对应的氨基酸残基被芳香族氨基酸和组氨酸以外的氨基酸残基取代的变异。
[10]上述方法,其中,
所述芳香族氨基酸和组氨酸以外的氨基酸残基是赖氨酸残基、丙氨酸残基、缬氨酸残基、丝氨酸残基、半胱氨酸残基、甲硫氨酸残基、天冬氨酸残基或天冬酰胺残基。
[11]上述方法,其中,
所述野生型PhoS蛋白质是下述(a)、(b)或(c)所述的蛋白质:
(a)包含序列编号29~34中任一项表示的氨基酸序列的蛋白质;
(b)包含下述氨基酸序列并且具有作为PhoRS系统的传感器激酶的功能的蛋白质,所述氨基酸序列是在序列编号29~34中任一项表示的氨基酸序列中包含1~10个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列;
(c)包含相对于序列编号29~34中任一项表示的氨基酸序列具有90%以上的一致性的氨基酸序列并且具有作为PhoRS系统的传感器激酶的功能的蛋白质。
[12]上述方法,其中,
对所述棒状细菌进一步进行了修饰,使其与未修饰菌株相比,选自编码Tat分泌系统的基因中的1种以上的基因的表达升高。
[13]上述方法,其中,
所述编码Tat分泌系统的基因包含tatA基因、tatB基因、tatC基因和tatE基因。
[14]上述方法,其中,
所述棒状细菌是棒状杆菌属细菌。
[15]上述方法,其中,
所述棒状细菌是谷氨酸棒杆菌。
[16]上述方法,其中,
所述棒状细菌是源自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株或源自谷氨酸棒杆菌ATCC 13869的修饰菌株。
[17]上述方法,其中,
所述棒状细菌是细胞表层蛋白在细胞中的平均分子数相比于未修饰菌株得到了降低的棒状细菌。
附图说明
[图1]表示载体的结构的图。
[图2]表示在谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其lepB基因表达增强菌株中表达融合有TorA信号肽的PTG(带有Pro结构部的谷氨酰胺转胺酶)时的SDS-PAGE的结果的照片。图中的氨基酸序列示于序列编号54。
[图3]表示在谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其lepB基因表达增强菌株中表达融合有TorA信号肽的PPG(带有Pro结构部的蛋白质谷氨酰胺酶)时的SDS-PAGE的结果的照片。图中的氨基酸序列示于序列编号55。
[图4]表示在谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其lepB基因表达增强菌株中表达融合有TorA信号肽的Bla(β-内酰胺酶)时的SDS-PAGE的结果的照片。图中的氨基酸序列示于序列编号56。
[图5]表示在谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其lepB基因表达增强菌株中表达融合有TorA信号肽的Trx(硫氧还蛋白)时的SDS-PAGE的结果的照片。图中的氨基酸序列示于序列编号57。
[图6]表示在谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其lepB基因表达增强菌株中表达融合有TorA信号肽的LFABP(肝型脂肪酸结合蛋白,Liver-type fatty acid-binding protein)时的SDS-PAGE的结果的照片。图中的氨基酸序列示于序列编号58和59。
[图7]表示在谷氨酸棒杆菌YDK010::phoS(W302C)菌株及其lepB基因表达增强菌株中表达融合有SlpA信号肽的PTG(带有Pro结构部的谷氨酰胺转胺酶)时的SDS-PAGE的结果的照片。图中的氨基酸序列示于序列编号54。
本发明的具体实施方式
下文中,对于本发明详细地进行说明。
本发明的方法是一种异源蛋白质的制造方法,其包含:培养具有用于分泌表达异源蛋白质的基因构建体的棒状细菌;和回收通过分泌生产而产生的异源蛋白质,其中,所述棒状细菌被修饰以提高LepB蛋白质的活性,TorA信号肽用于异源蛋白质的分泌生产。
本发明的方法中,能够降低TorA信号肽的残余,因此能够分泌生产完全剪切型(completely-cleaved form)的异源蛋白质。即,本发明的方法中分泌生产的“异源蛋白质”,如果没有特别说明,则是指完全剪切型的异源蛋白质。“完全剪切型的异源蛋白质”是指,完全除去了TorA信号肽的异源蛋白质,即完全不保留有TorA信号肽的异源蛋白质。
<1>本发明的方法中使用的棒状细菌
本发明的方法中使用的棒状细菌是具有用于分泌表达异源蛋白质的基因构建体的棒状细菌,并且是进行了修饰以使得LepB蛋白质的活性升高的棒状细菌。需要说明的是,本发明的方法中使用的棒状细菌也称为“本发明的细菌”或“本发明的棒状细菌”。此外,本发明的细菌具有的用于分泌表达异源蛋白质的基因构建体也称为“本发明中使用的基因构建体”。此外,本发明的细菌或用于构建它们的菌株也称为“宿主”。
<1-1>具有分泌生产异源蛋白质的能力的棒状细菌
本发明的棒状细菌具有分泌生产异源蛋白质(具体而言,完全剪切型的异源蛋白质)的能力。本发明的棒状细菌,至少具有用于分泌表达异源蛋白质的基因构建体(本发明中使用的基因构建体),因此具有分泌生产异源蛋白质的能力。本发明的棒状细菌,具体而言,可通过具有用于分泌表达异源蛋白质的基因构建体或具有用于分泌表达异源蛋白质的基因构建体与其他性质的组合,而具有分泌生产异源蛋白质的能力。
在本发明中,蛋白质被“分泌”的表述是指,蛋白质被转运出细菌菌体外(细胞外)。作为细菌菌体外(细胞外)的位置,可举出:培养基中和菌体表层。即,分泌的蛋白质分子例如可以存在于培养基中,也可以存在于菌体表层,还可以存在于培养基和菌体表层这两者中。即,蛋白质被“分泌”的表述不限于蛋白质的全部分子最终以完全游离形式存在于培养基中的情况,例如还包括蛋白质的全部分子存在于菌体表层的情况、以及蛋白质分子的一部分存在于培养基中而蛋白质分子的剩余部分存在于菌体表层的情况。
即,在本发明中,“分泌产生异源蛋白质的能力”是指,当在培养基中培养本发明的细菌时,本发明的细菌分泌异源蛋白质到培养基和/或菌体表层,并蓄积到异源蛋白质可以从培养基和/或菌体表层收集的程度的能力。例如就培养基中的蓄积量而言,蓄积量优选为10μg/L以上,更优选为1mg/L以上,特别优选为100mg/L以上,进一步优选为1g/L以上。此外,蓄积量,例如,就菌体表层中的蓄积量而言,当收集菌体表层中的异源蛋白质并将其悬浮在与培养基等量的液体中时,悬浮液中异源蛋白质的浓度优选为10μg/L以上,更优选为1mg/L以上,特别优选为100mg/L以上。需要说明的是,在本发明中,分泌产生的“蛋白质”包括被称为寡肽和多肽等肽的概念。
本发明中,“异源蛋白质(heterologous protein)”是指相对于表达和分泌该蛋白质的棒状细菌而言为外源性(exogenous)的蛋白质。例如,异源蛋白质可以是源自微生物的蛋白质、源自植物的蛋白质、源自动物的蛋白质、源自病毒的蛋白质、甚至是氨基酸序列由人工设计而成的蛋白质。特别是,异源蛋白质可以为源自人的蛋白质。异源蛋白质可以是单体蛋白质(monomeric protein)或多聚体蛋白质(multimeric protein)。“多聚体蛋白质”指可作为包含两个或多个亚基的多聚体而存在的蛋白质。在多聚体中,各亚基可以通过二硫键等共价键实现连接;可以通过氢键和疏水性相互作用等非共价键实现连接,或者可以通过它们的组合实现连接。在多聚体中优选包含一个或多个分子间二硫键。多聚体可以是包含单一种类的亚基的同源多聚体,也可以是包含两种以上的亚基的异源多聚体。需要说明的是,在多聚体蛋白质是异源多聚体的情况下,构成多聚体的亚基中的至少一个亚基是异源蛋白质即可。即,所有亚基可以是异源的,或者仅一部分亚基是异源的。异源蛋白质可以是天然的具有分泌性的蛋白质,也可以是天然的不具有分泌性的蛋白质,优选其是天然的具有分泌性的蛋白质。此外,异源蛋白质可以是天然的Tat系统依赖性分泌性蛋白质,也可以是天然的Sec系统依赖性分泌性蛋白质。下文中对“异源蛋白质”的具体实例进行描述。
要生产的异源蛋白质可以是单独一种或者两种以上。此外,当异源蛋白质是异源多聚体时,可以仅生产一种类型的亚基,也可以生产两种以上类型的亚基。即,“分泌产生异源蛋白质”包括分泌产生构成目标异源蛋白质的亚基中的所有亚基的情况,也包括分泌产生构成目标异源蛋白质中的仅一部分亚基的情况。
棒状细菌是需氧革兰氏阳性杆菌。作为棒状细菌,可举出:棒杆菌(Corynebacterium)属细菌、短杆菌属(Brevibacterium)细菌、细杆菌(Microbacterium)属细菌等。与传统用于异源蛋白质分泌生产的丝状真菌、酵母、芽孢杆菌(Bacillus)属细菌等相比,使用棒状细菌的优点可举出:它们固有性地向菌体外分泌的蛋白质的量非常少,因此能够期待会简化或省略分泌产生异源蛋白质时的纯化过程,此外,它们可以在含有糖、氨、以及无机盐等简单的培养基中良好地生长,因此在培养基成本、培养方法以及培养生产性方面优异。
棒状细菌的具体实例包括以下种类:
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)
醋谷棒杆菌(Corynebacterium acetoglutamicum)
解烷棒杆菌(Corynebacterium alkanolyticum)
美棒杆菌(Corynebacterium callunae)
钝齿棒杆菌(Corynebacterium crenatum)
谷氨酸棒杆菌(Corynebacterium glutamicum)
百合棒杆菌(Corynebacterium lilium)
栖糖蜜棒杆菌(Corynebacterium melassecola)
嗜热产氨棒杆菌(Corynebacterium thermoaminogenes(有效棒杆菌,Corynebacterium efficiens))
力士棒杆菌(Corynebacterium herculis)
二歧短杆菌(Brevibacterium divaricatum(谷氨酸棒杆菌,Corynebacteriumglutamicum))
黄色短杆菌(Brevibacterium flavum(谷氨酸棒杆菌,Corynebacteriumglutamicum))
乳发酵短杆菌(Brevibacterium immariophilum)
乳糖发酵短杆菌(Brevibacterium lactofermentum(谷氨酸棒杆菌,Corynebacterium glutamicum))
玫瑰色短杆菌(Brevibacterium roseum)
解糖短杆菌(Brevibacterium saccharolyticum)
生硫短杆菌(Brevibacterium thiogenitalis)
产氨棒杆菌(Corynebacterium ammoniagenes(停滞棒杆菌,Corynebacteriumstationis))
白短杆菌(Brevibacterium album)
蜡状短杆菌(Brevibacterium cerinum)
嗜氨微杆菌(Microbacterium ammoniaphilum)
棒状细菌的具体实例包括以下菌株:
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC 13870
醋谷棒杆菌(Corynebacterium acetoglutamicum)ATCC 15806
解烷棒杆菌(Corynebacterium alkanolyticum)ATCC 21511
美棒杆菌(Corynebacterium callunae)ATCC 15991
钝齿棒杆菌(Corynebacterium crenatum)AS1.542
谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC 13020、ATCC 13032、ATCC13060、ATCC 13869、FERM BP-734
百合棒杆菌(Corynebacterium lilium)ATCC 15990
栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC 17965
嗜热产氨棒杆菌(Corynebacterium thermoaminogenes(有效棒杆菌,Corynebacterium efficiens))AJ12340(FERM BP-1539)
力士棒杆菌(Corynebacterium herculis)ATCC 13868
二歧短杆菌(Brevibacterium divaricatum(谷氨酸棒杆菌,Corynebacteriumglutamicum))ATCC 14020
黄色短杆菌(Brevibacterium flavum(谷氨酸棒杆菌,Corynebacteriumglutamicum))ATCC 13826,ATCC 14067,AJ12418(FERM BP-2205)
未成熟短杆菌(Brevibacterium immariophilum)ATCC 14068
乳糖发酵短杆菌(Brevibacterium lactofermentum(谷氨酸棒杆菌,Corynebacterium glutamicum))ATCC 13869
玫瑰色短杆菌(Brevibacterium roseum)ATCC 13825
解糖短杆菌(Brevibacterium saccharolyticum)ATCC 14066
生硫短杆菌(Brevibacterium thiogenitalis)ATCC 19240
产氨棒杆菌(Corynebacterium ammoniagenes(停滞棒杆菌,Corynebacteriumstationis))ATCC 6871,ATCC 6872
白短杆菌(Brevibacterium album)ATCC 15111
蜡状短杆菌(Brevibacterium cerinum)ATCC 15112
嗜氨微杆菌(Microbacterium ammoniaphilum)ATCC 15354
需要说明的是,棒杆菌属细菌包括以前归类为短杆菌属但目前已合并到到棒杆菌属的细菌(Int.J.Syst.Bacteriol.,41,255(1991))。此外,停滞棒杆菌包括以前归类为产氨棒杆菌,但现在基于16S rRNA的碱基序列分析而重新归类于停滞棒杆菌的细菌(Int.J.Syst.Evol.Microbiol.,60,874-879(2010))。
这些菌株可从例如美国典型培养物保藏中心获得(地址:12301 Parklawn Drive,Rockville,马里兰20852,P.O.Box 1549,马纳萨斯,VA 20108,美国)。即,各个菌株被分配了对应的注册号,可以通过使用这些注册号来订购菌株(参见http://www.atcc.org/)。各菌株对应的保藏号列在美国典型培养物保藏中心的目录中。此外,这些菌株例如也可以从保藏各菌株的保藏库获得。
特别是,作为野生型菌株谷氨酸棒杆菌ATCC 13869的链霉素(Sm)抗性变异株而分离的谷氨酸棒杆菌AJ12036(FERM BP-734),与其亲本菌株(野生型菌株)相比,其被预测在负责蛋白质分泌相关的功能的基因中具有变异,并显示出在最优培养条件下,蛋白质的蓄积量显示出比亲本菌株(野生型菌株)高达约2~3倍的蛋白质分泌生产能力,因此优选作为宿主细菌(WO2002/081694)。AJ12036菌株最初于1984年3月26日作为国际保藏而保藏在日本通商产业省工业技术院生命工学工业技术研究所(现为,NITE国际专利微生物保藏中心,千叶县木更津市上总镰足2-5-8 120号室(邮编292-0818),日本),并分配了FERM BP-734的保藏号。
此外,嗜热产氨棒杆菌AJ12340(FERM BP-1539)最初于1987年3月13日作为国际保藏而保藏在日本通商产业省工业技术院生命工学工业技术研究所(目前,NITE国际专利微生物保藏中心,千叶县木更津市上总镰足2-5-8 120号室(邮编292-0818),日本),并分配了FERM BP-1539的保藏号。此外,黄色短杆菌AJ12418(FERM BP-2205最初于1988年12月24日作为国际保藏而保藏在日本通商产业省工业技术院生命工学工业技术研究所(目前,目前,NITE国际专利微生物保藏中心,千叶县木更津市上总镰足2-5-8 120号室(邮编292-0818),日本),并分配了FERM BP-2205的保藏号。
此外,还可以将上述棒状细菌作为亲本菌株,利用诱变法或基因重组法并且选出分泌产生蛋白质的能力得到了增强的菌株,并将其用作宿主。例如,可以在用紫外线照射或N-甲基-N’-亚硝基胍等化学诱变剂进行处理后,选择出分泌产生蛋白质的能力得到了增强的菌株。
此外,如果使用通过修饰上述菌株使其不生产细胞表层蛋白而得到的菌株作为宿主,则分泌在培养基中或菌体表层上的异源蛋白质的纯化会变得容易,因此特别优选。可以通过诱变法或基因重组法,将变异导入染色体上的细胞表层蛋白的编码区或其表达控制区来进行上述修饰。作为经过修饰而不产生细胞表层蛋白的棒状细菌,可举出:谷氨酸棒杆菌YDK010菌株(WO2002/081693),其是谷氨酸棒杆菌AJ12036菌株(FERM BP-734)的细胞表层蛋白PS2的缺陷菌株。
将用于本发明方法的基因构建体导入上述棒状细菌中并使其保有该基因构建体,由此可以获得具有分泌产生异源蛋白质能力的棒状细菌。即,本发明的细菌例如可以是源自上述棒状细菌的修饰菌株。具体而言,本发明的细菌例如可以是源自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株或源自谷氨酸棒杆菌ATCC 13869的修饰菌株。需要说明的是,来自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株也属于源自谷氨酸棒杆菌ATCC13869的修饰菌株。下面将描述用于本发明方法的基因构建体及其导入方法。
<1-2>提高LepB蛋白质的活性
本发明的细菌被进行了修饰以提高LepB蛋白质的活性。本发明的细菌,具体而言,进行了修饰,以使其与未修饰菌株相比,LepB蛋白质的活性升高。本发明的细菌,更具体而言,可以进行修饰以提高lepB基因的表达。通过对棒状细菌进行修饰以提高LepB蛋白质的活性,能够在通过该细菌并利用了TorA信号肽的异源蛋白质的分泌生产中降低TorA信号肽的残余。作为TorA信号肽的残余的降低,可举出TorA信号肽的残余率的降低。“TorA信号肽的残余率”是指,残余型(mis-cleaved form)的异源蛋白质的分泌生产量相对于异源蛋白质的总分泌生产量的重量比。“异源蛋白质的总分泌生产量”是指,完全剪切型的异源蛋白质的分泌生产量和残余型的异源蛋白质的分泌生产量的合计。“残余型的异源蛋白质”是指,TorA信号肽被部分性地除去,即,保留有TorA信号肽的C末端侧部分序列的异源蛋白质。作为TorA信号肽的C末端侧部分序列,可举出TorA信号肽的C末端侧15残基的氨基酸序列。作为TorA信号肽的C末端侧部分序列,具体而言,可举出序列编号46的25~39位的氨基酸序列。本发明的方法中的TorA信号肽的残余率,例如,可以为3%以下、1%以下、0.5%以下、0.3%以下、0.1%以下或0%。此外,本发明的方法中的TorA信号肽的残余率,例如,可以为使用了未修饰菌株(此处是指未进行修饰以提高LepB蛋白质的活性的菌株)的情况下TorA信号肽的残余率的50%以下、30%以下、10%以下、5%以下、3%以下、1%以下、或0%。此外,期待通过对棒状细菌进行修饰以提高LepB蛋白质的活性,能够提高利用TorA信号肽时该细菌分泌生产异源蛋白质(具体而言,完全剪切型的异源蛋白质)的能力,即,能够提高通过该细菌并利用了TorA信号肽的异源蛋白质(具体而言,完全剪切型的异源蛋白质)的分泌生产。
本发明的细菌,可通过对具有分泌生产异源蛋白质的能力的棒状细菌进行修饰以提高LepB蛋白质的活性的方式而得到。此外,本发明的细菌,可通过对棒状细菌进行修饰以提高LepB蛋白质的活性后赋予分泌生产异源蛋白质的能力而得到。本发明中,用于构建本发明的细菌的修饰,可以任意的顺序进行。需要说明的是,在假定本发明的细菌的构建中使用的,进行修饰以提高LepB蛋白质的活性前的菌株具有用于分泌表达异源蛋白质的基因构建体的情况下,能不能分泌生产异源蛋白质皆可。即,本发明的细菌,例如,可通过进行修饰以提高LepB蛋白质的活性的过程而得到分泌生产异源蛋白质的能力。具体而言,例如,本发明的细菌可以由在进行修饰以提高LepB蛋白质的活性前,虽然具有用于分泌表达异源蛋白质的基因构建体但是无法分泌生产异源蛋白质的菌株而得到,其通过进行修饰以提高LepB蛋白质的活性的过程而变得能够分泌生产异源蛋白质。
下文中,对于LepB蛋白质和编码其的lepB基因进行说明。LepB蛋白质是信号肽酶。“信号肽酶”是指,具有催化信号肽的加工的活性的蛋白质(酶)。该活性也称为“信号肽酶活性”。“信号肽的加工”是指,从具有信号肽的蛋白质中除去该信号肽整体的反应。LepB蛋白质,至少,具有针对TorA信号肽的信号肽酶活性,即,具有催化TorA信号肽的加工的活性。
作为lepB基因和LepB蛋白质,可举出棒状细菌、肠杆菌科的细菌等的各种生物中的。各种生物具有的lepB基因的碱基序列和它们编码的LepB蛋白质的氨基酸序列,例如,可从NCBI(National Center for Biotechnology Information)等的公开数据库得到。谷氨酸棒杆菌ATCC 13869的lepB基因的碱基序列和该基因编码的LepB蛋白质的氨基酸序列,分别示于序列编号1和2。即,lepB基因,例如,可以为具有序列编号1表示的碱基序列的基因。此外,LepB蛋白质,例如,可以为具有序列编号2表示的氨基酸序列的蛋白质。需要说明的是,“具有(氨基酸或碱基)序列”这样的表达,如果没有特别说明,则包括“包含(氨基酸或碱基)序列”、“由(氨基酸或碱基)序列构成”的情况。
只要保持其原始功能,lepB基因可以是上文举出的lepB基因(例如具有序列编号1所示碱基序列的基因)的变体。同样,只要保持其原始功能,LepB蛋白可以是上文举出的LepB蛋白(例如具有序列编号2表示的氨基酸序列的蛋白)的变体。这种保持原始功能的变体可以称为“保守变体”。在本发明中,术语“lepB基因”不限于上文举出的lepB基因,而包括其保守变体。同样,术语“LepB蛋白”不限于上文举出的LepB蛋白,而包括其保守变体。作为保守变体,可举出:上文举出的lepB基因及LepB蛋白的同源物或人工修饰体。
“保持原始功能”是指,基因或蛋白质的变体具有与原始基因或蛋白质的功能(如活性或性质)相对应的功能(如活性或性质)。即,“保持原始功能”可以是,在lepB基因中,基因变体能编码保持原始功能的蛋白质。此外,“保持原始功能”可以是,在LepB蛋白中,蛋白质的变体具有针对TorA信号肽的信号肽酶活性。
信号肽酶活性,例如,可通过将酶与基质(即,具有信号肽的蛋白质)进行孵育,并测定酶依赖性的信号肽的加工来进行测定。信号肽的加工,例如,可以孵育后基质的分子量或N末端氨基酸序列为指标进行测定。
下面将对保守变体进行例举。
可以容易地从公共数据库获得lepB基因的同源物或LepB蛋白的同源物,例如将上文示例的lepB基因的碱基序列或上文示例的LepB蛋白的氨基酸序列作为查询序列,通过BLAST搜索或FASTA搜索而获得。此外,lepB基因的同源物例如可以通过下述PCR获得,所述PCR使用棒状细菌的染色体作为模板,将基于这些公知的lepB基因的碱基序列而制得的寡核苷酸作为引物。
就lepB基因而言,只要是在保持原始功能的前提下,可以是编码具有下述氨基酸序列的蛋白质的基因:在上文示例的LepB蛋白的氨基酸序列(例如序列编号2所示的氨基酸序列)中的一个或多个位置上,一个或多个氨基酸发生了取代、缺失、插入和/或添加而成的氨基酸序列。需要说明的是,上述“一个或多个”根据氨基酸残基在蛋白质的立体结构中的位置和氨基酸残基的种类不同而不同,具体而言,例如为1~50个、1~40个、1~30个,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。
上述一个或多个氨基酸残基的取代、缺失、插入和/或添加是保持蛋白质正常功能的保守变异。保守变异的典型实例是保守取代。保守取代是下述变异:如果取代位点是芳香族氨基酸时,则是Phe、Trp、Tyr之间相互取代的变异;如果取代位点是疏水性氨基酸时,则是Leu、Ile、Val之间相互取代的变异;如果取代位点是极性氨基酸时,则是Gln和Asn之间相互取代的变异;如果取代位点是碱性氨基酸时,则是Lys、Arg、His之间相互取代的变异;如果取代位点是酸性氨基酸,则是Asp和Glu之间相互取代的变异;如果取代位点是具有羟基的氨基酸,则是Ser和Thr之间相互取代的变异。具体而言,认为是保守取代的取代,可举出:用Ser或Thr取代Ala、用Gln、His或Lys取代Arg、用Glu、Gln、Lys、His或Asp取代Asn、用Asn、Glu或Gln取代Asp、用Ser或Ala取代Cys、用Asn、Glu、Lys、His、Asp或Arg取代Gln、用Gly、Asn、Gln、Lys或Asp取代Glu、用Pro取代Gly、用Asn、Lys、Gln、Arg或Tyr取代His、用Leu、Met、Val或Phe取代Ile、用Ile、Met、Val或Phe取代Leu、用Asn、Glu、Gln、His或Arg取代Lys、用Ile、Leu、Val或Phe取代Met、用Trp、Tyr、Met、Ile或Leu取代Phe、用Thr或Ala取代Ser、用Ser或Ala取代Thr、用Phe或Tyr取代Trp、用His、Phe或Trp取代Tyr、以及用Met、Ile、或Leu取代Val。此外,在上述氨基酸的取代、缺失、插入或添加中,包括由于基因来源的细菌的个体差异或物种差异所带来的天然存在的变异(变异体或变体;mutant或variant)。
此外,只要保持原始功能,lepB基因就可以是编码具有下述氨基酸序列的蛋白质的基因:相对于上述LepB蛋白的氨基酸序列(例如序列编号2表示的氨基酸序列)整体具有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选99%以上的一致性的氨基酸序列。
此外,只要保持其原始功能,lepB基因就可以是下述DNA:在严谨条件下与上述示例的lepB基因的碱基序列(例如序列编号1所示碱基序列)的互补序列进行杂交或与可从该互补序列制得的探针相杂交的DNA。“严谨条件”是指,在该条件下形成所谓的特异性杂交,并且不形成非特异性杂交。作为严谨条件的一个例子,可举出下述条件:具有高度一致性的DNA彼此杂交,例如80%以上的一致性、优选90%以上的一致性、更优选95%以上的一致性、进一步更优选97%以上的一致性、特别优选99%以上的一致性的DNA彼此杂交,并且低于上述一致性的DNA彼此不杂交的条件;或者,典型的DNA杂交(SouthernHybridization)的洗涤条件,即在与60℃、1×SSC、0.1%SDS相当的盐浓度下和温度下,优选与60℃、0.1×SSC、0.1%SDS相当的盐浓度下和温度下,更优选与68℃、0.1×SSC、0.1%SDS相当的盐浓度下和温度下洗涤一次,优选洗涤2~3次的条件。
上述探针例如可以是基因的互补序列的一部分。可以通过使用寡核苷酸作为引物,并使用含有这些碱基序列的DNA片段作为模板的PCR来制备此类探针,所述寡核苷酸基于公知的基因的碱基序列制得。作为探针,例如可以使用具有300bp左右长度的DNA片段。在该情况下,作为杂交的洗涤条件例如可以是50℃、2×SSC、0.1%SDS。
此外,lepB基因可以是具有如下得到的碱基序列的基因:将上文示例的lepB基因或其保守变体的碱基序列中的任意密码子取代为与之等价的密码子而成的碱基序列。例如,lepB基因可根据使用的宿主的密码子使用频率而进行修饰以具有最适宜密码子。
需要说明的是,氨基酸序列间的“一致性”是指,通过blastp使用默认设定的Scoring Parameters(Matrix:BLOSUM62;Gap Costs:Existence=11,Extension=1;Compositional Adjustments:Conditional compositional score matrix adjustment)计算的氨基酸序列间的一致性。此外,碱基序列间的“一致性”是指,通过blastn使用默认设定的Scoring Parameters(Match/Mismatch Scores=1,-2;Gap Costs=Linear)计算的碱基序列间的一致性。
需要说明的是,以上关于所述基因和蛋白质的变体的描述适用于PhoRS蛋白、细胞表层蛋白、Tat分泌系统、本发明中分泌产生的异源蛋白质等任意蛋白质以及编码它们的基因。
<1-3>其它的性质
本发明的细菌只要能够分泌产生异源蛋白质即可,可具有所需的性质。例如,本发明的细菌可以具有降低的细胞表层蛋白活性(WO2013/065869、WO2013/065772、WO2013/118544、WO2013/062029)。此外,可以对本发明的细菌进行修饰,以降低青霉素结合蛋白的活性(WO2013/065869)。此外,可以修饰本发明的细菌,以使编码金属肽酶的基因的表达增加(WO2013/065772)。此外,可以修饰本发明的细菌,以使其具有变异型核糖体蛋白S1基因(变异型rpsA基因)(WO2013/118544)。此外,可以修饰本发明的细菌,以使其具有变异型phoS基因(WO2016/171224)。此外,可以进行修饰本发明的细菌,以使得RegX3蛋白质的活性降低(WO2018/074578)。此外,可以进行修饰本发明的细菌,以使得HrrSA系统的活性降低(WO2018/074579)。此外,可以进行修饰本发明的细菌,以使得Tat分泌系统的活性得到增强。这些性质或修饰可以单独使用或适当地组合使用。
<1-3-1>变异型phoS基因的导入
可以修饰本发明的细菌,以使其保持变异型phoS基因。“保持变异型phoS基因”也称为“具有变异型phoS基因”或“phoS基因中具有变异”。此外,“保持变异型phoS基因”也称为“具有变异型PhoS蛋白”或“PhoS蛋白中具有变异”。
在下文中,将对phoS基因和PhoS蛋白进行说明。phoS基因是编码PhoS蛋白的基因,PhoS蛋白是PhoRS系统的传感器激酶。PhoRS系统是双组分调节系统之一,可引起对环境中磷酸缺乏的应答。PhoRS系统包含phoS基因编码的传感器激酶PhoS和phoR基因编码的应答调节子PhoR。
在本发明中,具有“特定变异”的PhoS蛋白被称为“变异型PhoS蛋白”,编码它的基因也被称为“变异型phoS基因”。即,“变异型phoS基因”是具有“特定变异”的phoS基因。另外,在本发明中,不具有“特定变异”的PhoS蛋白被称为“野生型PhoS蛋白”,编码它的基因也被称为“野生型phoS基因”。即,“野生型phoS基因”是没有“特定变异”的phoS基因。需要说明的是,本文所谓的“野生型”是为了方便将其与“变异型”区分开来,只要其不具有“特定变异”即可,并不限于天然获得的菌株。“特定变异”将在下文描述。
作为野生型phoS基因的实例,例如可举出棒杆菌的phoS基因。作为棒状细菌的phoS基因的具体实例,可举出,例如:谷氨酸棒杆菌YDK 010菌株、谷氨酸棒杆菌ATCC 13032菌株、谷氨酸棒杆菌ATCC 14067菌株、美棒杆菌(C.callunae)、钝齿棒杆菌(C.crenatum)、高效棒杆菌(C.efficiens)的phoS基因。谷氨酸棒杆菌YDK 010菌株的phoS基因的碱基序列示在序列编号28中。此外,由这些phoS基因编码的野生型PhoS蛋白的氨基酸序列分别示于序列编号29~34。
野生型phoS基因只要其不具有“特定变异”并且保持原始功能,就可以是上文例举的野生型phoS基因的变体。同样,野生型PhoS蛋白只要其不具有“特定变异”并且保持原始功能,就可以是上文举出的野生型PhoS蛋白的变体。即,术语“野生型phoS基因”不限于上文例举的野生型phoS基因,还包括其不具有“特定变异”的保守变体。同样,术语“野生型PhoS蛋白”不限于上文例举的野生型PhoS蛋白,还包括不具有“特定变异”的保守变体。关于野生型PhoS蛋白和野生型phoS基因的变体,可以相应地适用上述关于LepB蛋白和lepB基因的保守变体的描述。例如,只要野生型phoS基因不具有“特定变异”并且保持原始功能,就可以为编码具有下述氨基酸序列的蛋白质的基因:在上述氨基酸序列中的一个或多个位置处一个或多个氨基酸发生取代、缺失、插入和/或添加而成的氨基酸序列。此外,例如,野生型phoS基因只要不具有“特定的变异”且保持原始功能,就可以为编码含有相对于所述氨基酸序列整体具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的一致性的氨基酸序列的蛋白质的基因。
需要说明的是,“保持原始功能”是指,在野生型PhoS蛋白中,蛋白质的变体可具有作为PhoS蛋白的功能(例如,由序列编号29~34所示的氨基酸序列构成的蛋白质的功能)。此外,“保持原始功能”是指,在野生型PhoS蛋白中,蛋白质的变体可具有作为PhoRS系统的传感器激酶的功能。即,具体而言,“作为PhoS蛋白的功能”可以是,作为PhoRS系统的传感器激酶的功能。具体而言,“作为PhoRS系统的传感器激酶的功能”可以是,与作为应答调节子的PhoR蛋白共同作用而引起对环境中的磷酸缺乏的应答的功能。更具体而言,“作为PhoRS系统的传感器激酶的功能”可以是,感测环境中的磷酸缺乏而进行自磷酸化,通过磷酸基团转移来使PhoR蛋白质活化的功能。
PhoS蛋白的变体是否具有作为PhoRS系统的传感器激酶的功能,例如可以通过下述方式进行确认:将编码该变体的基因导入棒杆菌的phoS基因缺陷菌株中,确认对磷酸缺乏的应答性是否得到补充。就对于对磷酸缺乏的应答性的补充而言,例如可以通过观察在磷酸缺乏条件下的生长是否得到改善,或检测已知在磷酸缺乏条件下表达被诱导的基因的表达是否得到诱导而进行确认。(J.Bacteriol.,188,724-732(2006))。例如,可以将谷氨酸棒杆菌YDK010菌株的phoS基因缺陷菌株或谷氨酸棒杆菌ATCC13032菌株的phoS基因缺陷菌株用作棒状细菌的phoS基因缺陷菌株。
在野生型PhoS蛋白中,优选自磷酸化的组氨酸残基是保守的。即,保守变异优选发生在除自磷酸化的组氨酸残基之外的氨基酸残基上。“自磷酸化的组氨酸残基”是指,野生型PhoS蛋白的第276位的组氨酸残基。此外,野生型PhoS蛋白优选具有例如上文例举的野生型PhoS蛋白的保守序列。即,保守变异优选发生在例如上文例举的野生型PhoS蛋白的非保守氨基酸残基上。
变异型PhoS蛋白在上述野生型PhoS蛋白的氨基酸序列中具有“特定变异”。
即,除了具有“特定变异”之外,变异型PhoS蛋白可以与上文例举的野生型PhoS蛋白或其保守变体相同。具体而言,例如,除了具有“特定变异”之外,变异型PhoS蛋白可以是具有序列编号29~34所示氨基酸序列的蛋白质。此外,具体而言,例如,除了具有“特定变异”之外,变异型PhoS蛋白可以是具有下述氨基酸序列的蛋白质:在序列编号29~34所示氨基酸序列中包含一个或多个氨基酸的取代、缺失、插入和/或添加而成的氨基酸序列。此外,具体而言,除了具有“特定变异”之外,变异型PhoS蛋白例如可以是具有下述氨基酸序列的蛋白质:相对于序列编号29~34中所示氨基酸序列,具有80%以上,优选90%以上,更优选95%以上,进一步优选97%以上,特别优选99%以上的一致性的氨基酸序列。
此外,换言之,变异型PhoS蛋白可以是上文示例的野生型PhoS蛋白的变体,其具有“特定变异”并且在该“特定变异”以外的位置进一步包含保守变异。具体而言,变异型PhoS蛋白例如可以是具有下述氨基酸序列的蛋白质:在序列编号29~34所示的氨基酸序列中,具有“特定变异”,并且进一步在“特定变异”以外的位置处包含一个或多个氨基酸残基的取代、缺失、插入和/或添加。
变异型phoS基因没有特别限制,只要其编码上述变异型PhoS蛋白即可。
下文中,对变异型PhoS蛋白所具有的“特定变异”进行说明。
“特定变异”没有特别限制,只要其是上述野生型PhoS蛋白的氨基酸序列经修饰而得到并且对分泌产生异源蛋白质是有效的变异即可。
“特定变异”优选为提高异源蛋白质的分泌生产量的变异。“提高异源蛋白质的分泌生产量”是指,经过修饰而具有变异型phoS基因的棒状细菌(修饰菌株)能够分泌产生的异源蛋白质的量大于未修饰菌株。“未修饰的菌株”是指,在phoS基因中不具有变异的对照菌株,即不具有变异型phoS基因的对照菌株,例如可以是野生型菌株或亲本菌株。“分泌产生的异源蛋白质的量大于未修饰菌株”表示只要异源蛋白质的分泌生产量比通过未修饰菌株获得的分泌生产量大即可,作为培养基中和/或菌体表层上的蓄积量,分泌产生的异源蛋白质的量例如优选为未修饰菌株的分泌生产量的1.1倍以上,更优选为1.2倍以上,进一步优选为1.3倍以上,更进一步优选为2倍以上,特别优选为5倍以上。此外,“分泌产生的异源蛋白质的量大于未修饰菌株”还可以是指,使用未修饰菌株的非浓缩培养上清液进行SDS-PAGE并以CBB染色时,不能检测到异源蛋白质,而使用修饰菌株的非浓缩培养上清液进行SDS-PAGE并以CBB染色时,可以检测到异源蛋白质。需要说明的是,“提高异源蛋白质的分泌生产量”未必一定是指提高所有异源蛋白质的分泌生产量,只要选作分泌产生的目标异源蛋白质的分泌生产量得到提高即可。“提高异源蛋白质的分泌生产量”可以具体指,例如实施例中所述的异源蛋白质的分泌生产量得到提高。
例如可以通过下述方式来确认某变异是否是提高异源蛋白质的分泌生产量的变异:由属于棒状细菌的菌株来制备经过修饰的菌株,所述经过修饰的菌株具有编码具有上述某变异的PhoS蛋白的基因,当将该菌株在培养基中进行培养时,对分泌产生的异源蛋白质的量进行定量,并将其与修饰前的菌株(未修饰菌株)在培养基中培养时分泌产生的异源蛋白质的量进行比较。
作为氨基酸序列变异,优选氨基酸残基的取代。即,“特定变异”优选为,用另一氨基酸残基取代野生型PhoS蛋白的任意氨基酸残基的变异。“特定变异”取代的氨基酸残基可以是一个残基,也可以是两个或更多个残基的组合。被“特定变异”取代的氨基酸残基可以优选为除自磷酸化的组氨酸残基之外的氨基酸残基。被“特定变异”取代的氨基酸残基可以更优选为除自磷酸化的组氨酸残基之外的HisKA结构域中的氨基酸残基。“自磷酸化的组氨酸残基”是指,野生型PhoS蛋白的第276位的组氨酸残基。“HisKA结构域”是指,包含野生型PhoS蛋白的第266位~第330位的氨基酸残基的区域。被“特异性变异”取代的氨基酸残基特别优选为野生型PhoS蛋白的第302位的色氨酸残基(W302)。
在上述变异中,作为取代后的氨基酸残基可举出:K(Lys)、R(Arg)、H(His)、A(Ala)、V(Val)、L(Leu)、I(Ile)、G(Gly)、S(Ser)、T(Thr)、P(Pro)、F(Phe)、W(Trp)、Y(Tyr)、C(Cys)、M(Met)、D(Asp)、E(Glu)、N(Asn)、Q(Gln)中的,除了原本的氨基酸残基以外的氨基酸残基。作为取代后的氨基酸残基,例如可以选择提高异源蛋白质的分泌生产量的氨基酸残基。
当取代发生在W302时,作为取代后的氨基酸残基的例子可举出除芳香族氨基酸和组氨酸之外的氨基酸残基。作为“除芳香族氨基酸和组氨酸之外的氨基酸残基”的具体例子可举出:K(Lys)、R(Arg)、A(Ala)、V(Val)、L(Leu)、I(Ile)、G(Gly)、S(Ser)、T(Thr)、P(Pro)、C(Cys)、M(Met)、D(Asp)、E(Glu)、N(Asn)、Q(Gln)。作为“除芳香族氨基酸和组氨酸之外的氨基酸残基”的更具体的例子可举出:K(Lys)、A(Ala)、V(Val)、S(Ser)、C(Cys)、M(Met)、D(Asp)、N(Asn)。
需要说明的是,phoS基因中的“特定变异”是指,使上述“特定变异”发生于所编码的PhoS蛋白上的、碱基序列上的变异。
在本发明中,“野生型PhoS蛋白的X位的氨基酸残基”是指,与序列编号29中的第X位的氨基酸残基相对应的氨基酸残基。例如,“W302”是指,与序列编号29中的第302位的色氨酸残基相对应的氨基酸残基。上述氨基酸残基的位置表示相对位置,并且其绝对位置可由于氨基酸的缺失、插入、添加等而移动。例如,在序列编号29所示的氨基酸序列构成的野生型PhoS蛋白中,如果比第X位靠近N端侧的一个氨基酸残基发生缺失或插入,则原始位于位置第X处的氨基酸残基分别重新定位在从N端数第X-1位或第X+1位处,然而,仍然认为其是“野生型PhoS蛋白的第X位的氨基酸残基”。具体而言,例如,在序列编号29~34所示的野生型PhoS蛋白的氨基酸序列中,“W302”是指分别在第302位、第302位、第302位、第321位、第275位、第286位的色氨酸残基。此外,在序列编号29~34所示的野生型PhoS蛋白的氨基酸序列中,“野生型PhoS蛋白的第276位的组氨酸残基(自磷酸化的组氨酸残基)”是指分别在第276位、第276位、第276位、第295位、第249位、第260位的组氨酸残基。此外,在序列编号29~34所示的野生型PhoS蛋白的氨基酸序列中,“包含野生型PhoS蛋白的第266位~第330位的氨基酸残基的区域(HisKA结构域)”是指分别包含第266位~第330位、第266位~第330位、第266位~第330位、第285位~第349位、第239位~第303位、第250位~第314位的氨基酸残基的区域。
需要说明的是,虽然本文的“W302”通常是色氨酸残基,但可以不是色氨酸残基。即,当野生型PhoS蛋白具有序列编号29~34所示氨基酸序列以外的氨基酸序列时,“W302”可以不是色氨酸残基。因此,例如,“用半胱氨酸取代W302的变异”不仅包括当“W302”是色氨酸残基时,用半胱氨酸残基取代该色氨酸残基的变异,还包括当“W302”是K(Lys)、R(Arg)、H(His)、A(Ala)、V(Val)、L(Leu)、I(Ile)、G(Gly)、S(Ser)、T(Thr)、P(Pro)、F(Phe)、Y(Tyr)、M(Met)、D(Asp)、E(Glu)、N(Asn)、或Q(Gln)时,用半胱氨酸残基取代该氨基酸残基的变异。其它变异也相同。
可以通过任意的PhoS蛋白的氨基酸序列和序列编号29的氨基酸序列之间的比对,来确定在任意PhoS蛋白的氨基酸序列中哪个氨基酸残基是“与序列编号29中的第X位的氨基酸残基相对应的氨基酸残基”。例如可以通过公知的基因分析软件来进行比对。此类软件的具体例子包括由Hitachi Solutions生产的DNASIS、由Genetyx生产的GENETYX等(Elizabeth C.Tyler et al.,Computers and Biomedical Research,24(1)72-96,1991;Barton GJ et al.,Journal of Molecular Biology,198(2),327-37,1987)。
例如可以通过修饰野生型phoS基因使得编码的PhoS蛋白具有上述“特定变异”来获得变异型phoS基因。例如可以通过具有野生型phoS基因的生物的克隆或通过化学合成,来获得要修饰的野生型phoS基因。此外,也可以在不使用野生型phoS基因的情况下获得变异型phoS基因。例如可以通过化学合成直接获得变异型phoS基因。在使用前可以进行进一步修饰获得的变异型phoS基因。
可以通过公知方法来修饰基因。例如,可以通过定点诱变法,将目标变异导入DNA的目标位点。作为定点诱变法的例子,可举出:使用PCR的方法(Higuchi,R.,61,in PCRTechnology,Erlich,H.A.Eds.,Stockton Press(1989);Carter P.,Meth.In Enzymol.,154,382(1987))、和使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.in Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。
在下文中,对将棒状细菌修饰成具有变异型phoS基因的方法进行说明。
可以通过将变异型phoS基因导入棒状细菌来对棒状细菌进行修饰,使棒状细菌具有变异型phoS基因。此外,还可以通过将上述“特定变异”导入棒状细菌染色体上的phoS基因来对棒状细菌进行修饰,使棒状细菌具有变异型phoS基因。可以通过自然变异、诱变处理、或基因工程手段,将变异导入染色体上的基因中。
将变异型phoS基因导入棒状细菌的方法没有特别限制。在本发明的细菌中,保持有变异型phoS基因,并且其能够在棒状细菌中发挥功能的启动子的控制下进行表达即可。启动子可以是来自宿主的启动子,也可以是异源启动子。启动子可以是phoS基因固有的启动子或其他基因的启动子。在本发明的细菌中,变异型phoS基因可以存在于质粒这样的在染色体外进行自我复制的载体中,或整合至染色体中。本发明的细菌可以仅具有变异型phoS基因的一个拷贝、或变异型phoS基因的两个以上的拷贝。本发明的细菌可以只有一种变异型phoS基因,或者可以具有两种以上的变异型phoS基因。变异型phoS基因例如可以通过与下述的用于增加基因表达的方法中的基因导入相同的方式导入,或者与下述的用于本发明的基因构建体的导入相同的方式导入。
本发明的细菌可以具有或不具有野生型phoS基因。优选本发明的细菌不具有野生型phoS基因。
可以通过破坏染色体上的野生型phoS基因来获得不具有野生型phoS基因的棒状细菌。可以通过公知的方法来破坏野生型phoS基因。具体而言,例如可以通过使野生型phoS基因的启动子区域和/或编码区域的部分或全部缺失,来破坏野生型phoS基因。
此外,通过用变异型phoS基因取代染色体上的野生型phoS基因,可以获得经过修饰而不具有野生型phoS基因并且具有变异型phoS基因的棒状细菌。作为进行此类基因取代的方法,可举出,例如:称为“Red驱动整合(Red-driven integration)”的方法(Datsenko,K.A,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000));Red驱动整合法与源自λ噬菌体的切除系统(Cho,E.H.,Gumport,R.I.,Gardner,J.F.,J.Bacteriol.,184:5200-5203(2002))组合而成的方法(参见WO2005/010175)等使用线性DNA的方法;使用包含温度敏感性复制起点的质粒的方法;使用能够接合转移的质粒的方法;使用不具有在宿主中发挥功能的复制起点的自杀质粒的方法(美国专利第6303383号,日本特开平05-007491号)等。
PhoS蛋白与作为应答调节子的PhoR蛋白共同作用而发挥功能,即引发针对环境中磷酸缺乏的应答。因此,本发明的细菌具有phoR基因,使得变异型PhoS蛋白发挥功能。phoR基因是编码PhoR蛋白质的基因,PhoR蛋白质是PhoRS系统的应答调节子。“具有phoR基因”还称为“具有PhoR蛋白”。通常,本发明的细菌固有的PhoR蛋白与变异型PhoS蛋白共同作用而发挥功能即可。另一方面,除了本发明的细菌固有的phoR基因之外也可以另将适当的phoR基因导入本发明的细菌中或以此取代本发明的细菌固有的phoR基因。导入的phoR基因没有特别限定,只要其编码与变异型PhoS蛋白共同作用而发挥功能的PhoR蛋白即可。
作为phoR基因,可举出,例如棒状细菌的phoR基因。具体而言,作为棒状细菌的phoR基因,可举出,例如下述菌的phoR基因:谷氨酸棒杆菌YDK010菌株、谷氨酸棒杆菌ATCC13032菌株、谷氨酸棒杆菌ATCC14067菌株、美棒杆菌(C.callunae)、钝齿棒杆菌(C.crenatum)、高效棒杆菌(C.efficiens)。谷氨酸棒杆菌ATCC13032菌株的phoR基因的碱基序列及其PhoR蛋白质的氨基酸序列分别示于序列编号35和序列编号36中。
phoR基因只要保持其原始功能,就可以是上文例举的phoR基因的变体。同样,PhoR蛋白只要保持其原始功能,就可以是上文举出的PhoR蛋白质的变体。即,术语“phoR基因”不仅包括上文例举的phoR基因,还包括其保守变体。同样,术语“PhoR蛋白”不仅包括上文举出的PhoR蛋白,还包括其保守变体。关于PhoR蛋白和phoR基因的变体,可以适用于上述关于LepB蛋白和lepB基因的保守变体的描述。例如,phoR基因可以是编码在上述氨基酸序列的一个或多个位置处具有一个或多个氨基酸残基的取代、缺失、插入和/或添加的蛋白质的基因,只要该基因保持原始功能即可。此外,例如,只要保持原始功能,phoR基因就可以为编码含有相对于所述氨基酸序列整体具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的一致性的氨基酸序列的蛋白质的基因。需要说明的是,PhoR蛋白中的“维持原始功能”可以是指,蛋白质的变体具有作为PhoR蛋白质的功能(例如,由序列编号36所示氨基酸序列构成的蛋白质的功能)。此外,PhoR蛋白中的“维持原始功能”可以是指,蛋白质的变体具有作为PhoRS系统的应答调节子的功能。即,具体而言,“作为PhoR的功能”可以指,作为PhoRS系统的应答调节子的功能。具体而言,“作为PhoRS系统的应答调节子的功能”具体指,与作为传感器激酶的PhoS蛋白共同作用,引起针对环境中的磷酸缺乏的应答的功能。更具体而言,“作为PhoRS系统的应答调节子的功能”可以指,通过从感测到环境中的磷酸缺乏而发生了自磷酸化的PhoS蛋白处转移磷酸基团而活化,并对应答环境中磷酸缺乏的基因的表达进行调控的功能。
例如可以通过将编码PhoR蛋白质的变体的基因导入棒状细菌的phoR基因缺陷菌株,并确认是否补充对磷酸缺乏的应答性,来确定PhoR蛋白质的变体是否具有作为PhoRS系统的应答调节子的功能。就补充对磷酸缺乏的应答性而言,例如可以检测出下述情况:在磷酸缺乏条件下的生长得到提高;或者公知的在磷酸缺乏条件下表达会被诱导的基因的表达得到诱导。(J.Bacteriol.,188,724-732(2006))。例如,可以将谷氨酸棒杆菌YDK010菌株的phoR基因缺陷菌株和谷氨酸棒杆菌ATCC13032菌株的phoR基因缺陷菌株用作棒杆菌的phoR基因缺陷菌株。
<1-3-2>细胞表层蛋白的活性降低
本发明的细菌可以是细胞表层蛋白的活性降低的细菌。具体而言,本发明的细菌的细胞表层蛋白的活性可以低于未修饰菌株。“细胞表层蛋白的活性降低”特别可以指,细胞表层蛋白在细胞中的平均分子数降低。下文将说明细胞表层蛋白以及编码它的基因。
细胞表层蛋白是构成细菌或古细菌的细胞表层(S层)的蛋白质。作为棒状细菌的细胞表层蛋白,可举出:谷氨酸棒杆菌的PS1和PS2(CspB)(日本特表平6-502548);和停滞棒杆菌(C.stationis)的SlpA(CspA)(日本特开平10-108675)。在这些中,优选降低PS2蛋白质的活性。
谷氨酸棒杆菌ATCC13869的cspB基因的碱基序列和由该基因编码的PS2蛋白(CspB蛋白)的氨基酸序列分别示于序列编号37和38中。
此外,例如报道了28株谷氨酸棒杆菌的CspB同源物的氨基酸序列(J.Biotechnol.,112,177-193(2004))。该28株谷氨酸棒杆菌和cspB基因同源物在NCBI数据库中的GenBank注册号如下所示(GenBank注册号显示在括号中)。
谷氨酸棒杆菌ATCC 13058(AY524990)
谷氨酸棒杆菌ATCC 13744(AY524991)
谷氨酸棒杆菌ATCC 13745(AY524992)
谷氨酸棒杆菌ATCC 14017(AY524993)
谷氨酸棒杆菌ATCC 14020(AY525009)
谷氨酸棒杆菌ATCC 14067(AY524994)
谷氨酸棒杆菌ATCC 14068(AY525010)
谷氨酸棒杆菌ATCC 14747(AY525011)
谷氨酸棒杆菌ATCC 14751(AY524995)
谷氨酸棒杆菌ATCC 14752(AY524996)
谷氨酸棒杆菌ATCC 14915(AY524997)
谷氨酸棒杆菌ATCC 15243(AY524998)
谷氨酸棒杆菌ATCC 15354(AY524999)
谷氨酸棒杆菌ATCC 17965(AY525000)
谷氨酸棒杆菌ATCC 17966(AY525001)
谷氨酸棒杆菌ATCC 19223(AY525002)
谷氨酸棒杆菌ATCC 19240(AY525012)
谷氨酸棒杆菌ATCC 21341(AY525003)
谷氨酸棒杆菌ATCC 21645(AY525004)
谷氨酸棒杆菌ATCC 31808(AY525013)
谷氨酸棒杆菌ATCC 31830(AY525007)
谷氨酸棒杆菌ATCC 31832(AY525008)
谷氨酸棒杆菌LP-6(AY525014)
谷氨酸棒杆菌DSM20137(AY525015)
谷氨酸棒杆菌DSM20598(AY525016)
谷氨酸棒杆菌DSM46307(AY525017)
谷氨酸棒杆菌22220(AY525005)
谷氨酸棒杆菌22243(AY525006)
由于编码细胞表层蛋白的基因的碱基序列,根据棒状细菌所属的种或菌株而存在差异,因此,编码细胞表层蛋白的基因可以是上述编码细胞表层蛋白的基因的变体,只要保持原始功能即可。同样,细胞表层蛋白可以是上述细胞表层蛋白的变体,只要保持原始功能即可。即,术语“cspB基因”不仅包括上述cspB基因,还包括其保守变体。同样,术语“CspB蛋白”不仅包括上述CspB蛋白,还包括其保守变体。上述关于LepB蛋白和lepB基因的保守变体的描述可以适用于细胞表层蛋白的变体和编码它的基因。例如,编码细胞表层蛋白的基因可以是编码具有下述氨基酸序列的蛋白质的基因,该氨基酸序列是在上文举出的氨基酸序列的一个或多个位置上具有一个或多个氨基酸残基的取代、缺失、插入和/或添加而成的氨基酸序列,只要该基因保持原始功能即可。此外,例如,只要保持原始功能,编码细胞表层蛋白的基因就可以为编码含有相对于所述氨基酸序列整体具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的一致性的氨基酸序列的蛋白质的基因。需要说明的是,“保持原始功能”可以指,对细胞表层蛋白而言,例如,是具有下述性质:其在棒状细菌中的活性降低时,异源蛋白质的分泌量与未修饰菌株相比得到了增加的性质。
“其在棒状细菌中的活性降低时,异源蛋白质的分泌量与未修饰菌株相比得到了增加的性质”是指,当其在棒状细菌中的活性降低时,赋予棒状细菌分泌产生异源蛋白质的量高于未修饰菌株的能力的性质。“未修饰菌株”是指,细胞表层蛋白的活性没有发生降低的对照菌株,例如可以是野生型菌株或亲本菌株。“分泌产生异源蛋白质的量高于未修饰菌株”是指只要异源蛋白质的分泌生产量高于未修饰菌株的产量即可,没有特别限制,例如,作为培养基中和/或菌体表层上的蓄积量,上述分泌产生的异源蛋白质的量优选为未修饰菌株的量的1.1以上,更优选1.2倍以上,进一步优选1.3倍以上,特别优选2倍以上。此外,“分泌产生异源蛋白质的量高于未修饰菌株”也可以是指,使用未修饰菌株的非浓缩培养上清液进行SDS-PAGE并以CBB染色时,不能检测到异源蛋白质,但使用修饰菌株的非浓缩培养上清液进行SDS-PAGE并以CBB染色时,可以检测到异源蛋白质。
可以通过下述方式来确认某蛋白质是否具有当在棒状细菌中的活性降低时,使其分泌产生异源蛋白质的量高于未修饰菌株的量的性质:由属于棒状细菌的菌株来制备经过修饰而该蛋白活性降低的菌株,当将该菌株在培养基中进行培养时,对分泌产生的异源蛋白质的量进行定量,并将其与修饰前的菌株(未修饰菌株)在培养基中培养时分泌产生的异源蛋白质的量进行比较。
在本发明中,“细胞表层蛋白的活性降低”包括:对棒状细菌进行了修饰,使细胞表层蛋白的活性降低的情况;和,棒状细菌中细胞表层蛋白的活性原本就降低了的情况。“棒状细菌中细胞表层蛋白的活性原本就降低了的情况”包括,棒状细菌原本不具有细胞表层蛋白的情况。即,作为细胞表层蛋白的活性降低的棒状细菌,可举出,例如,原本不具有细胞表层蛋白的棒状细菌。作为“棒状细菌原本不具有细胞表层蛋白的情况”可举出,例如,棒状细菌原本不具有编码细胞表层蛋白的基因的情况。需要说明的是,“棒状细菌原本不具有细胞表层蛋白”可以是指,棒状细菌原本就不具有选自在属于该棒状细菌种类的其他菌株中发现的一种或多种细胞表层蛋白。例如,“谷氨酸棒杆菌原本不具有细胞表层蛋白”可以是指,谷氨酸棒杆菌菌株原本就不具有选自在其他谷氨酸棒杆菌菌株中发现的一种或多种细胞表层蛋白,即,例如原本不具有PS1和/或PS2(CspB)。作为原本不具有细胞表层蛋白的棒状细菌,可举出,例如,原本就不具有cspB基因的谷氨酸棒杆菌ATCC 13032。
<1-3-3>蛋白质的分泌系统
本发明的细菌具有作为蛋白质的分泌系统的Tat系统(Tat分泌系统)。本发明的细菌可固有性地具有Tat分泌系统。本发明的细菌可以进行修饰以提高Tat分泌系统的活性。本发明的细菌,具体而言,可以进行修饰,以使得Tat分泌系统的活性与未修饰菌株相比而有所提高。Tat分泌系统的活性,例如,可通过提高选自编码Tat分泌系统的基因中的1种以上的基因的表达来提高。即,本发明的细菌,更具体而言,可进行修饰,以使得选自编码Tat分泌系统的基因中的1种以上的基因的表达得到提高。对于提高编码Tat分泌系统的基因的表达的方法,记载于日本专利第4730302号。通过对棒状细菌进行修饰以使得Tat分泌系统的活性提高,能够提高利用TorA信号肽时该细菌分泌生产异源蛋白质(具体而言,完全剪切型的异源蛋白质)的能力,即,期望提高通过该细菌并利用了TorA信号肽的异源蛋白质(具体而言,完全剪切型的异源蛋白质)的分泌生产。
作为编码Tat分泌系统的基因,可举出:tatA基因、tatB基因、tatC基因、tatE基因。
具体而言,作为编码Tat分泌系统的基因,可举出:谷氨酸棒杆菌的tatA基因、tatB基因、tatC基因。谷氨酸棒杆菌ATCC13032的tatA基因、tatB基因、tatC基因分别对应于,在NCBI数据库中注册为GenBank accession NC_003450(版本NC_003450.3GI:58036263)的基因组序列中第1571065位~第1571382位的序列的互补序列、第1167110位~第1167580位的序列、第1569929位~第1570873位的序列的互补序列。此外,谷氨酸棒杆菌ATCC 13032的TatA蛋白、TatB蛋白、TatC蛋白已经分别注册为GenBank accession NP_600707(版本NP_600707.1GI:19552705,locus_tag="NCgl1434")、GenBank accession NP_600350(版本NP_600350.1GI:19552348,locus_tag="NCgl1077")、GenBank accession NP_600706(版本NP_600706.1GI:19552704,locus_tag="NCgl1433")。谷氨酸棒杆菌ATCC 13032的tatA基因、tatB基因、tatC基因的碱基序列以及TatA蛋白、TatB蛋白、TatC蛋白的氨基酸序列如序列编号39~44所示。
此外,具体而言,作为编码Tat分泌系统的基因,可举出:大肠杆菌的tatA基因、tatB基因、tatC基因、tatE基因。大肠杆菌K-12MG1655的tatA基因、tatB基因、tatC基因、tatE基因分别对应于,在NCBI数据库中注册为GenBank accession NC_000913(版本NC_000913.2GI:49175990)的基因组序列中第4019968位~第4020237位的序列、第4020241位~第4020756位的序列、第4020759位~第4021535位的序列、以及第658170位~第658373位的序列。此外,大肠杆菌K-12MG1655的TatA蛋白、TatB蛋白、TatC蛋白、TatE蛋白已经分别注册为GenBank accession NP_418280(版本NP_418280.4GI:90111653,locus_tag="b3836")、GenBank accession YP_026270(版本YP_026270.1GI:49176428,locus_tag="b3838")、GenBank accession NP_418282(版本NP_418282.1GI:16131687,locus_tag="b3839")、GenBank accession NP_415160(版本NP_415160.1GI:16128610,locus_tag="b0627")。
编码Tat分泌系统的基因只要其保持原始功能,就可以是上文示例的编码Tat分泌系统的基因的变体。同样,Tat分泌系统只要其保持原始功能,就可以是上文示例的Tat分泌系统的变体。即,术语“tatA基因”、tatB基因”、“tatC基因”、“tatE基因”不仅分别包括上文示例的tatA基因、tatB基因、tatC基因、tatE基因,还包括其保守变体。同样,术语“TatA蛋白”、“TatB蛋白”、“TatC蛋白”、“TatE蛋白”不仅分别包括上文示例的TatA蛋白、TatB蛋白、TatC蛋白、TatE蛋白,还包括其保守变体。关于LepB蛋白和lepB基因的保守变体的上述描述可以适用于Tat分泌系统和编码它的基因的变体中。例如,编码Tat分泌系统的基因只要保持原始功能,就可以是编码具有在上述氨基酸序列中的一个或多个位置上进行了一个或多个氨基酸残基的取代、缺失、插入和/或添加而成的氨基酸序列的蛋白质的基因。此外,例如,只要保持原始功能,编码Tat分泌系统的基因就可以为编码含有相对于所述氨基酸序列整体具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的一致性的氨基酸序列的蛋白质的基因。需要说明的是,Tat分泌系统中的“保持原始功能”可以是指,具有将N末端上添加有TorA信号肽等Tat系统依赖性信号肽的蛋白质分泌至细胞外的功能。
Tat分泌系统的活性的提高,例如,可通过确认在N末端添加有TorA信号肽等的Tat系统依赖性信号肽的蛋白质的分泌生产量的提高来进行确认。在N末端添加有Tat系统依赖性信号肽的蛋白质的分泌生产量,例如,可以提高至未修饰菌株的1.5倍以上、2倍以上或3倍以上。
<1-4>提高蛋白质的活性的方法
下文中,对于提高LepB蛋白质等的蛋白质的活性的方法(包括提高基因的表达的方法)进行说明。
“提高蛋白质的活性”是指,该蛋白质的活性与未修饰菌株相比而有所提高。“提高蛋白质的活性”,具体而言,是指该蛋白质在细胞中的平均活性与未修饰菌株相比而有所提高。此处所谓的“未修饰菌株”是指,未进行修饰以使得目标蛋白质的活性降低的对照株。作为未修饰菌株,可举出野生菌株、亲本菌株。作为未修饰菌株,具体而言,可举出各细菌种的标准菌株(type strain)。此外,作为未修饰菌株,具体而言,可举出棒状细菌的说明中例举的菌株。即,一方式中,蛋白质的活性相比于标准菌株(即本发明的细菌所属种类的标准菌株)而有所提高。此外,另一方式中,蛋白质的活性可以相比于谷氨酸棒杆菌ATCC 13869株而有所提高。此外,另一方式中,蛋白质的活性可以相比于谷氨酸棒杆菌ATCC 13032株而有所提高。此外,另一方式中,蛋白质的活性可以相比于谷氨酸棒杆菌AJ12036(FERM BP-734)而有所提高。此外,另一方式中,蛋白质的活性可以相比于谷氨酸棒杆菌YDK010株而有所提高。需要说明的是,“提高蛋白质的活性”也称为“增强蛋白质的活性”。“提高蛋白质的活性”,更具体而言,可以是指与未修饰菌株相比,该蛋白质在细胞中的平均分子数增加、和/或该蛋白质每分子的功能提高。即,“提高蛋白质的活性”这样的情况下的“活性”,不限于蛋白质的催化剂活性,可以是指编码蛋白质的基因的转录量(mRNA量)或翻译量(蛋白质的量)。“蛋白质在细胞中的平均分子数”,可以是指该蛋白质的分子数在细胞中的平均值。此外,“提高蛋白质的活性”,不仅包括在原本具有目标蛋白质的活性的菌株中提高该蛋白质的活性,还包括对于原本不存在目标蛋白质的活性的菌株赋予该蛋白质的活性。此外,只要结果提高蛋白质的活性,就可以在使宿主本来具有的目标蛋白质的活性降低或消失后,赋予适宜的目标蛋白质的活性。
就蛋白质的活性提高的程度而言,只要蛋白质的活性与未修饰菌株相比而有所提高,就没有特别限定。蛋白质的活性,例如,可以提高至未修饰菌株的1.5倍以上、2倍以上或3倍以上。此外,在未修饰菌株不具有目标蛋白质的活性的情况下,通过导入编码该蛋白质的基因而生成该蛋白质即可,例如,可生产该蛋白质至可测定其活性的程度。
提高蛋白质的活性的修饰,例如,可通过提高编码该蛋白质的基因的表达来实现。“提高基因的表达”是指,该基因的表达与野生菌株、亲本菌株等未修饰菌株相比而有所提高。“提高基因的表达”,具体而言,是指该基因在细胞中的平均表达量与未修饰菌株相比而有所提高。“基因在细胞中的平均表达量”是指,该基因的表达量在细胞中的平均值。“提高基因的表达”,更具体而言,是指提高基因的转录量(mRNA量)、和/或提高基因的翻译量(蛋白质的量)。需要说明的是,“提高基因的表达”也称为“增强基因的表达”。基因的表达,例如,可以提高至未修饰菌株的1.5倍以上、2倍以上或3倍以上。此外,“提高基因的表达”,不仅包括提高原本表达目的基因的菌株中该基因的表达量,还包括在原本不表达目的基因的菌株中表达该基因。即,“提高基因的表达”是指,例如,可以是指在未保持目的基因的菌株中导入该基因,并表达该基因。
基因的表达的提高,例如,可通过提高基因的拷贝数来实现。
基因的拷贝数的增加,可通过向宿主的染色体导入该基因来实现。基因向染色体的导入,例如,可通过利用同源重组来进行(Miller,J.H.Experiments in MolecularGenetics,1972,Cold Spring Harbor Laboratory)。作为利用同源重组的基因导入法,例如,可举出:Red驱动整合(Red-driven integration)法(Datsenko,K.A,and Wanner,B.L.Proc.Natl.Acad.Sci.U S A.97:6640-6645(2000))等的使用直链状DNA的方法、使用包含温度敏感性复制起点的质粒的方法、使用可接合转移的质粒的方法、使用不具有在宿主内发挥功能的复制起点的自杀载体的方法、使用了噬菌体的转导(transduction)法。具体而言,可通过利用包含目的基因的重组DNA转化宿主,与宿主的染色体上的目标位点发生同源重组,来将该基因导入至宿主的染色体上。同源重组中使用的重组DNA的结构,只要是能够以期望的方式引发同源重组的,就没有特别限定。例如,可通过利用作为包含目的基因的线状DNA并且在该基因的两端分别具有与染色体上的目标位点的上流和下游相同的碱基序列的线状DNA来转化宿主,在目标位点的上流和下游分别发生同源重组,来将目标位点取代为该基因。同源重组中使用的重组DNA,可具有用于筛选转化体的标志物基因。基因,可以仅导入1拷贝,或导入2拷贝或其以上。例如,可通过将染色体上存在多个拷贝的碱基序列作为目标来进行同源重组,而向染色体导入基因的多个拷贝。作为在染色体上存在多个拷贝的序列,可举出:重复DNA序列(repetitive DNA)、存在于转座子的两端的反向重复。此外,可以将目标物质的生产中不必要的基因等染色体上的适当序列作为目标来进行同源重组。此外,基因,可使用转座子、Mini-Mu来随机导入至染色体上(日本特开平2-109985号公报、US5、882、888、EP805867B1)。需要说明的是,这样的利用了同源重组的染色体的修饰方法,不限于目的基因的导入,还可以利用表达调节序列的修饰等的、染色体的任意修饰。
目的基因导入至染色体上的确认,可通过下述方式进行确认:使用了具有与该基因的全部或一部分互补性的序列的探针的Southern杂交、或使用了基于该基因的序列而制成的引物的PCR等。
此外,基因的拷贝数的增加,可通过将包含该基因的载体导入宿主来实现。例如,可通过将包含目的基因的DNA片段与在宿主中发挥功能的载体连接而构建该基因的表达载体,并用该表达载体转化宿主,来提高该基因的拷贝数。包含目的基因的DNA片段,例如,可通过以具有目的基因的微生物的基因组DNA为模板的PCR而得到。作为载体,可使用可在宿主的细胞内自主复制的载体。载体,优选为多拷贝载体。此外,为了筛选转化体,优选载体具有抗生素抗性基因等的标志物。此外,载体,可具备:用于表达插入的基因的启动子、终止子。载体,例如,可以为:细菌质粒来源的载体、酵母质粒来源的载体、噬菌体来源的载体、粘粒或噬菌粒等。作为可在棒状细菌中自主复制的载体,具体而言,例如,可举出:pHM1519(Agric.Biol.Chem.,48,2901-2903(1984));pAM330(Agric.Biol.Chem.,48,2901-2903(1984));将它们改良而得到的具有药剂耐性基因的质粒;pCRY30(日本特开平3-210184);pCRY21、pCRY2KE、pCRY2KX、pCRY31、pCRY3KE、和pCRY3KX(日本特开平2-72876、美国专利5、185、262号);pCRY2和pCRY3(日本特开平1-191686);pAJ655、pAJ611、和pAJ1844(日本特开昭58-192900);pCG1(日本特开昭57-134500);pCG2(日本特开昭58-35197);pCG4和pCG11(日本特开昭57-183799);pVK7(日本特开平10-215883);pVK9(US2006-0141588);pVC7(日本特开平9-070291);pVS7(WO2013/069634)。
在导入基因的情况下,基因以可表达的方式保持在宿主中即可。具体而言,基因以接受在宿主中发挥功能的启动子进行的控制而表达的方式得到保持即可。启动子,只要在宿主中发挥功能,就没有特别限定。“在宿主中发挥功能的启动子”是指,在宿主中具有启动子活性的启动子。启动子,可以为宿主来源的启动子,或异源来源的启动子。启动子可以为导入的基因固有的启动子,或其他基因的启动子。作为启动子,例如,如下所述,可使用更为强力的启动子。
可以在基因的下游配置用于终止转录的终止子。终止子没有特别限制,只要在本发明的宿主中发挥功能即可。终止子可以是源自宿主的终止子,也可以是异源的终止子。终止子可以是待导入基因的固有的终止子,也可以是其他基因的终止子。
关于可用于各种微生物的载体、启动子、终止子,举例而言,详细记载于“微生物学基础讲座8基因工学、共立出版、1987年”中,并且可以使用这些。
此外,当导入两个或两个以上的基因时,各基因保持在宿主中并且能够进行表达即可。例如,各基因可以全部保持在一个表达载体上,或可以全部保持在染色体上。此外,各基因可以分别保持在多个表达载体上,或分别保持在单个或多个表达载体和染色体上。此外,还可以导入由两个或两个以上的基因构成的操纵子。
待导入的基因没有特别限制,只要其编码在宿主中发挥功能的蛋白质即可。待导入的基因可以源自宿主,也可以是异源基因。例如,可以使用基于该基因的核苷酸序列设计而成的引物,以具有该基因的生物的基因组DNA或携带该基因的质粒等作为模板,通过PCR来获得待导入的基因。另外,待导入的基因例如可以是基于该基因的核苷酸序列,通过全合成而得到的(Gene,60(1),115-127(1987))。所获得的基因可以直接使用,或根据需要进行修饰。即,可通过对基因进行修饰,而得到其变体。基因的修饰可以通过已知方法进行。例如,可以通过定点诱变法,将目标变异导入DNA的目标位点。即,例如可以通过定点诱变法,修饰基因的编码区,使得编码的蛋白质在特定位点含有氨基酸残基的取代、缺失、插入和/或添加。作为定点诱变法,可举出:使用PCR的方法(Higuchi,R.,61,in PCR technology,Erlich,H.A.Eds.,Stockton press(1989);Carter,P.,Meth.in Enzymol.,154,382(1987)),使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.in Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。或者,可以全合成基因的变体。
需要说明的是,在蛋白质作为包含多个亚基的复合体而发挥功能的情况下,只要结果可提高蛋白质的活性,就可以对这些多个亚基全部进行修饰,或仅对一部分进行修饰。即,例如,在以通过提高基因的表达来提高蛋白质的活性的情况下,可以增强编码这些亚基的多个基因的全部的表达,或仅增强一部分的表达。通常,优选增强编码这些亚基的多个基因的全部的表达。此外,就构成复合体的各亚基而言,只要使得复合体具有目标蛋白质的功能,就可以源自1种生物,或源自2种以上的不同生物。即,例如,可以将编码多个亚基的源自相同生物的基因导入宿主,或将分别源自不同生物的基因导入宿主。
此外,可以通过提高基因的转录效率来提高基因的表达。此外,还可以通过提高基因的翻译效率来增加基因的表达。例如,可以通过修饰基因的表达调节序列来提高基因的转录效率和基因的翻译效率。“表达调节序列”是影响基因表达的位点的统称。作为表达调节序列,可举出:启动子、Shine Dalgarno(SD)序列(也称为核糖体结合位点(RBS))、RBS与起始密码子之间的间隔区。可以使用启动子查询载体或GENETYX等基因分析软件,来确定表达调节序列。这些表达调节序列的修饰,例如,可通过下述方法进行:使用了温度敏感性载体的方法或Red驱动整合法(WO2005/010175)。
例如可以用更强的启动子替换染色体上的基因的启动子,来提高基因的转录效率。“更强的启动子”是指,与基因的固有存在的野生型启动子相比,基因的转录得到提高的启动子。作为可用于棒状细菌中的强启动子,可列举:人工修饰的P54-6启动子(Appl.Microbiol.Biotechnol.,53,674-679(2000));可在棒状细菌中用乙酸、乙醇、丙酮酸等进行诱导的pta、aceA、aceB、adh、amyE启动子等;在棒状细菌中表达量较大的强启动子cspB、SOD、tuf(EF-Tu)启动子(Journal of Biotechnology,104(2003)311-323;Appl.Environ.Microbiol.,2005Dec;71(12):8587-96);lac启动子;tac启动子;trc启动子。此外,作为更强的启动子,可以使用各种报告基因来获得高活性型的现有启动子。例如,使启动子区域中的-35和-10区域与共有序列接近,可以增强启动子的活性(WO00/18935)。作为高活性型启动子,可举出各种tac样启动子(Katashkina JI et al.RussianFederation Patent application 2006134574)。Goldstein等人的论文中记载了,用于评价启动子的强度的方法和强启动子的实例(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))等。
例如,可以用更强的Shine Dalgarno(SD)序列替换染色体上基因的ShineDalgarno(SD)序列(称为核糖体结合位点(RBS))来提高基因的翻译效率。“更强的SD序列”是指,与基因的固有存在的野生型SD序列相比,mRNA的翻译得到了提高的SD序列。作为更强的SD序列,可列举,例如:源自噬菌体T7的基因10的RBS(Olins P.O.et al,Gene,1988,73,227-235)。此外,已知在RBS和起始密码子之间的间隔区域中,特别是在起始密码子的紧邻的上游序列(5’-UTR)中,多个核苷酸的取代、插入或缺失对mRNA的稳定性和翻译效率有显著影响,因此,也可以通过修饰它们来提高基因的翻译效率。
例如,还可以通过修饰密码子来提高基因的翻译效率。例如,可以用更频繁使用的同义密码子替换基因中存在的稀有密码子,来提高基因的翻译效率。即,例如可以根据所使用的宿主中的密码子的使用频率,将待导入的基因修饰成含有最优密码子的基因。例如,可以通过定点诱变法,来进行密码子的置换。此外,可以全合成密码子发生了置换的基因片段。各种生物中密码子的使用频率公开于“Codon Usage Database”(http://www.kazusa.or.jp/codon;Nakamura,Y.et al,Nucl.Acids Res.,28,292(2000))。
此外,基因表达的升高,还可以通过扩增提高基因表达的调节子或通过缺失或减弱降低基因表达的调节子来实现。
上述用于提高基因表达的方法可单独使用、或任意组合使用。
此外,用于提高蛋白质的活性的修饰,例如,可通过提高蛋白质的比活性来实现。比活性得到了增强的蛋白质,例如,可通过探索各种生物而取得。此外,也可以向常规的蛋白质导入变异而得到高活性型。导入的变异,例如,可以为:在蛋白质的1个或者数个位置处1个或数个氨基酸发生取代、缺失、插入和/或添加。变异的导入,例如,可通过所述的定点诱变法来进行。此外,变异的导入,例如,可通过诱变处理来进行。作为诱变处理,可举出:X射线的照射、紫外线的照射、以及通过N-甲基-N’-硝基-N-亚硝基胍(MNNG)、甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)等的诱变剂进行的处理。此外,也可以在体外对DNA直接用羟胺进行处理,诱发随机变异。比活性的增强,可以单独使用,也可以与所述的增强基因的表达的方法任意组合使用。
转化的方法没有特别限定,可以使用常规已知的方法。例如,可以使用用氯化钙处理受体菌细胞以增加DNA的渗透性的方法,其已被报道用于大肠杆菌K-12菌株(Mandel,M.and Higa,A.,J.Mol.Biol.,1970,53,159-162);以及,由处于增殖阶段的细胞制备感受态细胞,随后导入DNA的方法,其已被报道用于枯草芽孢杆菌(Duncan,C.H.,Wilson,G.A.and Young,F.E.,Gene,1977,1:153-167)。或者,还可以使用将DNA受体菌的细胞制备成可以容易摄取重组DNA的原生质体或原生质球的状态,然后将重组DNA导入DNA受体菌细胞的方法,其已被用于枯草芽孢杆菌、放线菌类、以及酵母菌(Chang,S.and Choen,S.N.,1979,Mol.Gen.Genet.,168:111-115;Bibb,M.J.,Ward,J.M.and Hopwood,O.A.,1978,Nature,274:398-400;Hinnen,A.,Hicks,J.B.and Fink,G.R.,1978,Proc.Natl.Acad.Sci.USA,75:1929-1933)。或者,可以利用对于棒状细菌已经报道了的电脉冲法(日本特开平2-207791号公报)。
蛋白质的活性提高,可通过测定该蛋白质的活性来进行确认。
蛋白质的活性提高,也可通过确认编码该蛋白质的基因的表达提高来进行确认。基因的表达提高,可通过确认该基因的转录量提高、或确认由该基因表达的蛋白质的量提高来进行确认。
还可以将从该基因转录出的mRNA的量与野生型菌株或亲本菌株等未修饰菌株相比较,来确定该基因转录量的增加。作为用于评价mRNA的量的方法,可列举:Northen杂交、RT-PCR、微阵列、RNA-seq等(Sambrook,J.,etal.,Molecular Cloning A LaboratoryManual/Third Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量(例如,细胞中的平均分子数)例如,可以增加至例如未修饰的菌株的1.5倍以上、2倍以上、或3倍以上。
可以通过使用抗体的蛋白免疫印迹,来确定蛋白质的量的增加(Molecularcloning(Sambrook,J.,et al.,Molecular Cloning:A Laboratory Manual/Third Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。蛋白质的量(例如在细胞中的平均分子数)可以增加至例如未修饰菌株的1.5倍以上、2倍以上、或3倍以上。
所述提高蛋白质的活性的方法,可用于任意的蛋白质的活性增强、任意的基因的表达增强。
<1-5>降低蛋白质的活性的方法
下面对降低蛋白质的活性的方法进行说明。需要说明的是,下述降低蛋白质活性的方法可用于破坏野生型PhoS蛋白质。
“蛋白质的活性降低”是指,该蛋白质的活性低于未修饰菌株。“蛋白质的活性降低”具体而言是指,细胞中该蛋白质的平均活性低于未修饰菌株。这里的“未修饰菌株”是指,未经过降低目标蛋白活性的修饰的对照菌株。作为未修饰菌株,可列举野生型菌株和亲本菌株。具体而言,作为未修饰菌株,可列举:各细菌种类的模式菌株(type strain)。此外,作为未修饰菌株,具体可列举在棒状细菌的描述中示例的菌株。即,在一个实施方式中,蛋白质的活性可以低于模式菌株(即,本发明的细菌所属种类的模式菌株)。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌ATCC 13032。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌ATCC 13869。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌AJ12036(FERM BP-734)。此外,在另一个实施方式中,蛋白质的活性可以低于谷氨酸棒杆菌YDK010菌株。需要说明的是,“蛋白质的活性降低”还包括该蛋白质的活性完全消失的情况。更具体而言,“蛋白质的活性降低”是指,该蛋白质在细胞中的平均分子数降低,和/或每分子该蛋白质的功能降低。即,“蛋白质的活性降低”的情况下的“活性”不限于蛋白质的催化活性,也可以是指编码蛋白质的基因的转录量(mRNA量)或翻译量(蛋白质量)。“蛋白质在细胞中的平均分子数”可以是指,该蛋白质的分子数在细胞中的平均值。需要说明的是,“蛋白质在细胞中的平均分子数降低”包括完全不存在该蛋白质的情况。此外,“每分子蛋白质的功能降低”还包括每分子该蛋白质的功能完全消失的情况。蛋白质活性的降低程度没有特别限制,只要其蛋白质的活性低于未修饰菌株即可。蛋白质的活性可以降低至,例如,未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
降低蛋白质活性的修饰例如,可以通过降低编码该蛋白质的基因的表达来实现。“基因的表达降低”是指,基因的表达低于未修饰菌株。具体而言,“基因的表达降低”是指,该基因在细胞中的平均表达量低于在未修饰菌株中的平均表达量。“基因在细胞中的平均表达量”可以是指,该基因的表达量在细胞中的平均值。更具体而言,“基因的表达降低”是指,基因的转录量(mRNA量)降低,和/或基因的翻译量(蛋白质的量)降低。“基因的表达降低”包括该基因完全不表达的情况。需要说明的是,“基因的表达降低”也称为“基因的表达减弱”。基因的表达可以降低至,例如,未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
基因表达的降低可以是由于例如转录效率的降低、翻译效率的降低、或其组合。基因的表达的降低,例如,可通过修饰基因的表达调节序列来实现。“表达调节序列”是启动子、Shine Dalgarno(SD)序列(也称为核糖体结合位点(RBS))、RBS和起始密码子之间的间隔区域等对基因的表达产生影响的位点的总称。表达调节序列,例如,可使用启动子检索载体、GENETYX等的基因解析软件来确定。在修饰表达调控序列的情况下,表达调控序列优选修饰1个碱基以上、更优选2个碱基以上、特别优选3个碱基以上。例如,通过用较弱的启动子替换染色体上基因的启动子,可以实现基因转录效率的降低。“较弱的启动子”是指,基因转录弱于原本存在的野生型启动子的启动子。作为较弱的启动子,可举出,例如,诱导型启动子。即,诱导型启动子可以在非诱导条件下(例如,在不存在诱导物的情况下)作为较弱的启动子起作用。此外,可以使部分或全部的表达调节序列缺失(缺陷)。此外,例如,通过操纵与表达控制相关的因子,可以实现基因表达的降低。作为与表达控制相关的因子,可列举:与转录或翻译控制相关的低分子(诱导物质、抑制物质等)、蛋白质(转录因子等)、核酸(siRNA等)等。此外,例如通过向基因的编码区域中导入变异以使得基因的表达降低,可以实现基因表达的降低。例如,通过使用宿主中较少使用的同义密码子替换基因编码区中的密码子,可以减少基因表达。此外,例如后述,可以通过破坏基因,降低基因本身的表达。
此外,降低蛋白质活性的修饰例如可以通过破坏编码该蛋白质的基因来实现。“破坏基因”是指,该基因经过修饰而不产生能够正常发挥功能的蛋白质。“不产生正常发挥功能的蛋白质”包括,完全不从该基因产生蛋白质的情况,以及由该基因产生的每分子蛋白质的功能(例如,活性或性质)降低或消失的情况。
例如,通过使染色体上的基因缺失(缺陷),可以实现基因的破坏。“基因的缺失”是指,基因的部分或全部编码区的缺失。进一步,可以使整个区域缺失,包括染色体上基因的编码区之前和之后的序列。基因编码区之前和之后的序列例如可包括基因的表达调节序列。只要可以实现蛋白质活性的降低即可,缺失区域可以是N-末端区域(编码蛋白质的N-末端侧的区域)、内部区域、C-末端区域(编码蛋白质的C-末端的区域)等中的任一区域。通常,较长的缺失区域能够可靠地使基因失活。缺失区域的长度例如可以为基因编码区域全长的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上、或95%以上。此外,缺失区域之前和之后序列的阅读框优选为不一致。阅读框的不一致可导致缺失区域下游的框移位。
此外,例如可以在染色体上的基因编码区中导入氨基酸取代(错义突变)、终止密码子(无义突变)、1~2个氨基酸的添加或缺失(框移突变),来实现基因的破坏(Journal ofBiological Chemistry 272:8611-8617(1997),Proceedings ofthe National Academyof Sciences,USA 95 5511-5515(1998),Journal of Biological Chemistry 26 116,20833-20839(1991))。
此外,例如可以将其他核苷酸序列插入染色体上的基因编码区,来实现基因的破坏。插入位点可以是基因的任何区域,如果插入的核苷酸序列较长,则能够可靠地使基因失活。此外,插入位点之前和之后的序列中的阅读框优选为不一致。阅读框的不一致可能导致插入位点下游的框移位。作为其他核苷酸序列,只要其降低或消除所编码的蛋白质的活性即可,没有特别限制,例如,抗生素抗性基因等标记基因或用于生产目标物质的基因。
特别是,可以使编码的蛋白质的氨基酸序列缺失(缺陷),来实现基因的破坏。即,例如通过使蛋白质的氨基酸序列(氨基酸序列的部分或全部区域)缺失,具体而言,通过修饰基因使其编码氨基酸序列(氨基酸序列的部分或全部区域)缺失的蛋白质,来实现蛋白质的活性降低的修饰。需要说明的是,“蛋白质的氨基酸序列的缺失”是指,蛋白质的氨基酸序列的部分或全部区域的缺失。此外,“蛋白质的氨基酸序列的缺失”是指,原来的氨基酸序列从蛋白质中消失,并且还包括原来的氨基酸序列变为其他氨基酸序列的情况。即,例如,通过框移位而变为其他氨基酸序列的区域,可以被视为发生了缺失的区域。一般而言,蛋白质的氨基酸序列的缺失通常会导致蛋白质的总长度缩短,但蛋白质的总长度也可能不变或延长。例如,通过使基因编码区的部分或全部区域缺失,可以使所编码的蛋白质的氨基酸序列中的由上述缺失区域编码的区域缺失。此外,例如通过将终止密码子导入基因的编码区,可以使所编码的蛋白质的氨基酸序列中的由上述导入位点下游区域编码的区域缺失。此外,例如通过基因编码区中的框移位,可以使由该框位点编码的区域缺失。关于氨基酸序列的缺失中的缺失区域的位置和长度,可以相应地适用关于基因的缺失中的缺失区域的位置和长度的说明。
对染色体上的基因进行的如上所述的修饰,例如,可以通过下述方式来实现:制备经过修饰而不产生正常发挥功能的蛋白质的破坏型基因,用含有破坏型基因的重组DNA对宿主进行转化,使破坏型基因和染色体上的野生型基因进行同源重组,用破坏型基因取代染色体上的野生型基因。在这种情况下,如果根据宿主的营养需求型等性质,使标记基因包含于重组DNA中,则更易于操作。作为破坏型基因,可列举:基因编码区的部分或全部区域发生了缺失的基因、导入了错义突变的基因、导入了无义突变的基因、导入了框移位突变的基因、插入了转座子或标记基因等插入序列的基因。即使产生由破坏型基因编码的蛋白质,也具有不同于野生型蛋白质的三维结构而功能降低或消失。用于同源重组的重组DNA的结构没有特别限制,只要能以所需方式进行同源重组即可。例如,可以以线性DNA转化宿主,该线性DNA含有破坏型基因并且两端分别具有染色体上的野生型基因的上游和下游序列,分别在野生型基因的上游和下游进行同源重组,如此就可以用破坏型基因取代野生型基因。通过利用了这样的同源重组的基因置换进行基因破坏的方法已经被建立,例如有被称为“Red驱动整合(Red-driven integration)”的方法(Datsenko,K.A,and Wanner,B.L.Proc.Natl.Acad.Sci.U S A.97:6640-6645(2000))、Red驱动整合法与源自λ噬菌体的切除系统(Cho,E.H.,Gumport,R.I.,Gardner,J.F.J.Bacteriol.184:5200-5203(2002))组合而成的方法(参见WO2005/010175号)等使用了线性DNA的方法;使用含有温度敏感性复制起点的质粒的方法;使用能够接合转移的质粒的方法;使用不具有在宿主中起作用的复制起点的自杀载体的方法(美国专利第6303383号、日本特开平05-007491号)等。需要说明的是,利用了这样的同源重组的染色体的修饰方法,不限于目的基因的破坏,还可以用于表达调节序列的修饰等染色体的任意修饰。
此外,例如可以通过诱变处理,进行降低蛋白质活性的修饰。作为诱变处理可以举出:X射线照射、紫外线照射、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、甲基磺酸乙酯(EMS)以及甲基磺酸甲酯(MMS)等诱变剂的处理。
作为上述降低蛋白质活性的方法,可以单独使用或任意组合使用。
通过测量蛋白质的活性,可以确认该蛋白质活性的降低。
通过确认编码蛋白质的基因表达的降低,也可以确认该蛋白质活性的降低。通过确认基因的转录水平的降低、或确认从基因表达的蛋白质的量的减少,可以确认该基因表达的降低。
通过将基因转录出的mRNA的量与未修饰菌株进行比较,可以确认该基因的转录量的降低。评价mRNA的量的方法包括:印迹杂交(NorthernHybridization)、RT-PCR、微阵列、RNA-Seq等(Sambrook,J.,et al.,Molecular Cloning:A Laboratory Manual/ThirdEdition,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor(USA),2001)。mRNA的量可以降低至,例如,未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
通过进行SDS-PAGE并确认分离得到的蛋白质条带的强度,可以确认蛋白质的量的降低。此外,使用抗体并且通过蛋白免疫印迹法(western blot),可以确认蛋白质的量的降低(Sambrook,J.,et al.,Molecular Cloning:A Laboratory Manual/Third Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。蛋白质的量(例如在细胞中的平均分子数)可以降低至,例如未修饰菌株的50%以下、20%以下、10%以下、5%以下、或0%。
可以根据破坏中使用的方法,确定该基因的部分或全部核苷酸序列、限制酶图谱、总长度等,以此来确认基因的破坏。
所述降低蛋白质的活性的方法,可用于任意的蛋白质的活性降低、任意的基因的表达降低。
<1-6>用于分泌表达异源蛋白质的基因构建体及其导入
已知分泌性蛋白质(secretory protein)通常被翻译为前蛋白质(也称为前肽)或前蛋白质原(preproprotein)(也称为前原肽(prepropeptide)),然后通过加工而成为成熟蛋白质(mature protein)。具体而言,分泌性蛋白质通常被翻译为前蛋白质或前蛋白质原,然后,蛋白酶(通常称为信号肽酶)剪切作为前部分的信号肽,并且将分泌性蛋白质转化为成熟蛋白质或蛋白原(proprotein),蛋白原通过蛋白酶进一步剪切其原部分而成为成熟蛋白质。因此,在本发明的方法中,信号肽被用于异源蛋白质的分泌产生。需要说明的是,在本发明中,有时分泌性蛋白质的前蛋白质和前蛋白质原可以被统称为“分泌性蛋白质前体”。
本发明中使用的基因构建体以从5’到3’的方向包含:在棒状细菌中发挥功能的启动子序列、编码TorA信号肽的核酸序列、以及编码异源蛋白质的核酸序列。编码TorA信号肽的核酸序列只需连接在启动子序列的下游,并且在启动子的控制下表达TorA信号肽即可。编码异源蛋白质的核酸序列只需连接在编码TorA信号肽的核酸序列的下游有,并且异源蛋白质以与该信号肽形成的融合蛋白的形式表达即可。该融合蛋白也称为“本发明的融合蛋白”。需要说明的是,如上所述,在本发明的方法中,分泌生产完全除去了TorA信号肽的异源蛋白质(完全剪切型的异源蛋白质)。即,最终得到的异源蛋白质不具有TorA信号肽。因此,“异源蛋白质以与TorA信号肽的融合蛋白进行表达”是指,表达异源蛋白质时构成与TorA信号肽的融合蛋白,并非是指,最终得到的异源蛋白质构成与TorA信号肽的融合蛋白。核酸序列也可以称为“基因”。例如,编码异源蛋白质的核酸序列也称为“编码异源蛋白质的基因”或“异源蛋白质基因”。作为核酸序列,可列举DNA。此外,本发明中使用的基因构建体还可以合适的位置上具有对在棒杆菌中表达本发明的融合蛋白有效的控制序列(操纵子、SD序列、终止子等),以使它们能够发挥作用。
本发明中使用的启动子没有特别限制,只要是在棒状细菌中发挥功能的启动子即可。启动子可以是源自棒状细菌的启动子(如源自宿主的启动子)、也可以是异源启动子。启动子可以是异源蛋白质固有的启动子,也可以是其他基因的启动子。“在棒状细菌中发挥功能的启动子”是指,在棒状细菌中具有启动子活性的启动子。
作为异源启动子,可列举,例如:tac启动子、lac启动子、trp启动子、araBAD启动子等源自大肠杆菌的启动子。其中,优选tac启动子等强启动子、araBAD启动子等诱导型启动子。
作为源自棒状细菌的启动子,可列举,例如:细胞表层蛋白PS1、PS2(也称为CspB)、SlpA(也称为CspA)基因的启动子、各种氨基酸生物合成系统基因的启动子。作为各种氨基酸生物合成系统基因的启动子,具体可列举,例如下述基因的启动子:谷氨酸生物合成系统的谷氨酸脱氢酶基因、谷氨酰胺合成系统的谷氨酰胺合成酶基因、赖氨酸生物合成系统的天冬氨酸激酶基因、苏氨酸生物合成系统的高丝氨酸脱氢酶基因、异亮氨酸和缬氨酸生物合成系统的乙酰羟酸合成酶基因、亮氨酸生物合成系统的2-异丙基苹果酸合成酶基因、脯氨酸和精氨酸生物合成系统的谷氨酸激酶基因、组氨酸生物合成系统的磷酸核糖基-ATP焦磷酸化酶基因、色氨酸、酪氨酸和苯丙氨酸等芳香族氨基酸生物合成系统的3-脱氧-D-阿拉伯糖基-庚糖醛酸-7-磷酸酯(DAHP)合成酶基因、肌苷酸和鸟苷酸等核酸这样的核苷酸生物合成系统的磷酸核糖焦磷酸(PRPP)酰胺转移酶基因、肌苷酸脱氢酶基因、鸟苷酸合成酶基因。
此外,作为在棒状细菌中发挥功能的启动子,可列举:如上所述的可用于棒状细菌中的更强的启动子。此外,作为启动子,可通过使用各种报告基因来获得现有启动子的高活性型并使用。例如,通过使得启动子区域中的-35和-10区域与共有序列接近,可以增强启动子的活性(WO00/18935)。Goldstein等人的论文描述了用于评价启动子的强度的方法和强启动子的实例(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))等。此外,已知在核糖体结合位点(RBS)和起始密码子之间的间隔区域、特别是在起始密码子的紧邻的上游序列(5’-UTR)中,多个核苷酸的取代、插入或缺失会对mRNA的稳定性和翻译效率产生显著影响,因此,可以修饰这些序列。
本发明中使用的信号肽为TorA信号肽。TorA信号肽是Tat系统依赖性信号肽。“Tat系统依赖性信号肽”是指,通过Tat系统进行识别的信号肽。“Tat系统依赖性信号肽”,具体而言,可以是与目标蛋白质的N末端连接时,通过Tat分泌系统使该蛋白质被分泌的肽。Tat系统依赖性信号肽具有双精氨酸基序。作为双精氨酸基序,可举出:R-R-X-#-#(#:疏水性残基)(序列编号45)。作为TorA信号肽,可举出大肠杆菌等的肠杆菌科细菌的TorA蛋白质(三甲胺-N-氧化物还原酶)的信号肽。大肠杆菌的TorA信号肽的氨基酸序列为“MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATA(序列编号46)”。
TorA信号肽只要具有双精氨酸基序并且保持原始功能,就可以为所述例举的TorA信号肽的变体。对于TorA信号肽和编码其的基因的变体,可以适用关于所述LepB蛋白质和lepB基因的保守变体的记载。例如,TorA信号肽可以为:具有在所述例举的TorA信号肽的氨基酸序列中在1个或数个位置处1个或数个氨基酸发生了取代、缺失、插入和/或添加的氨基酸序列的肽。需要说明的是,TorA信号肽的变体中的所述“1个或数个”,具体而言,优选为1~7个,更优选为1~5个,进一步优选为1~3个,特别优选为1~2个。此外,例如,TorA信号肽,可以为相对于所述例举的TorA信号肽的氨基酸序列整体具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的一致性的氨基酸序列的肽。本发明中,“TorA信号肽”这样的用语,除了序列编号46所述的肽之外,还包含其保守变体。
对于TorA信号肽的“保持原始功能”是指,具有作为Tat系统依赖性信号肽的功能。“具有作为Tat系统依赖性信号肽的功能”是指,可被Tat系统识别,具体而言,可以是指具有在与目标蛋白质的N末端连接时通过Tat分泌系统使该蛋白质被分泌的功能。某一肽是否具有作为Tat系统依赖性信号肽的功能,例如,可通过下述方式确认:确认在N末端添加有该肽的蛋白质的分泌生产量可通过Tat分泌系统的增强而得到提高;确认在N末端添加有该肽的蛋白质的分泌生产量可通过Tat分泌系统的缺失而减少。
编码TorA信号肽的核酸序列,如果是所述的编码TorA信号肽的序列时,没有特别限定。
作为根据本发明的方法分泌产生的异源蛋白质,可列举:生理活性蛋白、受体蛋白、用作疫苗的抗原蛋白、酶、以及其他任意的蛋白质。
作为酶,可列举,例如:谷氨酰胺转胺酶、蛋白质谷氨酰胺酶、异麦芽葡聚糖酶(isomaltodextranase)、蛋白酶、内肽酶、外肽酶、氨基肽酶、羧肽酶、胶原酶、几丁质酶(Chitinase)等。作为谷氨酰胺转胺酶,可列举,例如:放线菌和丝状真菌的分泌型谷氨酰胺转胺酶,上述放线菌包括茂原链轮丝菌(Streptoverticillium mobaraense)IFO 13819(WO01/23591)、肉桂链轮丝菌(Streptoverticillium cinnamoneum)IFO 12852、灰橙轮丝链轮丝菌(Streptoverticillium griseocarneum)IFO 12776、利迪链霉菌(Streptomyceslydicus)(WO96/06931)等,上述丝状真菌包括卵菌(Oomycota)(WO9622366)等。作为蛋白质谷氨酰胺酶,可列举:朊金黄杆菌(Chryseobacterium proteolyticum)的蛋白质谷氨酰胺酶(WO2005/103278)。作为异麦芽葡聚糖酶,可列举:球形节杆菌(Arthrobacterglobiformis)的异麦芽葡聚糖酶(WO2005/103278)。
作为生理活性蛋白质,可列举:生长因子(增殖因子)、激素、细胞因子、抗体相关分子。
作为生长因子,具体而言,可列举:表皮生长因子(Epidermal growth factor;EGF)、胰岛素样生长因子-1(Insulin-like growth factor-1;IGF-1)、转化生长因子(Transforming growth factor;TGF)、神经生长因子(Nerve growth factor;NGF)、脑源性神经营养因子(Brain-derived neurotrophic factor;BDNF)、血管内皮细胞生长因子(Vascular endothelial growth factor;VEGF)、粒细胞集落刺激因子(Granulocyte-colony stimulating factor;G-CSF)、粒细胞-巨噬细胞集落刺激因子(Granulocyte-macrophage-colony stimulating factor;GM-CSF)、血小板衍生生长因子(Platelet-derived growth factor;PDGF)、促红细胞生成素(Erythropoietin;EPO)、血小板生成素(Thrombopoietin;TPO)、酸性成纤维细胞生长因子(acidic fibroblast growth factor;aFGF或FGF1)、碱性成纤维细胞生长因子(basic fibroblast growth factor;bFGF或FGF2)、角质细胞生长因子(keratinocyte growth factor;KGF-1或FGF7,以及KGF-2或FGF10)和肝细胞生长因子(Hepatocyte growth factor;HGF)。
作为激素,具体而言,可列举:胰岛素、胰高血糖素、生长抑素(somatostatin)、人生长激素(human growth hormone;hGH)、甲状旁腺激素(parathyroid hormone;PTH)、降钙素(calcitonin)、艾塞那肽(exenatide)。
作为细胞因子,具体而言,可列举,例如:白介素(interleukin)、干扰素(interferon)、肿瘤坏死因子(Tumor Necrosis Factor;TNF)。
需要说明的是,生长因子、激素、以及细胞因子可以不严格区分彼此。例如,生理活性蛋白质可以是属于生长因子、激素、细胞因子中的任一种的蛋白质,也可以是属于其中的多种蛋白质。
此外,生理活性蛋白质可以是蛋白质整体,也可以是蛋白质的一部分。作为蛋白质的一部分,可列举,具有生理活性的部分。作为具有生理活性的部分,具体而言,可列举:特立帕肽(Teriparatide),其为一种包含甲状旁腺激素(PTH)的成熟体的N末端34个氨基酸残基的生理活性肽。
“抗体相关分子”是指含有下述分子种类的蛋白质,该分子种类包含选自构成完整抗体的结构域中的单个结构域、或两个或两个以上结构域的组合。作为构成完整抗体的结构域,可列举:作为重链结构域的VH、CH1、CH2、CH3、与作为轻链结构域的VL和CL。抗体相关分子只要其含有上述分子种类即可,可以是单体蛋白或多聚体蛋白。需要说明的是,当抗体相关分子是多聚体蛋白时,其可以是由单一种类的亚基组成的同源多聚体,也可以是由两种或两种以上的亚基构成的异源多聚体。作为抗体相关分子,具体而言,可列举:完整抗体、Fab、F(ab’)、F(ab’)2、Fc、由重链(H链)和轻链(L链)组成的二聚体、Fc融合蛋白、重链(H链)、轻链(L链)、单链Fv(scFv)、sc(Fv)2、二硫键结合Fv(sdFv)、双功能抗体(diabody)、VHH片段(Nanobody(注册商标))。作为抗体相关分子,更具体而言,例如,可举出曲妥珠单抗(Trastuzumab)、阿达木单抗(Adalimumab)、纳武单抗(Nivolumab)。
受体蛋白没有特别限制,例如,受体蛋白可以是生理活性蛋白质或其他生理活性物质的受体蛋白。作为其他生理活性物质,可列举,例如:多巴胺等神经递质。此外,受体蛋白可以是相应配体未知的孤儿受体(orphan receptor)。
用作疫苗的抗原蛋白没有特别限制,只要其是可以诱导免疫应答的蛋白质即可,抗原蛋白根据预定的免疫应答目标来进行适当选择即可。
此外,作为其它蛋白质,可列举:肝型脂肪酸结合蛋白(Liver-type fattyacid-binding protein;LFABP)、荧光蛋白、免疫球蛋白结合蛋白、白蛋白、细胞外蛋白。作为荧光蛋白质,可列举:绿色荧光蛋白(Green Fluorescent Protein;GFP)。作为免疫球蛋白结合蛋白质,可列举:蛋白A、蛋白G、蛋白L。作为白蛋白,可举出人血清白蛋白。
作为细胞外蛋白质,可列举:纤连蛋白(fibronectin)、玻连蛋白(Vitronectin)、胶原蛋白、骨桥蛋白(osteopomtin)、层粘连蛋白(laminin)、及它们的部分序列。层粘连蛋白是具有由α链、β链、γ链组成的异三聚体结构的蛋白质。作为层粘连蛋白,可列举:哺乳类的层粘连蛋白。作为哺乳类,可列举:人、猴、黑猩猩等灵长类;小鼠、大鼠、仓鼠、豚鼠等啮齿类;兔、马、牛、绵羊、山羊、猪、狗、猫等其他的哺乳类。作为哺乳类,特别可举出人。作为层粘连蛋白质的亚基链(即α链、β链和γ链),可举出:5种α链(α1~α5)、3种β链(β1~β3)、3种γ链(γ1~γ3)。取决于这些亚基链的组合,可构成各种亚型的层粘连蛋白。作为层粘连蛋白质,具体而言,可列举:层粘连蛋白111、层粘连蛋白121、层粘连蛋白211、层粘连蛋白213、层粘连蛋白221、层粘连蛋白311、层粘连蛋白321、层粘连蛋白332、层粘连蛋白411、层粘连蛋白421、层粘连蛋白423、层粘连蛋白511、层粘连蛋白521、层粘连蛋白523。作为层粘连蛋白质的部分序列,可举出层粘连蛋白质的E8片段。具体而言,层粘连蛋白E8是具有下述结构的蛋白质:由α链的E8片段(α链E8)、β链的E8片段(β链E8)、γ链的E8片段(γ链E8)构成的异三聚体结构。层粘连蛋白E8的亚基链(即,α链E8、β链E8、γ链E8)统称为“E8亚基链”。作为E8亚基链,可举出上文例举的层粘连蛋白亚基链的E8片段。取决于这些E8亚基链的组合,可构成各种亚型的层粘连蛋白E8。作为层粘连蛋白E8,具体而言,可列举:层粘连蛋白111E8、层粘连蛋白121E8、层粘连蛋白211E8、层粘连蛋白221E8、层粘连蛋白332E8、层粘连蛋白421E8、层粘连蛋白411E8、层粘连蛋白511E8、层粘连蛋白521E8。
编码这些蛋白质等异源蛋白质的基因,可以直接、或者经过适宜修饰来使用。例如,可以根据所使用的宿主和/或期望获得的活性,对编码异源蛋白质的基因进行修饰。例如,可以对编码异源蛋白质的基因进行修饰,使得在编码的异源蛋白质的氨基酸序列中包含一个或多个氨基酸的取代、缺失、插入、和/或添加。关于LepB蛋白和LepB基因的变体的上述说明也适用于通过本发明的方法分泌产生的异源蛋白质和编码它的基因。需要说明的是,来源物种所限定的蛋白质,不限于在该物种中发现的蛋白质本身,还包括具有在该物种中发现的蛋白质的氨基酸序列的、蛋白质及其变体。这些变体可以是在该物种中被发现的,或者未被发现的。即,例如,“人源蛋白质”不限于在人体中发现的蛋白质本身,还包括具有在人体中发现的蛋白质的氨基酸序列的、蛋白质及其变体。此外,编码异源蛋白质的基因可以是其中的任何密码子被其同义密码子置换而得的基因。例如,可以根据所用宿主的密码子使用频率,对编码异源蛋白质的基因进行修饰,使其具有最优密码子。
只要完全除去了TorA信号肽,则通过本发明的方法最终获得的异源蛋白质的N-末端区域可以与天然蛋白质相同,也可以与天然蛋白质不同。例如,最终获得的异源蛋白质的N-末端区域与天然蛋白质相比,可以是添加或缺失一个或多个氨基酸而成的。需要说明的是,上述“一个或多个”可以根据目标异源蛋白质的全长或结构等的不同而不同,具体而言,其优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。
此外,待分泌产生的异源蛋白质可以是添加有Pro结构部的蛋白质(蛋白原)。当分泌产生的异源蛋白质为蛋白原时,最终获得的异源蛋白质可以是蛋白原,也可以不是蛋白原。即,可以通过剪切Pro结构部来将蛋白原加工成成熟蛋白质。例如可以使用蛋白酶来进行剪切。当使用蛋白酶时,考虑到最终获得的蛋白质的活性,优选在蛋白原与天然蛋白质基本相同的位置处剪切蛋白原,更优选在与天然蛋白质完全相同的位置处剪切蛋白原,从而得到与天然成熟蛋白质相同的成熟蛋白质。因此,最优选在产生与天然存在的成熟蛋白质相同的蛋白质的位置处,剪切蛋白原的特异性蛋白酶。然而,如上所述,最终获得的异源蛋白质的N-末端区域可以不同于天然蛋白质的N-末端区域。例如,根据待生产的异源蛋白质的种类、用途等,与天然蛋白质相比,有时N末端长或短1个~多个氨基酸残基的蛋白质具有更合适的活性。可用于本发明中的蛋白酶包括:市售的蛋白酶如Dispase(由BoehringerMannheim公司生产)、以及可从微生物培养液例如放线菌培养液等中获得的蛋白酶。此类蛋白酶可以以未纯化的状态进行使用,也可以根据需要而纯化至适当的纯度后进行使用。
将本发明中使用的基因构建体导入棒状细菌的方法没有特别限制。“本发明中使用的基因构建体的导入”是指,使该基因构建体保持在宿主中。“本发明中使用的基因构建体的导入”不仅包括将预先构建的该基因构建体一并导入宿主的情况,至少还包括将异源蛋白质基因导入宿主并且在宿主中构建该基因构建体的情况。在本发明的细菌中,本发明中使用的基因构建体可以存在于如质粒等这样能在染色体外自主复制的载体中,也可以整合至染色体中。例如,可以通过与上述用于增加基因表达方法中的基因导入相同的方式,进行本发明中使用的基因构建体的导入。需要说明的是,在构建本发明的细菌时,能够以任意的顺序进行:本发明中使用的基因构建体的导入、LepB蛋白的活性提高、以及其他修饰。
本发明中使用的基因构建体,例如可以使用包含该基因构建体的载体来导入宿主。例如,可以将本发明中使用的基因构建体与载体相连接以构建该基因构建体的表达载体,并通过以该表达载体转化宿主,来将该基因构建体导入宿主。此外,当载体含有在棒状细菌中发挥功能的启动子时,可以在该启动子的下游连接编码本发明的融合蛋白质的核酸序列,来构建本发明中使用的基因构建体的表达载体。载体没有特别限制,只要是在棒状细菌中自主复制的载体即可。可用于棒状细菌中的载体如上所述。
此外,可以使用例如人工转座子等转座子,将本发明中使用的基因构建体导入宿主染色体。当使用转座子时,通过同源重组或转座子自身的转移能力,将本发明中使用的基因构建体导入染色体。此外,还可以通过利用了同源重组的其他导入方法,将本发明中使用的基因构建体导入染色体。作为利用了同源重组的导入方法,可列举,例如:利用了线性DNA、含有温度敏感性复制原点的质粒、能够接合转移的质粒、不具有在宿主中发挥功能的复制起点的自杀质粒等的方法。此外,至少可以将异源蛋白质基因导入染色体上,使得本发明使用的基因构建体在染色体上进行构建。在这种情况下,本发明中使用的基因构建体中的、除异源蛋白质基因以外的构成成分的部分或全部可以原本就存在于宿主的染色体上。具体而言,例如也可以直接利用原本存在于宿主染色体上的启动子序列,仅将与该启动子的下游连接的基因替换为编码TorA信号肽的核酸序列和目标异源蛋白质基因,由此,可以在染色体上构建本发明中使用的基因构建体,并构建本发明的细菌。可以通过与本发明中使用的基因构建体导入染色体的方法相同的方式,将异源蛋白质基因等导入至本发明所使用的基因构建体的一部分染色体中。
例如可以通过克隆来获得本发明中使用的基因构建体或其构成成分(启动子序列、编码TorA信号肽的核酸序列、编码异源蛋白质的核酸序列等)。具体而言,例如,可以从具有目标异源蛋白质的生物体中克隆目标异源蛋白质基因,然后对基因进行修饰,例如导入编码TorA信号肽的核酸序列或导入启动子序列等,来获得本发明中使用的基因构建体。此外,可以通过化学合成来获得本发明中使用的基因构建体或其构成成分(Gene,60(1),115-127(1987))。得到的基因构建体或其构成成分可以直接使用,也可以根据需要进行修饰。
需要说明的是,当表达两种或两种以上种类的蛋白质时,本发明的细菌只要具有用于分泌表达各蛋白质的基因构建体,并可以实现分泌表达目标异源蛋白质即可。具体而言,例如,用于各蛋白质分泌表达的基因构建体可以全部保持在单个表达载体上,或保持在染色体上。此外,用于各蛋白质分泌表达的基因构建体可以分别保持在多个表达载体上,或可以分别保持在一个或多个表达载体和染色体上。“表达两种或两种以上种类的蛋白质的情况”例如是指,分泌产生两种或两种以上种类的异源蛋白质的情况、或分泌产生异源多聚体蛋白质的情况。
将本发明中使用的基因构建体导入棒状细菌的方法没有特别限制,并且可以使用通常使用的方法,例如原生质体法(Gene,39,281-286(1985))、电穿孔法(Bio/Technology,7,1067-1070(1989))、电脉冲法(日本特开平2-207791号公报)等。
<2>异源蛋白质的制造方法
培养上述获得的本发明的细菌,来表达异源蛋白质,由此,得到大量分泌到菌体外的异源蛋白质。
可以根据通常使用的方法和条件,来培养本发明的细菌。例如,本发明的细菌可以在含有碳源、氮源、无机离子的通常的培养基中进行培养。为了获得更高的增殖,还可以根据需要加入维生素和氨基酸等有机微量营养素。
作为碳源,可以使用碳水化合物例如葡萄糖和蔗糖、有机酸例如乙酸、醇类等。作为氮源,可以使用氨气、氨水、铵盐等。作为无机离子,根据需要而适当使用钙离子、镁离子、磷酸根离子、钾离子、铁离子等。在有氧条件下,在pH5.0~8.5、15~37℃的适当范围内培养1~7天左右。此外,可以使用下述条件:通过棒状细菌生产L-氨基酸的培养条件、以及使用了信号肽的蛋白质的分泌生产方法中所记载的其它条件(参见WO01/23591和WO2005/103278)。此外,当将诱导型启动子用于异源蛋白质的表达时,还可以向培养基中加入启动子诱导剂来进行培养。通过在这样的条件下培养本发明的细菌,可以在菌体内产生大量的目标蛋白质,并高效地分泌到菌体外。需要说明的是,根据本发明的方法,由于生产的异源蛋白质被分泌到菌体外,因此,即使是谷氨酰胺转胺酶等大量蓄积在微生物的菌体内通常是致死性的蛋白质,也可以连续生产而不受致死的影响。
根据本发明的方法而分泌到培养基中的蛋白质,可以通过本领域技术人员熟知的方法,从培养后的培养基中分离和纯化。例如,在通过离心分离等除去菌体后,可以通过已知的合适方法或其组合来分离纯化蛋白质,所述方法可举出:盐析、乙醇沉淀、超滤、凝胶过滤色谱、离子交换柱层析、亲和层析、中高压液相色谱、反相色谱、疏水色谱等。此外,在某些情况下,可以直接使用培养物或培养上清液。就根据本发明的方法而分泌在菌体表层的蛋白质而言,可以在通过本领域技术人员公知的方法进行溶解后,例如通过提高盐浓度和使用表面活性剂进行可溶化处理后,通过与蛋白质被分泌到培养基中的情况相同的方式,进行分离纯化。此外,在某些情况下,分泌到菌体表层的蛋白质例如也可以用作固定化酶,而不进行可溶化处理。
能够以含有培养上清液和/或菌体表层的级分作为样品,通过进行SDS-PAGE,并确定分离的蛋白质条带的分子量,来确定目标异源蛋白质的分泌产生。此外,能够以含有培养上清液和/或菌体表层的级分作为样品,通过使用了抗体的蛋白免疫印迹法(westernblot),来确定目标异源蛋白质的分泌产生(Molecular cloning(Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA),2001))。此外,还可以使用蛋白质测序仪检测目标蛋白质的N末端氨基酸序列,来确定目标异源蛋白质的分泌产生。此外,还可以使用质谱仪确定目标蛋白质的质量,来确定目标异源蛋白质的分泌产生。此外,当目标异源蛋白质是酶或具有某种可测量的生理活性的蛋白质时,能够以含有培养上清液和/或菌体表层的成分作为样品,测量目标异源蛋白质的酶活性或生理活性,来确定目标异源蛋白质的分泌产生。
实施例
下文中,参照非限定性的实施例对本发明进一步具体性地进行说明。
实施例1:源自谷氨酸棒杆菌ATCC13869的信号肽酶基因(lepB)扩增用载体的构建
谷氨酸棒杆菌ATCC13869菌株的基因组序列和编码I型信号肽酶(TypeI signalpeptidase,LepB)的lepB基因的碱基序列已经被确定(GenBank Accession No.AP017557,NCBI locus_tag CGBL_0119390)。源自谷氨酸棒杆菌ATCC13869菌株的lepB基因的碱基序列示于<序列编号01>,LepB蛋白质的氨基酸序列示于<序列编号02>。
以使用PurElute(TM)Genomic DNA Kit(EdgeBio)制备得到的谷氨酸棒杆菌ATCC13869菌株的染色体DNA作为模板,使用<序列编号03>和<序列编号04>的引物对包含lepB基因的编码区域及其5’侧上流约0.2kbp的区域通过PCR法进行扩增,得到约1.0kbp的DNA片段。对于<序列编号03>的引物设计制限酶KpnI的识别序列,对于<序列编号04>的引物设计制限酶ApaI和XbaI的识别序列。PCR中使用PrimeSTAR(R)HS DNA Polymerase(TakaraBio),反应条件基于厂商的推荐条件。
使该PCR片段被制限酶KpnI和XbaI消化,通过连接反应插入WO2016/171224所述的pPK5载体的KpnI-XbaI位点,从而构建lepB基因扩增用的载体pPK5lepB。同样地,使同一PCR片段被制限酶KpnI和ApaI消化,通过连接反应插入WO2016/171224所述的pPK6载体的KpnI-ApaI位点,从而构建tatABC分泌系统基因和lepB基因扩增用的载体pPK6lepB。连接反应中使用DNA Ligation Kit<Mighty Mix>(Takara Bio),反应条件基于厂商的推荐条件。需要说明的是,pPK5载体是日本特开平9-322774所述的pPK4载体中的对NaeI制限酶位点进行了修饰的载体,pPK6载体是在pPK5载体上搭载有tatABC基因的TatABC分泌系统扩增用载体(图1的版块A和C)。对插入片段的碱基序列进行确定的结果,确认了分别插入了预期的lepB基因。碱基序列的确定使用BigDye(R)Terminator v3.1 Cycle Sequencing Kit(AppliedBiosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
以pPK5lepB或pPK6lepB作为表达载体对目标蛋白质的表达盒进行亚克隆时,可通过利用KpnI位点或者ApaI-XbaI位点,来调整lepB基因和目标蛋白质的表达盒的搭载顺序(图1的版块B和D)。
实施例2:使用了TorA信号序列的带有Pro结构部的谷氨酰胺转胺酶(PTG)分泌表达中的lepB基因扩增效果的评价
(1)在现有(不扩增lepB基因)的条件下使用了TorA信号肽的PTG的分泌表达
将WO2016/171224所述的YDK010::phoS(W302C)/pPK6_T_PTG菌株以包含25mg/l的卡那霉素的MMTG液体培养基(葡萄糖120g、硫酸镁七水合物3g、硫酸铵30g、磷酸二氢钾1.5g、硫酸铁七水合物0.03g、硫酸锰五水合物0.03g、硫胺盐酸盐0.45mg、生物素0.45mg、DL-甲硫氨酸0.15g、大豆盐酸水解液(总氮量0.2g),碳酸钙50g,用水设为1L并调整为pH7.0)在30℃下培养72小时。需要说明的是,pPK6_T_PTG是由tatABC基因扩增用载体pPK6构建得到的带有Pro结构部的谷氨酰胺转胺酶(PTG)的分泌表达用载体,并且是具有谷氨酸棒杆菌ATCC13869菌株的cspB基因来源的启动子、以可表达的方式连接在该启动子的下游的大肠杆菌来源的编码TorA信号肽的DNA和以作为与该信号肽的融合蛋白而表达的方式连接的Streptomyces mobaraense来源的PTG基因的质粒(WO2016/171224)。YDK010::phoS(W302C)菌株是在作为谷氨酸棒杆菌AJ12036(FERM BP-734)的细胞表层蛋白CspB缺失菌株的YDK010株(WO2002/081694)的染色体上的phoS基因中导入有PhoS(W302C)变异的菌株(WO2016/171224)。培养结束后,将对培养液进行离心分离而得到的培养上清液1.0μl使用MULTIGEL(R)II mini 15/20(Cosmo Bio)进行还原SDS-PAGE后通过SYPRO(R)Orange(Thermo Fisher Scientific)进行染色的结果,主要检测到2根条带(图2的版块A,泳道3-5)。对各个条带的N末端氨基酸序列进行解析的结果,在高分子侧的条带中确认了表示在PTG的N末端残存有TorA信号序列的C末端侧15残基的氨基酸序列(GMLGPSLLTP;序列编号47),在低分子侧的条带中确认了PTG的N末端氨基酸序列(DNGAGEETKS;序列编号48)(图2的版块B)。即,可知在使用了TorA信号序列的PTG分泌生产中,明显残存有具有TorA信号肽的C末端侧15残基的残余型。
(2)使用了pPK6lepB载体的PTG分泌表达用载体构建
以WO2016/171224所述的PTG分泌表达用载体pPK6_T_PTG作为模板,使用<序列编号05>和<序列编号06>的引物、或<序列编号07>和<序列编号08>的引物,将包含cspB启动子-TorA信号肽-PTG的表达盒的约1.9kbp的DNA片段通过PCR法进行扩增。对于<序列编号05>和<序列编号06>的引物设计制限酶KpnI的识别序列,对于<序列编号07>和<序列编号08>的引物设计制限酶ApaI的识别序列。PCR中使用PrimeSTAR(R)HS DNA Polymerase(TakaraBio),反应条件基于厂商的推荐条件。
将这些DNA片段分别通过Infusion反应插入实施例1中构建得到的pPK6lepB载体的KpnI位点或ApaI位点,从而构建作为融合了tatABC分泌系统基因、lepB基因、TorA信号序列的PTG基因的共表达质粒的pPK6lepB(K)_T_PTG和pPK6lepB(A)_T_PTG(图1的版块D)。质粒名的(K)和(A)分别表示插入有PTG的表达盒的pPK6lepB载体的制限酶位点(KpnI位点和ApaI位点)。Infusion反应中使用In-Fusion(R)HD Cloning Kit(Takara Bio),反应条件基于厂商的推荐条件。对插入片段的碱基序列进行确定的结果,确认了分别插入了预期的基因。碱基序列的确定,使用BigDye(R)Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(3)lepB基因扩增条件下使用了TorA信号肽的PTG的分泌表达
使用实施例2(2)中构建得到的PTG分泌表达质粒pPK6lepB(K)_T_PTG和pPK6lepB(A)_T_PTG,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6lepB(K)_T_PTG菌株和YDK010::phoS(W302C)/pPK6lepB(A)_T_PTG菌株。将得到的各转化体使用包含25mg/l的卡那霉素的MMTG液体培养基分别在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液1.0μl使用MULTIGEL(R)II mini 15/20(Cosmo Bio)进行还原SDS-PAGE后通过SYPRO(R)Orange(Thermo Fisher Scientific)进行染色。其结果,在不扩增lepB基因的pPK6_T_PTG导入株的情况下,主要检测到2根条带,与之相对,在lepB基因扩增了的pPK6lepB(K)_T_PTG和pPK6lepB(A)_T_PTG导入株的情况下,高分子侧的条带均减少并且几乎无法检测到,低分子侧的条带增加(图2的版块A,泳道6-11)。对N末端氨基酸序列进行解析的结果,在低分子侧的条带中确认到PTG的N末端氨基酸序列(DNGAGEETKS;序列编号48)。即,可知在使用了TorA信号序列的PTG分泌生产中,在不扩增lepB基因的条件下明显残存有具有TorA信号肽的C末端侧15残基的残余型,但是通过lepB基因的扩增促进TorA信号肽的加工,能够显著提高具有正确的N末端氨基酸序列的PTG的生产效率。
实施例3:使用了TorA信号序列的带有Pro结构部的蛋白质谷氨酰胺酶(PPG)分泌表达中的lepB基因扩增效果的评价
(1)在现有(不扩增lepB基因)的条件下使用了TorA信号肽的PPG的分泌表达
将WO2016/171224所述的YDK010::phoS(W302C)/pPK6_T_PPG菌株用包含25mg/l的卡那霉素的MMTG液体培养基在30℃下培养72小时。需要说明的是,pPK6_T_PPG是由tatABC基因扩增用载体pPK6构建得到的带有Pro结构部的蛋白质谷氨酰胺酶(PPG)的分泌表达用载体,并且是具有谷氨酸棒杆菌ATCC13869菌株的cspB基因来源的启动子、以可表达的方式连接在该启动子的下游的大肠杆菌来源的编码TorA信号肽的DNA和以作为与该信号肽的融合蛋白而表达的方式连接的Chryseobacterium proteolyticum来源的PPG基因的质粒(WO2016/171224)。培养结束后,将对各培养液进行离心分离而得到的培养上清液2.5μl使用MULTIGEL(R)II mini 15/20(CosmoBio)进行还原SDS-PAGE后通过SYPRO(R)Orange(Thermo Fisher Scientific)进行染色的结果,主要检测到2根条带(图3的版块A,泳道3-5)。对各个条带的N末端氨基酸序列进行解析的结果,在高分子侧的条带中,确认了表示在PPG的N末端残存有TorA信号序列的C末端侧15残基的氨基酸序列(GMLGPSLLTP;序列编号47),在低分子侧的条带中,确认了PPG的N末端氨基酸序列(DSNGNQEING;序列编号49)(图3的版块B)。即,可知在使用了TorA信号序列的PPG分泌生产中,明显残存有具有TorA信号肽的C末端侧15残基的残余型。
(2)使用了pPK6lepB载体的PPG分泌表达用载体构建
以WO2016/171224所述的PPG的分泌表达用载体pPK6_T_PPG作为模板,使用<序列编号05>和<序列编号09>的引物、或<序列编号07>和<序列编号10>的引物,将包含cspB启动子-TorA信号序列-PPG的表达盒的约1.6kbp的DNA片段通过PCR法进行扩增。对于<序列编号05>和<序列编号09>的引物设计制限酶KpnI的识别序列,对于<序列编号07>和<序列编号10>的引物设计制限酶ApaI的识别序列。PCR中使用PrimeSTAR(R)HS DNA Polymerase(Takara Bio),反应条件基于厂商的推荐条件。
将这些DNA片段分别通过Infusion反应插入实施例1中构建得到的pPK6lepB载体的KpnI位点或ApaI位点,从而构建作为融合了tatABC分泌系统基因、lepB基因、TorA信号序列的PPG基因的共表达质粒的pPK6lepB(K)_T_PPG和pPK6lepB(A)_T_PPG(图1的版块D)。质粒名的(K)和(A)表示分别插入有PPG的表达盒的pPK6lepB载体的制限酶位点(KpnI位点和ApaI位点)。Infusion反应中使用In-Fusion(R)HD Cloning Kit(Takara Bio),反应条件基于厂商的推荐条件。对插入片段的进行碱基序列确定的结果,确认了分别插入了预期的基因。碱基序列的确定,使用BigDye(R)Terminator v3.1Cycle Sequencing Kit(Applied Biosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(3)lepB基因扩增条件下使用了TorA信号肽的PPG的分泌表达
使用实施例3(2)中构建得到的PPG分泌表达质粒pPK6lepB(K)_T_PPG和pPK6lepB(A)_T_PPG,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6lepB(K)_T_PPG菌株和YDK010::phoS(W302C)/pPK6lepB(A)_T_PPG菌株。将得到的各转化体使用包含25mg/l的卡那霉素的MMTG液体培养基分别在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液2.5μl使用MULTIGEL(R)II mini 15/20(Cosmo Bio)进行还原SDS-PAGE后通过SYPRO(R)Orange(Thermo Fisher Scientific)进行染色。其结果,lepB基因未扩增的pPK6_T_PPG导入株的情况下,主要检测到2根条带,与之相对,在lepB基因扩增了的pPK6lepB(K)_T_PPG和pPK6lepB(A)_T_PPG导入株的情况下,高分子侧的条带均减少并且几乎无法检测到,低分子侧的条带增加(图3的版块A,泳道6-11)。对N末端氨基酸序列进行解析的结果,在低分子侧的条带中确认了PPG的N末端氨基酸序列(DSNGNQEING;序列编号49)。即,在使用了TorA信号序列的PPG分泌生产中,在lepB基因非扩增条件下明显残存有具有TorA信号肽的C末端侧15残基的残余型,但是通过lepB基因的扩增而促进TorA信号肽的加工,能够明显提高具有正确的N末端氨基酸序列的PPG的生产效率。
实施例4:使用了TorA信号序列的β-内酰胺酶(Bla)分泌表达中的lepB基因扩增效果的评价
(1)添加有编码Tat分泌系统的tatABC基因和TorA信号序列的编码Bla的基因的共表达质粒的构建
已知作为β-内酰胺酶(β-lactamase;以下记载为Bla)的一种的属于TEM-型的A类广谱β-内酰胺酶TEM-116的氨基酸序列(GenBank Accesson No.WP_000027050)。该氨基酸序列中,除N末端的信号序列之外的24-286位的263残基的氨基酸序列示于<序列编号11>。考虑谷氨酸棒杆菌的密码子使用频率,设计了编码序列编号11的Bla的碱基序列。设计得到的碱基序列示于<序列编号12>。
接下来,使编码大肠杆菌来源的TorA蛋白质(UniProt Accession number:P33225)的信号肽39氨基酸残基的DNA和<序列编号12>所述的DNA连接至源自谷氨酸棒杆菌ATCC13869菌株的cspB基因的启动子的下游,进一步在5’-侧添加KpnI位点,在3’-侧添加ApaI位点,全合成TorA信号肽和Bla的融合蛋白的表达盒。将全合成得到的DNA片段插入WO2016/171224所述的pPK6载体的KpnI-ApaI位点,从而构建作为使用了TorA信号序列的Bla的分泌表达质粒的pPK6_T_Bla(图1的版块C)。对插入片段的碱基进行序列确定的结果,确认了构建了所设计的Bla基因表达盒。碱基序列的确定,使用BigDye(R)Terminatorv3.1 Cycle Sequencing Kit(Applied Biosystems)和3130Genetic Analyzer(AppliedBiosystems)进行。
(2)不扩增lepB基因条件下使用了TorA信号肽的Bla的分泌表达
使用实施例4(1)中构建得到的Bla的分泌表达质粒pPK6_T_Bla,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6_T_Bla菌株。将得到的转化体用包含25mg/l的卡那霉素的MMTG液体培养基在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液5.0μl使用NuPAGE(R)4-12%Bis-Tirs Gel(Thermo Fisher Scientific)进行还原SDS-PAGE后通过SYPRO(R)Ruby(ThermoFisher Scientific)进行染色的结果,主要检测到2根条带(图4的版块A,泳道3-5)。对各个条带的N末端氨基酸序列进行解析的结果,在高分子侧的条带中,确认了表示在Bla的N末端残存有TorA信号序列的C末端侧15残基的氨基酸序列(GMLGPSLLTP;序列编号47),在低分子侧的条带中,确认了Bla的N末端氨基酸序列(HPETLVKVKD;序列编号50)(图4的版块B)。即,可知在使用了TorA信号序列的Bla分泌生产中,残存有具有TorA信号肽的C末端侧15残基的残余型。
(3)使用了pPK6lepB载体的Bla分泌表达用载体构建
以实施例4(1)中构建得到的Bla的分泌表达用载体pPK6_T_Bla作为模板,使用<序列编号05>和<序列编号13>的引物、或<序列编号07>和<序列编号14>的引物,将包含cspB启动子-TorA信号序列-Bla的表达盒的约1.5kbp的DNA片段通过PCR法进行扩增。对于<序列编号05>和<序列编号13>的引物设计制限酶KpnI的识别序列,对于<序列编号07>和<序列编号14>的引物设计制限酶ApaI的识别序列。PCR中使用PrimeSTAR(R)HS DNA Polymerase(Takara Bio),反应条件基于厂商的推荐条件。
将这些DNA片段分别通过Infusion反应插入实施例1中构建得到的pPK6lepB载体的KpnI位点或ApaI位点,从而构建作为融合了tatABC分泌系统基因、lepB基因、TorA信号序列的Bla基因的共表达质粒的pPK6lepB(K)_T_Bla和pPK6lepB(A)_T_Bla(图1的版块D)。质粒名的(K)和(A)分别表示插入有Bla的表达盒的pPK6lepB载体的制限酶位点(KpnI位点和ApaI位点)。Infusion反应中使用In-Fusion(R)HD Cloning Kit(Takara Bio),反应条件基于厂商的推荐条件。对插入片段的碱基进行序列确定的结果,确认了分别插入了预期的基因。碱基序列的确定,使用BigDye(R)Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(4)lepB基因扩增条件下使用了TorA信号肽的Bla的分泌表达
使用实施例4(3)中构建得到的Bla分泌表达质粒pPK6lepB(K)_T_Bla和pPK6lepB(A)_T_Bla,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6lepB(K)_T_Bla菌株和YDK010::phoS(W302C)/pPK6lepB(A)_T_Bla菌株。将得到的各转化体使用包含25mg/l的卡那霉素的MMTG液体培养基分别在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液5.0μl使用NuPAGE(R)4-12%Bis-Tirs Gel(Thermo Fisher Scientific)进行还原SDS-PAGE后通过SYPRO(R)Ruby(Thermo Fisher Scientific)进行染色。其结果,在不扩增lepB基因的pPK6_T_Bla导入株的情况下,主要检测到2根条带,与之相对,在lepB基因扩增了的pPK6lepB(K)_T_Bla和pPK6lepB(A)_T_Bla导入株的情况下,高分子侧的条带均减少并且几乎无法检测到,低分子侧的条带增加(图4的版块A,泳道6-11)。对N末端氨基酸序列进行解析的结果,在低分子侧的条带中,确认了Bla的N末端氨基酸序列(HPETLVKVKD;序列编号50)。即,在使用了TorA信号序列的Bla分泌生产中,在不扩增lepB基因条件下残存有具有TorA信号肽的C末端侧15残基的残余型,但是通过lepB基因的扩增而促进TorA信号肽的加工,能够明显提高具有正确的N末端氨基酸序列的Bla的生产效率。
实施例5:使用了TorA信号序列的硫氧还蛋白(Trx)分泌表达中的lepB基因扩增效果的评价
(1)添加有编码Tat分泌系统的tatABC基因和TorA信号序列的编码Trx的基因的共表达质粒的构建
已知作为硫氧还蛋白(Thioredoxin;下文中,记载为Trx)的一种的大肠杆菌来源的TrxA蛋白质的氨基酸序列(GenBank Accesson No.WP_001323277)。从该氨基酸序列除去N末端19残基,进一步在N末端添加1残基Ala而得到的修饰型Trx的109残基的氨基酸序列示于<序列编号15>。考虑谷氨酸棒杆菌的密码子使用频率,设计了编码序列编号15的Trx的碱基序列。设计得到的碱基序列示于<序列编号16>。
接下来,将编码大肠杆菌来源的TorA蛋白质(UniProt Accession number:P33225)的信号肽39氨基酸残基的DNA和<序列编号16>所述的DNA连接至源自谷氨酸棒杆菌ATCC13869菌株的cspB基因的启动子的下游,进一步在5’-侧添加KpnI位点,在3’-侧添加ApaI位点,全合成TorA信号肽和Trx的融合蛋白的表达盒。将全合成得到的DNA片段插入WO2016/171224所述的pPK6载体的KpnI-ApaI位点,从而构建作为Trx的分泌表达质粒的pPK6_T_Trx(图1的版块C)。对插入片段的碱基进行序列确定的结果,确认构成了所设计的Trx基因表达盒。碱基序列的确定,使用BigDye(R)Terminator v3.1 Cycle SequencingKit(Applied Biosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(2)不扩增lepB基因条件下使用了TorA信号肽的Trx的分泌表达
使用实施例5(1)中构建得到的Trx的分泌表达质粒pPK6_T_Trx,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6_T_Trx菌株。将得到的转化体用包含25mg/l的卡那霉素的MMTG液体培养基在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液2.5μl使用NuPAGE(R)12%Bis-TirsGel(Thermo Fisher Scientific)进行还原SDS-PAGE后通过SYPRO(R)Ruby(Thermo FisherScientific)进行染色的结果,主要检测到2根条带(图5的版块A,泳道3-5)。对各个条带的N末端氨基酸序列进行解析的结果,在高分子侧的条带中,确认了表示在Trx的N末端残存有TorA信号序列的C末端侧15残基的氨基酸序列(GMLGPSLLTP;序列编号47),在低分子侧的条带中,确认了Trx的N末端氨基酸序列(ASDKIIHLTD;序列编号51)(图5的版块B)。即,在使用了TorA信号序列的Trx分泌生产中,残存有具有TorA信号肽的C末端侧15残基的残余型。
(3)使用了pPK6lepB载体的Trx分泌表达用载体构建
以实施例5(1)中构建得到的Trx的分泌表达用载体pPK6_T_Trx作为模板,使用<序列编号05>和<序列编号17>的引物、或<序列编号07>和<序列编号18>的引物,将包含cspB启动子-TorA信号序列-Trx的表达盒的约1.1kbp的DNA片段通过PCR法进行扩增。对于<序列编号05>和<序列编号17>的引物设计制限酶KpnI的识别序列,对于<序列编号07>和<序列编号18>的引物设计制限酶ApaI的识别序列。PCR中使用PrimeSTAR(R)HS DNA Polymerase(Takara Bio),反应条件基于厂商的推荐条件。
将这些DNA片段分别通过Infusion反应插入实施例1中构建得到的pPK6lepB载体的KpnI位点或ApaI位点,从而构建作为融合了tatABC分泌系统基因、lepB基因、TorA信号序列的Trx基因的共表达质粒的pPK6lepB(K)_T_Trx和pPK6lepB(A)_T_Trx(图1的版块D)。质粒名的(K)和(A)分别表示,插入有Trx的表达盒的pPK6lepB载体的制限酶位点(KpnI位点和ApaI位点)。Infusion反应中使用In-Fusion(R)HD Cloning Kit(Takara Bio),反应条件基于厂商的推荐条件。对插入片段的碱基进行序列确定的结果,确认了分别插入了预期的基因。碱基序列的确定,使用BigDye(R)Terminator v3.1 Cycle Sequencing Kit(Applied Biosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(4)lepB基因扩增条件下使用了TorA信号肽的Trx的分泌表达
使用实施例5(3)中构建得到的Trx分泌表达质粒pPK6lepB(K)_T_Trx和pPK6lepB(A)_T_Trx,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6lepB(K)_T_Trx菌株和YDK010::phoS(W302C)/pPK6lepB(A)_T_Trx菌株。将得到的各转化体使用包含25mg/l的卡那霉素的MMTG液体培养基分别在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液2.5μl使用NuPAGE(R)12%Bis-Tirs Gel(Thermo Fisher Scientific)进行还原SDS-PAGE后SYPRO(R)Ruby(Thermo Fisher Scientific)进行染色。其结果,在不扩增lepB基因的pPK6_T_Trx导入株的情况下,主要检测到2根条带,与之相对,在lepB基因扩增了的pPK6lepB(K)_T_Bla和pPK6lepB(A)_T_Bla导入株的情况下,高分子侧的条带均减少并且几乎无法检测到,低分子侧的条带增加(图5的版块A,泳道6-11)。对N末端氨基酸序列进行解析的结果,在低分子侧的条带中确认了Trx的N末端氨基酸序列(ASDKIIHLTD;序列编号51)。即,在使用了TorA信号序列的Trx分泌生产中,在不扩增lepB基因条件下残存有具有TorA信号肽的C末端侧15残基的残余型,但是通过lepB基因的扩增而促进TorA信号肽的加工,能够明显提高具有正确的N末端氨基酸序列的Trx的生产效率。
实施例6:使用了TorA信号序列的肝型脂肪酸结合蛋白(Liver-type fattyacid-binding protein,LFABP)分泌表达中的lepB基因扩增效果的评价
(1)添加有编码Tat分泌系统的tatABC基因和编码TorA信号序列的LFABP的基因的共表达质粒的构建
已知人的肝型脂肪酸结合蛋白(Liver-type fatty acid-binding protein,下文中,记载为LFABP)的氨基酸序列(GenBank Accession No.NP_001434)。该127残基的氨基酸序列示于<序列编号19>。考虑谷氨酸棒杆菌的密码子使用频率,设计了编码序列编号19的LFABP的碱基序列。设计得到的碱基序列示于<序列编号20>。
接下来,将编码大肠杆菌来源的TorA蛋白质(UniProt Accession number:P33225)的信号肽39氨基酸残基的DNA和<序列编号20>所述的DNA连接至源自谷氨酸棒杆菌ATCC13869菌株的cspB基因的启动子的下游,进一步在5’-侧添加KpnI位点,在3’-侧添加ApaI位点,全合成TorA信号肽和LFABP的融合蛋白的表达盒。将全合成得到的DNA片段插入WO2016/171224所述的pPK6载体的KpnI-ApaI位点,从而构建作为LFABP的分泌表达质粒的pPK6_T_LFABP(图1的版块C)。对插入片段的碱基进行序列确定的结果,确认构成了所设计的LFABP基因表达盒。碱基序列的确定,使用BigDye(R)Terminator v3.1 CycleSequencing Kit(Applied Biosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(2)不扩增lepB基因条件下使用了TorA信号肽的LFABP的分泌表达
使用实施例6(1)中构建得到的LFABP的分泌表达质粒pPK6_T_LFABP,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6_T_LFABP菌株。将得到的转化体用包含25mg/l的卡那霉素的MMTG液体培养基在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液5.0μl使用NuPAGE(R)4-12%Bis-Tirs Gel(Thermo Fisher Scientific)进行还原SDS-PAGE后通过SYPRO(R)Ruby(Life Technologies)进行染色的结果,主要检测到2根条带(图6的版块A,泳道3-5)。需要说明的是,高分子侧的条带在作为阴性对照的YDK010::phoS(W302C)/pPK6株的培养上清液中也被检测到(图6的版块A,lane2),因此推定其包含作为宿主的谷氨酸棒杆菌来源的蛋白质。对各个条带的N末端氨基酸序列进行解析的结果,在高分子侧的条带中,检测到表示在LFABP的N末端残存有TorA信号序列的C末端侧15残基的氨基酸序列(GMLGPSLLTP;序列编号47)和谷氨酸棒杆菌来源的resuscitation-promoting factor Rpf1(GenBankAccession No.AP017557,NCBI locus_tag CGBL_0109030)的成熟蛋白质的N末端序列(APDSDWDRLA;序列编号52),确认了在高分子侧的条带主要是这2种蛋白质的混合条带(图6的版块B)。需要说明的是,未检测到表示残存有Rpf1信号序列的C末端侧的部分序列的氨基酸序列,对于Rpf1,确认了信号肽全长正常地被剪切。另一方面,在低分子侧的条带中确认了LFABP的N末端氨基酸序列(MSFSGKYQLQ;序列编号53)(图6的版块B)。即,在使用了TorA信号序列的LFABP分泌生产中,残存有具有TorA信号肽的C末端侧15残基的残余型。
(3)使用了pPK6lepB载体的LFABP分泌表达用载体构建
以实施例6(1)中构建得到的LFABP的分泌表达用载体pPK6_T_LFABP作为模板,使用<序列编号05>和<序列编号21>的引物、或<序列编号07>和<序列编号22>的引物,将包含cspB启动子-TorA信号序列-LFABP的表达盒的约1.1kbp的DNA片段通过PCR法进行扩增。对于<序列编号05>和<序列编号21>的引物设计制限酶KpnI的识别序列,对于<序列编号07>和<序列编号22>的引物设计制限酶ApaI的识别序列。PCR中使用PrimeSTAR(R)HS DNAPolymerase(Takara Bio),反应条件基于厂商的推荐条件。
将这些DNA片段分别通过Infusion反应插入实施例1中制备得到的pPK 6lepB载体的KpnI位点或ApaI位点,从而构建作为融合了tatABC分泌系统基因、lepB基因、TorA信号序列的LFABP基因的共表达质粒的pPK6lepB(K)_T_LFABP和pPK6lepB(A)_T_FABP(图1的版块D)。质粒名的(K)和(A)分别表示插入有LFABP的表达盒的pPK6lepB载体的制限酶位点(KpnI位点和ApaI位点)。Infusion反应中使用In-Fusion(R)HD Cloning Kit(TakaraBio),反应条件基于厂商的推荐条件。对插入片段的碱基进行序列确定的结果,确认了分别插入了预期的基因。碱基序列的确定,使用BigDye(R)Terminatorv3.1 Cycle SequencingKit(Applied Biosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(4)lepB基因扩增条件下使用了TorA信号肽的LFABP的分泌表达
使用实施例6(3)中构建得到的LFABP分泌表达质粒pPK6lepB(K)_T_LFABP和pPK6lepB(A)_T_LFABP,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK6lepB(K)_T_LFABP菌株和YDK010::phoS(W302C)/pPK6lepB(A)_T_LFABP菌株。将得到的各转化体使用包含25mg/l的卡那霉素的MMTG液体培养基分别在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液5.0μl使用NuPAGE(R)4-12%Bis-Tirs Gel(Thermo Fisher Scientific)进行还原SDS-PAGE后通过SYPRO(R)Ruby(Life Technologies)进行染色。其结果,在不扩增lepB基因的pPK6_T_LFABP导入株的情况下,主要检测到2根大致等量的条带,与之相对,在lepB基因扩增了的pPK6lepB(K)_T_FABP和pPK6lepB(A)_T_FABP导入株的情况下,低分子侧的目的LFABP的条带均显著增加(图6的版块A,泳道6-11)。对N末端氨基酸序列进行解析的结果,在低分子侧的条带中确认了LFABP的N末端氨基酸序列(MSFSGKYQLQ;序列编号53)。即,在使用了TorA信号序列的LFABP分泌生产中,在不扩增lepB基因条件下残存有具有TorA信号肽的C末端侧15残基的残余型,但是通过lepB基因的扩增而促进TorA信号肽的加工,能够明显提高具有正确的N末端氨基酸序列的LFABP的生产效率。
根据以上的结果可知,在谷氨酸棒杆菌中使用TorA信号序列分泌表达异源蛋白质时,无论表达的蛋白质的种类如何,都残存有具有TorA信号肽的C末端侧15残基的残余型,并且,通过lepB基因的扩增而促进信号肽的加工,能够明显提高具有正确的N末端氨基酸序列的异源蛋白质的生产效率。
实施例7:使用了SlpA信号序列的带有Pro结构部的谷氨酰胺转胺酶(PTG)分泌表达中的lepB基因扩增效果的评价
(1)使用了pPK5载体的PTG分泌表达用载体构建
以WO2002/081694所述的PTG的分泌表达用载体pPKSPTG1作为模板,使用<序列编号23>和<序列编号24>的引物,将包含cspB启动子-SlpA信号序列-PTG的表达盒的约1.8kbp的DNA片段通过PCR法进行扩增。对于<序列编号23>和<序列编号24>的引物分别设计制限酶KpnI的识别序列。PCR中使用PrimeSTAR(R)HS DNA Polymerase(Takara Bio),反应条件基于厂商的推荐条件。将该DNA片段通过Infusion反应插入WO2016/171224所述的pPK5载体的KpnI位点,从而构建作为使用了SlpA信号序列的PTG分泌表达载体的pPK5_S_PTG(图1的版块A)。Infusion反应中使用In-Fusion(R)HD Cloning Kit(Takara Bio),反应条件基于厂商的推荐条件。对插入片段的碱基进行序列确定的结果,确认了分别插入了预期的基因。碱基序列的确定,使用BigDye(R)Terminator v3.1 Cycle Sequencing Kit(AppliedBiosystems)和3130Genetic Analyzer(Applied Biosystems)进行。
(2)使用了pPK5lepB载体的PTG分泌表达用载体构建
与实施例7(1)同样地,以WO2002/081694所述的PTG的分泌表达用载体pPKSPTG1作为模板,使用<序列编号23>和<序列编号25>的引物、或<序列编号26>和<序列编号27>的引物,将包含cspB启动子-SlpA信号序列-PTG的表达盒的约1.8kbp的DNA片段通过PCR法分别扩增。<序列编号23>和<序列编号25>的引物设计制限酶KpnI的识别序列,对于<序列编号26>和<序列编号27>的引物设计制限酶ApaI的识别序列。PCR中使用PrimeSTAR(R)HS DNAPolymerase(Takara Bio),反应条件基于厂商的推荐条件。将这些DNA片段分别通过Infusion反应插入实施例1中构建得到的pPK5lepB载体的KpnI位点或ApaI位点,从而构建了lepB基因和使用了SlpA信号序列的PTG分泌的共表达载体的pPK5lepB(K)_S_PTG和pPK5lepB(A)_S_PTG(图1的版块B)。质粒名的(K)和(A)分别表示插入有PTG的表达盒的pPK5lepB载体的制限酶位点(KpnI位点和ApaI位点)。Infusion反应中使用In-Fusion(R)HDCloning Kit(Takara Bio),反应条件基于厂商的推荐条件。对插入片段的碱基进行序列确定的结果,确认了分别插入了预期的基因。碱基序列的确定,使用BigDye(R)Terminatorv3.1 Cycle Sequencing Kit(Applied Biosystems)和3130Genetic Analyzer(AppliedBiosystems)进行。
(3)lepB基因的扩增和不扩增条件下SlpA信号肽-PTG的分泌表达
使用实施例7(1)和(2)中构建得到的作为使用了SlpA信号序列的PTG分泌表达质粒的pPK5_S_PTG、pPK5lepB(K)_S_PTG和pPK5lepB(A)_S_PTG,转化WO2016/171224所述的YDK010::phoS(W302C)菌株,得到YDK010::phoS(W302C)/pPK5_S_PTG菌株、YDK010::phoS(W302C)/pPK5lepB(K)_S_PTG菌株和YDK010::phoS(W302C)/pPK5lepB(A)_S_PTG菌株。将得到的各转化体使用包含25mg/l的卡那霉素的MMTG液体培养基分别在30℃下培养72小时。培养结束后,将对各培养液进行离心分离而得到的培养上清液5.0μl使用MULTIGEL(R)II mini 15/20(Cosmo Bio)进行还原SDS-PAGE后通过SYPRO(R)Orange(Thermo FisherScientific)进行染色。其结果,不同于使用了TorA信号序列的情况,在使用了SlpA信号序列的情况中,在不扩增lepB基因的pPK5_S_PTG导入株中,检测到PTG的单一条带,完全未检测到残存有SlpA信号肽C末端侧的部分序列的残余型(图7的版块A,lane 7)。此外,在lepB基因扩增了的pPK5lepB(K)_S_PTG和pPK5lepB(A)_S_PTG导入株中,条带图案也未变化,反而PTG的分泌表达量减少(图7的版块A,泳道8-9)。
即,可知在使用了谷氨酸棒杆菌的异源蛋白质分泌生产中,lepB基因的扩增并非在全部的信号序列中都是有效的。
工业实用性
根据本发明,能够效率良好地分泌生产异源蛋白质。
〔序列表的说明〕
序列编号1:谷氨酸棒杆菌ATCC 13869的lepB基因的碱基序列
序列编号2:谷氨酸棒杆菌ATCC 13869的LepB蛋白质的氨基酸序列
序列编号3~10:引物
序列编号11:β-内酰胺酶TEM-116的氨基酸序列
序列编号12:编码β-内酰胺酶TEM-116的碱基序列
序列编号13~14:引物
序列编号15:大肠杆菌的修饰型TrxA蛋白质的氨基酸序列
序列编号16:编码大肠杆菌的修饰型TrxA蛋白质的碱基序列
序列编号17~18:引物
序列编号19:人的LFABP的氨基酸序列
序列编号20:编码人的LFABP的碱基序列
序列编号21~27:引物
序列编号28:谷氨酸棒杆菌YDK010的phoS基因的碱基序列
序列编号29:谷氨酸棒杆菌YDK010的PhoS蛋白质的氨基酸序列
序列编号30:谷氨酸棒杆菌ATCC 13032的PhoS蛋白质的氨基酸序列
序列编号31:谷氨酸棒杆菌ATCC 14067的PhoS蛋白质的氨基酸序列
序列编号32:美棒杆菌(C.callunae)的PhoS蛋白质的氨基酸序列
序列编号33:钝齿棒杆菌(C.crenatum)的PhoS蛋白质的氨基酸序列
序列编号34:高效棒杆菌(C.efficiens)的PhoS蛋白质的氨基酸序列
序列编号35:谷氨酸棒杆菌ATCC 13032的phoR基因的碱基序列
序列编号36:谷氨酸棒杆菌ATCC 13032的PhoR蛋白质的氨基酸序列
序列编号37:谷氨酸棒杆菌ATCC 13869的cspB基因的碱基序列
序列编号38:谷氨酸棒杆菌ATCC 13869的CspB蛋白质的氨基酸序列
序列编号39:谷氨酸棒杆菌ATCC 13032的tatA基因的碱基序列
序列编号40:谷氨酸棒杆菌ATCC 13032的TatA蛋白质的氨基酸序列
序列编号41:谷氨酸棒杆菌ATCC 13032的tatB基因的碱基序列
序列编号42:谷氨酸棒杆菌ATCC 13032的TatB蛋白质的氨基酸序列
序列编号43:谷氨酸棒杆菌ATCC 13032的tatC基因的碱基序列
序列编号44:谷氨酸棒杆菌ATCC 13032的TatC蛋白质的氨基酸序列
序列编号45:双精氨酸基序的氨基酸序列
序列编号46:TorA信号肽的氨基酸序列
序列编号47~53:N末端氨基酸序列
序列编号54~59:包含信号肽的蛋白质的N末端氨基酸序列
序列表
<110> 味之素株式会社
<120> 蛋白质的分泌生产方法
<130> F118-19299
<150> JP2018-200673
<151> 2018-10-25
<160> 59
<170> PatentIn version 3.5
<210> 1
<211> 789
<212> DNA
<213> 谷氨酸棒杆菌
<400> 1
gtgactgatt tttctagtgc ttcaaatgct gacgattcca cgcaggacgg tcgtcctggt 60
cgacgtgctg gaaagtctaa gaaggaatcg aagccaactc cgtggtacat cgaaattcca 120
gtggttgtgg ttctgaccct cgcgctgatt ttcgtgctcc agacgtttgt cggacgcatg 180
tacatgattc cgagtggttc gatggaacct actttgcacg gatgtgaggg ctgcacgggt 240
gaccgcatcc tggtggagaa ggtttcttac tacttcacgg atccagagcc gggcgatgtt 300
gtggtgttca agggtactga ttcctggaac gttggattca ctacgcagcg ttccgataat 360
tcggtgatcc gcggcctgca gaacctgggt tcttacgtgg gtcttgtcgc acctgatgaa 420
aatgacctgg tcaagcgcat tatcgccacc ggcggtcaga ctgtttcgtg ccaagccggt 480
gatcctggaa tcatggttga cggcaaggaa gtcgatgaca gctacacgct gcaacctgcg 540
caattcccca tcgatgagac ctccggttcc accgaatgcg gcggcaacta tttcggcccc 600
atcaccgtgc ctgacggcaa ctacttcatg atgggtgaca accgcaccaa ctccatggat 660
tcccgctacc acctgggcga tcagtaccaa ggaaccatcc ctgaggaaaa catcaagggc 720
aaagttcaag caattatcct gccatttagc cgaatcggtg gcgtcgacga ccctgccatc 780
aaaggctag 789
<210> 2
<211> 262
<212> PRT
<213> 谷氨酸棒杆菌
<400> 2
Met Thr Asp Phe Ser Ser Ala Ser Asn Ala Asp Asp Ser Thr Gln Asp
1 5 10 15
Gly Arg Pro Gly Arg Arg Ala Gly Lys Ser Lys Lys Glu Ser Lys Pro
20 25 30
Thr Pro Trp Tyr Ile Glu Ile Pro Val Val Val Val Leu Thr Leu Ala
35 40 45
Leu Ile Phe Val Leu Gln Thr Phe Val Gly Arg Met Tyr Met Ile Pro
50 55 60
Ser Gly Ser Met Glu Pro Thr Leu His Gly Cys Glu Gly Cys Thr Gly
65 70 75 80
Asp Arg Ile Leu Val Glu Lys Val Ser Tyr Tyr Phe Thr Asp Pro Glu
85 90 95
Pro Gly Asp Val Val Val Phe Lys Gly Thr Asp Ser Trp Asn Val Gly
100 105 110
Phe Thr Thr Gln Arg Ser Asp Asn Ser Val Ile Arg Gly Leu Gln Asn
115 120 125
Leu Gly Ser Tyr Val Gly Leu Val Ala Pro Asp Glu Asn Asp Leu Val
130 135 140
Lys Arg Ile Ile Ala Thr Gly Gly Gln Thr Val Ser Cys Gln Ala Gly
145 150 155 160
Asp Pro Gly Ile Met Val Asp Gly Lys Glu Val Asp Asp Ser Tyr Thr
165 170 175
Leu Gln Pro Ala Gln Phe Pro Ile Asp Glu Thr Ser Gly Ser Thr Glu
180 185 190
Cys Gly Gly Asn Tyr Phe Gly Pro Ile Thr Val Pro Asp Gly Asn Tyr
195 200 205
Phe Met Met Gly Asp Asn Arg Thr Asn Ser Met Asp Ser Arg Tyr His
210 215 220
Leu Gly Asp Gln Tyr Gln Gly Thr Ile Pro Glu Glu Asn Ile Lys Gly
225 230 235 240
Lys Val Gln Ala Ile Ile Leu Pro Phe Ser Arg Ile Gly Gly Val Asp
245 250 255
Asp Pro Ala Ile Lys Gly
260
<210> 3
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 3
gctaatcttc atggtaccag gcaaaaggta 30
<210> 4
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 4
gggggcgtcg atctagaggg ccctagcctt tgatg 35
<210> 5
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
cgatattatt taggggtacc caaattcctg tgaa 34
<210> 6
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
gctacctttt gcctggtacc tcacggccag ccct 34
<210> 7
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
gccatcaaag gctagggccc caaattcctg tgaa 34
<210> 8
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
aggatccccg gaatgggccc tcacggccag ccct 34
<210> 9
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
gctacctttt gcctggtacc ttaaaatcca cagc 34
<210> 10
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
aggatccccg gaatgggccc ttaaaatcca cagc 34
<210> 11
<211> 263
<212> PRT
<213> 未知
<220>
<223> 多物种
<400> 11
His Pro Glu Thr Leu Val Lys Val Lys Asp Ala Glu Asp Gln Leu Gly
1 5 10 15
Ala Arg Val Gly Tyr Ile Glu Leu Asp Leu Asn Ser Gly Lys Ile Leu
20 25 30
Glu Ser Phe Arg Pro Glu Glu Arg Phe Pro Met Met Ser Thr Phe Lys
35 40 45
Val Leu Leu Cys Gly Ala Val Leu Ser Arg Ile Asp Ala Gly Gln Glu
50 55 60
Gln Leu Gly Arg Arg Ile His Tyr Ser Gln Asn Asp Leu Val Glu Tyr
65 70 75 80
Ser Pro Val Thr Glu Lys His Leu Thr Asp Gly Met Thr Val Arg Glu
85 90 95
Leu Cys Ser Ala Ala Ile Thr Met Ser Asp Asn Thr Ala Ala Asn Leu
100 105 110
Leu Leu Thr Thr Ile Gly Gly Pro Lys Glu Leu Thr Ala Phe Leu His
115 120 125
Asn Met Gly Asp His Val Thr Arg Leu Asp Arg Trp Glu Pro Glu Leu
130 135 140
Asn Glu Ala Ile Pro Asn Asp Glu Arg Asp Thr Thr Met Pro Val Ala
145 150 155 160
Met Ala Thr Thr Leu Arg Lys Leu Leu Thr Gly Glu Leu Leu Thr Leu
165 170 175
Ala Ser Arg Gln Gln Leu Ile Asp Trp Met Glu Ala Asp Lys Val Ala
180 185 190
Gly Pro Leu Leu Arg Ser Ala Leu Pro Ala Gly Trp Phe Ile Ala Asp
195 200 205
Lys Ser Gly Ala Gly Glu Arg Gly Ser Arg Gly Ile Ile Ala Ala Leu
210 215 220
Gly Pro Asp Gly Lys Pro Ser Arg Ile Val Val Ile Tyr Thr Thr Gly
225 230 235 240
Ser Gln Ala Thr Met Asp Glu Arg Asn Arg Gln Ile Ala Glu Ile Gly
245 250 255
Ala Ser Leu Ile Lys His Trp
260
<210> 12
<211> 792
<212> DNA
<213> 未知
<220>
<223> 多物种
<400> 12
cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 60
tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 120
tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac 180
gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 240
tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 300
gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 360
aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 420
gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 480
atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 540
caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 600
ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 660
attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 720
agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 780
aagcattggt aa 792
<210> 13
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
gctacctttt gcctggtacc ttaccaatgc ttaa 34
<210> 14
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
aggatccccg gaatgggccc ttaccaatgc ttaa 34
<210> 15
<211> 109
<212> PRT
<213> 大肠杆菌
<400> 15
Ala Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp
1 5 10 15
Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp
20 25 30
Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp
35 40 45
Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn
50 55 60
Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu
65 70 75 80
Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser
85 90 95
Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala
100 105
<210> 16
<211> 330
<212> DNA
<213> 大肠杆菌
<400> 16
gcgtccgata agattattca ccttaccgat gactccttcg ataccgatgt cctcaaggca 60
gatggcgcta ttctcgtgga cttctgggca gaatggtgcg gcccatgcaa gatgatcgcc 120
ccaattctcg atgaaatcgc ggacgagtac cagggcaagt tgaccgtggc aaaactgaac 180
attgatcaga acccaggcac cgctcctaag tacggcatcc gcggtattcc taccctgctc 240
cttttcaaaa acggtgaggt cgcagctacc aaagtgggtg cgttgtctaa gggtcagctc 300
aaagagttcc tggatgctaa cctggcgtga 330
<210> 17
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
gctacctttt gcctggtacc tcacgccagg ttag 34
<210> 18
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
aggatccccg gaatgggccc tcacgccagg ttag 34
<210> 19
<211> 127
<212> PRT
<213> 智人
<400> 19
Met Ser Phe Ser Gly Lys Tyr Gln Leu Gln Ser Gln Glu Asn Phe Glu
1 5 10 15
Ala Phe Met Lys Ala Ile Gly Leu Pro Glu Glu Leu Ile Gln Lys Gly
20 25 30
Lys Asp Ile Lys Gly Val Ser Glu Ile Val Gln Asn Gly Lys His Phe
35 40 45
Lys Phe Thr Ile Thr Ala Gly Ser Lys Val Ile Gln Asn Glu Phe Thr
50 55 60
Val Gly Glu Glu Cys Glu Leu Glu Thr Met Thr Gly Glu Lys Val Lys
65 70 75 80
Thr Val Val Gln Leu Glu Gly Asp Asn Lys Leu Val Thr Thr Phe Lys
85 90 95
Asn Ile Lys Ser Val Thr Glu Leu Asn Gly Asp Ile Ile Thr Asn Thr
100 105 110
Met Thr Leu Gly Asp Ile Val Phe Lys Arg Ile Ser Lys Arg Ile
115 120 125
<210> 20
<211> 384
<212> DNA
<213> 智人
<400> 20
atgtccttct ccggcaagta ccagctgcag tcccaggaaa acttcgaggc attcatgaag 60
gctatcggtc tgccagaaga gctcatccag aagggcaagg atatcaaggg tgtttccgaa 120
atcgtgcaga acggcaagca cttcaagttc accatcaccg caggttccaa ggtcatccag 180
aacgagttca ccgttggcga agagtgcgaa ctcgagacca tgaccggtga aaaggttaag 240
accgtggtcc agctggaggg cgacaacaag ctcgtgacca ccttcaagaa catcaagtcc 300
gtcaccgaac tgaacggcga tatcatcacc aacaccatga ccctcggtga catcgtgttc 360
aagcgcatct ccaagcgtat ctaa 384
<210> 21
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
gctacctttt gcctggtacc ttagatacgc ttgg 34
<210> 22
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
aggatccccg gaatgggccc ttagatacgc ttgg 34
<210> 23
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
acgaattcga gctcggtacc caaattcctg tgaa 34
<210> 24
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
ctagaggatc cccgggtacc tcacggccag ccct 34
<210> 25
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
gctacctttt gcctggtacc tcacggccag ccct 34
<210> 26
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
gccatcaaag gctagggccc caaattcctg tgaa 34
<210> 27
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
aggtcgactc tagagggccc tcacggccag ccct 34
<210> 28
<211> 1458
<212> DNA
<213> 谷氨酸棒杆菌
<400> 28
atggaaaacc cttatgtcgc tgcgctcgat gacgataaaa aagaagtcgg cgcaataaaa 60
gaagcagaaa aagaacctga aataggtccc atcagagctg ccggacgagc cataccgctg 120
cgcacccgca tcattttgat cgtggtgggt atcgccgggc ttggtttgct ggtcaacgcg 180
attgctgttt ccagcctcat gcgtgaagtt tcctataccc gcatggatca agagctagag 240
acctcgatgg ggacgtgggc gcataacgtt gagctgttta atttcgatgg cgtccgccaa 300
gggccaccca gcgattatta tgtggccaag gtttttcctg atggatccag cattattttc 360
aacgatgcac aatcggcacc caatctagct gaaaccacca tcggtactgg tccacacact 420
gtggatgctg ctagcggttc tgcctccaac actccgtggc gtgtgatggc ggaaaagaac 480
ggtgacatta tcaccgtggt gggtaaaagc atggggcgtg aaacaaacct gctgtaccga 540
ttggtgatgg tgcagatgat catcggcgcg ctgattctgg ttgctatttt gattacttca 600
ctcttcctag tcagacgctc gttgcggccg ttgagagaag ttgaagagac cgccaccagg 660
attgcgggcg gtgatttgga tcgacgtgtc ccgcagtggc caatgaccac agaagtcgga 720
cagctgtcga atgccctcaa tatcatgttg gagcagctcc aagcctcaat tctgaccgcc 780
cagcaaaaag aagctcagat gcgccgattc gttggcgacg cctcccacga gctccgcaca 840
ccactgacct ctgtgaaggg cttcaccgag ctgtattcat caggtgcaac agatgatgcc 900
aactgggtca tgtccaagat cggtggcgaa gcccaacgca tgagtgtgct tgtggaagac 960
ctcctgtcac tgacgcgtgc cgaaggccag caaatggaga agcaccgcgt tgacgtgctg 1020
gaactcgcat tggcagtacg cggatccatg cgagcagcct ggccagatcg caccgtcaac 1080
gtgtccaata aagccgagtc cattccagtt gttgaaggcg acccaacccg cctccaccaa 1140
gttctcacca acctggttgc caacggactc aaccacggcg gaccggacgc ggaagtcagc 1200
attgagatca acaccgatgg gcaaaacgtg aggattctcg tggcagacaa cggtgtcgga 1260
atgtctgaag aagatgccca gcatatcttc gagcgtttct accgcgccga ttcctcccgc 1320
tcacgcgcat ccggcggatc gggcctcggc cttgcgatca cgaaatccct ggtcgaaggc 1380
cacggcggca cagtcaccgt cgacagcgtg caaggcgaag gcacggtgtt cacgatcacc 1440
ttgccggcgg tttcttaa 1458
<210> 29
<211> 485
<212> PRT
<213> 谷氨酸棒杆菌
<400> 29
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Asp Lys Lys Glu Val
1 5 10 15
Gly Ala Ile Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asn
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 30
<211> 485
<212> PRT
<213> 谷氨酸棒杆菌
<400> 30
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Lys Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 31
<211> 485
<212> PRT
<213> 谷氨酸棒杆菌
<400> 31
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val
1 5 10 15
Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg
20 25 30
Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val
35 40 45
Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser
50 55 60
Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu
65 70 75 80
Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp
85 90 95
Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe
100 105 110
Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp
115 120 125
Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala
130 135 140
Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn
145 150 155 160
Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn
165 170 175
Leu Leu Tyr Arg Leu Val Val Val Gln Met Ile Ile Gly Ala Leu Ile
180 185 190
Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu
195 200 205
Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly
210 215 220
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
225 230 235 240
Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
245 250 255
Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly
260 265 270
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe
275 280 285
Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met
290 295 300
Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
305 310 315 320
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg
325 330 335
Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala
340 345 350
Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile
355 360 365
Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn
370 375 380
Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser
385 390 395 400
Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp
405 410 415
Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg
420 425 430
Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
435 440 445
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr
450 455 460
Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr
465 470 475 480
Leu Pro Ala Val Ser
485
<210> 32
<211> 504
<212> PRT
<213> 美棒杆菌
<400> 32
Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Lys Asn Ser Asn Phe Gly
1 5 10 15
Ala Lys Asp Thr Asp Ser Ala Val Ser Asp Ser Thr Glu Val Ser Gln
20 25 30
Asn Asn Asp Gly Ile Gly Thr Pro Ala Thr Ala Glu Pro Lys Val Gly
35 40 45
Pro Ile Arg Thr Ala Gly Arg Ala Met Pro Leu Arg Thr Arg Ile Ile
50 55 60
Leu Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Val
65 70 75 80
Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln
85 90 95
Asp Leu Glu Ser Ala Met Gly Thr Trp Val Arg Asn Val Glu Leu Phe
100 105 110
Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala
115 120 125
Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Glu Ser
130 135 140
Ala Pro Asp Leu Gly Gln Thr Thr Ile Gly Thr Gly Pro His Thr Val
145 150 155 160
Glu Ala Ala Glu Gly Ser Ala Ser Ser Thr His Trp Arg Val Met Ala
165 170 175
Ala Lys Asn Gly Asp Val Ile Thr Val Val Gly Lys Ser Met Gly Arg
180 185 190
Glu Ser Thr Leu Leu Tyr Arg Leu Val Val Val Gln Met Val Ile Gly
195 200 205
Val Leu Ile Leu Ile Ala Ile Leu Ile Gly Ser Phe Phe Leu Val Arg
210 215 220
Arg Ser Leu Lys Pro Leu Arg Glu Val Glu Glu Thr Ala Ser Arg Ile
225 230 235 240
Ala Gly Gly Glu Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr
245 250 255
Glu Val Gly Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu
260 265 270
Gln Thr Ser Ile Met Asn Ala Gln Gln Lys Glu Ala Gln Met Arg Arg
275 280 285
Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val
290 295 300
Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Gln Asp Ala Asp
305 310 315 320
Trp Val Leu Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu
325 330 335
Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu
340 345 350
Lys His Arg Val Asp Met Leu Glu Leu Ala Leu Ala Val Arg Gly Ser
355 360 365
Leu Lys Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ala Asn Arg Ser
370 375 380
Glu Asn Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val
385 390 395 400
Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Glu Ala
405 410 415
Glu Val Asn Ile Gln Val Glu Thr Ala Asp Asp Lys Val Lys Ile Leu
420 425 430
Val Ile Asp Asn Gly Val Gly Met Ser Lys Glu Asp Ala Glu His Ile
435 440 445
Phe Glu Arg Phe Tyr Arg Ala Asp Thr Ser Arg Ser Arg Ala Ser Gly
450 455 460
Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His
465 470 475 480
Gly Gly Thr Ile Thr Val Asp Ser Glu Leu Gly Lys Gly Thr Val Phe
485 490 495
Ser Ile Ile Leu Pro Ala Ala Glu
500
<210> 33
<211> 458
<212> PRT
<213> 钝齿棒杆菌
<400> 33
Ile Gly Pro Ile Arg Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg
1 5 10 15
Ile Ile Leu Ile Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn
20 25 30
Ala Ile Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met
35 40 45
Asp Gln Glu Leu Glu Thr Ser Met Gly Thr Trp Ala His Asn Val Glu
50 55 60
Leu Phe Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr
65 70 75 80
Val Ala Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala
85 90 95
Gln Ser Ala Pro Asp Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His
100 105 110
Thr Val Asp Ala Ala Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val
115 120 125
Met Ala Glu Lys Asn Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met
130 135 140
Gly Arg Glu Thr Asn Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile
145 150 155 160
Ile Gly Ala Leu Ile Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu
165 170 175
Val Arg Arg Ser Leu Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr
180 185 190
Arg Ile Ala Gly Gly Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met
195 200 205
Thr Thr Glu Val Gly Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu
210 215 220
Gln Leu Gln Ala Ser Ile Leu Ser Ala Gln Gln Lys Glu Ala Gln Met
225 230 235 240
Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr
245 250 255
Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp
260 265 270
Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser
275 280 285
Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln
290 295 300
Met Glu Lys His Arg Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg
305 310 315 320
Gly Ser Met Arg Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn
325 330 335
Lys Ala Ala Ser Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His
340 345 350
Gln Val Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro
355 360 365
Asp Ala Glu Val Ser Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg
370 375 380
Ile Leu Val Ala Asp Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln
385 390 395 400
His Ile Phe Glu Arg Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala
405 410 415
Ser Gly Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu
420 425 430
Gly His Gly Gly Thr Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr
435 440 445
Val Phe Thr Ile Thr Leu Pro Ala Val Ser
450 455
<210> 34
<211> 471
<212> PRT
<213> 高效棒杆菌
<400> 34
Met Thr Ala Pro Glu Asn Pro His Ala Gln Val Thr Pro Val Gly Arg
1 5 10 15
Phe Arg Gln Ala Ala Arg Gly Val Pro Leu Arg Thr Arg Ile Ile Leu
20 25 30
Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala
35 40 45
Val Ser Ser Leu Met Arg Glu Val Ser Tyr Ser Arg Met Asp Gln Glu
50 55 60
Leu Glu Ser Ala Met Asn Ser Trp Ala Gln Thr Ala Glu Leu Phe Gly
65 70 75 80
Ser Ile Thr Leu Gly Pro Pro Ser Asp Tyr Tyr Val Val Arg Ile Phe
85 90 95
Pro Asp Gly Ser His Met Val Phe Asn Gln Ser Asp Ser Ala Pro Asp
100 105 110
Leu Gly Glu Thr Thr Ile Gly Ile Gly Pro His Thr Ala Ser Ala Ala
115 120 125
Pro Gly Ser Ser Ser Ser Val Pro Trp Arg Val Ile Ala Ile Ser Asp
130 135 140
Asn Gly Thr Ile Thr Val Val Gly Lys Ser Leu Ala Pro Glu Ser Met
145 150 155 160
Leu Leu Tyr Arg Leu Val Ile Val Gln Leu Val Ile Gly Met Leu Ile
165 170 175
Val Val Ala Ile Leu Leu Ser Ser Leu Tyr Leu Val Asn Arg Ser Leu
180 185 190
Arg Pro Leu Arg Glu Val Glu Lys Thr Ala Lys Ser Ile Ala Gly Gly
195 200 205
Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly
210 215 220
Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser
225 230 235 240
Ile Leu Ser Ala Gln Glu Lys Glu Ser Gln Met Arg Arg Phe Val Gly
245 250 255
Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Tyr
260 265 270
Ser Glu Leu Tyr His Ser Gly Ala Thr Arg Asp Ala Asp Trp Val Leu
275 280 285
Ser Lys Ile Ser Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp
290 295 300
Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys Arg Pro
305 310 315 320
Val Asp Val Leu Glu Leu Ser Leu Ser Val Ala Ser Ser Met Arg Ala
325 330 335
Ala Trp Pro Glu Arg Ser Ile Thr Val Val Asn Lys Thr Gly Ser Leu
340 345 350
Pro Val Val Glu Gly Asp Ala Thr Arg Leu His Gln Val Leu Thr Asn
355 360 365
Leu Val Asn Asn Gly Leu Asn His Gly Gly Pro Asp Ala Ser Val Glu
370 375 380
Ile Glu Ile Ser Ala Glu Gly Gly Ser Val Leu Val Arg Val Val Asp
385 390 395 400
Asp Gly Val Gly Met Thr Ala Glu Asp Ala Gln His Ile Phe Glu Arg
405 410 415
Phe Tyr Arg Thr Asp Thr Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly
420 425 430
Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Arg Gly Thr
435 440 445
Ile Thr Val Asp Ser Glu Val Gly Glu Gly Thr Val Phe Thr Ile Thr
450 455 460
Leu Pro Ser Arg Met Glu Asp
465 470
<210> 35
<211> 708
<212> DNA
<213> 谷氨酸棒杆菌
<400> 35
atggacaacc agtctgacgg acaaatccgc gtactcgtcg ttgatgacga gccaaacatc 60
gtcgagctgc tcaccgtaag ccttaaattc caaggcttcg cagtgatgac cgccaacgat 120
ggcaatgaag ccctgaagat tgctcgtgag ttccgtccag acgcatacat cctcgatgtc 180
atgatgccag gaatggacgg cttcgagctg ctgaccaagc tgcgcggcga aggccttgac 240
agcccagttc tgtacctcac cgcaaaggat gccgtggagc accgcatcca cggcctgacc 300
atcggcgctg acgactacgt gaccaagcct ttctccctgg aagaagtaat cacccgcctg 360
cgcgtgattc ttcgtcgcgg tggagcagtt gaagaagaca cctcaacttc cctgcagtac 420
gcagacctca ccctcaacga tgaaacccac gaggtcacca aggctggcga actgatcgat 480
ctttccccaa ctgaattcaa cctcctgcgc tacctcatgc tcaacgctga agtggtgctg 540
tccaaggcaa agatcctgga taacgtgtgg cactacgatt ttggtggcga cggcaacgtc 600
gtggaatcct acatctccta cctgcgccgc aaggtggaca cccaggatcc gcagctaatt 660
cagactgttc gtggcgttgg atatgttctg cgcaccccac gtagctaa 708
<210> 36
<211> 235
<212> PRT
<213> 谷氨酸棒杆菌
<400> 36
Met Asp Asn Gln Ser Asp Gly Gln Ile Arg Val Leu Val Val Asp Asp
1 5 10 15
Glu Pro Asn Ile Val Glu Leu Leu Thr Val Ser Leu Lys Phe Gln Gly
20 25 30
Phe Ala Val Met Thr Ala Asn Asp Gly Asn Glu Ala Leu Lys Ile Ala
35 40 45
Arg Glu Phe Arg Pro Asp Ala Tyr Ile Leu Asp Val Met Met Pro Gly
50 55 60
Met Asp Gly Phe Glu Leu Leu Thr Lys Leu Arg Gly Glu Gly Leu Asp
65 70 75 80
Ser Pro Val Leu Tyr Leu Thr Ala Lys Asp Ala Val Glu His Arg Ile
85 90 95
His Gly Leu Thr Ile Gly Ala Asp Asp Tyr Val Thr Lys Pro Phe Ser
100 105 110
Leu Glu Glu Val Ile Thr Arg Leu Arg Val Ile Leu Arg Arg Gly Gly
115 120 125
Ala Val Glu Glu Asp Thr Ser Thr Ser Leu Gln Tyr Ala Asp Leu Thr
130 135 140
Leu Asn Asp Glu Thr His Glu Val Thr Lys Ala Gly Glu Leu Ile Asp
145 150 155 160
Leu Ser Pro Thr Glu Phe Asn Leu Leu Arg Tyr Leu Met Leu Asn Ala
165 170 175
Glu Val Val Leu Ser Lys Ala Lys Ile Leu Asp Asn Val Trp His Tyr
180 185 190
Asp Phe Gly Gly Asp Gly Asn Val Val Glu Ser Tyr Ile Ser Tyr Leu
195 200 205
Arg Arg Lys Val Asp Thr Gln Asp Pro Gln Leu Ile Gln Thr Val Arg
210 215 220
Gly Val Gly Tyr Val Leu Arg Thr Pro Arg Ser
225 230 235
<210> 37
<211> 1500
<212> DNA
<213> 谷氨酸棒杆菌
<400> 37
atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60
gcttccggcg tagctatccc agcattcgct caggagacca acccaacctt caacatcaac 120
aacggcttca acgatgctga tggatccacc atccagccag ttgagccagt taaccacacc 180
gaggaaaccc tccgcgacct gactgactcc accggcgctt acctggaaga gttccagtac 240
ggcaacgttg aggaaatcgt tgaagcatac ctgcaggttc aggcttccgc agacggattc 300
gatccttctg agcaggctgc ttacgaggct ttcgaggctg ctcgcgttcg tgcatcccag 360
gagctcgcgg cttccgctga gaccatcact aagacccgcg agtccgttgc ttacgcactc 420
aaggctgacc gcgaagctac cgcagctttc gaggcttacc tcagcgctct tcgtcaggtt 480
tcagtcatca acgatctgat cgctgatgct aacgccaaga acaagactga ctttgcagag 540
atcgagctct acgatgttct ttacaccgac gccgacatct ctggcgatgc tccacttctt 600
gctcctgcat acaaggagct gaaggacctt caggctgagg ttgacgcaga cttcgagtgg 660
ttgggcgagt tcgcaattga taacaatgaa gacaactacg tcattcgtac tcacatccct 720
gctgtagagg cactcaaggc agcgatcgat tcactggtcg acaccgttga gccacttcgt 780
gcagacgcta tcgctaagaa catcgaggct cagaagtctg acgttctggt tccccagctc 840
ttcctcgagc gtgcaactgc acagcgcgac accctgcgtg ttgtagaggc aatcttctct 900
acctctgctc gttacgttga actctacgag aacgtcgaga acgttaacgt tgagaacaag 960
acccttcgcc agcactactc ttccctgatc cctaacctct tcatcgcagc ggttggcaac 1020
atcaacgagc tcaacaatgc agatcaggct gcacgtgagc tcttcctcga ttgggacacc 1080
gacctcacca ccaacgatga ggacgaagct tactaccagg ctaagctcga cttcgctatc 1140
gagacctacg caaagatcct gatcaacggt gaagtttggc aggagccact cgcttacgtc 1200
cagaacctgg atgcaggcgc acgtcaggaa gcagctgacc gcgaagcaga gcgcgcagct 1260
gacgcagcat accgcgctga gcagctccgc atcgctcagg aagcagctga cgctcagaag 1320
gctctcgctg aggctcttgc taatgcaggc aacaacgaca acggtggcga caactcctcc 1380
gacgacaagg gaaccggttc ttccgacatc ggaacctggg gacctttcgc agcaattgca 1440
gctatcatcg cagcaatcgc agctatcttc ccattcctct ccggtatcgt taagttctaa 1500
<210> 38
<211> 499
<212> PRT
<213> 谷氨酸棒杆菌
<400> 38
Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala
1 5 10 15
Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu
20 25 30
Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala Asp Gly
35 40 45
Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu Thr Leu
50 55 60
Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe Gln Tyr
65 70 75 80
Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln Ala Ser
85 90 95
Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala Phe Glu
100 105 110
Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala Glu Thr
115 120 125
Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala Asp Arg
130 135 140
Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg Gln Val
145 150 155 160
Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn Lys Thr
165 170 175
Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp Ala Asp
180 185 190
Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu Leu Lys
195 200 205
Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly Glu Phe
210 215 220
Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His Ile Pro
225 230 235 240
Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp Thr Val
245 250 255
Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala Gln Lys
260 265 270
Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr Ala Gln
275 280 285
Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser Ala Arg
290 295 300
Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu Asn Lys
305 310 315 320
Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe Ile Ala
325 330 335
Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala Ala Arg
340 345 350
Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp Glu Asp
355 360 365
Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr Tyr Ala
370 375 380
Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala Tyr Val
385 390 395 400
Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg Glu Ala
405 410 415
Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg Ile Ala
420 425 430
Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu Ala Asn
435 440 445
Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp Lys Gly
450 455 460
Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala Ile Ala
465 470 475 480
Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser Gly Ile
485 490 495
Val Lys Phe
<210> 39
<211> 318
<212> DNA
<213> 谷氨酸棒杆菌
<400> 39
atgtccctcg gaccatggga aattggaatc attgtcctgc tgatcatcgt gctgttcggc 60
gcgaagaagc tgcctgatgc agctcgttcc atcggccgtt ccatgcgcat cttcaagtct 120
gaagtcaaag aaatgaacaa ggacggcgat accccagaac aacagcagca gcctcagcag 180
cagattgcgc ccaaccagat cgaggctcct cagccaaact ttgagcagca ctaccaggga 240
cagcaggttc agcagcctca gaaccctcag acccctgact accgtcagaa ctacgaggat 300
ccaaaccgca cctcttaa 318
<210> 40
<211> 105
<212> PRT
<213> 谷氨酸棒杆菌
<400> 40
Met Ser Leu Gly Pro Trp Glu Ile Gly Ile Ile Val Leu Leu Ile Ile
1 5 10 15
Val Leu Phe Gly Ala Lys Lys Leu Pro Asp Ala Ala Arg Ser Ile Gly
20 25 30
Arg Ser Met Arg Ile Phe Lys Ser Glu Val Lys Glu Met Asn Lys Asp
35 40 45
Gly Asp Thr Pro Glu Gln Gln Gln Gln Pro Gln Gln Gln Ile Ala Pro
50 55 60
Asn Gln Ile Glu Ala Pro Gln Pro Asn Phe Glu Gln His Tyr Gln Gly
65 70 75 80
Gln Gln Val Gln Gln Pro Gln Asn Pro Gln Thr Pro Asp Tyr Arg Gln
85 90 95
Asn Tyr Glu Asp Pro Asn Arg Thr Ser
100 105
<210> 41
<211> 471
<212> DNA
<213> 谷氨酸棒杆菌
<400> 41
atgttttcta gcgtgggttg gggagagatc ttcctcttag tcgttgtggg ccttgttgtc 60
atcggcccgg aacggttgcc tcgtttgatc caggacgcac gcgctgcgct gctcgctgca 120
cgtaccgcta tcgacaatgc aaagcagtcg ttggacagtg attttggttc ggaatttgat 180
gaaatccgaa agccactaac ccaggttgca cagtacagcc ggatgagccc caagacggcc 240
atcactaagg cgttatttga taatgattcc tcgttcctgg atgactttga tccaaagaag 300
atcatggccg aaggaacaga aggcgaagct cagcgcaaca agcaggcagc tgacaacaat 360
gcgaatgtgg tggaacgtcc agctgatggt tccaccgcac gcccaacgca aaacgatcca 420
aaagacggcc cgaattactc aggtggcgtc tcttggaccg atattattta g 471
<210> 42
<211> 156
<212> PRT
<213> 谷氨酸棒杆菌
<400> 42
Met Phe Ser Ser Val Gly Trp Gly Glu Ile Phe Leu Leu Val Val Val
1 5 10 15
Gly Leu Val Val Ile Gly Pro Glu Arg Leu Pro Arg Leu Ile Gln Asp
20 25 30
Ala Arg Ala Ala Leu Leu Ala Ala Arg Thr Ala Ile Asp Asn Ala Lys
35 40 45
Gln Ser Leu Asp Ser Asp Phe Gly Ser Glu Phe Asp Glu Ile Arg Lys
50 55 60
Pro Leu Thr Gln Val Ala Gln Tyr Ser Arg Met Ser Pro Lys Thr Ala
65 70 75 80
Ile Thr Lys Ala Leu Phe Asp Asn Asp Ser Ser Phe Leu Asp Asp Phe
85 90 95
Asp Pro Lys Lys Ile Met Ala Glu Gly Thr Glu Gly Glu Ala Gln Arg
100 105 110
Asn Lys Gln Ala Ala Asp Asn Asn Ala Asn Val Val Glu Arg Pro Ala
115 120 125
Asp Gly Ser Thr Ala Arg Pro Thr Gln Asn Asp Pro Lys Asp Gly Pro
130 135 140
Asn Tyr Ser Gly Gly Val Ser Trp Thr Asp Ile Ile
145 150 155
<210> 43
<211> 945
<212> DNA
<213> 谷氨酸棒杆菌
<400> 43
atgtccattg ttgagcacat caaagagttt cgacgccgac ttcttatcgc tctggcgggc 60
atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120
actttgggcg agctgctgag ggatccgtac tgttctctgc ctgctgaatc ccgctgggcc 180
atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240
cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300
ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360
gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420
tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480
gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540
ccactggtga tcggcatgct caacattgtg ggtatcttgc cttacgatgc cattaaagat 600
aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660
gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtaga gcttgccctg 720
cagttctgtc gtttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780
gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840
gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900
ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
<210> 44
<211> 314
<212> PRT
<213> 谷氨酸棒杆菌
<400> 44
Met Ser Ile Val Glu His Ile Lys Glu Phe Arg Arg Arg Leu Leu Ile
1 5 10 15
Ala Leu Ala Gly Ile Leu Val Gly Thr Ile Ile Gly Phe Ile Trp Tyr
20 25 30
Asp Phe Ser Phe Trp Gln Ile Pro Thr Leu Gly Glu Leu Leu Arg Asp
35 40 45
Pro Tyr Cys Ser Leu Pro Ala Glu Ser Arg Trp Ala Met Ser Asp Ser
50 55 60
Glu Glu Cys Arg Leu Leu Ala Thr Gly Pro Phe Asp Pro Phe Met Leu
65 70 75 80
Arg Leu Lys Val Ala Ala Leu Val Gly Met Val Leu Gly Ser Pro Val
85 90 95
Trp Leu Ser Gln Leu Trp Gly Phe Ile Thr Pro Gly Leu Met Lys Asn
100 105 110
Glu Arg Arg Tyr Thr Ala Ile Phe Val Thr Ile Ala Val Val Leu Phe
115 120 125
Val Gly Gly Ala Val Leu Ala Tyr Phe Val Val Ala Tyr Gly Leu Glu
130 135 140
Phe Leu Leu Thr Ile Gly Gly Asp Thr Gln Ala Ala Ala Leu Thr Gly
145 150 155 160
Asp Lys Tyr Phe Gly Phe Leu Leu Ala Leu Leu Ala Ile Phe Gly Val
165 170 175
Ser Phe Glu Val Pro Leu Val Ile Gly Met Leu Asn Ile Val Gly Ile
180 185 190
Leu Pro Tyr Asp Ala Ile Lys Asp Lys Arg Arg Met Ile Ile Met Ile
195 200 205
Leu Phe Val Phe Ala Ala Phe Met Thr Pro Gly Gln Asp Pro Phe Thr
210 215 220
Met Leu Val Leu Ala Leu Ser Leu Thr Val Leu Val Glu Leu Ala Leu
225 230 235 240
Gln Phe Cys Arg Phe Asn Asp Lys Arg Arg Asp Lys Lys Arg Pro Glu
245 250 255
Trp Leu Asp Gly Asp Asp Leu Ser Ala Ser Pro Leu Asp Thr Ser Ala
260 265 270
Gly Gly Glu Asp Ala Pro Ser Pro Val Glu Thr Pro Glu Ala Val Glu
275 280 285
Pro Ser Arg Met Leu Asn Pro Ser Gly Glu Ala Ser Ile Ser Tyr Lys
290 295 300
Pro Gly Arg Ala Asp Phe Gly Asp Val Leu
305 310
<210> 45
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 双精氨酸基序
<220>
<221> misc_feature
<222> (3)..(5)
<223> Xaa可以是任何天然氨基酸
<400> 45
Arg Arg Xaa Xaa Xaa
1 5
<210> 46
<211> 39
<212> PRT
<213> 大肠杆菌
<400> 46
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala
35
<210> 47
<211> 10
<212> PRT
<213> 大肠杆菌
<400> 47
Gly Met Leu Gly Pro Ser Leu Leu Thr Pro
1 5 10
<210> 48
<211> 10
<212> PRT
<213> 茂源链霉菌
<400> 48
Asp Asn Gly Ala Gly Glu Glu Thr Lys Ser
1 5 10
<210> 49
<211> 10
<212> PRT
<213> 解朊金黄杆菌
<400> 49
Asp Ser Asn Gly Asn Gln Glu Ile Asn Gly
1 5 10
<210> 50
<211> 10
<212> PRT
<213> 未知
<220>
<223> 多物种
<400> 50
His Pro Glu Thr Leu Val Lys Val Lys Asp
1 5 10
<210> 51
<211> 10
<212> PRT
<213> 大肠杆菌
<400> 51
Ala Ser Asp Lys Ile Ile His Leu Thr Asp
1 5 10
<210> 52
<211> 10
<212> PRT
<213> 谷氨酸棒杆菌
<400> 52
Ala Pro Asp Ser Asp Trp Asp Arg Leu Ala
1 5 10
<210> 53
<211> 10
<212> PRT
<213> 智人
<400> 53
Met Ser Phe Ser Gly Lys Tyr Gln Leu Gln
1 5 10
<210> 54
<211> 60
<212> PRT
<213> 大肠杆菌
<400> 54
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Asp Asn Gly Ala Gly Glu Glu Thr Lys
35 40 45
Ser Tyr Ala Glu Thr Tyr Arg Leu Thr Ala Asp Asp
50 55 60
<210> 55
<211> 60
<212> PRT
<213> 大肠杆菌
<400> 55
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Asp Ser Asn Gly Asn Gln Glu Ile Asn
35 40 45
Gly Lys Glu Lys Leu Ser Val Asn Asp Ser Lys Leu
50 55 60
<210> 56
<211> 59
<212> PRT
<213> 大肠杆菌
<400> 56
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala His Pro Glu Thr Leu Val Lys Val Lys
35 40 45
Asp Ala Glu Asp Gln Leu Gly Ala Arg Val Gly
50 55
<210> 57
<211> 59
<212> PRT
<213> 大肠杆菌
<400> 57
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Ala Ser Asp Lys Ile Ile His Leu Thr
35 40 45
Asp Asp Ser Phe Asp Thr Asp Val Leu Lys Ala
50 55
<210> 58
<211> 59
<212> PRT
<213> 大肠杆菌
<400> 58
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Thr Ala Met Ser Phe Ser Gly Lys Tyr Gln Leu
35 40 45
Gln Ser Gln Glu Asn Phe Glu Ala Phe Met Lys
50 55
<210> 59
<211> 59
<212> PRT
<213> 谷氨酸棒杆菌
<400> 59
Met Arg Gly Lys Leu Phe Met Gly Arg His Ser Thr Lys Thr Ser Ser
1 5 10 15
Ala Phe Thr Lys Leu Ala Ala Ser Thr Ile Ala Phe Gly Ala Ala Ala
20 25 30
Thr Ile Met Ala Pro Ser Ala Ser Ala Ala Pro Asp Ser Asp Trp Asp
35 40 45
Arg Leu Ala Gln Cys Glu Ser Gly Gly Asn Trp
50 55
PCT/RO/134表
Figure 000001

Claims (17)

1.一种异源蛋白质的制造方法,其包含:
培养具有用于分泌表达异源蛋白质的基因构建体的棒状细菌;和
回收通过分泌生产而产生的异源蛋白质,
所述方法中,对所述棒状细菌进行了修饰,以使其与未修饰菌株相比,LepB蛋白质的活性升高,
所述基因构建体在5’至3’的方向上包含:在棒状细菌中发挥功能的启动子序列、编码TorA信号肽的核酸序列和编码异源蛋白质的核酸序列,
所述异源蛋白质作为与所述TorA信号肽的融合蛋白进行表达。
2.根据权利要求1所述的方法,其中,
所述LepB蛋白质是下述(a)、(b)或(c)所述的蛋白质:
(a)包含序列编号2表示的氨基酸序列的蛋白质;
(b)包含下述氨基酸序列并且具有针对TorA信号肽的信号肽酶活性的蛋白质,所述氨基酸序列是在序列编号2表示的氨基酸序列中包含1~10个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列;
(c)包含相对于序列编号2表示的氨基酸序列具有90%以上的一致性的氨基酸序列并且具有针对TorA信号肽的信号肽酶活性的蛋白质。
3.根据权利要求1或2所述的方法,其中,
通过提高lepB基因的表达,而提高了所述LepB蛋白质的活性。
4.根据权利要求3所述的方法,其中,
所述lepB基因的表达,通过提高该基因的拷贝数和/或修饰该基因的表达调节序列而得到了提高。
5.根据权利要求1~4中任一项所述的方法,其中,
所述TorA信号肽是下述(a)、(b)或(c)所述的肽:
(a)包含序列编号46表示的氨基酸序列的肽;
(b)包含下述氨基酸序列并且具有作为Tat系统依赖性信号肽的功能的肽,所述氨基酸序列是在序列编号46表示的氨基酸序列中包含1~3个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列;
(c)包含相对于序列编号46表示的氨基酸序列具有90%以上的一致性的氨基酸序列并且具有作为Tat系统依赖性信号肽的功能的肽。
6.根据权利要求1~5中任一项所述的方法,其中,
所述TorA信号肽包含序列编号46表示的氨基酸序列。
7.根据权利要求1~6中任一项所述的方法,其中,
所述通过分泌生产而产生的异源蛋白质是完全除去了所述TorA信号肽的异源蛋白质。
8.根据权利要求1~7中任一项所述的方法,其中,
对所述棒状细菌进一步进行了修饰,以使其保持编码变异型PhoS蛋白质的phoS基因。
9.根据权利要求8所述的方法,其中,
所述变异是野生型PhoS蛋白质中与序列编号29的302位的色氨酸残基相对应的氨基酸残基被芳香族氨基酸和组氨酸以外的氨基酸残基取代的变异。
10.根据权利要求9所述的方法,其中,
所述芳香族氨基酸和组氨酸以外的氨基酸残基是赖氨酸残基、丙氨酸残基、缬氨酸残基、丝氨酸残基、半胱氨酸残基、甲硫氨酸残基、天冬氨酸残基或天冬酰胺残基。
11.根据权利要求9或10所述的方法,其中,
所述野生型PhoS蛋白质是下述(a)、(b)或(c)所述的蛋白质:
(a)包含序列编号29~34中任一项表示的氨基酸序列的蛋白质;
(b)包含下述氨基酸序列并且具有作为PhoRS系统的传感器激酶的功能的蛋白质,所述氨基酸序列是在序列编号29~34中任一项表示的氨基酸序列中包含1~10个氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列;
(c)包含相对于序列编号29~34中任一项表示的氨基酸序列具有90%以上的一致性的氨基酸序列并且具有作为PhoRS系统的传感器激酶的功能的蛋白质。
12.根据权利要求1~11中任一项所述的方法,其中,
对所述棒状细菌进一步进行了修饰,使其与未修饰菌株相比,选自编码Tat分泌系统的基因中的1种以上的基因的表达升高。
13.根据权利要求12所述的方法,其中,
所述编码Tat分泌系统的基因包含tatA基因、tatB基因、tatC基因和tatE基因。
14.根据权利要求1~13中任一项所述的方法,其中,
所述棒状细菌是棒状杆菌属细菌。
15.根据权利要求14所述的方法,其中,
所述棒状细菌是谷氨酸棒杆菌。
16.根据权利要求15所述的方法,其中,
所述棒状细菌是源自谷氨酸棒杆菌AJ12036(FERM BP-734)的修饰菌株或源自谷氨酸棒杆菌ATCC 13869的修饰菌株。
17.根据权利要求1~16中任一项所述的方法,其中,
所述棒状细菌是细胞表层蛋白在细胞中的平均分子数相比于未修饰菌株得到了降低的棒状细菌。
CN201980069863.5A 2018-10-25 2019-10-25 蛋白质的分泌生产方法 Pending CN112930359A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-200673 2018-10-25
JP2018200673 2018-10-25
PCT/JP2019/042069 WO2020085511A1 (ja) 2018-10-25 2019-10-25 タンパク質の分泌生産法

Publications (1)

Publication Number Publication Date
CN112930359A true CN112930359A (zh) 2021-06-08

Family

ID=70330620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980069863.5A Pending CN112930359A (zh) 2018-10-25 2019-10-25 蛋白质的分泌生产方法

Country Status (7)

Country Link
US (1) US20210246479A1 (zh)
EP (1) EP3872096A4 (zh)
JP (1) JP7375767B2 (zh)
KR (1) KR20210082212A (zh)
CN (1) CN112930359A (zh)
AU (1) AU2019364829A1 (zh)
WO (1) WO2020085511A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480409A (zh) * 2022-02-25 2022-05-13 江南大学 一种信号肽及促进胶原蛋白在谷氨酸棒杆菌中分泌表达的方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3228922A1 (en) 2021-10-11 2023-04-20 Ajinomoto Co., Inc. Bacterium modified to express heterologous tat protein
WO2023200008A1 (ja) * 2022-04-15 2023-10-19 味の素株式会社 培養肉の製造方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0444759A1 (en) * 1990-02-28 1991-09-04 Gist-Brocades N.V. Improved processing of proteins
WO1998040404A2 (en) * 1997-03-11 1998-09-17 Genetics Institute, Inc. Secreted proteins and polynucleotides encoding them
CN107532163A (zh) * 2015-04-24 2018-01-02 味之素株式会社 蛋白质的分泌生产方法

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4730302Y1 (zh) 1969-12-29 1972-09-11
JPS57134500A (en) 1981-02-12 1982-08-19 Kyowa Hakko Kogyo Co Ltd Plasmid pcg1
JPS57183799A (en) 1981-04-17 1982-11-12 Kyowa Hakko Kogyo Co Ltd Novel plasmid
JPS5835197A (ja) 1981-08-26 1983-03-01 Kyowa Hakko Kogyo Co Ltd プラスミドpcg2
JPS58192900A (ja) 1982-05-04 1983-11-10 Ajinomoto Co Inc 複合プラスミド
JPH01191686A (ja) 1988-01-26 1989-08-01 Mitsubishi Petrochem Co Ltd 複合プラスミド
FR2627508B1 (fr) 1988-02-22 1990-10-05 Eurolysine Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede
US5185262A (en) 1988-07-27 1993-02-09 Mitsubishi Petrochemical Co., Ltd. DNA fragment containing gene which encodes the function of stabilizing plasmid in host microorganism
JP2678995B2 (ja) 1988-09-08 1997-11-19 三菱化学株式会社 トリプトフアンシンターゼの製造法
JPH02207791A (ja) 1989-02-07 1990-08-17 Ajinomoto Co Inc 微生物の形質転換法
JP2973446B2 (ja) 1990-01-11 1999-11-08 三菱化学株式会社 新規プラスミドベクター
JPH07108228B2 (ja) 1990-10-15 1995-11-22 味の素株式会社 温度感受性プラスミド
WO1993003158A1 (fr) 1991-07-30 1993-02-18 Orsan Systeme d'expression et de secretion de proteines utilisables en particulier chez les corynebacteries
AU705803B2 (en) 1994-08-26 1999-06-03 Novozymes A/S Microbial transglutaminases, their production and use
WO1996022366A1 (en) 1995-01-19 1996-07-25 Novo Nordisk A/S Transglutaminases from oomycetes
US5882888A (en) 1995-01-23 1999-03-16 Novo Nordisk A/S DNA integration by transposition
JPH0970291A (ja) 1995-06-30 1997-03-18 Ajinomoto Co Inc 人工トランスポゾンを用いた遺伝子増幅方法
JP4035855B2 (ja) 1996-06-05 2008-01-23 味の素株式会社 L−リジンの製造法
JP3711658B2 (ja) 1996-10-07 2005-11-02 味の素株式会社 コリネバクテリウム・アンモニアゲネス由来の新規な細胞表層蛋白質
JP4168463B2 (ja) 1996-12-05 2008-10-22 味の素株式会社 L−リジンの製造法
US6160089A (en) 1998-07-08 2000-12-12 Mitsui Chemicals, Inc. Method for secretory production of human growth hormone
ATE447039T1 (de) 1998-09-25 2009-11-15 Ajinomoto Kk Coryneforme bakterien zur herstellung von l-glu
JP2000262288A (ja) 1999-03-16 2000-09-26 Ajinomoto Co Inc コリネ型細菌の温度感受性プラスミド
MXPA01012841A (es) * 1999-06-25 2002-07-09 Basf Ag Genes de corynebacterium glutamicum que codifican proteinas involucradas en homeostasis y adaptacion.
EP1375664B1 (en) 2001-03-30 2009-11-04 Ajinomoto Co., Inc. Method for the secretion and production of protein
KR100451432B1 (ko) 2002-07-12 2004-10-06 강충경 T-20 펩타이드의 생물학적 제조방법
JP4894134B2 (ja) 2003-07-29 2012-03-14 味の素株式会社 物質生産に影響する代謝フラックスの決定方法
JP4730302B2 (ja) 2004-04-20 2011-07-20 味の素株式会社 タンパク質の製造法
DE102004035543A1 (de) 2004-07-22 2006-02-09 Henkel Kgaa Neue sekretorische Genprodukte von Bacillus licheniformis und darauf aufbauende verbesserte biotechnologische Produktionsverfahren
JP2008508320A (ja) * 2004-07-29 2008-03-21 カイロン コーポレイション Streptococcusagalactiaeのようなグラム陽性細菌に対する免疫原性組成物
US7794989B2 (en) 2004-12-28 2010-09-14 Ajinomoto Co., Inc. L-glutamic acid-producing microorganism and a method for producing L-glutamic acid
RU2418069C2 (ru) 2006-09-29 2011-05-10 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) Способ конструирования рекомбинантных бактерий, принадлежащих к роду pantoea, и способ продукции l-аминокислот с использованием бактерий, принадлежащих к роду pantoea
KR101077783B1 (ko) 2011-08-16 2011-10-28 바이오알앤디 주식회사 재조합 인간성장호르몬 단백질, 이의 발현 벡터, 및 이를 이용한 인간성장호르몬 단백질의 제조방법
CN103917656B (zh) 2011-10-25 2016-09-28 味之素株式会社 蛋白质的分泌产生方法
KR101653555B1 (ko) 2011-11-02 2016-09-02 아지노모토 가부시키가이샤 단백질의 분비 생산 방법
AU2012333515B2 (en) * 2011-11-02 2015-07-16 Ajinomoto Co., Inc. Method for secreting and producing proteins
PE20141569A1 (es) 2011-11-11 2014-11-08 Ajinomoto Kk Metodo para producir una sustancia diana mediante fermentacion
JPWO2013118544A1 (ja) 2012-02-08 2015-05-11 味の素株式会社 タンパク質の分泌生産法
CN104611317B (zh) 2015-03-09 2018-07-06 江南大学 一种提高l-天冬酰胺酶分泌表达的方法
WO2018074578A1 (ja) 2016-10-21 2018-04-26 味の素株式会社 タンパク質の分泌生産法
EP3530747A4 (en) * 2016-10-21 2020-07-22 Ajinomoto Co., Inc. SECRETORY PROTEIN PRODUCTION PROCESS

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0444759A1 (en) * 1990-02-28 1991-09-04 Gist-Brocades N.V. Improved processing of proteins
WO1998040404A2 (en) * 1997-03-11 1998-09-17 Genetics Institute, Inc. Secreted proteins and polynucleotides encoding them
CN107532163A (zh) * 2015-04-24 2018-01-02 味之素株式会社 蛋白质的分泌生产方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IRIS LUKE等: "Proteolytic processing of Escherichia coli twin-arginine signal peptides by LepB", ARCH MICROBIOL, vol. 191, pages 919 - 925, XP019756290, DOI: 10.1007/s00203-009-0516-5 *
ROLAND FREUDL: "Beyond amino acids: Use of the Corynebacterium glutamicum cellfactory for the secretion of heterologous proteins", JOURNAL OF BIOTECHNOLOGY, vol. 258, pages 101 - 109 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480409A (zh) * 2022-02-25 2022-05-13 江南大学 一种信号肽及促进胶原蛋白在谷氨酸棒杆菌中分泌表达的方法
CN114480409B (zh) * 2022-02-25 2023-09-12 江南大学 一种信号肽及促进胶原蛋白在谷氨酸棒杆菌中分泌表达的方法

Also Published As

Publication number Publication date
JPWO2020085511A1 (ja) 2021-09-16
EP3872096A1 (en) 2021-09-01
AU2019364829A1 (en) 2021-06-03
WO2020085511A1 (ja) 2020-04-30
JP7375767B2 (ja) 2023-11-08
US20210246479A1 (en) 2021-08-12
EP3872096A4 (en) 2022-11-30
KR20210082212A (ko) 2021-07-02

Similar Documents

Publication Publication Date Title
KR102619848B1 (ko) 단백질의 분비 생산법
CN109937258B (zh) 蛋白质的分泌产生方法
JP6136930B2 (ja) タンパク質の分泌生産法
CN110312807B (zh) 蛋白质的分泌产生方法
US20210246479A1 (en) Method for Secretory Production of Protein
JP2023184699A (ja) タンパク質の分泌生産法
KR20240032941A (ko) 비천연 아미노산 함유 단백질의 분비 생산법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination