CN116615548A - L-组氨酸输出蛋白和使用其生产l-组氨酸的方法 - Google Patents

L-组氨酸输出蛋白和使用其生产l-组氨酸的方法 Download PDF

Info

Publication number
CN116615548A
CN116615548A CN202180078472.7A CN202180078472A CN116615548A CN 116615548 A CN116615548 A CN 116615548A CN 202180078472 A CN202180078472 A CN 202180078472A CN 116615548 A CN116615548 A CN 116615548A
Authority
CN
China
Prior art keywords
leu
ala
histidine
val
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180078472.7A
Other languages
English (en)
Inventor
许兰
徐昌一
丁起龙
任绣彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CJ CheilJedang Corp
Original Assignee
CJ CheilJedang Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CJ CheilJedang Corp filed Critical CJ CheilJedang Corp
Publication of CN116615548A publication Critical patent/CN116615548A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/35Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Mycobacteriaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/24Proline; Hydroxyproline; Histidine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/15Corynebacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种具有组氨酸输出活性的新型蛋白质、经修饰以表达该蛋白质的生产L‑组氨酸的微生物和使用该微生物生产L‑组氨酸的方法。

Description

L-组氨酸输出蛋白和使用其生产L-组氨酸的方法
技术领域
涉及一种具有组氨酸输出活性的新型蛋白质、一种经修饰以表达所述蛋白质的生产L-组氨酸的微生物,以及一种使用所述微生物生产L-组氨酸的方法。
背景技术
L-组氨酸是20种标准氨基酸中的一种,从营养学的角度来说,成人不需要大量的L-组氨酸,但L-组氨酸被分类为成长中儿童的必需氨基酸。此外,L-组氨酸参与重要生理过程,例如抗氧化和免疫调节等,并且L-组氨酸用于医药工业中,例如胃溃疡治疗剂或循环系统治疗剂的原料和氨基酸输液制剂等。
由于L-组氨酸在血红蛋白中特别丰富,因此其主要通过使用血粉为原料的蛋白水解提取法来生产。然而,该方法具有例如效率低和环境污染等缺点。另一方面,可以通过微生物发酵法生产L-组氨酸,但尚未实现大规模工业化。这是因为L-组氨酸的生物合成与核苷酸合成前体磷酸核糖焦磷酸(PRPP)竞争,具有复杂的生物合成过程并且需要高能量的调节机制。
已知当具有其他种类氨基酸输出能力的蛋白质的表达和/或功能时,相应氨基酸的产量增加的实例,但是先前几乎没有关于对L-组氨酸特异性输出能力的蛋白质进行研究。
在这种背景下,需要发现具有组氨酸特异性输出能力的蛋白质并开发使用该蛋白质的组氨酸生产技术。
发明内容
技术问题
在本说明书中,提出了由于发现具有L-组氨酸输出能力的组氨酸输出蛋白并将其在具有L-组氨酸生产能力的微生物中表达,可以显著提高L-组氨酸的生产。
一种实施方式提供了一种具有L-组氨酸输出活性的蛋白质。所述蛋白质可以是具有L-组氨酸特异性输出能力的蛋白质。
另一种实施方式提供了一种生产L-组氨酸的微生物,所述微生物表达L-组氨酸输出蛋白。
其他实施方式提供了一种用于生产L-组氨酸的方法,包括在培养基中培养所述微生物。
技术方案
在本说明书中,通过发现具有L-组氨酸输出能力的组氨酸输出蛋白,并将其导入具有L-组氨酸生产能力的微生物中,提供了L-组氨酸产量显著提高的重组微生物和使用其生产L-组氨酸的技术。
在下文中,将更详细地描述本发明。
一种实施方式提供了一种具有L-组氨酸输出活性的蛋白质。所述蛋白质可以是具有L-组氨酸特异性输出能力的蛋白质。在本说明书中,所述蛋白质可以由L-组氨酸输出蛋白表示。在一种实施方式中,L-组氨酸输出蛋白可以在棒状杆菌属(Corynebacterium)和/或埃希氏菌属(Escherichia)的微生物中具有L-组氨酸输出能力,然后,L-组氨酸输出蛋白可以是来源于不属于棒状杆菌属和/或埃希氏菌属的微生物的蛋白质,例如,所述微生物为选自由皮杆菌属(Dermabacter)(例如,阴道皮杆菌(Dermabacter vaginalis)等)、创伤杆菌属(Helcobacillus)(例如,马赛创伤杆菌(Helcobacillus massiliensis)等)和分枝杆菌属(Mycobacterium)(例如,脓肿分枝杆菌脓肿亚种(Mycobacterium abscessussubsp.abscessus)等)等所组成的组中的至少一种微生物。
在一种实施方式中,L-组氨酸输出蛋白可以是与SEQ ID NO:12、SEQ ID NO:13或其组合具有至少60%序列同源性的蛋白质。例如,在一种具体实施方式中,所述L-组氨酸输出蛋白可以与SEQ ID NO:12、13或其组合具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%的同源性。
在一种具体实施方式中,所述L-组氨酸输出蛋白可以是至少一种,例如,选自由包含选自以下的氨基酸序列的蛋白质或由以下序列组成的蛋白质所组成的组中的一种、两种或三种:
SEQ ID NO:12、SEQ ID NO:13,或其组合;
SEQ ID NO:41、SEQ ID NO:42,或其组合;以及
SEQ ID NO:44、SEQ ID NO:45,或其组合。
SEQ ID NO:12表示的蛋白质可以由SEQ ID NO:64的核酸序列来编码,并且SEQ IDNO:13表示的蛋白质可以由SEQ ID NO:65的核酸序列来编码,或SEQ ID NO:12和/或SEQ IDNO:13表示的蛋白质可以由SEQ ID NO:14的核酸序列(融合在SEQ ID NO:64的3’端和SEQID NO:65的5’端的重叠区域的操纵子序列)来编码。
SEQ ID NO:41表示的蛋白质可以由SEQ ID NO:66的核酸序列来编码,SEQ ID NO:42表示的蛋白质可以由SEQ ID NO:67的核酸序列来编码,或者SEQ ID NO:41和/或SEQ IDNO:42表示的蛋白质可以由SEQ ID NO:43的核酸序列(融合在SEQ ID NO:66的3’端和SEQID NO:67的5’端的重叠区域的操纵子序列)来编码。
SEQ ID NO:44表示的蛋白质可以由SEQ ID NO:68的核酸序列来编码,并且SEQ IDNO:45表示的蛋白质可以由SEQ ID NO:69的核酸序列来编码,或由SEQ ID NO:44和/或SEQID NO:45表示的蛋白质可以由SEQ ID NO:46的核酸序列(融合在SEQ ID NO:68的3’端和SEQ ID NO:69的5’端的重叠区域的操纵子序列)来编码。
另一种实施方式提供了一种生产L-组氨酸的微生物,所述微生物被修饰为表达L-组氨酸输出蛋白。所述L-组氨酸输出蛋白如前文所述。所述L-组氨酸输出蛋白可以是源自生产L-组氨酸的微生物(例如,来自微生物的异源微生物)的外源蛋白的蛋白质。
在本说明书中,术语“生产L-组氨酸的微生物”可以用于表示:
通过修饰具有L-组氨酸生产能力的微生物来表达L-组氨酸输出蛋白,例如,通过修饰该微生物1)来进一步表达L-组氨酸输出蛋白,或2)通过替换内源性L-组氨酸输出蛋白来表达它,从而与未经修饰的微生物相比,具有提高的L-组氨酸生产能力的情况,和/或
通过修饰不具有L-组氨酸生产能力的微生物以表达L-组氨酸输出蛋白而具有L-氨基酸生产能力的情况。
在本说明书中,“微生物”包括单细胞细菌,并且可以与“细胞”互换使用。
在本说明书中,未经修饰的微生物用于区别于经修饰以表达L-组氨酸输出蛋白的“生产L-组氨酸的微生物”,因此L-组氨酸生产能力增加或L-组氨酸生产能力是给定的,并且可以指在经修饰以表达L-组氨酸输出蛋白之前的微生物或未经修饰以表达L-组氨酸输出蛋白的微生物,并且可以由宿主微生物表示。
微生物可以是选自由天然具有L-组氨酸生产能力的微生物或不具有L-组氨酸生产能力或通过将突变引入显著更少的菌株而可以具有L-组氨酸生产能力的所有革兰氏阳性菌所组成的组中的至少一种,例如棒状杆菌属微生物和埃希氏菌属微生物。棒状杆菌属的微生物可以包括谷氨酸棒状杆菌、产氨棒状杆菌(Corynebacterium ammoniagenes)、乳糖发酵短杆菌(Brevibacterium lactofermentum)、黄色短杆菌(Brevibacteriumflavum)、热产氨棒状杆菌(Corynebacterium thermoaminogenes)、高效棒状杆菌(Corynebacterium efficiens)等,但不限于此。例如,棒状杆菌属的微生物可以是谷氨酸棒状杆菌。
在一种实施方式中,与未经修饰以表达L-组氨酸输出蛋白(例如,外源L-组氨酸输出蛋白)的同种未经修饰的微生物相比,经修饰以表达L-组氨酸输出蛋白的L-组氨酸生产微生物可具有增加的L-组氨酸生产能力。在一种具体实施方式中,经修饰以表达L-组氨酸输出蛋白的L-组氨酸生产微生物的L-组氨酸产量(例如,培养基中的含量)可以增加至少5%(w/v)、至少10%(w/v)、至少12.5%(w/v)、至少15%(w/v)、至少17.5%(w/v)或至少20%(w/v)(L-组氨酸产量增加率的上限可以不限于此,但可以是100%(w/v)、90%(w/v)、80%(w/v)、75%(w/v)、70%(w/v)、65%(w/v)、60%(w/v)、55%(w/v)或50%(w/v))。经修饰以表达L-组氨酸输出蛋白的L-组氨酸生产微生物与未经修饰的微生物之间的L-组氨酸产量的比较,可以基于彼此使用等量底物(例如,糖类如葡萄糖等)的情况来进行,例如可以在底物(例如糖类如葡萄糖等)单位量(1g、10g或100g等)标准培养基中比较L-组氨酸的含量。
在本说明书中,术语“经修饰以表达L-组氨酸输出蛋白”可以指在微生物中表达外源L-组氨酸输出蛋白的任何操作,例如,它可以指在微生物中导入编码外源L-组氨酸输出蛋白的基因或用编码外源L-组氨酸输出蛋白的基因转化微生物。
在本说明书中,多核苷酸(可以与“基因”互换使用)或多肽(可以与“蛋白质”互换使用)“包含特定核酸序列或氨基酸序列,由特定核酸组成序列或氨基酸序列组成,或由特定的核酸序列或氨基酸序列表示”,是可以互换用作等同含义的表述,并且可以指该多核苷酸或多肽由特定的核酸序列或氨基酸序列组成或基本上包含特定的核酸序列或氨基酸序列,并且可以解释为包含“基本上等同的序列”,其中,在保持多核苷酸或多肽(或不排除引入突变)的原有功能和/或所需功能的范围内将突变(删除、替换、修饰和/或添加)添加到特定的核酸序列或氨基酸序列中。
在一种实施方式中,本说明书中提供的核酸序列或氨基酸序列可以包含在保持原有功能或其所需功能的范围内,通过常规诱变修饰,例如,直接进化和/或定点诱变等。在一种实施方式中,多核苷酸或多肽“包含特定核酸序列或氨基酸序列”,可以指多核苷酸或多肽(i)由特定核酸序列或氨基酸序列组成或基本上包含该特定核酸序列或氨基酸序列,或(ii)由与特定核酸序列或氨基酸序列具有60%或更高、65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、91%或更高、92%或更高、93%或更高、94%或更高、95%或更高、96%或更高、97%或更高、98%或更高、99%或更高、99.5%或更高或99.9%或更高(例如,60%~99.5%、70%~99.5%、80%~99.5%、85%~99.5%、90%~99.5%、91%~99.5%、92%~99.5%、93%~99.5%、94%~99.5%、95%~99.5%、96%~99.5%、97%~99.5%、98%~99.5%或99%~99.5%)的同源性或基本上包含该序列,并保持原始功能和/或所需功能的核酸序列或氨基酸序列组成。在本说明书中,原始功能可以是L-组氨酸输出功能(氨基酸序列的情况)或编码具有L-组氨酸输出功能的蛋白质的功能(核酸序列的情况),所需的功能可以是指增加或赋予微生物L-组氨酸生产能力的功能。
在本说明书中描述的核酸序列中,考虑到微生物中的优选密码子通过密码子的简并性来表达蛋白质(L-组氨酸输出蛋白),在不改变氨基酸序列和/或从该编码区表达的蛋白质功能的范围内,可以对编码区进行各种修饰。
在本申请中,术语“同源性”或“同一性”是指两个给定的氨基酸序列或碱基序列的相关程度并且可以表示为百分比。术语同源性和同一性通常可以互换使用。
保守多核苷酸或保守多肽的序列同源性或同一性由标准阵列算法确定,并且可以一起使用通过所用程序建立的默认空位罚分。基本上,同源的或同一的序列通常可以在中等或高度严格条件下沿整个序列或全长的至少约50%、60%、70%、80%或90%杂交。显然,杂交还包括含有共同密码子的多核苷酸或考虑到多核苷酸中的密码子简并性的密码子。
任何两个多核苷酸或多肽序列是否具有同源性、相似性或同一性可以使用例如已知的计算机算法,诸如使用Pearson等人的“FASTA”程序(1988)[Proc.Natl.Acad.Sci.USA85]:2444确定。此外,同源性、相似性或同一性可使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453),在EMBOSS包的Needleman程序中执行(EMBOSS:TheEuropean Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)(版本5.0.0或之后的版本)(包括GCG程序包(Devereux,J.等人,Nucleic AcidsResearch 12:387(1984))、BLASTP、BLASTN、FASTA(Atschul,[S.][F.,][ET AL,J MOLECBIOL 215]:403(1990);Guide to Huge Computers,Martin J.Bishop,[ED.,]AcademicPress,圣地亚哥,1994,以及[CARILLO ETA/.](1988)SIAM J Applied Math 48:1073)。例如,可使用美国国家生物技术信息中心(National Biotechnology Information DatabaseCenter)的BLAST或ClustalW确定同源性、相似性或同一性。
多核苷酸或多肽的同源性、相似性或同一性可以通过使用GAP计算机程序比较序列信息来确定,例如Needleman等人(1970),J Mol Biol.48:443,已知例如,Smith和Waterman,Adv.Appl.Math(1981)2:482。概括地说,GAP程序可以定义为两个序列中的较短序列中符号的总数除以类似比对符号的数目(即,核苷酸或氨基酸)所获得的值。GAP程序的默认参数可包括(1)二元比较矩阵(包括相同值为1且非同值为0)和Gribsko等人,(1986)Nucl.Acids Res.14:6745的加权比较矩阵,如Schwartz和Dayhoff编,Atlas Of ProteinSequence And Structure,National Biomedical Research Foundation,第353-358页(1979)(或EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵)中所公开;(2)每个空位的罚分为3.0并且每个空位的每个符号额外罚分0.10(或空位开放罚分为10,空位延伸罚分为0.5);以及(3)末端空位没有罚分。
另外,任意两个多核苷酸或多肽序列是否具有同源性、相似性或同一性,可以通过在确定的严格条件下进行DNA(Southern)杂交实验比对序列来确定,所确定的合适的杂交条件是在相应的技术范围内,并且可以通过本领域技术人员已知的方法确定(例如,J.Sambrook等人,Molecular Cloning,A Laboratory Manual,第二版,Cold SpringHarbor Laboratory press,Cold Spring Harbor,纽约,1989;FM Ausubel等人,CurrentProtocols in Molecular Biology,John Wiley&Sons,Inc.,纽约)。
本领域技术人员使用常规表达载体,通过适当地选择已知的已知的转换方法,可以进行编码L-组氨酸输出蛋白的基因的导入或转化。在本说明书中,术语“转化”是指将包含编码靶蛋白(L-组氨酸输出蛋白)的多核苷酸的表达载体导入宿主微生物中,使得由多核苷酸编码的蛋白质可以在宿主细胞中表达。只要转化的多核苷酸可以在宿主微生物中表达,它就可以位于插入的宿主微生物的染色体中和/或位于染色体外。只要多核苷酸可以被导入宿主微生物中并在宿主微生物中表达,导入的形式不受限制。例如,多核苷酸可以以表达盒的形式导入宿主微生物,该表达盒是包含自主表达所需的所有元件的基因结构。表达盒通常可以包含表达调节元件,例如可以操作地连接至多核苷酸的启动子、转录终止信号、核糖体结合位点和/或翻译终止信号等。表达盒可以是能够自我复制的表达载体的形式。此外,可以将多核苷酸以其自身的形式导入宿主细胞并在宿主细胞中可操作地连接至表达需要的序列。在上文中,术语“可操作地连接”可以指表达调控元件(例如,启动子)和多核苷酸功能性地连接,使得表达调控元件对编码靶蛋白(L-组氨酸输出蛋白)的多核苷酸进行转录调控(例如,转录起始)。可操作的连接可以使用本领域已知的基因重组技术进行,例如,可以通过常见的位点特异性DNA切割和连接来进行,但不限于此。
将多核苷酸转化到宿主微生物中的方法可以通过任何将核酸导入细胞(微生物)的方法来进行,并且可以根据宿主微生物适当地选择和进行本领域已知的转化技术。作为已知的转化方法,电穿孔法、磷酸钙(CaPO4)沉淀法、氯化钙(CaCl2)沉淀法、显微注射法、聚乙二醇(PEG)沉淀法(聚乙二醇介导的摄取)、DEAE-葡聚糖法、阳离子脂质体法、脂质转染法、醋酸锂-DMSO法等可以作为示例,但不限于此。
将基因插入宿主细胞基因组(染色体)中可以通过适当地选择本领域技术人员已知的方法来进行,并且例如,可以使用例如RNA引导的核酸内切酶系统来进行(例如,选自由(a)RNA引导的核酸内切酶(例如,Cas9蛋白等)、其编码基因或包含该基因的载体;和(b)混合物(例如,RNA引导的核酸内切酶蛋白和向导RNA等的混合物)、复合物(例如,核糖核酸融合蛋白(RNP)、重组载体(例如,包含RNA引导核酸内切酶编码基因和向导RNA编码DNA的载体等)等,其包含向导RNA(例如,单向导RNA(sgRNA)等),其编码DNA或包含该DNA的载体所组成的组中的至少一种,但不限于此。
另一种实施方式提供了编码L-组氨酸输出蛋白的核酸分子。在一种实施方式中,核酸分子可以是包含SEQ ID NO:64和/或SEQ ID NO:65,或SEQ ID NO:14;SEQ ID NO:66和/或SEQ ID NO:67,或SEQ ID NO:43;或SEQ ID NO:68和/或SEQ ID NO:69,或SEQ ID NO:46的核酸序列或由该序列组成的核酸分子。
其他实施方式提供了一种包含该核酸分子的重组载体(表达载体)。
其他实施方式提供了一种包含该核酸分子或重组载体的重组细胞。
一种实施方式提供了一种用于生产L-组氨酸的组合物、一种用于增加L-组氨酸产量的组合物或一种用于制备L-组氨酸生产微生物的组合物,其包含编码L-组氨酸输出蛋白的核酸分子、包含该核酸分子的重组载体或包含该核酸分子或重组载体的细胞。
其他实施方式提供了一种用于制备L-组氨酸生产微生物的方法或一种增强和/或赋予微生物L-组氨酸生产能力的方法,包括修饰微生物以表达L-组氨酸输出蛋白。修饰微生物以表达L-组氨酸输出蛋白可以通过将编码L-组氨酸输出蛋白的基因导入微生物来进行,或用编码L-组氨酸输出蛋白的基因转化微生物来进行。
L-组氨酸输出蛋白、编码L-组氨酸输出蛋白的基因和微生物如上所述。
在本说明书中,术语“载体”是指含有编码靶蛋白的多核苷酸的碱基序列的DNA制品,所述DNA制品可操作地连接至合适的调节序列,使得靶蛋白能够在合适的宿主中表达。调节重序列可以包含可启动转录的启动子、用于调节转录的任何操纵子序列、编码合适的mRNA核糖体结合位点的序列和/或调节转录和/或翻译终止的序列。在转化到合适的宿主微生物后,载体可以独立于宿主微生物的基因组表达或整合到宿主微生物的基因组中表达。
可用于本说明书的载体不受特别限制,只要它可以在宿主细胞中复制即可,并且可以选自所有常用的载体。常用载体的实例可以包括天然或重组质粒、粘粒、病毒、噬菌体等。例如,作为载体,可以将pWE15、M13、MBL3、MBL4、IXII、ASHII、APII、t10、t11、Charon4A和Charon21A等用作噬菌体载体或粘粒载体,并且可以将pBR基、pUC基、pBluescriptII基、pGEM基、pTZ基、pCL基和pET基载体等用作质粒载体。具体而言,可以举例pDZ、pACYC177、pACYC184、pCL、pECCG117、pUC19、pBR322、pMW118、pCC1BAC载体等,但不限于此。
可用于本说明书的载体可以是已知的表达载体和/或用于将多核苷酸插入宿主细胞染色体的载体。可以通过本领域已知的任何方法将多核苷酸插入宿主细胞染色体,例如,同源重组,但不限于此。载体还可以包含选择标记物,用于确认插入在染色体中。选择标记物用于选择用载体转化的细胞,即,确认多核苷酸的插入,并且它可以在赋予选择性表型例如抗药性、营养缺陷型、细胞毒剂抗性或表面蛋白表达的基因中选择和使用。在用选择剂处理的环境中,只有表达选择标记物的细胞存活或表现出其他表型性状,因此可以选择转化的细胞。
其他实施方式提供了一种用于生产L-组氨酸的方法,包括在培养基中培养生产L-组氨酸的微生物。该方法还可以包括培养后从培养的微生物、培养基或它们两者中回收L-组氨酸。
在所述方法中,微生物的培养没有特别限制,但可以通过已知的分批培养法、连续培养法、补料分批培养法等进行。然后,培养条件没有特别限制,但可以使用碱性化合物(例如:氢氧化钠、氢氧化钾或氨)或酸性化合物(例如:磷酸盐或硫酸盐)调节滴定pH(例如,pH5~9,具体地,pH 6~8,最具体地,pH 6.8),并且可以通过将氧气或含氧气体混合物引入培养物中来维持需氧条件。培养温度可保持在20℃~45℃或25℃~40℃,并且可培养约10小时~约160小时、约10小时~96小时、约10小时~48小时或约10小时~36小时,但不限于此。通过培养生产的L-组氨酸可以分泌到培养基中或保留在细胞中。
可用于培养的培养基可以单独地使用选自由糖和碳水化合物(例如:葡萄糖、蔗糖、乳糖、果糖、麦芽糖、糖蜜、淀粉和纤维素)、油和脂肪(例如:大豆油、葵花籽油、花生油和椰子油)、脂肪酸(例如:棕榈酸、硬脂酸和亚油酸)、醇类(例如:甘油和乙醇)、有机酸(如:醋酸)等所组成的组中的至少一种,或混合并使用其中的至少两种作为碳源,但不限于此。作为氮源,可以单独地使用选自由含氮有机化合物(例如:蛋白胨、酵母提取物、肉汁、麦芽提取物、玉米浆、豆粕粉和尿素)、无机化合物(例如:硫酸铵、氯化铵、磷酸铵、碳酸铵和硝酸铵)等所组成的组的至少一种,也可以混合并使用其中的至少两种,但不限于此。作为磷源,可以单独地使用选自由磷酸二氢钾、磷酸氢二钾、其相应的含钠盐等所组成的组中的至少一种,或混合并使用其中的至少两种,但不限于此。此外,培养基可以包含必需的生长促进物质,例如其他金属盐(例如:硫酸镁或硫酸铁)、氨基酸和/或维生素等。
回收L-组氨酸可以是根据培养方法使用本领域已知的适当方法从培养基、培养液或微生物中收集所需的氨基酸。例如,可以通过选自离心、过滤、阴离子交换层析、结晶、HPLC等中的至少一种方法进行回收。用于回收L-组氨酸的方法还可以包括在回收之前、回收的同时或回收之后进行纯化。
有益效果
与不表达L-组氨酸输出基因的亲本菌株相比,通过在具有L-组氨酸生产能力的微生物中表达本说明书中提供的L-组氨酸输出基因,可以显著提高L-组氨酸产量,因此不但L-组氨酸可以更有效地生产,而且其还可以有助于L-组氨酸的工业化大规模生产。
具体实施方式
下面通过实施例对本申请进行更详细的说明。然而,这些实施例旨在说明性地描述本申请,但本申请的范围不受这些实施例的限制。
实施例1.外源组氨酸输出基因搜索和候选物选择
L-组氨酸在氨基酸种类中主要分类为碱性氨基酸,但也分类为芳香族氨基酸或支链氨基酸。为了选择具有L-组氨酸特异性输出能力的蛋白质候选物,基于NCBI和Kegg数据库,作为使用输出蛋白质(LysE(Arch Microbiol 180:155-160)、Wex(韩国专利第10-1968317号)、BrnFE(Arch Microbiol 180:155-160))的氨基酸序列作为查询序列对每个类别的氨基酸(碱性氨基酸:L-赖氨酸,芳香族氨基酸:Trp,支链氨基酸:异亮氨酸)进行PSI-BLAST搜索的结果,选择预测为可能释放L-组氨酸的膜蛋白的候选基因和拥有这些基因的微生物。
其中,考虑到生产菌株适用的生物安全性水平和保障可能性,如下表1所示,选择基于LysE的1种蛋白质、基于Wex的3种蛋白质和基于BrnFE的2种蛋白质、编码它们的基因和包含它们微生物:
表1L-组氨酸输出候选物清单
(上表1中,生物安全性依据美国疾病控制和预防中心(Centers for DiseaseControl and Prevention)定义的微生物致病指数(1~4级)(越低越安全)
实施例2.导入外源L-组氨酸输出基因候选物的载体和导入该载体的棒状杆菌属重组菌株的构建
构建用于将实施例1中选择的6种外源L-组氨酸输出基因候选物导入棒状杆菌属菌株的6种载体。
为了导入外源L-组氨酸输出基因候选物,将编码谷氨酸棒状杆菌的转座子的基因中的NCgl2131基因用作插入位点(Journal of Biotechnology 104,5-25Jorn Kalinowski等人,2003)。此外,外源L-组氨酸输出基因候选物被设计为在棒状状杆菌属来源的gapA基因(下文中,PgapA,SEQ ID NO:15)的启动子下表达。
为了用输出蛋白(exporter)基因替换NCgl2131基因,构建了NCg12131缺失和靶基因插入的载体。为了构建该载体,使用谷氨酸棒状杆菌菌株ATCC13032的染色体为模板,分别使用SEQ ID NO:16和SEQ ID NO:17,以及SEQ ID NO:18和SEQ ID NO:19引物对,分别进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得531bp的del-N2131L(SEQ ID NO:20)和555bp的del-N2131R(SEQ ID NO:21)的DNA片段。将获得的DNA产物使用QIAGEN公司的PCR纯化试剂盒进行纯化,然后使用pDZ载体(韩国专利第10-0924065号)和TaKaRa公司的Infusion克隆试剂盒进行克隆,从而构建了NCgl2131基因缺失和靶基因插入的载体。
编码水草螺菌来源的蛋白质(下文中,Haq、SEQ ID NO:1)的基因(下文中,haq、SEQID NO:2)的碱基序列信息从美国国立卫生研究院GenBank(NIH GenBank)获得。为了扩增haq,使用水草螺菌菌株(KCTC42001)的染色体DNA为模板,使用SEQ ID NO:22和SEQ ID NO:23的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了含有945bp的haq(SEQ ID NO:2)的977bp的haq片段。为了获得与haq可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:24和SEQ ID NO:25引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了含有409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。
编码罗尔斯通氏菌来源的蛋白质(下文中,Cpi、SEQ ID NO:3)的基因(下文中,cpi、SEQ ID NO:4)的碱基序列信息从美国国立卫生研究院GenBank(NIH GenBank)获得。为了扩增来源于罗尔斯通氏菌的cpi,使用罗尔斯通氏菌菌株(KCTC22125)的染色体DNA为模板,使用SEQ ID NO:24和SEQ ID NO:25的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含945bp的cpi(SEQ ID NO:4)的977bp的cpi片段。为了获得与cpi可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:22和SEQ ID NO:26的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃进行聚合5分钟。结果,获得了包含409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。将获得的cpi片段和PgapA片段,以及用ScaI限制性酶切割的pDZΔN2131载体用Gibson组装法进行克隆,得到重组质粒,命名为pDZΔN2131-PgapA-Cpi。
编码栖冷克吕沃尔菌来源的蛋白质(下文中,Kcr、SEQ ID NO:5)的基因(下文中,kcr、SEQ ID NO:6)的碱基序列信息从美国国立卫生研究院GenBank(NIH GenBank)获得。为了扩增栖冷克吕沃尔菌来源的kcr,使用栖冷克吕沃尔菌菌株(KCTC2580)的染色体DNA为模板,使用SEQ ID NO:29和SEQ ID NO:30的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含882bp的kcr(SEQ ID NO:6)的914bp的kcr片段。为了获得与kcr可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:24和SEQ ID NO:31的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。将获得的kcr片段和PgapA片段,以及用ScaI限制性酶切割后的pDZΔN2131载体使用Gibson组装方法来克隆,得到重组质粒,命名为pDZΔN2131-PgapA-Kcr。
编码停滞棒状杆菌来源的蛋白质(下文中,Cst、SEQ ID NO:7)的基因(下文中,cst、SEQ ID NO:8)的碱基序列信息从美国国立卫生研究院GenBank(NIH GenBank)获得。为了扩增停滞棒状杆菌来源的cst,使用停滞棒状杆菌菌株(KCTC6872)的染色体DNA为模板,使用SEQ ID NO:32和SEQ ID NO:33的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含717bp的cst(SEQ ID NO:8)的749bp的cst片段。为了获得与cst可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:24和SEQ ID NO:34的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。将获得的cst片段和PgapA片段,以及用ScaI限制性酶切割后的pDZΔN2131载体使用Gibson组装方法来克隆,得到重组质粒,命名为pDZΔN2131-PgapA-Cst。
编码盐生银杆菌来源的蛋白质(下文中,LsaFE、SEQ ID NO:9、10)的基因(下文中,lsa、SEQ ID NO:11)的碱基序列信息从美国国立卫生研究院GenBank(NIH GenBank)获得。为了扩增盐生银杆菌来源的lsa,使用盐生银杆菌菌株(KCTC19904)的染色体DNA为模板,使用SEQ ID NO:35和SEQ ID NO:36的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含1048bp的lsa(SEQ ID NO:11)的1080bp的lsa片段。为了获得与Isa可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:24和SEQ ID NO:37的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。将获得的lsa片段和PgapA片段,以及用ScaI限制性酶切割后的pDZΔN2131载体使用Gibson组装方法来克隆,得到重组质粒,命名为pDZΔN2131-PgapA-Lsa。
编码阴道皮杆菌来源的蛋白质(下文中,DvaFE、SEQ ID NO:12、13)的操纵子(下文中,dva、SEQ ID NO:14)的碱基序列信息从美国国立卫生研究院GenBank(NIH GenBank)获得。为了扩增阴道皮杆菌来源的dva,使用阴道皮杆菌菌株(KCTC39585)的染色体DNA为模板,使用SEQ ID NO:38和SEQ ID NO:39的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含1081bp的dva(SEQ ID NO:14)的1113bp的dva片段。为了获得与dva可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:24和SEQ ID NO:40引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。将获得的dva片段和PgapA片段,以及用ScaI限制性酶切割后的pDZΔN2131载体使用Gibson组装方法来克隆,得到重组质粒,命名为pDZΔN2131-PgapA-Dva。
为了确认外源L-组氨酸输出基因候选物的L-组氨酸输出能力,构建了NCgl2131缺失的载体(pDZΔN2131)和导入6种外源L-组氨酸输出基因候选物的载体(pDZΔN2131-PgapA-Haq、pDZΔN2131-PgapA-Cpi、pDZΔN2131-PgapA-Kcr、pDZΔN2131-PgapA-Cst、pDZΔN2131-PgapA-Lsa、pDZΔN2131-PgapA-Dva)分别导入进谷氨酸棒状杆菌ATCC13032菌株中。更具体地,分别将载体通过电穿孔法转化到ATCC13032菌株中,并且通过二次杂交过程,构建了7种重组菌株,其中染色体上的NCgl2131基因缺失或替换为L-组氨酸输出基因候选物,分别命名为ATCC13032ΔN2131(删除N2131基因)、ATCC13032ΔN2131::Haq(N2131基因被haq替代)、ATCC13032ΔN2131::Cpi(N2131基因被cpi替代)、ATCC13032ΔN2131::Kcr(N2131基因被kcr替代)、ATCC13032ΔN2131::Cst(N2131基因被cst替代)、ATCC13032ΔN2131::Lsa(N2131基因被lsa替代)和ATCC13032ΔN2131::Dva(N2131基因被dva替代)。
实施例3.导入外源L-组氨酸输出基因候选物的棒状杆菌属菌株的MIC测定
为确认实施例2构建的7种重组谷氨酸棒状杆菌菌株(ATCC13032ΔN2131、ATCC13032ΔN2131::Haq、ATCC13032ΔN2131::Cpi、ATCC13032ΔN2131::Kcr、ATCC13032ΔN2131::Cst、ATCC13032ΔN2131::Lsa和ATCC13032ΔN2131::Dva)具有L-组氨酸输出能力活性,进行使用L-组氨酸的最低抑制浓度(MIC)实验。7种菌株在30℃下在基本液体培养基中培养24小时后,稀释为1×103个和1×104个细胞,在添加了L-组氨酸的基本固体培养基中点样培养。使用的基本固体培养基组成如下:
基本培养基(pH7.2)
葡萄糖10g、KH2PO4 1g、K2HPO4 2g、MgSO4·7H2O 0.4g、尿素2g、(NH4)2SO4 5g、NaCl0.5g、烟酰胺5μg、泛酸钙0.1μg、生物素0.2μg、盐酸硫胺素3μg、微量元素溶液*1ml(基于1升蒸馏水)、20g琼脂
*微量元素溶液
Na2B4O7·10H2O 0.09g,(NH4)6Mo7O27·4H2O 0.04g,ZnSO4·7H2O 0.01g,CuSO4·5H2O 0.27g,MnCl2·4H2O 0.01g,FeCl3·6H2O 1g,CaCl2 0.01g(基于1升蒸馏水)
对于最小抑菌浓度实验,在基本固体培养基中加入1g/L的L-组氨酸,并且在48小时后观察细胞生长情况,结果见下表2:
表2
导入外源L-组氨酸输出基因候选物的棒状杆菌属菌株在含L-组氨酸的基本培养基中的生长程度
(在表2中,+的数量表示菌株的相对生长程度,各个表示如下:
+:未形成单个菌落,但形成了浑浊(不是作为单个菌落生长而是聚集生长的类型);
++:形成浑浊并且形成小于5个单个菌落;
+++:形成浑浊并且形成小于50个单个菌落;
++++:形成浑浊并且无法区分单个菌落)
如表2所示,除ATCC13032ΔN2131::Dva菌株外的所有菌株在不含L-组氨酸的基本培养基中生长顺利。然而,在包含1g/L的L-组氨酸的基本培养基中,其中导入了L-组氨酸输出基因候选物的大部分菌株的生长是不显著的,并且只有导入阴道皮杆菌来源的基因的ATCC13032ΔN2131::Dva菌株显示出优于ATCC13032ΔN2131的生长。这表明导入的阴道皮杆菌来源的蛋白质即使在包含高于最低抑菌浓度的L-组氨酸的培养基中,也可以具有L-组氨酸输出能力。
由此,选择阴道皮杆菌来源的蛋白质Dva作为赋予高于最低抑菌浓度的L-组氨酸抗性并且具有L-组氨酸特异性输出能力的蛋白质。
实施例4.基于棒状杆菌来源的L-组氨酸生产菌株KCCM80179导入阴道皮杆菌来源基因的菌株的构建及L-组氨酸生产能力的评价
为了确认阴道皮杆菌来源的蛋白质Dva的L-组氨酸输出能力,将阴道皮杆菌来源的基因dva导入L-组氨酸生产菌株KCCM 80179(韩国专利申请第10-2019-004693414-682号)。
为此,将实施例2中构建的载体pDZΔN2131和pDZΔN2131-PgapA-Dva通过电穿孔法转化,并且通过二次杂交方法来构建其中染色体上NCgl2131基因缺失或被L-组氨酸输出基因候选物(dva)替代的2种菌株,分别命名为KCCM 80179ΔN2131(NCgl2131基因缺失)和KCCM 80179ΔN2131-PgapA-Dva(NCgl2131基因被dva替代)。
为了确认构建的KCCM 80179ΔN2131和KCCM 80179ΔN2131-PgapA-Dva菌株的L-组氨酸生产能力,通过以下方法培养菌株:将KCCM 80179ΔN2131和KCCM 80179ΔN2131-PgapA-Dva菌株在活化培养基中培养16小时,然后将每个菌株接种到含有25ml种子培养基的250ml角挡板烧瓶中,并以200rpm振荡培养。然后,将1ml的种子培养液接种到含有25ml生产培养基的250ml角挡板烧瓶中,在30℃下以200rpm振荡培养48小时。用于培养的培养基组成如下:
<活化培养基>
肉汁1%(w/v)、聚蛋白胨1%(w/v)、氯化钠0.5%(w/v)、酵母提取物1%(w/v)、琼脂2%(w/v)、pH 7.2
<种子培养基>
葡萄糖5%(w/v)、细菌蛋白胨1%(w/v)、氯化钠0.25%(w/v)、酵母提取物1%(w/v)、尿素0.4%(w/v)、pH 7.2
<生产培养基>
葡萄糖10%(w/v)、硫酸铵2%(w/v)、磷酸二氢钾0.1%(w/v)、七水硫酸镁0.05%(w/v)、CSL(玉米浆)2.0%(w/v)、生物素200μg/L、碳酸钙、pH 7.2
培养完成后,通过HPLC测定L-组氨酸产量(培养基中组氨酸含量),结果见下表3:
表3
导入KCCM 80179来源的阴道皮杆菌来源基因的菌株的L-组氨酸产量
如表3所示,确认NCg12131-缺失菌株具有与亲本菌株KCCM 80179菌株同等水平的L-组氨酸生产能力,而与NCgl2131-缺失菌株和亲本菌株KCCM 80179菌株相比,其中导入阴道皮杆菌来源的基因的KCCM 80179ΔN2131-PgapA-Dva菌株的L-组氨酸生产能力分别提高了23%和21%。通过实施例3和实施例4的结果,确定了通过导入阴道皮杆菌来源的基因,不仅提高了对浓度高于最低抑菌浓度的L-组氨酸的抵抗力,而且大大提高了L-组氨酸生产能力。该结果证明阴道皮杆菌来源的蛋白是能够特异性输出L-组氨酸的L-组氨酸输出蛋白。
实施例5.阴道皮杆菌来源的L-组氨酸输出蛋白样蛋白质的附加保护
由于阴道皮杆菌来源的蛋白质的L-组氨酸输出能力在实施例3和实施例4中得到确认,为了额外确保与该蛋白具有高氨基酸序列同源性的相似蛋白,使用DvaFE中DvaF的序列(SEQ ID NO:12)作为查询,进行BLAST搜索(见表4)。
表4
作为BLAST搜索的结果,另外选择了显示至少60%序列同源性并且不属于皮杆菌属的2种L-组氨酸输出蛋白,如下表5所示:
表5L-组氨酸输出蛋白附加候选物清单
实施例6.导入附加外源L-组氨酸输出基因候选物的载体的构建
构建了两种载体,用于将实施例5中附加地选择的2种L-组氨酸输出基因候选物导入棒状杆菌属菌株中。与实施例2相同,NCgl2131基因用作缺失位点,并且PgapA用作启动子。
编码马赛创伤杆菌来源的蛋白质(下文中,HmaFE、SEQ ID NO:41、42)的操纵子(下文中,hma,SEQ ID NO:43)的碱基序列信息从美国国立卫生研究院GenBank(NIH GenBank)获得。为了获得haq DNA,使用Bionics公司(社)的基因合成服务合成DNA。为了扩增合成的DNA,使用SEQ ID NO:47和SEQ ID NO:48的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含1081bp的hma(SEQ ID NO:43)的1113bp的hma片段。为了获得与hma可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:24和SEQ ID NO:49的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。将获得的hma片段和PgapA片段,以及用ScaI限制性酶切割的pDZΔN2131载体用Gibson组装法进行克隆,得到重组质粒,命名为pDZΔN2131-PgapA-Hma。
编码脓肿分枝杆菌脓肿亚种来源的蛋白质(下文中,MabFE,SEQ ID NO:44、45)的操作子(下文中,mab,SEQ ID NO:46)的碱基序列信息从美国国立卫生研究院GenBank(NIHGenBank)获得。为了获得mab DNA,使用Bionics公司(社)的基因合成服务合成DNA。为了扩增合成的DNA,使用SEQ ID NO:50和SEQ ID NO:51的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含1081bp的mab(SEQ ID NO:46)的1113bp的mab片段。为了获得与mab可连接的PgapA片段,使用ATCC13032的染色体为模板,使用SEQ ID NO:24和SEQ ID NO:52的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含409bp的PgapA(SEQ ID NO:15)的441bp的PgapA片段。将获得的mab片段和PgapA片段,以及用ScaI限制性酶切割的pDZΔN2131载体用Gibson组装法进行克隆,得到重组质粒,命名为pDZΔN2131-PgapA-Mab。
实施例7.基于生产L-组氨酸菌株KCCM 80179导入马赛创伤杆菌来源、脓肿分枝杆菌脓肿亚种来源的基因的菌株的构建及L-组氨酸生产能力的评价
为了确认马赛创伤杆菌来源的蛋白质Hma和脓肿分枝杆菌脓肿亚种来源的蛋白质Mab是否具有L-组氨酸输出能力,将hma和mab分别导入到生产L-组氨酸菌株KCCM 80179菌株中。
为此,将实施例6中构建的载体pDZΔN2131-PgapA-Hma和pDZΔN2131-PgapA-Mab通过电穿孔转化,并且通过二次杂交方法,来构建其中染色体上NCgl2131基因被L-组氨酸输出基因候选物替代的2种菌株,分别命名为KCCM 80179ΔN2131-PgapA-Hma(NCgl2131基因被hma替代)和KCCM 80179ΔN2131-PgapA-Mab(NCgl2131基因被mab替代)。
为了确认构建的KCCM 80179ΔN2131-PgapA-Hma和KCCM 80179ΔN2131-PgapA-Mab菌株的L-组氨酸生产能力,通过实施例4中进行的方法进行菌株培养,并且测量L-组氨酸产量。以实施例4中构建的KCCM 80179ΔN2131菌株和KCCM 80179ΔN2131-PgapA-Dva菌株作为对照组,通过相同的方法进行培养和L-组氨酸产量(培养基中组氨酸含量)的测量。获得的结果在表6中显示。
表6
导入KCCM 80179来源的马赛创伤杆菌来源的基因或脓肿分枝杆菌脓肿亚种来源的基因的菌株的L-组氨酸产量
如表6所示,与亲本菌株KCCM 80179菌株相比,在KCCM 80179ΔN2131-PgapA-Hma菌株和KCCM 80179ΔN2131-PgapA-Mab菌株中,L-组氨酸产量分别增加了18%和15.8%。这种结果表明,马赛创伤杆菌来源的蛋白质和脓肿分枝杆菌脓肿亚种来源的蛋白质也可以选择作为L-组氨酸输出蛋白。
实施例8.基于L-组氨酸生产菌株CA14-737导入阴道皮杆菌来源、马赛创伤杆菌来源、脓肿分枝杆菌脓肿亚种来源的菌株的构建和L-组氨酸生产能力的评价
为了再次确认阴道皮杆菌来源的蛋白Dva、马赛创伤杆菌来源的蛋白Hma和脓肿分枝杆菌脓肿亚种来源的蛋白Mab的L-组氨酸输出能力,将它们分别导入来源于野生型谷氨酸棒状杆菌的L-组氨酸生产菌株CA14-737(韩国专利申请第10-2019-004693414-682号),其中导入解决了L-组氨酸反馈限制的HisG多肽突变,并且增强了L-组氨酸生物合成基因。
为此,将实施例2和实施例6中构建的4种载体(pDZΔN2131、pDZΔN2131-PgapA-Dva、pDZΔN2131-PgapA-Hma、pDZΔN2131-PgapA-Mab)分别通过电穿孔转化到CA14-737菌株,并且通过二次杂交方法,来构建其中染色体上NCgl2131基因缺失或被L-组氨酸输出基因候选物替代的4种菌株,分别命名为CA14-737ΔN2131、CA14-737ΔN2131-PgapA-Dva、CA14-737ΔN2131-PgapA-Hma和CA14-737ΔN2131-PgapA-Mab。
为了确认构建的CA14-737ΔN2131、CA14-737ΔN2131-PgapA-Dva、CA14-737ΔN2131-PgapA-Hma、CA14-737ΔN2131-PgapA-Mab菌株的L-组氨酸生产能力,菌株通过实施例4中进行的方法进行培养,并且测定L-组氨酸产量(培养基中组氨酸含量),结果见表7:
表7
导入CA14-737来源的阴道皮杆菌来源的基因、马赛创伤杆菌来源的基因、脓肿分枝杆菌脓肿亚种来源的基因的菌株的L-组氨酸产量
如表7所示,与亲本菌株CA14-737株相比,其中导入了阴道皮杆菌来源的基因的CA14-737ΔN2131-PgapA-Dva菌株的L-组氨酸产量增加了62.5%,并且其中导入了马赛创伤杆菌来源的基因的CA14-737ΔN2131-PgapA-Hma菌株的L-组氨酸产量增加了47.5%,并且其中导入了脓肿分枝杆菌脓肿亚种来源的基因的CA14-737ΔN2131-PgapA-Mab菌株的L-组氨酸产量增加了52.5%。由此,再次确认了所有的阴道皮杆菌来源的蛋白质、马赛创伤杆菌来源的蛋白质和脓肿分枝杆菌脓肿亚种来源的蛋白质是能够特异性输出L-组氨酸的L-组氨酸输出蛋白。在构建的重组菌株中,CA14-737ΔN2131-PgapA-Dva菌株(谷氨酸棒状杆菌CA14-0875)在2020年9月21日国际保藏在布达佩斯条约下的国际保藏机构韩国微生物保藏中心(KCCM),位于韩国首尔西大门区,保藏号为KCCM12793P。
实施例9.表达阴道皮杆菌来源、马赛创伤杆菌来源、脓肿分枝杆菌脓肿亚种来源的蛋白的大肠杆菌(E.coli)载体的构建
确认了所选择的L-组氨酸输出蛋白在各种菌株中是否表现出L-组氨酸生产能力。为此,构建了能够在大肠杆菌中分别表达阴道皮杆菌来源、马赛创伤杆菌来源、脓肿分枝杆菌脓肿亚种来源的蛋白质的载体。将各基因克隆到大肠杆菌表达载体pCC1BAC(下文中,pBAC、Epicenter公司)中,并且在大肠杆菌菌株MG1655(下文中,PyccA、SEQ ID NO:53)的yccA启动子下进行表达。
为了扩增阴道皮杆菌来源的dva,使用阴道皮杆菌菌株的染色体DNA为模板,使用SEQ ID NO:54和SEQ ID NO:55的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含1081bp的dva(SEQ ID NO:10)的1113bp的dva片段。为了获得与dva可连接的PyccA片段,使用MG1655的染色体为模板,使用SEQ ID NO:56和SEQ ID NO:57的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含100bp的PyccA(SEQ ID NO:53)的132bp的PyccA片段。将获得的dva片段和PyccA片段,以及用EcoRI限制性酶切割的pBAC载体用Gibson组装法进行克隆,来获得重组质粒,命名为pBAC-PyccA-Dva。
为了扩增马赛创伤杆菌来源的hma,使用实施例6中构建的pDZΔN2131-PgapA-Hm载体DNA为模板,使用SEQ ID NO:58和SEQ ID NO:59的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含1081bp的hma(SEQ ID NO:43)的1113bp的hma片段。为了获得与hma可连接的PyccA片段,使用MG1655的染色体为模板,使用SEQ ID NO:56和SEQ ID NO:60引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含100bp的PyccA(SEQ ID NO:53)的132bp的PyccA片段。将获得的hma片段和PyccA片段,以及用EcoRI限制性酶切割的pBAC载体用Gibson组装法进行克隆,来获得重组质粒,命名为pBAC-PyccA-Hma。
为了扩增脓肿分枝杆菌脓肿亚种来源的mab,使用实施例6中构建的pDZΔN2131-PgapA-Mab载体DNA为模板,使用SEQ ID NO:61和SEQ ID NO:62的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合2分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含1081bp的mab(SEQ ID NO:43)的1113bp的mab片段。为了获得与mab可连接的PyccA片段,使用MG1655的染色体为模板,使用SEQ ID NO:56和SEQ ID NO:63的引物对进行PCR。作为PCR反应的聚合酶,使用PfuUltraTM高可靠性DNA聚合酶(Stratagene),PCR条件如下:在95℃下变性30秒;在55℃下退火30秒;以及在72℃下聚合1分钟,循环28次,然后在72℃下进行聚合5分钟。结果,获得了包含100bp的PyccA(SEQ ID NO:53)的132bp的PyccA片段。将获得的mab片段和PyccA片段,以及用EcoRI限制性酶切割的pBAC载体使用Gibson组装法进行克隆,来获得重组质粒,命名为pBAC-PyccA-Mab。
实施例10.基于大肠杆菌来源的L-组氨酸生产菌株导入阴道皮杆菌来源的基因的菌株的构建和L-组氨酸生产能力的评价
为了确认基于大肠杆菌来源的L-组氨酸生产菌株的3种新组氨酸输出蛋白(Dva、Hma、Mab)的L-组氨酸输出能力,将3种构建的载体导入CA14 -9003e菌株,该菌株具有先前报道的基因型(purR缺失、hisL缺失、hisGr;大肠杆菌MG1655的定向修饰来获得组氨酸产生突变体;Applied Biochemistry and Microbiology,2013,Vol.49,No.2,pp.130-135)(MG1655+hisGr hisL'_ΔΔpurR)。为此,分别导入在实施例9中构建的3种载体(pBAC-PyccA-Dva、pBAC-PyccA-Hma、pBAC-PyccA-Mab)和pBAC载体,从而构建CA14-9003e/pBAC、CA14-9003e/pBAC-PyccA-Dva、CA14-9003e/pBAC-PyccA-Hma和CA14-9003e/pBAC-PyccA-Mab菌株。
为了确认构建的CA14-9003e/pBAC、CA14-9003e/pBAC-PyccA-Dva、CA14-9003e/pBAC-PyccA-Hma、CA14-9003e/pBAC-PyccA-Mab菌株的L-组氨酸生产能力,通过以下方法培养所述菌株。将菌株在LB固体培养基(包含25μg/ml氯霉素)中培养16小时,然后将各菌株接种于含有25ml的LB液体培养基的250ml角挡板烧瓶中,并且在37℃下以200rpm振荡培养20小时。然后,将1ml的种子培养液接种到含有25ml大肠杆菌生产培养基的250ml角挡板烧瓶中(Applied Biochemistry and Microbiology,2013,Vol.49,No.2,pp.130-135),并且在37℃下以200rpm振荡培养48小时。用于培养的培养基如下:
<大肠杆菌生产培养基>
葡萄糖4%(w/v)、酵母提取物0.2%(w/v)、硫酸铵1.6%(w/v)、磷酸氢二钾三水合物0.06%(w/v)、硫酸铁七水合物0.0005%(w/v)、五水硫酸镁0.0005%(w/v)、碳酸钙、pH7.2
培养完成后,通过HPLC测量L-组氨酸产量(培养基中的组氨酸含量),结果示于下表8中。
表8
导入CA14-9003e来源的阴道皮杆菌来源的基因、马赛创伤杆菌来源的基因、脓肿分枝杆菌脓肿亚种来源的基因的菌株的L-组氨酸产量
如表8所示,导入阴道皮杆菌来源的基因的CA14-9003e/pBAC-PgapA-Dva菌株的L-组氨酸产量增加了62.5%,导入马赛创伤杆菌来源的基因的CA14-9003e/pBAC-PgapA-Hma菌株的L-组氨酸产量增加了21.9%,以及导入脓肿分枝杆菌脓肿亚种来源的基因的CA14-9003e/pBAC-PgapA-Mab菌株的L-组氨酸产量增加了18.8%。由此,证实了所有阴道皮杆菌来源的蛋白质、马赛创伤杆菌来源的蛋白质和脓肿分枝杆菌脓肿亚种来源的蛋白质在大肠杆菌L-组氨酸生产菌株中作为对L-组氨酸特异性的输出蛋白质起作用。
通过上述结果,确定当与阴道皮杆菌来源的蛋白质具有至少60%同源性的蛋白质被导入微生物时,其作为特异性地将L-组氨酸输出到细胞外的输出蛋白起作用。
上述,在本说明书中公开的各个说明及实施方式也可以适用于彼此的说明及实施方式。本说明书中公开的各种要素的所有可能组合都在本说明书中提出的发明范围内。此外,不能认为本说明书中的发明范围受以下具体描述的限制,只要本领域技术人员能够认识到或识别出与本说明书中所描述的具体实施方式的许多等同物,这些等同物旨在包括于本说明书中提出的发明中。
[保藏号]
保藏单位名称:韩国微生物保藏中心
保藏号:KCCM12793P
保藏日期:2020年09月21日(中文译文)
国际承认用于专利程序的微生物保藏的布达佩斯条约
国际表格
至:CJ第一制糖株式会社
韩国首尔市中区东湖路330号
CJ第一制糖中心
(邮编)100-400
上述翻译文本与原文没有相违之处
<110> CJ第一制糖株式会社(CJ CheilJedang Corporation)
<120> L-组氨酸输出蛋白和使用其生产L-组氨酸的方法
<130> OPP20215089KR
<150> KR 10-2020-0183702
<151> 2020-12-24
<160> 69
<170> koPatentIn 3.0
<210> 1
<211> 314
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Haq蛋白质
<400> 1
Met Lys Ser Lys Asn Ala Thr Leu Val Gly Leu Ser Ala Val Val Leu
1 5 10 15
Trp Ser Ala Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Ala Ile Tyr Thr Val Ala Ser Leu Ile Leu
35 40 45
Leu Val Ser Val Gly Phe Pro Arg Leu Ala Ser Phe Pro Arg Arg Tyr
50 55 60
Leu Leu Trp Gly Ser Val Leu Phe Val Ala Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ser Ile Gly Tyr Ala His Thr Gly Arg Gln Ala Ile Glu Val Gly
85 90 95
Met Val Asn Tyr Leu Trp Pro Thr Phe Thr Leu Val Ala Ala Ile Leu
100 105 110
Phe Gly Gly Gln Arg Ala Thr Leu Leu Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Met Leu Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Pro Ser Gly Met Leu Ala Asn Ile Arg Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Ile Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Thr Arg Ile Ala Gln Gly Gln Asn Gly Val Thr Pro Phe Phe Met Leu
180 185 190
Val Ala Leu Ala Leu Trp Val Lys Val Leu Leu Gly Gly His Val Ala
195 200 205
Glu Leu Ser Phe Ser Val Pro Ala Leu Val Tyr Leu Val Leu Ala Ala
210 215 220
Ala Ala Met Gly Leu Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His
225 230 235 240
Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Phe
245 250 255
Ser Ser Ala Leu Ser Ala Leu Leu Leu Arg Ala Pro Leu Pro Thr Ser
260 265 270
Phe Trp Val Gly Ala Ala Leu Val Cys Ala Gly Ser Ile Leu Cys Trp
275 280 285
Arg Ala Thr Arg Ser Leu Asp Leu Ser Lys Glu Pro Ala Ala Arg Ala
290 295 300
Ala Arg Pro Glu Gly Pro Pro Gln Asn Gln
305 310
<210> 2
<211> 945
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> haq基因
<400> 2
atgaagagca agaacgcaac cctggtcgga ttgagcgcgg tggtactgtg gagtgccatc 60
gtgggcctga tccgtggcgt gagcgagcat ctcggagcca ccggcggggc ggcggccatt 120
tacacggtgg cttcgctgat cctgctggtg tcggtgggat tcccgcgcct ggcgagtttc 180
ccgcgcaggt atctgctatg gggcagcgtg ctgttcgtgg cttatgaatt gtgcctgtcg 240
ctctcgatcg gttatgccca taccggccgc caggccatcg aagtcggcat ggtcaattac 300
ctctggccga ccttcaccct ggtggcggcc atcctcttcg gaggccagcg cgccacgctg 360
ctggtggtgc caggcttcat cctttccatg ctgggcatct gctgggtgct cgggggcgac 420
caggggctgg atccttccgg catgctggcc aatatccgtg acaatccgct gagctacggc 480
ctggccttca tcggggcctt gatctgggcg gcctactgca ccgtgactac ccgcatcgcc 540
caaggccaga acggggtgac gcctttcttc atgctggtgg cattggcatt gtgggtgaag 600
gtgctgctgg gcgggcatgt ggctgaacta tccttcagtg tgcccgcact ggtctacctg 660
gtgctggctg cggcggcgat ggggctgggc tatgcggcct ggaacgtggg catcctgcat 720
ggcaatgtga cagtgctggc cggtgcctcg tatttcatcc cggtcttttc ttcggccttg 780
tcggccttgc tgctacgtgc gccgctgccc acctcgttct gggtgggcgc tgcgctggtg 840
tgcgccgggt cgatcctgtg ctggcgggct acccgcagcc tggatttgtc aaaagaacct 900
gcagcgcggg cggcacgtcc cgaaggccca cctcagaacc aatag 945
<210> 3
<211> 312
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cpi蛋白质
<400> 3
Met Gln Ser Thr Arg Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Leu
1 5 10 15
Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Ser Leu
20 25 30
Gly Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Val Leu
35 40 45
Leu Met Leu Thr Val Gly Phe Val Arg Leu Arg Glu Phe Pro Arg Arg
50 55 60
Tyr Leu Val Trp Gly Ser Ile Leu Phe Val Ser Tyr Glu Leu Cys Leu
65 70 75 80
Ser Leu Ser Ile Gly Tyr Ser His Ser Gly Arg Gln Ala Ile Glu Val
85 90 95
Gly Met Val Asn Tyr Leu Trp Pro Ser Phe Thr Met Leu Cys Ala Ile
100 105 110
Ala Phe Asn Lys Gln Lys Ala Asn Val Leu Ile Val Pro Gly Phe Leu
115 120 125
Ile Ala Ile Leu Gly Ile Cys Leu Val Leu Gly Gly Glu Gln Gly Leu
130 135 140
Asp Val Ala Gly Met Val Ala Asn Val Arg Asp Asn Pro Leu Ser Tyr
145 150 155 160
Gly Leu Ala Leu Ala Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val
165 170 175
Thr Asn Arg Ile Ala Gly Gly Asn Asn Gly Val Thr Leu Phe Phe Met
180 185 190
Leu Thr Ala Met Ala Leu Trp Ile Lys Tyr Phe Thr Gly Asp His Ala
195 200 205
Pro Met Ala Phe Thr Tyr His Ala Val Ile Tyr Leu Ala Leu Ala Ala
210 215 220
Ser Ala Met Gly Phe Gly Tyr Pro Ala Trp Asn Val Gly Ile Leu His
225 230 235 240
Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Ile
245 250 255
Ser Ala Ala Leu Ala Gly Leu Leu Leu His Ile Pro Leu Ser Leu Ala
260 265 270
Phe Trp Lys Gly Ala Ser Leu Val Cys Ala Gly Ser Val Leu Cys Trp
275 280 285
Leu Ala Thr Arg Ala Arg Lys Val Ala Ala Thr Pro Asp Arg Ala Pro
290 295 300
Val Arg Asp Arg Val Trp Lys Gln
305 310
<210> 4
<211> 939
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> cpi基因
<400> 4
atgcaaagca cgcgtaaggc cacgttgatc gggctcattg cgatcctgtt gtggagttcc 60
atcgtcggcc tgatccgcgg cgtcagtgaa agcctcggcg cgaccggtgg cgccgccatg 120
atgtactcgg ttgcctccgt cctgcttatg ctgacggttg gcttcgtgcg tctgcgcgaa 180
tttccgcggc gctatctggt ctggggcagc atcctgttcg tctcctacga actgtgcctg 240
tcgctgtcca tcggctattc gcacagcggc aggcaggcga tcgaggtggg gatggtcaat 300
tacctctggc cgtctttcac catgttgtgc gccatcgcct tcaacaagca gaaggcgaac 360
gttctgatcg tgccgggctt cctgattgcg atcctgggta tctgcctggt gctgggcggc 420
gagcagggtc tggatgttgc aggcatggtg gccaatgtca gggacaatcc gctcagctac 480
ggcctcgctt tagcgggcgc gctgatctgg gcggcctatt gcaccgtgac caacaggatt 540
gccggcggca acaacggcgt cacgctgttt ttcatgctca ccgcaatggc gctgtggatc 600
aagtacttca ccggcgacca tgcgccgatg gctttcacat accacgccgt catctacctg 660
gcactggcag cgtcggcgat gggcttcggc tacccggcgt ggaacgtggg catcctgcac 720
ggcaacgtaa cggtgcttgc cggcgcgtcg tatttcatcc ctgtgatttc agccgcactg 780
gctggcttgc tcttgcatat accgctttcg ctggcgttct ggaaaggcgc gtcgctggta 840
tgcgcggggt ccgtgctgtg ctggttggcg acgcgcgcgc gcaaggtggc tgcaacgccc 900
gaccgtgctc cggtccgcga ccgtgtctgg aagcaatga 939
<210> 5
<211> 293
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Kcr蛋白质
<400> 5
Met Asp Lys Lys Arg Ala Thr Leu Ile Gly Phe Ser Ala Ile Ile Leu
1 5 10 15
Trp Ser Thr Met Val Gly Leu Ile Arg Gly Val Ser Glu Gly Leu Gly
20 25 30
Pro Val Gly Gly Ala Ala Met Ile Tyr Ser Leu Ser Gly Leu Leu Leu
35 40 45
Ile Phe Thr Val Gly Phe Pro Gln Leu Arg Gln Ile Pro Pro Arg Tyr
50 55 60
Leu Leu Val Gly Ser Leu Phe Phe Val Ser Tyr Glu Met Cys Leu Ala
65 70 75 80
Leu Ser Leu Gly Tyr Ala Gly Thr Arg Gln Gln Ala Ile Glu Val Gly
85 90 95
Met Val Asn Tyr Leu Trp Pro Ser Leu Thr Ile Leu Phe Ala Ile Ile
100 105 110
Phe Asn Gly Gln Lys Thr Thr Trp Leu Val Ile Pro Gly Leu Leu Leu
115 120 125
Ser Ile Val Gly Val Thr Trp Val Leu Gly Gly Glu His Gly Leu Asp
130 135 140
Leu Ala Glu Ile Arg Ser Asn Val Ile Ser Ser Pro Leu Ser Tyr Ile
145 150 155 160
Leu Ala Phe Val Gly Ala Phe Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Lys Tyr Ala Lys Gly Lys Asn Gly Ile Thr Leu Phe Val Leu Phe
180 185 190
Thr Ala Leu Ala Leu Trp Val Lys Phe Leu Met Ser Glu Gln Pro Pro
195 200 205
Met Ile Phe Ser Trp Pro Val Val Ile Lys Leu Val Thr Cys Ala Leu
210 215 220
Ala Leu Gly Phe Ala Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Ser Leu Leu Ala Ala Ala Ser Tyr Phe Thr Pro Val Leu Ser
245 250 255
Ser Ala Leu Ala Ala Phe Leu Leu Ser Ala Ala Leu Ser Trp Ser Phe
260 265 270
Trp Gln Gly Ala Ala Met Val Cys Gly Gly Ser Leu Leu Cys Trp Tyr
275 280 285
Ala Thr Arg Arg Pro
290
<210> 6
<211> 371
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> kcr基因
<400> 6
atggataaga aaagagcgac gctcattgga tttagcgcca ttattttgtg gagtacgatg 60
gtgggtctga ttcgcggcgt aagcgaaggg ctcggcccgg tgggcggagc cgcaatgatt 120
tacagcctca gcggcctgct gctgattttt accgttggct tcccacaatt gcgccaaatt 180
ccaccgcgct atttgctggt aggtagcctg ttttttgtca gctacgaaat gtgcctcgcg 240
ctctcattag gctatgccgg cactcgccaa caggccatcg aagtcggcat ggtgaattat 300
ctctggccta gcctgacgat tttatttgcg attatcttta atggtcaaaa aaccacctgg 360
ctggttatcc c 371
<210> 7
<211> 238
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cst蛋白质
<400> 7
Met Ser Thr Leu Ser Ile Leu Ile Ala Gly Phe Ala Leu Gly Leu Ser
1 5 10 15
Leu Ile Val Ala Ile Gly Pro Gln Asn Ala Leu Leu Ile Lys Gln Gly
20 25 30
Ile Lys Arg Glu His Val Trp Val Val Ile Ala Ile Cys Ala Val Ser
35 40 45
Asp Ile Ile Leu Ile Ser Gly Gly Thr Ala Gly Val Gly Tyr Leu Val
50 55 60
Glu Thr Phe Pro Thr Ala Leu Val Val Leu Lys Tyr Leu Gly Ala Ile
65 70 75 80
Tyr Leu Ala Tyr Phe Thr Tyr Leu Cys Phe Arg Asp Ala Leu Arg Asp
85 90 95
Lys Val Glu Thr Leu Ser Pro Ala Gln Ile Glu Pro Asn Lys Thr Gln
100 105 110
Gln Ile Asp Ala Phe Asp Gly Gly Asp Leu Gly Gly Ser Ser Val Asp
115 120 125
Thr Arg Arg Arg Thr Thr Arg Leu Arg Gln Gln Val Arg Gln Ser Thr
130 135 140
Trp Val Lys Pro Ala Leu Ala Thr Leu Ala Ile Cys Trp Leu Asn Pro
145 150 155 160
Ala Ala Tyr Val Asp Val Leu Val Met Ile Gly Gly Leu Ala Asn Gln
165 170 175
Tyr Gly Glu Thr Gly Arg Trp Phe Phe Ala Ala Gly Ala Ile Ala Ala
180 185 190
Ser Met Leu Trp Phe Pro Ser Val Gly Leu Ala Ala Ala Lys Phe Ser
195 200 205
His Val Leu Ser Arg Pro Ala Val Trp Arg Gly Ile Asn Phe Gly Ile
210 215 220
Gly Cys Ile Met Ala Leu Leu Thr Ile Lys Leu Leu Leu Thr
225 230 235
<210> 8
<211> 717
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> cst基因
<400> 8
atgtcaacgc tgtctatcct catcgccggt ttcgcactag ggctctcact tatcgtagcg 60
attggcccgc aaaatgctct gctgatcaaa cagggcatta aacgcgagca cgtgtgggta 120
gtcattgcga tttgcgcggt gtccgacatt attttgatta gcggtggcac cgcgggggtg 180
ggctatctgg tggagacttt cccgaccgca ctggtggtgc tgaagtatct gggcgcgatt 240
tatctggctt actttactta tctgtgcttt cgcgatgcgt tgcgcgacaa ggttgaaact 300
ctctcccctg cgcagatcga gccgaataag acgcagcaga tcgatgcatt cgatggcggc 360
gacttgggcg gttcttctgt tgatacccgg cggcgcacca cgcgtctgcg ccagcaagta 420
cgccaatcga cctgggtgaa gccagctctt gcgaccttgg cgatttgctg gctgaacccg 480
gcagcttatg tcgatgtgct ggtaatgatt ggcggacttg ccaaccaata cggcgaaacc 540
ggccgatggt tttttgctgc cggtgccatt gcagcgagca tgctgtggtt tcccagcgtt 600
ggtcttgctg ccgcgaagtt ctcgcacgta ctttcgcgcc ctgcggtatg gcgcggcatc 660
aacttcggca ttggctgcat catggcgctg ctgaccatta agctgctgtt gacctag 717
<210> 9
<211> 242
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> LsaF蛋白质
<400> 9
Met Ser Pro Ser His Asp Pro Leu Pro Arg Arg Ala Gly Ala Ala Ala
1 5 10 15
Gly Leu Arg Asp Ser Leu Gly Val Gly Leu Gly Ile Phe Pro Leu Gly
20 25 30
Ile Ala Leu Gly Ile Leu Val Ile Gln Ala Gly Leu Pro Trp Trp Leu
35 40 45
Ala Pro Ala Leu Ser Ile Gly Ile Phe Ala Gly Ser Val Glu Leu Leu
50 55 60
Leu Val Ser Met Leu Ala Ala Ala Thr Pro Leu Val Thr Ile Ala Ala
65 70 75 80
Thr Val Phe Ala Val Asn Phe Arg His Val Phe Tyr Ala Phe Ser Phe
85 90 95
Pro Leu Ser Arg Val Arg Pro Gly Leu Pro Arg Ala Tyr Ser Ile Tyr
100 105 110
Ala Met Ile Asp Glu Ala Tyr Ala Thr Tyr Val Leu Met Asp Pro Asp
115 120 125
Arg Leu Ser Ser Ala Arg Met Val Thr Gly Gln Leu Ala Met Gln Leu
130 135 140
Tyr Trp Val Leu Gly Gly Phe Val Gly Ile Met Ile Ala Asn Val Leu
145 150 155 160
Pro Ala Pro Ile Glu Gly Phe Glu Phe Ala Leu Val Ala Leu Phe Val
165 170 175
Val Met Ser Met Asp Ala Ile Arg Gly Lys Arg Glu Leu Pro Ser Ala
180 185 190
Leu Leu Ala Cys Leu Ala Val Thr Val Ala Ile Leu Val Ala Gly Asp
195 200 205
Asn Ala Leu Leu Val Ala Leu Ala Leu Tyr Ser Gly Leu Leu Gly Leu
210 215 220
Arg Tyr Phe Leu Thr Lys Arg Thr Thr Asp Thr Ala Glu Glu Gly Glu
225 230 235 240
Arg Ala
<210> 10
<211> 140
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> LsaE蛋白质
<400> 10
Met Arg Cys Trp Ser Arg Leu Arg Cys Thr Pro Gly Tyr Trp Gly Cys
1 5 10 15
Ala Ile Ser Ser Pro Ser Glu Pro Arg Thr Leu Arg Arg Arg Ala Ser
20 25 30
Val Pro Ser Thr Glu Tyr Leu Ile Ala Gly Val Val Val Ala Gly Leu
35 40 45
Ile Thr Leu Ala Leu Arg Ala Leu Pro Phe Ala Ala Leu Lys Pro Leu
50 55 60
Arg Lys Ser Lys Leu Val Gln Ala Leu Gly Arg Trp Met Pro Ala Gly
65 70 75 80
Ile Leu Val Ile Leu Ala Val Val Val Leu Arg Asp Gln Leu Ile Ser
85 90 95
Gln Gln Gly Arg Val Trp Pro Val Leu Val Ala Thr Ala Ile Thr Ala
100 105 110
Leu Ala His Leu Leu Ser Lys Arg Arg Ala Leu Val Ser Ile Ala Ala
115 120 125
Gly Thr Ala Cys Tyr Val Leu Leu Leu Asn Phe Phe
130 135 140
<210> 11
<211> 1048
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> lsa基因
<400> 11
atgtctccgt cacacgatcc tttaccgcgc cgcgcgggcg ccgcggccgg ccttcgagat 60
tctctcgggg tcggcctcgg cattttcccc ttgggcattg ccctcggaat tcttgtcatt 120
caggcgggac ttccctggtg gctcgccccg gccctctcga ttggtatctt cgcgggatct 180
gtcgagctgc tcctggtcag catgctcgcc gccgcgactc cgctcgtgac gatcgccgcg 240
accgtgttcg ccgtgaactt tcggcacgta ttctacgcgt tctcgtttcc gctttcgcgg 300
gtgcgaccgg gtctaccccg ggcgtactcc atctacgcaa tgatcgacga ggcctacgcc 360
acctatgtgc tgatggatcc ggatcgcctg agctcagccc gcatggtaac cggccagctc 420
gcgatgcagc tctattgggt gctcggcggc ttcgtcggca tcatgattgc gaacgtgctc 480
cctgccccca ttgagggctt tgagtttgca ctcgtggcgc tcttcgtggt gatgtcgatg 540
gatgcgattc gcggcaagcg cgagctccca tcggccttgc tggcttgcct cgctgtcacg 600
gttgcaatac tggtcgctgg cgacaatgcg ctgctggtcg cgcttgcgct gtactccggg 660
ctactggggc tgcgctattt cctcaccaag cgaaccacgg acactgcgga ggagggcgag 720
cgtgcctagc accgaatatc taatcgcggg cgtcgtcgtc gcgggcctca tcaccctggc 780
gctgcgcgca ctcccgtttg cggcgctcaa accgctgcgc aaatctaagc tcgtgcaggc 840
gctcgggcgc tggatgcccg ctggcatcct cgttatcctc gccgtcgtcg tactgcgcga 900
tcagctcata tcgcagcagg gccgggtgtg gccggtgctc gtcgcgaccg cgatcacggc 960
cctcgctcac ttgctctcaa agcgacgcgc gctcgtgagc atcgcggctg gcaccgcctg 1020
ctacgtgctg ctgctcaact ttttctag 1048
<210> 12
<211> 251
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> DvaF蛋白质
<400> 12
Met Ser Val Glu Ala Gln Pro Gly Ala Asn Asp Arg Pro Tyr Ser Val
1 5 10 15
Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu
20 25 30
Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser
35 40 45
Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala
50 55 60
Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro
65 70 75 80
Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val
85 90 95
Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Thr Asn Pro Phe Leu
100 105 110
Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr
115 120 125
Val Ala Asn Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly
130 135 140
Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu
145 150 155 160
Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu
165 170 175
Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln
180 185 190
Glu Ile Pro Ser Leu Leu Leu Gly Ala Ala Ala Phe Gly Phe Ala Leu
195 200 205
Leu Leu Leu Pro Ser Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val
210 215 220
Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro
225 230 235 240
Leu Pro Ala Glu Met Glu Ser Asp Asp Ala Ala
245 250
<210> 13
<211> 111
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> DvaE蛋白质
<400> 13
Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile
1 5 10 15
Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu
20 25 30
Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met
35 40 45
Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr
50 55 60
Leu Ala Glu Glu Pro Gly Gly Leu Val His Leu Leu Ile Ala Ser Gly
65 70 75 80
Val Thr Ile Ala Val His Leu Phe Gly Gly Arg Arg Thr Leu Val Ser
85 90 95
Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe
100 105 110
<210> 14
<211> 1081
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> dvaFE基因
<400> 14
atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60
acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120
ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180
ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240
cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300
aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360
accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420
atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480
ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540
atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600
gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660
attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720
ctcccggcag agatggagag cgacgatgca gcttgacatc cccttctggt atctcgcctc 780
ggttctcctc atcgccttcg ccgtgacctt cacgctgcgc gcgctcccgt tcgcgattct 840
cgaaccactg cgcaaatcgc aattcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900
cctcgtgatc ctcgcgctcg cgacctttaa gagcaccctc gccgaggaac ccggtggtct 960
cgttcacctg ctgatcgcct caggagtcac gattgccgtg cacctcttcg gtggtcgccg 1020
caccctcgtg agcgtcgccg cgggcaccct cgccttcgtg ctgctcgtga actttttcta 1080
a 1081
<210> 15
<211> 409
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PgapA
<400> 15
tctgagactt taatttgtgg attcacgggg gtgtaatgta gttcataatt aaccccattc 60
gggggagcag atcgtagtgc gaacgatttc aggttcgttc cctgcaaaaa ctatttagcg 120
caagtgttgg aaatgccccc gtttggggtc aatgtccatt tttgaatgtg tctgtatgat 180
tttgcatctg ctgcgaaatc tttgtttccc cgctaaagtt gaggacaggt tgacacggag 240
ttgactcgac gaattatcca atgtgagtag gtttggtgcg tgagttggaa aaattcgcca 300
tactcgccct tgggttctgt cagctcaaga attcttgagt gaccgatgct ctgattgacc 360
taactgcttg acacattgca tttcctacaa tctttagagg agacacaac 409
<210> 16
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 16
gtacccgggg atcctctaga caaagccgaa gagaagttgg 40
<210> 17
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 17
gcatagagta ctcggcgccc ataaatttca 30
<210> 18
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 18
gcgccgagta ctctatgccg agaagttgaa 30
<210> 19
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 19
gcctgcaggt cgactctaga ctgggcatca cactattttt 40
<210> 20
<211> 531
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> del-N2131L
<400> 20
gtacccgggg atcctctaga caaagccgaa gagaagttgg cttgacggac ccgaaattcc 60
agctgatttt gacgatcctg atgcacccgg caggtggcct ggcgaaaagt tggggcttcc 120
tcaagaaggg gccggctctc tgtcctcagt ggctcgtcgt atcggcgggg tctgcgtgga 180
ctggggtgtt tcctgggtta ttgctattgt gctgtccaat ttcacggatg tgctgggcga 240
tgtagcgaca tccacgctca ttattttcgt gatcctgggt tggcttaccg gttggatctt 300
tgctcgcacc ccaggtcatg ccgtgtttgg catgggcctt gcgcgtgtgg atgcagagga 360
acgtgtgggc tggtggcgtg cgctggttcg cccactgctg acgatcttga ttctgcctgc 420
cgtgatggtg gatgctgacg gccgtgggct ccacgacaag gcaacgggaa ctgcagttat 480
ccgcgggtaa tttgtcttga gtgaaattta tgggcgccga gtactctatg c 531
<210> 21
<211> 555
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> del-N2131R
<400> 21
gcgccgagta ctctatgccg agaagttgaa cagcaatctt gcagcaactc ctcagtattc 60
acaccagccc caatggacac aaaaacatca gccccagaat cgcccctaag ggcctcaaat 120
acacgatctg gaccaactag tcatcgggaa aacccaaccc cttaaatcgc cttctgcgct 180
taaggggtca atgctagata agtaggaaca acaacgtttg ggcggccagg atctttgcga 240
tcatcgccag cggatacaca gaggtataac ccatggcagg gagctcgttg cgggaggcat 300
ctgacacata actcagcaca gcagggtggg tttgcgtacc ggcgaggatg ccagcggttt 360
caccgaaggg gattttcatc agtttgtggc caacgaacag caccgtgatg gagatgaaca 420
aagtgagcag cgcaccgaag ccgatgatgg tgagtgattg ggggtcgctg atcgctgatc 480
gaaatcctgc gcccgctgag gtaccgatgg cagccaaaaa tagtgtgatg cccagtctag 540
agtcgacctg caggc 555
<210> 22
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 22
aggagacaca acatgaagag caagaacgca 30
<210> 23
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 23
tcaacttctc ggcatagagt ctattggttc tgaggtgggc 40
<210> 24
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 24
gaaatttatg ggcgccgagt tctgagactt taatttgtgg 40
<210> 25
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 25
cttgctcttc atgttgtgtc tcctctaaag 30
<210> 26
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 26
aggagacaca acatgcaaag cacgcgtaag 30
<210> 27
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 27
tcaacttctc ggcatagagt tcattgcttc cagacacggt 40
<210> 28
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 28
cgtgctttgc atgttgtgtc tcctctaaag 30
<210> 29
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 29
aggagacaca acatggataa gaaaagagcg 30
<210> 30
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 30
tcaacttctc ggcatagagt ttagggacgg cgggtggcgt 40
<210> 31
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 31
tttcttatcc atgttgtgtc tcctctaaag 30
<210> 32
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 32
aggagacaca acatgtcaac gctgtctatc 30
<210> 33
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 33
tcaacttctc ggcatagagt ctaggtcaac agcagcttaa 40
<210> 34
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 34
cagcgttgac atgttgtgtc tcctctaaag 30
<210> 35
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 35
aggagacaca acatgtctcc gtcacacgat 30
<210> 36
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 36
tcaacttctc ggcatagagt ctagaaaaag ttgagcagca 40
<210> 37
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 37
tgacggagac atgttgtgtc tcctctaaag 30
<210> 38
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 38
aggagacaca acatgagcgt tgaggcgcag 30
<210> 39
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 39
tcaacttctc ggcatagagt ttagaaaaag ttcacgagca 40
<210> 40
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 40
ctcaacgctc atgttgtgtc tcctctaaag 30
<210> 41
<211> 251
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> HmaF蛋白质
<400> 41
Met Ser Val Ala Ala Gln Pro Ser Ala His Glu His Pro Tyr Ser Val
1 5 10 15
Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu
20 25 30
Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser
35 40 45
Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala
50 55 60
Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro
65 70 75 80
Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val
85 90 95
Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu
100 105 110
Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr
115 120 125
Val Ala His Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly
130 135 140
Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu
145 150 155 160
Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu
165 170 175
Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln
180 185 190
Glu Leu Pro Ser Leu Val Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu
195 200 205
Leu Leu Met Pro Gly Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val
210 215 220
Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro
225 230 235 240
Leu Pro Ala Glu Met Glu Gly Asp Asp Ala Ala
245 250
<210> 42
<211> 111
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> HmaE蛋白质
<400> 42
Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile
1 5 10 15
Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu
20 25 30
Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met
35 40 45
Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr
50 55 60
Leu Ala Glu Glu Pro Gly Ser Val Ile His Leu Leu Ile Ala Ser Ala
65 70 75 80
Val Thr Ile Ala Val His Leu Leu Phe Gly Arg Arg Thr Leu Val Ser
85 90 95
Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe
100 105 110
<210> 43
<211> 1081
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> hmaFE基因
<400> 43
atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60
acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120
tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180
ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240
ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300
aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360
accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420
atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480
ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540
atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600
gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660
atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720
ctaccggcgg aaatggaggg cgacgatgca gcttgacatc cccttctggt accttgcctc 780
ggttctcctc attgccttcg ccgtcacctt tacgctgcgc gcgctcccgt tcgcgatcct 840
cgaaccgctg cgcaaatccc agttcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900
cctcgtcatt ctcgcgctcg cgaccttcaa aagcaccctc gctgaggaac ccggcagcgt 960
cattcatttg ctcattgcct cggccgtcac gatcgctgtg catcttctct ttgggcgccg 1020
aaccctcgtg agtgtcgccg cgggtaccct cgccttcgtg ctcctcgtga acttcttcta 1080
a 1081
<210> 44
<211> 251
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MabF蛋白质
<400> 44
Met Ser Val Glu Ala Gln Pro Gly Ala His Glu Arg Pro Tyr Ser Val
1 5 10 15
Arg His Glu Ile Thr Gln Gly Ala Leu Leu Ile Leu Pro Ala Gly Leu
20 25 30
Gly Met Ile Pro Ile Gly Ile Ala Phe Gly Leu Leu Val Val Gln Ser
35 40 45
Gly Leu Pro Trp Trp Met Ala Pro Ala Leu Ser Phe Phe Ala Tyr Ala
50 55 60
Gly Ser Leu Glu Leu Leu Leu Ile Thr Leu Ile Thr Ser Leu Thr Pro
65 70 75 80
Leu Val Thr Ile Ala Ala Ala Ser Phe Phe Val Asn Phe Arg His Val
85 90 95
Phe Tyr Ala Phe Asn Phe Pro Leu Lys Val Val Lys Asn Pro Phe Leu
100 105 110
Lys Phe Tyr Ala Met Tyr Ser Leu Thr Asp Glu Ile Phe Ala Val Thr
115 120 125
Val Ala Asn Pro Lys Gly Trp Thr Gln Pro Arg Val Ile Ser Ala Gly
130 135 140
Ala Val Leu Gln Ile Cys Trp Val Gly Gly Gly Leu Met Gly Val Leu
145 150 155 160
Leu Ser Ser Phe Ile Pro Phe Gln Ile Arg Gly Leu Ser Phe Ala Leu
165 170 175
Cys Ala Leu Phe Ile Thr Leu Thr Leu Asp Ala Cys Arg Thr Lys Gln
180 185 190
Glu Ile Pro Ser Leu Leu Leu Gly Ala Ala Ala Phe Gly Leu Ala Leu
195 200 205
Leu Leu Leu Pro Ser Gln Pro Ile Phe Ala Ala Met Ile Gly Phe Val
210 215 220
Ala Thr Leu Ala Ala Arg Tyr Thr Ile Ala Val Arg Leu Thr Arg Pro
225 230 235 240
Leu Pro Ala Glu Met Glu Ser Asp Asp Ala Ala
245 250
<210> 45
<211> 111
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MabE蛋白质
<400> 45
Met Gln Leu Asp Ile Pro Phe Trp Tyr Leu Ala Ser Val Leu Leu Ile
1 5 10 15
Ala Phe Ala Val Thr Phe Thr Leu Arg Ala Leu Pro Phe Ala Ile Leu
20 25 30
Glu Pro Leu Arg Lys Ser Gln Phe Val Arg Val Met Ala Val Trp Met
35 40 45
Pro Ala Gly Ile Leu Val Ile Leu Ala Leu Ala Thr Phe Lys Ser Thr
50 55 60
Leu Ala Glu Glu Pro Gly Gly Leu Val His Leu Leu Ile Ala Ser Ala
65 70 75 80
Val Thr Ile Ala Val His Leu Phe Gly Gly Arg Arg Thr Leu Val Ser
85 90 95
Val Ala Ala Gly Thr Leu Ala Phe Val Leu Leu Val Asn Phe Phe
100 105 110
<210> 46
<211> 1081
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> mabFE基因
<400> 46
atgagcgttg aggcgcagcc tggcgcacac gagcgaccct actcggtgcg ccacgaaatc 60
acgcagggcg cgctcctgat tctccccgca ggtctcggca tgatcccgat cggtatcgcc 120
ttcggcctgc ttgtggtgca gtcggggctc ccgtggtgga tggcgcccgc cctctcgttt 180
ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacccca 240
ctggtgacga tcgcggcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttc 300
aactttccac tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtattcgctg 360
accgacgaaa tcttcgcggt cacggtcgcg aacccaaagg ggtggaccca gccgcgcgtg 420
atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480
ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540
atcacgctga ccctcgatgc gtgccgcaca aaacaggaga tcccgtcact tctcctcggc 600
gctgccgcct tcggcctcgc gcttcttttg ctcccgagcc agccgatctt cgcggcgatg 660
attggcttcg ttgcgaccct cgcggctcgc tacacgatcg ccgtacgcct cacgaggcca 720
ctcccggcag agatggagag cgacgatgca gcttgacatc cccttctggt acctcgcctc 780
ggttctcctc atcgccttcg ccgttacttt tacgctgcgc gcgctcccgt tcgcgatcct 840
cgaaccactg cgcaaatcgc aattcgtgcg cgtcatggcc gtgtggatgc ccgcgggcat 900
cctcgtcatt ctggcgctcg cgaccttcaa gagcaccctc gccgaggaac ccggtggtct 960
cgttcacctg ctgatcgcct cagccgtcac gatcgccgtg cacctcttcg gtggtcgccg 1020
aaccctcgtg agcgtcgccg cgggcaccct cgccttcgtg ctgctcgtga acttcttcta 1080
a 1081
<210> 47
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 47
aggagacaca acatgagcgt tgcggcgcag 30
<210> 48
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 48
tcaacttctc ggcatagagt ttagaagaag ttcacgagga 40
<210> 49
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 49
cgcaacgctc atgttgtgtc tcctctaaag 30
<210> 50
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 50
aggagacaca acatgagcgt tgaggcgcag 30
<210> 51
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 51
tcaacttctc ggcatagagt ttagaagaag ttcacgagca 40
<210> 52
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 52
ctcaacgctc atgttgtgtc tcctctaaag 30
<210> 53
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PyccA
<400> 53
ttccagatca aatgcgtaaa gatgggtaaa acttctgggt gcccttacgc attatcatta 60
tgctgcttaa ttaattacat ctgtcataga gagtgactca 100
<210> 54
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 54
gagagtgact caatgagcgt tgaggcgcag 30
<210> 55
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 55
cgggtaccga gctcgaattc ttagaaaaag ttcacgagca 40
<210> 56
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 56
actcactata gggcgaattc ttccagatca aatgcgtaaa 40
<210> 57
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 57
ctcaacgctc attgagtcac tctctatgac 30
<210> 58
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 58
gagagtgact caatgagcgt tgcggcgcag 30
<210> 59
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 59
cgggtaccga gctcgaattc ttagaagaag ttcacgagga 40
<210> 60
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 60
cgcaacgctc attgagtcac tctctatgac 30
<210> 61
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 61
gagagtgact caatgagcgt tgaggcgcag 30
<210> 62
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 62
cgggtaccga gctcgaattc ttagaagaag ttcacgagca 40
<210> 63
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 63
ctcaacgctc attgagtcac tctctatgac 30
<210> 64
<211> 756
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> dvaF基因
<400> 64
atgagcgttg aggcgcagcc tggcgcaaac gaccgaccct atagcgtgcg ccacgagatc 60
acgcagggcg cactcctgat tctccccgca gggctcggaa tgattccgat cggcattgcc 120
ttcggcctgc ttgtggtgca atcggggctc ccgtggtgga tggcacccgc cctttcgttc 180
ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacgccg 240
cttgtaacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttt 300
aatttcccgc tcaaggtcgt cacgaacccg ttcttgaagt tctacgcgat gtactccctc 360
accgacgaga tcttcgcggt aacggttgcc aatccaaagg ggtggacgca gccgcgcgtg 420
atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480
ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540
atcacgctga ccctcgatgc gtgccgcacg aaacaggaga tcccgtcact tctcctcggt 600
gctgccgcct tcggtttcgc gctccttttg ctcccgagcc agccgatctt cgccgcgatg 660
attggcttcg tggcgaccct cgccgcgcgc tacacgatcg ccgtgcgcct cacgaggcca 720
ctcccggcag agatggagag cgacgatgca gcttga 756
<210> 65
<211> 335
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> dvaE基因
<400> 65
atgcagcttg acatcccctt ctggtatctc gcctcggttc tcctcatcgc cttcgccgtg 60
accttcacgc tgcgcgcgct cccgttcgcg attctcgaac cactgcgcaa atcgcaattc 120
gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tgatcctcgc gctcgcgacc 180
tttaagagca ccctcgccga ggaacccggt ggtctcgttc acctgctgat cgcctcagga 240
gtcacgattg ccgtgcacct cttcggtggt cgccgcaccc tcgtgagcgt cgccgcgggc 300
accctcgcct tcgtgctgct cgtgaacttt ttcta 335
<210> 66
<211> 756
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> hmaF基因
<400> 66
atgagcgttg cggcgcagcc tagcgcacat gagcatccct attcggtgcg ccatgaaatc 60
acgcaggggg cgctcttgat tctccccgcg ggcctcggca tgatcccgat tggcatcgct 120
tttggccttc ttgttgtgca gtccggactt ccgtggtgga tggcacccgc cctctcattc 180
ttcgcgtacg cgggctcgct cgagcttttg ctcatcacac tcatcacatc gctcacgccg 240
ctcgtgacga tcgctgcggc atcgttcttc gtgaacttcc gccacgtgtt ttacgcgttc 300
aacttcccgc tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtactcgctt 360
accgacgaga tcttcgcggt gacggtcgcg cacccgaagg ggtggacgca gccacgcgtc 420
atctccgcgg gcgccgtact ccagatctgc tgggtgggag gcggcctcat gggcgtgctc 480
ctctcgagtt tcattccctt ccagatccgc ggtttgagct tcgccctgtg cgcgcttttc 540
atcaccctga ctctcgatgc gtgccgcacg aagcaagaac ttccgtcgct agttctcggc 600
gccgcggcct tcggtctcgc cctgctcctc atgcccgggc agccgatctt tgccgcgatg 660
atcggcttcg ttgcaacgct cgccgcgcgg tacacgatcg ccgtgcgcct tacgaggccg 720
ctaccggcgg aaatggaggg cgacgatgca gcttga 756
<210> 67
<211> 336
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> hmaE基因
<400> 67
atgcagcttg acatcccctt ctggtacctt gcctcggttc tcctcattgc cttcgccgtc 60
acctttacgc tgcgcgcgct cccgttcgcg atcctcgaac cgctgcgcaa atcccagttc 120
gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tcattctcgc gctcgcgacc 180
ttcaaaagca ccctcgctga ggaacccggc agcgtcattc atttgctcat tgcctcggcc 240
gtcacgatcg ctgtgcatct tctctttggg cgccgaaccc tcgtgagtgt cgccgcgggt 300
accctcgcct tcgtgctcct cgtgaacttc ttctaa 336
<210> 68
<211> 756
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> mabF基因
<400> 68
atgagcgttg aggcgcagcc tggcgcacac gagcgaccct actcggtgcg ccacgaaatc 60
acgcagggcg cgctcctgat tctccccgca ggtctcggca tgatcccgat cggtatcgcc 120
ttcggcctgc ttgtggtgca gtcggggctc ccgtggtgga tggcgcccgc cctctcgttt 180
ttcgcgtacg cgggctcact cgagcttctg ctcatcacgc tcatcacgtc gcttacccca 240
ctggtgacga tcgcggcggc atcgttcttc gtgaacttcc gccacgtgtt ctacgcgttc 300
aactttccac tcaaggtcgt gaagaacccg tttttgaagt tctacgcgat gtattcgctg 360
accgacgaaa tcttcgcggt cacggtcgcg aacccaaagg ggtggaccca gccgcgcgtg 420
atctcggcag gggccgtact ccagatctgc tgggtgggtg gcggcctcat gggggtactg 480
ctctcgagct tcatcccctt ccagatccgc ggcctgagtt tcgcgctgtg cgccctgttc 540
atcacgctga ccctcgatgc gtgccgcaca aaacaggaga tcccgtcact tctcctcggc 600
gctgccgcct tcggcctcgc gcttcttttg ctcccgagcc agccgatctt cgcggcgatg 660
attggcttcg ttgcgaccct cgcggctcgc tacacgatcg ccgtacgcct cacgaggcca 720
ctcccggcag agatggagag cgacgatgca gcttga 756
<210> 69
<211> 336
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> mabE基因
<400> 69
atgcagcttg acatcccctt ctggtacctc gcctcggttc tcctcatcgc cttcgccgtt 60
acttttacgc tgcgcgcgct cccgttcgcg atcctcgaac cactgcgcaa atcgcaattc 120
gtgcgcgtca tggccgtgtg gatgcccgcg ggcatcctcg tcattctggc gctcgcgacc 180
ttcaagagca ccctcgccga ggaacccggt ggtctcgttc acctgctgat cgcctcagcc 240
gtcacgatcg ccgtgcacct cttcggtggt cgccgaaccc tcgtgagcgt cgccgcgggc 300
accctcgcct tcgtgctgct cgtgaacttc ttctaa 336

Claims (15)

1.一种生产L-组氨酸的微生物,所述微生物被修饰为表达与SEQ ID NO:12、SEQ IDNO:13或其组合具有至少60%序列同源性的蛋白质。
2.根据权利要求1所述的生产L-组氨酸的微生物,其中,所述蛋白质是外源蛋白质。
3.根据权利要求1所述的生产L-组氨酸的微生物,其中,所述修饰是通过导入编码与SEQ ID NO:12、SEQ ID NO:13或其组合具有至少60%序列同源性的氨基酸序列的基因进行的。
4.根据权利要求1所述的生产L-组氨酸的微生物,其中,所述蛋白质由SEQ ID NO:12和13、SEQ ID NO:41和42或SEQ ID NO:44和45的氨基酸序列表示。
5.根据权利要求4所述的生产L-组氨酸的微生物,其中,所述修饰是通过导入编码SEQID NO:12和13、SEQ ID NO:41和42或SEQ ID NO:44和45的氨基酸序列的基因进行的。
6.根据权利要求1至5中任一项所述的生产L-组氨酸的微生物,其中,所述微生物是棒状杆菌属(Corynebacterium)或埃希氏菌属(Escherichia)微生物。
7.根据权利要求6所述的生产L-组氨酸的微生物,其中,所述微生物是谷氨酸棒状杆菌(Corynebacterium glutamicum)或大肠杆菌(Escherichia coli)。
8.一种用于生产L-组氨酸的组合物,包含:
与SEQ ID NO:12、SEQ ID NO:13或其组合具有至少60%序列同源性的蛋白质,
编码所述蛋白质的基因,
包含所述基因的重组载体,或
包含所述基因或所述重组载体的重组微生物。
9.根据权利要求8所述的用于生产L-组氨酸的组合物,其中,所述蛋白质由SEQ ID NO:12和13、SEQ ID NO:41和42或SEQ ID NO:44和45的氨基酸序列表示。
10.根据权利要求8或9所述的用于生产L-组氨酸的组合物,其中,所述微生物是棒状杆菌属或埃希氏菌属微生物。
11.根据权利要求10所述的用于生产L-组氨酸的组合物,其中,所述微生物是谷氨酸棒状杆菌或大肠杆菌。
12.一种用于生产L-组氨酸的方法,包括在培养基中培养根据权利要求1至5中任一项所述的生产L-组氨酸的微生物。
13.根据权利要求12所述的生产L-组氨酸的方法,进一步包括在培养后从培养的微生物或培养基中回收L-组氨酸。
14.根据权利要求12所述的用于生产L-组氨酸的方法,其中,所述微生物是棒状杆菌属或埃希氏菌属微生物。
15.根据权利要求14所述的生产L-组氨酸的方法,其中,所述微生物是谷氨酸棒状杆菌或大肠杆菌。
CN202180078472.7A 2020-12-24 2021-12-23 L-组氨酸输出蛋白和使用其生产l-组氨酸的方法 Pending CN116615548A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020200183702A KR20220092182A (ko) 2020-12-24 2020-12-24 L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법
KR10-2020-0183702 2020-12-24
PCT/KR2021/019769 WO2022139523A1 (ko) 2020-12-24 2021-12-23 L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법

Publications (1)

Publication Number Publication Date
CN116615548A true CN116615548A (zh) 2023-08-18

Family

ID=82159751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180078472.7A Pending CN116615548A (zh) 2020-12-24 2021-12-23 L-组氨酸输出蛋白和使用其生产l-组氨酸的方法

Country Status (7)

Country Link
EP (1) EP4269597A1 (zh)
JP (1) JP2023540292A (zh)
KR (2) KR20220092182A (zh)
CN (1) CN116615548A (zh)
AU (1) AU2021409842A1 (zh)
CA (1) CA3197710A1 (zh)
WO (1) WO2022139523A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19951708A1 (de) * 1999-10-27 2001-05-03 Degussa Für den Export verzweigtkettiger Aminosäuren kodierende Nikleotidsequenzen, Verfahren zu deren Isolierung und ihre Verwendung
KR100924065B1 (ko) 2006-09-15 2009-10-27 씨제이제일제당 (주) L-라이신 생산능이 향상된 코리네박테리아 및 그를 이용한 l-라이신 생산 방법
EP3292935A1 (en) 2016-09-13 2018-03-14 Unimate Robotica, S.L. Device adapted to dosing pastry substances
KR101904666B1 (ko) * 2017-08-02 2018-11-29 씨제이제일제당 (주) Atp 포스포리보실기 전이효소 변이체 및 이를 이용한 l-히스티딘 생산방법
KR101887821B1 (ko) * 2017-08-11 2018-08-13 대상 주식회사 비산화 펜토오스 인산 경로 관련 효소의 불활성화에 의한 히스티딘 생산능 변이 균주
KR101968317B1 (ko) 2018-02-23 2019-04-11 씨제이제일제당 주식회사 신규 l-트립토판 배출 단백질 및 이를 이용한 l-트립토판을 생산하는 방법
KR102204917B1 (ko) * 2019-04-22 2021-01-20 씨제이제일제당 주식회사 L-히스티딘 생산능이 강화된 미생물 및 이를 이용한 히스티딘 생산방법

Also Published As

Publication number Publication date
KR20230149787A (ko) 2023-10-27
WO2022139523A1 (ko) 2022-06-30
JP2023540292A (ja) 2023-09-22
KR20220092182A (ko) 2022-07-01
CA3197710A1 (en) 2022-06-30
AU2021409842A1 (en) 2023-05-11
EP4269597A1 (en) 2023-11-01

Similar Documents

Publication Publication Date Title
CN116547297A (zh) 表达奥奈达湖希瓦氏菌衍生蛋白的微生物和使用其生产l-氨基酸的方法
AU2022206623B2 (en) Glxr protein variant or threonine production method using same
KR102306010B1 (ko) 신규한 분지쇄아미노산 투과효소 변이체 및 이를 이용한 l-발린 생산 방법
KR102306008B1 (ko) 신규한 전사 조절자 변이체 및 이를 이용한 l-발린 생산 방법
KR102314882B1 (ko) 신규한 막단백질 TerC 변이체 및 이를 이용한 L-라이신 생산 방법
CN116615548A (zh) L-组氨酸输出蛋白和使用其生产l-组氨酸的方法
AU2021394840B2 (en) Shewanella atlantica-derived protein-expressing microorganism and L-amino acid production method using same
KR102339264B1 (ko) 신규 프로모터 및 이의 용도
KR102339271B1 (ko) 신규 프로모터 및 이의 용도
KR102281369B1 (ko) 신규한 디히드로리포일 아세틸기전이효소 변이체 및 이를 이용한 l-발린 생산 방법
RU2826633C1 (ru) Микроорганизм, экспрессирующий белок, происходящий из Shewanella atlantica, и способ получения L-аминокислоты с его использованием
CN113994002B (zh) 新型启动子及其用途
CN113994003B (zh) 新型启动子及其用途
KR102281370B1 (ko) 신규한 2-이소프로필말레이트합성효소 변이체 및 이를 이용한 l-발린 생산 방법
KR102281371B1 (ko) 신규한 글리세르알데히드-3-인산탈수소효소 변이체 및 이를 이용한 l-발린 생산 방법
KR102306007B1 (ko) 신규한 슈가 포터 계열 mfs 트랜스포터 변이체 및 이를 이용한 l-발린 생산 방법
KR102306009B1 (ko) 신규한 WhiB 계열 전사 조절자 WhcA 변이체 및 이를 이용한 L-발린 생산 방법
RU2793435C1 (ru) Новый вариант мембранного белка TERC и способ получения L-лизина с его применением
KR102673796B1 (ko) 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법
RU2823572C1 (ru) Микроорганизм, экспрессирующий белок, происходящий из shewanella oneidensis, и способ получения l-аминокислоты с его применением
EP4098658B1 (en) Novel protein variant and method for producing l-lysine using same
RU2795162C1 (ru) Новый вариант регулятора транскрипции WHCA семейства WHIB и способ получения L-валина с его применением
RU2793441C1 (ru) Новый вариант белка сборки праймосомы и способ получения l-лизина с его применением
KR20240000168A (ko) L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법
KR20240000169A (ko) L-히스티딘 배출 단백질 및 이를 이용한 l-히스티딘 생산 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination