CN107074915A - 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用 - Google Patents

参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用 Download PDF

Info

Publication number
CN107074915A
CN107074915A CN201580062908.8A CN201580062908A CN107074915A CN 107074915 A CN107074915 A CN 107074915A CN 201580062908 A CN201580062908 A CN 201580062908A CN 107074915 A CN107074915 A CN 107074915A
Authority
CN
China
Prior art keywords
seq
ldc
acid
producing klebsiella
klebsiella bacterium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580062908.8A
Other languages
English (en)
Other versions
CN107074915B (zh
Inventor
周豪宏
李乃强
刘修才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cathay R&D Center Co Ltd
CIBT America Inc
Original Assignee
Shanghai Cathay Biotechnology Research and Development Center Co Ltd
Cathay Industrial Biotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cathay Biotechnology Research and Development Center Co Ltd, Cathay Industrial Biotech Ltd filed Critical Shanghai Cathay Biotechnology Research and Development Center Co Ltd
Publication of CN107074915A publication Critical patent/CN107074915A/zh
Application granted granted Critical
Publication of CN107074915B publication Critical patent/CN107074915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01018Lysine decarboxylase (4.1.1.18)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了赖氨酸脱羧酶多肽,其包含SEQ ID NO:2的突变体和/或其片段。所述突变体或片段与SEQ ID NO:2具有至少95%序列相同性。本发明还提供了编码所述赖氨酸脱羧酶的DNA多核苷酸、包含所述DNA多核苷酸的表达载体、转化体、突变宿主细胞、产生赖氨酸脱羧酶的方法和生产赖氨酸衍生产物的方法。

Description

参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法 和应用
背景技术
尸胺是参与产生多种产物的平台化合物。尸胺可以通过微生物中的赖氨酸的脱羧作用合成。赖氨酸脱羧酶是通过从赖氨酸去除羧基来催化产生尸胺的酶。例如,在大肠杆菌(E.coli)中,尸胺是通过两种赖氨酸脱羧酶多肽CadA和LdcC直接从L-赖氨酸生物合成的。目前改良赖氨酸生产和赖氨酸衍生产物如尸胺生产的方法聚焦于参与细胞代谢的蛋白质的过表达或弱化。然而,迄今为止获得的产量仍不满意。因此,需要获得更高尸胺产量的新技术。
发明概述
本发明一方面涉及赖氨酸脱羧酶多肽,其包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2的突变体(即产酸克雷伯氏菌(Klebsiella oxytoca)Ldc的突变体)及其片段,及SEQ ID NO:2的片段(即产酸克雷伯氏菌Ldc的片段),其中所述突变体或片段与SEQ ID NO:2具有至少95%序列相同性。在某些实施方案中,SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)可包含SEQ ID NO:2的氨基酸序列或其片段、由SEQ ID NO:2的氨基酸序列或其片段组成或基本上由SEQ ID NO:2的氨基酸序列或其片段组成,所述SEQ ID NO:2的氨基酸序列或其片段包含选自如下的一个或多个突变:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,及在氨基酸位置607处突变为X5的突变;X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸;条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,及X5不是苯丙氨酸。在某些实施方案中,SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)可包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S),SEQ ID NO:9(即产酸克雷伯氏菌Ldc R436G),SEQ ID NO:11(即产酸克雷伯氏菌Ldc F507L)及SEQ IDNO:13(即产酸克雷伯氏菌LdcF607Y)。
本发明的另一方面涉及非天然存在的DNA多核苷酸,其包含一个或多个赖氨酸脱羧酶核苷酸序列、由一个或多个赖氨酸脱羧酶核苷酸序列组成或者基本上由一个或多个赖氨酸脱羧酶核苷酸序列组成,其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ IDNO:3具有至少95%序列相同性,并且其中所述多核苷酸编码本文描述的一种或多种赖氨酸脱羧酶多肽。在某些实施方案中,非天然存在的DNA多核苷酸可包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,及SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ IDNO:3具有至少95%序列相同性,并且其中所述多核苷酸编码一种或多种赖氨酸脱羧酶多肽,其包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段。在某些实施方案中,SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)可包含SEQ ID NO:3的赖氨酸脱羧酶核苷酸序列(即产酸克雷伯氏菌ldc-co1)或其片段、由SEQ ID NO:3的赖氨酸脱羧酶核苷酸序列(即产酸克雷伯氏菌ldc-co1)或其片段组成或者基本上由SEQ IDNO:3的赖氨酸脱羧酶核苷酸序列(即产酸克雷伯氏菌ldc-co1)或其片段组成。在某些实施方案中,SEQID NO:3的赖氨酸脱羧酶核苷酸序列包含选自如下的一个或多个突变:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,及在核苷酸位置1820处突变为Z5的突变;Z1、Z2、Z3、Z4和Z5各自独立地选自腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,及Z5不是T。在某些实施方案中,SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)包含选自如下的赖氨酸脱羧酶核苷酸序列、由选自如下的赖氨酸脱羧酶核苷酸序列组成或者基本上由选自如下的赖氨酸脱羧酶核苷酸序列组成:SEQID NO:4(即产酸克雷伯氏菌ldc-co1 A859G),SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1C1193G),SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1C1306G),SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1 C1521G)及SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1 T1820A)。
本发明的另一方面涉及包含如本文描述的DNA多核苷酸的表达质粒载体,及在宿主细胞中能自主复制的骨架质粒,其中所述表达质粒载体用于赖氨酸衍生产物的生产。
本发明的另一方面涉及转化体,其包含在宿主细胞中的如本文描述的一个或多个表达质粒载体。
本发明的另一方面涉及突变宿主细胞,其包含整合进宿主细胞染色体中的如本文描述的DNA多核苷酸。
本发明的另一方面涉及一种生产如本文描述的一种或多种赖氨酸脱羧酶多肽的方法,其中所述方法包括获得本文描述的突变宿主细胞和/或本文描述的转化体,将所述突变宿主细胞和/或转化体在使得所述一种或多种多肽有效表达的条件下培养,及收获所述一种或多种赖氨酸脱羧酶多肽。
本发明的另一方面涉及一种生产尸胺(1,5-戊二胺)的方法,包括1a)培养本文描述的突变宿主细胞和/或转化体;1b)使用得自步骤1a的培养物使赖氨酸脱羧而生产尸胺;及1c)使用得自步骤1b的培养物提取并纯化尸胺。
本发明的另一方面涉及一种生产尸胺(1,5-戊二胺)的方法,包括获得如本文描述的一种或多种赖氨酸脱羧酶多肽及使用所述一种或多种赖氨酸脱羧酶多肽使赖氨酸脱羧而生产尸胺。
附图简述
图1:表中示出在下面的实施例章节中描述的用于产生构建体的引物。
图2:表中示出本文描述的菌株、质粒、酶、基因、启动子和核糖体结合位点(RBS)脱氧核糖核酸(DNA)序列。
图3:分批发酵结果。将菌株LN20(白色)和CIB60(黑色)使用分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(方框)、葡萄糖(圆形)及活性(三角形)。
图4:补料分批发酵结果。将菌株LN24以补料分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(白色方框)及活性(黑色菱形)。
图5:分批发酵结果。将LN24(黑色)和LN3014(白色)使用分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(方框)、葡萄糖(圆形)及活性(三角形)。
图6:补料分批发酵结果。将菌株LN3014以补料分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(白色方框)及活性(白色三角形)。
发明详述
如下描述提供了彻底理解及能够实施本发明实施方案的具体详细描述。然而,本领域技术人员理解不借助于这些详细描述也可以实施本发明。在其它情况中,未详细示出或描述熟知的结构和功能以避免不必要的模糊关于本发明实施方案的描述。
产酸克雷伯氏菌(K.oxytoca)是一种革兰氏阴性棒状细菌。产酸克雷伯氏菌E718基因组序列含有产酸克雷伯氏菌赖氨酸脱羧酶基因ldc,其编码赖氨酸脱羧酶多肽产酸克雷伯氏菌Ldc。如本文所用,产酸克雷伯氏菌ldc的核苷酸序列被称作“产酸克雷伯氏菌ldc”、“ldc”、“产酸克雷伯氏菌ldc多核苷酸”或者“产酸克雷伯氏菌ldc核苷酸序列”,其具有SEQ ID NO:1的核苷酸序列。如本文所用,产酸克雷伯氏菌Ldc多肽被称作“产酸克雷伯氏菌Ldc”、“Ldc”、“产酸克雷伯氏菌Ldc多肽”或者“产酸克雷伯氏菌Ldc蛋白质”,其具有SEQID NO:2的氨基酸序列。
本发明的一方面涉及赖氨酸脱羧酶多肽,其包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段,其中所述突变体或片段与SEQ ID NO:2具有至少95%序列相同性。
在某些实施方案中,SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)或其片段因此与SEQ ID NO:2可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或者大约99%~99.999%的序列相同性。
如本文所用,术语“大约”是指在指定数值或数值范围的5%或10%内。
在某些实施方案中,SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)可包含含有一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含一个或多个突变的SEQ IDNO:2的氨基酸序列组成或者基本上由包含一个或多个突变的SEQ ID NO:2的氨基酸序列组成。SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)可包含在SEQ ID NO:2内的一个或多个氨基酸的一个或多个缺失、取代、添加和/或插入,其中SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)提供了与产酸克雷伯氏菌Ldc基本相同的赖氨酸脱羧酶活性(即产酸克雷伯氏菌Ldc的突变体与产酸克雷伯氏菌Ldc相比具有大约80%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比大约90%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比大约95%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比大约97%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc对比大约99%或更高的赖氨酸脱羧酶活性;或者与产酸克雷伯氏菌Ldc对比大约100%或更高的赖氨酸脱羧酶活性)。
优选的SEQ ID NO:2突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于:SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S),SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G),SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)和SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含如下的氨基酸序列、由如下的氨基酸序列组成或者基本上由如下的氨基酸序列组成:包含选自如下的一个或多个突变的SEQ IDNO:2:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌Ldc T398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);及SEQ ID NO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,以及X5不是苯丙氨酸。如本文所用,同源多肽与指定的多肽序列可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或者大约99%~99.999%的序列同源性。
在某些实施方案中,如本文所用,多肽的片段提供了与该片段从中衍生的完整未突变多肽基本相同的功能。在这些实施方案中,产酸克雷伯氏菌Ldc的片段或者产酸克雷伯氏菌Ldc的突变体具有与产酸克雷伯氏菌Ldc或者其从中衍生的产酸克雷伯氏菌的突变体基本相同的功能(例如赖氨酸脱羧酶活性)。
本发明的另一方面涉及DNA多核苷酸,其包含本文描述的一个或多个赖氨酸脱羧酶核苷酸序列、由本文描述的一个或多个赖氨酸脱羧酶核苷酸序列组成或者基本上由本文描述的一个或多个赖氨酸脱羧酶核苷酸序列组成。在某些实施方案中,DNA多核苷酸可包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列:SEQ ID NO:1(即产酸克雷伯氏菌ldc)及其片段,及SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性,并且其中所述多核苷酸编码一种或多种赖氨酸脱羧酶多肽,其包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段。
在某些实施方案中,所述赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc和产酸克雷伯氏菌Ldc的突变体与前文描述的相同。当存在多个多肽时,每个多肽可以是相同或不同的,所述一种或多种多肽可以单独表达或者作为融合蛋白表达。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S),SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G),SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)及SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含如下的氨基酸序列、由如下的氨基酸组成或者基本上由如下的氨基酸序列组成的突变体:包含选自如下的一个或多个突变的SEQ ID NO:2:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌LdcK287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌Ldc T398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);及SEQID NO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,以及X5不是苯丙氨酸。
在某些实施方案中,所述DNA多核苷酸序列可包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,及SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段)。SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)在包含SEQID NO:1或SEQ ID NO:3的核苷酸序列中可包括一个或多个核苷酸的一个或多个缺失、取代、添加和/或插入,而由所述核苷酸序列编码的赖氨酸脱羧酶多肽提供了与产酸克雷伯氏菌Ldc基本相同的功能(即由产酸克雷伯氏菌ldc的突变体编码的赖氨酸脱羧酶多肽与产酸克雷伯氏菌Ldc相比具有大约80%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比具有大约90%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc对比具有大约95%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比具有大约97%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比具有大约99%或更高的赖氨酸脱羧酶活性;或者与产酸克雷伯氏菌Ldc相比具有大约100%或更高的赖氨酸脱羧酶活性)。
在某些实施方案中,SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)或其片段与SEQ ID NO:1或SEQ ID NO:3可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或者大约99%~99.999%的序列相同性。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3)且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于这样的赖氨酸脱羧酶核苷酸序列,其编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1A859G),SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1C1193G),SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1C1306G),SEQ IDNO:10(即产酸克雷伯氏菌ldc-co1C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的另外的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于:包含含有选自如下的一个或多个突变的SEQ IDNO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或基本上由包含选自如下的一个或多个突变的SEQID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或这些突变的任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或这些突变的任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldc A859Z1或产酸克雷伯氏菌ldc-co1A859Z1);产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1C1193Z2);产酸克雷伯氏菌ldc C1306G或产酸克雷伯氏菌ldc-co1C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)和T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,以及Z5不是T。如本文所用,同源核苷酸序列与指定的核苷酸序列可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或大约99%~99.999%的同源性。
在某些实施方案中,所述DNA多核苷酸可以是重组或非天然存在的多核苷酸。在某些实施方案中,所述DNA多核苷酸可以是cDNA。在某些实施方案中,所述DNA多核苷酸可以通过密码子优化获得以用于在特定微生物(例如大肠杆菌、蜂房哈夫尼菌(H.alvei)或产酸克雷伯氏菌)中的最佳多肽表达。
如本文所用,核苷酸序列、多肽和DNA分子不限于功能区,可包括表达抑制区、编码区、前导序列、外显子、内含子和表达盒中的至少一个(见例如Papadakis et al.,"Promoters and Control Elements:Designing ExpressionCassettes for GeneTherapy,"Current Gene Therapy(2004),4,89-113)。而且,核苷酸序列或多核苷酸可包括双链DNA或者单链DNA(即组成双链DNA的有义链和反义链),或者核糖核酸(RNA)。含有核苷酸序列的多核苷酸可包括该核苷酸序列的片段和/或突变体。核苷酸序列的片段是指核苷酸序列的一部分,其编码提供与完整多核苷酸编码的多肽基本相同功能的多肽。核苷酸序列的突变体的例子包括天然存在的等位基因突变体,人工突变体,及通过在所述核苷酸序列中缺失、取代、添加和/或插入一个或多个核苷酸获得的核苷酸序列。应理解这种核苷酸序列的片段和/或突变体编码与原始核苷酸序列编码的多肽具有基本相同功能的多肽。例如,产酸克雷伯氏菌ldc的片段和/或突变体编码与产酸克雷伯氏菌Ldc具有基本相同功能(即赖氨酸脱羧酶活性)的多肽。
密码子优化是可用于通过增加感兴趣基因的翻译效率使生物体中蛋白质表达最大化的一种技术。不同的生物体由于突变倾向和天然选择而通常示出对于编码相同氨基酸的一些密码子之一的特殊偏好性。例如,在快速生长的微生物如大肠杆菌中,优化密码子反映出其各自的基因组tRNA库的组成。因此,在快速生长的微生物中,氨基酸的低频率密码子可以用用于相同氨基酸的但高频率的密码子置换。因此,优化的DNA序列的表达在快速生长的微生物中得以改良。见例如http://www.guptalab.org/shubhg/pdf/shubhra_codon.pdf关于密码子优化技术的综述,将其全部内容并入本文作参考。如本文所提供,多核苷酸序列可以是经密码子优化的,以用于在特定微生物中的最佳多肽表达,所述微生物包括但不限于大肠杆菌、蜂房哈夫尼菌和产酸克雷伯氏菌。
在某些实施方案中,核苷酸序列的突变体可得自核苷酸序列的密码子优化,以降低其G和C核苷酸含量用于改良的蛋白质表达。如果大约50%或以上的碱基是G或C,则认为该基因组是GC富集的。感兴趣的核苷酸序列中的高GC含量可导致mRNA中形成二级结构,这可导致中断的翻译及较低水平的表达。因此,将编码序列中的G和C残基改变为A和T残基而不改变氨基酸可提供更高水平的表达。
在某些实施方案中,本文描述的DNA多核苷酸可进一步包含一个或多个核糖体结合位点(RBS)DNA核苷酸序列。如本文所用,RBS DNA核苷酸序列可称作“RBS DNA”、“RBS DNA序列”、“RBS DNA核苷酸序列”或者“RBS DNA多核苷酸序列”。RBS是在信使RNA(mRNA)中发现的一个RNA序列,核糖体可与其结合并起始翻译。在原核生物中,RBS被称作Shine-Dalgarno序列,位于待翻译的RNA序列起始密码子的上游。RBS序列中的突变在原核生物中可减少或增加翻译。本发明提供的RBS DNA核苷酸序列具有与RBS序列相同的碱基序列,除了在RBS序列的RNA序列中的尿嘧啶(U)由胸腺嘧啶(T)置换。例如,如果RBS序列是“GGAGAU”,则相应的RBS DNA核苷酸序列是“GGAGAT”。如在下文实施例中示出,产酸克雷伯氏菌Ldc及其突变体从不同RBS序列的表达导致不同水平的尸胺生产活性(见实施例7)。如下文实施例7提供,质粒pUC18-KOldc-co1-Pbad含有位于产酸克雷伯氏菌ldc-co1序列上游的RBS DNA核苷酸序列“GGAGAT”(RBS DNA-1,SEQ ID NO:14)。制备RBS DNA文库用于筛选导致尸胺生产增加的用于产酸克雷伯氏菌Ldc蛋白表达的最佳RBS序列。与含有RBS DNA核苷酸序列RBS DNA-1(SEQ ID NO:14)的质粒相比,具有突变的RBS DNA核苷酸序列的至少5个质粒当转化进大肠杆菌K12中时产生更高水平的尸胺。含有RBS DNA核苷酸序列“TGGAGG”(RBS DNA-5,SEQ IDNO:18)的质粒(pLN637)产生最高的尸胺产量(见实施例7)。
如本文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBSDNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5)和SEQ IDNO:19(即RBS DNA-6)。在某些优选的实施方案中,所述一个或多个RBSDNA核苷酸序列可包含SEQ ID NO:18(即RBS DNA-5)、由SEQ ID NO:18(即RBS DNA-5)组成或者基本上由SEQ ID NO:18(即RBS DNA-5)组成。在某些实施方案中,所述RBS DNA核苷酸序列可位于SEQ ID NO:1的赖氨酸脱羧酶核苷酸序列(即产酸克雷伯氏菌ldc)及其片段以及SEQID NO:1(即产酸克雷伯氏菌ldc)的突变体及其片段的上游。
如本文所提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个启动子核苷酸序列:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列)及SEQ ID NO:22(即Ptac启动子序列)。启动子是起始DNA转录的DNA区域。启动子位于被转录的DNA的上游。在某些优选实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。在某些实施方案中,所述启动子核苷酸序列可位于SEQ ID NO:1的赖氨酸脱羧酶核苷酸序列(即产酸克雷伯氏菌ldc)或其片段及SEQ ID NO:1(即产酸克雷伯氏菌ldc)的突变体或其片段的上游。当DNA多核苷酸包含一个或多个RBS DNA核苷酸序列及一个或多个启动子核苷酸序列时,所述一个或多个启动子核苷酸序列可位于赖氨酸脱羧酶核苷酸序列和RBS DNA核苷酸序列的上游。
本发明的另一方面涉及表达质粒载体,其包含如下多核苷酸、由如下多核苷酸组成或者基本上由如下多核苷酸组成:
包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列、由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成或基本上由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成的DNA多核苷酸:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,及SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ IDNO:1或SEQ ID NO:3具有至少95%序列相同性,及其中所述多核苷酸编码一种或多种赖氨酸脱羧酶多肽,该多肽包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段;及
能在宿主细胞中自主复制的骨架质粒,
其中所述表达质粒载体用于生产赖氨酸衍生产物。
所述DNA多核苷酸、赖氨酸脱羧酶核苷酸序列、产酸克雷伯氏菌ldc及其突变体和片段、赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其突变体和片段与前文描述的相同。当存在多个多肽时,每个多肽可以相同或不同,所述一个或多个多肽可以单独表达或者作为融合蛋白表达。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3),且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于赖氨酸脱羧酶核苷酸序列,其编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1A859G),SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1C1193G),SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1C1306G),SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的另外的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或其任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或其任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldcA859Z1或产酸克雷伯氏菌ldc-co1A859Z1);产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1C1193Z2);产酸克雷伯氏菌ldcC1306G或产酸克雷伯氏菌ldc-co1C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)及T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,以及Z5不是T。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E)、SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S)、SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G)、SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)和SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成或基本上由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成的突变体:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌LdcT398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);及SEQ IDNO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸及X5不是苯丙氨酸。
如本文所用,术语“宿主细胞”是指微生物细胞,其可以是可以用表达质粒载体转化的任何细胞(例如埃希氏菌属(例如大肠杆菌),克雷伯氏菌属(例如产酸克雷伯氏菌),假单胞菌属(例如铜绿假单胞菌(P.aeruginosa)),棒杆菌属(例如谷氨酸棒杆菌(Corynebacterium glutamicum)),芽孢杆菌(Bacilli),哈夫尼菌属(例如蜂房哈夫尼菌(Hafnia alvei)),短杆菌属(Brevibacterium),乳杆菌属(Lactobacillus)(例如戊糖乳杆菌(Lactobacilluspentosus),植物乳杆菌(Lactobacillus plantarum),Lactobacillussaerimneri),乳球菌属(Lactococcus)(例如乳酸乳球菌(Lactococcus lactis),乳酸乳球菌乳脂亚种(Lactococcus lactis ssp.Cremoris),乳酸乳球菌乳亚种(Lactococcuslactis ssp.lactis))以及链球菌属(Streptococcus)(例如嗜热链球菌(Streptococcusthermophilus)))。
大肠杆菌细胞可以是衍生自大肠杆菌K12(例如MG1655、W3110、DH10b、DH1、BW2952及衍生自其的菌株)或大肠杆菌B的任何大肠杆菌菌株,或者衍生自其的菌株。
如本文所用,赖氨酸衍生产物可以是尸胺。例如,本文描述的表达质粒载体可用于生产尸胺。
在某些实施方案中,所述宿主细胞可含有一个或多个内源质粒。在某些实施方案中,所述宿主细胞不含内源质粒。如本文所用,术语“治愈”是指从宿主细胞中去除一个或多个内源质粒。在某些实施方案中,可以通过从宿主细胞去除所有内源质粒来“治愈”宿主细胞的所有内源质粒。在某些实施方案中,可以通过仅去除从细胞靶向去除的一个或多个内源质粒来“治愈”宿主细胞的一个或多个内源质粒。
在某些实施方案中,所述宿主细胞可以是原核细胞(例如是蜂房哈夫尼菌),其含有编码特异性毒素/抗毒素基因对的内源质粒。这种毒素/抗毒素基因对在维持遗传信息及应激反应中起作用(见Wertz et al.“Chimeric nature of two plasmids of Hafniaalvei encoding the bacteriocins alveicins A and B.”Journal of Bacteriology,(2004)186:1598-1605)。只要细胞具有一个或多个包含抗毒素基因的质粒,则该毒素被所述一个或多个质粒持续表达的抗毒素中和以保持细胞存活。在某些原核生物中,所述抗毒素蛋白比毒素蛋白更快降解。如果包含抗毒素基因的质粒从细胞中丢失,则细胞中毒素蛋白将比抗毒素蛋白存在更长时间并杀死细胞或者抑制细胞生长。因此,优选保留包含抗毒素或者毒素/抗毒素基因的质粒以保持宿主细胞存活。
如本文所用,毒素/抗毒素基因对具有两个基因,一个是毒素基因,其表达对于宿主细胞具有毒性的多肽,另一个是抗毒素基因,其中和宿主细胞中的毒性多肽。所述毒素/抗毒素基因对的例子包括但不限于abt/abi基因对和aat/aai基因对、其片段及其突变体。在一些实施方案中,所述毒素多核苷酸序列包含SEQ ID NO:23或SEQ ID NO:25的核苷酸序列、其片段或突变体,由SEQ ID NO:23或SEQ ID NO:25的核苷酸序列、其片段或突变体组成,或者基本上由SEQ ID NO:23或SEQ ID NO:25的核苷酸序列、其片段或突变体组成。在一些实施方案中,所述抗毒素多核苷酸序列包含SEQ ID NO:24或SEQ ID NO:26的核苷酸序列、其片段或突变体,由SEQ ID NO:24或SEQ ID NO:26的核苷酸序列、其片段或突变体组成,或者基本上由SEQ ID NO:24或SEQ ID NO:26的核苷酸序列、其片段或突变体组成。
在某些实施方案中,所述宿主细胞可以是任何蜂房哈夫尼菌菌株,例如没有内源质粒的蜂房哈夫尼菌菌株或者含有内源质粒的蜂房哈夫尼菌菌株。例如,所述宿主细胞可以是含有一个或多个pAlvA质粒的蜂房哈夫尼菌菌株,或者其经治愈的菌株(pAlvA-菌株),或者含有一个或多个pAlvB质粒的蜂房哈夫尼菌菌株及其经治愈的菌株(pAlvB-菌株)。
在某些实施方案中,本发明揭示的表达质粒载体(例如表达质粒载体)可进一步包含选自abi基因,aai基因及其突变体及片段的一个或多个抗毒素基因,和/或选自abt/abi基因对和aat/aai基因对及其突变体和片段的一个或多个毒素/抗毒素基因对。例如,在某些实施方案中,表达质粒载体(例如所述表达质粒载体)可进一步包含抵消对宿主细胞有害的毒素多肽的抗毒素多核苷酸以及编码所述毒素多肽的毒素多核苷酸序列。
在某些实施方案中,所述宿主细胞可以是适用于工业规模或大规模生产的工业菌株。例如,工业菌株可以在发酵罐中培养。培养规模可以从数百升至数百万升。另一方面,实验室菌株通常在数升或更少中培养。在某些实施方案中,工业菌株可以比实验室菌株在更简单或更经济的培养基中生长。
能在宿主细胞中自主复制的骨架质粒可以是在宿主细胞中可以复制的任何质粒。在一个实施方案中,表达质粒载体包含在大肠杆菌中可以复制的骨架质粒。在另一个实施方案中,表达质粒载体包含在蜂房哈夫尼菌中可以复制的骨架质粒。骨架质粒的例子包括但不限于在大肠杆菌中可以复制的骨架质粒,例如pUC(例如pUC18和pUC19质粒),pBR322,pSC101,pET,p15a和pACYC质粒,及从其衍生的质粒。
在某些实施方案中,所述表达质粒载体可用于生产如本文描述的赖氨酸衍生产物。在某些实施方案中,赖氨酸衍生产物可是如本文描述的尸胺。
如上文所提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBSDNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5)和SEQ ID NO:19(即RBS DNA-6)。在某些优选的实施方案中,所述一个或多个RBSDNA核苷酸序列可包含SEQ ID NO:18(即RBS DNA-5)、由SEQID NO:18(即RBS DNA-5)组成或者基本上由SEQ ID NO:18(即RBSDNA-5)组成。
如本文所提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自SEQ ID NO:20(即Plac启动子序列)、SEQ ID NO:21(即Pbad启动子序列)和SEQ ID NO:22(即Ptac启动子序列)的一个或多个启动子核苷酸序列。在某些优选的实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。
本发明的另一方面涉及转化体,其包含在宿主细胞中的一个或多个表达质粒载体、由在宿主细胞中的一个或多个表达质粒载体组成或者基本上由在宿主细胞中的一个或多个表达质粒载体组成,所述表达质粒载体包含如下多核苷酸、由如下多核苷酸组成或者基本上由如下多核苷酸组成:
包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列、由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成或者基本上由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成的DNA多核苷酸:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性,及其中所述多核苷酸编码一种或多种赖氨酸脱羧酶多肽,所述赖氨酸脱羧酶多肽包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段;及
能载宿主细胞中自主复制的骨架质粒,
其中所述表达质粒载体用于生产赖氨酸衍生产物。
所述表达质粒载体、宿主细胞、骨架质粒、DNA多核苷酸、赖氨酸脱羧酶核苷酸序列、产酸克雷伯氏菌ldc及其突变体和片段、赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其突变体和片段与前文的描述相同。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3)且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的赖氨酸脱羧酶核苷酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1 A859G)、SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1 C1193G)、SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1C1306G)、SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
另外的编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于:包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或其任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或其任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1 A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldc A859Z1或产酸克雷伯氏菌ldc-co1A859Z1);产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1 C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1 C1193Z2);产酸克雷伯氏菌ldc C1306G或产酸克雷伯氏菌ldc-co1 C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1 C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1 C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1 C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1 T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1 T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)和T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,及Z5不是T。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S),SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G),SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)和SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于:包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成的突变体:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1),SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌LdcT398X2),SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3),SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4),及SEQ IDNO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,及X5不是苯丙氨酸。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5),和SEQ ID NO:19(即RBS DNA-6)。在某些优选的实施方案中,所述一个或多个RBSDNA核苷酸序列可包含SEQ ID NO:18(即RBS DNA-5)、由SEQ ID NO:18(即RBS DNA-5)组成或者基本上由SEQ ID NO:18(即RBS DNA-5)组成。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个启动子核苷酸序列:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列)和SEQ ID NO:22(即Ptac启动子序列)。在某些优选的实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。
如本文所用,转化体可以是通过在宿主细胞中导入一个或多个表达质粒载体而改变的宿主细胞。在某些实施方案中,所述转化体可以通过转化向对质粒载体呈现出感受态的宿主细胞中导入所述表达质粒载体而获得。
在某些实施方案中,所述转化体可用于生产如本文描述的赖氨酸衍生产物。在某些实施方案中,赖氨酸衍生产物可以是如本文描述的尸胺。
本发明的另一方面涉及突变宿主细胞,其包含如下多核苷酸、由如下多核苷酸组成或者基本上由如下多核苷酸组成:
包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列的DNA多核苷酸:SEQ IDNO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,及SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性,及其中所述多核苷酸编码包含选自如下的氨基酸序列的一种或多种赖氨酸脱羧酶多肽:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段。
所述宿主细胞、DNA多核苷酸、赖氨酸脱羧酶核苷酸序列、产酸克雷伯氏菌ldc及其片段和突变体、赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其片段和突变体与前文描述的相同。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3)且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的赖氨酸脱羧酶核苷酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1 A859G)、SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1 C1193G)、SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1 C1306G)、SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1 C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
其它的编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于:包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或其任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或其任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1 A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldc A859Z1或产酸克雷伯氏菌ldc-co1A859Z1;产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1 C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1 C1193Z2);产酸克雷伯氏菌ldcC1306G或产酸克雷伯氏菌ldc-co1 C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1 C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1 C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1 C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1 T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1 T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)和T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,及Z5不是T。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E)、SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S)、SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G)、SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)及SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。其它的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成的突变体:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌Ldc T398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);SEQ IDNO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸及X5不是苯丙氨酸。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5),和SEQ ID NO:19(即RBS DNA-6)。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个启动子核苷酸序列、由选自如下的一个或多个启动子核苷酸序列组成或者基本上由选自如下的一个或多个启动子核苷酸序列组成:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列),及SEQ ID NO:22(即Ptac启动子序列)。在某些优选的实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。
在某些实施方案中,所述突变宿主细胞可用于生产如本文描述的赖氨酸衍生产物。在某些实施方案中,赖氨酸衍生产物可是如本文描述的尸胺。
在某些实施方案中,根据PCR介导的基因置换方法可以将所述DNA多核苷酸整合进宿主细胞染色体中(见例如Datsenko,2000关于PCR介导的基因置换方法的综述,该文献以其全部内容并入本文作参考)。整合的染色体也可以通过其它合适方法产生。
本发明的另一方面涉及一种生产如本文描述的一种或多种赖氨酸脱羧酶多肽的方法,包括:
获得如本文描述的突变宿主细胞和/或转化体;
在使所述一种或多种赖氨酸脱羧酶多肽有效表达的条件下培养所述突变宿主细胞和/或转化体;及
收获所述一种或多种赖氨酸脱羧酶多肽。
所述赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其突变体和片段、突变宿主细胞和/或转化体与前文描述的相同。
在某些实施方案中,所述转化体和/或突变宿主细胞可以是如本文描述的任何那些转化体和/或突变宿主细胞。例如,用于生产一种或多种赖氨酸脱羧酶多肽的转化体可以通过将如本文描述的一种或多种表达质粒载体转化进宿主细胞中而获得。
所述转化体和/或突变宿主细胞可以使用含有碳源和非碳营养源的培养基培养。碳源的例子包括但不限于糖(例如碳水化合物如葡萄糖和果糖)、油和/或脂肪、脂肪酸,和/或其衍生物。油和脂肪可含有饱和和/或不饱和的脂肪酸,其具有10或更多个碳原子,例如椰子油、棕榈油、棕榈仁油等。脂肪酸可以是饱和和/或不饱和脂肪酸,例如己酸、辛酸、癸酸、月桂酸、油酸、棕榈酸、亚油酸、亚麻酸、肉豆蔻酸等。脂肪酸衍生物的例子包括但不限于其酯及盐。非碳源的例子包括但不限于氮源、无机盐,及其它有机营养源。
例如,培养基可含有能被转化体和/或突变宿主细胞同化的碳源,任选具有选自氮源、无机盐及其它有机营养源的一种或多种其它来源。在某些实施方案中,氮源的重量百分比是培养基的大约0.01%至大约0.1%。氮源的例子可包含氨、铵盐(例如氯化铵、硫酸铵和磷酸铵)、蛋白胨、肉膏、酵母提取物等。无机盐的例子包括但不限于磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠等。其它有机营养源的例子包括但不限于氨基酸(例如甘氨酸、丙氨酸、丝氨酸、苏氨酸和脯氨酸)、维生素(例如维生素B1、维生素B12和维生素C)等。
培养可以在只要细胞可以生长的任何温度进行,优选大约20℃至大约40℃,或者大约35℃。培养时间可以是大约1天、大约2天、大约3天、大约4天、大约5天、大约6天、大约7天、大约8天、大约9天或者大约10天。
在一个实施方案中,所述转化体和/或突变宿主细胞是在含有肽、蛋白胨、维生素(例如维生素B)、微量元素(例如氮、硫、镁)和矿物质的培养基中培养。这种培养基的例子包括但不限于通常已知的Lysogeny broth(LB)培养基,其包含悬浮于水(例如蒸馏水或去离子水)中的胰蛋白胨、酵母提取物和NaCl。
本发明的另一方面涉及一种生产尸胺(1,5-戊二胺)的方法,包括如下步骤、由如下步骤组成或者基本上由如下步骤组成:
1a)培养本文揭示的转化体和/或突变宿主细胞,
1b)使用得自步骤1a的培养物使赖氨酸脱羧而生产尸胺,及
1c)使用得自步骤1b的培养物提取及纯化尸胺。
在某些实施方案中,所述转化体和/或突变宿主细胞可以是本文描述的任何那些转化体和/或突变宿主细胞。
培养所述转化体和/或突变宿主细胞可包括前述培养所述转化体的步骤。
例如,所述转化体和/或突变宿主细胞可以使用含有碳源和非碳源营养源的培养基培养。碳源的例子包括但不限于糖(例如碳水化合物如葡萄糖和果糖)、油和/或脂肪,脂肪酸、和/或其衍生物。油和脂肪可含有饱和和/或不饱和脂肪酸,其具有10或更多个碳原子,例如椰子油、棕榈油、棕榈仁油等。所述脂肪酸可以是饱和和/或不饱和脂肪酸,例如己酸、辛酸、癸酸、月桂酸、油酸、棕榈酸、亚油酸、亚麻酸、肉豆蔻酸等。脂肪酸衍生物的例子包括但不限于其酯及其盐。非碳源的例子包括但不限于氮源、无机盐,及其它有机营养源。
例如,培养基可含有能被转化体和/或突变宿主细胞同化的碳源,任选具有选自氮源、无机盐及其它有机营养源的一种或多种其它来源。在某些实施方案中,氮源的重量百分比是培养基的大约0.01%至大约0.1%。氮源的例子可包含氨、铵盐(例如氯化铵、硫酸铵和磷酸铵)、蛋白胨、肉膏、酵母提取物等。无机盐的例子包括但不限于磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠等。其它有机营养源的例子包括但不限于氨基酸(例如甘氨酸、丙氨酸、丝氨酸、苏氨酸和脯氨酸)、维生素(例如维生素B1、维生素B12和维生素C)等。
培养可以在只要细胞可以生长的任何温度进行,优选大约20℃至大约40℃,或者大约35℃。培养时间可以是大约1天、大约2天、大约3天、大约4天、大约5天、大约6天、大约7天、大约8天、大约9天或者大约10天。
在一个实施方案中,所述转化体和/或突变宿主细胞是在含有肽、蛋白胨、维生素(例如维生素B)、微量元素(例如氮、硫、镁)和矿物质的培养基中培养。这种培养基的例子包括但不限于通常已知的Lysogeny broth(LB)培养基,其包含悬浮于水(例如蒸馏水或去离子水)中的胰蛋白胨、酵母提取物和NaCl。
如本文所用,“使用得自步骤1a的培养物”可包括进一步处理得自步骤1a的培养物。例如使用缓冲溶液稀释所述培养物,离心所述培养物以收集细胞,将细胞重悬浮于缓冲溶液中,或者将细胞裂解为细胞裂解物,和/或从细胞裂解物中纯化赖氨酸脱羧酶。
在另一个实施方案中,所述方法的步骤1c进一步包括如下步骤:
1d)分离得自步骤1b的反应的固体与液体成分;
1e)将得自步骤1d的液体成分的pH调节为大约14或更高;
1f)从得自步骤1e的液体成分中除去水;及
1g)回收尸胺。
在步骤1d中,步骤1b的反应的固体与液体成分的分离可以通过常规离心和/或过滤方法实现。
在步骤1e中,步骤1d的液体成分的pH值可以通过加入碱例如NaOH调节。NaOH可以作为固体和/或溶液(例如水溶液)加入。
在步骤1f中,水可以通过在环境压力或真空蒸馏而除去。
在步骤1g中,尸胺可以通过在环境压力或真空蒸馏而回收。
本发明的另一方面涉及一种生产尸胺(1,5-戊二胺)的方法,包括如下步骤、由如下步骤组成或者基本上由如下步骤组成:
2a)获得包含选自如下的氨基酸序列的一种或多种赖氨酸脱羧酶多肽:SEQ IDNO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段;及
2b)使用在步骤2a中获得的一种或多种赖氨酸脱羧酶多肽使赖氨酸脱羧而生产尸胺。
所述赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc、其突变体和片段与前文描述的相同。
在某些实施方案中,所述生产尸胺的方法可进一步包括包含提取和纯化步骤2b中产生的尸胺的步骤2c。在另一个实施方案中,所述方法的步骤2c进一步包括如下步骤:
2d)分离得自步骤2b的反应的固体和液体成分;
2e)将得自步骤2d的液体成分的pH调节为大约14或更高;
2f)从得自步骤2e的液体成分中除去水;及
2g)回收尸胺。
在步骤2d中,步骤2b的固体与液体成分的分离可以通过常规的离心和/或过滤方法实现。
在步骤2e中,步骤2d的液体成分的pH可以通过加入碱例如NaOH进行调节。NaOH可以作为固体和/或溶液(例如水溶液)形式加入。
在步骤2f中,水可以通过在环境压力或真空蒸馏而除去。
在步骤2g中,尸胺可以通过在环境压力或真空蒸馏而回收。
在某些实施方案中,所述用于生产尸胺的一种或多种赖氨酸脱羧酶多肽可以是固定化的。在某些实施方案中,所述一种或多种赖氨酸脱羧酶多肽可以局限于基质上。在某些实施方案中,所述一种或多种赖氨酸脱羧酶多肽可以使用本领域技术人员已知的任何合适方法固定。固定技术的例子包括但不限于吸附(例如通过离子或疏水性相互作用)、共价结合、亲和性固定(例如将基质与一种或多种赖氨酸脱羧酶多肽的亲和性配体偶联,或者将所述一种或多种赖氨酸脱羧酶多肽与对基质具有亲和性的分子缀合),及捕获(即通过与基质共价或非共价相互作用锁定所述一种或多种赖氨酸脱羧酶多肽)。可用作基质的材料的例子包括但不限于藻酸盐、壳聚糖、壳多糖、胶原、角叉菜胶、明胶、纤维素、淀粉、果胶、琼脂糖、沸石、陶瓷、硅藻土、二氧化硅、玻璃、活性炭及木炭。
本发明的另一方面涉及根据本发明揭示的方法制备的生物基尸胺。
如本文所用,“生物基”化合物是指在Standard ASTM D6866下认为化合物是生物基的。
本发明的另一方面涉及具有如下结构1的结构的聚酰胺,包括其立体异构体:
其中
m=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
n=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
j=大约100-大约1000000;及
所述聚酰胺是从碳原子数为m的一个或多个二胺及碳原子数目为n的一个或多个二羧酸制备的,至少一个所述二胺和二羧酸包含在Standard ASTM D6866下的生物基碳,并且每个二胺或二羧酸的m或n可以相同或不同。
在一个实施方案中,所述二胺是生物基尸胺,更优选是根据本发明方法制备的生物基尸胺。二羧酸的例子包括但不限于C10二羧酸、C11二羧酸、C12二羧酸、C13二羧酸、C14二羧酸、C16二羧酸、C18二羧酸及其任意组合。在某些实施方案中,所有或部分Cn二羧酸是生物基的。
在另一实施方案中,所述聚酰胺具有上述结构,其中:
所述聚酰胺是通过生物基尸胺与一个或多个二羧酸反应形成的,更优选所述生物基尸胺是根据本发明的方法制备的;
n=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
j=大约100-大约1000000、大约1000-大约100000,或者大约1000-大约10000;及
所述二羧酸包含在Standard ASTM D6866下的生物基碳。
本发明的另一方面涉及一种生产本发明揭示的聚酰胺的方法,包括根据本发明的方法制备生物基尸胺如Cm二胺。
在一个实施方案中,所述方法进一步包括制备一种或多种生物基Cn二羧酸。
在另一个实施方案中,所述方法进一步包括通过将生物基尸胺与一种或多种生物基Cn二羧酸反应制备聚酰胺。
本发明的另一方面涉及包含本发明揭示的一种或多种聚酰胺的组合物。
在一个实施方案中,所述二胺是生物基尸胺,优选是根据本发明的方法制备的生物基尸胺。二羧酸的例子包括但不限于C10二羧酸、C11二羧酸、C12二羧酸、C13二羧酸、C14二羧酸、C16二羧酸、C18二羧酸及其任意组合。在某些实施方案中,所有或部分Cn二羧酸是生物基的。
在另一个实施方案中,所述聚酰胺具有上述结构,其中:
所述聚酰胺是通过将生物基尸胺与一种或多种二羧酸反应形成的,优选所述生物基尸胺是根据本发明的方法制备的;
n=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
j=大约100-大约1000000、大约1000-大约100000,或者大约1000-大约10000;及
所述二羧酸包含在Standard ASTM D6866下的生物基碳。
本发明的另一方面涉及一种制备1,5-二异氰酸戊烷的方法,包括:
3a)制备本发明揭示的生物基尸胺;及
3b)将得自步骤3a的生物基尸胺转化为1,5-二异氰酸戊烷。
步骤3b可包括使用任何已知方法将二胺转化为异氰酸酯。所述方法的一个实例是传统光气法,包括一步高温光气法(即在高温下混合光气与二胺以获得异氰酸盐/酯)、改良的两步光气法,及三光气法,其中使用三光气代替光气。还有不使用光气作为原料的其它方法。所述方法的一个实例是使用CO2代替光气的己二胺羰基化:将CO2添加至伯胺和有机碱的溶液中,然后将适当量的磷亲电试剂添加至反应溶液中以起始放热的脱水反应,获得异氰酸盐/酯。另一实例是氨基甲酸酯热分解法,其中将伯胺转化为氨基甲酸酯,然后将氨基甲酸酯加热至分解并产生异氰酸盐/酯。
用于氨基酸、多肽、碱基序列和核酸的缩写基于在IUPAC-IUB Communication onBiochemical Nomenclature,Eur.J.Biochem.,138:9(1984),"Guideline for PreparingSpecifications Including Base Sequences and Amino Acid Sequences"(UnitedStates Patent and Trademark Office)中指定的缩写及在本技术领域中常用的那些。
除非上下文另有明确要求,在整个说明书和权利要求书中,单词“包含”、“包括”等在包容的意义上解释(即在“包括但不限于”的意义上),与排他性或穷尽性意义相反。在本申请中使用时,单词“本文”、“以上”、“以下”、“上文”和相似输入的单词指作为整体的本申请,不是指本申请的任何特定部分。在上下文允许时,上文详细描述中使用单数或复数的单词还可以分别包括复数或单数。关于两个或更多个项目的列表的单词“或”和“和/或”涵盖单词的所有以下解释:列表中的任何项目,列表中的所有项目,以及列表中的项目的任何组合。
以下实施例意图说明本发明的多种实施方案。因此,讨论的具体实施方案不应当理解为限制本发明的范围。本领域技术人员会清楚可以进行各种等价、改变和修改而不背离本发明的范围,并且应当理解这类等价实施方案包括在本文中。此外,本公开中引用的所有参考文献均以其全文加入本文参考,就如在本文中完整示出一样。
实施例
实施例1:产酸克雷伯氏菌赖氨酸脱羧酶在大肠杆菌中的过表达
产酸克雷伯氏菌基因组DNA购自DSMZ(DSM 6673)。基因组DNA在PCR反应中用作模板,使用引物KOldc-F和KOldc-R(见图1)。引物基于GenBank登记号CP003683.1设计,其是产酸克雷伯氏菌E718基因组的一部分,含有野生型赖氨酸脱羧酶(ldc)基因。产酸克雷伯氏菌ldc核苷酸序列(SEQ ID NO:1)编码赖氨酸脱羧酶蛋白产酸克雷伯氏菌Ldc(SEQ ID NO:2)。将扩增的PCR产物使用限制酶SacI和XbaI克隆进质粒pUC18中,产生pUC18-KOldc。在验证赖氨酸脱羧酶序列之后,将pUC18-KOldc转化进大肠杆菌MG1655 K12(DSM 18039)(K12)中,产生菌株LN18(见图2)。将产酸克雷伯氏菌ldc的序列进行密码子优化以在大肠杆菌中表达(产酸克雷伯氏菌ldc-co1;SEQ ID NO:3)。将密码子优化的基因(产酸克雷伯氏菌ldc-co1)克隆进入上述的pUC18中,产生质粒pUC18-KOldc-co1,将该质粒转化进大肠杆菌K12中,产生菌株LN20(见图2)。通过将野生型大肠杆菌cadA克隆进pUC18中产生阳性对照pCIB60,由此构建含有野生型大肠杆菌cadA的质粒载体,其编码赖氨酸脱羧酶多肽CadA。将pCIB60转化进大肠杆菌K12中,产生菌株CIB60(见图2)。
将每个菌株的三个菌落在具有氨苄青霉素的LB培养基中在3mL培养物中在37℃生长过夜。第二天,将40μL每个过夜培养物接种于3mL具有氨苄青霉素的新鲜LB培养基中,至最终OD600为~0.05,生长3小时至OD600为~0.4,加入0.5mM异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)。将每个培养物在37℃再保温8小时。为检测活性,将0.9mL培养物与赖氨酸-HCl(15mg)和吡哆醛5-磷酸(PLP)(0.1mM终浓度)混合,最终反应体积为1mL。使每个反应在37℃进行2小时。通过将样品煮沸5分钟而终止反应。使用NMR立即处理样品。
表1:使用菌株CIB60(包含大肠杆菌cadA的大肠杆菌菌株)、菌株LN18(包含产酸克雷伯氏菌ldc的大肠杆菌菌株)及菌株LN20(包含产酸克雷伯氏菌ldc-co1的大肠杆菌菌株)生产尸胺
如表1所示,表达由产酸克雷伯氏菌ldc-co1DNA编码的产酸克雷伯氏菌Ldc蛋白的细胞与表达由野生型产酸克雷伯氏菌ldc DNA编码的产酸克雷伯氏菌Ldc蛋白的细胞(4.41g/kg)或者表达大肠杆菌CadA蛋白的细胞(5.69g/kg)相比,产生最高产量的尸胺(6.63g/kg)。
实施例2:使用包含产酸克雷伯氏菌lcd-co1和Plac启动子的LN20菌株生产尸胺
将包含产酸克雷伯氏菌ldc-co1和Plac启动子的三个LN20菌株菌落(见图2)在具有氨苄青霉素的LB培养基中在3mL培养物中在37℃生长过夜。第二天,将160μL每个过夜培养物接种于12mL具有氨苄青霉素的新鲜LB培养基中,至终OD600为~0.05,生长3小时至OD600为~0.4。在OD600为~0.4时,将每12mL培养物分成四个单独的3mL培养物,在每个培养物中加入IPTG,终浓度为0、0.1、0.2和0.5mM。将每个培养物在37℃再保温8小时。使用与实施例1描述的相同方案检测尸胺生产。
表2:使用LN20(包含产酸克雷伯氏菌ldc-co1和Plac启动子的大肠杆菌菌株)生产尸胺
IPTG浓度(mM) 尸胺(g/kg)
0 3.35±0.5
0.1 5.96±0.4
0.2 6.68±0.1
0.5 6.82±0.3
如表2示出,当在IPTG浓度为0.5mM诱导LN20细胞(包含产酸克雷伯氏菌ldc-co1和Plac启动子的大肠杆菌菌株)时,产生最高产量的尸胺。
实施例3:使用包含产酸克雷伯氏菌ldc-co1和Pbad启动子的LN22菌株生产尸胺
接着,产生包含产酸克雷伯氏菌ldc-co1和Pbad启动子的菌株(LN22菌株,见图2)。使用引物XhoI-F和XhoI-R,将XhoI限制位点插入pUC18-KOldc-co1质粒中lac启动子起始处上游的27个碱基对(见图1)。进行QuickChange PCR,使用含有产酸克雷伯氏菌ldc-co1基因的质粒pUC18-KOldc-co1作为模板DNA。含有插入的XhoI序列的所得质粒称作pUC18-KOldc-co1-XhoI。使用引物Pbad-F和Pbad-R从pKD46表达质粒扩增Pbad启动子和上游araC基因(见图1),并使用限制酶XhoI和SacI克隆进pUC18-KOldc-co1-XhoI中,产生质粒pUC18-KOldc-co1-Pbad。将质粒pUC18-KOldc-co1-Pbad转化进大肠杆菌菌株K12中,产生菌株LN22(见图2)。以与实施例2相同方式进行尸胺生产和分析实验,不同之处是加入阿拉伯糖代替IPTG,终浓度为0、2.5、5.0和10.0mM。
表3:使用菌株LN22(包含产酸克雷伯氏菌ldc-co1和Pbad启动子的大肠杆菌菌株)生产尸胺
阿拉伯糖浓度(mM) 尸胺(g/kg)
0 0.49±0.4
2.5 2.35±0.4
5.0 6.09±0.1
10.0 6.45±0.1
如表3示出,当在阿拉伯糖浓度为10mM诱导LN22细胞(包含产酸克雷伯氏菌ldc-co1和Pbad启动子的大肠杆菌菌株)时,产生最高产量的尸胺。
实施例4:使用LN24菌株(包含产酸克雷伯氏菌ldc-co1和Ptac启动子的大肠杆菌菌株)生产尸胺
接着,产生包含产酸克雷伯氏菌ldc-co1和Ptac启动子的菌株(LN24菌株,见图2)。相似地,使用引物Ptac-F和Ptac-R从pGEXT43扩增Ptac启动子和上游lacIq基因(见图1),并克隆进pUC18-KOldc-co1-XhoI中,产生质粒pUC18-KOldc-co1-Ptac。将pUC18-KOldc-co1-Ptac转化进K12中产生菌株LN24(见图2)。尸胺生产和分析实验如实施例2同样的方式进行。表4:使用菌株LN24(包含产酸克雷伯氏菌ldc-co1和Ptac启动子的大肠杆菌菌株)生产尸胺
IPTG浓度(mM) 尸胺(g/kg)
0 1.61±0.4
0.1 7.57±0.1
0.2 7.57±0.1
0.5 7.20±0.2
如表4示出,当在IPTG浓度为0.1或0.2mM诱导LN24细胞(包含产酸克雷伯氏菌ldc-co1和Ptac启动子的大肠杆菌菌株)时,产生最高产量的尸胺。
实施例5:比较表达产酸克雷伯氏菌Ldc或大肠杆菌CadA的菌株在分批发酵期间生产尸胺
使用表达产酸克雷伯氏菌Ldc蛋白的细胞(菌株LN20,包含产酸克雷伯氏菌ldc-co1和Plac启动子的大肠杆菌细胞,见图2)及表达大肠杆菌CadA蛋白的细胞(菌株CIB60,包含大肠杆菌cadA和Plac启动子的大肠杆菌细胞,见图2)进行分批发酵。分批培养在37℃在含有7L发酵培养基(由20g/L葡萄糖、30g/L玉米浆、10g/L酵母提取物、5g/L硫酸铵、10g/LMgSO4、0.05g/L FeSO4、0.05g/L MnSO4、5g/L CaCl2和0.1g/L氨苄青霉素组成)的10-L罐式发酵器中进行。将一个菌落接种于50mL LB培养基中,在培养摇床中在100rpm和37℃生长24小时。用50mL种子培养物接种发酵罐,pH通过加入20%(w/v)NaOH控制在大约7.0。维持3.5L/min通气,搅拌速度为400rpm及压力为0.05MPa。在指数期加入0.2mM IPTG。总发酵时间为18小时。定期取样品以测量生物量浓度及赖氨酸转化为尸胺的能力。数据在图3中示出。
在分批发酵条件下,表达大肠杆菌CadA的细胞(菌株CIB60)在18小时后达到最终OD600为15.02(见图3,黑色方框)。表达产酸克雷伯氏菌Ldc的细胞(菌株LN20)达到为14.26的更低OD600(见图3,白色方框)。葡萄糖利用率在这两菌株之间相似(见图3:LN20,白色圆形;CIB60,黑色圆形)。然而,表达产酸克雷伯氏菌Ldc的细胞(菌株LN20)能将赖氨酸-HCl转化为尸胺,速率为每分钟0.43%,这比表达大肠杆菌CadA的细胞(菌株CIB60)高24%,后者的活性为每分钟0.37%(见图3,分别为白色三角形和黑色三角形)。
实施例6:在补料分批发酵期间使用表达产酸克雷伯氏菌Ldc的菌株生产尸胺
使用表达产酸克雷伯氏菌Ldc蛋白的细胞(菌株LN24,包含产酸克雷伯氏菌ldc-co1和Ptac启动子的大肠杆菌细胞,见图2)进行补料分批发酵。补料分批培养在37℃在含有5L发酵培养基(由8g/L葡萄糖、30g/L玉米浆、10g/L酵母提取物、5g/L硫酸铵、10g/L MgSO4、0.05g/L FeSO4、0.05g/L MnSO4、5g/L CaCl2和0.1g/L氨苄青霉素组成)的10-L罐式发酵器中进行。补料溶液含有在水中的50%葡萄糖以保持发酵液中葡萄糖浓度为5-8g/L。加入25%氨水溶液以维持pH为大约7.0。维持3.5L/min通气,搅拌速度为400rpm及压力为0.05Mpa。在指数期期间每10小时加入0.1mMIPTG。总发酵时间为58小时。在58小时期间定期取样品以测量生物量浓度及赖氨酸转化为尸胺的能力。数据在图4中示出。
在补料分批发酵条件下,表达产酸克雷伯氏菌Ldc蛋白的细胞(菌株LN24)在58小时后达到OD600为大约80(见图4,白色方框),针对10g样品观测到最大活性为每分钟1.33%(0.133%/min/g)(见图4,黑色菱形)。
实施例7:对于增加的尸胺生产筛选核糖体结合位点文库
制备核糖体结合位点(RBS)DNA文库用于筛选导致增加的尸胺生产的用于产酸克雷伯氏菌Ldc蛋白表达的最佳RBS序列。在pUC18-KOldc-co1-Ptac中使用引物RBS-F和RBS-R(见图1)修饰产酸克雷伯氏菌ldc-co1中RBS DNA区域(SEQ ID NO:3)中的核苷酸。设计RBS-F以使得在相对于产酸克雷伯氏菌ldc-co1的第一个核苷酸的核苷酸位置-7至-12产生随机核苷酸序列。将五个PCR反应集合在一起,用限制酶DpnI处理以除去任何模板DNA,及进行PCR清除。将1μg纯化的DNA转化进大肠杆菌MG1655K12中,将转化体铺板以使得可以筛选单一菌落。筛选1000个菌落,标记为LN100-1099。将使用菌株LN100-1099的尸胺生产情况与LN24菌株(包含产酸克雷伯氏菌ldc-co1和Ptac的大肠杆菌菌株,见图2)尸胺生产情况进行比较。
得自筛选文库的5个菌株(LN140、LN301、LN499、LN637和LN770)证实在这1000个筛选的菌株中具有最高尸胺产量。纯化来自这些菌株的质粒并标记为pLN140、pLN301、pLN499、pLN637和pLN770。使用引物RBS-out-F(见图1)对所述质粒进行测序以确定产酸克雷伯氏菌ldc-co1的RBS DNA区域中的新RBS DNA序列。将来自最高产量的5个生产菌株的5个质粒转化进大肠杆菌MG1655K12中,产生菌株LN1100、LN1101、LN1102、LN1103和LN1104(见图2)。将使用具有突变的RBS DNA序列的菌株(LN1100、LN1101、LN1102、LN1103和LN1104)的尸胺生产与使用野生型RBS DNA序列的菌株(菌株LN24,包含产酸克雷伯氏菌ldc-co1和Ptac启动子的大肠杆菌菌株,图2)的尸胺生产进行比较。如实施例1所述进行尸胺生产和分析,不同之处是使用0.1mM IPTG和25mg赖氨酸-HCl。
表5:使用菌株LN24和得自RBS DNA筛选文库的菌株的尸胺生产
如表5所示,与具有野生型RBS DNA序列的菌株(LN24)相比,具有突变的RBS DNA序列的质粒当转化进大肠杆菌K12(LN1100、LN1101、LN1102、LN1103和LN1104)中时产生更高产量的尸胺。尸胺的最高产量在菌株LN1103中产生(即10.0±0.6g/kg),其具有RBS DNA-5序列(即TGGAGG;SEQ ID NO:18)。
实施例8:对于增加的尸胺生产筛选epPCR文库
使用易错PCR(epPCR),将在实施例7中产生最高产量尸胺的菌株的质粒(质粒pLN637,菌株LN1103)用于在产酸克雷伯氏菌ldc-co1多核苷酸序列(SEQ ID NO:3)中导入随机突变。基于pLN637的测序结果,设计引物epPCR-F(见图1)以扩增产酸克雷伯氏菌ldc-co1上游区域。使用epPCR,使用引物epPCR-F和epPCR-R(图1)从pLN637扩增产酸克雷伯氏菌ldc-co1序列。epPCR根据厂商指导使用GeneMorph II随机诱变试剂盒完成。将5个PCR反应集合在一起,用限制酶DpnI处理以除去任何模板DNA,并纯化。使用限制酶SacI和XbaI,将扩增产物克隆进pUC18-KOldc-co1-Ptac中置换产酸克雷伯氏菌ldc-co1多核苷酸序列。将纯化的DNA转化进大肠杆菌MG1655K12中,将转化体铺板以使得可以针对增加的尸胺生产筛选单一菌落。筛选来自转化的1000个单一菌落,鉴别与LN1103相比具有增加的将赖氨酸-HCl转化为尸胺的能力的菌株。从epPCR产生的这1000个突变体标记为LN2000-2999。
得自epPCR的5个菌株(即LN2377、LN2453、LN2768、LN2888和LN2964)证实在经筛选通过epPCR产生的1000个突变体中产生最高的尸胺产量。纯化这些菌株的质粒,标记为pLN2377、pLN2453、pLN2768、pLN2888和pLN2964。使用引物ldc-out-F和ldc-out-R,对这些质粒每个上的赖氨酸脱羧酶基因均进行测序(图1)。将这5个质粒转化进大肠杆菌MG1655K12中,产生菌株LN3010、LN3011、LN3012、LN3013和LN3014(图2)。如实施例7所述进行尸胺生产和分析。
表6:使用菌株LN1103和得自epPCR筛选文库的菌株的尸胺生产
如表6所示,与在产酸克雷伯氏菌ldc-co1序列中无突变的菌株(即菌株LN24)相比,用在产酸克雷伯氏菌ldc-co1序列中具有突变的质粒转化的大肠杆菌K12(即菌株LN3010、LN3011、LN3012、LN3013和LN3014)产生更高产量的尸胺。尸胺的最高产量产自菌株LN3014,其表达突变产酸克雷伯氏菌Ldc F507L蛋白(SEQ ID NO:11),获得的产量为11.2±1.0g/kg尸胺。
实施例9:在分批发酵期间对比表达产酸克雷伯氏菌Ldc或产酸克雷伯氏菌LdcF507L的菌株的尸胺生产
如实施例5所述相同方式进行表达产酸克雷伯氏菌Ldc的细胞(菌株LN24,图2)或者表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014,图2)的分批发酵。数据在图5中示出。在分批发酵条件下,表达产酸克雷伯氏菌Ldc的细胞(菌株LN24)和表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014)在18小时后达到相似的最终OD600,为大约13.6±0.1(见图5,分别为黑色方框和白色方框)。在表达产酸克雷伯氏菌Ldc的细胞(菌株LN24)中与表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014)相比,葡萄糖利用率略高(见图5,分别为黑色圆形和白色圆形)。然而,表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014)与表达产酸克雷伯氏菌Ldc的细胞(菌株LN24)相比,赖氨酸-HCl转化为尸胺的转化率高25%(见图5,分别为白色三角形和黑色三角形)。表达产酸克雷伯氏菌Ldc的细胞(菌株LN24)达到活性为每分钟0.58%,而表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014)达到活性为每分钟0.72%(见图5,在18小时时间点,分别为黑色三角形和白色三角形)。
实施例10:在补料分批发酵期间表达产酸克雷伯氏菌Ldc F507L的菌株的尸胺生产
如实施例6提供的相同方式进行表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014,图2)的补料分批发酵。数据在图6中示出。表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014)在补料分批发酵中检测58小时。在58小时后,OD600达到大约82,对于测定的10g样品观测到最大活性,为每分钟1.56%(0.156%/min/g)(见图6,在58小时时间点,分别为方框和三角形)。
参考文献
下文列举的参考文献、专利和公开的专利申请及上文说明书中引用的所有参考文献在此均以其全部内容并入作参考,就如在本文示出一样。
1.Wertz et al.Chimeric nature of two plasmids of H.alvei encoding thebacteriocins alveicins A and B.Journal of Bacteriology,(2004)186:1598-1605.
2.Datsenko KA&Wanner BL.One-step inactivation of chromosomal genes inEscherichia coli K-12using PCR products.PNAS,(2000)6640-6645.
3.Papadakis et al.Promoters and Control Elements:Designing ExpressionCassettes for Gene Therapy.Current Gene Therapy,(2004)4:89-113.
序列表
SEQ ID NO:1(产酸克雷伯氏菌ldc核苷酸序列)
ATGAACGTTATCGCAATCATGAATCACATGGGTGTCTACTTCAAAGAAGAACCCATCCGTGAACTGCATCGCGCCCTCGAACGCCTGGACTTCCGTATTGTCTACCCGAACGACCGTGAAGACTTATTAAAACTTATCGAAAACAATGCGCGTCTGTGCGGCGTGATCTTCGACTGGGATAAATATAATCTCGAACTGTGCGAAGACATCAGCAAAATGAACGAATACATGCCGCTGTACGCCTTTGCGAACACTTACTCAACGCTGGACGTGAGCCTCAACGATCTGCGGATGCAGGTTCGCTTCTTCGAATATGCGCTGGGCGCAGCGGAAGACATTGCCAACAAAATCAAACAGAATACCGACGAGTATATCGACACCATTCTGCCGCCGCTGACCAAAGCGCTGTTTAAATACGTGCGTGAAGGCAAATACACCTTCTGTACCCCAGGCCATATGGGCGGTACCGCGTTCCAGAAAAGCCCAGTCGGCAGCATCTTCTACGATTTCTTTGGTTCCAATACCATGAAATCCGATATCTCGATTTCGGTTTCTGAACTCGGTTCTCTGCTGGACCACAGCGGCCCGCACAAAGAAGCGGAAGAGTACATCGCCCGCGTCTTCAACGCGGAACGCAGCTACATGGTGACCAACGGGACCTCTACCGCCAACAAAATTGTCGGCATGTATTCCGCCCCGGCCGGTAGCACCGTGCTGATTGACCGTAACTGCCATAAATCGCTGACCCATCTGATGATGATGAGCGACATTACGCCAATCTACTTCCGCCCGACCCGCAACGCCTACGGTATCCTCGGCGGTATCCCGCAGAGCGAATTCCAGCATGCGACCATCGCGAAGCGCGTGAAAGAAACCCCGAACGCGACCTGGCCGGTGCACGCGGTTATCACCAACTCCACCTATGACGGTCTGCTGTACAACACGGACTACATCAAGAAAACCCTGGATGTGAAATCCATCCACTTTGACTCCGCGTGGGTGCCTTACACCAACTTCTCGCCGATTTATGAAGGCAAATGCGGGATGAGCGGCGGCCGCGTCGAAGGGAAAGTGATTTACGAAACCCAGTCCACGCACAAACTGCTGGCGGCGTTCTCTCAGGCCTCGATGATTCACGTTAAAGGCGACGTGAACGAAGAGACCTTTAACGAAGCCTACATGATGCACACCACCACTTCTCCGCACTACGGCGTGGTGGCCTCGACGGAAACCGCGGCGGCGATGATGAAAGGCAACGCCGGTAAGCGCCTGATTGACGGCTCTATCGAACGTTCAATCAAGTTCCGTAAAGAGATCAAACGTCTGAAAGGCGAGTCCGACGGCTGGTTCTTCGACGTCTGGCAGCCGGAACATATCGATGGCGCTGAATGCTGGCCGCTGCGCTCCGACAGCGCGTGGCACGGCTTCAAAAACATCGATAACGAGCACATGTATCTCGACCCGATTAAAGTCACGCTGCTGACTCCGGGGATGAAGAAAGACGGCACCATGGATGAGTTCGGTATTCCGGCGAGCATCGTGGCGAAGTATCTCGACGAGCACGGTATCGTGGTCGAAAAAACCGGTCCGTACAACCTGCTGTTCCTGTTCAGTATCGGTATCGACAAAACCAAAGCGCTGAGCCTGCTGCGTGCGCTGACCGATTTCAAACGCGCGTTCGACCTGAACCTGCGGGTGAAAAACATGCTGCCGTCGCTGTATCGTGAAGATCCGGAATTCTACGAAAACATGCGCGTTCAGGAACTGGCGCAGAACATTCATAAACTGATTGAGCACCACAACCTGCCGGATCTGATGTTCCGCGCGTTCGAAGTGCTGCCGACCATGATGATCACGCCGTACGCCGCGTTCCAGAAAGAGCTGCACGGTCAGACCGAAGAGGTGTATCTCGAAGAGATGGTGGGCCGCGTCAACGCCAATATGATCCTGCCGTATCCTCCGGGAGTGCCGCTGGTGATGCCGGGTGAAATGATCACCGAAGAGAGCCGTCCGGTGCTGGAGTTCCTGCAGATGCTGTGCGAAATCGGCGCCCACTATCCGGGCTTCGAAACCGATATCCACGGCGCCTATCGTCAGGCGGATGGTCGTTACACCGTTAAAGTGCTGAAAGAAGAAAATAACAAATAA
SEQ ID NO:2(产酸克雷伯氏菌Ldc氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:3(产酸克雷伯氏菌ldc-co1核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:4(产酸克雷伯氏菌ldc-co1A859G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTGAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:5(产酸克雷伯氏菌Ldc K287E氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAERVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:6(产酸克雷伯氏菌ldc-co1C1193G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCAGCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:7(产酸克雷伯氏菌Ldc T398S氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTSTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:8(产酸克雷伯氏菌ldc-co1C1306G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTGGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:9(产酸克雷伯氏菌Ldc R436G氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFGKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:10(产酸克雷伯氏菌ldc-co1C1521G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTGGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:11(产酸克雷伯氏菌Ldc F507L氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDELGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:12(产酸克雷伯氏菌ldc-co1T1820A核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTACCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:13(产酸克雷伯氏菌Ldc F607Y氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:14(RBS DNA-1)
GGAGAT
SEQ ID NO:15(RBS DNA-2)
AGGACT
SEQ ID NO:16(RBS DNA-3)
GAGGAG
SEQ ID NO:17(RBS DNA-4)
GAGGAA
SEQ ID NO:18(RBS DNA-5)
TGGAGG
SEQ ID NO:19(RBS DNA-6)
CAGGAG
SEQ ID NO:20(Plac启动子核苷酸序列)
TTTACACTTTATGCTTCCGGCTCGTATGTTG
SEQ ID NO:21(Pbad启动子核苷酸序列)
GACGCTTTTTATCGCAACTCTCTACTGT
SEQ ID NO:22(Ptac启动子核苷酸序列)
TTGACAATTAATCATCGGCTCGTATAATG
SEQ ID NO:23(aat核苷酸序列)
>gb|AY271828.1|:385-1717H.alvei质粒pAlvA,完整序列
SEQ ID NO:24(aai核苷酸序列)
>gb|AY271828.1|:1734-2069H.alvei质粒pAlvA,完整序列
SEQ ID NO:25(abt核苷酸序列)
>gb|AY271829.1|:384-1566H.alvei质粒pAlvB,完整序列
SEQ ID NO:26(abi核苷酸序列)
>gb|AY271829.1|:1583-1918H.alvei质粒pAlvB,完整序列
序列表
<110> 上海凯赛生物技术研发中心有限公司
凯赛生物产业有限公司
<120> 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用
<130> 77705-8007.WO00
<160> 26
<170> PatentIn version 3.5
<210> 1
<211> 2148
<212> DNA
<213> Klebsiella oxytoca
<400> 1
atgaacgtta tcgcaatcat gaatcacatg ggtgtctact tcaaagaaga acccatccgt 60
gaactgcatc gcgccctcga acgcctggac ttccgtattg tctacccgaa cgaccgtgaa 120
gacttattaa aacttatcga aaacaatgcg cgtctgtgcg gcgtgatctt cgactgggat 180
aaatataatc tcgaactgtg cgaagacatc agcaaaatga acgaatacat gccgctgtac 240
gcctttgcga acacttactc aacgctggac gtgagcctca acgatctgcg gatgcaggtt 300
cgcttcttcg aatatgcgct gggcgcagcg gaagacattg ccaacaaaat caaacagaat 360
accgacgagt atatcgacac cattctgccg ccgctgacca aagcgctgtt taaatacgtg 420
cgtgaaggca aatacacctt ctgtacccca ggccatatgg gcggtaccgc gttccagaaa 480
agcccagtcg gcagcatctt ctacgatttc tttggttcca ataccatgaa atccgatatc 540
tcgatttcgg tttctgaact cggttctctg ctggaccaca gcggcccgca caaagaagcg 600
gaagagtaca tcgcccgcgt cttcaacgcg gaacgcagct acatggtgac caacgggacc 660
tctaccgcca acaaaattgt cggcatgtat tccgccccgg ccggtagcac cgtgctgatt 720
gaccgtaact gccataaatc gctgacccat ctgatgatga tgagcgacat tacgccaatc 780
tacttccgcc cgacccgcaa cgcctacggt atcctcggcg gtatcccgca gagcgaattc 840
cagcatgcga ccatcgcgaa gcgcgtgaaa gaaaccccga acgcgacctg gccggtgcac 900
gcggttatca ccaactccac ctatgacggt ctgctgtaca acacggacta catcaagaaa 960
accctggatg tgaaatccat ccactttgac tccgcgtggg tgccttacac caacttctcg 1020
ccgatttatg aaggcaaatg cgggatgagc ggcggccgcg tcgaagggaa agtgatttac 1080
gaaacccagt ccacgcacaa actgctggcg gcgttctctc aggcctcgat gattcacgtt 1140
aaaggcgacg tgaacgaaga gacctttaac gaagcctaca tgatgcacac caccacttct 1200
ccgcactacg gcgtggtggc ctcgacggaa accgcggcgg cgatgatgaa aggcaacgcc 1260
ggtaagcgcc tgattgacgg ctctatcgaa cgttcaatca agttccgtaa agagatcaaa 1320
cgtctgaaag gcgagtccga cggctggttc ttcgacgtct ggcagccgga acatatcgat 1380
ggcgctgaat gctggccgct gcgctccgac agcgcgtggc acggcttcaa aaacatcgat 1440
aacgagcaca tgtatctcga cccgattaaa gtcacgctgc tgactccggg gatgaagaaa 1500
gacggcacca tggatgagtt cggtattccg gcgagcatcg tggcgaagta tctcgacgag 1560
cacggtatcg tggtcgaaaa aaccggtccg tacaacctgc tgttcctgtt cagtatcggt 1620
atcgacaaaa ccaaagcgct gagcctgctg cgtgcgctga ccgatttcaa acgcgcgttc 1680
gacctgaacc tgcgggtgaa aaacatgctg ccgtcgctgt atcgtgaaga tccggaattc 1740
tacgaaaaca tgcgcgttca ggaactggcg cagaacattc ataaactgat tgagcaccac 1800
aacctgccgg atctgatgtt ccgcgcgttc gaagtgctgc cgaccatgat gatcacgccg 1860
tacgccgcgt tccagaaaga gctgcacggt cagaccgaag aggtgtatct cgaagagatg 1920
gtgggccgcg tcaacgccaa tatgatcctg ccgtatcctc cgggagtgcc gctggtgatg 1980
ccgggtgaaa tgatcaccga agagagccgt ccggtgctgg agttcctgca gatgctgtgc 2040
gaaatcggcg cccactatcc gggcttcgaa accgatatcc acggcgccta tcgtcaggcg 2100
gatggtcgtt acaccgttaa agtgctgaaa gaagaaaata acaaataa 2148
<210> 2
<211> 715
<212> PRT
<213> Klebsiella oxytoca
<400> 2
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 3
<211> 2148
<212> DNA
<213> synthetic
<400> 3
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 4
<211> 2148
<212> DNA
<213> synthetic
<400> 4
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctga gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 5
<211> 715
<212> PRT
<213> synthetic
<400> 5
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Glu Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 6
<211> 2148
<212> DNA
<213> synthetic
<400> 6
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac cagcacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 7
<211> 715
<212> PRT
<213> synthetic
<400> 7
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Ser Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 8
<211> 2148
<212> DNA
<213> synthetic
<400> 8
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttggtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 9
<211> 715
<212> PRT
<213> synthetic
<400> 9
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Gly Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 10
<211> 2148
<212> DNA
<213> synthetic
<400> 10
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt gggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 11
<211> 715
<212> PRT
<213> synthetic
<400> 11
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Leu Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 12
<211> 2148
<212> DNA
<213> synthetic
<400> 12
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgta ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 13
<211> 715
<212> PRT
<213> synthetic
<400> 13
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 14
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 14
nnggagatnn 10
<210> 15
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 15
nnaggactnn 10
<210> 16
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 16
nngaggagnn 10
<210> 17
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 17
nngaggaann 10
<210> 18
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 18
nntggaggnn 10
<210> 19
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 19
nncaggagnn 10
<210> 20
<211> 31
<212> DNA
<213> synthetic
<400> 20
tttacacttt atgcttccgg ctcgtatgtt g 31
<210> 21
<211> 28
<212> DNA
<213> synthetic
<400> 21
gacgcttttt atcgcaactc tctactgt 28
<210> 22
<211> 29
<212> DNA
<213> synthetic
<400> 22
ttgacaatta atcatcggct cgtataatg 29
<210> 23
<211> 1333
<212> DNA
<213> Hafnia alvei
<400> 23
ttgactttgt taaaagtcag gcataagatc aaaatactgt atatataaca atgtatttat 60
atacagtatt ttatactttt tatctaacgt cagagagggc aatattatga gtggtggaga 120
tggcaagggt cacaatagtg gagcacatga ttccggtggc agcattaatg gaacttctgg 180
gaaaggtggg ccatcaagcg gaggagcatc agataattct gggtggagtt cggaaaataa 240
cccgtggggc ggtggtaact cgggaatgat tggtggcagt caaggaggta acggagctaa 300
tcatggtggc gaaaatacat cttctaacta tgggaaagat gtatcacgcc aaatcggtga 360
tgcgatagcc agaaaggaag gcatcaatcc gaaaatattc actgggtact ttatccgttc 420
agatggatat ttgatcggaa taacgccact tgtcagtggt gatgcctttg gcgttaatct 480
tggcctgttc aataacaatc aaaatagtag tagtgaaaat aagggatgga atggaaggaa 540
tggagatggc attaaaaata gtagccaagg tggatggaag attaaaacta atgaacttac 600
ttcaaaccaa gtagctgctg ctaaatccgt tccagaacct aaaaatagta aatattataa 660
gtccatgaga gaagctagcg atgaggttat taattctaat ttaaaccaag ggcatggagt 720
tggtgaggca gctagagctg aaagagatta cagagaaaaa gtaaagaacg caatcaatga 780
taatagtccc aatgtgctac aggatgctat taaatttaca gcagattttt ataaggaagt 840
ttttaacgct tacggagaaa aagccgaaaa actagccaag ttattagctg atcaagctaa 900
aggtaaaaag atccgcaatg tagaagatgc attgaaatct tatgaaaaac acaaggctaa 960
cattaacaaa aaaatcaatg cgaaagatcg cgaagctatc gccaaggctt tggagtctat 1020
ggatgtagaa aaagccgcaa aaaatatatc caagttcagc aaaggactag gttgggttgg 1080
cccagctatc gatataactg attggtttac agaattatac aaagcagtga aaactgataa 1140
ttggagatct ctttatgtta aaactgaaac tattgcagta gggctagctg caacccatgt 1200
caccgcctta gcattcagtg ctgtcttggg tgggcctata ggtattttag gttatggttt 1260
gattatggct ggggttgggg cgttagttaa cgagacaata gttgacgagg caaataaggt 1320
cattgggatt taa 1333
<210> 24
<211> 336
<212> DNA
<213> Hafnia alvei
<400> 24
ctatatttta gcggtcacat tttttatttc aaaacaaaca gaaagaacac caataggaat 60
tgatgtcata aaaataaaaa taaaatacaa agtcattaaa tatgtttttg gcacaccatc 120
cttaaaaaaa cctgttttcc aaaattcttt tttcgtatat ctaagcgctg ctttctctat 180
tagaaaccga gagaaaggaa atagaatagc gctagccaaa ccaaagattc tgagcgcaat 240
tattttaggt tcgtcatcac cataactggc gtaaagaata caagcagcca taaagtatcc 300
ccaaaacata ttatgtatgt aatatttcct tgtcat 336
<210> 25
<211> 1077
<212> DNA
<213> Hafnia alvei
<400> 25
atgagtggtg gagacggtaa aggtcacaat agtggagcac atgattccgg tggcagcatt 60
aatggaactt cggggaaagg tggacctgat tctggtggcg gatattggga caaccatcca 120
catattacaa tcaccggtgg acgggaagta ggtcaagggg gagctggtat caactggggt 180
ggtggttctg gtcatggtaa cggcgggggc tcagttgcca tccaagaata taacacgagt 240
aaatatccta acacgggagg atttcctcct cttggagacg ctagctggct gttaaatcct 300
ccaaaatggt cggttattga agtaaaatca gaaaactcag catggcgctc ttatattact 360
catgttcaag gtcatgttta caaattgact tttgatggta cgggtaagct cattgatacc 420
gcgtatgtta attatgaacc cagtgatgat actcgttgga gcccgcttaa aagttttaaa 480
tataataaag gaaccgctga aaaacaggtt agggatgcca ttaacaatga aaaagaagca 540
gttaaggacg ctgttaaatt tactgcagac ttctataaag aggtttttaa ggtttacgga 600
gaaaaagccg agaagctcgc taagttatta gcagatcaag ctaaaggcaa aaaggttcgc 660
aacgtagaag atgccttgaa atcttatgaa aaatataaga ctaacattaa caaaaaaatc 720
aatgcgaaag atcgcgaagc tattgctaaa gccttggagt ctatggatgt aggaaaagcc 780
gcaaaaaata tagccaagtt cagtaaagga ctaggttggg ttggccctgc tatcgatata 840
actgattggt ttacagaatt atacaaggca gtggaaactg ataattggag atctttttat 900
gttaaaactg aaactattgc agtagggcta gctgcaaccc atgttgccgc cttggcattc 960
agcgctgtct tgggtgggcc tgtaggtatt ttgggttatg gtttgattat ggctggggtt 1020
ggggcgttag ttaatgagac aatagttgac gaggcaaata aggttattgg gctttaa 1077
<210> 26
<211> 336
<212> DNA
<213> Hafnia alvei
<400> 26
ctataattta gcggtcacat tttttatttc aaaaaaaaca gaaataacac ctataggaat 60
tgatgtcata aaaataaaaa ttaaatacaa agtcattaaa tatgtttttg gcacgccatc 120
cttaaaaaaa ccagtttccc aaaattcttt tttcgtatat ctaagcgcgg ttttctctat 180
taaaaaccga gagaaaggga ataggatagc actagccaaa ccaaagattc tgagcgcaat 240
tattttaggt tcgttatccc cataactggc gtaaagaata caaacagcca taaagtaccc 300
ccaaaacata ttatgtatat aatatttcct tgtcat 336

Claims (31)

1.一种赖氨酸脱羧酶多肽,其包含选自如下的氨基酸序列:SEQ ID NO:2的突变体(即产酸克雷伯氏菌(K.oxytoca)Ldc的突变体)及其片段,和SEQ ID NO:2的片段(即产酸克雷伯氏菌Ldc的片段),其中所述突变体或片段与SEQ ID NO:2具有至少95%序列相同性。
2.权利要求1的赖氨酸脱羧酶多肽,其中SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,及在氨基酸位置607处突变为X5的突变;X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸;且条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸以及X5不是苯丙氨酸。
3.权利要求2的赖氨酸脱羧酶多肽,其中SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)包含选自如下的氨基酸序列:SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQID NO:7(即产酸克雷伯氏菌Ldc T398S),SEQ ID NO:9(即产酸克雷伯氏菌Ldc R436G),SEQID NO:11(即产酸克雷伯氏菌Ldc F507L)及SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。
4.一种非天然存在的DNA多核苷酸,其包含一个或多个赖氨酸脱羧酶核苷酸序列,其中所述多核苷酸编码一种或多种权利要求1-3任一项的赖氨酸脱羧酶多肽。
5.一种非天然存在的DNA多核苷酸,其包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,和SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性并且其中所述多核苷酸编码一个或多个包含选自如下的氨基酸序列的赖氨酸脱羧酶多肽:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,和SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段。
6.权利要求5的非天然存在的DNA多核苷酸,其中SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)包含SEQ ID NO:3(即产酸克雷伯氏菌ldc-co1)的赖氨酸脱羧酶核苷酸序列或其片段。
7.权利要求6的非天然存在的DNA多核苷酸,其中SEQ ID NO:3的赖氨酸脱羧酶核苷酸序列包含选自如下的一个或多个突变:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,及在核苷酸位置1820处突变为Z5的突变;Z1、Z2、Z3、Z4和Z5各自独立地选自腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T以及Z5不是T。
8.权利要求6的非天然存在的DNA多核苷酸,其中SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)包含选自如下的赖氨酸脱羧酶核苷酸序列:SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1 A859G),SEQ ID NO:6(产酸克雷伯氏菌ldc-co1 C1193G),SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1 C1306G),SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1 C1521G)及SEQID NO:12(即产酸克雷伯氏菌ldc-co1 T1820A)。
9.权利要求4-8任一项的非天然存在的DNA多核苷酸,进一步包含选自如下的一个或多个核糖体结合位点(RBS)DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBS DNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBS DNA-5)和SEQ ID NO:19(即RBS DNA-6)。
10.权利要求4-9任一项的非天然存在的DNA多核苷酸,进一步包含选自如下的一个或多个启动子核苷酸序列:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列),及SEQ ID NO:22(即Ptac启动子序列)。
11.权利要求4-8的非天然存在的DNA多核苷酸,其中,为在大肠杆菌细胞中的最佳多肽表达,所述多核苷酸序列已经经密码子优化。
12.一种表达质粒载体,其包含:
包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列的DNA多核苷酸:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,和SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性,及其中所述多核苷酸编码包含选自如下的氨基酸序列的一种或多种赖氨酸脱羧酶多肽:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,和SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段;及
骨架质粒,其能在宿主细胞中自主复制,
其中所述表达质粒载体用于生产赖氨酸衍生产物。
13.权利要求12的表达质粒载体,其中SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,及在氨基酸位置607处突变为X5的突变;X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸;且条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,及X5不是苯丙氨酸。
14.权利要求13的表达质粒载体,其中SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)包含选自如下的氨基酸序列:SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ IDNO:7(即产酸克雷伯氏菌Ldc T398S),SEQ ID NO:9(即产酸克雷伯氏菌Ldc R436G),SEQ IDNO:11(即产酸克雷伯氏菌Ldc F507L)及SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。
15.权利要求12的表达质粒载体,其中SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)包含SEQ ID NO:3(即产酸克雷伯氏菌ldc-co1)的赖氨酸脱羧酶核苷酸序列或其片段。
16.权利要求15的表达质粒载体,其中SEQ ID NO:3的赖氨酸脱羧酶核苷酸序列包含选自如下的一个或多个突变:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,及在核苷酸位置1820处突变为Z5的突变;Z1、Z2、Z3、Z4和Z5各自独立地选自腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,以及Z5不是T。
17.权利要求12的表达质粒载体,其中SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)包含选自如下的赖氨酸脱羧酶核苷酸序列:SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1 A859G),SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1 C1193G),SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1 C1306G),SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1 C1521G)及SEQ IDNO:12(即产酸克雷伯氏菌ldc-co1 T1820A)。
18.权利要求12-17任一项的表达质粒载体,其中所述宿主细胞是大肠杆菌细胞。
19.权利要求12-18任一项的表达质粒载体,其中,为在大肠杆菌细胞中的最佳多肽表达,所述DNA多核苷酸序列经密码子优化。
20.权利要求19的表达质粒载体,其中所述骨架质粒是大肠杆菌表达质粒载体。
21.权利要求20的表达质粒载体,其中所述骨架质粒选自pUC18、pUC19、pBR322、pACYC、pET、pSC101及任何它们的衍生质粒。
22.权利要求12-21任一项的表达质粒载体,其中所述DNA多核苷酸进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5),及SEQ ID NO:19(即RBS DNA-6)。
23.权利要求12-22任一项的表达质粒载体,其中所述DNA多核苷酸进一步包含选自如下的一个或多个启动子核苷酸序列:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列),及SEQ ID NO:22(即Ptac启动子序列)。
24.一种转化体,其在宿主细胞中包含一个或多个权利要求12-23任一项的表达质粒载体。
25.一种突变宿主细胞,其包含整合进宿主细胞染色体中的权利要求4-11任一项的DNA多核苷酸。
26.权利要求25的突变宿主细胞,其中所述宿主细胞是大肠杆菌细胞。
27.一种生产一种或多种赖氨酸脱羧酶多肽的方法,包括:
获得权利要求25或26的突变宿主细胞和/或权利要求24的转化体;
在有效表达所述一种或多种赖氨酸脱羧酶多肽的条件下培养所述突变宿主细胞和/或转化体;及
收获所述一种或多种赖氨酸脱羧酶多肽。
28.一种生产尸胺(1,5-戊二胺)的方法,包括:
1a)培养权利要求25或26的突变宿主细胞和/或权利要求24的转化体;
1b)使用得自步骤1a的培养物使赖氨酸脱羧而生产尸胺;及
1c)使用得自步骤1b的培养物提取并纯化尸胺。
29.一种生产尸胺(1,5-戊二胺)的方法,包括:
2a)获得一种或多种权利要求1-3任一项的赖氨酸脱羧酶多肽;及
2b)使用在步骤2a中获得的一种或多种赖氨酸脱羧酶多肽使赖氨酸脱羧而生产尸胺。
30.权利要求29的方法,其中所述一种或多种赖氨酸脱羧酶多肽固定在表面上。
31.权利要求30的方法,进一步包括:
2c)提取并纯化在步骤2b中生产的尸胺。
CN201580062908.8A 2015-01-30 2015-01-30 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用 Active CN107074915B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2015/071978 WO2016119230A1 (en) 2015-01-30 2015-01-30 Expression of klebsiella oxytoca polypeptides involved in lysine decarboxylation, and methods and applications thereof

Publications (2)

Publication Number Publication Date
CN107074915A true CN107074915A (zh) 2017-08-18
CN107074915B CN107074915B (zh) 2021-04-02

Family

ID=56542224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580062908.8A Active CN107074915B (zh) 2015-01-30 2015-01-30 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用

Country Status (5)

Country Link
US (2) US10584149B2 (zh)
EP (1) EP3250583B1 (zh)
CN (1) CN107074915B (zh)
ES (1) ES2871097T3 (zh)
WO (1) WO2016119230A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108795916A (zh) * 2018-07-16 2018-11-13 南京工业大学 一种赖氨酸脱羧酶突变体、其编码基因及其表达和应用
CN108796619A (zh) * 2017-05-05 2018-11-13 上海凯赛生物技术研发中心有限公司 赖氨酸脱羧酶突变体文库构建及高或低活力突变株高通量筛选的方法
CN110106123A (zh) * 2019-05-31 2019-08-09 河南农业大学 克雷伯氏菌株z3及其在还原六价铬离子中的应用
CN110546255A (zh) * 2017-05-16 2019-12-06 上海凯赛生物技术股份有限公司 对赖氨酸脱羧酶酶类的修饰
CN110904102A (zh) * 2018-09-18 2020-03-24 中国科学院上海生命科学研究院 一种用于重组蛋白质表达的启动子
CN114657167A (zh) * 2020-12-23 2022-06-24 苏州引航生物科技有限公司 一种脱羧酶及5-羟色胺的制备方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110291192B (zh) * 2016-12-30 2023-12-08 上海凯赛生物技术股份有限公司 在可滴定氨基酸具有修饰的赖氨酸脱羧酶
EP3562837A4 (en) * 2016-12-30 2020-12-30 Cathay Biotech Inc. MODIFIED LYSIN DECARBOXYLASE ENZYMES
CN108795912B (zh) * 2017-05-05 2022-08-02 上海凯赛生物技术股份有限公司 赖氨酸脱羧酶突变体及其应用
CN111748549B (zh) * 2017-05-16 2022-09-23 中国科学院天津工业生物技术研究所 新的赖氨酸脱羧酶突变体及其应用
CN112899261B (zh) * 2021-03-25 2022-03-29 美邦美和生物科技有限公司 赖氨酸脱羧酶突变体、其编码基因及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981202A (zh) * 2008-01-23 2011-02-23 巴斯夫欧洲公司 发酵生产1,5-二氨基戊烷的方法
CN102424811A (zh) * 2011-12-13 2012-04-25 天津科技大学 一种产尸胺工程菌

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101981202A (zh) * 2008-01-23 2011-02-23 巴斯夫欧洲公司 发酵生产1,5-二氨基戊烷的方法
CN102424811A (zh) * 2011-12-13 2012-04-25 天津科技大学 一种产尸胺工程菌

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
GENBANK: "lysine decarboxylase CadA [Klebsiella sp. OBRC7],NCBI Reference Sequence: WP_009652676.1", 《GENBANK》 *
GENBANK: "MULTISPECIES: lysine decarboxylase CadA [Klebsiella],NCBI Reference Sequence: WP_004848492.1", 《GENBANK》 *
LOTHAR F. FECKER ET AL.: "Cloning and characterization of a lysine decarboxylase gene from Hafnia alvei", 《MOL GEN GENET》 *
NAIQIANG LI ET AL.: "Cadaverine Production by Heterologous Expression of Klebsiella oxytoca Lysine Decarboxylase", 《BIOTECHNOLOGY AND BIOPROCESS ENGINEERING》 *
NAIQIANG LI ET AL.: "Improved cadaverine production from mutant Klebsiella oxytoca lysine decarboxylase", 《ENG. LIFE SCI.》 *
ZHI-GANG QIAN ET AL.: "Metabolic Engineering of Escherichia coli for the Production of Cadaverine: A Five Carbon Diamine", 《BIOTECHNOLOGY AND BIOENGINEERING》 *
李乃强: "赖氨酸脱羧酶高效表达、分子定向进化及其催化合成戊二胺的反应过程特性", 《中国博士学位论文全文数据库 基础科学辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108796619A (zh) * 2017-05-05 2018-11-13 上海凯赛生物技术研发中心有限公司 赖氨酸脱羧酶突变体文库构建及高或低活力突变株高通量筛选的方法
CN110546255A (zh) * 2017-05-16 2019-12-06 上海凯赛生物技术股份有限公司 对赖氨酸脱羧酶酶类的修饰
CN110546255B (zh) * 2017-05-16 2023-07-04 上海凯赛生物技术股份有限公司 对赖氨酸脱羧酶酶类的修饰
CN108795916A (zh) * 2018-07-16 2018-11-13 南京工业大学 一种赖氨酸脱羧酶突变体、其编码基因及其表达和应用
CN108795916B (zh) * 2018-07-16 2020-02-21 南京工业大学 一种赖氨酸脱羧酶突变体、其编码基因及其表达和应用
CN110904102A (zh) * 2018-09-18 2020-03-24 中国科学院上海生命科学研究院 一种用于重组蛋白质表达的启动子
WO2020057397A1 (zh) * 2018-09-18 2020-03-26 中国科学院上海生命科学研究院 一种用于重组蛋白质表达的启动子
CN110106123A (zh) * 2019-05-31 2019-08-09 河南农业大学 克雷伯氏菌株z3及其在还原六价铬离子中的应用
CN110106123B (zh) * 2019-05-31 2021-09-24 河南农业大学 克雷伯氏菌株z3及其在还原六价铬离子中的应用
CN114657167A (zh) * 2020-12-23 2022-06-24 苏州引航生物科技有限公司 一种脱羧酶及5-羟色胺的制备方法
CN114657167B (zh) * 2020-12-23 2023-09-05 苏州引航生物科技有限公司 一种脱羧酶及5-羟色胺的制备方法

Also Published As

Publication number Publication date
US20180371028A1 (en) 2018-12-27
US11261217B2 (en) 2022-03-01
WO2016119230A1 (en) 2016-08-04
CN107074915B (zh) 2021-04-02
EP3250583B1 (en) 2021-03-03
EP3250583A4 (en) 2018-07-11
US20200157152A1 (en) 2020-05-21
EP3250583A1 (en) 2017-12-06
ES2871097T3 (es) 2021-10-28
US10584149B2 (en) 2020-03-10

Similar Documents

Publication Publication Date Title
CN107074915A (zh) 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用
CN101883853B (zh) 具有生产1,4-丁二醇能力的突变体和使用该突变体制备1,4-丁二醇的方法
CA2440195C (fr) Genes synthetiques et plasmides bacteriens depourvus de cpg
TWI716841B (zh) 新穎啟動子及使用該啟動子製造l-胺基酸的方法
US10647976B2 (en) Expression of polypeptides involved in lysine decarboxylation, and methods and applications thereof
WO2016054792A1 (en) Expression of recombinant tetracycline efflux pumps for the production of lysine or lysine-derived products, and methods and applications thereof
CN109415418B (zh) 通过包含编码糖磷酸转移酶系统(pts)的基因的微生物发酵产生感兴趣的分子的方法
ES2603984T3 (es) Nuevos productos génicos de Bacillus licheniformis que forman o que degradan poliaminoácidos y procedimientos de producción biotecnológicos mejorados basados en los mismos
CN111748549A (zh) 新的赖氨酸脱羧酶突变体及其应用
CN113667682A (zh) Yh66-rs11190基因突变体及其在制备l-缬氨酸中的应用
KR20170069452A (ko) Z-도메인 및 칼시퀘스트린 융합 단백질을 이용한 항체의 분리 및 정제 방법
JP2021531817A (ja) 変異体RpoCコード配列を含む核酸分子
Liu et al. Flavobacterium phragmitis sp. nov., an endophyte of reed (Phragmites australis)
CN103667165B (zh) 高产l‑赖氨酸的生产菌株及其应用
CN110904062B (zh) 一株高产l-丙氨酸的菌株
US20230332116A1 (en) Polypeptide with aspartate kinase activity and use thereof in production of amino acid
DE69920470T2 (de) Neuartiges gen und transformant, welcher dieses beinhaltet
EP1097990B1 (en) A mutant kanamycin nucleotidyltransferase and a method of screening thermophilic bacteria using the same
CN111334445B (zh) 长链二元酸生产菌株及其制备方法和应用
Jakubauskas et al. Bioinformatic and partial functional analysis of pEspA and pEspB, two plasmids from Exiguobacterium arabatum sp. nov. RFL1109
KR100251523B1 (ko) 고온성 절대 공생 미생물 심비오박테리움의 공생균주인 고온성 미생물 바실러스속 균주 유래의 내열성 글루타메이트라세마아제를 암호하는 유전자 및 이를 이용한 내열성 글루타메이트라세마아제의 제조방법
EP1211312B1 (en) Method for sterilizing transformed cells
CN111411106A (zh) 一种耐高温复合菌制剂
CN116323646A (zh) 具有高脂质生产力的重组藻类
JP2003230381A (ja) 黒麹菌のフェリクローム生合成に関与するクラスター遺伝子

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Floor 4, building 5, No. 1690, Cailun Road, Zhangjiang hi tech park, Pudong New Area, Shanghai

Applicant after: CATHAY R&D CENTER Co.,Ltd.

Applicant after: CATHAY INDUSTRIAL BIOTECH Ltd.

Address before: 201203 Shanghai City, Pudong New Area Zhangjiang High Tech Park 1690 Cailun Road No. 5 Building 4 layer

Applicant before: CATHAY R&D CENTER Co.,Ltd.

Applicant before: CATHAY INDUSTRIAL BIOTECH Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191016

Address after: Floor 4, building 5, No. 1690, Cailun Road, Zhangjiang hi tech park, Pudong New Area, Shanghai

Applicant after: CATHAY R&D CENTER Co.,Ltd.

Applicant after: CIBT USA

Address before: 201203 Shanghai City, Pudong New Area Zhangjiang High Tech Park 1690 Cailun Road No. 5 Building 4 layer

Applicant before: CATHAY R&D CENTER Co.,Ltd.

Applicant before: CATHAY INDUSTRIAL BIOTECH Ltd.

GR01 Patent grant
GR01 Patent grant