CN111485008A - 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法 - Google Patents

顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法 Download PDF

Info

Publication number
CN111485008A
CN111485008A CN202010074917.1A CN202010074917A CN111485008A CN 111485008 A CN111485008 A CN 111485008A CN 202010074917 A CN202010074917 A CN 202010074917A CN 111485008 A CN111485008 A CN 111485008A
Authority
CN
China
Prior art keywords
cis
protein
ala
acid
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010074917.1A
Other languages
English (en)
Inventor
藤井匡
田村圭辅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microbiopharm Japan Co Ltd
Original Assignee
Japan Mccullough Biopharmaceutical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Mccullough Biopharmaceutical Co ltd filed Critical Japan Mccullough Biopharmaceutical Co ltd
Publication of CN111485008A publication Critical patent/CN111485008A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Abstract

本发明涉及具有生产顺式‑5‑羟基‑L‑六氢吡啶甲酸的能力的基因重组微生物、以及利用这些微生物制备顺式‑5‑羟基‑L‑六氢吡啶甲酸的方法。本发明提供了制备顺式‑5‑羟基‑L‑六氢吡啶甲酸的方法。本发明的制备方法可应用能够直接生产顺式‑5‑羟基‑L‑六氢吡啶甲酸的基因重组微生物。本发明也提供了该基因重组微生物。本发明的优选方式的特征是,在培养基中培养具有下列DNA的基因重组微生物:编码参与L‑六氢吡啶甲酸的生物合成的蛋白质的DNA、以及编码具有L‑六氢吡啶甲酸的顺式‑5位羟化酶活性的蛋白质的DNA,并从该培养液获得顺式‑5‑羟基‑L‑六氢吡啶甲酸。

Description

顺式-5-羟基-L-六氢吡啶甲酸的生物学制备方法
本申请是国际申请日为2013年6月12日、国际申请号为PCT/JP2013/066218、进入中国国家阶段的申请号为201380030961.0、发明名称为“顺式-5-羟基-L-六氢吡啶甲酸的生物学制备方法”的PCT申请的分案申请。
技术领域
本发明涉及具有生产顺式-5-羟基-L-六氢吡啶甲酸的能力的基因重组微生物、以及利用这些微生物制备顺式-5-羟基-L-六氢吡啶甲酸的方法。
背景技术
顺式-5-羟基-L-六氢吡啶甲酸是具有在L-六氢吡啶甲酸中引入羟基的结构的修饰氨基酸中的一种,是用作药物合成中间体的物质。
另一方面,L-六氢吡啶甲酸(或者2-哌啶甲酸或L-同型脯氨酸)的生物学制备方法已被报告(非专利文献1、非专利文献2、以及专利文献1)。这些报告中,通过具有以下多核苷酸(有时也称为DNA)的大肠杆菌,从L-赖氨酸制备L-六氢吡啶甲酸。
a)编码具有L-赖氨酸6-氨基转移酶酶活性的蛋白质的多核苷酸,
b)编码具有吡咯啉-5-羧酸还原酶(リダクターゼ酵素)酶活性的蛋白质的多核苷酸。
这些报告中,上述a)的例子可列举泥色黄杆菌(Flavobacterium lutescens)IFO3084株衍生的lat基因(序列号1)、上述b) 的例子可列举大肠杆菌衍生proC基因(序列号3)。大肠杆菌原本具有proC基因,因此导入lat基因、表达该基因的大肠杆菌具有L-六氢吡啶甲酸生产能力。另外报告了,通过下列大肠杆菌,L-六氢吡啶甲酸的生产速度提高,所述大肠杆菌也具有编码具有赖氨酸特异性穿透活性的蛋白质的DNA、例如大肠杆菌衍生lysP基因(序列号4)。
据报告,苜蓿根瘤菌苜蓿中华根瘤菌(Sinorhizobium meliloti)1021衍生的CAC47686蛋白质具有将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的能力(非专利文献3)。该氨基酸序列在数据库GenBank中以登录号CAC47686登录。碱基序列在数据库GenBank中以登录号AL591792登录(序列号6)。
另外据报告,百脉根根瘤菌(Mesorhizobium loti)MAFF303099衍生的BAB52605蛋白质、或者CAC47686蛋白质具有将L-脯氨酸转化为顺式-4-羟基脯氨酸的能力(专利文献2)。BAB52605蛋白质的氨基酸序列在数据库GenBank中以登录号BAB52605登录。碱基序列在数据库GenBank中以登录号BA000012登录 (序列号7:loti基因)。
现有技术文献
专利文献
专利文献1:WO2001/048216(专利第4516712号)
专利文献2:WO2009/139365
非专利文献
非专利文献1:Biosci. Biotechnol. Biochem., 66 (3), 622-627, 2002
非专利文献2:Biosci. Biotechnol. Biochem., 66 (9), 1981-1984, 2002
非专利文献3:Adv. Synth. Catal., 353, 1375-1383, 2011。
发明内容
发明要解决的问题
CAC47686蛋白质被认为是用于合成非天然氨基酸的有益的酶,但其存在以下问题。
问题1)用一般方法在大肠杆菌中表达该蛋白质时,该蛋白质不溶且不活化。
问题2)该蛋白质在提供给体外反应时迅速变性。
问题3)该蛋白质在提供给体外反应时,与顺式-5-羟基-L-六氢吡啶甲酸共同地,顺式-3-羟基六氢吡啶甲酸也从L-六氢吡啶甲酸几乎等量地蓄积。
在非专利文献3中,为了回避问题1)、且在大肠杆菌中表达CAC47686蛋白质,应用冷激启动子在低温诱导蛋白质表达,且使得天蓝链霉菌(Streptomyces coelicolor)的GroEL/GroES共表达等。另外,作为回避问题2)的方法之一,可列举向表达了该蛋白质的大肠杆菌的活菌提供L-六氢吡啶甲酸使其羟化的想法,但该方法实际上是否有效尚不明确。问题3)的回避方法没有提示。如此地,应用表达CAC47686蛋白质的大肠杆菌制备顺式-5-羟基-L-六氢吡啶甲酸存在许多困难。
认为BAB52605蛋白质也与CAC47686蛋白质同样地可具有将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的能力,但如本说明书实施例所示可知,表达loti基因编码的BAB52605蛋白质的大肠杆菌的顺式-5-羟基-L-六氢吡啶甲酸生产能力比较低。另外,BAB52605蛋白质与CAC47686蛋白质的氨基酸序列同一性是66%。
解决问题的手段
另一方面,EFV12517蛋白质是裙皱慢反应脂肪酸菌(Segniliparus rugosus) ATCCBAA-974衍生的蛋白质,其氨基酸序列在数据库GenBank中以登录号EFV12517登录。其碱基序列在数据库GenBank中以登录号ACZI01000186(区域:1378..2229)登录(序列号8:shortcis基因)。EFV12517蛋白质在GenBank中标注为天冬氨酰/天冬酰胺酰β-羟化酶(aspartyl/Asparaginyl β-hydroxylase),如本发明实施例所示地,在表达EFV12517蛋白质的大肠杆菌中不能检测到将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的能力。但是发现了,表达下列蛋白质的大肠杆菌具有L-六氢吡啶甲酸的顺式-5位羟化酶活性,能够将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸,从而完成本发明,所述蛋白质由从距EFV12517蛋白质标注位置上游48个碱基(相当于16个氨基酸)表达的多核苷酸(序列号2:cis基因)编码。
本发明提供以下内容:
[1] 顺式-5-羟基-L-六氢吡啶甲酸或其药学上可接受的盐或者它们的溶剂合物的制备方法,其包含,通过以可表达的状态含有下述(A)~(F)中任一多核苷酸的微生物,以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的步骤:
(A)由序列号2记载的碱基序列组成的多核苷酸;
(B)与由与序列号2记载的碱基序列互补的碱基序列组成的多核苷酸在严格条件下杂交、并且编码具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(C)与序列号2记载的碱基序列具有至少85%以上的同一性、并且编码具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(D)编码由序列号25记载的氨基酸序列组成的蛋白质的多核苷酸;
(E)编码由在序列号25记载的氨基酸序列中置换、缺失、插入、和/或添加1个或多数氨基酸而成的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(F) 编码由与序列号25记载的氨基酸序列具有至少85%以上同一性的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸。
[2] [1]中记载的制备方法,所述微生物以可表达的状态进一步含有:编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸、以及编码具有催化以Δ1-哌啶烯-6-甲酸(デルタ1-ピペリデイン-6-カルボン酸)为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸,所述方法进一步包含:
以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛、随后将L-氨基己二酸-Δ-半醛转化为Δ1-哌啶烯-6-甲酸的步骤;以及
以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的步骤。
[3] [2]中记载的制备方法,所述编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸从泥色黄杆菌(Flavobacterium lutescens)衍生。
[4] [2]或者[3]中记载的制备方法,所述微生物是大肠杆菌,其原本具有编码具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸。
[5] 下述(A)~(F)中任一多核苷酸:
(A)由序列号2记载的碱基序列组成的多核苷酸;
(B)与由与序列号2记载的碱基序列互补的碱基序列组成的多核苷酸在严格条件下杂交、并且编码具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(C)与序列号2记载的碱基序列具有至少85%以上的同一性、并且编码具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(D)编码由序列号25记载的氨基酸序列组成的蛋白质的多核苷酸;
(E)编码由在序列号25记载的氨基酸序列中置换、缺失、插入、和/或添加1个或多数氨基酸而成的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(F) 编码由与序列号25记载的氨基酸序列具有至少85%以上同一性的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸。
[6] 转化用载体,其包含[5]中记载的多核苷酸。
[7] [6]中记载的微生物的转化用载体,其进一步包含编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸。
[8] [6]或者[7]中记载的微生物的转化用载体,其进一步包含编码具有催化生成α-酮戊二酸的反应的活性的蛋白质和/或具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸。
[9] 基因重组微生物,其通过[6]~[8]的任一项中记载的载体转化。
[10] 基因重组大肠杆菌,其通过[5]中记载的多核苷酸、以及编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸转化,且具有以L-赖氨酸为原料生成顺式-5-羟基-L-六氢吡啶甲酸的能力。
[11] 下述(d)~(f)中任一蛋白质:
(d) 由序列号25记载的氨基酸序列组成的蛋白质;
(e) 由在序列号25记载的氨基酸序列中置换、缺失、插入、和/或添加1个或多数氨基酸而成的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质;
(f) 由与序列号25记载的氨基酸序列具有至少85%以上同一性的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质。
[12] 顺式-5-羟基-L-六氢吡啶甲酸或其药学上可接受的盐或者它们的溶剂合物的制备方法,其包含使[11]中记载的蛋白质作用于L-六氢吡啶甲酸生成顺式-5-羟基-L-六氢吡啶甲酸的步骤。
[13] [12]中记载的制备方法,其进一步包含:
使具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质作用于L-赖氨酸生成L-氨基己二酸-Δ-半醛,随后将L-氨基己二酸-Δ-半醛转化为Δ1-哌啶烯-6-甲酸的步骤;以及
使具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质作用于得到的Δ1-哌啶烯-6-甲酸生成L-六氢吡啶甲酸的步骤。
[14] [9]或者[10]中记载的基因重组微生物或者基因重组大肠杆菌,其具有每1L培养液生产50mg以上顺式-5-羟基-L-六氢吡啶甲酸的能力。
附图说明
图1是本发明的制备方法的一个例子,从L-赖氨酸至顺式-5-羟基-L-六氢吡啶甲酸的转化途径。
图2是质粒pRSF-Cis(参考实施例1)。
图3是BL21(DE3)/pRSF-Cis株的产物的HPLC图(参考实施例2)。
图4是BL21(DE3)/pRSF-Cis株的产物的LC/MS图(参考实施例2)。上3点是200μg/mL标准品、下2点是BL21(DE3)/pRSF-Cis株生产的物质。
图5是酶lat、酶cis、变体cis的碱基序列以及氨基酸序列。
具体实施方式
本发明提供了制备以下述式(I)的结构式表示的顺式-5-羟基-L-六氢吡啶甲酸或其药学上可接受的盐或者它们的溶剂合物的方法。
化学式1
Figure 884579DEST_PATH_IMAGE001
式(I)。
本发明的顺式-5-羟基-L-六氢吡啶甲酸的制备方法可包含下述步骤(1)~(3):
(1)以L-赖氨酸为底物,生成L-氨基己二酸-Δ-半醛,随后将L-氨基己二酸-Δ-半醛转化为Δ1-哌啶烯-6-甲酸的步骤;
(2)以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的步骤;以及
(3)以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的步骤。
本发明的顺式-5-羟基-L-六氢吡啶甲酸的制备方法包含上述步骤(3)。步骤(3)利用具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质、也即L-六氢吡啶甲酸顺式-5位羟化酶(Cis),以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸。该步骤在具有cis基因的生物中表达Cis,能够生物学地实施。
本发明中,cis基因或者蛋白质可应用下述(A)~(F)中任一多核苷酸或下述(d)~(f)中任一蛋白质。
(A)由序列号2记载的碱基序列组成的多核苷酸;
(B)与由与序列号2记载的碱基序列互补的碱基序列组成的多核苷酸在严格条件下杂交、并且编码具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(C)与序列号2记载的碱基序列具有至少85%以上的同一性、并且编码具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(D)编码由序列号25记载的氨基酸序列组成的蛋白质的多核苷酸;
(E)编码由在序列号25记载的氨基酸序列中置换、缺失、插入、和/或添加1个或多数氨基酸而成的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(F) 编码由与序列号25记载的氨基酸序列具有至少85%以上同一性的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸。
(d) 由序列号25记载的氨基酸序列组成的蛋白质;
(e) 由在序列号25记载的氨基酸序列中置换、缺失、插入、和/或添加1个或多数氨基酸而成的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质;
(f) 由与序列号25记载的氨基酸序列具有至少85%以上同一性的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质。
在序列表的序列号2以及25中,示出了发明人鉴定的、本说明书实施例中应用的cis的碱基序列以及氨基酸序列。
对序列号25的全长Cis蛋白质的氨基酸序列检索同一性高的序列,认识到,其相对于序列号6的碱基序列编码的CAC47686蛋白质(本发明有时也称为“Meliloti蛋白质”)的氨基酸序列有34%的同一性,相对于序列号7的碱基序列编码的BAB52605蛋白质(本发明有时也称为“Loti蛋白质”)的氨基酸序列有33%的同一性。具体地,对于前者,得分 = 163个命中 (413), 期望值 = 6e-45, 方法: Compositional matrix adjust,一致性 = 93/275(34%),阳性(Positives) = 146/275 (53%),缺口 = 9/275 (3%)。对于后者,得分 = 159个命中 (402),期望值 = 3e-43,方法: Compositional matrix adjust,一致性 = 87/260(33%),阳性(Positives) = 139/260 (53%),缺口 = 6/260 (2%)。没有确认到具有比它们高的同一性的序列。另外,同一性的确认应用NCBI提供的blastp。
实施例中应用的Cis蛋白质是含有EFV12517蛋白质(本发明有时也称为“Shortcis蛋白质”。由序列号8的碱基序列编码。GenBank中标注为天冬氨酰/天冬酰胺酰β-羟化酶)的48个碱基、也即16个氨基酸上游部分而构成的蛋白质。但是,Shortcis蛋白质本身将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的能力是未知的,实践中也不能检测到(参考实施例2)。
另外,与实施例中应用的Cis蛋白质具有34%的氨基酸序列同一性的Meliloti蛋白质已知具有将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的能力(前述非专利文献3),但如已经描述的那样,已知其具有各种问题。另一方面,根据本发明人的研究已知,与实施例中应用的Cis蛋白质具有33%的氨基酸序列同一性的Loti蛋白质在大肠杆菌中表达时,顺式-5-羟基-L-六氢吡啶甲酸的生产能力比较低(参考实施例3),此外,Loti(BAB52605)蛋白质与Meliloti(CAC47686)蛋白质的氨基酸序列同一性是66%,Loti蛋白质通过大肠杆菌表达、应用得到的蛋白质制备顺式-5-羟基-L-六氢吡啶甲酸时,推测与Meliloti蛋白质具有同样的困难。
在本发明的一个实施方式中,cis基因以及蛋白质可衍生自慢反应脂肪酸菌属(Segniliparus),更具体地,可衍生自Segniliparus rugosus,进一步具体地,可衍生自裙皱慢反应脂肪酸菌(Segniliparus rugosus)ATCC BAA-974。
上述(B)~(F)的多核苷酸以及(e)~(f)的蛋白质应称为实施例中应用的cis基因以及Cis蛋白质的变体。考虑到有关实施例应用的Cis蛋白质的基序等信息、和上游16个氨基酸序列缺失时无期望活性,本领域技术人员能够适当地设计这样的变体。根据本发明人的研究知晓,实施例中应用的Cis蛋白质具有天冬氨酰/天冬酰胺酰β-羟化酶区域(位置:26..174)和L-脯氨酸3-羟化酶, C-末端区域(位置: 190..274)。另外,如果显示了序列,利用公开的网址例如GenomeNet (http://www.genome.jp/))中的Pfam等,本领域技术人员能够适当进行基序分析,另外,本领域技术人员可参考说明书记载适当评价某一蛋白质是否具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性。
在本发明的一个实施方式中,应用变体Cis。变体Cis的例子是,本说明书实施例中应用的、由序列号23的碱基序列组成的多核苷酸编码的、由序列号26的氨基酸序列组成的蛋白质。序列号23的碱基序列与实施例中应用的cis的碱基序列(序列号2)有2个碱基(897个碱基中)不同,序列号26的氨基酸序列与实施例中应用的Cis的氨基酸序列(序列号25)有1个氨基酸(299个氨基酸中)不同。序列号26的氨基酸序列与序列号25的氨基酸序列的同一性是99.7%。
另外,实施例中应用的变体Cis的氨基酸序列(序列号26)相对于由序列号6的碱基序列编码的Meliloti蛋白质的氨基酸序列具有34%的同一性,相对于由序列号7的碱基序列编码的Loti蛋白质的氨基酸序列具有29%的同一性。
本发明中有关多核苷酸提及“在严格条件下杂交”时,除非特定记载,对于任一多核苷酸,杂交条件都可遵照Molecular Cloning. A Laboratory Manual. 2nd ed.(Sambrook et al.,Cold Spring Harbor Laboratory Press)以及Hybridization ofNucleic Acid Immobilization on Solid Supports(ANALYTICAL BIOCHEMISTRY 138,267-284(1984))的记载根据要获得的多核苷酸适当选择。例如,获得具有85%以上同一性的DNA时,可应用下列条件:在2倍浓度SSC溶液以及50%甲酰胺存在下,在45℃进行杂交,随后,应用0.1倍浓度的SSC溶液(1倍浓度的SSC溶液的组成是由150mM氯化钠、15mM柠檬酸钠组成),在60℃洗涤滤器。另外,在获得具有90%以上同一性的DNA时,可应用下列条件:在2倍浓度SSC溶液以及50%甲酰胺存在下,在50℃进行杂交,随后,应用0.1倍浓度的SSC溶液,在65℃洗涤滤器。
另外,本发明中涉及蛋白质提及“置换、缺失、插入、和/或添加了1个或多数氨基酸的氨基酸序列”时,除非特定记载,置换等氨基酸的个数没有特别限制,对于任一蛋白质,只要由其氨基酸序列组成的蛋白质具有期望功能,可为1~9个或者1~4个左右,如果置换为性质类似的氨基酸,可为更多个置换等。用于制备与这样的氨基酸序列有关的多核苷酸或者蛋白质的手段是本领域技术人员公知的。
本发明中有关碱基序列(有时也称为核苷酸序列)或者氨基酸序列提及“同一性”时,除非特定记载,对于任一碱基序列或者氨基酸序列,是指2个序列以最佳方式比对时,2个序列间共有的一致核苷酸或者氨基酸个数的百分比。也即,可通过同一性=(一致位置的数目/位置总数)×100计算,可应用市售算法进行计算。另外,这种算法并入Altschul etal.,J.Mol.Biol.215(1990)403-410中记载的NBLAST以及XBLAST程序中。更详细地,有关碱基序列或者氨基酸序列同一性的检索分析可通过本领域技术人员公知的算法或者程序(例如,BLASTN、BLASTP、BLASTX、ClustalW)进行。应用程序时的参数是本领域技术人员能够适当设定的,另外也可应用各程序的缺省参数。这些分析方法的具体方式也是本领域技术人员公知的。
本说明书中,关于碱基序列或者氨基酸序列提及同一性时,除非特定记载,任一情况都是指至少70%、优选80%以上、更优选85%以上、进一步优选90%以上、进一步优选95%以上、进一步优选97.5%以上、进一步优选99%以上的序列同一性。
本发明中应用的多核苷酸或者基因、以及蛋白质或者酶是本领域技术人员利用现有技术能够制备的。
本发明的顺式-5-羟基-L-六氢吡啶甲酸的制备方法也可包含上述步骤(1)。步骤(1)利用具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质、也即L-赖氨酸6-氨基转移酶(Lat),以L-赖氨酸为底物,生成L-氨基己二酸-Δ-半醛;随后将L-氨基己二酸-Δ-半醛转化为Δ1-哌啶烯-6-甲酸。该步骤在具有lat基因的生物中表达Lat,可生物学地实施。
本发明中,lat基因或者蛋白质可应用下述(A’)~(F’)中任一多核苷酸、或者下述(d’)~(f’)中任一蛋白质。
(A’) 由序列号1记载的碱基序列组成的多核苷酸;
(B’) 与由与序列号1记载的碱基序列互补的碱基序列组成的多核苷酸在严格条件下杂交、并且编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸;
(C’)与序列号1中记载的碱基序列具有至少85%以上的同一性、并且编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸;
(D’)编码由序列号24记载的氨基酸序列组成的蛋白质的多核苷酸;
(E’) 编码由在序列号24记载的氨基酸序列中置换、缺失、插入、和/或添加1个或多数氨基酸而成的氨基酸序列组成、并且具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸;
(F’) 编码由与序列号24记载的氨基酸序列具有至少85%以上同一性的氨基酸序列组成、并且具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸。
(d’) 由序列号24记载的氨基酸序列组成的蛋白质;
(e’) 由在序列号24记载的氨基酸序列中置换、缺失、插入、和/或添加1个或多数氨基酸而成的氨基酸序列组成、并且具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质;
(f’) 由与序列号24记载的氨基酸序列具有至少85%以上同一性的氨基酸序列组成、并且具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质。
序列表的序列号1以及22示出了泥色黄杆菌(Flavobacterium lutescens)IFO3084衍生的lat的碱基序列以及氨基酸序列。
本发明中,lat基因或者蛋白质可由各种生物衍生。在本发明的一个实施方式中,lat基因以及蛋白质可衍生自黄杆菌属,更具体地,可衍生自泥色黄杆菌,进一步特定地,可衍生自泥色黄杆菌IFO3084。
本发明的顺式-5-羟基-L-六氢吡啶甲酸的制备方法也包含上述步骤(2)。步骤(2)利用具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质、也即吡咯啉-5-羧酸还原酶(ProC),以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸。该步骤利用具有proC基因的生物,可生物学地实施。
序列表的序列号3以及25示出了大肠杆菌衍生的proC的碱基序列以及氨基酸序列。另外,proC可参考前述专利文献1。
ProC是大肠杆菌原本具有的酶。利用大肠杆菌实施本发明的制备方法时,作为用于步骤(2)的酶,可应用大肠杆菌原本具有的ProC,为了强化等目的,也可应用外来的ProC。本发明中提及“以可表达的状态包含”时,除非特定记载,不限于该多核苷酸为外来多核苷酸,也包括原本具有的多核苷酸。
本发明的顺式-5-羟基-L-六氢吡啶甲酸的制备方法的上述步骤(1)~(3)中任一或全部可生物学地实施。生物学地实施的典型例子是,在以可表达状态包含必要基因的微生物细胞内中实施。用于顺式-5-羟基-L-六氢吡啶甲酸的生物学制备方法的微生物可通过以适当构成的载体转化宿主微生物获得。本发明也提供了这样的基因重组微生物、载体。用于本发明的实施的生物的例子是微生物,更具体的例子是原核生物,更具体的例子是大肠杆菌。
本发明中提及“基因重组微生物”时,除非特定记载,意味着利用基因重组技术在特定微生物中导入其它生物衍生的基因而成的微生物(细菌、放线菌、酵母、丝状菌等),其中应用的基因导入方式不限于利用质粒等载体的基因重组,也包括同源重组等方式。
根据本发明,可表达地具有分别编码具有L-赖氨酸6-氨基转移酶酶活性的蛋白质(Lat)、具有吡咯啉-5-羧酸还原酶酶活性的蛋白质(ProC)、以及具有L-六氢吡啶甲酸的顺式-5位羟化酶活性的蛋白质(Cis)的基因,能够获得可由L-赖氨酸直接生产顺式-5-羟基-L-六氢吡啶甲酸的基因重组微生物。另外,培养该基因重组微生物,并通过从培养液中获取,可高效生产顺式-5-羟基-L-六氢吡啶甲酸。
在任一实施方式中,根据本发明提供的基因重组微生物都可以可表达地具有编码具有赖氨酸特异性穿透蛋白质活性的蛋白质(LysP)的基因。据报告,在L-六氢吡啶甲酸的生物学制备方法中,通过利用LysP,L-六氢吡啶甲酸的生产速度提高,根据同样的观点,在顺式-5-羟基-L-六氢吡啶甲酸的生物学制备方法中LysP也可以有用。序列号4示出大肠杆菌衍生lysP基因的碱基序列。
在任一实施方式中,根据本发明提供的基因重组微生物可以可表达状态进一步包含编码具有催化生成α-酮戊二酸的反应的活性的蛋白质的基因。L-六氢吡啶甲酸顺式-5位羟化酶代表的氨基酸羟化酶类在其羟化反应时要求α-酮戊二酸(非专利文献3)。另外已知,L-赖氨酸6-氨基转移酶也在其氨基转移反应时要求α-酮戊二酸,将其转化为谷氨酸(EC2.6.1.36 )。因此,利用可表达这些蛋白质的微生物由L-赖氨酸制备L-六氢吡啶甲酸时,认为再生α-酮戊二酸是重要的。
将谷氨酸再生为α-酮戊二酸的酶已知谷氨酸脱氢酶(EC 1.4.1.2),利用该酶的反应可与利用L-赖氨酸6-氨基转移酶的反应偶联。序列号5示出枯草菌枯草芽孢杆菌(Bacillus subtilis)亚种subtilis str. 168衍生的rocG基因的碱基序列。
以下,对本发明的实施方式进一步具体地进行说明。
本发明的顺式-5-羟基-L-六氢吡啶甲酸的生物学制备方法中应用的、编码具有L-六氢吡啶甲酸的顺式-5位羟化酶活性的蛋白质的多核苷酸,可根据本技术领域公知的方法(例如,Molecular Cloning. A Laboratory Manual. 2nd ed中记载的菌落杂交法)由适当微生物菌体得到。这样的微生物的优选例子可列举,属于慢反应脂肪酸菌属的菌株,更具体地属于Segniliparus rugosus的菌株,更具体地Segniliparus rugosus ATCC BAA-974。或者,如本发明的实施例,也可人工合成编码具有L-六氢吡啶甲酸的顺式-5位羟化酶活性的蛋白质的DNA。
实施例中人工合成的、编码从距EFV12517蛋白质标注位置上游48个碱基(相当于16个氨基酸)表达的具有L-六氢吡啶甲酸的顺式-5位羟化酶活性的蛋白质的多核苷酸如序列表的序列号2所示。该序列号2示出的DNA中包含cis(碱基1~碱基897)的可读框。
本发明的一个实施方式的重组体是,具有编码L-六氢吡啶甲酸的生物合成相关的酶(例如,Lat、ProC、LysP、RocG)的多核苷酸、以及编码L-六氢吡啶甲酸顺式-5位羟化酶(Cis)的多核苷酸的基因重组微生物,其可通过在宿主微生物中整合这二种DNA的方法制备。
宿主是能够整合目的DNA、能够生产目的顺式-5-羟基-L-六氢吡啶甲酸的微生物即可,可没有特别限制地应用。优选微生物可列举属于大肠杆菌(Escherichia coli)的菌株,例如大肠杆菌BL21(DE3)株等。
用于在宿主中整合表达外来多核苷酸的方式没有特别限制,可利用例如Molecular Cloning. A Laboratory Manual. 2nd ed、Current Protocols in MolecularBiology(Frederick M. Ausubel等编辑,1987)等中记载的方法实施。宿主、质粒-载体系统没有特别限制,只要是目的多核苷酸可在宿主中稳定保持、表达的系统即可。另外,除目的多核苷酸以外,质粒也可含有自主复制序列、启动子序列、终止子序列、耐药基因等,质粒的种类不仅为自主复制性质粒,也可为与考虑使用的宿主的基因组的一定区域具有相同序列的整合型质粒。整合目的多核苷酸的部位可为质粒上或者宿主微生物基因组上中的任一。
利用大肠杆菌作为宿主时,可分别列举pUC19和pRSFDuet-1等作为自主复制型载体、lac和T7等作为启动子序列、lacZ终止子和T7终止子等作为终止子序列、耐氨苄青霉素基因和耐卡那霉素基因等作为耐药基因。
利用基因重组大肠杆菌实施本发明时,L-六氢吡啶甲酸的生物合成相关的蛋白质中的Lat、以及Cis的导入是重要的,但ProC、LysP以及RocG导入的适当与否可考虑目的产物的量、同时生产的L-六氢吡啶甲酸的有无及程度、作为原料的L-赖氨酸的利用率等适当设计。
培养如此制备的基因重组微生物,利用现有技术方法评价顺式-5-羟基-L-六氢吡啶甲酸的生产能力,选择适当的重组体,能够得到有用的顺式-5-羟基-L-六氢吡啶甲酸的生产株。产物的测定方法可根据本发明实施例记载的方法。
本发明的顺式-5-羟基-L-六氢吡啶甲酸的生物学制备方法典型地通过培养基因重组微生物实施。微生物的培养条件可由本领域技术人员根据应用的微生物适当设计。利用大肠杆菌作为宿主时,按需要,在含有作为选择标记的抗生素的常用培养基中接种适当量的微生物,在20℃~40℃,按需要在100~400rpm,边搅拌或振荡边培养6小时~72小时、优选9小时~60小时、更优选12小时~48小时,可增殖菌体。该培养期间或者培养后,供给作为原料的L-赖氨酸或其盐、按需要α-酮戊二酸或其盐、进一步按需要适当的诱导物质(例如,异丙基硫代-β-半乳糖苷(IPTG)),进一步在20℃~40℃按需要在100~400rpm搅拌或振荡3小时~72小时、优选4小时~60小时、更优选6小时~48小时,在培养液中得到目的物质。L-赖氨酸等的供给时间和培养终点是本领域技术人员考虑目的物质生产量等可适当決定的,根据事先进行的小规模培养结果,在经过预先确定的时间时,供给L-赖氨酸等,另外可终止培养。
L-赖氨酸的初始浓度可为例如2~32g/L、更具体4~16g/L,α-酮戊二酸的初始浓度可为例如0~16g/L、更具体0~8g/L。或者,α-酮戊二酸的初始浓度可为例如1~16g/L、更具体2~8g/L。
本发明的基因重组大肠杆菌的优选例子是具有每1L培养液生产50mg以上顺式-5-羟基-L-六氢吡啶甲酸的能力的基因重组大肠杆菌。
本发明中,“顺式-5-羟基-L-六氢吡啶甲酸或其药学上可接受的盐或者它们的溶剂合物”中,以顺式-5-羟基-L-六氢吡啶甲酸为例进行说明,但是,除非特定记载,该说明也适于顺式-5-羟基-L-六氢吡啶甲酸的药学上可接受的盐或者它们的溶剂合物,另外,本领域技术人员可加入适当必要的步骤,将顺式-5-羟基-L-六氢吡啶甲酸的制备方法改变为其药学上可接受的盐或者它们的溶剂合物的制备方法。另外,本发明中提及“药学上可接受的盐或者它们的溶剂合物”时,盐包含:碱金属盐(例如钠盐、钾盐)、碱土金属盐(例如镁盐、钙盐)、铵盐、单-、二-或者三-低级(烷基或者羟基烷基)铵盐(例如乙醇铵盐、二乙醇铵盐、三乙醇铵盐、氨基丁三醇盐)、盐酸盐、溴化氢酸盐、碘化氢酸盐、硝酸盐、磷酸盐、硫酸盐、甲酸盐、乙酸盐、柠檬酸盐、草酸盐、富马酸盐、马来酸盐、琥珀酸盐、苹果酸盐、酒石酸盐、三氯乙酸盐、三氟乙酸盐、甲磺酸盐、苯磺酸盐、对甲苯磺酸盐、均三甲苯磺酸盐以及萘磺酸盐。
另外,盐可为无水物或溶剂合物,溶剂合物包含水合物、甲醇化物、乙醇化物、丙醇化物、以及2-丙醇化物。
实施例
以下列举实施例对本发明进行具体说明,但本发明不限于这些实施例。
实施例1. pRSFduet-Cis的构建
以序列号1的碱基序列为参考,设计和制备5’末端添加NcoI位点的引物lac-lat-NcoF2(参考序列号9)以及5’末端添加SpeI位点的引物lat-XhoR(参考序列号10)。随后,应用这2种引物和泥色黄杆菌(Flavobacterium lutescens)IFO3084株基因组DNA作为模板,进行PCR反应。PCR反应应用KOD-Plus-Ver.2(TOYOBO公司),在98℃变性20秒、在60℃退火20秒、在68℃延伸90秒的3步反应重复30次。利用Wizard PCR Preps DNA Purification System(Promega公司),从该PCR扩增反应液中回收包含lat的约1.5kbp大小的DNA片段。将得到的DNA片段用限制性酶NcoI和XhoI消化,得到lat片段。
以序列号4的碱基序列为参考,设计和制备5’末端添加XhoI位点的引物lysP-SD-XhoF(参考序列号11)以及5’末端添加KpnI位点的引物lysP-KpnR(参考序列号12)(SIGMAGENOSYS公司)。随后,应用这2种引物和大肠杆菌K12衍生JM109株基因组DNA作为模板,与上述同样地进行PCR反应。从该PCR扩增反应液回收含有lysP的约1.5kbp大小的DNA片段。将得到的DNA片段用限制性酶XhoI和KpnI消化,得到lysP片段。
以序列号3的碱基序列为参考,设计和制备5’末端添加KpnI位点的引物proC-SD-KpnF(参考序列号13)以及5’末端添加BamHI位点的引物proC-BamR(参考序列号14)。随后,应用这2种引物和大肠杆菌K12 JM109株基因组DNA作为模板,与上述同样地进行PCR反应。从该PCR扩增反应液回收含有proC的约1.0kbp大小的DNA片段。将得到的DNA片段用限制性酶KpnI和BamHI消化,得到proC片段。
将pRSFDuet-1(Novergen公司)用限制性酶NcoI和BamHI消化得到的质粒消化产物、lat片段、lysP片段、以及proC片段四者用DNA连接试剂盒ver.2(takara-bio公司)连接,通过转化大肠杆菌JM109感受态细胞(takara-bio公司),构建具有latlysP、以及proC各基因的质粒pRSF-LLP。
随后,以序列号5的碱基序列为参考,设计和制备5’末端添加BamHI位点的引物rocG-SD-BamF(参考序列号15)以及5’末端添加XbaI位点的引物rocG-XbaR(参考序列号16)。随后,应用这2种引物和枯草菌枯草芽孢杆菌亚种subtilis str. 168株基因组DNA作为模板,与上述同样地进行PCR反应。从该PCR扩增反应液回收含有rocG的约1.3kbp大小的DNA片段。将得到的DNA片段用限制性酶BamHI和XbaI消化,得到rocG片段。
将通过限制性酶BamHI和XbaI消化pRSF-LLP得到的质粒消化产物与rocG片段连接,构建具有latlysPproC、以及rocG各基因的质粒pRSF-PA。
以序列号8的碱基序列为参考,设计和制备5’末端添加NdeI位点的引物segni-short-NdeF(参考序列号17)以及5’末端添加BglII位点的引物segni-cis-BglR(参考序列号18)。随后,按照序列号8的碱基序列进行人工基因合成(GenScript公司),将其用作模板与上述同样地进行PCR反应。从该PCR扩增反应液回收含有cis的约0.9kbp大小的DNA片段。将得到的DNA片段用限制性酶NdeI和BglII消化,得到cisShort片段。
将通过限制性酶NdeI和BglII消化pRSF-PA得到的质粒消化产物与cisShort片段连接,构建具有latlysPproCrocG各基因、以及编码EFV12517蛋白质的基因(shortcis)的质粒pRSF-CisShort。
以序列号2的碱基序列为参考,设计和制备5’末端添加NdeI位点的引物segni-cis-NdeF2(参考序列号19)以及5’末端添加BglII位点的引物segni-cis-BglR(参考序列号18)。随后,按照序列号2的碱基序列进行人工基因合成(GenScript公司),将其用作模板与上述同样地进行PCR反应。从该PCR扩增反应液回收含有cis的约0.9kbp大小的DNA片段。将得到的DNA片段用限制性酶NdeI和BglII消化,得到cis片段。
将通过限制性酶NdeI和BglII消化pRSF-PA得到的质粒消化产物与cis片段连接,构建具有latlysPproCrocG、以及cis各基因的质粒pRSF-Cis(图2)。
以序列号1的碱基序列为参考,设计和制备5’末端添加NcoI位点的引物lac-lat-NcoF2(参考序列号9)以及5’末端添加AflII位点的引物lat-(Spe)AflR2(参考序列号20)。随后,应用这2种引物和质粒pRSF-Cis作为模板进行PCR反应。从该PCR扩增反应液回收含有lat的约1.5kbp大小的DNA片段。将得到的DNA片段用限制性酶NcoI和AflII消化,得到lat2片段。
将通过限制性酶NcoI和AflII消化pRSF-Cis得到的质粒消化产物与lat2片段连接,构建具有lat以及cis基因的质粒pRSF-LatCis。
以序列号7的碱基序列为参考,设计和制备5’末端添加NcoI位点的引物loti-SD-PacF(参考序列号21)以及5’末端添加AvrII位点的引物loti-AvrR(参考序列号22)。随后,应用这两种引物和百脉根根瘤菌MAFF303099株基因组DNA作为模板进行PCR反应。从该PCR扩增反应液回收含有编码BAB52605蛋白质的基因的约0.9kbp大小的DNA片段。将得到的DNA片段用限制性酶PacI和AflII消化,得到loti片段。
将通过限制性酶PacI和AflII消化pRSF-Cis得到的质粒消化产物与loti片段连接,构建具有latlysPproCrocG各基因、以及编码BAB52605蛋白质的基因(loti)的质粒pRSF―Loti。
最后,分别应用引物segni-cis-NdeF2以及segni-cis-BglR、模板pRSF-Cis,应用DiversifyTM PCR随机诱变试剂盒(Clonteck公司)的条件5进行PCR反应。从该PCR扩增反应液回收约0.9kbp大小的DNA片段。将得到的DNA片段用限制性酶NdeI和BglII消化而成的片段作为变体-cis片段。将通过限制性酶NdeI和BglII消化pRSF-PA得到的质粒消化产物与变体-cis片段连接,将通过限制性酶NdeI和BglII消化pRSF-PA得到的质粒消化产物与变体-cis片段连接,构建具有latlysPproCrocG各基因、以及变体cis基因的质粒pRSF-MutCisLibrary。
实施例2. 顺式-5-羟基-L-六氢吡啶甲酸生产试验1
将应用质粒pRSF-Cis(图2)、pRSF-CisShort、pRSF-PA、pRSF-LatCis以及pRSFDuet-1转化大肠杆菌one-shot BL21(DE3)感受态细胞(lifetechnologies日本公司)而成的菌株分别作为BL21(DE3)/pRSF-Cis、BL21(DE3)/pRSF-CisShort、BL21(DE3)/pRSF-PABL21(DE3)/pRSF-LatCis以及BL21(DE3)/pRSFDuet-1。将这些菌株在包含卡那霉素硫酸盐(25μg/ml)的M9SEED液体培养基(3.39% Na2HPO4、1.5% KH2PO4、0.25%氯化钙、0.5%氯化铵、1%酪蛋白氨基酸、0.002%胸腺嘧啶、0.1mM氯化钙、0.1mM硫酸铁、0.4%葡萄糖、0.001mM氯化镁)中接种,在30℃、220rpm振荡培养22小时。将该培养液10μL加入含有卡那霉素硫酸盐(30μg/mL)和Overnight Express Autoinduction Systems(Merck公司)的M9Cis培养基(3.39%Na2HPO4、1.5% KH2PO、0.25%氯化钠、0.5%氯化铵、1%酪蛋白氨基酸、0.002%胸腺嘧啶、0.1mM氯化钙、0.1mM硫酸铁、80μg/ml 5-氨基乙酰丙酸、0.01%)后,在30℃、220rpm振荡培养9小时。此时加入40%L-赖氨酸盐酸盐10μL(终浓度8g/L)、20%α-酮戊二酸10μL(终浓度4g/L)、100mM IPTG 0.5μL(终浓度0.1mM)、以及50%甘油5μL(终浓度0.5%),进一步在30℃、220rpm振荡培养。在培养开始后24小时的时间点,回收培养液的离心上清液,用于配制LC/MS分析样品。
对取样液应用Nα-(5-氟-2,4-二硝基苯基)-L-亮氨酰胺(L-FDLA)(东京化成工业公司),通过以下方法进行FDLA化。
取样液的离心上清的10倍稀释液20μL中加入1M NaHCO3 6.25μL和1% L-FDLA丙酮溶液30μL,在37℃保温一小时。加入6.25μL的1N HCL终止反应,加入乙腈60μL稀释,得到FDLA化液。
对得到的FDLA化液用HPLC以及LC/MS测定L-赖氨酸、L-六氢吡啶甲酸以及顺式-5-羟基-L-六氢吡啶甲酸的量。HPLC以及LC/MS分析图在图3以及图4中示出。定量结果在表1中示出。另外,HPLC以及LC/MS测定条件如下所示。
分析条件
柱:CAPCELLPAK C18 SG120,4.6×150mm,5μm
流速:1.0mL/min
流动相:A;0.1%乙酸 B;乙腈
梯度:0-9min(B:30-65%),9.01-12min(B:90%),12.01-15min(B:30%)
检测:340nm
注入量:5μL
柱温度:40℃
MS:Agilent 6320 (Ion trap)
模式:ESI/APCI positive
扫描范围:m/z 100-900
分析时间:15分钟
保留时间:L-赖氨酸 10.0分钟
L-六氢吡啶甲酸 8.5分钟
顺式-5-羟基-L-六氢吡啶甲酸 5.8分钟。
Figure 332878DEST_PATH_IMAGE002
该结果未能确认BL21(DE3)/pRSFDuet-1株中L-六氢吡啶甲酸以及顺式-5-羟基-L-六氢吡啶甲酸的生产,与之相比,BL21(DE3)/pRSF-CisShort株(质粒上含有latlysPproCrocGshortcis各基因)以及BL21(DE3)/pRSF-PA株(质粒上含有latlysPproCrocG各基因)生产L-六氢吡啶甲酸。另外,BL21(DE3)/pRSF-Cis株(质粒上含有latlysPproCrocGcis各基因)以及BL21(DE3)/pRSF―LatCis株(质粒上含有lat以及cis基因)生产顺式-5-羟基-L-六氢吡啶甲酸和L-六氢吡啶甲酸。
据此显示出,通过在具有L-六氢吡啶甲酸生产能力的株中导入cis基因(此处共表达lat基因和cis基因),能够直接生产顺式-5-羟基-L-六氢吡啶甲酸,通过进一步共表达lysPproC以及rocG基因,其生产能力可提高。另外,L-六氢吡啶甲酸标准品应用L-Pipecolic Acid(东京化成工业公司)、顺式-5-羟基-L-六氢吡啶甲酸标准品应用(2S,5S)-5-Hydroxypipecolic Acid (SV ChemBIOTECH.INC)。
如此地,表达由shortcis基因编码的EFV12517蛋白质的大肠杆菌未能检测到L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的能力,但表达从距EFV12517蛋白质标注位置上游48个碱基(相当于16个氨基酸)表达的多核苷酸(cis基因)编码的蛋白质的大肠杆菌具有将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的L-六氢吡啶甲酸的顺式-5位羟化酶活性。进一步地,该cis基因编码的蛋白质的氨基酸序列与CAC47686蛋白质以及BAB52605蛋白质的氨基酸序列的同源性分别为34%以及33%。
根据以上,表达cis基因编码的蛋白质的大肠杆菌具有将L-六氢吡啶甲酸转化为顺式-5-羟基-L-六氢吡啶甲酸的L-六氢吡啶甲酸的顺式-5位羟化酶活性,其根据已知信息难以推测。
实施例3. 顺式-5-羟基-L-六氢吡啶甲酸生产试验2
应用质粒pRSF-Cis、pRSF-Loti以及pRSF-MutCis转化大肠杆菌one-shot BL21(DE3)感受态细胞,得到的株各自为BL21(DE3)/pRSF-Cis以及BL21(DE3)/pRSF-Loti。另外,应用质粒pRSF-MutCisLibrary转化大肠杆菌one-shot BL21(DE3)感受态细胞,得到的株中的一株为BL21(DE3)/pRSF-MutCis1。对这些株与实施例2同样地进行培养以及分析,测定L-六氢吡啶甲酸以及顺式-5-羟基-L-六氢吡啶甲酸的量。测定结果在表2中示出。
Figure 520406DEST_PATH_IMAGE003
结果是,与BL21(DE3)/pRSF-Cis株(质粒上含有latlysPproCrocGcis各基因)相比,BL21(DE3)/pRSF-Loti株(质粒上含有latlysPproCrocGloti各基因)的顺式-5-羟基-L-六氢吡啶甲酸生产量约为1/30。据此示出,在应用表达loti基因编码的BAB52605蛋白质的大肠杆菌时,得到的顺式-5-羟基-L-六氢吡啶甲酸的量比较少。
另一方面,与BL21(DE3)/pRSF-Cis株相比,BL21(DE3)/pRSF―MutCis1株(质粒上含有latlysPproCrocG、变体cis各基因)的顺式-5-羟基-L-六氢吡啶甲酸生产量是相同或更高的。用BigDye Terminator v3.1 Cycle Sequencing Kit(AppliedBiosystems公司)分析该变体cis基因的碱基序列,结果示于序列号23。结果是,cis基因碱基序列与该变体cis基因碱基序列在全部897个碱基中有2个碱基不同,因此这两个基因碱基序列的同源性是99.7%。因此示出,应用表达与cis基因碱基序列的同源性为99.7%以上的基因编码的蛋白质的大肠杆菌,能够制备顺式-5-羟基-L-六氢吡啶甲酸。
实施例4. 顺式-5-羟基-L-六氢吡啶甲酸生产试验3
应用质粒pRSF-Cis、以及pRSF-CisΔproCΔrocG转化大肠杆菌one-shot BL21(DE3)感受态细胞,得到的株各自为BL21(DE3)/pRSF-Cis以及BL21(DE3)/pRSF-CisΔproCΔrocG。这些株与实施例2同样地进行培养以及分析,测定L-六氢吡啶甲酸以及顺式-5-羟基-L-六氢吡啶甲酸的量。测定结果示于表3。
Figure 181195DEST_PATH_IMAGE004
结果,与BL21(DE3)/pRSF-Cis株(质粒上含有latlysPproCrocGcis各基因)相比,BL21(DE3)/pRSF-CisΔproCΔrocG株(质粒上含有latlysPcis各基因)的顺式-5-羟基-L-六氢吡啶甲酸生产量约为2/3。如此示出,质粒上含有lat以及lysP两种基因加上proC以及rocG基因时,得到的顺式-5-羟基-L-六氢吡啶甲酸的量多。
实施例5. 顺式-5-羟基-L-六氢吡啶甲酸生产试验4
为了删除质粒pRSF-Cis的proC基因、rocG基因、或者这两种基因,制备以下引物。
引物proCrocGX-SpeR (参考序列号27)
引物proCX-SpeR (参考序列号28)
引物rocGX-SpeF (参考序列号29)
引物proCX-SpeF (参考序列号30)。
删除了质粒pRSF-Cis的proC基因的质粒pRSF-CisΔproC如下制备。应用引物proCX-SpeF和引物proCrocGX-SpeR,以pRSF-Cis为模板进行PCR反应。从该PCR扩增反应液回收质粒pRSF-Cis的proC基因被删除的DNA片段。得到的DNA片段用限制性酶SpeI消化、自身连接、转化大肠杆菌JM109感受态细胞(takara-bio公司),构建pRSF-CisΔproC。同样地,质粒pRSF-Cis的rocG基因被删除的质粒pRSF-CisΔrocG应用引物rocGX-SpeF和引物proCX-SpeR,质粒pRSF-Cis的proC基因和rocG基因被删除的质粒pRSF-CisΔproCΔrocG应用引物rocGX-SpeF和引物proCrocGX-SpeR制备。
应用质粒pRSF-Cis、pRSF-CisΔproC、pRSF-CisΔrocG、以及pRSF-CisΔproCΔrocG转化大肠杆菌one-shot BL21(DE3)感受态细胞(lifetechnologies日本公司)而成的株各自为BL21(DE3)/pRSF-Cis、BL21(DE3)/pRSF-CisΔproC、BL21(DE3)/pRSF-CisΔrocG、以及BL21(DE3)/pRSF-CisΔproCΔrocG。这些株在含卡那霉素硫酸盐(25μg/ml)的M9SEED液体培养基(3.39% Na2HPO4、1.5% KH2PO4、0.25%氯化钙、0.5%氯化铵、1%酪蛋白氨基酸、0.002%胸腺嘧啶、0.1mM氯化钙、0.1mM硫酸铁、0.4%葡萄糖、0.001 mM 氯化镁)中接种,在30℃、220rpm振荡培养9小时。将该培养液10μL加入包含卡那霉素硫酸盐(30μg/mL)、L-赖氨酸盐酸盐(终浓度8g/L)、α-酮戊二酸(终浓度2g/L)以及Overnight ExpressAutoinduction Systems(Merck公司)的M9Cis培养基(3.39% Na2HPO4、1.5% KH2PO、0.25%氯化钠、0.5%氯化铵、1%酪蛋白氨基酸、0.002%胸腺嘧啶、0.1mM氯化钙、0.1mM硫酸铁、80μg/ml 5-氨基乙酰丙酸、0.01%)后,在30℃、220rpm振荡培养15小时。此时加入40%L-赖氨酸盐酸盐5μL(终浓度4g/L)、20%α-酮戊二酸 5μL(终浓度2g/L)、100mM IPTG0.5μL(终浓度0.1mM)、以及50%甘油5μL(终浓度0.5%),进一步在30℃、220rpm振荡培养。在培养开始后39小时的时间点,回收培养液的离心上清液,用于制备LC/MS分析样品。测定结果示于表4。
Figure 261146DEST_PATH_IMAGE005
结果,该培养条件下,BL21(DE3)/pRSF-CisΔrocG以及BL21(DE3)/pRSF-CisΔproCΔrocG比BL21(DE3)/pRSF-Cis的顺式-5-羟基-L-六氢吡啶甲酸生产量多。
序列表自由文本
序列号1:lat的碱基序列
序列号2:cis的碱基序列
序列号3:proC的碱基序列
序列号4:lysP的碱基序列
序列号5:rocG的碱基序列
序列号6:meliloti的碱基序列
序列号7:loti的碱基序列
序列号8:shortcis的碱基序列
序列号9:引物lac-lat-NcoF2
序列号10:引物lat-XhoR
序列号11:引物lysP-SD-XhoF
序列号12:引物lysP-KpnR
序列号13:proC-SD-KpnF
序列号14:引物proC-BamR
序列号15:引物rocG-SD-BamF
序列号16:引物rocG-XbaR
序列号17:引物segni-short-NdeF
序列号18:引物segni-cis-BglR
序列号19:引物segni-cis-NdeF2
序列号20:引物lat-(Spe)AflR2
序列号21:引物loti-SD-PacF
序列号22:引物loti-AvrR
序列号23:变体cis的碱基序列
序列号24:lat编码的蛋白质的氨基酸序列
序列号25:cis编码的蛋白质的氨基酸序列
序列号26:变体cis编码的蛋白质的氨基酸序列
序列号27:引物proCrocGX-SpeR
序列号28:引物proCX-SpeR
序列号29:引物rocGX-SpeF
序列号30:引物proCX-SpeF。
序列表
<110> MicroBiopharm Japan Co., Ltd.
<120> PROCESS FOR THE BIOLOGICAL PRODUCTION OF CIS-5-HYDROXY-L-PIPECOLICACID
<130> 135157H
<150> JP 2012-133876
<160> 30
<170> PatentIn version 3.5
<210> 1
<211> 1482
<212> DNA
<213> 泥色黄杆菌IFO3084 (lat)
<220>
<223> Inventor: FUJII, Tadashi
Inventor: TAMURA, Keisuke
<220>
<221> CDS
<222> (1)..(1482)
<400> 1
atg tcc ctt ctt gcc ccg ctc gcc ccg ctc cgc gcc cat gcc ggc acc 48
Met Ser Leu Leu Ala Pro Leu Ala Pro Leu Arg Ala His Ala Gly Thr
1 5 10 15
cgc ctt acc cag ggc ctg tct gac ccg cag gtc gag cag ctg gcc gcc 96
Arg Leu Thr Gln Gly Leu Ser Asp Pro Gln Val Glu Gln Leu Ala Ala
20 25 30
aac cac cct gac ctg cgc gcc gcc atc gac gcc gct gcc gac gaa tac 144
Asn His Pro Asp Leu Arg Ala Ala Ile Asp Ala Ala Ala Asp Glu Tyr
35 40 45
gcg cgc atc aaa ccg cag gcc gcg gca ttg ctg gac ctg gat gaa agc 192
Ala Arg Ile Lys Pro Gln Ala Ala Ala Leu Leu Asp Leu Asp Glu Ser
50 55 60
gcg cag atc gcc gcc gtg cag gat ggc ttc gtc aac ttc tat gcc gat 240
Ala Gln Ile Ala Ala Val Gln Asp Gly Phe Val Asn Phe Tyr Ala Asp
65 70 75 80
gat gcg gtg gtg ccc tat atc gcc ctg gcc gcc cgc ggg ccg tgg gtg 288
Asp Ala Val Val Pro Tyr Ile Ala Leu Ala Ala Arg Gly Pro Trp Val
85 90 95
gtc agc ctg aag ggc gcg gtg ctg tat gac gcc ggc ggc tac ggc atg 336
Val Ser Leu Lys Gly Ala Val Leu Tyr Asp Ala Gly Gly Tyr Gly Met
100 105 110
ctc ggc ttc ggc cat acc ccg gcc gat atc ctg gag gcg gtc ggc aag 384
Leu Gly Phe Gly His Thr Pro Ala Asp Ile Leu Glu Ala Val Gly Lys
115 120 125
ccg cag gtg atg gcc aac atc atg act ccc tcg ctg gcc cag ggc cgc 432
Pro Gln Val Met Ala Asn Ile Met Thr Pro Ser Leu Ala Gln Gly Arg
130 135 140
ttc att gcc gca atg cgc cgc gaa atc ggc cat acc cgc ggc ggc tgc 480
Phe Ile Ala Ala Met Arg Arg Glu Ile Gly His Thr Arg Gly Gly Cys
145 150 155 160
ccg ttc tcg cac ttc atg tgc ctg aac tcc ggc tcc gaa gcg gtc ggg 528
Pro Phe Ser His Phe Met Cys Leu Asn Ser Gly Ser Glu Ala Val Gly
165 170 175
ctg gcc gcg cgc atc gcc gac atc aac gcc aag ctg atg acc gac ccg 576
Leu Ala Ala Arg Ile Ala Asp Ile Asn Ala Lys Leu Met Thr Asp Pro
180 185 190
ggc gcc cgg cat gcc ggc gcc acg atc aag cgc gtg gtg atc aag ggc 624
Gly Ala Arg His Ala Gly Ala Thr Ile Lys Arg Val Val Ile Lys Gly
195 200 205
agt ttc cac ggc cgt acc gac cgt ccg gcg ctg tat tcc gat tcc acc 672
Ser Phe His Gly Arg Thr Asp Arg Pro Ala Leu Tyr Ser Asp Ser Thr
210 215 220
cgc aag gcc tac gat gcg cat ctg gcc agc tac cgc gac gag cac agc 720
Arg Lys Ala Tyr Asp Ala His Leu Ala Ser Tyr Arg Asp Glu His Ser
225 230 235 240
gtc att gcc atc gcc ccg tat gac cag cag gcc ctg cgc cag gtg ttt 768
Val Ile Ala Ile Ala Pro Tyr Asp Gln Gln Ala Leu Arg Gln Val Phe
245 250 255
gcc gat gcc cag gcc aac cac tgg ttc atc gag gcg gtg ttc ctg gag 816
Ala Asp Ala Gln Ala Asn His Trp Phe Ile Glu Ala Val Phe Leu Glu
260 265 270
ccg gtg atg ggc gaa ggc gac ccg ggc cgt gcg gtg ccg gtg gac ttc 864
Pro Val Met Gly Glu Gly Asp Pro Gly Arg Ala Val Pro Val Asp Phe
275 280 285
tac cgc ctg gcc cgt gag ctg acc cgc gaa cac ggc agc ctg ctg ctg 912
Tyr Arg Leu Ala Arg Glu Leu Thr Arg Glu His Gly Ser Leu Leu Leu
290 295 300
atc gat tcg atc cag gcc gcg ctg cgc gtg cac ggc acc ctg tcc ttc 960
Ile Asp Ser Ile Gln Ala Ala Leu Arg Val His Gly Thr Leu Ser Phe
305 310 315 320
gtc gac tac ccc ggc cac cag gag ctg gag gca ccg gac atg gag acc 1008
Val Asp Tyr Pro Gly His Gln Glu Leu Glu Ala Pro Asp Met Glu Thr
325 330 335
tac tcc aag gcc ctg aac ggc gcc cag ttc ccg ctg tcg gta gtg gcc 1056
Tyr Ser Lys Ala Leu Asn Gly Ala Gln Phe Pro Leu Ser Val Val Ala
340 345 350
gtg acc gag cac gcc gcc gcg ctg tac cgc aag ggc gtg tac ggc aac 1104
Val Thr Glu His Ala Ala Ala Leu Tyr Arg Lys Gly Val Tyr Gly Asn
355 360 365
acc atg acc acc aac ccg cgg gcg ctg gac gtg gcc tgc gcc acc ctg 1152
Thr Met Thr Thr Asn Pro Arg Ala Leu Asp Val Ala Cys Ala Thr Leu
370 375 380
gca cgc ctg gat gag ccg gtc cgc aac aat atc cgc ctg cgt ggc cag 1200
Ala Arg Leu Asp Glu Pro Val Arg Asn Asn Ile Arg Leu Arg Gly Gln
385 390 395 400
cag gcg atg cag aag ctg gaa gca ttg aag gaa cgg ctg ggg ggc gcg 1248
Gln Ala Met Gln Lys Leu Glu Ala Leu Lys Glu Arg Leu Gly Gly Ala
405 410 415
atc acc aag gtg cag ggc acc ggc ctg ctg ttc tcc tgc gag ctg gcc 1296
Ile Thr Lys Val Gln Gly Thr Gly Leu Leu Phe Ser Cys Glu Leu Ala
420 425 430
ccg cag tac aag tgc tac ggg gcc ggc tcc acc gag gag tgg ctg cgc 1344
Pro Gln Tyr Lys Cys Tyr Gly Ala Gly Ser Thr Glu Glu Trp Leu Arg
435 440 445
atg cac ggg gtc aat gtg atc cac ggc ggc gag aat tcg ctg cgc ttc 1392
Met His Gly Val Asn Val Ile His Gly Gly Glu Asn Ser Leu Arg Phe
450 455 460
acc ccg cac ttc ggc atg gac gag gcc gaa ctg gac ctg ctg gtg gag 1440
Thr Pro His Phe Gly Met Asp Glu Ala Glu Leu Asp Leu Leu Val Glu
465 470 475 480
atg gtc ggg cgt gcg ctg gtc gaa ggc cca cgc cgg gcc tga 1482
Met Val Gly Arg Ala Leu Val Glu Gly Pro Arg Arg Ala
485 490
<210> 2
<211> 900
<212> DNA
<213> Segniliparus rugosus ATCC BAA-974 (cis)
<220>
<221> CDS
<222> (1)..(900)
<400> 2
atg aag tca tac agt ctg ggg aag ttc gaa gac cgt agt att gac agt 48
Met Lys Ser Tyr Ser Leu Gly Lys Phe Glu Asp Arg Ser Ile Asp Ser
1 5 10 15
ttg atc gaa gag gcc tcc ggc ctg ccc gac agc gcg tac agc tcg gcc 96
Leu Ile Glu Glu Ala Ser Gly Leu Pro Asp Ser Ala Tyr Ser Ser Ala
20 25 30
tat caa gag tac tca atc ggc ctt tgg gac acg gcc acg cta tgg aat 144
Tyr Gln Glu Tyr Ser Ile Gly Leu Trp Asp Thr Ala Thr Leu Trp Asn
35 40 45
gag cgc ggc aac gag tct ggt gaa gtc tca gag cac gcc gcg gcg gcg 192
Glu Arg Gly Asn Glu Ser Gly Glu Val Ser Glu His Ala Ala Ala Ala
50 55 60
gcg cct acc gct atc ggc cga tcg acg cct cgg ctc aat gaa ttc gtg 240
Ala Pro Thr Ala Ile Gly Arg Ser Thr Pro Arg Leu Asn Glu Phe Val
65 70 75 80
cga gcg aaa ttc aat gtc gac gtt ttg cgc gct gtt cga cta ttt cgg 288
Arg Ala Lys Phe Asn Val Asp Val Leu Arg Ala Val Arg Leu Phe Arg
85 90 95
gcg cgg caa ggc gcg atc atc att cct cat cgc gac tat ttg gag cac 336
Ala Arg Gln Gly Ala Ile Ile Ile Pro His Arg Asp Tyr Leu Glu His
100 105 110
tcc aac ggg ttt tgc cgg atc cat ctt cct ttg gtg acg act ccg gga 384
Ser Asn Gly Phe Cys Arg Ile His Leu Pro Leu Val Thr Thr Pro Gly
115 120 125
gcc cgt aat agc gag aat aac gag gtc tat cgc atg ttg cca ggc gag 432
Ala Arg Asn Ser Glu Asn Asn Glu Val Tyr Arg Met Leu Pro Gly Glu
130 135 140
ctt tgg ttc ctg gac agc aac gag gtc cat tcg ggt gga gtt ctt gat 480
Leu Trp Phe Leu Asp Ser Asn Glu Val His Ser Gly Gly Val Leu Asp
145 150 155 160
tcg gga act cgg atc cat tta gtg cta gat ttc acc cat gag cat aac 528
Ser Gly Thr Arg Ile His Leu Val Leu Asp Phe Thr His Glu His Asn
165 170 175
gaa aac ccg gct gct gtg ttg aaa aac gcg gac cga tta cgt cct att 576
Glu Asn Pro Ala Ala Val Leu Lys Asn Ala Asp Arg Leu Arg Pro Ile
180 185 190
gct cgc gat ccg cga ata tct cga tcc aag tta gac cac gaa gct ctg 624
Ala Arg Asp Pro Arg Ile Ser Arg Ser Lys Leu Asp His Glu Ala Leu
195 200 205
gag agc ctg atc cga ggc ggt cga gtc gtg aca ttg gcg atg tgg ccc 672
Glu Ser Leu Ile Arg Gly Gly Arg Val Val Thr Leu Ala Met Trp Pro
210 215 220
gcc cta gtg cag atg ctc gct aga atc cat ctg aca tct gac gcg cat 720
Ala Leu Val Gln Met Leu Ala Arg Ile His Leu Thr Ser Asp Ala His
225 230 235 240
cct gcc gaa ctt tac gac tgg ctg gac gat ctt gct gac cgc agt ggt 768
Pro Ala Glu Leu Tyr Asp Trp Leu Asp Asp Leu Ala Asp Arg Ser Gly
245 250 255
aac gac gag ctt gtg gca gag gcg cga aga atg cgg cga tat ttc ttg 816
Asn Asp Glu Leu Val Ala Glu Ala Arg Arg Met Arg Arg Tyr Phe Leu
260 265 270
acg gat gga ata tcg agg act cca tcg ttc gag cga ttt tgg cgc gag 864
Thr Asp Gly Ile Ser Arg Thr Pro Ser Phe Glu Arg Phe Trp Arg Glu
275 280 285
ctc gat gcg gcg cgg aag ggc gag cta gtc tcg taa 900
Leu Asp Ala Ala Arg Lys Gly Glu Leu Val Ser
290 295
<210> 3
<211> 810
<212> DNA
<213> 大肠杆菌 (proC)
<400> 3
atggaaaaga aaatcggttt tattggctgc ggcaatatgg gaaaagccat tctcggcggt 60
ctgattgcca gcggtcaggt gcttccaggg caaatctggg tatacacccc ctccccggat 120
aaagtcgccg ccctgcatga ccagttcggc atcaacgccg cagaatcggc gcaagaagtg 180
gcgcaaatcg ccgacatcat ttttgctgcc gttaaacctg gcatcatgat taaagtgctt 240
agcgaaatca cctccagcct gaataaagac tctctggtcg tttctattgc tgcaggtgtc 300
acgctcgacc agcttgcccg cgcgctgggc catgaccgga aaattatccg cgccatgccg 360
aacactcccg cactggttaa tgccgggatg acctccgtaa cgccaaacgc gctggtaacc 420
ccagaagata ccgctgatgt gctgaatatt ttccgctgct ttggcgaagc ggaagtaatt 480
gctgagccga tgatccaccc ggtggtcggt gtgagcggtt cttcgccagc ctacgtattt 540
atgtttatcg aagcgatggc cgacgccgcc gtgctgggcg ggatgccacg cgcccaggcg 600
tataaatttg ccgctcaggc ggtaatgggt tccgcaaaaa tggtgctgga aacgggagaa 660
catccggggg cactgaaaga tatggtctgc tcaccgggag gcaccaccat tgaagcggta 720
cgcgtactgg aagagaaagg cttccgtgct gcagtgatcg aagcgatgac gaagtgtatg 780
gaaaaatcag aaaaactcag caaatcctga 810
<210> 4
<211> 1470
<212> DNA
<213> 大肠杆菌 (lysP)
<400> 4
atggtttccg aaactaaaac cacagaagcg ccgggcttac gccgtgaatt aaaggcgcgt 60
cacctgacga tgattgccat tggcggttcc atcggtacag gtctttttgt tgcctctggc 120
gcaacgattt ctcaggcagg tccgggcggg gcattgctct cgtatatgct gattggcctg 180
atggtttact tcctgatgac cagtctcggt gaactggctg catatatgcc ggtttccggt 240
tcgtttgcca cttacggtca gaactatgtt gaagaaggct ttggcttcgc gctgggctgg 300
aactactggt acaactgggc ggtgactatc gccgttgacc tggttgcagc tcagctggtc 360
atgagctggt ggttcccgga tacaccgggc tggatctgga gtgcgttgtt cctcggcgtt 420
atcttcctgc tgaactacat ctcagttcgt ggctttggtg aagcggaata ctggttctca 480
ctgatcaaag tcacgacagt tattgtcttt atcatcgttg gcgtgctgat gattatcggt 540
atcttcaaag gcgcgcagcc tgcgggctgg agcaactgga caatcggcga agcgccgttt 600
gctggtggtt ttgcggcgat gatcggcgta gctatgattg tcggcttctc tttccaggga 660
accgagctga tcggtattgc tgcaggcgag tccgaagatc cggcgaaaaa cattccacgc 720
gcggtacgtc aggtgttctg gcgaatcctg ttgttctatg tgttcgcgat cctgattatc 780
agcctgatta ttccgtacac cgatccgagc ctgctgcgta acgatgttaa agacatcagc 840
gttagtccgt tcaccctggt gttccagcac gcgggtctgc tctctgcggc ggcggtgatg 900
aacgcagtta ttctgacggc ggtgctgtca gcgggtaact ccggtatgta tgcgtctact 960
cgtatgctgt acaccctggc gtgtgacggt aaagcgccgc gcattttcgc taaactgtcg 1020
cgtggtggcg tgccgcgtaa tgcgctgtat gcgacgacgg tgattgccgg tctgtgcttc 1080
ctgacctcca tgtttggcaa ccagacggta tacctgtggc tgctgaacac ctccgggatg 1140
acgggtttta tcgcctggct ggggattgcc attagccact atcgcttccg tcgcggttac 1200
gtattgcagg gacacgacat taacgatctg ccgtaccgtt caggtttctt cccactgggg 1260
ccgatcttcg cattcattct gtgtctgatt atcactttgg gccagaacta cgaagcgttc 1320
ctgaaagata ctattgactg gggcggcgta gcggcaacgt atattggtat cccgctgttc 1380
ctgattattt ggttcggcta caagctgatt aaaggaactc acttcgtacg ctacagcgaa 1440
atgaagttcc cgcagaacga taagaaataa 1470
<210> 5
<211> 1275
<212> DNA
<213> 枯草芽孢杆菌亚种subtilis str. 168 (rocG)
<400> 5
atgtcagcaa agcaagtctc gaaagatgaa gaaaaagaag ctcttaactt atttctgtct 60
acccaaacaa tcattaagga agcccttcgg aagctgggtt atccgggaga tatgtatgaa 120
ctcatgaaag agccgcagag aatgctcact gtccgcattc cggtcaaaat ggacaatggg 180
agcgtcaaag tgttcacagg ctaccggtca cagcacaatg atgctgtcgg tccgacaaag 240
gggggcgttc gcttccatcc agaagttaat gaagaggaag taaaggcatt atccatttgg 300
atgacgctca aatgcgggat tgccaatctt ccttacggcg gcgggaaggg cggtattatt 360
tgtgatccgc ggacaatgtc atttggagaa ctggaaaggc tgagcagggg gtatgtccgt 420
gccatcagcc agatcgtcgg tccgacaaag gatattccag ctcccgatgt gtacaccaat 480
tcgcagatta tggcgtggat gatggatgag tacagccggc tgcgggaatt cgattctccg 540
ggctttatta caggtaaacc gcttgttttg ggaggatcgc aaggacggga aacagcgacg 600
gcacagggcg tcacgatttg tattgaagag gcggtgaaga aaaaagggat caagctgcaa 660
aacgcgcgca tcatcataca gggctttgga aacgcgggta gcttcctggc caaattcatg 720
cacgatgcgg gcgcgaaggt gatcgggatt tctgatgcca atggcgggct ctacaaccca 780
gacggccttg atatccctta tttgctcgat aaacgggaca gctttggtat ggtcaccaat 840
ttatttactg acgtcatcac aaatgaggag ctgcttgaaa aggattgcga tattttagtg 900
cctgccgcga tctccaatca aatcacagcc aaaaacgcac ataacattca ggcgtcaatc 960
gtcgttgaac gggcgaacgg cccgacaacc attgatgcca ctaagatcct gaatgaaaga 1020
ggcgtgctgc ttgtgccgga tatcctagcg agtgccggcg gcgtcacggt ttcttatttt 1080
gaatgggtgc aaaacaacca aggatattat tggtcggaag aagaggttgc agaaaaactg 1140
agaagcgtca tggtcagctc gttcgaaaca atttatcaaa cagcggcaac acataaagtg 1200
gatatgcgtt tggcggctta catgacgggc atcagaaaat cggcagaagc atcgcgtttc 1260
cgcggatggg tctaa 1275
<210> 6
<211> 843
<212> DNA
<213> 苜蓿中华根瘤菌 1021 (meliloti)
<400> 6
atgagcaccc atttcttggg caaggtcaag ttcgatgaag cgcgattggc agaagatcta 60
tctaccttgg aagttgccga gttctcgagt gcatactcgg acttcgcgtg cggtaaatgg 120
gaggcatgcg tgctacgcaa tcggaccgga atgcaggagg aagatatcgt cgtaagtcac 180
aacgctcctg cactggccac gccgctgagc aagtcgctgc cgtatctgaa cgaacttgtt 240
gaaacccact tcgattgcag cgctgttcgg tatacaagaa ttgtccgtgt atcagaaaac 300
gcatgtataa tcccccatag tgattaccta gaactagatg agaccttcac aaggttacac 360
ctggtgttag acactaattc aggatgcgct aatactgagg aagataaaat atttcatatg 420
ggactgggag agatttggtt ccttgacgct atgttaccgc atagcgctgc ttgtttttcc 480
aaaactccgc gcctgcatct gatgatcgac tttgaggcta ccgcttttcc cgaatctttt 540
ctgcgaaatg tcgaacaacc agtgacaaca cgagacatgg ttgatcctcg gaaggaacta 600
accgatgagg ttatcgaagg tattctgggg ttttcaataa ttattagcga agccaattac 660
cgggaaattg tttctattct ggcgaagcta cacttcttct acaaggcaga ctgtcgatca 720
atgtacgact ggctgaagga aatctgcaaa cgtcgagggg atcctgcact tattgaaaag 780
accgcctcgc tcgagcgatt ttttctaggg caccgtgaac gtggcgaggt gatgacatac 840
taa 843
<210> 7
<211>
<212> DNA
<213> 百脉根根瘤菌 MAFF303099 (loti)
<400> 7
atgacaacgc ggatattggg tgtggtccag cttgatcaaa ggcgactgac agacgatttg 60
gctgtcttag cgaagtccaa cttctcgagc gaatattcgg atttcgcctg cgggcggtgg 120
gaattctgca tgctccgcaa tcagtcgggg aagcaggagg agcagagagt ggtcgtccac 180
gagaccccag cgctggcgac acctctgggc caatccttac cctatctcaa tgaattgttg 240
gacaatcact ttgataggga ctctatacgc tacgcgcgga tcatccggat atcagaaaac 300
gcgtgtataa tacctcaccg tgattacttg gaactagaag ggaaatttat cagagtgcac 360
ctagttctag atacgaatga aaagtgttcc aatacagaag agaataatat attccatatg 420
ggacgaggtg agatctggtt tcttgacgca agcctgccgc acagcgcggg atgtttctca 480
ccaactccac gcttacatct agtggtcgac atcgagggga ctcgttccct ggaagaggtt 540
gcaatcaatg tcgaacagcc gtcggcaagg aatgccacgg tggatactcg caaggagtgg 600
actgatgaaa cgctcgaatc cgttctggga ttttcggaga ttatcagcga ggccaattat 660
cgagagatcg tcgcgattct ggcgaagctc cactttttcc acaaggtcca ctgcgtggat 720
atgtatggct ggcttaagga aatctgccga cgtcgtggcg agccggcgct tatagaaaag 780
gccaactcgc ttgagcgatt ttatctcatt gaccgtgctg ctggcgaggt catgacttat 840
tga 843
<210> 8
<211> 852
<212> DNA
<213> Segniliparus rugosus ATCC BAA-974 (shortcis)
<400> 8
ttgatcgaag aggcctccgg cctgcccgac agcgcgtaca gctcggccta tcaagagtac 60
tcaatcggcc tttgggacac ggccacgcta tggaatgagc gcggcaacga gtctggtgaa 120
gtctcagagc acgccgcggc ggcggcgcct accgctatcg gccgatcgac gcctcggctc 180
aatgaattcg tgcgagcgaa attcaatgtc gacgttttgc gcgctgttcg actatttcgg 240
gcgcggcaag gcgcgatcat cattcctcat cgcgactatt tggagcactc caacgggttt 300
tgccggatcc atcttccttt ggtgacgact ccgggagccc gtaatagcga gaataacgag 360
gtctatcgca tgttgccagg cgagctttgg ttcctggaca gcaacgaggt ccattcgggt 420
ggagttcttg attcgggaac tcggatccat ttagtgctag atttcaccca tgagcataac 480
gaaaacccgg ctgctgtgtt gaaaaacgcg gaccgattac gtcctattgc tcgcgatccg 540
cgaatatctc gatccaagtt agaccacgaa gctctggaga gcctgatccg aggcggtcga 600
gtcgtgacat tggcgatgtg gcccgcccta gtgcagatgc tcgctagaat ccatctgaca 660
tctgacgcgc atcctgccga actttacgac tggctggacg atcttgctga ccgcagtggt 720
aacgacgagc ttgtggcaga ggcgcgaaga atgcggcgat atttcttgac ggatggaata 780
tcgaggactc catcgttcga gcgattttgg cgcgagctcg atgcggcgcg gaagggcgag 840
ctagtctcgt aa 852
<210> 9
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物 lac-lat-NcoF2
<400> 9
aaaccatggc catgattacg ccaagcttgt cccttcttgc c 41
<210> 10
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物 lat-XhoR
<400> 10
gggctcgagt caggcccggc gtgggccttc gacc 34
<210> 11
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物 lysP-SD-XhoF
<400> 11
gggctcgaga agaaggagat atagatatgg tttccgaaac taaaaccaca 50
<210> 12
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物 lysP-KpnR
<400> 12
cccggtacct tatttcttat cgttctgcgg gaa 33
<210> 13
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物 proC-SD-KpnF
<400> 13
gggggtacca agaaggagat atagatatgg aaaagaaaat cggttttatt g 51
<210> 14
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物 proC-BamR
<400> 14
cccggatcct caggatttgc tgagtttttc tg 32
<210> 15
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物 rocG-SD-BamF
<400> 15
cttggatcca gaaggagata tagatatgtc agcaaagcaa gtctcgaaag 50
<210> 16
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物 rocG-XbaR
<400> 16
cttaagcttt tagacccatc cgcggaaacg cga 33
<210> 17
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物 segni-short-NdeF
<400> 17
aaacatatga tcgaagaggc ctccggcctg cccga 35
<210> 18
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物 segni-cis-BglR
<400> 18
gggagatctt tacgagacta gctcgccctt ccgcgccgca t 41
<210> 19
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物 segni-cis-NdeF2
<400> 19
aaacatatga tcgaagaggc ctccggcctg cccga 35
<210> 20
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物 lat-(Spe)AflR2
<400> 20
gggcttaagc ttaagtcagg cccggcgtgg gccttcgacc 40
<210> 21
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 引物 loti-SD-pacF
<400> 21
cccttaatta aagaaggaga tatacacatg acaacgcgga tattgggtgt ggt 53
<210> 22
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物 loti-AvrR
<400> 22
aaacctaggt caataagtca tgacctcgcc agcagca 37
<210> 23
<211> 900
<212> DNA
<213> 人工序列
<220>
<223> 变体 cis
<220>
<221> CDS
<222> (1)..(900)
<400> 23
atg aag tca tac agt ctg ggg aag ttc gaa gac cgt agt att gac agt 48
Met Lys Ser Tyr Ser Leu Gly Lys Phe Glu Asp Arg Ser Ile Asp Ser
1 5 10 15
ttg atc gaa gag gcc tcc ggc ctg ccc gac agc gcg tac agc tcg gcc 96
Leu Ile Glu Glu Ala Ser Gly Leu Pro Asp Ser Ala Tyr Ser Ser Ala
20 25 30
tat caa gag tac tca atc ggc ctt tgg gac acg gcc acg cta tgg aat 144
Tyr Gln Glu Tyr Ser Ile Gly Leu Trp Asp Thr Ala Thr Leu Trp Asn
35 40 45
gag cgc ggt aac gag tct ggt gaa gtc tca gag cac gcc gcg gcg gcg 192
Glu Arg Gly Asn Glu Ser Gly Glu Val Ser Glu His Ala Ala Ala Ala
50 55 60
gcg cct acc gct atc ggc cga tcg acg cct cgg ctc aat gaa ttc gtg 240
Ala Pro Thr Ala Ile Gly Arg Ser Thr Pro Arg Leu Asn Glu Phe Val
65 70 75 80
cga gcg aaa ttc aat gtc gac gtt ttg cgc gct gtt cga cta ttt cgg 288
Arg Ala Lys Phe Asn Val Asp Val Leu Arg Ala Val Arg Leu Phe Arg
85 90 95
gcg cgg caa ggc gcg atc atc att cct cat cgc gac tat ttg gag cac 336
Ala Arg Gln Gly Ala Ile Ile Ile Pro His Arg Asp Tyr Leu Glu His
100 105 110
tcc aac ggg ttt tgc cgg atc cat ctt cct ttg gtg acg act ccg gga 384
Ser Asn Gly Phe Cys Arg Ile His Leu Pro Leu Val Thr Thr Pro Gly
115 120 125
gcc cgt aat agc gag aat aac gag gtc tat cgc atg atg cca ggc gag 432
Ala Arg Asn Ser Glu Asn Asn Glu Val Tyr Arg Met Met Pro Gly Glu
130 135 140
ctt tgg ttc ctg gac agc aac gag gtc cat tcg ggt gga gtt ctt gat 480
Leu Trp Phe Leu Asp Ser Asn Glu Val His Ser Gly Gly Val Leu Asp
145 150 155 160
tcg gga act cgg atc cat tta gtg cta gat ttc acc cat gag cat aac 528
Ser Gly Thr Arg Ile His Leu Val Leu Asp Phe Thr His Glu His Asn
165 170 175
gaa aac ccg gct gct gtg ttg aaa aac gcg gac cga tta cgt cct att 576
Glu Asn Pro Ala Ala Val Leu Lys Asn Ala Asp Arg Leu Arg Pro Ile
180 185 190
gct cgc gat ccg cga ata tct cga tcc aag tta gac cac gaa gct ctg 624
Ala Arg Asp Pro Arg Ile Ser Arg Ser Lys Leu Asp His Glu Ala Leu
195 200 205
gag agc ctg atc cga ggc ggt cga gtc gtg aca ttg gcg atg tgg ccc 672
Glu Ser Leu Ile Arg Gly Gly Arg Val Val Thr Leu Ala Met Trp Pro
210 215 220
gcc cta gtg cag atg ctc gct aga atc cat ctg aca tct gac gcg cat 720
Ala Leu Val Gln Met Leu Ala Arg Ile His Leu Thr Ser Asp Ala His
225 230 235 240
cct gcc gaa ctt tac gac tgg ctg gac gat ctt gct gac cgc agt ggt 768
Pro Ala Glu Leu Tyr Asp Trp Leu Asp Asp Leu Ala Asp Arg Ser Gly
245 250 255
aac gac gag ctt gtg gca gag gcg cga aga atg cgg cga tat ttc ttg 816
Asn Asp Glu Leu Val Ala Glu Ala Arg Arg Met Arg Arg Tyr Phe Leu
260 265 270
acg gat gga ata tcg agg act cca tcg ttc gag cga ttt tgg cgc gag 864
Thr Asp Gly Ile Ser Arg Thr Pro Ser Phe Glu Arg Phe Trp Arg Glu
275 280 285
ctc gat gcg gcg cgg aag ggc gag cta gtc tcg taa 900
Leu Asp Ala Ala Arg Lys Gly Glu Leu Val Ser
290 295
<210> 24
<211> 493
<212> PRT
<213> 泥色黄杆菌 IFO3084 (lat)
<400> 24
Met Ser Leu Leu Ala Pro Leu Ala Pro Leu Arg Ala His Ala Gly Thr
1 5 10 15
Arg Leu Thr Gln Gly Leu Ser Asp Pro Gln Val Glu Gln Leu Ala Ala
20 25 30
Asn His Pro Asp Leu Arg Ala Ala Ile Asp Ala Ala Ala Asp Glu Tyr
35 40 45
Ala Arg Ile Lys Pro Gln Ala Ala Ala Leu Leu Asp Leu Asp Glu Ser
50 55 60
Ala Gln Ile Ala Ala Val Gln Asp Gly Phe Val Asn Phe Tyr Ala Asp
65 70 75 80
Asp Ala Val Val Pro Tyr Ile Ala Leu Ala Ala Arg Gly Pro Trp Val
85 90 95
Val Ser Leu Lys Gly Ala Val Leu Tyr Asp Ala Gly Gly Tyr Gly Met
100 105 110
Leu Gly Phe Gly His Thr Pro Ala Asp Ile Leu Glu Ala Val Gly Lys
115 120 125
Pro Gln Val Met Ala Asn Ile Met Thr Pro Ser Leu Ala Gln Gly Arg
130 135 140
Phe Ile Ala Ala Met Arg Arg Glu Ile Gly His Thr Arg Gly Gly Cys
145 150 155 160
Pro Phe Ser His Phe Met Cys Leu Asn Ser Gly Ser Glu Ala Val Gly
165 170 175
Leu Ala Ala Arg Ile Ala Asp Ile Asn Ala Lys Leu Met Thr Asp Pro
180 185 190
Gly Ala Arg His Ala Gly Ala Thr Ile Lys Arg Val Val Ile Lys Gly
195 200 205
Ser Phe His Gly Arg Thr Asp Arg Pro Ala Leu Tyr Ser Asp Ser Thr
210 215 220
Arg Lys Ala Tyr Asp Ala His Leu Ala Ser Tyr Arg Asp Glu His Ser
225 230 235 240
Val Ile Ala Ile Ala Pro Tyr Asp Gln Gln Ala Leu Arg Gln Val Phe
245 250 255
Ala Asp Ala Gln Ala Asn His Trp Phe Ile Glu Ala Val Phe Leu Glu
260 265 270
Pro Val Met Gly Glu Gly Asp Pro Gly Arg Ala Val Pro Val Asp Phe
275 280 285
Tyr Arg Leu Ala Arg Glu Leu Thr Arg Glu His Gly Ser Leu Leu Leu
290 295 300
Ile Asp Ser Ile Gln Ala Ala Leu Arg Val His Gly Thr Leu Ser Phe
305 310 315 320
Val Asp Tyr Pro Gly His Gln Glu Leu Glu Ala Pro Asp Met Glu Thr
325 330 335
Tyr Ser Lys Ala Leu Asn Gly Ala Gln Phe Pro Leu Ser Val Val Ala
340 345 350
Val Thr Glu His Ala Ala Ala Leu Tyr Arg Lys Gly Val Tyr Gly Asn
355 360 365
Thr Met Thr Thr Asn Pro Arg Ala Leu Asp Val Ala Cys Ala Thr Leu
370 375 380
Ala Arg Leu Asp Glu Pro Val Arg Asn Asn Ile Arg Leu Arg Gly Gln
385 390 395 400
Gln Ala Met Gln Lys Leu Glu Ala Leu Lys Glu Arg Leu Gly Gly Ala
405 410 415
Ile Thr Lys Val Gln Gly Thr Gly Leu Leu Phe Ser Cys Glu Leu Ala
420 425 430
Pro Gln Tyr Lys Cys Tyr Gly Ala Gly Ser Thr Glu Glu Trp Leu Arg
435 440 445
Met His Gly Val Asn Val Ile His Gly Gly Glu Asn Ser Leu Arg Phe
450 455 460
Thr Pro His Phe Gly Met Asp Glu Ala Glu Leu Asp Leu Leu Val Glu
465 470 475 480
Met Val Gly Arg Ala Leu Val Glu Gly Pro Arg Arg Ala
485 490
<210> 25
<211> 299
<212> PRT
<213> Segniliparus rugosus ATCC BAA-974 (cis)
<400> 25
Met Lys Ser Tyr Ser Leu Gly Lys Phe Glu Asp Arg Ser Ile Asp Ser
1 5 10 15
Leu Ile Glu Glu Ala Ser Gly Leu Pro Asp Ser Ala Tyr Ser Ser Ala
20 25 30
Tyr Gln Glu Tyr Ser Ile Gly Leu Trp Asp Thr Ala Thr Leu Trp Asn
35 40 45
Glu Arg Gly Asn Glu Ser Gly Glu Val Ser Glu His Ala Ala Ala Ala
50 55 60
Ala Pro Thr Ala Ile Gly Arg Ser Thr Pro Arg Leu Asn Glu Phe Val
65 70 75 80
Arg Ala Lys Phe Asn Val Asp Val Leu Arg Ala Val Arg Leu Phe Arg
85 90 95
Ala Arg Gln Gly Ala Ile Ile Ile Pro His Arg Asp Tyr Leu Glu His
100 105 110
Ser Asn Gly Phe Cys Arg Ile His Leu Pro Leu Val Thr Thr Pro Gly
115 120 125
Ala Arg Asn Ser Glu Asn Asn Glu Val Tyr Arg Met Leu Pro Gly Glu
130 135 140
Leu Trp Phe Leu Asp Ser Asn Glu Val His Ser Gly Gly Val Leu Asp
145 150 155 160
Ser Gly Thr Arg Ile His Leu Val Leu Asp Phe Thr His Glu His Asn
165 170 175
Glu Asn Pro Ala Ala Val Leu Lys Asn Ala Asp Arg Leu Arg Pro Ile
180 185 190
Ala Arg Asp Pro Arg Ile Ser Arg Ser Lys Leu Asp His Glu Ala Leu
195 200 205
Glu Ser Leu Ile Arg Gly Gly Arg Val Val Thr Leu Ala Met Trp Pro
210 215 220
Ala Leu Val Gln Met Leu Ala Arg Ile His Leu Thr Ser Asp Ala His
225 230 235 240
Pro Ala Glu Leu Tyr Asp Trp Leu Asp Asp Leu Ala Asp Arg Ser Gly
245 250 255
Asn Asp Glu Leu Val Ala Glu Ala Arg Arg Met Arg Arg Tyr Phe Leu
260 265 270
Thr Asp Gly Ile Ser Arg Thr Pro Ser Phe Glu Arg Phe Trp Arg Glu
275 280 285
Leu Asp Ala Ala Arg Lys Gly Glu Leu Val Ser
290 295
<210> 26
<211> 299
<212> PRT
<213> 人工序列
<220>
<223> 变体 cis
<400> 26
Met Lys Ser Tyr Ser Leu Gly Lys Phe Glu Asp Arg Ser Ile Asp Ser
1 5 10 15
Leu Ile Glu Glu Ala Ser Gly Leu Pro Asp Ser Ala Tyr Ser Ser Ala
20 25 30
Tyr Gln Glu Tyr Ser Ile Gly Leu Trp Asp Thr Ala Thr Leu Trp Asn
35 40 45
Glu Arg Gly Asn Glu Ser Gly Glu Val Ser Glu His Ala Ala Ala Ala
50 55 60
Ala Pro Thr Ala Ile Gly Arg Ser Thr Pro Arg Leu Asn Glu Phe Val
65 70 75 80
Arg Ala Lys Phe Asn Val Asp Val Leu Arg Ala Val Arg Leu Phe Arg
85 90 95
Ala Arg Gln Gly Ala Ile Ile Ile Pro His Arg Asp Tyr Leu Glu His
100 105 110
Ser Asn Gly Phe Cys Arg Ile His Leu Pro Leu Val Thr Thr Pro Gly
115 120 125
Ala Arg Asn Ser Glu Asn Asn Glu Val Tyr Arg Met Met Pro Gly Glu
130 135 140
Leu Trp Phe Leu Asp Ser Asn Glu Val His Ser Gly Gly Val Leu Asp
145 150 155 160
Ser Gly Thr Arg Ile His Leu Val Leu Asp Phe Thr His Glu His Asn
165 170 175
Glu Asn Pro Ala Ala Val Leu Lys Asn Ala Asp Arg Leu Arg Pro Ile
180 185 190
Ala Arg Asp Pro Arg Ile Ser Arg Ser Lys Leu Asp His Glu Ala Leu
195 200 205
Glu Ser Leu Ile Arg Gly Gly Arg Val Val Thr Leu Ala Met Trp Pro
210 215 220
Ala Leu Val Gln Met Leu Ala Arg Ile His Leu Thr Ser Asp Ala His
225 230 235 240
Pro Ala Glu Leu Tyr Asp Trp Leu Asp Asp Leu Ala Asp Arg Ser Gly
245 250 255
Asn Asp Glu Leu Val Ala Glu Ala Arg Arg Met Arg Arg Tyr Phe Leu
260 265 270
Thr Asp Gly Ile Ser Arg Thr Pro Ser Phe Glu Arg Phe Trp Arg Glu
275 280 285
Leu Asp Ala Ala Arg Lys Gly Glu Leu Val Ser
290 295
<210> 27
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物 proCrocGX-SpeR
<400> 27
cttactagtt tatttcttat cgttctgcgg 30
<210> 28
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物 proCX-SpeR
<400> 28
tctactagtt caggatttgc tgagtttttc 30
<210> 29
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物 rocGX-SpeF
<400> 29
atgactagtt cgaacagaaa gtaatcgtat 30
<210> 30
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物 proCX-SpeF
<400> 30
tgaactagta gaaggagata tagatatgt 30

Claims (13)

1.顺式-5-羟基-L-六氢吡啶甲酸或其药学上可接受的盐或者它们的溶剂合物的制备方法,其包含,通过以可表达的状态含有下述(A)和(D)~(F)、以及(G)和(H)中任一多核苷酸的微生物,以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的步骤:
(A)由序列号2记载的碱基序列组成的多核苷酸;
(D)编码由序列号25记载的氨基酸序列组成的蛋白质的多核苷酸;
(E)编码由在序列号25记载的氨基酸序列中置换、缺失、插入、和/或添加1个氨基酸而成的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(F) 编码由与序列号25记载的氨基酸序列具有至少99.7%以上同一性的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸;
(G) 编码由在序列号25记载的氨基酸序列中置换、缺失、插入、和/或添加1个氨基酸而成的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸,并且该多核苷酸来源于裙皱慢反应脂肪酸菌(Segniliparus rugosus)和
(H) 编码由与序列号25记载的氨基酸序列具有至少99.7%以上同一性的氨基酸序列组成、并且具有催化以L-六氢吡啶甲酸为底物生成顺式-5-羟基-L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸,并且该多核苷酸来源于裙皱慢反应脂肪酸菌(Segniliparusrugosus)。
2.权利要求1中记载的制备方法,其中所述微生物以可表达的状态进一步含有:编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸、以及编码具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸,所述方法进一步包含:
以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛、随后将L-氨基己二酸-Δ-半醛转化为Δ1-哌啶烯-6-甲酸的步骤;以及
以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的步骤。
3.权利要求2中记载的制备方法,其中所述编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸来源于泥色黄杆菌(Flavobacteriumlutescens)。
4.权利要求2或3中记载的制备方法,其中所述微生物是大肠杆菌,其原本具有编码具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸。
5.下述(D)的多核苷酸:
(D)编码由序列号25或序列编号26记载的氨基酸序列组成的蛋白质的多核苷酸。
6.转化用载体,其包含权利要求5中记载的多核苷酸。
7.权利要求6中记载的微生物的转化用载体,其进一步包含编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸。
8.权利要求6或7中记载的微生物的转化用载体,其进一步包含编码具有催化生成α-酮戊二酸的反应的活性的蛋白质和/或具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质的多核苷酸。
9.基因重组微生物,其通过权利要求6~8的任一项中记载的载体转化。
10.基因重组大肠杆菌,其通过权利要求5中记载的多核苷酸、以及编码具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质的多核苷酸转化,且具有以L-赖氨酸为原料生成顺式-5-羟基-L-六氢吡啶甲酸的能力。
11.下述(d)的蛋白质:
(d) 由序列号25或序列编号26记载的氨基酸序列组成的蛋白质。
12.顺式-5-羟基-L-六氢吡啶甲酸或其药学上可接受的盐或者它们的溶剂合物的制备方法,其包含使权利要求11中记载的蛋白质作用于L-六氢吡啶甲酸生成顺式-5-羟基-L-六氢吡啶甲酸的步骤。
13.权利要求12中记载的制备方法,其进一步包含:
使具有催化以L-赖氨酸为底物生成L-氨基己二酸-Δ-半醛的反应的活性的蛋白质作用于L-赖氨酸生成L-氨基己二酸-Δ-半醛,随后将L-氨基己二酸-Δ-半醛转化为Δ1-哌啶烯-6-甲酸的步骤;以及
使具有催化以Δ1-哌啶烯-6-甲酸为底物生成L-六氢吡啶甲酸的反应的活性的蛋白质作用于得到的Δ1-哌啶烯-6-甲酸生成L-六氢吡啶甲酸的步骤。
CN202010074917.1A 2012-06-13 2013-06-12 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法 Pending CN111485008A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012-133876 2012-06-13
JP2012133876 2012-06-13
CN201380030961.0A CN104395466A (zh) 2012-06-13 2013-06-12 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380030961.0A Division CN104395466A (zh) 2012-06-13 2013-06-12 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法

Publications (1)

Publication Number Publication Date
CN111485008A true CN111485008A (zh) 2020-08-04

Family

ID=49758258

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010074917.1A Pending CN111485008A (zh) 2012-06-13 2013-06-12 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法
CN201380030961.0A Pending CN104395466A (zh) 2012-06-13 2013-06-12 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201380030961.0A Pending CN104395466A (zh) 2012-06-13 2013-06-12 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法

Country Status (6)

Country Link
US (1) US9611490B2 (zh)
EP (1) EP2873730A4 (zh)
JP (1) JP6276178B2 (zh)
CN (2) CN111485008A (zh)
CA (1) CA2876558C (zh)
WO (1) WO2013187438A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6539212B2 (ja) * 2013-12-26 2019-07-03 株式会社カネカ 光学活性環状イミノ酸の製造方法
CN105940103B (zh) * 2014-01-31 2021-06-15 株式会社Api 哌可酸4位羟化酶和利用该酶的4-羟基氨基酸的制造法
US10087473B2 (en) 2014-11-12 2018-10-02 Api Corporation Method for manufacturing cis-5-hydroxy-L-pipecolic acid
CN116396991A (zh) 2015-10-02 2023-07-07 株式会社Api 羟基-l-哌可酸的制造方法
US20240043887A1 (en) * 2020-12-25 2024-02-08 Api Corporation Mutant l-pipecolic acid hydroxylase and cis-5-hydroxy-l-pipecolic acid production method utilizing same
CN117866868A (zh) * 2024-03-12 2024-04-12 天津科技大学 一种l-高脯氨酸生产菌株及其构建方法与应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001048216A1 (fr) * 1999-12-28 2001-07-05 Mercian Corporation Methode de production biologique d'acide l-pipecolique

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2290065B1 (en) 2008-05-12 2014-08-27 Kyowa Hakko Bio Co., Ltd. Process for production of cis-4-hydroxy-l-proline
SE534361C2 (sv) * 2009-10-23 2011-07-26 Idea Ab R Metod för tillverkning av ett kompositmaterial

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001048216A1 (fr) * 1999-12-28 2001-07-05 Mercian Corporation Methode de production biologique d'acide l-pipecolique
EP1249494A1 (en) * 1999-12-28 2002-10-16 Mercian Corporation Process for the biological production of l-pipecolic acid

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ASHLEE M.EARL等: "High quality draft genome sequence of Segniliparus rugosus CDC 945T= (ATCC BAA-974T)" *
EARL,A.M等: "Segniliparus rugosus ATCC BAA-974 CONT1.186,whole genome shotgun sequence" *
KLEIN等: "A simple procedure for selective hydroxylation of L-proline and L-pipecolic acid with recombinantly expressed praline hydroxylases" *

Also Published As

Publication number Publication date
EP2873730A4 (en) 2016-05-11
US20150211035A1 (en) 2015-07-30
JPWO2013187438A1 (ja) 2016-02-04
CA2876558C (en) 2020-08-04
CN104395466A (zh) 2015-03-04
CA2876558A1 (en) 2013-12-19
EP2873730A1 (en) 2015-05-20
US9611490B2 (en) 2017-04-04
WO2013187438A1 (ja) 2013-12-19
JP6276178B2 (ja) 2018-02-07

Similar Documents

Publication Publication Date Title
US11905539B2 (en) Isopropylmalate synthase variant and a method of producing L-leucine using the same
Ingram et al. One‐pot synthesis of amino‐alcohols using a de‐novo transketolase and β‐alanine: Pyruvate transaminase pathway in Escherichia coli
Jennewein et al. Directed evolution of an industrial biocatalyst: 2‐deoxy‐D‐ribose 5‐phosphate aldolase
RU2571932C2 (ru) Способ получения l-орнитина с использованием бактерий, сверхэкспрессирующих lyse
CN111485008A (zh) 顺式-5-羟基-l-六氢吡啶甲酸的生物学制备方法
US8735132B2 (en) Mutations and genetic targets for enhanced L-tyrosine production
Prell et al. Adaptive laboratory evolution accelerated glutarate production by Corynebacterium glutamicum
KR20220119026A (ko) 구아니디노아세트산의 발효 생산 방법
WO2020099303A1 (en) Improved production of riboflavin
JP2003511067A (ja) 高い収量のタンパク質発現系および方法
WO2009139365A1 (ja) シス-4-ヒドロキシ-l-プロリン製造方法
KR20050108387A (ko) L-세린 대사에 관여하는 단백질을 암호화하는 코리네형박테리아의 뉴클레오티드 서열 및 미생물에 의한 l-세린의제조 방법
EP1249494B1 (en) Process for the biological production of l-pipecolic acid
CN107287256A (zh) 全细胞催化合成l-2-哌啶甲酸的方法
EP4332230A1 (en) Corynebacterium glutamicum variant with improved l-lysine production ability, and method for producing l-lysine using same
JP6484467B2 (ja) 2−アミノブタン酸の製造方法およびアスパラギン酸デカルボキシラーゼの使用方法
WO2006104124A1 (ja) 新規パントテン酸キナーゼ遺伝子及びその利用方法
CN108866017A (zh) 一种酶法制备β-羟基-β-甲基丁酸的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Tokyo, Japan

Applicant after: Sanli Holding Co.,Ltd.

Address before: Tokyo, Japan

Applicant before: MICROBIOPHARM JAPAN CO.,LTD.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211203

Address after: Tokyo, Japan

Applicant after: MICROBIOPHARM JAPAN CO.,LTD.

Address before: Tokyo, Japan

Applicant before: Sanli Holding Co.,Ltd.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200804