CN101878309A - 用于工业应用的新丙二酸脱羧酶 - Google Patents

用于工业应用的新丙二酸脱羧酶 Download PDF

Info

Publication number
CN101878309A
CN101878309A CN2008801180574A CN200880118057A CN101878309A CN 101878309 A CN101878309 A CN 101878309A CN 2008801180574 A CN2008801180574 A CN 2008801180574A CN 200880118057 A CN200880118057 A CN 200880118057A CN 101878309 A CN101878309 A CN 101878309A
Authority
CN
China
Prior art keywords
ala
leu
protein
val
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008801180574A
Other languages
English (en)
Other versions
CN101878309B (zh
Inventor
B·豪尔
N·施耐德
K·奥克拉萨
J·米克尔费尔德
D·雷斯
C·莱威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN101878309A publication Critical patent/CN101878309A/zh
Application granted granted Critical
Publication of CN101878309B publication Critical patent/CN101878309B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/235Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bordetella (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01076Arylmalonate decarboxylase (4.1.1.76)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2299/00Coordinates from 3D structures of peptides, e.g. proteins or enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/010755-Guanidino-2-oxopentanoate decarboxylase (4.1.1.75)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/195Assays involving biological materials from specific organisms or of a specific nature from bacteria
    • G01N2333/235Assays involving biological materials from specific organisms or of a specific nature from bacteria from Bordetella (G)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及用于酶催化的丙二酸(propanedioic acid)衍生物酶促脱羧的方法,其中所述酶在结构和/或功能上与从博德特氏菌属(Bordetella)微生物分离的芳基丙二酸脱羧酶(AMD酶)相关。本发明也涉及用于实施所要求保护的方法的具有脱羧酶活性的新酶、其突变体、对应的编码序列与表达系统、制备所述新酶的方法和用于获得也具有所述脱羧酶活性的其他合适酶的筛选方法。

Description

用于工业应用的新丙二酸脱羧酶
本发明涉及由酶催化的酶促脱羧α-取代的丙二酸衍生物的方法,其中所述的酶在结构上和/或功能上与从博德特氏菌属(Bordetella)微生物、尤其支气管炎博德特氏菌(Bordetella bronchiseptica)分离的芳基丙二酸脱羧酶(AMD酶)相关。本发明也涉及用于实施所要求保护的方法的具有脱羧酶活性的新酶、其突变体、对应的编码序列与表达系统、制备所述新酶的方法和用于获得也具有所述脱羧酶活性的其他合适酶的筛选方法。
发明背景
丙二酰底物的脱羧是许多重要生物学途径中存在的常见酶转化作用。例如,多种需氧细菌和厌氧细菌可以依赖丙二酸盐作为唯一碳源生长,因为它们拥有将丙二酸或丙二酰辅酶A转化成乙酸盐的丙二酸脱羧酶系统1。大部分的这些原型丙二酸脱羧酶是多酶系统,涉及具有不寻常辅基的酰基载体蛋白(ACP)以及生物素依赖性脱羧酶2。丙二酰单元的脱羧也在β-酮酰基ACP合酶(KAS)和脂肪酸与聚酮化合物合酶内部的结构域所催化的克莱森型缩合反应期间发生。
芳基丙二酸脱羧酶(AMD酶)从革兰氏阴性细菌-支气管败血性产碱杆菌(Alcaligenes bronchisepticus)(支气管炎博德特氏菌)分离3,4,它催化α-芳基-α-甲基丙二酸的对映选择性脱羧以产生光学纯α-芳基丙酸。尽管没有建立该酶的生物学作用,然而已经显示它是使一类底物脱羧的强烈催化剂,其中所述底物包括包括:苯基丙二酸1;2-甲基-2-苯基丙二酸2;2-甲基-2-萘基丙二酸3和2-噻吩基丙二酸4(见图1(a))5。AMD酶是丙二酸脱羧酶类中不寻常的6,因为它不需要生物素或任何其他辅因子来发挥活性。此外,脱羧不涉及形成作为几种丙二酸脱羧酶的常见推动力1,2的丙二酰硫酯酶中间体7。该酶的机制因而是很令人感兴趣的。AMD酶的手性羧酸产物对于工业应用也潜在地具有吸引力,尤其作为药物合成的前体。
来自支气管炎博德特氏菌的AMD酶(SEQ ID NO:2)显示与许多消旋酶和异构酶的序列相似性7,8。另外,如序列比对所示,推定的催化性半胱氨酸在全部酶中保留。然而,没有报道那些酶的AMD酶活性并且来自支气管炎博德特氏菌的AMD酶(SEQ ID NO:2)仍是能够催化α-芳基丙二酸脱羧成α-芳基丙酸的唯一酶。
在谷氨酸消旋酶和天冬氨酸消旋酶的情况下,两个半胱氨酸残基位于活性位点内氨基酸底物两侧之任一侧。实际上,据讨论这两个半胱氨酸残基在广义酸-碱催化中发挥作用,从底物夺取α-质子以生成平面状烯醇化物,其中所述平面状烯醇化物从对面再次质子化,从而产生外消旋物9,10。在AMD酶的情况下,已经显示单个活性位点Cys残基(Cys188)在酶催化中发挥重要作用。这产生了AMD酶机制与消旋酶相似的说法。例如,提出底物2-甲基-2-苯基丙二酸的脱羧产生烯醇化物阴离子,该烯醇化物阴离子在si-面被Cys188质子化以形成R-构型的α-苯基丙酸产物8。为支持与消旋酶家族的机制相似性,在序列比对结果指导下8,第二半胱氨酸的导入产生能够使纯手性α-芳基丙酸外消旋化的AMD酶单点突变体(G74C),尽管催化效率极低。此外,双突变G74C/C188S产生具有相反对映选择性的酶,其中预测所述的双突变G74C/C188S改变烯醇化物中间体的对立面上关键活性位点Cys的位置。再次地,这种突变体的催化效率比野生型AMD酶低几个数量级11
WO 2005/07811提供了从支气管炎博德特氏菌KU1201分离的AMD酶和突变体的具体例子,所述突变体携带多达2个突变氨基酸残基。提出了具有改变的酶活性的以下突变体:A84G、F85A、A87G、R94A、T103A、I127A、(F85A、R173A)、(F85A、E176A)和(F85A、A178G);提出了具有改良热稳定性的以下突变体:P15A、P32A、G74A、T75A、D128A、D163A、A165G和C171A。一般地,提及在至少一个以下位置内的突变:17、19、22、24、25、32、41、42、46、47、53、60、61、63、68、74、83、84、85、87、94、103、105、112、116、119、121、139、142、155、168、171、173、178、199、201、202、203、204、205、210、221、222、224、225、226、227、228、229、230、235、238、239和240。然而,所述文献既没有公开所述突变体或亲代AMD酶的整个晶体结构或此类酶的催化部位的结构性架构,该文献也没有教导或提出AMD酶活性可能与不同来源的蛋白质有关。该文献展望了可能借助该文献中公开的酶突变体可接近的其他“产物结构”。然而,仅报道了针对苯基丙二酸和α-羟基-(4-甲基苯基)丙二酸的有限数目突变体的酶活性。没有提出或甚至测试烃基取代的、尤其烯基取代的丙二酸衍生物。
本领域迄今没有描述具有AMD酶活性的其他酶。
因而需要备选的、任选改良的具有AMD酶活性的酶,其中所述酶潜在可应用于工业方法中以优选地制备丙二酸衍生物,例如α-芳基丙酸的光学纯脱羧产物,并且不需要生物素或任何其他辅因子用于发挥脱羧酶活性。
也需要鉴定新的具有扩展或改变/修饰的底物专一性的丙二酸脱羧酶,即,使异于α-芳基丙二酸的丙二酸衍生物脱羧的酶,其中所述酶潜在得可应用于工业方法中以优选地从相应丙二酸底物制备光学纯的α-取代的一元羧酸。
也需要从具有AMD酶活性的此类酶或具有扩展或改变/修饰的底物专一性的此类酶中衍生的功能性突变体,所述功能性突变体潜在可应用于工业方法中以优选地从丙二酸底物制备光学纯的一元羧酸。所述的功能性突变体可以适应于优选或排他地使异于芳基丙二酸的丙二酸底物(例如非芳族α-取代的丙二酸衍生物,如烯基取代的丙二酸)脱羧。
因而提供具有如上文所提及丙二酸脱羧酶活性(MD酶活性)的此类备选或任选改良的酶是本发明的目的。
发明简述
出人意料地,上文提及的问题可通过鉴定迄今未曾描述过其AMD酶活性或MD酶活性的其他酶加以解决。
尤其,本发明人鉴定了来自支气管炎博德特氏菌的AMD酶(SEQ IDNO:2)的晶体结构并开展了允许表征这种有趣脱羧酶的详细分子机制的18O标记研究。基于此,本发明人能够鉴定工业上合适的其他AMD酶。例如,鉴定到来自中生根瘤菌(Mesorhizobium sp.)BNC1的酶(SEQ IDNO:4),其中显示所述酶具有与来自支气管炎博德特氏菌的AMD酶相似的结构、立体化学、机制和催化效率。本发明人也对此类酶观察到(若与亲代酶相比较)扩展或修饰的底物专一性和/或酶活性,从而允许α-取代的其他丙二酸衍生物的生物催化转化。基于所述研究,本发明人也能够提供所述酶的功能性工程化突变体。
附图简述
图1:(a)由AMD酶催化的脱羧反应;(b)由来自支气管炎博德特氏菌的AMD酶催化的脱羧反应的建议机制。
图2:如ESI-MS分析后所确定的具有羧基端His6标签的纯化酶的序列。
图3.(a)来自支气管炎博德特氏菌的AMD酶的序列比对结果(上部线)和来自不同微生物:中生根瘤菌BNCI、支气管炎博德特氏菌RB50、掘越氏热球菌(Pyrcoccus horikoshii)OT3和Alkaliphilus metalliredigenes QYMF的结构及功能上相关的酶的例子。
(b)来自支气管炎博德特氏菌的AMD酶的功能性相关序列区域的比对结果(上部线)和来自不同微生物的结构及功能上相关的酶的例子。
图4:(a)突出显示磷酸盐和Cys188的AMD酶晶体结构的示意图。(b)具有所结合磷酸盐的AMD酶活性位点和对磷酸盐O1、O2和O3观察到的氢键形成模式。
图5:具有在构筑较小结合口袋(较浅颜色)下缔合的残基Lys40、Val43、Tyr48、Val156、Pro14、Met159的AMD酶活性位点,其中所述的较小结合口袋包围与氧-阴离子孔残基Ser76、Thre75、Gly189(较深颜色)结合并接近于催化部位Cys188的中间体烯醇化物的甲基。
图6:(a)具有溶剂可及表面的支气管炎博德特氏菌AMD酶活性位点的横截面,显示了位于结合口袋中的2-甲基-2-苯基丙二酸的模型。构筑氧-阴离子孔的残基为较深色并且构筑疏水口袋的残基为较浅色,(b)中生根瘤菌BNCI AMD酶的活性位点。
图7:AMD酶活性位点内2-甲基-2-苯基丙二酸(左)和烯醇化物(右)的方向。
图8:使用18O标记的水确定AMD酶立体化学。
图9:使用2-甲基-2-苯基丙二酸作为底物的用于AMD酶活性的体内测定法,左图-含有不带AMD酶基因的pET30b载体的大肠杆菌菌落,右图-含有携带该基因的pET30b载体的大肠杆菌菌落。
图10:使用2-甲基-2-苯基丙二酸作为底物的用于AMD酶活性的体内测定法。顶部平皿-含有pET30b的BL21(DE3),底部平皿-含有带AMD酶基因的pET30b的BL21(DE3)。
发明详述
1.优选的实施方案
本发明的第一方面涉及使式Iα-取代的丙二酸化合物
        HOOC-C(R1)(R2)-COOH    (I)
或其盐形式脱羧的生物催化方法,其中
残基R1代表单环或二环状,任选1-、2-或3-重取代的环,所述环例如是任选取代的、尤其单环状、芳族或杂芳族的环;或非芳族环,尤其在环内部任选携带1或2个碳-碳双键的单环或二环;并且
残基R2代表H、OH、SH、NH2、低级烷氧基、低级烷硫基、低级烷基、低级烯基、低级炔基或羟基-低级烷基,尤其OH、SH或低级烷基,所述方法包括
a)使任意立体异构体混合物形式或光学纯形式的至少一种式(I)化合物与以下蛋白质接触:
(i)蛋白质,其具有丙二酸脱羧酶活性、尤其芳基丙二酸脱羧酶活性,并包含与SEQ ID NO:2的支气管炎博德特氏菌蛋白质(残基1至240)(Blast数据库条目BAA02419.1)具有100%或更少,或者尤其少于99%,例如少于98、97、96或95%,但是至少25%,例如至少30、35、40、45、50、60、70、80或90%序列同一性,例如25至98、30至97、30至95、30至90或30至80或30至70或30至70%序列同一性的氨基酸序列,或
(ii)蛋白质,其具有丙二酸脱羧酶活性、尤其芳基丙二酸脱羧酶活性,并包含与SEQ ID NO:12的嗜火产水菌蛋白质(残基1至254)(Blast数据库条目AAF25672)具有100%或更少,例如少于99%,例如少于98、97、96或95%,但是至少25%,例如至少30、35、40、45、50、60、70、80或90%序列同一性,例如25至98、30至97、30至95、30至90或30至80或30至70或30至70%序列同一性的氨基酸序列;
b)和任选地分离式I化合物的至少一种脱羧产物,优选分离该反应产物的一种特定立体异构体。
在另一个备选实施方案中,本发明提供了用于式I化合物或其盐形式脱羧的以上类型方法,其中
残基R1代表直链或分支的、单不饱和或多不饱和的低级烯基,所述低级烯基任选地携带一个或多个环状取代基;例如被1个或多个、优选1个、单环或二环状、任选取代的芳族或非芳族的环取代;或其中该低级烯基的两个(例如末端的)取代基共同形成碳环或杂环、饱和或不饱和的芳族的或尤其非芳族的环,例如,如本文中定义的环亚烷基残基;并且
残基R2代表H、OH、SH、NH2、低级烷氧基、低级烷硫基、低级烷基、低级烯基、低级炔基或羟基低级烷基、尤其OH、SH或低级烷基。根据所述的备选实施方案,所施加的酶活性是如本文中定义的MD酶活性。
在式I化合物或其盐形式的特定组中,残基R1代表直链或分支的单不饱和低级烯基,所述低级烯基任选地被单环或二环状、任选取代的环取代,并且残基R2是低级烷基。
尤其应当提及这样的化合物,其中R1代表直链C1-C6-烯-1-基,所述的直链C1-C6-烯-1-基任选地被单环或二环状、任选取代的环取代,并且残基R2是C1-C6-烷基。
例如,残基R1代表直链C1-C6-烯-1-基,如乙烯基、丙烯-1-基或丁烯-1-基,并且残基R2是C1-C6-烷基。任选地,所述残基R1可以进一步被单环或二环状、尤其单环的、芳族或非芳族环取代。所述环基可以优选是芳族的并且可以是如下文所定义基团,可以进一步被也如下文定的1、2或3个任选取代基取代。任选地,所述残基R1也可以被末端地取代。
在另一个实施方案中,必需提及这样的化合物,其中R1代表末端被环亚烷基环取代的直链C1-C6-烯-1-基,其中所述的环亚烷基环又任选地被取代,并且残基R2是C1-C6-烷基。
作为式I化合物的非限制性例子,可以提及:2-苯基-丙二酸、2-乙烯基-丙二酸、2-丙烯-1-基-丙二酸、2-丁烯-1-基-丙二酸、2-(亚环己基甲基)丙二酸、2-环己烯-1-基-丙二酸;和对应的甲基丙二酸化合物。
优选地,该方法包括作为立体选择性一元脱羧过程的脱羧反应。
优选地获得了式II
        HC(R1)(R2)-COOH  (II)
的光学纯取代产物或其盐形式,其中残基R1和R2如上文定义。
本发明方法的非限制性例子可以由以下示意图说明:
Figure GPA00001141945100071
R3=H,CH3
R4=H,CH3CH2
Me=CH3
其中α-双取代的丙二酸III以生物催化方式被一元脱羧,以高度对映选择形成对应的一元羧酸IV。
合适方法的又一个非限制性例子指式III化合物脱羧以形成式IV化合物,其中α位置中的Me(即甲基)取代基被SH或尤其OH替代。
读者会认识到本发明不限于如本文中描述的优选脱羧反应。由于酶促反应原则上是可逆反应,故本发明也涵盖以式II化合物作为底物并以式I丙二酸作为产物的相应逆反应,即羧化反应。
在优选的实施方案中,具有AMD酶或MD酶活性并与SEQ ID NO:2的支气管炎博德特氏菌蛋白质显示100%或更少或者尤其少于99%氨基酸序列同一性的蛋白质形成底物口袋,所述的口袋具有携带式I底物分子的能力并包含处于功能性排列的以下结构元件:
a)含有半胱氨酸的催化部位(CS),所述催化部位的半胱氨酸残基能够与底物相互作用,尤其通过转移质子至底物形成烯醇化物中间体而与底物相互作用,
b)氧-阴离子孔(OAH),其包含与底物的不会切除的羧基相互作用的多个极性氨基酸侧链。
此外,所述处于口袋的底物还可以包含
c)与环状、优选芳族或杂芳族的残基R1相互作用的大结合口袋(LBP),和
d)与残基R2相互作用的小结合口袋(SBP)。
如附图进一步说明,对支气管炎博德特氏菌AMD酶(SEQ ID NO:2)的晶体结构的分析导致鉴定到参与形成该酶反应中心的各个氨基酸残基或氨基酸序列部分,从而可能建立针对具有AMD酶或MD酶活性的其他适宜酶和从中所衍生功能性突变体的模型系统或参考酶。
尤其,对于所述的具体参考酶,可鉴定某些“关键氨基酸残基”,其中预测所述的关键氨基酸残基参与形成底物口袋的功能明显不同部分。所述的功能明显不同部分命名为催化部位(CS)、氧-阴离子孔(OAH)、小结合口袋(SBP)和大结合口袋(LBP)。
第一功能部分是CS并且关键氨基酸残基是Cys188。而且,发现在一级氨基酸序列中彼此不相邻的序列部分通过有助于结合口袋的相同功能部分反而是功能相关的。因而,观察到OAH功能部分由至少两个明显不同序列部分形成,其中所述的明显不同序列部分是包含如下文所述关键氨基酸残基的所谓OAH1和OAH2。
                OAH1Thr75,Gly189
                OAH2Ser76,Tyr126
也观察到所述的参考酶形成结合口袋区域SBP和LBP,并且与它们相关的氨基酸残基可以根据相对于同该酶结合的式I底物的偏好性方向进一步细分。
LBP可以细分成以如下关键残基表征的LBP 1和LBP2:
        LBP1    Pro14,Pro15,Gly189,Gly190,Met104
        LBP2    Val13,Met73,Pro21,Ser212。
LBP1残基在底物的环基(R1)周围存在,而LBP2残基构成大结合口袋的剩余部分。
SBP可以细分成以如下关键残基表征的SBP1和SBP2:
        SBP1    Lys40,Val43,Tyr48,Leu77,Val156,Pro14,Gly74
        SBP2    Val156,Met159,Val43。
SBP1残基在底物的离去羧基周围形成小结合口袋的较大部分,而SBP2残基在该底物的较小体积残基(R2)周围构筑所述结合口袋的较小部分。
基于这种分析,可以开发一种高度特征性序列模式,借助所述序列模式可以搜索并且实际上可能由本发明人找到具有所需酶活性的其他候选蛋白质。在图3(b)的比对结果中显示此类新认识到的AMD酶或MD酶和它们氨基酸序列的相应部分的实例,其中所述的相应部分也显示所述特征性序列模式。关键氨基酸残基的特征性序列模式(即所述关键氨基酸的亚组)可以从该比对结果得到。所述的亚组尤其包含:
        Pro14、Thr75、Ser76、Tyr126、Cys188
或这些残基中3或4个残基的组合,例如:
        Thr75、Ser76、Tyr126、Cys188
        Pro14、Thr75、Ser76、Cys188。
通过使用所述序列模式搜索其他候选酶和/或突变体也将由本发明包括。熟练的读者将理解以上序列模式不受该模式的两个相邻氨基酸残基之间的确切距离限制。以上序列模式中两个相邻者之间的每个距离例如可以彼此不依赖地变化直至±10、±5、±3、±2或±1氨基酸位置,而不明显地影响所需的酶活性。
仅紧密空间接近性而言,可以将各个关键氨基酸残基分配到不止一个上文所提及的所述序列部分中(例如见位置14、43、74、75、189中的氨基酸)
与基于本发明如所获得的结晶学数据对各个氨基酸残基的上文所述功能性和空间分析相一致,可以鉴定到作为具有本发明芳基丙二酸或丙二酸脱羧酶活性潜在有用酶的特征的独特局部氨基酸序列。
根据本发明酶的又一个优选实施方案,作为优选的局部氨基酸序列,可以提及:
a)含有半胱氨酸的催化部位序列“CSS”,所述CSS由与SEQ ID NO:1的残基186至191相对应的序列区域形成,显示以下序列模式:
    “CSS” (S/L)C(G/T)(G/N) (SEQ ID NO:13)
b)分别与SEQ ID NO:1的残基73至77和124至128相对应的氧-阴离子孔形成序列“OAH1S”和“OAH2S”,所述OAH1S和OAH2S显示以下两种序列模式:
    “OAH1S” (M/G)(G/C)TS(L/G)  (SEQ ID NO:14)
    “OAH2S” T(A/P)Y(I/R)(D/Q)  (SEQ ID NO:15)
其中在OAH2S内首个和/或最末氨基酸残基可以缺失。
合适的局部序列CSS、OAH1S和OAH2S的具体例子可以从图3(b)衍生。
根据又一实施方案,所述的结构元件CSS、OAH1S和OAH2S在氨基酸链中按照以下依次(N->C)顺序排列:
            OAH1S-OAH2S-CSS
并且其中所述的结构元件借助彼此独立地包含一个或多个氨基酸残基的多个氨基酸序列连接在一起。
尤其,所述的结构元件CSS、OAH1S和OAH2S可以在氨基酸链中按照以下依次(N->C)顺序排列:
            OAHS1-sp1-OAHS2-sp2-CS
其中sp1和sp2是具有以下大致序列长度的连接氨基酸序列:
                sp143-47个氨基酸
                sp255-57个氨基酸。
作为其他优选的局部氨基酸序列,可以提及;
c)大结合口袋序列“LBPS”,所述LBPS由与SEQ ID NO:1的残基12至17相对应的序列区域形成并显示以下序列模式:
    “LBPS” IVP(P/S/A)(A/T/S/P)(A/N/G) (SEQ ID NO:16)
合适的局部序列LBPS的具体例子可以从图3(b)得到。
尤其,所述的结构元件CSS、OAH1S、OAH2S和LBPS可以在氨基酸链中按照以下依次(N->C)顺序排列:
            LBPS-sp3-OAHS1-sp1-OAHS2-sp2-CS
其中sp1、sp2和sp3是具有以下大致序列长度的连接性氨基酸序列:
                sp143-47个氨基酸
                sp255-57个氨基酸
                Sp357-62个氨基酸。
熟练的读者会认识到如本文中公开的具体脱羧酶的突变体可以工程化以改变它们底物谱(底物专一性)或改善它们针对某种底物的酶活性(与亲代酶相比时)。所述的突变(氨基酸替换、添加、缺失、插入、倒位)也可以在如本文以上定义的结构元件内部进行。具体突变体可以在一个或多个所述结构元件中包含1至10个、尤其1、2、3、4或5个同时突变。下文将给出合适突变的非限制性例子。
熟练的读者也会认识到可以在如本文中公开的脱羧酶的氨基酸序列的区域内进行额外的单突变或多突变,其中所述突变与所述结构元件不相关并且因而不影响该酶的底物口袋或催化部位,并且因此对酶活性或底物专一性是较不重要的。受本发明的技术性教导内容(例如本文中给出的序列比对结果)指引,熟练的读者将轻易鉴定容许更广泛修饰的此类区域。例如,熟练的读者将能够在此类区域内进行1至30个、2至20个或5至10个同时突变,而不面对不利影响酶活性和/或底物专一性的不可预见风险。
熟练的读者也会认识到可以在如本文中公开的脱羧酶的氨基酸序列的区域内进行额外的单突变或多突变,其中所述突变尽管不构筑底物口袋或活性位点,然而可以影响所述区域的形状并且因而可以影响酶活性和/或底物专一性。受本发明的技术性教导内容(例如本文中给出的序列比对结果)指引,熟练的读者也将轻易鉴定此类区域。例如,熟练的读者将能够在此类区域内进行1至30个、2至20个或5至10个同时突变。Leu191是作为SEQ ID NO:2的支气管炎博德特氏菌蛋白质的这种氨基酸残基的非限制性例子,其中可以改变(由任何其他氨基酸残基替换)或缺失Leu191以影响该酶的活性位点和/或结合口袋的形状。
根据本发明方法的又一实施方案,具有AMD酶或MD酶活性的蛋白质选自由以下蛋白质组成的组:
a)包含SEQ ID NO:4的氨基酸残基2至241并源自中生根瘤菌BNCI(Blast数据库条目EAN08019.1)的蛋白质;
b)包含SEQ ID NO:6的氨基酸残基2至240并源自掘越氏热球菌OT3(Blast数据库条目BAA30082.1)的蛋白质;
c)包含SEQ ID NO:8的氨基酸残基2至267并源自支气管炎博德特氏菌RB50(Blast数据库条目NP_888076.1)的蛋白质;
d)包含SEQ ID NO:10的氨基酸残基2至246并源自Aklaliphilusmetalliredigenes QYMF(Blast数据库条目ZP_00801202.1)的蛋白质,和
e)具有芳基丙二酸或丙二酸脱羧酶活性并与a)、b)、c)或d)的序列之一具有少于100%序列同一性的蛋白质。
鉴定来自产水菌属(Aquifex)和热球菌属(Pyrococcus)的具有芳基丙二酸脱羧酶活性的新蛋白质是极有前景的,因为那些生物嗜热,故预计所述酶也是热稳定的。因此,本发明也提供具有芳基丙二酸或丙二酸脱羧酶活性的新的热稳定蛋白质和相应的稳定蛋白质突变体及衍生物。
根据又一优选的实施方案,脱羧反应以分离或纯化、任选固定化的如本文中定义的脱羧酶进行或通过在式I化合物存在下培养表达所述脱羧酶活性的微生物进行。
本发明也涉及蛋白质,该蛋白质具有如本文中定义的脱羧酶活性并与包含SEQ ID NO:2的氨基酸残基1至240的支气管炎博德特氏菌蛋白质显示少于99%,例如少于98、97、96或95%,但是至少25%,例如至少30、35、40、45、50、60、70、80或90%序列同一性,例如25至98、30至97、30至95、30至90或30至80或30至70或30至70%序列同一性。
本发明也涉及具有如本文中定义的脱羧酶活性的蛋白质,其选自
a)包含SEQ ID NO:4的氨基酸残基1至241并源自中生根瘤菌BNCI的蛋白质;
b)包含SEQ ID NO:6的氨基酸残基1至240并源自掘越氏热球菌OT3的蛋白质;
c)包含SEQ ID NO:8的氨基酸残基1至267并源自支气管炎博德特氏菌RB50的蛋白质;
d)包含SEQ ID NO:10的氨基酸残基1至246并源自Aklaliphilusmetalliredigenes QYMF的蛋白质,和
e)包含SEQ ID NO:12的氨基酸残基1至256并源自嗜火产水菌的蛋白质,
以及具有如本文中定义的脱羧酶活性的其突变体,所述突变体与相应亲本蛋白质有少于100%或更少例如少于99%,例如少于98、97、96或95%,但是至少25%,例如至少30、35、40、45、50、60、70、80或90%序列同一性,例如25至98、30至97、30至95、30至90或30至80或30至70或30至70%序列同一性。
例如,具有所需脱羧酶活性的蛋白质(其选自如本文中以上所定义的源自中生根瘤菌BNCI的蛋白质和源自支气管炎博德特氏菌的蛋白质组成的组)可以用来使以上确定类型的化合物脱羧,其中残基R1代表直链或分支的单不饱和或多不饱和低级烯基,所述低级烯基任选地被如上文定义的单环或二环状任选取代的环取代,并且残基R2代表H、OH、SH、NH2、低级烷氧基、低级烷硫基、低级烷基、低级烯基、低级炔基或羟基低级烷基、尤其低级烷基。
尤其,SEQ ID NO:2、4、6、8和10的蛋白质的所述突变体仍包含部分或全部如上文定义的关键氨基酸残基和/或结构元件CSS、OAH1S、OAH2S和LBPS。
其他潜在可用突变的非限制性例子例如在WO2005/078111,图2中对SEQ ID NO:2的蛋白质公开,所述文献的公开内容因而通过引用的方式并入。通过比对所述序列与具有本发明AMD酶活性的结构上相关的新筛选的蛋白质(见例如图3(a)),熟练的读者也将能够从新获得的具有AMD酶活性的酶推导出合适的突变体。此类推导的突变体可以具有与相应的非突变的亲本酶基本上相同的酶特征,例如酶活性、底物专一性、立体专一性、稳定性、溶解度,或具有修饰的酶特征,例如修改的,如提高或消弱的酶活性、催化效率、稳定性、溶解度、立体专一性,和/或修饰的,即更宽泛或更狭窄的底物专一性。
就SEQ ID NO:2的支气管炎博德特氏菌蛋白质而言,下文列出关键氨基酸替换的非限制性例子。
  结构部分   关键氨基酸   突变
LBP1   Pro14,Pro15,Gly189,Gly190,Met104   Gly,Ala,ValGly,Ala,HisAla,Val,Del1)Ala,Val,Ser,Del1)
LBP2   Val13,Met73,Pro21,Ser212   Gly,Ala
SBP1   Leu40,Val43,Tyr48,Leu77,Val156,Pro14,Gly74   Ala,GlyAla,GlyAlaGly,Ala,ValCys
  结构部分   关键氨基酸   突变
SBP2   Val156,Met159Val43   AlaGly,Ala,Val,Ser,CysAla,Gly
OAH1   Thr75Gly189, Ala,Val,Del1)
OAH2   Ser76,Tyr126, Lys
  CS   Cys188   Ser
  影响活性位点形状的残基 Leu191 Del
1)Del=氨基酸残基的缺失
突变体的非限制性例子是在选自13、14、15、189、190和191的位置中包含至少一个突变或下述多突变的那些突变体,其中所述的多突变包含通过这些位置的任意排列所获得的突变组合,例如
13和14,
13和15,
14和15,
13、14和15,
14、15和189,
14、15和190,
14、15、189和190,
13、14、15和189,
13、14、15和190,
13、14、15、189和190
13、14和191,
13、15和191;
14、15和191,
13、14、15和191,
14、15、189和191
14、15、190和191,
14、15、189、190和191,
13、14、15、189和191,
13、14、15、190和191,
13、14、15、189、190和191等。
在这些位置开展突变允许提高酶对非芳族非环状的式(I)丙二酸(例如携带烯基取代基的那些丙二酸)的结合亲和力。氨基酸突变的具体例子在本上下文中是:
Val13Aly或Gly;
Pro14Val、Ala或Gly;
Pro15His或Gly;
Gly189Ala或Del;
Gly190Ala、Ser或Del;
Leu191Del。
突变Pro14Val和Pro15His可以提供对小的不饱和脂族底物的更好结合作用。添加Gly190Ala至这种双重突变体可能提供甚至更好的结果。在添加第四突变如Gly189Ala后,该酶可能仅能够接受不饱和脂族底物并且不再接受芳族底物。将Val13和Pro14突变成更小的氨基酸如Gly/Ala并缺失残基Gly189或190之一应当使该酶更好地接受分支底物。上述解释不应当视为限制性的。
类似地,熟练的读者将能够对结构相关的酶定义合适的突变体,即,从以下蛋白质定义:
a)包含SEQ ID NO:4的氨基酸残基2至241并源自中生根瘤菌BNCI的蛋白质;
b)包含SEQ ID NO:6的氨基酸残基2至240并源自掘越氏热球菌OT3的蛋白质;
c)包含SEQ ID NO:8的氨基酸残基2至267并源自支气管炎博德特氏菌RB50的蛋白质;和
d)包含SEQ ID NO:10的氨基酸残基2至246并源自Aklaliphilusmetalliredigenes QYMF的蛋白质。
本发明也涉及编码具有如本文中所定义脱羧酶活性的蛋白质的核酸。
本发明也涉及表达盒,其包含与至少一个调节性核酸序列有效连接的如上文定义的核酸。
本发明也涉及包含如上文定义的至少一种表达盒或核酸的重组表达载体。
本发明也涉及携带如上文定义的至少一种表达盒的重组微生物。
本发明也涉及生物反应器,其包含具有如本文中定义的脱羧酶活性的至少一种蛋白质或如上文定义的重组微生物,所述蛋白质或重组微生物任选地处于固定化形式。
本发明也涉及制备如本文中所定义的具有脱羧酶活性的酶的方法,所述方法包括培养如上文定义的重组微生物并任选地从培养物分离所述酶。
本发明也涉及具有如本文中定义的脱羧酶活性的蛋白质的晶形,尤其那些形式,其中具有芳基丙二酸脱羧酶活性的蛋白质如上文定义。
可优选的晶形从SEQ ID NO:2的支气管炎博德特氏菌蛋白质(Blast数据库条目BAA02419.1)获得,所述晶形的晶体属于具有下述晶胞的P21空间群,所述晶胞具有常数a=38.7,b=65.6,
Figure GPA00001141945100171
和β=110.8°。
本发明也涉及制备具有如本文中定义的脱羧酶活性的蛋白质的结晶形式的方法,所述方法包括添加具有8.3至8.7范围(例如8.5)的pH、优选以Tris缓冲液缓冲的结晶试剂和聚亚烷基二醇(如聚乙二醇,尤其尤其PEG 4000至8000,如PEG 6000)至(以约1至50或5至20mg/ml浓度)含有所述蛋白质的溶液。
本发明也涉及用于具有如本文中所定义脱羧酶活性的候选酶的筛选方法,所述方法包括鉴定作为具有如本文中所定义脱羧酶活性的酶的特征的序列基序(模式),并筛选已知氨基酸序列(例如氨基酸序列数据库)中与所述序列基序局部或完全匹配的序列。优选地,所述的序列基序从如SEQ IDNO:2、4、6、8、9、10或12所定义的具有脱羧酶活性的蛋白质晶形的晶体结构衍生。
本发明也涉及制备具有如本文中定义的脱羧酶活性的候选酶的方法,所述候选酶通过如上文定义的方法筛选到,该方法包括获得候选酶的编码性核苷酸序列,在重组微生物中表达所述序列并分离所述表达产物。最后,本发明也涉及如通过所述方法制备的表达产物在脱羧反应中脱羧如上文定义的式I化合物的用途。
2.具体术语的解释
“AMD酶”(EC 4.1.1.76)指具有芳基丙二酸脱氢酶活性并催化α-芳基-丙二酸如α-芳基-α-甲基丙二酸的对映选择性一元脱羧以产生光学纯芳基丙酸的酶。该酶活性不需要生物素或任何其他辅因子。此外,脱羧不涉及丙二酰硫酯酶中间体的形成。
“具有芳基丙二酸脱氢酶(AMD酶)活性的酶”催化一元脱羧作用,即如本文中定义的至少一种通式I底物、尤其在丙二酸α位置携带至少一个芳族取代基的式I底物的一个羧基由氢置换。
由于本文中公开的脱羧酶或突变体也可以显示扩展的底物专一性(与如本文中所述的未突变参考酶相比时),据此,不仅含有环基团或芳族基团的丙二酸被脱羧,非芳族的非环状丙二酸也被脱羧,或可以优选作为底物,如非环状、非芳族丙二酸。如本文中更通常所用的术语“MD酶″或“具有MD酶活性的酶”指具有扩展的底物专一性的那些脱羧酶和/或指具有改变或修饰的底物偏好性或底物专一性的那些脱羧酶。所述的MD酶催化一元脱羧作用,即如本文中定义的至少一种通式I底物、尤其另外或排他地在丙二酸α位置不携带环状或芳族取代基的式I底物的一个羧基由氢置换。MD酶活性不需要生物素或任何其他辅因子。此外,脱羧不涉及丙二酰硫酯酶中间体的形成。
“扩展的底物专一性”指与参考酶相比时转化结构上不同的额外底物的酶。
“改变/修饰的底物专一性”指与参考酶相比时转化一组局部或完全不同的底物分子的酶。因而,术语“改变的底物专一性”可以描述这样的情况,其中(例如通过突变产生的)脱羧酶比参考酶(例如未突变的酶)更好地适应于特定底物分子的脱羧。例如,更高的偏好性或专一性可以因酶变体所形成的结合口袋的更高底物亲和性引起。
“改变/修饰的酶活性”指与参考酶相比时对至少一种共同底物分子显示更快或更慢的转化动力学的酶。
除非另外说明,如本文中所用的术语“脱羧酶”或“具有脱羧酶活性的酶”一般指如本文中定义的AMD酶和/或MD酶。
鉴于酶促反应的可逆性,本发明也涉及本文中所述生物催化脱羧反应的相应逆反应(即一元羧化反应)。
术语“生物催化方法”指在如本文中定义的脱羧酶(AMD酶或MD酶)的催化活性存在下,即在分离的纯的或粗制酶或者含有或表达这种酶活性的完整微生物细胞存在下进行的任意方法。
术语“立体专一的”意指几种对映体之一由所述酶以至少90%ee、优选至少95%ee、尤其至少98%ee或至少99%ee的高对映体过量或纯度形成,所述的ee%值根据下式计算:
            ee%=[XA-XB]/[XA+XB]*100,
其中XA和XB分别指对映体A或B的摩尔分数。
如本文中定义的AMD酶、MD酶或脱羧酶的“底物口袋”或其“反应中心”在待催化的反应期间携带式I底物分子并将它转化成式II产物。所述的底物口袋由某些“结构元件”即该底物口袋的具有不同功能的部分组成。所述的结构元件彼此处于“功能性排列”中,即它们在待催化的反应期间协作。
“序列基序”或“模式”代表多个氨基酸残基的特征排列或“指纹”,其中所述的多个氨基酸残基在特定氨基酸序列中相互毗邻或以确定的方式相互分隔,即由特征性长度的中间间隔序列分隔。
就式I底物和式II产物而言,优选以下意义:
“盐形式”指铵盐或碱金属或碱土金属盐,例如Na+、K+或Ca2+盐。
“低级烷基”指具有从1至8个、优选1、2、3或4个碳原子的直链或支链基团的C1-C8-烷基。其例子是C1-C4-烷基甲基、乙基、正丙基、异丙基、正丙基、2-丁基、异丁基或叔丁基;并且额外地是具有多于4个碳原子的残基,如戊基、1-甲基丁基、2-甲基丁基、3-甲基丁基、2,2-二甲基丙基、1-乙基丙基、己基、1,1-二甲基丙基、1,2-二甲基丙基、1-甲基戊基、2-甲基戊基、3-甲基戊基、4-甲基戊基、1,1-二甲基丁基、1,2-二甲基丁基、1,3-二甲基丁基、2,2-二甲基丁基、2,3-二甲基丁基、3,3-二甲基丁基、1-乙基丁基、2-乙基丁基、1,1,2-三甲基丙基、1,2,2-三甲基丙基、1-乙基-1-甲基丙基、1-乙基-2-甲基丙基、庚基、辛基及其结构性异构体如2-乙基己基。
“低级烷氧基”优选地指上文所提及低级烷基的C1-C8-烷氧基类似物。
“低级烷硫基”优选地指上文所提及低级烷基的C1-C8-烷硫代类似物。例子是甲硫基、乙硫基、丙硫基、异丙硫基、丁硫基、仲丁硫基、异丁硫基和叔丁硫基。
“低级烯基”包含C2-C8-烯基,所述烯基是具有从2至8个、优选2至4个碳原子的单不饱和直链或支链烃基,例如乙烯基、1-或2-丙烯基、1-、2-和3-丁烯基、2-甲基丙烯-3-基、2-甲基丙烯-1-基、1-、2-、3-和4-戊烯基、1-、2-、3-、4-和5-己烯基、1-、2-、3-、4-、5-和6-庚烯基、1-、2-、3-、4-、5-、6-和7-辛烯基及它们的结构性异构体。
“低级炔基”包含以上“低级烯基”的炔基同系物。
术语“羟基低级烷基”指具有从1至8个、尤其从1至4个碳原子的直链或支链烷基的C1-C8-羟烷基,其中至少一个氢原子(例如1或2氢原子)被羟基替换。其例子是羟甲基、2-羟基-1-乙基、2-和3-羟基-1-丙基、2-、3-和4-羟基-1-丁基、2-、3-、4-和5-羟基-1-戊基、2-、3-、4-、5-和6-羟基-1-己基、2-、3-、4-、5-、6-和7-羟基-1-庚基、2-、3-、4-、5-、6-、7-和8-羟基-1-辛基、2,3-二羟基-1-丙基及其结构性异构体。
术语“亚环烷基”代表包含4至7个环碳原子的环结构,其通过双键与分子的剩余结构连接。作为例子可以提及亚环戊基、亚环己基和亚环庚基。
作为“单环或二环”残基的例子,可以提及碳环或杂环的,任选稠合的,非芳族的或优选芳族或杂芳族的环,所述环具有3至12个环碳原子和任选1至4杂原子如N、S和O。作为例子可以提及环丙基、环丁基、环戊基、环己基,环庚基及其单不饱和或多不饱和类似物,例如环丁烯基、环戊烯基、环己烯基、环庚烯基、环己二烯基、环庚二烯基以及萘基和苯基;以及具有选自O、N和S的1至4个杂原子的5-至7-元饱和或者单不饱和或多不饱和杂环基,并且其中该杂环可以进一步与另一个杂环或碳环稠合。杂环残基的例子是从吡咯烷、四氢呋喃、哌啶、吗啉、吡咯、呋喃、噻吩、吡唑、咪唑、噁唑、噻唑、吡啶、吡喃、嘧啶、哒嗪、吡嗪、苯并呋喃、吲哚和喹啉衍生的那些残基。“单环”也包含上文所提及的亚环烷基结构。
作为“任选的取代基”,可以提及NH2、OH、SH、卤素如F、Cl、Br、I;如上文定义的低级烷氧基、低级烷硫基、低级烷基、低级烯基、低级炔基或羟基-低级烷基。“任选的取代基”也包含上文所提及的亚环烷基残基,所述任选取代基可以认为由这样的两个取代基形成。
3.本发明的其他实施方案
3.1 本发明的蛋白质
本发明不限于具体公开的“具有AMD酶活性的蛋白质”或“具有MD酶活性的蛋白质”,反而还扩展至其功能性等同物。
在本发明的范围内,具体公开的酶的“功能性等同物”或类似物是其还具有所需生物学功能或活性(例如酶活性)的各种多肽。
例如,“功能性等同物”意指在用于酶活性的试验中比如本文中定义的酶显示至少1至10%,或至少20%,或至少50%,或至少75%,或至少90%更高或更低活性的酶。
根据本发明,“功能性等同物”尤其也意指突变体,其在以上所述氨基酸序列的至少一个序列位置中具有相异于具体所描述氨基酸的氨基酸,不过仍拥有前述生物学活性之一。“功能性等同物”因而包含通过一个或多个氨基酸添加、替换、插入、缺失和/或倒位所获得的突变体,其中所述改变可以在任意序列位置中出现,只要它们导致具有本发明特性谱(profile ofproperties)的突变体。如果反应性模式在突变体与未改变的多肽之间定性地重合,即如果以不同速率转化例如相同的底物,则尤其也提供了功能等同性。在下表中显示适宜氨基酸替换的例子。
原始残基        替换的例子
Ala             Ser
Arg             Lys
Asn             Gln;His
Asp             Glu
Cys             Ser
Gln             Asn
Glu             Asp
Gly             Pro
His             Asn;Gln
Ile             Leu;Val
Leu             Ile;Val
Lys             Arg;Gln;Glu
Met             Leu;Ile
Phe             Met;Leu;Tyr
Ser             Thr
Thr             Ser
Trp             Tyr
Tyr             Trp;Phe
Val             Ile;Leu
“功能性等同物”在以上意义中也是所述多肽的“前体”,以及所述多肽的“功能性衍生物”和“盐”。
“前体”在这种情况下是所述多肽的具有或没有所需生物学活性的天然或合成性前体。
表述“盐”意指本发明蛋白质分子羧基的盐以及氨基的酸加成盐。羧基的盐可以按照已知方式产生并包含无机盐,例如钠、钙、铵、铁和锌盐,和与有机碱(例如,胺如三乙醇胺、精氨酸、赖氨酸、哌啶等)的盐。
本发明也涵盖酸加成盐,例如与无机酸(如氢氯酸或硫酸)的盐和与有机酸(如乙酸、草酸)的盐。
本发明多肽的“功能性衍生物”也可以在功能性氨基酸侧基团上或其氨基或羧基末端处使用已知技术产生。此类衍生物包含例如羧酸基脂族酯、通过与氨或伯胺或仲胺反应可获得的羧酸基的酰胺;通过与酰基反应所产生的游离氨基的N-酰基衍生物;或通过与酰基反应所产生的游离羟基的O-酰基衍生物。
“功能性等同物”自然也包含可以从其他生物获得的多肽以及天然存在的变体。例如,可以通过序列比较建立同源序列区域的区域,并且可以基于本发明的具体参数确定等同酶。
“功能性等同物”也包含本发明多肽的片段,优选独立结构域或序列基序,它们例如显示所需的生物学功能。
“功能性等同物”还是这样的融合蛋白,所述融合蛋白具有以上所述多肽序列之一或从其中衍生的功能性等同物和处于功能性氨基端或羧基端结合(即融合蛋白诸部分没有相互明显地功能性损坏)的至少一种其他的功能上不同的异源序列。这些异源序列的非限制性例子例如是信号肽、组氨酸锚状物或酶。
根据本发明也包括的“功能性等同物”是具体公开的蛋白质的同源物。这些同源物拥有以上所述的同一性百分数值。所述的值指与具体公开的氨基酸序列的同一性,并可以根据Pearson和Lipman,Proc.Natl.Acad,Sci.(USA)85(8),1988,2444-2448的算法计算出来。
也可以从BLAST比对、算法blastp(蛋白质-蛋白质BLAST)或通过如下文给出的Clustal设置计算出同一性百分数值。
本发明同源多肽的同一性百分数尤其意指氨基酸残基相对于本文中具体所述氨基酸序列之一的总长度的同一性百分数。
在蛋白质可能糖基化的情况下,本发明的“功能性等同物”包含处于去糖基化和糖基化形式以及可以通过改变糖基化模式获得的修饰形式的上文所述类型蛋白质。
本发明蛋白质或多肽的此类功能性等同物或同源物可以通过诱变例如点突变、加长或缩短所述蛋白质来产生。
本发明蛋白质的此类功能性等同物或同源物可以通过筛选突变体(例如缩短突变体)组合数据库鉴定。例如,可以通过在核酸水平组合诱变(例如通过酶促连接合成性寡核苷酸的混合物)产生蛋白质变体的多样化数据库。存在可以用于从简并寡核苷酸序列产生潜在同源物数据库的许多方法。可以在自动DNA合成仪上实施简并基因序列的化学合成,并且合成性基因可以随后连接至合适的表达载体。简并基因的使用使得在一种混合物中产生编码所需蛋白质序列集合的全部序列成为可能。合成简并寡核苷酸的方法是本领域技术人员已知的(例如Narang,S.A.(1983)Tetrahedron39:3;Itakura等人(1984)Annu.Rev.Biochem.53:323;Itakura等人,(1984)Science 198:1056;Ike等人(1983)Nucleic Acids Res.11:477)。
在现有技术中,已知几项技术,它们用于筛选通过点突变或缩短法产生的组合数据库的基因产物和用于筛选cDNA文库中具有所选特性的基因产物。这些技术可以适应于快速筛选通过组合诱变本发明同源物所产生的基因库。最常用于筛选庞大基因库的基于高通量分析的技术包括在可以复制的表达载体中克隆基因库、用所得载体数据库转化合适的细胞并在这样的条件下表达组合基因,在所述条件下检测所需的活性有助于编码检测到其产物的基因的载体分离。递归总体诱变(REM),一项提高数据库中功能性突变体频率的技术,可以与筛选试验组合使用,旨在鉴定同源物(Arkin和Yourvan(1992)PNAS 89:7811-7815;Delgrave等人(1993)ProteinEngineering 6(3):327-331)。
3.2 编码核酸序列
本发明也涉及编码如本文中所定义酶的核酸序列。
本发明也涉及与本文中具体公开的序列具有某种“同一性”程度的核酸。两种核酸之间的“同一性”意指在每种情况下所述核酸全长范围内核苷酸的同一性。
例如可以借助Informax(USA)公司Vector NTI套装7.1程序,使用Clustal方法用以下设置(Higgins DG,Sharp PM.在微型计算机上的快速和灵敏的多重序列比对(Fast and sensitive multiple sequence alignments ona microcomputer).Comput Appl.Biosci.1989年4月;5(2):151-1)计算同一性:
  多重比对参数:
  空位开口罚分   10
  空位延伸罚分   10
  空位分离罚分范围   8
  空位分离罚分   关闭
  多重比对参数:
  比对延迟的同一性%   40
  残基特异性空位   关闭
  亲水性残基空位   关闭
  过渡权重   0
  配对比对参数:
  FAST算法   开启
  K-tuple大小   1
  空位罚分   3
  窗口大小   5
  最佳对角线数目   5
备选地,同一性可以根据Chenna,Ramu,Sugawara,Hideaki,Koike.Tadashi,Lopez,Rodrigo,Gibson,Toby J,Higgins,Desmond G,Thompson,Julie D.采用Clustal系列程序的多重序列比对(Multiplesequence alignment with the Clustal series of programs).(2003)NucleicAcids Res 31(13):3497-500,网页:http://www.ebi.ac.uk/Tools/clustalw/index.html#和以下设置确定:
  DNA空位开口罚分   15.0
  DNA空位延伸罚分   6.66
  DNA矩阵   同一性
  蛋白质空位开口罚分   10.0
  蛋白质空位延伸罚分   0.2
  蛋白质矩阵   Gonnet
  蛋白质/DNA ENDGAP   -1
  DNA空位开口罚分   15.0
  蛋白质/DNA GAPDIST   4
本文中提及的全部核酸序列(单链和双链DNA和RNA序列,例如cDNA和mRNA)可以按照已知方式通过化学合成从核苷酸结构单元产生,例如通过各个重叠的互补性双螺旋核酸结构单元的片段缩合法产生。寡核苷酸的化学合成可以例如以已知方式通过亚磷酰胺(phosphoamidite)方法(Voet,Voet,第2版,Wiley Press,New York,第896-897页)进行。合成性寡核苷酸的积聚和借助DNA聚合酶Klenow片段填补缺口和连接反应以及一般克隆技术在Sambrook等人(1989)中描述,见下文。
本发明也涉及编码以上多肽及其功能性等同物之一的核酸序列(单链和双链DNA和RNA序列,例如cDNA和mRNA),所述核酸序列可以例如使用人工核苷酸类似物获得。
本发明既涉及编码本发明多肽或蛋白质或其生物学活性区段的分离的核酸分子,并还涉及可以用作例如鉴定或扩增本发明编码性核酸的杂交探针或引物的核酸片段。
本发明的核酸分子可以额外含有来自编码遗传区3′和/或5′末端的非翻译序列。
本发明还涉及与具体所述核苷酸序列或其区段互补的核酸分子。
本发明的核苷酸序列使得产生可以用于鉴定和/或克隆其他细胞类型和生物中同源序列的探针和引物成为可能。此类探针或引物一般包含在“严格”条件(见下文)与本发明核酸序列的有义链或相应反义链的至少约12个、优选至少约25个,例如约40、50或75个连续核苷酸杂交的核苷酸序列区域。
“分离”的核酸分子与该核酸天然来源中存在的其他核酸分子分隔,并且通过重组技术产生时,还可以基本上不含其他细胞物质或培养基,或化学合成时,可以不含化学前体或其他化学品。
本发明的核酸分子可以借助分子生物学标准技术和根据本文提供的序列信息分离。例如,可以使用具体公开的完整序列之一或其区段作为杂交探针和(如在例如Sambrook,J.,Fritsch,E.F.和Maniatis,T.MolecularCloning:A Laboratory Manual.2nd edition,Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中描述的)标准杂交技术从合适的cDNA文库分离cDNA。此外,包含所公开序列之一或其区段的核酸分子可以使用基于这种序列构建的寡核苷酸引物,通过聚合酶链反应分离。以这种方式扩增的核酸可以克隆在合适的载体中并可以通过DNA测序加以表征。本发明寡核苷酸也可以通过标准合成方法产生,例如使用自动DNA合成仪产生。
本发明的核酸序列或其衍生物、这些序列的同源物或部分可以例如通过寻常杂交技术或PCR技术从其他细菌分离,例如借助基因组文库或cDNA文库。这些DNA序列在标准条件下与本发明的序列杂交。
“杂交”意指多核苷酸或寡核苷酸在标准条件下与近乎互补序列结合的能力,而在这些条件下非互补配偶体之间不发生非特异性结合作用。为此,所述序列可以是90-100%互补的。例如在RNA印迹或DNA印迹中或在PCR或RT-PCR的引物结合过程中利用了能够相互特异性结合的互补序列的特性。
将保守区域的短寡核苷酸有利地用于杂交。然而,也可能使用本发明核酸的较长片段或完整序列用于杂交。这些标准条件根据所用核酸(寡核苷酸、较长片段或完整序列)或根据何种类型的核酸-DNA或RNA用于杂交而变化。例如,DNA:DNA杂合体的解链温度比相同长度的DNA:RNA杂合体的解链温度低约10℃。
例如,取决于具体核酸,标准条件意指在浓度0.1至5×SSC(1×SSC=0.15M NaCl,15mM柠檬酸钠,pH 7.2)或额外存在50%甲酰胺下的水性缓冲液中42和58℃之间的温度,例如42℃在5×SSC,50%甲酰胺中。有利地,DNA:DNA杂合体的杂交条件是0.1×SSC和在约20℃至45℃之间、优选在约30℃至45℃之间的温度。对于DNA:RNA杂合体,杂交条件有利地是0.1×SSC和在约30℃至55℃之间、优选在约45℃至55℃之间的温度。所述这些杂交温度是在甲酰胺不存在下为大约100个核苷酸长度及50%G+C含量的核酸计算解链温度值的例子。DNA杂交的实验条件在相关遗传学教材(例如Sambrook等人,1989)中描述,并且可以例如根据核酸的长度、杂合体的类型或G+C含量,使用本领域技术人员已知的公式计算。本领域技术人员可以从以下教材获得关于杂交的进一步信息:Ausubel等人(编著),1985,Current Protocols in Molecular Biology,John Wiley & Sons,New York;Hames和Higgins(编著),1985,NucleicAcids Hybridization:A Practical Approach,IRL Press at OxfordUniversity Press,Oxford;Brown(编著),1991,Essential Molecular Biology:A Practical Approach,IRL Press at Oxford University Press,Oxford。
“杂交”尤其可以在严格性条件下实施。此类杂交条件例如在Sambrook,J.,Fritsch,E.F.,Maniatis,T.,于:Molecular Cloning(ALaboratory Manual),2nd edition,Cold Spring Harbor Laboratory Press,1989,第9.31-9.57页中或在Current Protocols in Molecular Biology,JohnWiley & Sons,N.Y.(1989),6.3.1-6.3.6.中描述。
“严格”杂交条件尤其意指:在42℃于以下溶液中孵育过夜,随后用0.1×SSC在65℃洗涤滤膜,其中所述溶液由50%甲酰胺,5×SSC(750mM NaCl,75mM柠檬酸三钠),50mM磷酸钠(pH 7.6),5×Denhardt溶液,10%硫酸葡聚糖和20g/ml变性剪切鲑精DNA组成。
本发明还涉及具体公开或可衍生的核酸序列的衍生物。
因而,本发明的其他核酸序列可以从本文中具体公开的序列衍生并且可以因添加、替换、插入或缺失单个或几个核苷酸而与所公开的序列不同,并且也编码具有所需特性谱的多肽。
本发明也包括这样的核酸序列,其包含所谓沉默突变或根据特殊来源或宿主生物的密码子选择,与具体所述序列相比已经被改变,以及其天然存在变体例如剪接变体或等位变体。
本发明也涉及可以通过保守性核苷酸替换(即所讨论的氨基酸被具有相同电荷、大小、极性和/或溶解度的氨基酸置换)获得的序列。
本发明还涉及因序列多态性从具体公开的核酸衍生的分子。这些遗传多态性可以因自然变异存在于群体内部的个体之间。这些天然变异通常在基因的核苷酸序列中产生1-5%差异。
本发明核酸序列的衍生物意指例如在衍生的氨基酸水平上具有至少60%同源性、优选至少80%同源性、极特别优选在整个序列范围内至少90%同源性(就氨基酸水平上的同源性而言,应当参考上文对所述多肽给出的细节)的等位变体。有利地,同源性可以在序列的部分区域内较高。
另外,衍生物也应当理解为是本发明核酸序列的同源物,例如动物、植物、真菌或细菌同源物、编码性和非编码性DNA序列的缩短序列、单链DNA或RNA。例如,同源物在DNA水平在本文具体公开的序列中所给出的整个DNA区域内具有至少40%、优选地至少60%、特别优选至少70%、极特别优选至少80%的同源性。
另外,衍生物应理解为是例如具有启动子的融合物。添加至所述核苷酸序列的启动子可以因至少一个核苷酸交换、至少一个插入、倒位和/或缺失被修饰,尽管不破坏该启动子的功能性或效力。另外,所述启动子的效力可以因改变其序列而提高或这些启动子可以与更有效的启动子、甚至不同属的生物的启动子完全交换。
3.3 本发明的构建体
本发明也涉及表达构建体,其含有处于调节性核酸序列的遗传控制下的编码本发明多肽或融合蛋白的核酸序列;以及包含这些表达构建体至少之一的载体。
根据本发明,“表达单元”意指具有表达活性的核酸,该核酸包含如本文中定义的启动子并且与待表达的核酸或基因功能性连接后,调节这种核酸或这种基因的表达即转录和翻译。因而在这种环境下,它也叫做“调节性核酸序列”。除启动子之外,可以存在其他调节元件,例如增强子。
根据本发明,“表达盒”或“表达构建体”意指与待表达的核酸或待表达的基因功能性连接的表达单元。与表达单元相反,表达盒因而不仅包含调节转录和翻译的核酸序列,还包含应当由于转录和翻译而表达为蛋白质的核酸序列。
术语“表达”或“过量表达”在本发明的环境下描述微生物中由相应DNA编码的一种或多种酶的胞内活性的产生或提高。为此,例如可以在生物中插入基因、由另一种基因置换现存基因、增加基因或诸基因的拷贝数、使用强启动子或使用编码具有高活性的相应酶的基因,并且任选地可以组合这些措施。
优选地,本发明的此类构建体包含在各自编码序列上游的启动子和3′-下游的终止子序列,并且任选地还包含常规调节元件,在每种情况下它们与编码序列功能性连接。
根据本发明,“启动子”、“具有启动子活性的核酸”或“启动子序列”意指与待转录核酸功能性连接的调节这种核酸转录的核酸。
在这种情况下,“功能性”或“有效连接”意指例如具有启动子活性的核酸之一和待转录的核酸序列和任选地其他调节元件(例如能够使核酸转录的核酸序列及例如终止子)以如此方式依次连接,使得所述每种调节元件可以在该核酸序列的转录中履行其功能。这实际上不必需要化学意义上的直接连接。遗传调控序列例如增强子序列也能够从更远位置或甚至从其它DNA分子上对靶序列发挥它们的功能。优选这样的排列,其中待转录的核酸序列位于启动子序列之后(即在3′端),从而这两个序列彼此共价地结合。启动子序列与待转基因方式表达的核酸序列之间的距离可以小于200bp(碱基对)或小于100bp或小于50bp。
除了启动子和终止子之外,可以提及的其他调节元件的例子是靶向序列、增强子、多腺苷酸化信号、选择标记、扩增信号、复制起点等。合适的调节序列例如在Goeddel,Gene Expression Technology:Methods inEnzymology 185,Academic Press,San Diego,CA(1990)中描述。
本发明的核酸构建体尤其包含从本文中具体提及的那些序列或其衍生物和同源物选出的序列,以及可以从本文中具体提及的氨基酸序列衍生的核酸序列,其中所述的核酸序列有利地与控制(例如增加)基因表达的一种或多种调节信号有效或功能性连接。
除这些调控序列之外,对这些序列的天然调节作用仍可以在实际结构基因之前存在,并且任选地可以被遗传地改变,从而关闭了天然调节作用并且所述基因的表达已经增加。核酸构建体也可以具有更简单的设计,即,在编码序列之前不插入任何额外的调节信号并且不移除天然启动子连同其调节作用。相反,使天然调节序列沉默,从而调节作用不再发生并且基因表达增加。
优选的核酸构建体有利地也含有与启动子功能性连接的一个或多个前述增强子序列,其中所述的增强子序列允许核酸序列表达提高。也可以在DNA序列的3′端插入额外的有利序列,如其他调节元件或终止子。可以在该构建体中含有一个或多个拷贝的本发明核酸。该构建体也可以含有其他标记,如抗生素抗性或辅源营养弥补基因(auxotrophy-complementinggene),任选地用于对构建体选择。
在启动子如cos-、tac-、trp-、tet-、trp-tet-、Ipp-、lac-、Ipp-lac-、laclq-、T7-、T5-、T3-、gal-、trc-、ara-、rhaP(rhaPBAD)SP6-、λ-PR-中或在有利地用于革兰氏阴性细菌内的λ-PL启动子中含有合适的调节序列的例子。例如在革兰氏阳性启动子ace、amy和SPO2,在酵母或真菌启动子ADC1、MFα、AC、P-60、CYC1、GAPDH、TEF、rp28、ADH中含有其他有利的调节序列。人工启动子也可以用于调节作用。
为表达,将核酸构建体插入宿主生物中,有利地在载体(例如质粒或噬菌体)中,其在该宿主内允许基因的最佳表达。除质粒和噬菌体外,载体也理解为意指本领域技术人员已知的全部其他载体,例如,病毒如SV40、CMV、杆状病毒和腺病毒、转座子、IS元件、噬菌粒、粘粒和线性或环状DNA。这些载体可以在宿主生物中自主复制或可以随染色体复制。这些载体代表本发明的又一实施方案。
合适的质粒例如是大肠杆菌中的pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pKK223-3、pDHE19.2、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III113-B1、λgt11或pBdCI;诺卡氏菌型放线菌(Nocardioform actinomycetes)中的pJAM2;链霉菌属(Streptomyce)中的pIJ101、pIJ364、pIJ702或pIJ361;芽孢杆菌中的pUB110、pC194或pBD214;棒杆菌属(Corynebacterium)中的pSA77或pAJ667;真菌中的pALS1、pIL2或pBB116;酵母中的2αM、pAG-1、YEp6、YEp13或pEMBLYe23或植物中的pLGV23、pGHlac+、pBIN19、pAK2004或pDH51。前述质粒代表可能质粒的小部分选择。其它质粒是本领域技术人员熟知的并且将在例如书籍Cloning Vectors(编者PouwelsP.H.等人,Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0 444904018)中找到。
在载体的其他实施方案中,含有本发明核酸构建体或本发明核酸的载体可以有利地以线性DNA形式插入微生物并通过异源或同源重组整合入宿主生物的基因组。这种线性DNA可以包含线性化载体如质粒或仅包含本发明的核酸构建体或核酸。
为在生物中最佳表达异源基因,有利的是根据生物中所用的特定密码子选择改变核酸序列。该密码子选择可以基于计算机评价所讨论生物的其他已知基因轻易地确定。
本发明表达盒的产生基于合适启动子与合适的编码性核苷酸序列及终止子信号或多腺苷酸化信号的融合。为此使用如在例如T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular Cloning:A Laboratory Manual,ColdSpring Harbor Laboratory,Cold Spring Harbor,NY(1989)以及在T.J.Silhavy,M.L.Berman和L.W.Enquist,Experiments with Gene Fusions,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1984)并且在Ausubel,F.M.等人,Current Protocols in Molecular Biology,GreenePublishing Assoc.和Wiley Interscience(1987)中描述的常见重组和克隆技术。
将重组核酸构建体或基因构建体有利地插入用于合适的宿主生物内表达的宿主特异性载体中,以允许所述基因在宿主中最佳表达。载体是本领域技术人员熟知的并且将在例如“Cloning Vectors”(Pouwels P.H.等人,Elsevier,Amsterdam-New York-Oxford,1985)中找到。
3.4 可以根据本发明使用的宿主
根据上下文,术语“微生物”意指起始微生物(野生型)或本发明的基因修饰微生物或这两者。
根据本发明,术语“野生型”意指相应的起始微生物并且不需要实质地对应于天然存在的生物。
借助本发明的载体,可以产生重组微生物,所述重组微生物已经用例如至少一种本发明载体转化并可以用于产生本发明的多肽。有利地,将以上所述的本发明重组构建体插入合适的宿主系统并表达。优选地,使用本领域技术人员熟悉的常见克隆与转染方法,例如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等,旨在确保所述核酸在相应表达系统中表达。合适的系统例如在Current Protocols in Molecular Biology,F.Ausubel等人,Publ.Wiley Interscience,New York 1997,或Sambrook等人MolecularCloning:A Laboratory Manual.第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中描述。
原则上,可以考虑全部原核生物作为本发明核酸或核酸构建体的重组宿主生物。有利地使用细菌作为宿主生物。优选地,它们选自具有产生PHA-、TAG-或WE-型包含体能力的天然或重组细菌,尤其如产生TAG的诺卡氏菌型放线菌,尤其红球菌属(Rhodococcus)、分枝杆菌属(Mycobacterium)、诺卡氏菌属(Nocardia)、戈登氏菌属(Gordonia)、斯科曼氏菌属(Skermania)和束村氏菌属(Tsukamurella);以及产生TAG的链霉菌;产生WE的不动杆菌属(Acinetobacter)和食碱菌属(Alcanivorax);以及埃希氏菌属(Escherichia),尤其大肠杆菌、棒杆菌属,尤其谷氨酸棒杆菌(C.glutamicum)和芽孢杆菌属(Bacillus),尤其枯草芽孢杆菌(B.subtili)的重组菌株。
本发明的宿主生物随后优选地含有本文发明中所述的编码根据上文定义的酶活性的核酸序列、核酸构建体或载体至少之一。
取决于宿主生物,以本领域技术人员熟悉的方式培育或繁殖本发明方法中所用的生物。原则上,微生物在液体培养基中在0℃与和100℃之间、优选在10℃与60℃之间的温度在通氧气的情况下培育,其中所述液体培养基含有通常为糖形式的碳源、通常为有机氮源(如酵母提取物)形式的氮源或盐如硫酸铵、微量元素如铁、锰和镁盐并且任选地含有维生素。液体营养培养基的pH可以维持在固定值上,即在培育期间调节或不调节。可以分批、半分批或连续地实施培育。养分可以在发酵伊始供应或可以随后半连续或连续地供应。
3.5 重组产生具有脱羧酶活性的蛋白质
本发明也涉及通过培育表达本发明蛋白质的微生物并从培养物分离所需产物来产生所述蛋白质的方法。
如根据本发明使用的微生物可以连续地或在分批工艺或在补料分批或重复补料分批工艺中间歇地培育。将在Chmiel(Bioprocesstechnik 1.Einführung in die Bioverfahrenstechnik(Gustav Fischer Verlag,Stuttgart,1991))的教材中或Storhas(Bioreaktoren und periphere Einrichtungen(Vieweg Verlag,Braunschweig/Wiesbaden,1994))的教材中找到对已知培育方法的综述。
待使用的培养基必须以适宜方式满足具体菌株的要求。对用于多种微生物的培养基的描述在手册“美国细菌学会普通细菌学方法手册(Manualof Methods for General Bacteriology)”(Washington D.C,USA,1981)中给出。
可以根据本发明使用的这些培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。
优选的碳源是糖,如单糖、二糖或多糖。极好的碳源例如是葡萄糖、果糖、甘露糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽糖、蔗糖、棉子糖、淀粉或纤维素。糖也可以通过复杂化合物如糖蜜或来自糖精炼的其他副产品添加至培养基。添加多种碳源的混合物也可以是有利的。其他可能碳源是油和脂肪,如大豆油、葵花籽油、花生油或椰子油,脂肪酸如棕榈酸、硬脂酸或亚油酸、醇如甘油、甲醇或乙醇和有机酸如乙酸或乳酸。
氮源通常是有机或无机氮化合物或含有这些化合物的物质。氮源的例子包括氨气或铵盐,如硫酸铵、氯化铵、磷酸铵、碳酸铵或硝酸铵、硝酸盐、脲、氨基酸或复杂氮源,如玉米浆、大豆粉、大豆蛋白、酵母提取物、肉浸汁和其他等。氮源可以分别使用或作为混合物使用。
可以在培养基中存在的无机盐化合物包含钙、镁、钠、钴、钼、钾、锰、锌、铜和铁的氯化物、磷酸盐或硫酸盐。
含硫无机化合物例如硫酸盐、亚硫酸盐、连二亚硫酸盐、连四硫酸盐、硫代硫酸盐、硫化物以及有机硫化合物如硫醇和硫羟可以用作硫源。
磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐可以用作磷源。
可以添加螯合剂至培养基,目的在于维持溶液中的金属离子。特别合适的螯合剂包含二羟基酚,如儿茶酚或原儿茶酸或有机酸如柠檬酸。
根据本发明使用的发酵培养基也可以含有其他生长因子,如维生素或生长促进剂,它们包括例如生物素、核黄素、硫胺素、叶酸、烟酸、泛酸和吡哆醇。生长因子和盐经常来自培养基的复杂组分,如酵母提取物、糖蜜、玉米浆等。此外,可以添加合适的前体至培养基。培养基中化合物的精确组成强烈取决于具体实验并且必须对每种具体情况逐一决定。关于培养基优化的信息可以在教材“Applied Microbiol.Physiology,A PracticalApproach”(Publ.P.M.Rhodes,P.F.Stanbury,IRL Press(1997)第53-73页,ISBN 0 19 9635773)中找到。也可以从供应商处获得生长培养基,如标准1(Merck)或BHI(心脑浸液,DIFCO)等。
通过加热(在1.5巴和121℃,20分钟)或通过无菌过滤,将培养基的全部组分消毒。所述组分可以一起消毒或根据需要分别消毒。培养基的全部组分可以在培养伊始存在或任选地可以连续地或通过补料分批添加。
培养物的温度通常在15℃和45℃,优选25℃至40℃之间并且在实验期间可以维持恒定或可以变化。培养基的pH值应当在5至8.5的范围内,优选地在7.0附近。可以在培育期间通过添加碱性化合物如氢氧化钠、氢氧化钾、氨或氨水或酸性化合物如磷酸或硫酸控制生长的pH值。消泡剂例如脂肪酸聚二醇酯可以用于控制起泡。为维持质粒的稳定性,可以将具有选择作用的合适物质例如抗生素添加至培养基。将氧或含氧气体混合物例如空气送入培养物旨在维持有氧条件。培养物的温度通常从20℃和45℃。持续培养直至最大量的所需产物已经形成。这通常在10小时至160小时内实现。
细胞可以任选地通过高频超声波、通过高压例如在弗氏细胞压碎器中、通过渗透作用、通过去垢剂、裂解酶或有机溶剂的作用、借助匀浆机或通过所列几种方法的组合加以破坏。
以下实施例仅起到说明本发明的作用。对本领域技术人员显而易见的众多可能变化也属于本发明的范围。
实验部分
1.一般信息
a)仪器与材料
全部化学品(除非不指出时)从Sigmα-Aldrich购买。XhoI和NdeI限制酶从Roche购买并且T4连接酶从New England Biolabs购买。在Bruker200或400MHz质谱仪上进行1H NMR分析。在配备以正离子模式运行的电喷雾电离源的Bruker Esquire 3000+离子阱MS上实施ESI-MS分析。用于ESI-MS分析的蛋白质样品通过在ddH2O中透析4小时脱盐。
b)序列相似性搜索和新AMD酶的鉴定
为了找到新的丙二酸脱羧酶,使用基本局部比对搜索工具(BLAST)比对来自支气管炎博德特氏菌的AMD酶的蛋白质序列与来自公共数据库的已知蛋白质的序列。在搜索期间,使用以下参数:数据库-非冗余蛋白质序列,算法-blastp(蛋白质-蛋白质BLAST)。
从针对来自支气管炎博德特氏菌的AMD酶的最相似蛋白的命中名单中选择以下细菌酶:
来自中生根瘤菌BNC1的蛋白质EAN08019.1,
来自掘越氏热球菌OT3的蛋白质BAA30082.1,
来自支气管炎博德特氏菌RB50的蛋白质NP_888076.1,和
来自Alkaliphilus metalliredigenes QYMF的蛋白质ZP_00801202.1。
c)AMD酶和其他酶的亚克隆
将编码以下酶:
来自支气管炎博德特氏菌的AMD酶,
来自中生根瘤菌BNC1的蛋白质EAN08019.1,
来自掘越氏热球菌OT3的蛋白质BAA30082.1,
来自支气管炎博德特氏菌RB50的蛋白质NP_888076.1,和
来自Alkaliphilus metalliredigenes QYMF的蛋白质ZP_00801202.1和
来自嗜火产水菌的谷氨酸消旋酶(AAF25672)
的基因为大肠杆菌中的表达进行优化、合成并克隆到含有氨苄青霉素抗性基因的pGA4载体(GENEART AG.,德国)中。利用XhoI和NdeI限制性位点,随后将所述基因亚克隆入含有卡那霉素抗性基因的pET30b载体(Novagen,目录号69910-3,EMD Chemicals,Inc.,圣迭哥,美国)。将连接产物转化入BL21(DE3)电感受态大肠杆菌细胞,将后者涂布在Kan50-LB-琼脂平板上。随后从所述细胞分离质粒并通过测序证实成功的亚克隆。该亚克隆过程允许轻易表达并纯化大肠杆菌中的靶蛋白(蛋白质加上6xHis标签)。在亚克隆入pET30b载体后,全部酶的序列在羧基末端由以下氨基酸延伸:Leu-Glu-His-His-His-His-His-His。
根据SEQ ID NO:1、3、5、7、9和11的核苷酸序列代表那些编码加His标签的酶的优化序列。
d)His6-融合蛋白的表达和纯化
将编码AMD酶的含有T7RNA聚合酶启动子和卡那霉素抗性基因的质粒转化入电感受态大肠杆菌菌株BL21(DE3)。细菌起初在37℃温度的生长培养基(1%胰蛋白胨,0.5%酵母提取物,1%氯化钠,0.4%葡萄糖,0.20xM9缓冲液(对于1升:KH2PO4 3g,Na2HPO4 6g,NaCl 5g,MgSO4(1M)1ml,dH2O直至1升),50mg/mL卡那霉素)中孵育大约4小时以达到OD600=1。添加异丙基-6-D-硫代吡喃半乳糖苷(终浓度1mM)诱导蛋白质表达。在30℃过夜孵育后,使细胞沉淀(4500转/分钟,15分钟,4℃)并在添加50mM TRIS缓冲液(pH 8)中的鸡卵清溶菌酶(0.1mg/1mL缓冲液)后于室温裂解,所述的TRIS缓冲液含有25mM NaCl,2mM EDTA,0.2mM DTT和蛋白酶抑制剂-苯基甲磺酰氟(10μg/mL)。裂解后,通过添加2%硫酸链霉素,随后通过离心(4500转/分钟,20分钟,4℃)沉淀核酸。含有粗制AMD酶的上清液对含有25mM NaCl的25mM TRIS缓冲液(pH8)过夜透析(Spectra/Por 2,截留分子量:12-14 000),产生通过FPLC在GE Healthcare Bio-Science HiTrap螯合5mL柱上容易纯化的His6融合蛋白。通过利用磷酸钠缓冲液(0.02M,pH 7.4)、NaCl(0.5M)和咪唑(25、60和250mM)的梯度实现蛋白质的洗脱。以250mM浓度的咪唑洗脱靶蛋白。该过程产生每250mL培养物多达15mg蛋白质并且一般是95%的SDS-PAGE纯度。通过使用Bradford测定法或在OD280分光光度计读数而计算蛋白质终浓度。
e)来自支气管炎博德特氏菌的AMD酶的位点定向诱变
使用Pfu Turbo聚合酶(Stratagene),按照Stratagene QuikChange
Figure GPA00001141945100381
位点定向诱变试剂盒的制造商说明书实施位点定向诱变。PCR仪条件如下:1段循环:95℃,2分钟;2段循环(重复30次):95℃30秒,55℃30秒,和72℃5.5分钟;3段循环:4℃10分钟。PCR后,添加Dpn I限制酶以消化未突变的质粒。将突变的DNA转移至大肠杆菌BL21(DE3)中并按照上文对野生型描述的方法表达蛋白质。可以类似地进行本发明其他脱羧酶的诱变。
f)确定AMD酶活性的体内平板测定法
使用以下培养基制备测试平皿:1%胰蛋白胨,0.5%酵母提取物,1%氯化钠,1%琼脂,0.025%溴麝香草酚蓝(BTB)。随后调节pH至6.5并将培养基高压灭菌。当培养基温度达50-60℃时,添加异丙基-6-D-硫代吡喃半乳糖苷(终浓度1mM),卡那霉素(终浓度40mg/mL)和苯基丙二酸(终浓度0.36%)。100μl含有AMD酶的液体细菌培养物涂布在测试平皿上。在37℃孵育2-3日,菌落和周围区域的颜色改变至指示AMD酶活性的蓝绿色。
g)动力学常数的测定
该方法涉及在620nm分光光度测量pH指示剂-BTB随脱羧反应期间形成的[OH-]的递增浓度从黄色至蓝绿色的改变。为确保颜色的增加与pH的升高为线性关系,应当在pH指示剂的pK(BTB的pKa=7.3)附近进行测量17。我们发现pH 7.2的5mM(和/或10mM)MOPS缓冲液是合适的。在更高的酶浓度或更快的反应情况下,更浓的缓冲液(10mM)产生更好的结果,因为颜色改变因更高的缓冲容量而更缓慢。
在Anthos Zenyth 3100 96孔微量平板读数仪上进行全部动力学测定法。将10μl的20-500mM苯基丙二酸或甲基-苯基丙二酸溶液(pH调节至7.2)添加至180μl含有0.0186mM溴麝香草酚蓝的5-10mM MOPS缓冲液pH 7.2。通过添加10μl脱羧酶溶液(终浓度0.002-0.02mM)启动反应。反应的灵敏度取决于缓冲液的浓度,更低的浓度产生更高的灵敏度。使用双倒数作图法和以下等式,从所得蓝色溶液在620nm的分光光度量值计算KM和kcat值:
反应速率=(dA/dt)*Q*反应体积,其中
Q=(CMOPS缓冲液/CBTB指示剂)*(1/Δε620nm*l)并且Δε616nm=15703.79M-1cm-117,18
h)通过来自支气管炎博德特氏菌的AMD酶和来自中生根瘤菌BNC1的Asp/Glu消旋酶使2-甲基-2-苯基丙二酸体外脱羧成2-苯基丙酸
添加100μl 0.5M 2-甲基-2-苯基丙二酸的水溶液(在调节pH至8后)至pH 8的400μl 0.1M TRIS缓冲液。随后添加20μl AMD酶溶液(10mg/mL)并且反应物在30℃搅拌8小时。产物在用1M HCl酸化并用TMS-重氮甲烷甲基化后以二乙醚萃取。该反应物通过GC分析(转化率高达95%)并通过GC-MS,1H NMR证实2-苯基丙酸的形成。两种酶产物(在甲基化后)具有相同构型(在使用手性柱的GC上的相同峰,ee>99%)。因而根据文献7,该产物的绝对构型是R。
i)i)酶促反应的底物
苯基丙二酸(1)从Sigmα-Aldrich购买。
2-乙基-2-苯基丙二酸是来自BASF SE的友好馈赠。
2-甲基-2-苯基丙二酸二乙酯(2a)从苯基丙二酸二乙酯与碘甲代烷的反应合成。将10g(42.3mmol)苯基丙二酸二乙酯在回流下于乙醇钠溶液中搅拌1小时,其中通过在60mL无水乙醇中溶解1.6g(69.5mmol)金属钠制备所述乙醇钠溶液。随后,添加6mL(96.4mmol)Mel并将所得的混合物在回流下搅拌另外一小时。在反应后,在真空下除去溶剂并将剩余残余物溶解于二乙醚中并在无水硫酸镁上干燥。将二乙醚蒸发并且获得终产物(灰白色油),根据NMR分析,产率是98%并且纯度是99%。
2-甲基-2-苯基丙二酸(2)通过在氢氧化钠中水解从2-甲基-2-苯基丙二酸二乙酯(2a)合成。将4g(16mmol)2-甲基-2-苯基丙二酸二乙酯溶解于100mL乙醇中并添加50mL的3.25M氢氧化钠水溶液。反应物在室温搅拌过夜。随后在真空下蒸发乙醇并且将所得白色粉末溶解于10mL水中,在冰上冷却并用5M HCl酸化至pH 1。产物用2x100mL二乙醚萃取并在无水硫酸镁上干燥。蒸发二乙醚以产生终产物(白色粉末),如1H NMR所分析,产率是97%并且纯度是99%。
2-亚丙基丙二酸二乙酯(4a)、2-亚丁基丙二酸二乙酯(5a)和2-(2-甲基亚丙基)丙二酸二乙酯(6a)通过丙二酸二乙酯分别与丙醛、丁醛、异丁醛的反应制备。16g(0.1mol)丙二酸二乙酯与50ml甲苯中的0.4ml哌啶和1.2ml冰乙酸一起搅拌20分钟。随后,添加0.12mol适宜的醛并且反应物在Dean-Stark条件下回流4小时。添加100ml以氢氯酸酸化的水至反应混合物并且产物用二乙醚萃取。有机层用盐水液洗涤数次并且在硫酸镁上干燥。全部产物由急骤柱层析纯化。以高达80%的产率获得作为无色油的产物。
2-亚乙基丙二酸二乙酯(3a)从Sigmα-Aldrich购买。
以如下文2-甲基-2-乙烯基丙二酸二乙酯(3b)合成中所示的相同方式获得2-甲基-2-乙烯基丙二酸二乙酯(3b)、2-甲基-2-((E)-丙-1-烯基)丙二酸二乙酯(4b)、2-甲基-2-((E)-丁-1-烯基)丙二酸二乙酯(5b)和2-甲基-2-(2-甲基丙-1-烯基)丙二酸二乙酯(6b)。
将15ml无水THF中的2.4ml二异丙胺冷却至-78℃并且逐滴添加己烷中的10.5ml BuLi(2.5M)。20分钟后,添加7.5ml的DMPU和2.8g(0.014mol)2-亚乙基丙二酸二乙酯(3a)。反应物在-78℃搅拌45分钟并随后添加3.8g碘代甲烷。反应物在1小时内搅拌至室温并随后回流30分钟。添加70ml以氢氯酸酸化的水至反应混合物并且产物用二乙醚萃取。产物由急骤柱层析纯化。以30%产率获得作为无色油的最终酯。以如上文对2-甲基-2-苯基丙二酸(2)所述的相同方式从酯合成2-甲基-2-乙烯基丙二酸(3)、2-甲基-2-((E)-丙-1-烯基)丙二酸二乙酯(4)、2-甲基-2-((E)-丁-1-烯基)丙二酸二乙酯(5)和2-甲基-2-(2-甲基丙-1-烯基)丙二酸二乙酯(6)。
k)18O标记实验
步骤I:10μl(40μmol)2-甲基-2-苯基丙二酸二乙酯(5)与10μl DMSO混合并且混悬于含有5mg猪肝脏酯酶(15单位/mg冻干粉,Sigmα-Aldrich)的500μl磷酸盐缓冲液pH 7(对于H2 18O实验:将0.5mL缓冲液蒸发至干燥并且存留的粉末再溶于0.5mL H2 18O和反应所用的标记缓冲液)中。反应物在30℃搅拌过夜。随后将反应物冷却至4℃,用1M HCI酸化至pH 1并且产物用二乙醚萃取。2-甲基-2-苯基丙二酸单乙酯由1H NMR鉴定并在用TMS-重氮甲烷甲基化后由GC-MS(采用同位素分析)鉴定。在手性柱Chiracel-OD上通过HPLC-分析证实2-甲基-2-苯基丙二酸单乙酯的对映选择性。通过使用己烷-异丙醇-三氟乙酸(93∶7∶1.5)混合物,在260nm以0.25mL/min流速实现对映体峰的分开。根据文献数据14,形成的产物具有R构型。
步骤II:来自步骤I的产物溶解于150μl无水乙醇中并添加55μl的8.75M NaOH(对于H2 18O实验:100mg金属钠溶解于55μl的H2 18O中,获得的Na18OH用于反应)。反应物在30℃搅拌2.5小时。将反应物蒸发至干燥并溶解于冷(4℃)的0.1M TRIS缓冲液pH 8(400μl)并且pH用1MHCl调节至8。1/3的混合物用1M HCl酸化至pH 1并且产物用二乙醚萃取。2-甲基-2-苯基丙二酸由1H NMR鉴定并在用TMS-重氮甲烷甲基化后由GC-MS(采用同位素分析)鉴定。
步骤III:向来自步骤II剩余溶液,添加20μl AMD酶溶液(10mg/mL)并且反应混合物在30℃搅拌4.5小时(对于来自中生根瘤菌的AMD酶,过夜)。在这段时间后,将混合物冷却至4℃,用1M HCl酸化至pH 1并且终产物用二乙醚萃取。2-苯基丙酸由1H NMR鉴定并在用TMS-重氮甲烷甲基化后由GC-MS(采用同位素分析)鉴定。(甲基后的)产物的对映选择性(ee>99%)由使用手性柱的GC证实。
2.实施例
实施例1:支气管炎博德特氏菌AMD酶的过量产生和活性
将用于大肠杆菌中表达而进行密码子优化的编码支气管炎博德特氏菌AMD酶的合成基因亚克隆至pET30b载体中。用IPTG诱导后,在大肠杆菌BL21(DE3)菌株中的表达产生作为羧基端His6融合蛋白的AMD酶。该酶随后通过Ni亲和层析纯化至大于95%纯度(如SDS-PAGE所证实)并且通过ESI-MS(m/z实验值25 799,理论值:25 800Da)证实分子量。
首先,使用文献中所报道方法的改良方法,采用具有AMD酶表达载体的完整大肠杆菌细胞检验芳基丙二酸脱羧酶活性,其中所述改良方法使用溴麝香草酚蓝(BTB)作为pH指示剂和苯基丙二酸1作为底物。在IPTG存在下,AMD酶对底物的脱羧因颜色从黄至蓝的清晰改变而是显而易见的。以2-甲基-2-苯基丙二酸2作为底物时,注意到相似的颜色改变。所述脱羧酶的体外动力学参数使用已知UV分光光度测定法的改良方法确定,其中所述的改良方法依赖于随脱羧后氢氧化物离子4的递增浓度BTB在620nm处吸收的改变。从这种变化中,以苯基丙二酸和2-甲基-2-苯基丙二酸2作为底物确定表观动力学参数(表1)。总体上,所述动力学常数与对天然酶所确定的那些动力学常数一致并提示His6标签基本不影响AMD酶的活性。然而,2-甲基-2-苯基丙二酸的Kcat高于先前报道6
表1.使用苯基丙二酸和2-甲基-2-苯基丙二酸作为底物所检验酶的动力学常数(以BTB分光光度方法确定)
Figure GPA00001141945100431
  NP_888076.1
  来自嗜火产水菌的谷氨酸消旋酶   3.1*10-3(0.21*10-3)b   0.24(3.3)b   77(15710)b   不反应
  来自掘越氏热球菌OT3的蛋白质BAA30082.1 41.7*10-3 0.09 2.2 不反应
  来自AlkaliphilusmetalliredigenesQYMF的蛋白质ZP_00801202.1 123*10-3 0.26 2.1 不反应
a)来自支气管炎博德特氏菌的AMD酶的文献数据6
b)来自嗜火产水菌的谷氨酸消旋酶(消旋酶活性的动力学常数)10
实施例2:支气管炎博德特氏菌AMD酶的结构
a)通过沉滴技术结晶AMD酶
将如根据实施例1获得的支气管炎博德特氏菌AMD酶浓缩至10mg/mL并且使用与2μL母液混合的2μL制备沉滴,其中所述母液由Tris(0.1M,pH 8.5)和PEG 6000(30%)组成。托盘在21℃孵育并且小晶体在1周后出现。晶体属于具有晶胞a=38.7,b=65.6,
Figure GPA00001141945100441
β=110.8°和约34%溶剂含量的P21空间群。在添加10%PEG 200作为防冻剂后快速冷却至100K的单晶上收集达
Figure GPA00001141945100442
的完整数据集(见表2)。分析衍射图像并使用Crystal Clear扫描数据。
从FPLC纯化法得到如晶体结构分析所揭示的在AMD酶活性位点内结合的磷酸盐阴离子,在所述FPLC纯化法中使用磷酸盐缓冲液作为洗脱缓冲液。
通过手工解读差值帕特森函数(difference Patterson function)找到两种同晶氯化铅衍生物的重原子位点的位置。使用定位的位点来解析以生成实验性MIRAS相,随后使用Arp/Warp自动建立一个部分AMD酶模型。完成所得模型并使用Coot和Refmac 5进行细化。
表2:来自支气管炎博德特氏菌的AMD酶的晶体学数据
Figure GPA00001141945100451
b)AMD酶结构的确定
使用异常散射多重同晶置换(MIRAS),以两种氯化铅衍生物,将AMD酶结构解析至标称分辨率
Figure GPA00001141945100452
该结构揭示与Asp/Glu消旋酶晶体结构10,12的总体相似性,尽管在催化性功能方面差异明显。晶体相对较小,不过因非常低的溶剂含量(大约22%),故衍射极强。该结构明显是一种紧密折叠的单体,所述单体出人意料地在β片层末端之间的溶剂可及通道的中心处具有结合于活性位点Cys188附近的单个磷酸盐分子(图4(a))。该磷酸可能模拟所提出烯醇化物中间体的羧基,4个氧中的2个氧被一个典型的氧-阴离子孔构造结合(图4(b)。已经在许多蛋白质结构描述了单个分离的氧阴离子孔(Robertus,J.D.,Kraut,J.,Alden,R.A.和Birktoft,J.J.枯草蛋白酶:涉及过渡态稳定化的立体化学机制(Subtil-isin;a stereochemicalmechanism involving transition-state stabilization).Biochemistry 11,4293-4303(1972))。然而,先前没有报道过这些氧中的2个氧以双氧-阴离子孔形式存在,据预测其使高能烯二醇化物型中间体稳定化。
O1被Tyr126的侧链结合并且被Ser76的酰胺骨架和羟基侧链结合。另一方面,除Thr75的羟基和酰胺骨架之外,O2被Gly189的酰胺骨架结合。不能单从氢键形成模式确立两个O原子任一者或二者是否去质子化。此外,磷酸盐O3与Cys188侧链形成氢键。然而,在该磷酸盐与AMD酶的其余残基之间极少形成额外的直接接触。
尽管这种酶的真实生物学底物未知,然而已经广泛地使用前手性2-甲基-2-苯基丙二酸2作为模型底物。因而最初将所提出的衍生自这种底物脱羧的烯醇化物中间体对该结构的活性位点建模(图5)。该模型使用原初磷酸基的O1-P-O2原子的坐标,目的在于将烯醇化物的羧基置于氧-阴离子孔内。在原初结构中,活性位点腔体积在性质上主要是疏水的并且在O1-P-O2原子上方伸展。在O1基团正上方存在相对小的可用空间,而与之相比,伸展入溶剂区的一个大腔体在O2正上方是可用的。这个大腔体也理想地处于结合芳基的形状,同时Pro14侧链距离Gly189-Gly190酰胺键大约
Figure GPA00001141945100461
从而允许扁平芳族系统在它们之间的理想范德华堆积作用。从可用活性位点体积看,似乎该酶将能够容纳相对大体积的邻位-、间位-和对位-基团,包括2-萘基取代基,这与该酶先前确定的底物专一性一致6,13。在O1上方存在狭小可用空间的事实清楚地表明这个空间最有可能容纳更小的甲基取代基。以这种方式结合的所提出中间体的模型(图5)安置Cys188硫羟基与烯醇化物的si-面密切接触,这与产生R-构型2-苯基丙酸产物的后续质子化步骤一致。
实施例3:活性位点修饰
用停靠在活性位点内的所提出烯醇化物中间体对晶体结构的进一步分析揭示(位于所丢失羧化物的对面的)氨基酸残基Leu40、Val43、Val156、Tyr48和Met159构成可能容纳甲基取代基的较小疏水性结合口袋(图5)。
因此,通过位点定向诱变产生3个各自的单突变体Leu40Ala、Val43Ala和Val156Ala。
以下引物(正向和反向)用于每种位点定向诱变法(从SigmaAldrich获得)。
L40A_F    GAGCGGCCTGGGCGCGGGTAGCGTTAC  (SEQ ID NO:17)
L40A_R    GTAACGCTACCCGCGCCCAGGCCGCTC  (SEQ ID NO:18)
V43A_F    CCTGGGTAGCGCAACCCCGGAAGGC    (SEQ ID NO:19)
V43A_R    GCCTTCCGGGGTTGCGCTACCCAGG    (SEQ ID NO:20)
V156A_F   GCATTACCGGCGCGGAAGCGATGGC    (SEQ ID NO:21)
V156A_R   GCCATCGCTTCCGCGCCGGTAATGC    (SEQ ID NO:22)
尽管对一种具体AMD酶(BAA02419.1)的所述三种具体单突变体示范了本发明突变体的制备,然而熟练的读者将能够借助基本上相同的方法在氨基酸序列的任何位置导入突变,目的在于修饰本发明酶的活性谱。所选择的位点定向诱变引物:
Pro14Ala_F    CATTGGCATGATTGTGGCGCCGGCAGCGGGTC (SEQ ID NO:23)
Pro14Ala_R    GACCCGCTGCCGGCGCCACAATCATGCCAATG (SEQ ID NO:24)
P14G_F    CATTGGCATGATTGTGGGTCCGGCAGCGGGTCTG   (SEQ ID NO:25)
P14G_R    CAGACCCGCTGCCGGACCCACAATCATGCCAATG   (SEQ ID NO:26)
G189A_F   CTGCTGTCTTGCGCGGGTCTGCTGACC          (SEQ ID NO:27)
G189A_R   GGTCAGCAGACCCGCGCAAGACAGCAG          (SEQ ID NO:28)
G190A_F   CTGCTGTCTTGCGGCGCGCTGCTGACCCTGGATG   (SEQ ID NO:29)
G190A_R   CATCCAGGGTCAGCAGCGCGCCGCAAGACAGCAG   (SEQ ID NO:30)
G189A+G190A_F
CATTCTGCTGTCTTGCGCGGCGCTGCTGACCCTGGATG         (SEQ ID NO:31)
G189A+G190A_R
CATCCAGGGTCAGCAGCGCCGCGCAAGACAGCAGAATG         (SEQ ID NO:32)
所选择的位点定向饱和诱变引物:
VAL13+PRO14(SAT)_F
CCCCGACCATTGGCATGATTNDTNDTCCGGCAGCGGGTCTGGTTC
(SEQ ID NO:33)
VAL13+PRO14(SAT)_R
GAACCAGACCCGCTGCCGGAHNAHNAATCATGCCAATGGTCGGGG
(SEQ ID NO:34)
PRO14+PRO15(SAT)_F
CGACCATTGGCATGATTGTGNDTNDTGCAGCGGGTCTGGTTCCGG
(SEQ ID NO:35)
PRO14+PRO15(SAT)_R
CCGGAACCAGACCCGCTGCAHNAHNCACAATCATGCCAATGGTCG
(SEQ ID NO:36)
突变体的制备如上文所述进行。
实施例4:脱羧的底物方向和机制
为了进一步探索疏水相互作用在脱羧中是重要的可能性,需要建立底物在活性位点中的可能方向。为此,实施18O标记实验以建立该反应的立体化学过程并因而鉴定2-甲基-2-苯基丙二酸2底物的2个前手性羧基中哪一个前手性羧基在脱羧期间丢失,哪一个与氧-阴离子孔结合(图8)。因此,使用猪肝脏酯酶(PLE)来催化2-甲基-2-苯基丙二酸二乙酯的对映选择性水解以产生符合文献的98%e.e的(R)-单酯614。(R)-单酯6随后用H2 18O中的Na18OH水解以产生具有前-R羧化物7中18O标记的2-甲基-2-苯基丙二酸。类似地,所述二酯5首先用98%H2 18O中的PLE水解以产生8并随后以非标记NaOH皂化,从而产生具有前-S羧化物9中18O标记的2-甲基-2-苯基丙二酸。手性18O标记的丙二酸7和9分别与AMD酶孵育。脱羧产物随后用TMS-重氮甲烷甲基化并通过GC-MS分析。据此,显而易见从(R)-丙二酸7(路径A)产生的产物(2-苯基丙酸甲酯)已经丢失18O标记(m/z164),而来自(S)-丙二酸9(路径B)的该产物仍保留18O标记(m/z 166)。这通过丢失构型完全倒反的前-R羧化物而证实发生脱羧。
就所建立反应物的立体化学过程而言,可能将底物2-甲基-2-苯基丙二酸置于AMD酶结构的活性位点内(图6)。就氧-阴离子孔所决定的前-R羧化物的位置和位于溶剂暴露口袋中的苯基取代基而言,显而易见前-S羧化物占据活性位点相对于Cys188残基的对立面并且确实牢固地被Leu40、Val43、Val 156、Tyr48疏水口袋结合(图7)。实际上,从该模型中可能得出结论:Leu40Ala突变可能起到为至少一个水分子产生足够空间以结合并稳定化前-R羧化物,因而延迟脱羧。Leu40是脱羧酶活性必需的,同时该蛋白质正确折叠显然需要Val43、Val156,该事实说明了这些残基对该酶采取正确功能性构象的重要性。另外,这些研究结果表明丙二酸底物的前-R羧化物的疏水性去稳定化是脱羧的推动力,导致电子密度离开原位至烯醇化物中间体的前-S羧化物中,其中所述的烯醇化物中间体由氧-阴离子孔稳定化(图1(b))。因而,该酶能够仅通过定向排列丙二酸底物,以至一个羧基被一个广泛成氢键网络稳定化,同时另一个羧酸根丧失任何此类稳定化相互作用,而在无辅因子或不预先激活为吸电子硫酯的情况下实现有效脱羧。
实施例5:其他AMD酶相关酶的鉴定和催化特性
尽管AMD酶在生物催化中应用的前景明显,然而迄今分离并表征仅一种这样的酶。然而,在蛋白质数据库中的搜索揭示存在与支气管炎博德特氏菌AMD酶具有序列相似性的许多蛋白质,其中大部分蛋白质的功能未知。选择4种蛋白质序列用于研究,其中所述的蛋白质序列与AMD酶显示中等至高度相似性(图3(a),(b))并在与这种支气管炎博德特氏菌酶中Cys188相同的相对位置处含有半胱氨酸(表3)。
表3所选用于搜索芳基丙二酸脱羧酶活性的酶及其由ESI-MS确定的分子量。
  来自BLAST数据库的编   微生物   提出的功能  在加6xHis标   与AMD酶的同一性   实验分子  理论分子量(道
  号   记的蛋白质中的氨基酸数目   [%](重叠氨基酸的数目)   量(道尔顿)   尔顿)
BAA02419.1   支气管炎博德特氏菌   芳基丙二酸脱羧酶 248 100(240) 25799 25800
EAN08019.1   中生根瘤菌BNC1   Asp/Glu消旋酶 248 52(219) 25770 25771
NP_888076.1   支气管炎博德特氏菌RB50   推定的脱羧酶 273 36(237) 29953 29950
  ZP_00801202.1   Alkaliphilusmetalliredigenes QYMF   Asp/Glu消旋酶 251 34(183) 27413 27410
BAA30082.1   掘越氏热球菌OT3   假设的芳基丙二酸脱羧酶 246 30(214) 27816 27818
AAF25672 嗜火产水菌   谷氨酸消旋酶 262 - 29060 29058
因而,合成了编码这些蛋白质的具有大肠杆菌优化密码子的基因。将合成的基因如上所述克隆,在大肠杆菌中过量表达并纯化为His6-融合蛋白。SDS-PAGE证实全部蛋白质具有大于95%的纯度并且全部蛋白质的ESI质谱符合理论值(表3)。除此之外,过量产生并纯化了来自嗜火产水菌的已知的谷氨酸消旋酶。这种谷氨酸消旋酶的序列与来自支气管炎博德特氏菌的AMD酶的序列几乎没有相似性。然而,该谷氨酸消旋酶的结构和机理已充分建立10,16,所述机理基于采用两个在广义酸-碱催化作用中起作用的半胱氨酸形成中间体烯醇化物。这些事实使得这种酶成为有趣的研究候选物,旨在建立天然消旋酶是否也可展示不加区别的脱羧酶活性。
起初在具有BTB和作为底物的苯基丙二酸的平板(见图9和10)上体内测量所述新酶的活性。令人惊奇地,全部的转化菌落在延长的孵育期后变成蓝色,而没有插入基因的转化体不产生颜色改变。这表明全部这些这些酶可以某种程度催化脱羧反应。随后,建立纯化酶的表观动力学常数(表1)。值得注意地,以苯基丙二酸1和2-甲基-2-苯基丙二酸2作为底物,与支气管炎博德特氏菌AMD酶显示最高相似性的来自中生根瘤菌BNC1的酶显示出极高效的脱羧酶活性。支气管炎博德特氏菌RB50酶对苯基丙二酸显示中等活性,而来自掘越氏热球菌OT3和Alkaliphilus metalliredigenesQYMF的酶对苯基丙二酸显示极低活性水平,这与仅对具有这些酶的转化体显示缓慢显色的体内测定法一致。有趣地,来自嗜火产水菌的已知谷氨酸消旋酶能够催化苯基丙二酸脱羧,其活性比天然谷氨酸消旋酶活性低196倍。可以通过蛋白质序列比对结果合理说明这些结果(图3(a)(b))。全部酶都具有氧-阴离子孔,然而仅来自支气管炎博德特氏菌的酶和来自中生根瘤菌的酶具有推定疏水性羧化物结合口袋,其中需要所述结合口袋使脱羧时丢失的CO2基团去稳定化。由此得出结论:将一个羧酸根牢固结合至氧-阴离子孔内即足以脱羧,然而为了高效脱羧,丢失的羧基必须通过疏水性接触酶活性位点去稳定化。这些结果表明芳基丙二酸的脱羧可以由许多不同的酶实现,并且这提供众多可能起点以工程化具有改良底物专一性和生物催化活性的新脱羧酶。
实施例6:来自中生根瘤菌BNC1的AMD酶的结构和机制
从新酶的汇集物中,仅来自中生根瘤菌BNC1的脱羧酶能够使2-甲基-2-苯基丙二酸2脱羧。在这种情况下,在2-甲基-脱羧后获得的2-苯基丙酸产物显示与因支气管炎博德特氏菌AMD酶产生的脱羧产物具有相同R-构型(ee>99%)。另外,用(R)-和(S)-丙二酸7和9的18O标记研究也表明中生根瘤菌BNC1 AMD酶以与支气管炎博德特氏菌酶相同的立体化学运转,丢失构型完全颠倒的前-R羧化物。考虑到表观机制特性和与支气管炎博德特氏菌AMD酶的序列相似性,可能产生具有结合的底物2-甲基-2-苯基丙二酸2的中生根瘤菌BNC1 AMD酶活性位点的模型(图6(b))。该模型显示一个极相似的活性位点结构,该结构具有容纳前-S羧基的氧-阴离子孔和起到使前-R羧化物去稳定化作用的保守性疏水口袋。此外,存在一个完美容纳底物的苯基的溶剂可及性口袋。总之,这证实该酶具有与支气管炎博德特氏菌AMD酶相似的机理和结构。除了为涉及新脱羧酶的设计提供有价值信息之外,这些观察结果提出一些有趣的问题,如为何这些相当不同的生物拥有在初级或次级代谢方面无明显功能的相似酶。显然,仍待观察这类酶可能在自然界中起到什么生理作用。
实施例7:支气管炎博德特氏菌KU 1201 AMD酶和中生根瘤菌BNC1AMD酶对不同烯基取代的式I底物的活性
BTB活性测定法如上所述进行。测试了作为底物的式I化合物,其中R2是甲基并且R1是苯基、乙烯基、丙烯-1-基、丁烯-1-基或2-甲基丙烯-1-基。结果汇总于下表4中:
表4:由TB测定法在30℃测定的不同式I化合物的动力学常数
数据显示每种所检验的烯基取代的非芳族化合物被所述两种不同AMD酶的每一种酶脱羧。对于非芳族残基R1而言,对R1=乙烯基观察到最快反应。
实施例8:确定由支气管炎博德特氏菌KU 1201 AMD酶和中生根瘤菌BNC1 AMD酶针对不同烯基取代的式I底物所形成的一元酸的光学纯度和绝对构型
不同的非芳族底物由来自支气管炎博德特氏菌KU1201和中生根瘤菌BNC1的AMD酶脱羧,如下面的示意图中所示。
R3=H,CH3    Me=CH3
R4=H,CH3CH2
所述酶促反应的条件与对芳基丙二酸所述那样(见上文)相同,仅反应时间更长。通常24小时后,全部底物已经被转化。
所述的不饱和脂族丙二酸的反应进行到完成(>99%转化率)。产物可以通过终止酶促反应后用二乙醚从酸化水层萃取以纯形式回收。通常,无需额外的纯化步骤。
反应在200mg规模上进行,并且回收的纯产物的观察产率是约90-95%。
为了分析反应产物,所获得的一元酸用重氮甲烷衍生成相应的甲酯。随后借助气相色谱,使用手性柱Varian Chirasil-Dex CB(25mx250μmx0.26μm)在以下温度条件下测定所述甲酯的ee值:在50℃维持30分钟,随后梯度10℃/分钟直至温度达到200℃,随后在200℃维持5分钟。
停留时间值:
2-甲基丁-3-烯酸甲酯:12.286分钟(对映体(R))和12.350分钟(S);
(E)-2-甲基戊-3-烯酸甲酯:24.984分钟(S)和27.823分钟(R);
(E)-2-甲基己-3-烯酸甲酯:34.324分钟(S)和34.885分钟(R);
2,4-二甲基庚-3-烯酸甲酯:33.679分钟(R)和34.254分钟(S)。
对于来自支气管炎博德特氏菌KU1201和中生根瘤菌BNC1的两种AMD酶的每一种,以ee>99%获得一元酸。
所得一元酸的绝对构型是(R),与芳基丙二酸的相同。通过比较测量的旋光度与相应文献数据确定绝对构型。
将相应的非芳族HO-取代的底物(其中Me被羟基置换)脱羧并通过比色筛选法测定(数据未显示)。
关于本发明的结论性总体评价
已经用结合至活性位点的磷酸盐给出了来自支气管炎博德特氏菌的辅因子独立的芳基丙二酸脱羧酶(AMD酶)的首个X射线晶体结构。该结构揭示氧-阴离子孔的存在,其中需要所述氧-阴离子孔来结合一个底物羧酸根并稳定推定的烯醇化物中间体的形成。此外,可以容纳典型底物的大芳基取代基的溶剂可及性腔是明显的,而紧凑疏水口袋限制了额外脂族丙二酸取代基的大小。使用18O标记研究,可以确立模型底物2-甲基-2-苯基丙二酸的脱羧伴随立体化学结构的颠倒和前-R羧化物的丢失发生,这允许产生与活性位点结合的底物的模型。该模型显示底物在脱羧期间丢失的前-R羧化物被疏水口袋牢固结合,其中推测所述的疏水口袋使羧化物上的负电荷去稳定化,从而在缺少辅因子或酰基酶中间体的情况下为脱羧提供必需推动力。该疏水口袋的结构及机理重要性通过位点定向诱变疏水性残基成为Ala来展示,其中所述的点定向诱变导致错误折叠或活性完全丧失。脱羧后,由氧-阴离子孔稳定化的所得烯醇化物随后从活性位点Cys188残基的si-面质子化,产生(2R)-苯基丙酸。
除此之外,对支气管炎博德特氏菌AMD酶表现相似性的4种新酶显示催化芳基丙二酸底物的脱羧。发现来自中生根瘤菌BNC1的这些酶之一拥有与原初支气管炎博德特氏菌AMD酶相似的底物专一性、催化效率和立体化学。另外,这两种酶之间的序列相似性允许产生来自中生根瘤菌的AMD酶的结构模型,这支持这两种AMD酶具有共同机理的假说。此外,也显示来自嗜火产水菌的预测具备相似催化机制的已知谷氨酸消旋酶具备不加区别的芳基丙二酸脱羧酶活性,尽管该酶几乎不显示与AMD酶的序列相似性。
总之,这些综合的结果提供重要的结构性和机理性深刻理解,其对于通过推理性诱变或定向进化工程化新脱羧酶是必需的。所述技术例如在以下文献中公开:
1)Roberto A Chica,Nicolas Doucet and Joelle N Pelletier,Semi-rational approachesto engineering enzyme activity:combining the benefits of directed evolution and ra-tional design,Current Opinion in Biotechnology,16,4,2005,378-384,
2)Enzyme functionality:Design,engineering,and screening edited by Allan Svendsen,Marcel Dekker,Inc.,New York,Basel 2003
3)Paul A.Dalby Engineering Enzymes for Biocatalysis Recent Patents on Biotechnol-ogy 2007,1,1-9
这是重要的改进,因为由AMD酶提供的高度立体选择性使得能够从廉价的可用的丙二酸前体制备高价值的纯手性羧酸。
将本文引用的文件并入本文作为参考。
参考文献
1.Dimroth,P.,Hilbi,H.,Enzymic and genetic basis for bacterial growth on malo-nate.Mol.Microbiol.1997,25,(1),3-10.
2.Hoenke,S.,Wild,M.R.,Dimroth,P.,Biosynthesis of triphosphoribosyl-dephospho-coenzyme A,the precursor of the prosthetic group of malonate de-carboxylase..Biochemistry 2000,39,(43),13223-32.
3.Miyamoto,K.,Ohta,H.,Asymmetric decarboxylation of disubstituted malonic acidby Alcaligenes bronchisepticus KU1201.Biocatalysis 1991,5,49-60.
4.Miyamoto,K.,Ohta,H.,Cloning and heterologous expression of a novel aryl-malonate decarboxylase gene from Alcaligenes bronchisepticus KU 1201.ApplMicrobiol Biotechnol 1992,38,234-238.
5.Miyamoto,K.,Ohta,H.,Enzyme-mediated asymmetric decarboxylationof disub-stituted malonic acids.J Am Chem Soc 1990,112,4077-4078
6.Miyamoto,K.,Ohta,H.,Purification and properties of a novel arylmalonate de-carboxylase from Alcaligenes bronchisepticus KU 1201.European Journal of Bio-chemistry 1992,210,(2),475-81.
7.Terao,Y.,Miyamoto,K.,Ohta,H.,Introduction of single mutation changes aryl-malonate decarboxylase to racemase.Chemical Communications 2006,34,3600-3602.
8.Matoishi,K.,Ueda,M.,Miyamoto,K.,Ohta,H.,Mechanism of asymmetric decar-boxylation of α-aryl-α-methylmalonate catalyzed by arylmalonate decarboxylaseoriginated from Alcaligenes bronchisepticus.Journal of Molecular Catalysis B:Enzymatic 2004,27,(4-6),161-168.
9.Glavas,S.,Tanner,M.E.,Active site residues of glutamate racemase.Biochem-istry 2001,40,(21),6199-6204
10.Hwang,K.Y.,Cho,C.S.,Kim,S.S.,Sung,H.C.,Yu,Y.G.,Cho,Y.,Structureand mechanism of glutamate racemase from Aquifex pyrophilus.Nature structuralbiology 1999,6,(5),422-426.
11.Terao,Y.,Ijima,Y.,Miyamoto,K.,Ohta,H.,Inversion of enantioselectivity ofarylmalonate decarboxylase via site-directed mutation based on the proposed re-action mechanism.Journal of Molecular Catalysis B:Enzymatic 2007,45,(1-2),15-20
12.Liu,L.,Iwata,K.,Kita,A.,Kawarabayasi,Y.,Yohda,M.,Miki,K.,Crystal struc-ture of aspartate racemase from Pyrococcus horikoshii OT3 and its implicationsfor molecular mechanism of PLP-independent racemization.J.Mol.Biol.2002,319,479-489.
13.Miyamoto,K.,Ohta,H.,Osamura,Y.,Effect of Conformation of the Substrate onEnzymatic Decarboxylation of a-Arylmalonic Acid.Bioorganic and MedicinalChemisby 1994,2,(6),469-475.
14.Dominguez de Maria,P.,Kossmann,B.,Potgrave,N.,Buchholz,S.,Trauthwein,H.,May,O.,Groeger,H.,Improved process for the enantioselective hydrolysis ofprochiral diethyl malonates catalyzed by pig liver esterase.Synlett 2005,11,1746-1748.
15.Miyamoto,K.,Tsutsumi,T.,Terao,Y.,Ohta,H.,Stereochemistry of Decarboxyla-tion of Arylmalonate Catalyzed by Mutant Enzymes.Chemistry Letters 2007,36,(5),656-657.
16.Handa,S.,Koo,J.H.,Kim,Y.S.,Floss,H.G.,Stereochemical Course of Biotin-IndependentMalonate Decarboxylase Catalysis.Archives of Biochemistry andBiophysics 1999,370,(1),93-96.
17.Janes,L.E.,Lowendahl,A.Ch.,Kazlauskas,R.J.,Quantitative screening of hy-drolase libraries using pH indicators:identifying active and enantioselective hy-drolases.Chemistry-A European Journal 1998,4,(11),2324-2331.
18.Banerjee,A.,Kaul,P.,Sharma,R.,Banerjee,U.C.,A high-throughput amenablecolorimetric assay for enantioselective screening of nitrilase-producing microor-ganisms using pH sensitive indicators.Journal of Biomolecular Screening 2003,8,(5),559-565.
序列表
<110>巴斯夫欧洲公司
 
<120>用于工业生物催化的新的丙二酸脱羧酶
 
<130>M/48290-PCT
 
<160>36
 
<170>PatentIn版本3.3
 
<210>1
<211>744
<212>DNA
<213>支气管炎博德特氏菌
 
<220>
<221>CDS
<222>(1)..(744)
 
<400>1
atg cag cag gcg agc acc ccg acc att ggc atg att gtg ccg ccg gca       48
Met Gln Gln Ala Ser Thr Pro Thr Ile Gly Met Ile Val Pro Pro Ala
1               5                   10                  15
gcg ggt ctg gtt ccg gcg gat ggc gcg cgt ctg tat ccg gat ctg ccg       96
Ala Gly Leu Val Pro Ala Asp Gly Ala Arg Leu Tyr Pro Asp Leu Pro
            20                  25                  30
ttt att gcg agc ggc ctg ggc ctg ggt agc gtt acc ccg gaa ggc tat      144
Phe Ile Ala Ser Gly Leu Gly Leu Gly Ser Val Thr Pro Glu Gly Tyr
        35                  40                  45
gat gcg gtg att gaa agc gtg gtg gat cat gcg cgt cgt ctg cag aaa      192
Asp Ala Val Ile Glu Ser Val Val Asp His Ala Arg Arg Leu Gln Lys
    50                  55                  60
cag ggt gcg gcg gtg gtg agc ctg atg ggc acc agc ctg agc ttt tat      240
Gln Gly Ala Ala Val Val Ser Leu Met Gly Thr Ser Leu Ser Phe Tyr
65                  70                  75                  80
cgt ggt gcg gcg ttt aac gcg gcg ctg acc gtg gcg atg cgt gaa gcg      288
Arg Gly Ala Ala Phe Asn Ala Ala Leu Thr Val Ala Met Arg Glu Ala
                85                  90                  95
acc ggt ctg ccg tgc acc acc atg tct acc gcg gtg ctg aat ggt ctg      336
Thr Gly Leu Pro Cys Thr Thr Met Ser Thr Ala Val Leu Asn Gly Leu
            100                 105                 110
cgt gcg ctg ggt gtg cgt cgt gtt gcg ctg gcc acc gcg tat atc gat      384
Arg Ala Leu Gly Val Arg Arg Val Ala Leu Ala Thr Ala Tyr Ile Asp
        115                 120                 125
gat gtg aac gaa cgt ctg gcc gcg ttt ctg gcc gaa gaa agc ctg gtg      432
Asp Val Asn Glu Arg Leu Ala Ala Phe Leu Ala Glu Glu Ser Leu Val
    130                 135                 140
ccg acc ggt tgt cgt agc ctg ggc att acc ggc gtg gaa gcg atg gcg      480
Pro Thr Gly Cys Arg Ser Leu Gly Ile Thr Gly Val Glu Ala Met Ala
145                 150                 155                 160
cgt gtg gat acc gcg acc ctg gtg gat ctg tgc gtg cgt gcg ttt gaa      528
Arg Val Asp Thr Ala Thr Leu Val Asp Leu Cys Val Arg Ala Phe Glu
                165                 170                 175
gcg gca ccg gat agc gat ggc att ctg ctg tct tgc ggc ggt ctg ctg      576
Ala Ala Pro Asp Ser Asp Gly Ile Leu Leu Ser Cys Gly Gly Leu Leu
            180                 185                 190
acc ctg gat gcg att ccg gaa gtg gaa cgt cgt ctg ggc gtg ccg gtg      624
Thr Leu Asp Ala Ile Pro Glu Val Glu Arg Arg Leu Gly Val Pro Val
        195                 200                 205
gtt agc agc agc ccg gca ggc ttt tgg gat gcg gtg cgt ctg gcc ggt      672
Val Ser Ser Ser Pro Ala Gly Phe Trp Asp Ala Val Arg Leu Ala Gly
    210                 215                 220
ggt ggt gcg aaa gcg cgt ccg ggc tat ggc cgt ctg ttt gat gaa agc      720
Gly Gly Ala Lys Ala Arg Pro Gly Tyr Gly Arg Leu Phe Asp Glu Ser
225                 230                 235                 240
ctc gag cac cac cac cac cac cac                                      744
Leu Glu His His His His His His
                245
<210>2
<211>248
<212>PRT
<213>支气管炎博德特氏菌
 
<400>2
Met Gln Gln Ala Ser Thr Pro Thr Ile Gly Met Ile Val Pro Pro Ala
1               5                   10                  15
Ala Gly Leu Val Pro Ala Asp Gly Ala Arg Leu Tyr Pro Asp Leu Pro
            20                  25                  30
Phe Ile Ala Ser Gly Leu Gly Leu Gly Ser Val Thr Pro Glu Gly Tyr
        35                  40                  45
Asp Ala Val Ile Glu Ser Val Val Asp His Ala Arg Arg Leu Gln Lys
    50                  55                  60
Gln Gly Ala Ala Val Val Ser Leu Met Gly Thr Ser Leu Ser Phe Tyr
65                  70                  75                  80
Arg Gly Ala Ala Phe Asn Ala Ala Leu Thr Val Ala Met Arg Glu Ala
                85                  90                  95
Thr Gly Leu Pro Cys Thr Thr Met Ser Thr Ala Val Leu Asn Gly Leu
            100                 105                 110
Arg Ala Leu Gly Val Arg Arg Val Ala Leu Ala Thr Ala Tyr Ile Asp
        115                 120                 125
Asp Val Asn Glu Arg Leu Ala Ala Phe Leu Ala Glu Glu Ser Leu Val
    130                 135                 140
Pro Thr Gly Cys Arg Ser Leu Gly Ile Thr Gly Val Glu Ala Met Ala
145                 150                 155                 160
Arg Val Asp Thr Ala Thr Leu Val Asp Leu Cys Val Arg Ala Phe Glu
                165                 170                 175
Ala Ala Pro Asp Ser Asp Gly Ile Leu Leu Ser Cys Gly Gly Leu Leu
            180                 185                 190
Thr Leu Asp Ala Ile Pro Glu Val Glu Arg Arg Leu Gly Val Pro Val
        195                 200                 205
Val Ser Ser Ser Pro Ala Gly Phe Trp Asp Ala Val Arg Leu Ala Gly
    210                 215                 220
Gly Gly Ala Lys Ala Arg Pro Gly Tyr Gly Arg Leu Phe Asp Glu Ser
225                 230                 235                 240
Leu Glu His His His His His His
                245
 
<210>3
<211>747
<212>DNA
<213>中生根瘤菌
 
<220>
<221>CDS
<222>(1)..(747)
 
<400>3
atg agc gcg gaa gat ccg gtg att ggc ctg att gtt ccg ccg gca gca       48
Met Ser Ala Glu Asp Pro Val Ile Gly Leu Ile Val Pro Pro Ala Ala
1               5                   10                  15
ggt ctg gtt ccg ccg gaa gcg gtg gcg atg tat ccg gaa gtg acc ttt       96
Gly Leu Val Pro Pro Glu Ala Val Ala Met Tyr Pro Glu Val Thr Phe
            20                  25                  30
cat gcg agc ggc ctg ggc ctg aaa gaa atg acc ccg tgc ggc tat gcg      144
His Ala Ser Gly Leu Gly Leu Lys Glu Met Thr Pro Cys Gly Tyr Ala
        35                  40                  45
ggc gtg att gat ctg gtg ggc gat cat gcg gaa cgt cat gcg cag gcg      192
Gly Val Ile Asp Leu Val Gly Asp His Ala Glu Arg His Ala Gln Ala
    50                  55                  60
ggt gcg cag gcg gtg gcg ctg atg ggc acc agc ctg agc ttt ttt cgt      240
Gly Ala Gln Ala Val Ala Leu Met Gly Thr Ser Leu Ser Phe Phe Arg
65                  70                  75                  80
ggt gcg gcg ttt aac gcg gaa ctg att acc cac atg agc aac cgt agc      288
Gly Ala Ala Phe Asn Ala Glu Leu Ile Thr His Met Ser Asn Arg Ser
                85                  90                  95
ggt ctg ccg gcg acc acc atg agc cag gcg gtg gtg gat gaa ctg aaa      336
Gly Leu Pro Ala Thr Thr Met Ser Gln Ala Val Val Asp Glu Leu Lys
            100                 105                 110
agc cat ggc gcg cgt cgt att gcg gtg gtg acc gcg tat cgc cag gat      384
Ser His Gly Ala Arg Arg Ile Ala Val Val Thr Ala Tyr Arg Gln Asp
        115                 120                 125
gtg aac aac ctg ctg gcc gcg ttt ctg aac gaa cat ggc att gaa gcg      432
Val Asn Asn Leu Leu Ala Ala Phe Leu Asn Glu His Gly Ile Glu Ala
    130                 135                 140
cgt agc ctg aaa agc ctg ggc att acc agc gtg gcg gat gtt gcg ggc      480
Arg Ser Leu Lys Ser Leu Gly Ile Thr Ser Val Ala Asp Val Ala Gly
145                 150                 155                 160
acc ccg gcg aaa cgt ctg ctg cag ctg tgc aaa gaa gcg gtg cat gat      528
Thr Pro Ala Lys Arg Leu Leu Gln Leu Cys Lys Glu Ala Val His Asp
                165                 170                 175
gcg ggt ccg gtg gat gcg gtg ctg att agc tgc ggc ggt ctgcat acc       576
Ala Gly Pro Val Asp Ala Val Leu Ile Ser Cys Gly Gly Leu His Thr
            180                 185                 190
ctg gat gtg att gtg gat gtg gaa atc agc acc ggc ctg ccg gtt gtt      624
Leu Asp Val Ile Val Asp Val Glu Ile Ser Thr Gly Leu Pro Val Val
        195                 200                 205
acc agc gcg acc gcg ggt gtg cgt ggt gcg gtg ggc ctg ctg aaa cgt      672
Thr Ser Ala Thr Ala Gly Val Arg Gly Ala Val Gly Leu Leu Lys Arg
    210                 215                 220
agc gcg gaa acc gcg gaa cat gcg acc agc aaa ttt ctg acc ggc cgt      720
Ser Ala Glu Thr Ala Glu His Ala Thr Ser Lys Phe Leu Thr Gly Arg
225                 230                 235                 240
gcg ctc gag cac cac cac cac cac cac                                  747
Ala Leu Glu His His His His His His
                245
 
<210>4
<211>249
<212>PRT
<213>中生根瘤菌
 
<400>4
Met Ser Ala Glu Asp Pro Val Ile Gly Leu Ile Val Pro Pro Ala Ala
1               5                   10                  15
Gly Leu Val Pro Pro Glu Ala Val Ala Met Tyr Pro Glu Val Thr Phe
            20                  25                  30
His Ala Ser Gly Leu Gly Leu Lys Glu Met Thr Pro Cys Gly Tyr Ala
        35                  40                  45
Gly Val Ile Asp Leu Val Gly Asp His Ala Glu Arg His Ala Gln Ala
    50                  55                  60
Gly Ala Gln Ala Val Ala Leu Met Gly Thr Ser Leu Ser Phe Phe Arg
65                  70                  75                  80
Gly Ala Ala Phe Asn Ala Glu Leu Ile Thr His Met Ser Asn Arg Ser
                85                  90                  95
Gly Leu Pro Ala Thr Thr Met Ser Gln Ala Val Val Asp Glu Leu Lys
            100                 105                 110
Ser His Gly Ala Arg Arg Ile Ala Val Val Thr Ala Tyr Arg Gln Asp
        115                 120                 125
Val Asn Asn Leu Leu Ala Ala Phe Leu Asn Glu His Gly Ile Glu Ala
    130                 135                 140
Arg Ser Leu Lys Ser Leu Gly Ile Thr Ser Val Ala Asp Val Ala Gly
145                 150                 155                 160
Thr Pro Ala Lys Arg Leu Leu Gln Leu Cys Lys Glu Ala Val His Asp
                165                 170                 175
Ala Gly Pro Val Asp Ala Val Leu Ile Ser Cys Gly Gly Leu His Thr
            180                 185                 190
Leu Asp Val Ile Val Asp Val Glu Ile Ser Thr Gly Leu Pro Val Val
        195                 200                 205
Thr Ser Ala Thr Ala Gly Val Arg Gly Ala Val Gly Leu Leu Lys Arg
    210                 215                 220
Ser Ala Glu Thr Ala Glu His Ala Thr Ser Lys Phe Leu Thr Gly Arg
225                 230                 235                 240
Ala Leu Glu His His His His His His
                245
 
<210>5
<211>738
<212>DNA
<213>掘越氏热球菌
 
<220>
<221>CDS
<222>(1)..(738)
 
<400>5
atg tat ggc tgg cgt cgt cgt att ggc ctg att gtg ccg agc agc aac       48
Met Tyr Gly Trp Arg Arg Arg Ile Gly Leu Ile Val Pro Ser Ser Asn
1               5                   10                  15
acc acc atg gaa ccg gaa ttt tgg aaa atg gcg ccg gaa ggc gtg agc       96
Thr Thr Met Glu Pro Glu Phe Trp Lys Met Ala Pro Glu Gly Val Ser
            20                  25                  30
att cat acc gcg cgt atg cgt ctg cgt gaa gtg acc gaa gaa agc ctg      144
Ile His Thr Ala Arg Met Arg Leu Arg Glu Val Thr Glu Glu Ser Leu
        35                  40                  45
ctg gaa atg gaa cgt cat gcg aaa gat gcg gcg ctg gaa ctg gcc gat      192
Leu Glu Met Glu Arg His Ala Lys Asp Ala Ala Leu Glu Leu Ala Asp
    50                  55                  60
gcg gaa gtg gat gtg att gtg tat ggc tgc acc agc ggc agc ctg att      240
Ala Glu Val Asp Val Ile Val Tyr Gly Cys Thr Ser Gly Ser Leu Ile
65                  70                  75                  80
aaa ggc aaa ggc tat gat aaa gaa atc gcg aaa aac ctg gaa gaa gcg      288
Lys Gly Lys Gly Tyr Asp Lys Glu Ile Ala Lys Asn Leu Glu Glu Ala
                85                  90                  95
agc ggc att aaa acc att acc acc tct acc gcg gtt ctg aac gcg ctg      336
Ser Gly Ile Lys Thr Ile Thr Thr Ser Thr Ala Val Leu Asn Ala Leu
            100                 105                 110
aac acc ctg gat att cag aaa gtg gtg gtg gcg acc ccg tat att gat      384
Asn Thr Leu Asp Ile Gln Lys Val Val Val Ala Thr Pro Tyr Ile Asp
        115                 120                 125
agc gtg aac gaa cgc gaa aaa gaa ttt ctg gaa gcg aac ggc att gaa      432
Ser Val Asn Glu Arg Glu Lys Glu Phe Leu Glu Ala Asn Gly Ile Glu
    130                 135                 140
gtg ctg cgt att aaa ggc ctg ggc att gtg aaa aac acc gaa att ggc      480
Val Leu Arg Ile Lys Gly Leu Gly Ile Val Lys Asn Thr Glu Ile Gly
145                 150                 155                 160
cgt cag gaa ccg tgg gtt gcg tat aaa ctg gcc ctg gaa gtg tat acc      528
Arg Gln Glu Pro Trp Val Ala Tyr Lys Leu Ala Leu Glu Val Tyr Thr
                165                 170                 175
ccg gaa gcg gat ggc ctg ttt att agc tgc acc aac ttt cgc acc att      576
Pro Glu Ala Asp Gly Leu Phe Ile Ser Cys Thr Asn Phe Arg Thr Ile
            180                 185                 190
gaa atc atc gat aaa ctg gaa gtg gaa ctg ggc gtg ccg gtg gtg acc      624
Glu Ile Ile Asp Lys Leu Glu Val Glu Leu Gly Val Pro Val Val Thr
        195                 200                 205
agc aac cag gcg acc atg tgg tat gcg ctg aaa acc atg aaa gtg aaa      672
Ser Asn Gln Ala Thr Met Trp Tyr Ala Leu Lys Thr Met Lys Val Lys
    210                 215                 220
gaa aaa tat gat atg tac ggc acc ctg ctg aaa gaa aaa ctg ctc gag      720
Glu Lys Tyr Asp Met Tyr Gly Thr Leu Leu Lys Glu Lys Leu Leu Glu
225                 230                 235                 240
cac cac cac cac cac cac                                              738
His His His His His His
                245
 
<210>6
<211>246
<212>PRT
<213>掘越氏热球菌
 
<400>6
Met Tyr Gly Trp Arg Arg Arg Ile Gly Leu Ile Val Pro Ser Ser Asn
1               5                   10                  15
Thr Thr Met Glu Pro Glu Phe Trp Lys Met Ala Pro Glu Gly Val Ser
            20                  25                  30
Ile His Thr Ala Arg Met Arg Leu Arg Glu Val Thr Glu Glu Ser Leu
        35                  40                  45
Leu Glu Met Glu Arg His Ala Lys Asp Ala Ala Leu Glu Leu Ala Asp
    50                  55                  60
Ala Glu Val Asp Val Ile Val Tyr Gly Cys Thr Ser Gly Ser Leu Ile
65                  70                  75                  80
Lys Gly Lys Gly Tyr Asp Lys Glu Ile Ala Lys Asn Leu Glu Glu Ala
                85                  90                  95
Ser Gly Ile Lys Thr Ile Thr Thr Ser Thr Ala Val Leu Asn Ala Leu
            100                 105                 110
Asn Thr Leu Asp Ile Gln Lys Val Val Val Ala Thr Pro Tyr Ile Asp
        115                 120                 125
Ser Val Asn Glu Arg Glu Lys Glu Phe Leu Glu Ala Asn Gly Ile Glu
    130                 135                 140
Val Leu Arg Ile Lys Gly Leu Gly Ile Val Lys Asn Thr Glu Ile Gly
145                 150                 155                 160
Arg Gln Glu Pro Trp Val Ala Tyr Lys Leu Ala Leu Glu Val Tyr Thr
                165                 170                 175
Pro Glu Ala Asp Gly Leu Phe Ile Ser Cys Thr Asn Phe Arg Thr Ile
            180                 185                 190
Glu Ile Ile Asp Lys Leu Glu Val Glu Leu Gly Val Pro Val Val Thr
        195                 200                 205
Ser Asn Gln Ala Thr Met Trp Tyr Ala Leu Lys Thr Met Lys Val Lys
    210                 215                 220
Glu Lys Tyr Asp Met Tyr Gly Thr Leu Leu Lys Glu Lys Leu Leu Glu
225                 230                 235                 240
His His His His His His
                245
 
<210>7
<211>819
<212>DNA
<213>支气管炎博德特氏菌
 
<220>
<221>CDS
<222>(1)..(819)
 
<400>7
atg ccg acc ccg acc cag atg aaa acc acc gcg cgt tat cgt ccg tat       48
Met Pro Thr Pro Thr Gln Met Lys Thr Thr Ala Arg Tyr Arg Pro Tyr
1               5                   10                  15
gcg tgg cgt gcg aaa gtg ggc ctg att gtg ccg agc acc aac acc att       96
Ala Trp Arg Ala Lys Val Gly Leu Ile Val Pro Ser Thr Asn Thr Ile
            20                  25                  30
aac gaa ccg gaa ttc tat cgt ctg gcc ccg gat ggc gtg acc att cat      144
Asn Glu Pro Glu Phe Tyr Arg Leu Ala Pro Asp Gly Val Thr Ile His
        35                  40                  45
acc ggc cgt gcg att aat gcg ggt ccg gcg acc caa gaa aac tat gat      192
Thr Gly Arg Ala Ile Asn Ala Gly Pro Ala Thr Gln Glu Asn Tyr Asp
    50                  55                  60
cgt atg gcg cgt ggc gtt ctg gaa gcg gcg gat ctg att aaa acc gcg      240
Arg Met Ala Arg Gly Val Leu Glu Ala Ala Asp Leu Ile Lys Thr Ala
65                  70                  75                  80
gaa gtg gat gtg gtg gcg tat ggc tgc acc agc ggc agc att gtg tgc      288
Glu Val Asp Val Val Ala Tyr Gly Cys Thr Ser Gly Ser Ile Val Cys
                85                  90                  95
agc ctg gat gaa ctg tgc gat ggc atg agc gaa cgt gtg ggc gtt ccg      336
Ser Leu Asp Glu Leu Cys Asp Gly Met Ser Glu Arg Val Gly Val Pro
            100                 105                 110
gcg att gcg acc gcg ggt gcg gtt gtt gcg gcg ctg cgt gcg ctg ggt      384
Ala Ile Ala Thr Ala Gly Ala Val Val Ala Ala Leu Arg Ala Leu Gly
        115                 120                 125
gtt cgt cgt gtg gcg gtg ggc acc ccg tat att gat ttt gtg aac cag      432
Val Arg Arg Val Ala Val Gly Thr Pro Tyr Ile Asp Phe Val Asn Gln
    130                 135                 140
cgt gaa cgt gaa ttt ctg gaa cag tat ggc ttt gaa gtg gtg agc att      480
Arg Glu Arg Glu Phe Leu Glu Gln Tyr Gly Phe Glu Val Val Ser Ile
145                 150                 155                 160
gaa ggc atg gat ctg ggc cat acg cag gaa gaa cgt cgc gat att ggc      528
Glu Gly Met Asp Leu Gly His Thr Gln Glu Glu Arg Arg Asp Ile Gly
                165                 170                 175
cgt gtg ccg ccg cag agc acc ttt cag ctg gcc cgt gat att gat cgt      576
Arg Val Pro Pro Gln Ser Thr Phe Gln Leu Ala Arg Asp Ile Asp Arg
            180                 185                 190
ccg cag gcg gaa gcg att ttt ctg agc tgc acc aac ctg gcc acc ctg      624
Pro Gln Ala Glu Ala Ile Phe Leu Ser Cys Thr Asn Leu Ala Thr Leu
        195                 200                 205
gat atg att gaa cgc atc gaa aac gaa ctg ggc aaa ccg gtg gtg acc      672
Asp Met Ile Glu Arg Ile Glu Asn Glu Leu Gly Lys Pro Val Val Thr
    210                 215                 220
agc aac cag gcg acc ttt tgg gcg tgc ctg cgt ctg ctg ggt ctg agc      720
Ser Asn Gln Ala Thr Phe Trp Ala Cys Leu Arg Leu Leu Gly Leu Ser
225                 230                 235                 240
tgc gcg att ccg ggc tat ggc cgt ctg ctg acc gat tgc ctg gcc ccg      768
Cys Ala Ile Pro Gly Tyr Gly Arg Leu Leu Thr Asp Cys Leu Ala Pro
                245                 250                 255
att acc cgt gcg agc tat gcg ctg gcc ctc gag cac cac cac cac cac      816
Ile Thr Arg Ala Ser Tyr Ala Leu Ala Leu Glu His His His His His
            260                 265                 270
cac                                                                  819
His
 
<210>8
<211>273
<212>PRT
<213>支气管炎博德特氏菌
 
<400>8
Met Pro Thr Pro Thr Gln Met Lys Thr Thr Ala Arg Tyr Arg Pro Tyr
1               5                   10                  15
Ala Trp Arg Ala Lys Val Gly Leu Ile Val Pro Ser Thr Asn Thr Ile
            20                  25                  30
Asn Glu Pro Glu Phe Tyr Arg Leu Ala Pro Asp Gly ValThr Ile His
        35                  40                  45
Thr Gly Arg Ala Ile Asn Ala Gly Pro Ala Thr Gln Glu Asn Tyr Asp
    50                  55                  60
Arg Met Ala Arg Gly Val Leu Glu Ala Ala Asp Leu Ile Lys Thr Ala
65                  70                  75                  80
Glu Val Asp Val Val Ala Tyr Gly Cys Thr Ser Gly Ser Ile Val Cys
                85                  90                  95
Ser Leu Asp Glu Leu Cys Asp Gly Met Ser Glu Arg Val Gly Val Pro
            100                 105                 110
Ala Ile Ala Thr Ala Gly Ala Val Val Ala Ala Leu Arg Ala Leu Gly
        115                 120                 125
Val Arg Arg Val Ala Val Gly Thr Pro Tyr Ile Asp Phe Val Asn Gln
    130                 135                 140
Arg Glu Arg Glu Phe Leu Glu Gln Tyr Gly Phe Glu Val Val Ser Ile
145                 150                 155                 160
Glu Gly Met Asp Leu Gly His Thr Gln Glu Glu Arg Arg Asp Ile Gly
                165                 170                 175
Arg Val Pro Pro Gln Ser Thr Phe Gln Leu Ala Arg Asp Ile Asp Arg
            180                 185                 190
Pro Gln Ala Glu Ala Ile Phe Leu Ser Cys Thr Asn Leu Ala Thr Leu
        195                 200                 205
Asp Met Ile Glu Arg Ile Glu Asn Glu Leu Gly Lys Pro Val Val Thr
    210                 215                 220
Ser Asn Gln Ala Thr Phe Trp Ala Cys Leu Arg Leu Leu Gly Leu Ser
225                 230                 235                 240
Cys Ala Ile Pro Gly Tyr Gly Arg Leu Leu Thr Asp Cys Leu Ala Pro
                245                 250                 255
Ile Thr Arg Ala Ser Tyr Ala Leu Ala Leu Glu His His His His His
            260                 265                 270
His
<210>9
<211>756
<212>DNA
<213>Alkaliphilus metalliredigenes
 
<220>
<221>CDS
<222>(1)..(756)
 
<400>9
atg agc gat ttt agc tat ggc ggc cgt gcg aaa att ggc ctg att tat       48
Met Ser Asp Phe Ser Tyr Gly Gly Arg Ala Lys Ile Gly Leu Ile Tyr
1               5                   10                  15
ccg gca ccg ggc tgg gtt atg gaa ccg gaa ttc tat ctg atg gcg ccg       96
Pro Ala Pro Gly Trp Val Met Glu Pro Glu Phe Tyr Leu Met Ala Pro
            20                  25                  30
tgg ggc gtg agc acc tat acc acc cgt att agc ctg aaa cat gtg aac      144
Trp Gly Val Ser Thr Tyr Thr Thr Arg Ile Ser Leu Lys His Val Asn
        35                  40                  45
gtg gcg gaa ctg cgt aaa ctg ggc gat cag agc gtg gaa gcg gcg gaa      192
Val Ala Glu Leu Arg Lys Leu Gly Asp Gln Ser Val Glu Ala Ala Glu
    50                  55                  60
ctg ctg gcc cag gcg ccg ctg gat gtg att gcg ctg ggc tgc acc agc      240
Leu Leu Ala Gln Ala Pro Leu Asp Val Ile Ala Leu Gly Cys Thr Ser
65                  70                  75                  80
ggc agc ttc gtg aac ggc agc cgt tat gat caa gaa ctg atc gaa aaa      288
Gly Ser Phe Val Asn Gly Ser Arg Tyr Asp Gln Glu Leu Ile Glu Lys
                85                  90                  95
atg gaa ggc gtg agc ggc ggt att ccg tgc acc acc acc tct acc gcg      336
Met Glu Gly Val Ser Gly Gly Ile Pro Cys Thr Thr Thr Ser Thr Ala
            100                 105                 110
gtt gtg gcg gcg ctg aaa gcg ctg cat gtg acc aaa att gcg gtg gcg      384
Val Val Ala Ala Leu Lys Ala Leu His Val Thr Lys Ile Ala Val Ala
        115                 120                 125
acc ccg tat atc gat gaa gtg aac ctg aaa gcg aaa aac ttt ctg gaa      432
Thr Pro Tyr Ile Asp Glu Val Asn Leu Lys Ala Lys Asn Phe Leu Glu
    130                 135                 140
gcg gaa ggc ctg gat gtg gtg aac att aaa ggc ctg ggc ctg ctg cag      480
Ala Glu Gly Leu Asp Val Val Asn Ile Lys Gly Leu Gly Leu Leu Gln
145                 150                 155                 160
gat att gaa att gat cgc cag gat atg gaa acc gtg tat cgt ctg gcc      528
Asp Ile Glu Ile Asp Arg Gln Asp Met Glu Thr Val Tyr Arg Leu Ala
                165                 170                 175
aaa gaa gtg gat cac gtt gaa gcg cag gcg att gtg att ctg tgc acc      576
Lys Glu Val Asp His Val Glu Ala Gln Ala Ile Val Ile Leu Cys Thr
            180                 185                 190
ggc ctg cgt agc gtg ccg att att gaa gcg ctg gaa aac gat ctg ggc      624
Gly Leu Arg Ser Val Pro Ile Ile Glu Ala Leu Glu Asn Asp Leu Gly
        195                 200                 205
aaa ccg gtg att agc gcg att cag gcg acc ttt tgg cat tgc ctg cgt      672
Lys Pro Val Ile Ser Ala Ile Gln Ala Thr Phe Trp His Cys Leu Arg
    210                 215                 220
ctg agc ggc gtg cgt gaa aac gtg gaa ggc tat ggc agc ctg ctg cgt      720
Leu Ser Gly Val Arg Glu Asn Val Glu Gly Tyr Gly Ser Leu Leu Arg
225                 230                 235                 240
att gaa ggc ctg ctc gag cac cac cac cac cac cac                       756
Ile Glu Gly Leu Leu Glu His His His His His His
                245                 250
 
<210>10
<211>252
<212>PRT
<213>Alkaliphilus metalliredigenes
 
<400>10
Met Ser Asp Phe Ser Tyr Gly Gly Arg Ala Lys Ile Gly Leu Ile Tyr
1               5                   10                  15
Pro Ala Pro Gly Trp Val Met Glu Pro Glu Phe Tyr Leu Met Ala Pro
            20                  25                  30
Trp Gly Val Ser Thr Tyr Thr Thr Arg Ile Ser Leu Lys His Val Asn
        35                  40                  45
Val Ala Glu Leu Arg Lys Leu Gly Asp Gln Ser Val Glu Ala Ala Glu
    50                  55                  60
Leu Leu Ala Gln Ala Pro Leu Asp Val Ile Ala Leu Gly Cys Thr Ser
65                  70                  75                  80
Gly Ser Phe Val Asn Gly Ser Arg Tyr Asp Gln Glu Leu Ile Glu Lys
                85                  90                  95
Met Glu Gly Val Ser Gly Gly Ile Pro Cys Thr Thr Thr Ser Thr Ala
            100                 105                 110
Val Val Ala Ala Leu Lys Ala Leu His Val Thr Lys Ile Ala Val Ala
        115                 120                 125
Thr Pro Tyr Ile Asp Glu Val Asn Leu Lys Ala Lys Asn Phe Leu Glu
    130                 135                 140
Ala Glu Gly Leu Asp Val Val Asn Ile Lys Gly Leu Gly Leu Leu Gln
145                 150                 155                 160
Asp Ile Glu Ile Asp Arg Gln Asp Met Glu Thr Val Tyr Arg Leu Ala
                165                 170                 175
Lys Glu Val Asp His Val Glu Ala Gln Ala Ile Val Ile Leu Cys Thr
            180                 185                 190
Gly Leu Arg Ser Val Pro Ile Ile Glu Ala Leu Glu Asn Asp Leu Gly
        195                 200                 205
Lys Pro Val Ile Ser Ala Ile Gln Ala Thr Phe Trp His Cys Leu Arg
    210                 215                 220
Leu Ser Gly Val Arg Glu Asn Val Glu Gly Tyr Gly Ser Leu Leu Arg
225                 230                 235                 240
Ile Glu Gly Leu Leu Glu His His His His His His
                245                 250
 
<210>11
<211>786
<212>DNA
<213>嗜火产水菌
 
<220>
<221>CDS
<222>(1)..(786)
 
<400>11
atg aaa atc ggc att ttt gat agc ggc gtg ggc ggt ctg acc gtg ctg      48
Met Lys Ile Gly Ile Phe Asp Ser Gly Val Gly Gly Leu Thr Val Leu
1               5                   10                  15
aaa gcg att cgt aac cgt tat cgc aaa gtg gat att gtg tat ctg ggc       96
Lys Ala Ile Arg Asn Arg Tyr Arg Lys Val Asp Ile Val Tyr Leu Gly
            20                  25                  30
gat acc gcg cgt gtg ccg tat ggc att cgt agc aaa gat acc att atc      144
Asp Thr Ala Arg Val Pro Tyr Gly Ile Arg Ser Lys Asp Thr Ile Ile
        35                  40                  45
cgc tat agc ctg gaa tgc gcg ggc ttt ctg aaa gat aaa ggc gtg gat      192
Arg Tyr Ser Leu Glu Cys Ala Gly Phe Leu Lys Asp Lys Gly Val Asp
    50                  55                  60
att att gtg gtg gcg tgt aac acc gcg agc gcg tat gcg ctg gaa cgt      240
Ile Ile Val Val Ala Cys Asn Thr Ala Ser Ala Tyr Ala Leu Glu Arg
65                  70                  75                  80
ctg aaa aaa gag atc aac gtt ccg gtt ttt ggc gtg att gaa ccg ggc      288
Leu Lys Lys Glu Ile Asn Val Pro Val Phe Gly Val Ile Glu Pro Gly
                85                  90                  95
gtg aaa gaa gcg ctg aaa aaa agc cgc aac aaa aaa att ggt gtg att      336
Val Lys Glu Ala Leu Lys Lys Ser Arg Asn Lys Lys Ile Gly Val Ile
            100                 105                 110
ggc acc ccg gcg acc gtt aaa agc ggc gcg tat cag cgt aaa ctg gaa      384
Gly Thr Pro Ala Thr Val Lys Ser Gly Ala Tyr Gln Arg Lys Leu Glu
        115                 120                 125
gaa ggc ggt gcg gat gtt ttt gcg aaa gcg tgc ccg ctg ttt gtg ccg      432
Glu Gly Gly Ala Asp Val Phe Ala Lys Ala Cys Pro Leu Phe Val Pro
    130                 135                 140
ctg gcc gaa gaa ggc ctg ctg gaa ggc gaa att acc cgt aaa gtg gtg      480
Leu Ala Glu Glu Gly Leu Leu Glu Gly Glu Ile Thr Arg Lys Val Val
145                 150                 155                 160
gaa cac tat ctg aaa gaa ttc aaa ggc aaa atc gat acc ctg att ctg      528
Glu His Tyr Leu Lys Glu Phe Lys Gly Lys Ile Asp Thr Leu Ile Leu
                165                 170                 175
ggc tgc acg cac tat ccg ctg ctg aaa aaa gaa atc aaa aaa ttc ctg      576
Gly Cys Thr His Tyr Pro Leu Leu Lys Lys Glu Ile Lys Lys Phe Leu
            180                 185                 190
ggc gat gtg gaa gtg gtg gat agc agc gaa gcc ctg agc ctg agc ctg      624
Gly Asp Val Glu Val Val Asp Ser Ser Glu Ala Leu Ser Leu Ser Leu
        195                 200                 205
cat aac ttc att aaa gat gat ggc agc agc agc ctg gaa ctg ttt ttt      672
His Asn Phe Ile Lys Asp Asp Gly Ser Ser Ser Leu Glu Leu Phe Phe
    210                 215                 220
acc gat ctg agc ccg aac ctg cag ttt ctg att aaa ctg att ctg ggt      720
Thr Asp Leu Ser Pro Asn Leu Gln Phe Leu Ile Lys Leu Ile Leu Gly
225                 230                 235                 240
cgt gat tat ccg gtg aaa ctg gcc gaa ggc gtg ttt acc cat ctc gag      768
Arg Asp Tyr Pro Val Lys Leu Ala Glu Gly Val Phe Thr His Leu Glu
                245                 250                 255
cac cac cac cac cac cac                                                 786
His His His His His His
            260
 
<210>12
<211>262
<212>PRT
<213>嗜火产水菌
 
<400>12
Met Lys Ile Gly Ile Phe Asp Ser Gly Val Gly Gly Leu Thr Val Leu
1               5                   10                  15
Lys Ala Ile Arg Asn Arg Tyr Arg Lys Val Asp Ile Val Tyr Leu Gly
            20                  25                  30
Asp Thr Ala Arg Val Pro Tyr Gly Ile Arg Ser Lys Asp Thr Ile Ile
        35                  40                  45
Arg Tyr Ser Leu Glu Cys Ala Gly Phe Leu Lys Asp Lys Gly Val Asp
    50                  55                  60
Ile Ile Val Val Ala Cys Asn Thr Ala Ser Ala Tyr Ala Leu Glu Arg
65                  70                  75                  80
Leu Lys Lys Glu Ile Asn Val Pro Val Phe Gly Val Ile Glu Pro Gly
                85                  90                  95
Val Lys Glu Ala Leu Lys Lys Ser Arg Asn Lys Lys Ile Gly Val Ile
            100                 105                 110
Gly Thr Pro Ala Thr Val Lys Ser Gly Ala Tyr Gln Arg Lys Leu Glu
        115                 120                 125
Glu Gly Gly Ala Asp Val Phe Ala Lys Ala Cys Pro Leu Phe Val Pro
    130                 135                 140
Leu Ala Glu Glu Gly Leu Leu Glu Gly Glu Ile Thr Arg Lys Val Val
145                 150                 155                 160
Glu His Tyr Leu Lys Glu Phe Lys Gly Lys Ile Asp Thr Leu Ile Leu
                165                 170                 175
Gly Cys Thr His Tyr Pro Leu Leu Lys Lys Glu Ile Lys Lys Phe Leu
            180                 185                 190
Gly Asp Val Glu Val Val Asp Ser Ser Glu Ala Leu Ser Leu Ser Leu
        195                 200                 205
His Asn Phe Ile Lys Asp Asp Gly Ser Ser Ser Leu Glu Leu Phe Phe
    210                 215                 220
Thr Asp Leu Ser Pro Asn Leu Gln Phe Leu Ile Lys Leu Ile Leu Gly
225                 230                 235                 240
Arg Asp Tyr Pro Val Lys Leu Ala Glu Gly Val Phe Thr His Leu Glu
                245                 250                 255
His His His His His His
            260
 
<210>13
<211>4
<212>PRT
<213>人工的
<220>
<223>CS序列模式
 
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>Xaa是Ser或Leu
 
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>Xaa是Gly或Thr
 
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>Xaa是Gyl或Asn
 
<400>13
Xaa Cys Xaa Xaa
1
 
<210>14
<211>5
<212>PRT
<213>人工的
 
<220>
<223>OAH1序列模式
 
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>Xaa是Met或Gly
 
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>Xaa是Cys或Gly
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>Xaa是Leu或Gly
 
<400>14
Xaa Xaa Thr Ser Xaa
1               5
 
<210>15
<211>5
<212>PRT
<213>人工的
 
<220>
<223>OAH2序列模式
 
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>Thr任选缺失
 
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>Xaa是Ala或Pro
 
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>Xaa是Ile或Arg
 
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>Xaa是Asp或Gln或缺失
 
<400>15
Thr Xaa Tyr Xaa Xaa
1               5
<210>16
<211>6
<212>PRT
<213>人工的
 
<220>
<223>LBP序列模式
 
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>Xaa是Phe,Ser或Ala
 
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>Xaa是Phe,Ser,Thr或Ala
 
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>Xaa是Ala,Asn或Gly
 
<400>16
Ile Val Pro Xaa Xaa Xaa
1               5
 
<210>17
<211>27
<212>DNA
<213>人工的
 
<220>
<223>正向引物
 
<400>17
gagcggcctg ggcgcgggta gcgttac                                         27
 
<210>18
<211>27
<212>DNA
<213>人工的
 
<220>
<223>反向引物
 
<400>18
gtaacgctac ccgcgcccag gccgctc                                            27
 
<210>19
<211>25
<212>DNA
<213>人工的
 
<220>
<223>正向引物
 
<400>19
cctgggtagc gcaaccccgg aaggc                                              25
 
<210>20
<211>25
<212>DNA
<213>人工的
 
<220>
<223>反向引物
 
<400>20
gccttccggg gttgcgctac ccagg                                              25
 
<210>21
<211>25
<212>DNA
<213>人工的
 
<220>
<223>正向引物
 
<400>21
gcattaccgg cgcggaagcg atggc                                               25
 
<210>22
<211>25
<212>DNA
<213>人工的
 
<220>
<223>反向引物
 
<400>22
gccatcgctt ccgcgccggt aatgc                                               25
 
<210>23
<211>32
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>23
cattggcatg attgtggcgc cggcagcggg tc                                       32
 
<210>24
<211>32
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>24
gacccgctgc cggcgccaca atcatgccaa tg                                       32
 
<210>25
<211>34
<212>DNA
<213>人工的
<220>
<223>PCR引物
 
<400>25
cattggcatg attgtgggtc cggcagcggg tctg                                   34
 
<210>26
<211>34
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>26
cagacccgct gccggaccca caatcatgcc aatg                                   34
 
<210>27
<211>27
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>27
ctgctgtctt gcgcgggtct gctgacc                                           27
 
<210>28
<211>27
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>28
ggtcagcaga cccgcgcaag acagcag                                           27
 
<210>29
<211>34
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>29
ctgctgtctt gcggcgcgct gctgaccctg gatg                                  34
 
<210>30
<211>34
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>30
catccagggt cagcagcgcg ccgcaagaca gcag                                  34
 
<210>31
<211>38
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>31
cattctgctg tcttgcgcgg cgctgctgac cctggatg                              38
 
<210>32
<211>38
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<400>32
catccagggt cagcagcgcc gcgcaagaca gcagaatg                              38
 
<210>33
<211>45
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<220>
<221>misc_feature
<222>(21)..(21)
<223>n是a,c,g,或t
 
<220>
<221>misc_feature
<222>(24)..(24)
<223>n是a,c,g,或t
 
<400>33
ccccgaccat tggcatgatt ndtndtccgg cagcgggtct ggttc                       45
 
<210>34
<211>45
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<220>
<221>misc_feature
<222>(22)..(22)
<223>n是a,c,g,或t
 
<220>
<221>misc_feature
<222>(25)..(25)
<223>n是a,c,g,或t
<400>34
gaaccagacc cgctgccgga hnahnaatca tgccaatggt cgggg                      45
 
<210>35
<211>45
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<220>
<221>misc_feature
<222>(21)..(21)
<223>n是a,c,g,或t
 
<220>
<221>misc_feature
<222>(24)..(24)
<223>n是a,c,g,或t
 
<400>35
cgaccattgg catgattgtg ndtndtgcag cgggtctggt tccgg                      45
 
<210>36
<211>45
<212>DNA
<213>人工的
 
<220>
<223>PCR引物
 
<220>
<221>misc_feature
<222>(22)..(22)
<223>n是a,c,g,或t
 
<220>
<221>misc_feature
<222>(25)..(25)
<223>n是a,c,g,或t
 
<400>36
ccggaaccag acccgctgca hnahncacaa tcatgccaat  ggtcg                       45

Claims (32)

1.生物催化脱羧式I化合物
HOOC-C(R1)(R2)-COOH  (I)
或其盐形式的方法,其中
残基R1代表直链或分支的、单不饱和或多不饱和的低级烯基,所述低级烯基任选地携带一个或多个环状取代基;或残基R1代表单环或二环状、任选取代的饱和或者单不饱和或多不饱和的环,并且
残基R2代表H、OH、SH、NH2、低级烷氧基、低级烷硫基、低级烷基、低级烯基、低级炔基或羟基低级烷基,
该方法包括
a)将至少一种式(I)化合物与以下蛋白质接触:
(i)具有脱羧酶活性并包含与SEQ ID NO:2的支气管炎博德特氏菌蛋白质(残基1至240)具有100%或更少的序列同一性的氨基酸序列的蛋白质,或
(ii)具有脱羧酶活性并包含与SEQ ID NO:12的嗜火产水菌蛋白质(残基1至254)具有100%或更少的序列同一性的氨基酸序列的蛋白质;
b)和任选地分离式I化合物的至少一种脱羧产物。
2.权利要求1的方法,其中具有脱羧酶活性并显示与SEQ ID NO:2的支气管炎博德特氏菌蛋白质的100%或更少氨基酸序列同一性的蛋白质具有底物口袋,所述的口袋具有携带式I底物分子的能力并包含处于功能性排列中的以下结构元件:
a)含有半胱氨酸的催化部位,所述催化部位的半胱氨酸残基能够与底物相互作用,尤其通过转移质子至脱羧底物的烯醇化物中间体与底物相互作用,
b)氧-阴离子孔,其包含与底物的不会切除的羧基相互作用的多个极性氨基酸侧链。
3.权利要求2的方法,其中所述酶具有包含以下结构元件的底物口袋:
a)含有半胱氨酸的催化部位“CSS”,所述“CSS”由显示以下序列模式的序列区域形成:
“CSS”(S/L)C(G/T)(G/N)  (SEQIDNO:13)
b)氧-阴离子孔,其由显示以下两种序列模式的两个序列区域的氨基酸残基形成:
“OAH1S”(M/G)(G/C)TS(L/G)  (SEQ ID NO:14)
“OAH2S”T(A/P)Y(I/R)(D/Q)  (SEQ ID NO:15)
或者具有突变的底物口袋,该底物口袋仍具有携带至少一种式I底物的能力。
4.权利要求3的方法,其中所述的结构元件按照以下依次(N->C)顺序排列于氨基酸链中:
OAH1S-OAH2S-CSS
并且其中所述的结构元件借助彼此独立地包含一个或多个氨基酸残基的多个氨基酸序列连接在一起。
5.前述权利要求之一项的方法,其中具有脱羧酶活性的蛋白质选自由以下蛋白质组成的组:
a)包含SEQ ID NO:4的氨基酸残基2至241并源自中生根瘤菌BNCI的蛋白质;
b)包含SEQ ID NO:6的氨基酸残基2至240并源自掘越氏热球菌的蛋白质;
c)包含SEQ ID NO:8的氨基酸残基2至267并源自支气管炎博德特氏菌的蛋白质;
d)包含SEQ ID NO:10的氨基酸残基2至246并源自Aklaliphilusmetalliredigenes QYMF的蛋白质,和
e)具有芳基丙二酸或丙二酸脱羧酶活性并与a)、b)、c)或d)的序列之一具有少于100%序列同一性的蛋白质。
6.前述权利要求之一项的方法,其中所述脱羧反应是立体选择性一元脱羧作用。
7.权利要求6的方法,其中获得式II
HC(R1)(R2)-COOH  (II)
的光学纯化合物或其盐形式,其中残基R1和R2如权利要求1中定义。
8.前述权利要求之一项的方法,其中脱羧反应以分离或纯化(任选地固定化)形式的所述脱羧酶进行或通过在式I化合物存在下培养表达所述脱羧酶酶活性的微生物进行。
9.前述权利要求之一项的方法,其中将式I化合物或其盐形式脱羧,其中残基R1代表直链或分支的单不饱和低级烯基,所述低级烯基任选地被单环或二环状、任选取代的环取代,并且残基R2是低级烷基。
10.权利要求9的方法,其中R1代表直链C1-C6-烯-1-基,所述的直链C1-C6-烯-1-基任选地被单环或二环状、任选取代的环取代,并且残基R2是C1-C6-烷基。
11.权利要求10的方法,其中R1代表乙烯基、丙烯-1-基、丁烯-1-基。
12.权利要求9至11之一项的方法,其中所述具有脱羧酶活性的蛋白质选自如本文中以上所定义的源自中生根瘤菌BNCI的蛋白质和源自支气管炎博德特氏菌的蛋白质组成的组。
13.蛋白质,具有脱羧酶活性并与SEQ ID NO:2的支气管炎博德特氏菌蛋白质具有少于99%的序列同一性。
14.具有脱羧酶活性的蛋白质,其选自:
a)包含SEQ ID NO:4的氨基酸残基2至241并源自中生根瘤菌BNCI的蛋白质;
b)包含SEQ ID NO:6的氨基酸残基2至240并源自掘越氏热球菌OT3的蛋白质;
c)包含SEQ ID NO:8的氨基酸残基2至267并源自支气管炎博德特氏菌RB50的蛋白质;
d)包含SEQ ID NO:10的氨基酸残基2至246并源自Aklaliphilusmetalliredigenes QYMF的蛋白质,和
e)包含SEQ ID NO:12的氨基酸残基2至256并源自嗜火产水菌的蛋白质。
15.如权利要求13或14中定义的具有脱羧酶活性的蛋白质的突变体,所述突变体与对应的亲本蛋白具有少于100%的序列同一性。
16.权利要求15的突变体,其仍包含如权利要求2至4之一项中定义的结构元件。
17.核酸,其编码权利要求13至16任一项的具有脱羧酶活性的蛋白质。
18.表达盒,其包含与至少一个调节性核酸序列有效连接的权利要求17的核酸。
19.重组表达载体,其包含至少一个权利要求18的表达盒或权利要求17的核酸。
20.重组微生物,其携带至少一个权利要求19的表达载体。
21.生物反应器,其包含至少一种如权利要求13至16之一项中所定义的具有脱羧酶活性的蛋白质或权利要求20的重组微生物,所述蛋白质或重组微生物任选地处于固定化形式。
22.制备具有脱羧酶活性的酶的方法,所述方法包括培养如权利要求20中所定义的重组微生物并任选地从培养物分离具有脱羧酶活性的所述酶。
23.具有脱羧酶活性的蛋白质的晶形。
24.权利要求23的晶形,其中具有脱羧酶活性的蛋白质如权利要求13至16之一项中定义。
25.权利要求24的晶形,其中具有脱羧酶活性的蛋白质是SEQ IDNO:2的支气管炎博德特氏菌蛋白质(Blast数据库条目BAA02419.1)。
26.权利要求25的晶形,所述晶形的晶体属于具有晶胞的P21空间群,所述晶胞具有常数a=38.7,b=65.6,c=42.2埃和β=110.8°。
27.制备如权利要求23至26之一项中所定义蛋白质的晶形的方法,所述方法包括添加具有8.3至8.7范围内pH的结晶试剂和聚乙二醇至含有所述蛋白质的溶液。
28.具有如权利要求1中所定义脱羧酶活性的候选酶的筛选方法,所述方法包括鉴定如权利要求13至16之一项中所定义酶的特征性序列基序(模式)并筛选氨基酸序列数据库中与所述序列基序部分或完全匹配的数据库条目。
29.权利要求28的筛选方法,其中所述的序列基序在权利要求2至4中定义。
30.权利要求28或29的筛选方法,其中所述序列基序来自从如权利要求23至26之一项中定义的蛋白质晶形的晶体结构。
31.制备由权利要求28至30的方法筛选到的具有脱羧酶活性的候选酶的方法,该方法包括获得候选酶的编码核苷酸序列,在重组微生物中表达所述序列并分离所述表达产物。
32.如根据权利要求25制备的表达产物在脱羧反应中脱羧如权利要求1中所定义的式I化合物的用途。
CN200880118057.4A 2007-11-28 2008-11-28 用于工业应用的新丙二酸脱羧酶 Expired - Fee Related CN101878309B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP07023075A EP2065470A1 (en) 2007-11-28 2007-11-28 New malonate decarboxylases for industrial applications
EP07023075.0 2007-11-28
EP08156393 2008-05-16
EP08156393.4 2008-05-16
PCT/EP2008/010131 WO2009068308A2 (en) 2007-11-28 2008-11-28 New malonate decarboxylases for industrial applications

Publications (2)

Publication Number Publication Date
CN101878309A true CN101878309A (zh) 2010-11-03
CN101878309B CN101878309B (zh) 2016-01-13

Family

ID=39361366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880118057.4A Expired - Fee Related CN101878309B (zh) 2007-11-28 2008-11-28 用于工业应用的新丙二酸脱羧酶

Country Status (5)

Country Link
US (2) US8951750B2 (zh)
EP (4) EP2065470A1 (zh)
JP (2) JP2011504734A (zh)
CN (1) CN101878309B (zh)
WO (1) WO2009068308A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114150024A (zh) * 2021-12-03 2022-03-08 河北省科学院生物研究所 一种双功能酶生物催化剂及其制备方法和应用

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2145904A1 (de) 2008-07-18 2010-01-20 Basf Se Verfahren zur enzymkatalysierten Hydrolyse von Polyacrylsäureestern sowie dafür zu verwendende Esterasen
EP2438179B1 (en) 2009-06-04 2016-12-21 Basf Se A process for the enzymatic reduction of enoates
ES2628225T3 (es) 2009-09-15 2017-08-02 Basf Se Preparación de beta-aminoácidos
EP2478094A1 (en) 2009-09-16 2012-07-25 Basf Se An enzymatically catalyzed method of preparing mono-acylated polyols
JP5848028B2 (ja) * 2010-05-21 2016-01-27 三井化学株式会社 2’−デオキシヌクレオシドの製造方法
WO2012117999A1 (ja) * 2011-02-28 2012-09-07 学校法人慶應義塾 S体選択的高活性型変異型アリールマロン脱炭酸酵素
BR112015020904A2 (pt) 2013-03-15 2017-10-10 Genomatica Inc microrganismos e métodos para produção de butadieno e compostos relacionados por assimilação de formiato
DE102014006224B4 (de) 2014-04-30 2020-10-22 Chiracon Gmbh Verfahren zur Herstellung von 2-Aryl-2-Alkyl-malonsäuren

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1242054A (zh) * 1996-10-28 2000-01-19 Nsc技术有限公司 制备d-天门冬氨酸的方法和组合物

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040131601A1 (en) 2000-03-30 2004-07-08 Foundry Networks, Inc., A Delaward Corporation Injection of bone marrow-derived cells and medium for angiogenesis
EP1564298A1 (de) 2004-02-13 2005-08-17 BioSpring GmbH Enzymatische asymmetrische Decarboxylierung von disubstituierten Malonsäuren

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1242054A (zh) * 1996-10-28 2000-01-19 Nsc技术有限公司 制备d-天门冬氨酸的方法和组合物

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114150024A (zh) * 2021-12-03 2022-03-08 河北省科学院生物研究所 一种双功能酶生物催化剂及其制备方法和应用

Also Published As

Publication number Publication date
JP2015130861A (ja) 2015-07-23
CN101878309B (zh) 2016-01-13
EP2225382A2 (en) 2010-09-08
US8951750B2 (en) 2015-02-10
EP2565273A1 (en) 2013-03-06
JP2011504734A (ja) 2011-02-17
WO2009068308A2 (en) 2009-06-04
WO2009068308A3 (en) 2009-07-16
EP2065470A1 (en) 2009-06-03
EP2565274A1 (en) 2013-03-06
US20150147800A1 (en) 2015-05-28
US20100311037A1 (en) 2010-12-09
EP2225382B1 (en) 2016-11-09

Similar Documents

Publication Publication Date Title
CN101878309A (zh) 用于工业应用的新丙二酸脱羧酶
AU782517B2 (en) L-pantolactone-hydrolase and a method for producing D-pantolactone
JP5101510B2 (ja) 新規デヒドロゲナーゼ、その誘導体および光学活性アルカノールの製造方法
CN110325646B (zh) 制备(3e,7e)-高法尼酸或(3e,7e)-高法尼酸酯的方法
CN103502442A (zh) 新的7β-羟基类固醇脱氢酶突变体和制备熊去氧胆酸的方法
CN102791876A (zh) 新的7β-羟类固醇脱氢酶及它们的用途
CN106574281A (zh) 醇类的氧化还原自足性生物催化胺化
JP2022033873A (ja) ホモファルネシル酸の酵素的環化
CN101796192B (zh) 使用固氮弧菌属物种(Azoarcus Sp)EBN1脱氢酶产生光学活性醇的方法
CN102612557A (zh) 制备单酰基化多元醇的酶促催化方法
US20120123155A1 (en) Biocatalyst for catalytic hydroamination
JP5919192B2 (ja) βアミノ酸の調製
US20060211099A1 (en) L-carnitin dehydrogenases, their derivatives and method for producing substituted (s) alkanols
CN104364387A (zh) 使用醛肟脱水酶从萜肟产生萜腈的方法
CN105408488A (zh) 用于从阿魏酸快速和高产率产生香草醛的恶臭假单胞菌kt2440的基因工程化
JP5820778B2 (ja) エステラーゼ活性を有するタンパク質
JP2004507268A (ja) ブチノールiエステラーゼ
JP2012511922A (ja) デュロキセチンアルコールを製造するための改良型生体触媒
EP2280075A1 (en) Biocatalyst for catalytic hydroamination
Nagayama et al. Enzymatic monoglyceride production in w/o microemulsion systems
JP2006204254A (ja) アセチル−CoAアシルトランスフェラーゼ

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160113

Termination date: 20161128