CN105063072A

CN105063072A - 醛缩酶、编码它们的核酸及制备和使用它们的方法

Info

Publication number: CN105063072A
Application number: CN201510514805.2A
Authority: CN
Inventors: E·伯克; P·M·希克斯; P·卢京比尔; T·理查德森; D·P·维那; L·赵
Original assignee: BASF Enzymes LLC
Current assignee: BASF Enzymes LLC
Priority date: 2006-03-07
Filing date: 2007-03-07
Publication date: 2015-11-18
Also published as: KR20090004918A; KR101622894B1; EA019971B1; EA201301267A1; EP1999256A4; JP5793486B2; US8546118B2; CA2645225A1; KR20160058194A; EP3153580A3; EP1999256B1; AU2007223086A1; JP2013063068A; CN102690833A; ES2383767T3; CN101443446A; EP3153580A2; BRPI0708614A2; EP1999256A2; EP2385108B1

Abstract

本发明涉及具有醛缩酶活性，包括丙酮酸醛缩酶，例如没有限制地，HMG和/或KHG醛缩酶活性的多肽，编码这些多肽的多核苷酸，和制备并使用这些多核苷酸及多肽的方法。在一些实施方式中，本发明涉及具有醛缩酶活性，包括丙酮酸醛缩酶，例如没有限制地，HMG和/或KHG醛缩酶活性，包括热稳定性和耐热活性的多肽，编码这些酶的多核苷酸，和制备并使用这些多核苷酸及多肽的方法。依据本发明的多肽可以被用于多种药物、农业和工业环境。在一些实施方式中，本发明提供了多肽和生物合成途径，它们被用于产生R-2-羟基2-(吲哚-3基甲基)-4-酮戊二酸(R-MP)和某些monatin立体异构体，如R,R和S,R？monatin及其盐，以及monatin衍生物的某些立体异构体，如R,R和S,R构型及其盐。

Description

醛缩酶、编码它们的核酸及制备和使用它们的方法

本申请是分案申请，原申请的申请日为2007年3月7日、申请号为200780016408.6(针对的分案申请的申请号为201210175110.2)、发明名称为“醛缩酶、编码它们的核酸及制备和使用它们的方法”。

相关申请的交叉参考

本申请要求2006年3月7日提交的美国临时专利申请号60/780,515的权益。

发明领域

本发明涉及分子和细胞生物学及生物化学。更特别地，本发明涉及具有醛缩酶活性的多肽，编码这些多肽的多核苷酸，以及制造和使用这些多核苷酸和多肽的方法。

发明背景

Monatin是具有如下化学式的高强度甜味剂：

Monatin包括导致四种潜在的立体异构的构型的两个手性中心。R,R构型(“R,R立体异构体”或“R,Rmonatin”)；S,S构型(“S,S立体异构体”或“S,Smonatin”)；R,S构型(“R,S立体异构体”或“R,Smonatin”)；和S,R构型(“S,R立体异构体”或“S,Rmonatin”)。用在此处，除非另有说明，术语“monatin”用于表示包含全部四种monatin立体异构体的组合物，包含monatin立体异构体的任意组合的组合物(如仅包括R,R和S,S构型的monatin立体异构体的组合物)，以及单一的异构体形式。

出于本公开的目的，monatin的碳主链按上图所示编号，与醇基团直接共价连接的碳被编为2-位碳，而与氨基基团直接共价连接的碳被编为4-位碳。因此，这里对R,Rmonatin、S,Smonatin、R,Smonatin和S,Rmonatin分别表示：2R,4Rmonatin、2S,4Smonatin、2R,4Smonatin和2S,4Rmonatin，除非另有说明。

应该注意，在文献中monatin碳骨架也使用可选的惯例编号，与醇基团连接的碳是4-位碳，而与氨基基团连接的碳是2-位碳。因此，举例来说，本公开中2S,4Rmonatin的指代与使用可选编号惯例的文献中2R,4Smonatin的指代相同。

此外，由于不同的命名习惯，monatin已知有多个可选的化学名称，包括：2-羟基-2-(吲哚-3-基甲基)-4-氨基戊二酸；4-氨基-2-羟基-2-(1H-吲哚-3-基甲基)-戊二酸；4-羟基-4-(3-吲哚基甲基)谷氨酸；和3-(1-氨基-1,3-二羧基-3-羟基-丁-4-基)吲哚。

Monatin的某些异构形式可在位于南非的德兰士瓦地区(TransvaalRegion)的Schlerochitonilicifolius植物根的茎皮中找到。美国专利申请号10/422,366(’366申请)和10/979,821(’821申请)公开了用于体外和体内生产monatin的多肽、通路和微生物，这两个申请引入本文作为参考。

概述

本发明提供了具有醛缩酶活性(下文中为“醛缩酶”)，包括丙酮酸醛缩酶活性，如，没有限制地，HMG和KHG醛缩酶活性的多肽，编码该多肽的多核苷酸，和生产和使用该多肽和多核苷酸的方法。在一些实施方式中，本发明也提供了含有根据本发明所述的多肽或多核苷酸的组合物(如药物组合物、燃料和燃料添加剂组合物、食品和食品添加剂、饮料和饮料添加剂、饲料和饲料添加剂、药品和药品添加剂、膳食补充物)。这些组合物可以被配制为多种形式，如片剂、凝胶、丸剂、植入物、液体、喷雾剂、薄膜、胶束、粉末、食品、饲料颗粒或任意类型的胶囊化形式。

在一些实施方式中，醛缩酶和/或其组合物可以用于药物、工业和/或农业方面。

在一些实施方式中，醛缩酶和/或其组合物可以用于形成或断裂碳-碳键。

在一些实施方式中，提供催化α-酮酸受体和丙酮酸(丙酮酸盐(酯))或丙酮酸衍生物供体之间的碳-碳键形成反应的醛缩酶(见下面的反应图示)。在一些实施方式中，受体也可以是酮类或醛类。在一些实施方式中，提供具有4-羟基-2-氧化戊二酸醛缩酶(如2-酮-4-羟基戊二酸醛缩酶、2-氧代-4-羟基戊二酸醛缩酶、KHG-醛缩酶，EC4.1.3.16)活性并催化以下反应的醛缩酶：4-羟基-2-氧化戊二酸<＝>丙酮酸+乙醛酸。在一些实施方式中，提供具有HMG-醛缩酶(如4-羟基-4-甲基-2-氧化戊二酸醛缩酶、丙酮酸醛缩酶、γ-甲基-γ-羟基-α-酮戊二酸醛缩酶、4-羟基-4-甲基-2-酮戊二酸醛缩酶，EC4.1.3.17)活性并催化以下反应的醛缩酶：4-羟基-4-甲基-2-氧化戊二酸<＝>2丙酮酸。HMG醛缩酶也作用于4-羟基-4-甲基-2-氧化己二酸和4-羧基-4-羟基-2-氧化十六二酸(oxohexadioate)。

R＝H、烷基、取代烷基、芳基、取代芳基、苄基、取代苄基

R₂＝H、烷基、取代烷基、芳基、取代芳基、苄基、取代苄基

R₃＝H、烷基、取代烷基、芳基、取代芳基、苄基、取代苄基、羧酸。

在一些实施方式中，醛缩酶，例如丙酮酸醛缩酶，如，没有限制地，HMG和/或KHG醛缩酶被提供用于促进3,4-取代的2-酮-戊二酸的生产。在一种实施方式中，本发明提供了生产3,4-取代的2-酮-戊二酸的方法，包括：(a)提供具有醛缩酶活性，例如丙酮酸醛缩酶活性，如没有限制地，HMG醛缩酶和/或KMG醛缩酶活性的多肽；(b)提供供体和受体化合物；和(c)在醛缩酶催化3,4-取代的2-酮-戊二酸合成的条件下将步骤(a)的多肽与步骤(b)中的化合物接触，其中任选地供体和受体是丙酮酸或丙酮酸供体和α-酮酸受体，酮类和/或醛类。

在一些实施方式中，提供促进R-2-羟基-2-(吲哚-3-基甲基)-4-酮戊二酸(R-MP)——一种monatin前体——产生的醛缩酶。在一些实施方式中，丙酮酸醛缩酶，例如HMG和/或KHG醛缩酶，可以与D-氨基转移酶联合使用以产生4-取代D-谷氨酸或其衍生物。4-取代D-谷氨酸和/或其衍生物可以被用作抗生素，因为这些化合物已经被发现能抑制细菌的谷氨酸解旋酶(WO0214261A3)。在一种实施方式中，本发明提供了生产4-取代D-谷氨酸的方法，包括：(a)提供具有醛缩酶活性的多肽，例如丙酮酸醛缩酶活性，如没有限制地，HMG醛缩酶和/或KMG醛缩酶活性；(b)提供α-酮酸受体和丙酮酸或丙酮酸供体；和(c)在醛缩酶催化4-取代D-谷氨酸合成的条件下将步骤(a)的多肽与步骤(b)中的化合物接触，其中任选地多肽具有丙酮酸醛缩酶、HMG醛缩酶和/或KHG醛缩酶活性，并且其中任选地，该方法进一步包括使用D-氨基转移酶。

本发明提供了分离的，合成的或重组的核酸，其包含与根据本发明的核酸序列，包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多残基的区域中，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列。在一些实施方式中，一种或多种核酸编码至少一种多肽，所述多肽具有醛缩酶活性，包括丙酮酸醛缩酶活性，如没有限制地，HMG和/或KHG醛缩酶活性。在一些实施方式中，序列同一性通过用序列比较算法的分析或通过视觉观察确定。

在可选的实施方式中，一种或多种核酸编码至少一种能够产生抗体的多肽，所述抗体可以特异地与本发明的多肽结合，或这些核酸可以被用作鉴定或分离编码醛缩酶的核酸的探针，或用于抑制醛缩酶表达核酸的表达。

根据本发明的核酸也包括分离的、合成的或重组的核酸，其编码根据本发明的酶，如包含一种或多种具有如SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334中所述序列和其子序列的多肽的酶，其变体及其酶活性片段。在一些实施方式中，所述多肽具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性。

在一些实施方式中，本发明提供了优选地由混合培养物衍生的编码醛缩酶，例如编码丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸。在一些实施方式中，本发明提供了由混合培养物分离的编码碳-碳键形成或断裂酶的核酸，其含有依据本发明的多核苷酸，如与依据本发明的核酸，如SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338在至少约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、或更多残基的区域内具有至少约10％、15％、20％、25％、30％、35％、40％、45％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全(100％)序列同一性的序列。

在一些实施方式中，本发明提供了编码醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG酶的核酸，包括依据本发明的多核苷酸序列和由它们编码的多肽，包括依据本发明的酶，如依据本发明的多肽，如SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334及其酶的活性片段，其优选地由常见来源，如环境来源获得。在一些实施方式中，本发明也提供了编码醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG酶的核酸，其优选地由环境来源，如混合环境来源获得。

在一些实施方式中，所述序列比较算法是BLAST版2.2.2算法，其中过滤设置被设置为blastall–pblastp–d“nrpataa”–FF，所有其它选项被设置为默认值。

本发明的其它实施方式是分离的、合成的或重组的核酸，其包括依据本发明的核酸序列、与其基本一致的序列、和与其互补的序列的至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个连续的碱基。

在一些实施方式中，依据本发明的分离的、合成的或重组的核酸编码具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的多肽，其是热稳定的。依据本发明的热稳定多肽在包含温度范围从约-100℃到约-80℃、约-80℃到约-40℃、约-40℃到约-20℃、约-20℃到约0℃、约0℃到约37℃、约0℃到约5℃、约5℃到约15℃、约15℃到约25℃、约25℃到约37℃、约37℃到约45℃、约45℃到约55℃、约55℃到约70℃、约70℃到约75℃、约75℃到约85℃、约85℃到约90℃、约90℃到约95℃、约95℃到约100℃、约100℃到约105℃、约105℃到约110℃、约110℃到约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高温度的条件下，可以保持醛缩酶活性，例如丙酮酸醛缩酶活性，如HMG和/或KHG醛缩酶活性。依据本发明的热稳定多肽在范围从约-100℃到约-80℃、约-80℃到约-40℃、约-40℃到约-20℃、约-20℃到约0℃、约0℃到约5℃、约5℃到约15℃、约15℃到约25℃、约25℃到约37℃、约37℃到约45℃、约45℃到约55℃、约55℃到约70℃、约70℃到约75℃、约75℃到约85℃、约85℃到约90℃、约90℃到约95℃、约95℃到约100℃、约100℃到约105℃、约105℃到约110℃、约110℃到约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度下，可以保持醛缩酶活性，例如丙酮酸醛缩酶活性，如HMG和/或KHG醛缩酶活性。在一些实施方式中，依据本发明的热稳定多肽在上述温度范围内，在约pH3.0、约pH3.5、约pH4.0、约pH4.5、约pH5.0、约pH5.5、约pH6.0、约pH6.5、约pH7.0、约pH7.5、约pH8.0、约pH8.5、约pH9.0、约pH9.5、约pH10.0、约pH10.5、约pH11.0、约pH11.5、约pH12.0或更高pH的条件下保持醛缩酶活性。

在其它的实施方式中，分离的、合成的或重组的核酸编码具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的多肽，其是耐热的。依据本发明的耐热性多肽在暴露于包含范围从约-100℃到约-80℃、约-80℃到约-40℃、约-40℃到约-20℃、约-20℃到约0℃、约0℃到约5℃、约5℃到约15℃、约15℃到约25℃、约25℃到约37℃、约37℃到约45℃、约45℃到约55℃、约55℃到约70℃、约70℃到约75℃、约75℃到约85℃、约85℃到约90℃、约90℃到约95℃、约95℃到约100℃、约100℃到约105℃、约105℃到约110℃、约110℃到约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高温度的条件后，可以保持醛缩酶活性，例如丙酮酸醛缩酶活性，如HMG和/或KHG醛缩酶活性。依据本发明的耐热性多肽在暴露于范围从约-100℃到约-80℃、约-80℃到约-40℃、约-40℃到约-20℃、约-20℃到约0℃、约0℃到约5℃、约5℃到约15℃、约15℃到约25℃、约25℃到约37℃、约37℃到约45℃、约45℃到约55℃、约55℃到约70℃、约70℃到约75℃、约75℃到约85℃、约85℃到约90℃、约90℃到约95℃、约95℃到约100℃、约100℃到约105℃、约105℃到约110℃、约110℃到约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度后，可以保持醛缩酶活性，例如丙酮酸醛缩酶活性，如HMG和/或KHG醛缩酶活性。在一些实施方式中，依据本发明的耐热性多肽在暴露于上述温度范围内后，在约pH3.0、约pH3.5、约pH4.0、约pH4.5、约pH5.0、约pH5.5、约pH6.0、约pH6.5、约pH7.0、约pH7.5、约pH8.0、约pH8.5、约pH9.0、约pH9.5、约pH10.0、约pH10.5、约pH11.0、约pH11.5、约pH12.0或更高的pH值下保持醛缩酶活性。

本发明提供了分离的、合成的或重组的核酸，其包括在严格条件下与依据本发明的核酸杂交的序列，依据本发明的核酸包括如SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338中所述的序列或其片段或子序列。在一些实施方式中，所述核酸编码具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的多肽。所述核酸长度可以是至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多个残基，或基因或转录物的全长。在一些实施方式中，所述严格条件包括清洗步骤，其包括在0.2×SSC中在约65℃的温度下洗涤约15分钟。

本发明提供了用于鉴定或分离编码具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的多肽的核酸的核酸探针，其中所述探针包括依据本发明的序列中约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多连续的碱基，并且其中所述探针通过结合或杂交鉴定核酸。该探针可以包括含有依据本发明的序列、或其片段或子序列中约10-100个连续碱基的寡核苷酸，例如，10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基或更多，或在它们之间任意期望的长度。

本发明提供了用于鉴定或分离编码具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的多肽的核酸的核酸探针，其中所述探针包括含有依据本发明核酸中至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多碱基的序列的核酸，例如与本发明的核酸具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全(100％)序列同一性的多核苷酸。在一些实施方式中，序列同一性通过使用序列比较算法的分析或通过视觉观察确定。在其它的实施方式中，探针可以包括含有依据本发明的核酸序列或其子序列的至少约10-100个连续碱基的寡核苷酸，例如，10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基或更多碱基，或在它们之间任意期望的长度。

本发明提供了扩增(如通过PCR)编码具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的多肽的核酸的扩增引物对，其中每个引物对能够扩增包含依据本发明的序列，或其片段或子序列的核酸(参见序列表)。扩增引物序列对中的一个或每个成员可以包含寡核苷酸，其含有该序列至少约10到50个，或更多连续碱基，或该序列约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多连续碱基。在一些实施方式中，本发明提供了扩增引物对，其中每个引物对包含具有如依据本发明的核酸的大约前(5’端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个残基所述的序列的第一成员，和具有如第一成员的互补链的大约前(5’端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个残基所述的序列的第二成员。

本发明提供了编码醛缩酶，例如编码丙酮酸醛缩酶、编码HMG和/或KHG醛缩酶的核酸，其通过扩增，如聚合酶链反应(PCR)，使用依据本发明的扩增引物对产生。在一些实施方式中，本发明提供了编码醛缩酶，例如编码丙酮酸醛缩酶、编码HMG和/或KHG醛缩酶的核酸，其通过扩增，如聚合酶链反应(PCR)，使用依据本发明的扩增引物对产生。在一些实施方式中，本发明提供了通过扩增，如聚合酶链反应(PCR)，使用依据本发明的扩增引物对生产醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的方法。在一些实施方式中，扩增引物对从文库，例如基因文库，如环境文库中扩增核酸。

本发明提供了扩增编码具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的多肽的核酸的方法，包括用能够扩增依据本发明的核酸序列、或其片段或子序列的扩增引物序列对来扩增模板核酸。

本发明提供了包含依据本发明的核酸或其子序列的表达盒。在一些实施方式中，表达盒可以含有与启动子可操作地连接的核酸。该启动子可以是病毒、细菌、哺乳动物、真菌、酵母或植物启动子。在一些实施方式中，植物启动子可以是马铃薯、稻、玉米、小麦、烟草或大麦启动子。该启动子可以是组成型启动子。组成型启动子可以含有CaMV35S。在其它的实施方式中，启动子可以是诱导型启动子。在一些实施方式中，启动子可以是组织特异性启动子或环境调控或发育调控型启动子。因此，启动子可以是，例如种子特异性、叶特异性、根特异性、茎特异性、或脱落诱导的启动子。在一些实施方式中，表达盒可以进一步包含植物或植物病毒表达载体。

本发明提供了克隆载体，包括依据本发明的表达盒(例如载体)或依据本发明的核酸。克隆载体可以是病毒载体、质粒、噬菌体(phage)、噬粒、粘粒(cosmid)、F粘粒(fosmid)、细菌噬菌体(bacteriophage)或人工染色体。病毒载体可以包括腺病毒载体、逆转录病毒载体或腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。

本发明提供了包含依据本发明的核酸或本发明的表达盒(例如载体)或依据本发明的克隆载体的转化细胞。在一些实施方式中，转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。在一些实施方式中，植物细胞可以是大豆、油菜籽、含油种子、番茄、甘蔗、谷类、马铃薯、小麦、稻、玉米、烟草或大麦细胞。

本发明提供了包含本发明核酸或本发明表达盒(例如载体)的转基因非人动物。在一些实施方式中，该动物是小鼠、大鼠、猪、山羊或绵羊。

本发明提供了包含本发明核酸或本发明表达盒(例如载体)的转基因植物。转基因植物可以是谷类植物、玉米植物、马铃薯植物、番茄植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。

本发明提供了包含本发明核酸或本发明表达序列盒(例如载体)的转基因种子。转基因种子可以是谷类种子、玉米种子、小麦粒、含油种子、油菜籽、大豆种子、棕榈核、向日葵种子、芝麻种子、花生或烟草植物种子。

本发明提供了反义寡核苷酸，其包含与在严格条件下与依据本发明的核酸互补或能够与其杂交的核酸序列。在一些实施方式中，本发明提供了抑制醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶信息在细胞中翻译的方法，该方法包括给细胞施用反义寡核苷酸或在细胞中表达反义寡核苷酸，所述反义寡核苷酸包括与本发明的核酸互补的核酸序列或能与本发明的核酸在严格条件下杂交的核酸序列。在一些实施方式中，所述反义寡核苷酸的长度在大约10到50、大约20到60、大约30到70、大约40到80或大约60到100个碱基之间，例如长度为10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个碱基。

本发明提供了抑制醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶信息在细胞中翻译的方法，该方法包括给予细胞反义寡核苷酸或在细胞中表达反义寡核苷酸，所述反义寡核苷酸包括与本发明的核酸互补的核酸序列或能与本发明的核酸在严格条件下杂交的核酸序列。

本发明提供了双链抑制RNA(RNAi或RNA干扰)分子(包括小干扰性RNA，或siRNA，用于抑制转录；以及微RNA或miRNA，用于抑制翻译)，其包含依据本发明序列的子序列。在一些实施方式中，siRNA的长度为约21到约24个残基，或大约至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多双链核苷酸。在一些实施方式中，本发明提供了抑制醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶在细胞中表达的方法，该方法包括给予细胞双链抑制RNA(siRNA或miRNA)或在细胞中表达双链抑制RNA(siRNA或miRNA)，其中所述RNA包括依据本发明的序列的子序列。

本发明提供了分离的、合成的或重组的多肽，其包含与依据本发明的多肽或肽在至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350或更多残基的区域，或在该多肽的全长区域中具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多或完全(100％)序列同一性的氨基酸序列。在一些实施方式中，序列同一性通过用序列比较算法的分析或通过视觉观察确定。依据本发明的多肽或肽包括SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334及其子序列、其变体和其酶活性片段。依据本发明的多肽也包括长度至少约10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600或更多个残基的片段，或者为酶的全长区域内的片段。依据本发明的多肽或肽序列包括由依据本发明的核酸编码的序列。依据本发明的多肽或肽序列包括由依据本发明的抗体特异性结合的多肽或肽(例如，表位)，或可产生依据本发明的抗体的多肽或肽(例如，免疫原)。

在一些实施方式中，依据本发明的多肽具有至少一种醛缩酶的酶活性，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性。在其它的实施方式中，依据本发明的多核苷酸编码具有至少一种醛缩酶的酶活性，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性的多肽。

本发明的另一实施方式提供了分离的、合成的或重组的多肽或肽，其包含依据本发明的多肽或肽序列、与其基本一致的序列和与其互补的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150或更多个连续的碱基。该肽可以是例如免疫原性片段、基序(例如结合位点)、信号序列、前原序列(preprosequence)或活性位点。

本发明提供了分离的、合成的或重组的核酸，其包含编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶酶活性和信号序列的多肽的序列，其中所述核酸包含依据本发明的序列。“信号序列”指帮助依据本发明的醛缩酶从宿主细胞分泌的分泌信号或其它区域。信号序列可以由另一种醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，或非醛缩酶，例如非丙酮酸醛缩酶，如非HMG和/或非KHG醛缩酶(异源)的酶衍生。在一些实施方式中，本发明提供了分离的、合成的或重组的核酸，其含有编码具有醛缩酶、例如丙酮酸醛缩酶、如HMG和/或KHG醛缩酶的酶活性的多肽的序列，其中所述序列不含有信号序列并且所述核酸含有依据本发明的序列。在一些实施方式中，本发明提供了分离的、合成的或重组的多肽，其含有缺少所有或部分信号序列的依据本发明的多肽。在一些实施方式中，分离的、合成的或重组的多肽可以含有依据本发明的多肽，其含有异源信号序列，例如异源醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的信号序列或非醛缩酶，例如非丙酮酸醛缩酶，如非HMG和/或非KHG醛缩酶的信号序列。

在一些实施方式中，本发明提供了嵌合蛋白，其包括含有依据本发明的信号序列的第一结构域和至少一个第二结构域。该蛋白可以是融合蛋白。第二结构域可以包含酶。该蛋白可以是非酶。

本发明提供了嵌合多肽，包括含有依据本发明的信号肽(SP)、前原序列和/或催化结构域(CD)的至少第一结构域以及含有异源多肽或肽的第二结构域，其中所述异源多肽或肽不与所述信号肽(SP)、前原序列和/或催化结构域(CD)天然相关。在一些实施方式中，异源多肽或肽不是醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶。所述异源多肽或肽可以在所述信号肽(SP)、前原序列和/或催化结构域(CD)的氨基端、羧基端或两端。

本发明提供了编码嵌合多肽的分离的或重组的核酸，其中所述嵌合多肽包括含有本发明的信号肽(SP)、前原结构域和/或催化结构域(CD)的至少第一结构域以及含有异源多肽或肽的第二结构域，其中所述异源多肽或肽不与所述信号肽(SP)、前原结构域和/或催化结构域(CD)天然相关。

本发明提供了分离的、合成的或重组的信号序列(如信号肽)，其包括依据本发明的多肽，如SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334的残基1到14、1到15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、1到34、1到35、1到36、1到37、1到38、1到40、1到41、1到42、1到43、1到44、1到45、1到46或1到47所述的序列，或由它们组成。在一些实施方式中，本发明提供了信号序列，其包含依据本发明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基端残基。

在一些实施方式中，所述醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性包含每毫克蛋白约10到约12,000单位的比活性。在其它的实施方式中，所述醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性包含每毫克蛋白约1000到约10,000单位，或每毫克蛋白约5000到约7500单位的比活性。可选地，所述醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性包含每毫克蛋白约10到约7500单位，或每毫克蛋白约5000到约12,000单位范围内的比活性。在一些实施方式中，所述醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性包含每毫克蛋白约10到约5000单位，或每毫克蛋白约7500到约10,000单位范围内的比活性。在其它实施方式中，所述醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性包含每毫克蛋白约10到约2500单位范围内的比活性。可选地，所述醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性包含每毫克蛋白约10到约1000单位范围内的比活性。测量不同醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的示例性方法使用普通底物，4-羧基-4-羟基-2-氧代己二酸(“CHA”)。典型的测试包括50mM磷酸钠pH7.5、1mMMgCl₂、1mMCHA、10μg/ml来自赖氏乳杆菌(Lactobacillusleichmanii)的D-乳酸脱氢酶(“LDH”)(Sigma-Aldrich,St.Louis,MO)、0.5mMNADH。该测试通过加入待测试的酶开始。与NAD+形成偶联的丙酮酸释放在分光光度计中340nm处连续监测。酶活性单位被定义为释放足量丙酮酸以使340nm处的吸收值每分钟降低1OD的量。

在其它的实施方式中，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的耐热性包括在被加热到高温后，如从约0℃到约20℃、约20℃到约37℃、约37℃到约50℃、约50℃到约70℃、约70℃到约75℃、约75℃到约80℃、约80℃到约85℃、约85℃到约90℃、约90℃到约95℃、约95℃到约100℃、约100℃到约110℃或更高温度后，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的比活性保持至少一半。可选择地，耐热性可以包括在被加热到高温后，如上所述，保持每毫克蛋白从大约10到大约12000单位，或每毫克蛋白大约5000到大约10,000单位的范围内的比活性。在另一实施方式中，耐热性可以包括在被加热到高温后，如上所述，保持每毫克蛋白从大约10到大约5000单位的范围内的比活性。

本发明提供了依照本发明的分离的、合成的或重组的多肽，其中所述多肽包括至少一个糖基化位点。在一些实施方式中，糖基化可以是N-连接糖基化。在一些实施方式中，多肽可以在毕赤酵母(P.pastoris)或裂变酵母(S.pombe)宿主中被表达后被糖基化。

在一些实施方式中，多肽可以在包含约pH6.5、pH6、pH5.5、pH5、pH4.5、pH4.0、pH3.5、pH3.0或更低(更酸性)pH的条件下保持醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性。在其它实施方式中，多肽可以在包含约pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pH11.0、pH11.5、pH12、pH12.5或更高(更碱性)pH的条件下保持醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性。在一些实施方式中，多肽可以在暴露于包含约pH6.5、pH6、pH5.5、pH5、pH4.5、pH4.0、pH3.5、pH3.0或更低(更酸性)pH的条件下之后保持醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性。在其它实施方式中，多肽可以在暴露于包含约pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5、pH11.0、pH11.5、pH12、pH12.5或更高(更碱性)pH的条件下之后保持醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性。

在一些实施方式中，依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶在碱性条件下，例如肠，如小肠的碱性条件下具有活性。在一些实施方式中，多肽在暴露于胃的酸性pH之后能够保持活性。

本发明提供了含有依照本发明的多肽(包括肽)的蛋白制备物，其中该蛋白制备物包括液体、固体或凝胶。在一些实施方式中，本发明提供了包含依照本发明的多肽和第二成员，诸如多肽或其他(第二)结构域的异源二聚体。异源二聚体的第二成员可以是不同的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，不同的酶或另一种蛋白。在一些实施方式中，第二结构域可以是多肽并且异源二聚体可以是融合蛋白。在一些实施方式中，第二结构域可以是表位或标记。在一些实施方式中，本发明提供了同源多聚体，包括但不限于同源二聚体、同源三聚体、同源四聚体、同源五聚体和同源六聚体，其包含依据本发明的多肽。

本发明提供了具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的固定化多肽(包括肽)，其中所述固定化多肽含有依据本发明的多肽，由依据本发明的核酸编码的多肽，或含有依据本发明的多肽和第二结构域的多肽。在一些实施方式中，多肽可以被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、平板、阵列或毛细管上。

本发明还提供了包含本发明的固定化核酸的阵列，包括，例如本发明的探针。在一些实施方式中，本发明还提供了包含本发明的抗体的阵列。

本发明提供了分离的、合成的或重组的抗体，其与本发明的多肽或与由本发明的核酸编码的多肽特异性结合。本发明的这些抗体可以是单克隆或多克隆抗体。在一些实施方式中，本发明提供了包含本发明的抗体的杂交瘤，所述抗体例如，与本发明的多肽或与由本发明的核酸编码的多肽特异性结合的抗体。在一些实施方式中，本发明提供了编码这些抗体的核酸。

本发明提供了分离或鉴定具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽的方法，包括以下步骤：(a)提供依据本发明的抗体；(b)提供含有多肽的样品；和(c)在抗体可以与该多肽特异结合的条件下，将步骤(b)的样品与步骤(a)的抗体接触，由此分离或鉴定具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽。

本发明提供了制备抗醛缩酶，例如抗丙酮酸醛缩酶，如抗HMG和/或抗KHG醛缩酶抗体的方法，包括以足以产生体液免疫应答的量给予非人类动物依据本发明的核酸，或依据本发明的多肽或其子序列，由此制备抗醛缩酶，例如抗丙酮酸醛缩酶，如抗HMG和/或抗KHG醛缩酶的抗体。在一些实施方式中，本发明提供了产生抗醛缩酶，例如抗丙酮酸醛缩酶，如抗HMG和/或抗KHG醛缩酶免疫反应(细胞应答或体液应答)的方法，该方法包括以足以产生免疫应答(细胞应答或体液应答)的量向非人动物施用本发明的核酸或本发明的多肽或其子序列。

本发明提供了产生重组多肽的方法，包括如下步骤：(a)提供与启动子可操作地连接的本发明的核酸；和(b)在允许多肽表达的条件下表达步骤(a)的核酸，从而产生重组多肽。在一些实施方式中，该方法可进一步包括用步骤(a)的核酸转化宿主细胞，随后表达步骤(a)的核酸，从而在转化细胞中产生重组多肽。

本发明提供了鉴定具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽的方法，包括以下步骤：(a)提供依据本发明的多肽；或由依据本发明的核酸编码的多肽；(b)提供醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶底物；和(c)将步骤(a)的多肽或其片段或变体与步骤(b)的底物接触，并检测底物量的减少或反应产物量的增加，其中底物量的减少或反应产物量的增加检测出具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽。在一些实施方式中，底物是碳水化合物，含碳水化合物的化合物和/或碳水化合物的类似物。

本发明提供了鉴定醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶底物的方法，包括以下步骤：(a)提供依据本发明的多肽；或由依据本发明的核酸编码的多肽；(b)提供测试底物；和(c)将步骤(a)的多肽与步骤(b)的测试底物接触，并检测底物量的减少或反应产物量的增加，其中底物量的减少或反应产物量的增加将测试底物鉴定为醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶底物。

本发明提供了确定测试化合物是否与多肽特异性结合的方法，包括以下步骤：(a)在允许核酸翻译成多肽的条件下表达核酸或含有核酸的载体，其中所述核酸含有依据本发明的核酸，或提供依据本发明的多肽；(b)提供测试化合物；(c)将所述多肽与所述测试化合物接触；和(d)确定步骤(b)的测试化合物是否与所述多肽特异性结合。

本发明提供了鉴定醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的调节剂的方法，包括以下步骤：(a)提供依据本发明的多肽或由依据本发明的核酸编码的多肽；(b)提供测试化合物；(c)将步骤(a)的多肽与步骤(b)的测试化合物接触，并测量醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性，其中在存在测试化合物的情况下测定的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性与不存在测试化合物的情况下测定的活性相比的变化，提供了如此确定：该测试化合物调节醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性。在一些实施方式中，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性可以通过提供醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶底物并检测底物量的减少或反应产物量的增加，或，底物量的增加或反应产物量的减少来测定。与测试化合物不存在的情况下底物或反应产物量的比较，在测试化合物存在的情况下底物量的减少或反应产物量的增加将测试化合物鉴定为醛缩酶例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的激活剂。与测试化合物不存在的情况下底物或反应产物量的比较，在测试化合物存在的情况下底物量的增加或反应产物量的减少将测试化合物鉴定为醛缩酶例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的抑制剂。

本发明提供了计算机系统，该系统包括处理器和数据存储设备，其中所述数据存储设备上已经存储了本发明的多肽序列或核酸序列(例如由依据本发明的核酸编码的多肽或肽)。在一些实施方式中，计算机系统可以进一步包括序列比较算法和数据存储设备，其中数据存储设备上已经存储了至少一个参考序列。在其他实施方式中，序列比较算法包括指出多态现象(多态性)的计算机程序。在一些实施方式中，计算机系统可以进一步包括在所述序列中鉴定一个或多个特征的鉴定器(标识符，identifier)。在一些实施方式中，本发明提供了计算机可读介质，其上已经存储了本发明的多肽序列或核酸序列。在一些实施方式中，本发明提供了用于鉴定序列中的特征的方法，包括如下步骤：(a)使用鉴定序列中的一个或多个特征的计算机程序读取序列，其中所述序列包括本发明的多肽序列或核酸序列；和(b)用所述计算机程序鉴定序列中的一个或多个特征。在一些实施方式中，本发明提供了将第一序列与第二序列进行比较的方法，包括如下步骤：(a)通过使用比较序列的计算机程序读取第一序列和第二序列，其中第一序列包括依据本发明的多肽序列或核酸序列；和(b)用所述计算机程序确定第一序列和第二序列之间的差异。确定第一序列和第二序列之间差异的步骤可以进一步包括鉴定多态性的步骤。在一些实施方式中，该方法可以进一步包括可鉴定序列中的一个或多个特征的鉴定器。在其他实施方式中，该方法可以包括使用计算机程序读取第一序列，并鉴定该序列中的一个或多个特征。

本发明提供了从样品，如环境样品中分离或回收核酸的方法，所述核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽，包括以下步骤：(a)提供扩增核酸的扩增引物序列对，该核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽，其中所述引物对能够扩增依据本发明的核酸；(b)从样品中分离核酸，或处理样品以便样品中的核酸可实现与扩增引物对杂交；和(c)将步骤(b)的核酸与步骤(a)的扩增引物对组合，以从样品中扩增核酸，由此从样品中分离或回收编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽的核酸。扩增引物序列对的一个或每个成员可以包含寡核苷酸，其包括依据本发明的扩增引物序列对，如具有依据本发明序列的至少约10到50个连续碱基。在本发明的一种实施方式中，样品是环境样品。

本发明提供了从样品，如环境样品中分离或回收核酸的方法，所述核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽，包括以下步骤：(a)提供具有依据本发明的核酸或其子序列的多核苷酸探针；(b)从样品中分离核酸，或处理样品，以便样品中的核酸可实现与步骤(a)的多核苷酸探针杂交；(c)将步骤(b)的分离的核酸或处理样品与步骤(a)的多核苷酸探针混合；和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸，由此从样品中分离或回收编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽的核酸。样品可包括水样品、液体样品、土壤样品、空气样品或生物样品。在一些实施方式中，生物样品可以来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。在本发明的一种实施方式中，样品是环境样品。

本发明提供了产生核酸变体的方法，所述核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽，该方法包括以下步骤：(a)提供包含依据本发明的核酸的模板核酸；和(b)在模板序列中修饰、缺失或添加一个或多个核苷酸，或进行修饰、缺失和添加的组合，以产生模板核酸的变体。在一些实施方式中，该方法可以进一步包括表达变体核酸以产生变体醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽。修饰、添加或缺失可以通过包括如下方法中的方法来引入，包括：易错PCR、改组(重排，shuffling)、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变(recursiveensemblemutagenesis)、指数整体诱变、位点特异性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、染色体饱和诱变(CSM)或其组合。在其他实施方式中，修饰、添加或缺失通过如下方法的方法引入：包括重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变(gappedduplexmutagenesis)、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。

在一些实施方式中，该方法可被迭代重复，直到产生与由模板核酸编码的多肽相比具有改变的或不同活性的或改变的或不同稳定性的醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶。在一些实施方式中，变体醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽是耐热性的，并且在暴露于升高的温度后保持一些活性。在其它的实施方式中，变体醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽与模板核酸编码的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶相比具有提高的糖基化水平。可选地，变体醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽在高温下具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性，其中由模板核酸编码的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶在高温下是没有活性的。在一些实施方式中，该方法可被迭代重复，直到产生具有与模板核酸的密码子使用有所不同的密码子使用的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶编码序列。在其它实施方式中，该方法可以被迭代重复，直到产生具有比模板核酸的信息表达或稳定性更高或更低水平的信息表达或稳定性的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶基因。

本发明提供了在编码具有醛缩酶例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法，该方法包括如下步骤：(a)提供编码具有醛缩酶例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽的依据本发明的核酸；和(b)鉴定步骤(a)的核酸中非优选或较不优选的密码子，用优选的或中度使用(neutrallyused)的密码子来代替，所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以增加其在宿主细胞中的表达。

本发明提供了修饰核酸中的密码子的方法，所述核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽；该方法包括以下步骤：(a)提供依据本发明的核酸；和(b)鉴定步骤(a)的核酸中的密码子，并用不同的密码子来代替，所述不同的密码子编码与被代替的密码子相同的氨基酸，由此修饰编码醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的核酸中的密码子。

本发明提供了修饰核酸中的密码子的方法，以提高其在宿主细胞中的表达，该核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽，该方法包括以下步骤：(a)提供依据本发明的核酸，其编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽；和(b)鉴定步骤(a)的核酸中的非优选或较不优选密码子，并用优选的或中度使用的密码子来代替，所述优选或中度使用的密码子编码与被取代的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以增加其在宿主细胞中的表达。

本发明提供了修饰核酸中的密码子的方法，以提高其在宿主细胞中的表达，该核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽，该方法包括以下步骤：(a)提供本发明的核酸；和(b)鉴定步骤(a)的核酸中的至少一个优选密码子，并用非优选的或较不优选的密码子来代替，所述非优选或较不优选的密码子编码与被取代的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选的密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以降低其在宿主细胞中的表达。在一些实施方式中，宿主细胞可以是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。

本发明提供了产生核酸文库的方法，该核酸编码许多修饰的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性位点或底物结合位点，其中修饰的活性位点或底物结合位点由含有编码第一活性位点或第一底物结合位点的序列的第一核酸衍生得到；该方法包括以下步骤：(a)提供编码第一活性位点或第一底物结合位点的第一核酸，其中第一核酸序列包含在严格条件下与依据本发明的核酸杂交的序列，并且该核酸编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性位点，或醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶底物结合位点；(b)提供一组诱变寡核苷酸，其在第一核酸的多个目标密码子处编码天然发生的氨基酸变体；和(c)使用该组诱变的寡核苷酸以产生一组编码活性位点或编码底物结合位点的变体核酸，其在被诱变的每一氨基酸密码子处编码一定范围的氨基酸变化，从而产生编码多个被修饰的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性位点或底物结合位点的核酸的文库。在一些实施方式中，该方法包括通过包括如下方法中的方法诱变步骤(a)的第一核酸：优化的定向进化系统、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、易错PCR、改组、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配及其组合。在其他实施方式中，该方法包括通过包括如下方法中的方法诱变步骤(a)的第一核酸或变体：重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。

本发明提供了产生小分子的方法，包括如下步骤：(a)提供多个能合成或修饰小分子的生物合成酶，其中这些酶中的一种酶包括由本发明的核酸编码的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶；(b)为步骤(a)的至少一种酶提供底物；和(c)将步骤(b)的底物与这些酶在能促进多个生物催化反应的条件下通过一系列生物催化反应进行反应，以产生小分子。在一些实施方式中，本发明提供了修饰小分子的方法，包括如下步骤：(a)提供醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，其中该酶包括本发明的多肽，或由本发明的核酸编码的多肽，或其子序列；(b)提供小分子；和(c)将步骤(a)的酶与步骤(b)的小分子在能促进由醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶催化的酶促反应的条件下进行反应，从而通过醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶酶促反应修饰小分子。在一些实施方式中，该方法可以包括步骤(a)的酶的多个小分子底物，从而产生通过由醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶催化的至少一种酶促反应产生的被修饰小分子的文库。在一些实施方式中，该方法可以包括多个其它的酶，在有助于这些酶介导的多个生物催化反应的条件下，以形成由多个酶促反应产生的被修饰小分子的文库。在其他实施方式中，该方法可以进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的步骤可以进一步包括系统地去除所有但保留一个用于产生文库中多个被修饰小分子中的一部分的生物催化反应，方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子，并鉴定出产生具有期望活性的特定修饰小分子的至少一个特异性生物催化反应。

本发明提供了确定醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶功能片段的方法，包括以下步骤：(a)提供醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，其中所述酶含有依据本发明的多肽，或依据本发明的核酸或其子序列编码的多肽；和(b)从步骤(a)的序列中缺失多个氨基酸残基，并测试醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的剩余序列，从而确定丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的功能片段。在一些实施方式中，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性通过提供醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶底物，并检测底物量的减少或反应产物量的增加来测量。

本发明提供了通过使用实时代谢流(real-timemetabolicflux)分析进行新的或修饰的表型的全细胞工程改造的方法，该方法包括如下步骤：(a)通过修饰细胞的遗传组成产生修饰的细胞，其中所述遗传组成通过将本发明的核酸加入到细胞来修饰；(b)培养修饰的细胞以产生多个修饰的细胞；(c)通过实时监控步骤(b)的细胞培养物来测量该细胞的至少一个代谢参数；和(d)分析步骤(c)的数据，以确定被测量的参数是否与在类似条件下未修饰细胞中的参照测量值不同，从而使用实时代谢流量分析鉴定细胞中的工程改造的表型。在一些实施方式中，细胞的遗传组成可以通过包括在细胞中序列的缺失或序列的修饰，或敲除基因的表达的方法来修饰。在一些实施方式中，该方法可以进一步包括选择含有新的工程改造的表型的细胞。在其他实施方式中，该方法可以包括培养被选择的细胞，从而产生包含新的工程表型的新细胞株。

本发明提供了提高醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶多肽的耐热性或热稳定性的方法，该方法包括对醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶多肽进行糖基化，其中所述多肽包括依据本发明的多肽，或依据本发明的核酸编码的多肽的至少三十个连续的氨基酸，由此提高醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶多肽的耐热性或热稳定性。在一些实施方式中，醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的比活性在高于约37℃到约95℃的温度范围内可以是热稳定的或耐热的。

本发明提供了在细胞中过量表达重组的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽的方法，该方法包括表达含有核酸的载体，该核酸包括本发明的核酸或本发明的核酸序列，其中序列同一性通过使用序列比较算法的分析或通过视觉观察来确定，其中过量表达通过使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。

本发明提供了产生转基因植物的方法，该方法包括如下步骤：(a)将异源核酸序列引入细胞中，其中异源核酸序列包括本发明的核酸序列，从而产生转化的植物细胞；和(b)从转化的细胞产生转基因植物。在一些实施方式中，步骤(a)可以进一步包括通过植物细胞原生质体的电穿孔或显微注射引入异源核酸序列。在其他实施方式中，步骤(a)可以进一步包括通过DNA微粒轰击(DNAparticlebombardment)将异源核酸序列直接引入植物组织中。可以选择地，步骤(a)可以进一步包括使用根瘤农杆菌(Agrobacteriumtumefaciens)宿主将异源核酸序列引入植物细胞DNA中。在一些实施方式中，植物细胞可以是甘蔗、甜菜、大豆、番茄、马铃薯、玉米、水稻、小麦、烟草或大麦细胞。

本发明提供了在植物细胞中表达异源核酸序列的方法，该方法包括如下步骤：(a)用与启动子可操作地连接的异源核酸序列转化植物细胞，其中异源核酸序列包括本发明的核酸；(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。在一些实施方式中，本发明提供了在植物细胞中表达异源核酸序列的方法，该方法包括如下步骤：(a)用与启动子可操作地连接的异源核酸序列转化植物细胞，其中异源核酸序列包括本发明的序列；(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。

本发明提供了饲料或食品，其含有本发明的多肽或本发明的核酸编码的多肽。在一些实施方式中，本发明提供了食品、饲料、液体如饮料(如果汁或啤酒)、面包或面团或面包产品、或饮料前体(例如，麦芽汁)，其含有本发明的多肽。在其它实施方式中，本发明提供了含有依据本发明的多肽的食品、饲料或饮料添加剂。在一些实施方式中，本发明提供了含有依据本发明的多肽，或依据本发明的核酸编码的多肽的食品或营养补充剂，如用于人类或动物的食品或营养补充剂。

在一些实施方式中，食品或营养补充剂中的多肽可以是糖基化的。在一些实施方式中，本发明提供了可食用的酶输送基质，其包含依据本发明的多肽，如依据本发明的核酸编码的多肽。在一些实施方式中，输送基质包含丸剂。在一些实施方式中，多肽可以是糖基化的。在一些实施方式中，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性是耐热的。在其它实施方式中，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性是热稳定的。

本发明提供了含有依据本发明的多肽的食品、饲料或营养补充剂。在一些实施方式中，本发明提供了使用醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶作为动物膳食中的营养补充剂的方法，该方法包括：制备含有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的营养补充剂，所述酶含有依据本发明的多肽的至少三十个连续氨基酸；和给予动物该营养补充剂。动物可以是人、反刍或单胃动物。醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以通过在选自细菌、酵母、植物、昆虫、真菌和动物的生物体中表达编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的多核苷酸制备。所述生物体可选自裂变酵母(S.pombe)、酿酒酵母(S.cerevisiae)、毕赤酵母(Pichia.pastoris)、大肠杆菌(E.coli.)、链霉菌属某种(Streptomycessp.)、杆菌属某种(Bacillussp.)和乳酸杆菌属某种(Lactobacillussp.)。

本发明提供了可食用的酶输送基质，其包含热稳定的重组醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，例如依据本发明的多肽。在一些实施方式中，本发明提供了向动物输送醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的方法，该方法包括：制备丸剂形式的可食用的酶输送基质，其含有粒状的可食用载体和热稳定的重组醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，其中所述丸剂易于将包含在其中的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶分散在含水介质中；和给予动物该可食用的酶输送基质。重组的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以包含依据本发明的多肽。醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，可以被糖基化，以在制丸的条件下提供热稳定性。该输送基质可以通过对含有谷物胚芽和醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的混合物进行制丸而形成。制丸条件可包括蒸汽的应用。制丸条件可包括应用超过约80℃的温度约5分钟，而该酶保持每毫克蛋白至少大约350到大约900单位的比活性。

在一些实施方式中，本发明提供了药物组合物，其含有依据本发明的醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶，或依据本发明的核酸编码的多肽。在一些实施方式中，该药物组合物发挥助消化剂的作用。

在一些实施方式中，含有碳-碳键的化合物与依据本发明的多肽在约pH3.0到约pH9.0、约3.0到约10.0、约3.0到约11.0或更高的pH范围内接触，依据本发明的多肽具有醛缩酶活性，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的酶活性。在其它实施方式中，含有碳-碳键的化合物与醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，在至少约55℃、60℃、65℃、70℃、75℃、80℃、85℃、90℃或更高的温度下接触。

本公开还提供了用于促进生产monatin、monatin衍生物及其盐，例如生产R-2-羟基2-(吲哚-3基甲基)-4-酮戊二酸(也是指R-α酮酸monatin、R-monatin前体、R-MP和α酮形式的monatin)，monatin的某些立体异构体的前体，如R,R和S,Rmonatin的过程中的反应的多肽。本公开也提供了使用一种或多种本发明的多肽生产monatin、monatin衍生物、及其盐和内缩合产物的方法。合成R-MP、monatin的立体异构体和/或monatin衍生物的立体异构体的方法包括使用一种或多种具有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332和SEQIDNO:334及其酶活性片段中任何的带有醛缩酶活性的多肽。

同时，合成R-MP、monatin的立体异构体和/或monatin衍生物的立体异构体的方法可包括使用由核酸序列编码的具有醛缩酶活性的多肽，所述核酸序列与依据本发明的核酸，包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多残基的区域内，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性。

此外，合成R-MP、monatin的立体异构体和/或monatin衍生物的立体异构体的方法可包括使用在严格条件下与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338的核酸杂交的核酸序列编码的、具有醛缩酶活性的多肽。

本发明提供了方法，包括：在多步途径中生产选自monatin、monatin衍生物、其盐及其组合的产品，其中该途径中的反应由一种或多种多肽辅助，所述多肽选自包含SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334的氨基酸序列或其片段或子序列的、具有醛缩酶活性的分离的或重组的多肽。在一些实施方式中，其片段或子序列具有至少0.2mgMP/mg蛋白/hr的醛缩酶活性。在其它实施方式中，其片段或子序列具有至少0.1mgMP/mg蛋白/hr的醛缩酶活性。在一些实施方式中，由一种或多种依据本发明的多肽辅助的反应在约1.0到约10.0mM的MgCl₂中进行。在其它实施方式中，由一种或多种依据本发明的多肽辅助的反应在约pH7.0到约pH11.5的条件下进行。在另外的实施方式中，由一种或多种依据本发明的多肽辅助的反应在约0.005％到约1％的聚山梨醇酯洗涤剂中进行。

在一些实施方式中，反应是吲哚-3-丙酮酸与C3碳源之间的反应。在一些实施方式中，反应优选地产生R-2-羟基-2-(吲哚-3-基-甲基)-4-酮戊二酸，而非S-2-羟基-2-(吲哚-3-基-甲基)-4-酮戊二酸。

在一些实施方式中，由多步途径生产的产物是monatin、其盐及其组合。

在其它实施方式中，在多步途径中，R,R-monatin、R-Smonatin或其组合中至少一种以比S,S-monatin或S,R-monatin更大的量被产出。在一些实施方式中，在多步途径中，R,Rmonatin以比R,S-monatin、S,S-monatin和S,R-monatin更大的量产出。

本发明提供了方法，包括：在多步途径中生产选自monatin、monatin衍生物、其盐及其组合的产品，其中该途径中的反应由至少一种由核酸序列编码的多肽辅助，所述核酸序列包含与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338具有至少50％序列同一性百分比的序列。在一些实施方式中，序列同一性百分数至少为95％。在其它实施方式中，序列同一性的百分数为100％。

本发明提供了包含优选地产生R-2-羟基-2-(吲哚-3-基-甲基)-4-酮戊二酸，而非S-2-羟基-2-(吲哚-3-基-甲基)-4-酮戊二酸反应的方法，其中至少一种由核酸序列编码的多肽被用于辅助多步途径中的一个反应，所述多肽包括与SEQIDNO:28、SEQIDNO:116、SEQIDNO:298、SEQIDNO:44、SEQIDNO:54、SEQIDNO:148、SEQIDNO:46、SEQIDNO:134、SEQIDNO:142、SEQIDNO:122、SEQIDNO:74、SEQIDNO:64、SEQIDNO:108、SEQIDNO:96、SEQIDNO:126、SEQIDNO:80、SEQIDNO:36、SEQIDNO:62、SEQIDNO:112、SEQIDNO:130、SEQIDNO:94、SEQIDNO:58、SEQIDNO:50、SEQIDNO:106、SEQIDNO:42、SEQIDNO:278、SEQIDNO:162、SEQIDNO:276、SEQIDNO:178、SEQIDNO:166、SEQIDNO:218、SEQIDNO:224、SEQIDNO:226、SEQIDNO:244、SEQIDNO:250、SEQIDNO:252、SEQIDNO:264、SEQIDNO:268、SEQIDNO:272、SEQIDNO:184、SEQIDNO:282、SEQIDNO:186、SEQIDNO:192、SEQIDNO:200、SEQIDNO:284、SEQIDNO:172、SEQIDNO:180、SEQIDNO:168、SEQIDNO:228、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240和SEQIDNO:156具有至少95％的序列同一性的序列。

本发明提供了方法，包括：在多步途径中生产选自monatin、monatin衍生物、其盐及其组合的产品，其中该途径中的反应由至少一种由核酸序列编码的多肽辅助，所述核酸序列包含在严格条件下与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338的核酸杂交的序列。

本发明也提供了方法，包括：在多步途径中生产选自monatin前体、其盐及其组合的产品，其中该途径中的反应由一种或多种多肽辅助，所述多肽选自具有醛缩酶活性的、包含SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334的氨基酸序列或其片段或子序列的分离的或重组的多肽，其中所述monatin前体、其盐及其组合是甜的。

本发明额外地提供了方法，包括：在多步途径中生产选自monatin前体、其盐及其组合的产品，其中该途径中的反应由至少一种由核酸序列编码的多肽辅助，所述核酸序列包含与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338具有至少50％序列同一性百分比的序列，其中所述monatin前体、其盐及其组合是甜的。

本发明进一步提供了方法，包括：在多步途径中生产选自monatin前体、其盐及其组合的产品，其中该途径中的反应由至少一种由核酸序列编码的多肽辅助，所述核酸序列包含在严格条件下与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338的核酸杂交的序列，其中所述monatin前体、其盐及其组合是甜的。

为了简洁，在本说明书及权利要求书中中间体/产物(如monatin、monatin前体或monatin衍生物(一种或多种))被认为形成的任何地方，术语“和/或其盐”应该被理解为被包括在应用的地方。换句话说，例如，短语“吲哚-3-丙酮酸被转化为MP”应该被理解为是“吲哚-3-丙酮酸被转化为MP和/或其盐”。实际上，普通技术人员可以认识到在所示的反应条件下，中间体/产物的盐事实上存在。

根据一些实施方式，该方法产生monatin或monatin衍生物组合物，其中该组合物的monatin或monatin衍生物组分仅包括R,R和S,R形式的monatin或monatin衍生物。当用于表示只有某些异构体形成时，术语“仅”表示如果外消旋反应不发生，该途径只产生识别的异构体。因此，术语“仅”不应该用来表示不存在其它异构体，相反普通技术人员将会理解，由于可能发生的外消旋反应，其它异构形式可能以相对小的量存在。根据一些实施方式，该方法产生组合物，其中该组合物的monatin或monatin衍生物组分仅包括R,R形式的monatin或monatin衍生物(除了一定程度的外消旋反应发生，产生其它异构形式)。

如这里所用，短语“monatin组合物”表示包含一种或多种monatin异构体的组合物；该术语也可以表示只有单一异构形式的monatin而没有其它。

如这里所用，短语“monatin衍生物组合物”表示包含一种或多种monatin衍生物的异构体的组合物；该术语也可以表示只有单一异构形式的monatin衍生物而没有其它。

如这里所用，短语“monatin衍生物”具有以下结构：

其中，R_a、R_b、R_c、R_d和R_e每一个独立地代表选自氢原子，羟基基团，C₁-C₃烷基基团，C₁-C₃烷氧基基团，氨基基团，卤素原子——如碘原子、溴原子、氯原子或氟原子——的任何取代基，然而，R_a、R_b、R_c、R_d和R_e不能同时都为氢。可选地，R_b和R_c，和/或R_d和R_e分别可以一起形成C₁-C₄亚烷基。

如这里所用，“取代的吲哚-3-丙酮酸”表示吲哚-3-丙酮酸的吲哚环上的一个或多个碳原子独立地被上面定义的R_a、R_b、R_c、R_d和R_e取代基中的一个或多个取代。然而，R_a、R_b、R_c、R_d和R_e不能同时都为氢。可选地，R_b和R_c，和/或R_d和R_e分别可一起形成C₁-C₄亚烷基。

如这里所用，“取代色氨酸”表示色氨酸的吲哚环上的一个或多个碳原子独立地被上面定义的R_a、R_b、R_c、R_d和R_e取代基中的一个或多个取代。然而，R_a、R_b、R_c、R_d和R_e不能同时都为氢。可选地，R_b和R_c，和/或R_d和R_e分别可以一起形成C₁-C₄亚烷基。在一种实施方式中，取代的色氨酸在吲哚环上包含与最终monatin衍生物相同的取代基(一个或多个)。

此外，本文所述的生产monatin的生物合成途径可以使用取代的色氨酸来生产可能具有甜味的monatin衍生物。在一些实施方式中，用在本文所述的生物合成途径中的取代的色氨酸包括氯化色氨酸和5-羟色氨酸。

举例来说，与R,Rmonatin具有结构相似性的氯化D-色氨酸已经被鉴定为非营养性增甜剂(特别是6-氯-D-色氨酸)。类似地，卤化的和羟基取代形式的monatin已经被发现具有甜味。美国公开的专利申请号2005/0118317。卤素和羟基基团可以取代氢，特别在色氨酸的吲哚的苯环上的1-4位上，而不干扰后续向D-或L-色氨酸、吲哚-3-丙酮酸、MP或monatin的转化。取代的吲哚在文献中已经显示出是PLP-酶的合适底物并且已经产出取代的色氨酸。Fukuda,D.S.等，“ProductionofSubstitutedL-TryptophansbyFermentation”,Appl.Environ.Microbiol.，21:841-43(1971)。卤素未显示出在空间上阻碍色氨酸合成酶β亚基催化机理，并且对映特异性(enantiospecificity)也完整无损。

在本发明的一些实施方式中，提供了生产monatin组合物的方法，其包括从L-色氨酸产生吲哚-3-丙酮酸，从吲哚-3-丙酮酸产生2-羟基-2-(吲哚-3-基甲基)-4-酮戊二酸(“monatin前体”或“MP”)，和从MP产生monatin。L-色氨酸产生吲哚-3-丙酮酸的反应由具有对L-色氨酸比R-MP、R,Rmonatin或两者更高特异性、更高活性或两者兼具的酶促进(辅助)。根据某些实施方式，吲哚-3-丙酮酸的反应由具有R-特异醛缩酶活性的酶促进并因此产生R-MP。根据某些实施方式，提供消旋酶，其能够促进色氨酸反应的氨基酸副产物从一种异构形式到另一种异构形式的差向异构化(epimerization)。

在依据本发明的一些实施方式中，提供了生产monatin组合物的方法，其包括从L-色氨酸产生吲哚-3-丙酮酸，从吲哚-3-丙酮酸产生2-羟基-2-(吲哚-3-基甲基)-4-酮戊二酸(“monatin前体”或“MP”)，和从MP产生monatin。L-色氨酸产生吲哚-3-丙酮酸的反应由具有对L-色氨酸比R-MP、R,Rmonatin或两者更高特异性、更高活性或两者兼具的酶促进，并且MP形成monatin的反应由对R-MP具有立体选择性的酶促进。术语“立体选择的(stereoselective)”表示对一种异构体比另一种异构体具有更高特异性、更高活性或两者兼具的酶——本例中是R-MP对S-MP。在优选的实施方式中，与另一种异构体相比，立体选择的酶对一种异构体具有有限的活性。“有限的”活性表示最小的或不可感知的活性，例如根据本文提供的实验确定的。

应该注意，在对一系列反应引用参考的地方，如前面的段落中，本发明不要求每一步被明确地实施；该步骤被隐含地实施就足够。换句话说，例如，生产monatin组合物的方法，其包括从L-色氨酸产生吲哚-3-丙酮酸，从吲哚-3-丙酮酸产生2-羟基-2-(吲哚-3-基甲基)-4-酮戊二酸(“monatin前体”或“MP”)，和从MP产生monatin，其中每个反应由适当的酶促进，可以通过混合L-色氨酸和酶并设置条件以便列举的反应能够发生来进行。在这样的例子中，L-色氨酸可以反应成生吲哚-3-丙酮酸，从L-色氨酸成生的吲哚-3-丙酮酸可以反应形成MP，以及从吲哚-3-丙酮酸成生的MP可以反应形成monatin。该过程例如也可以通过下例的方法进行：提供在适合L-色氨酸的产生发生的条件下能够产生L-色氨酸的化合物；并将该化合物与能够促进所述一系列反应的酶在适合那些反应发生的条件下混合。作为另一个实例，该过程可以如下实施：提供经遗传工程改造以根据所述的途径产生monatin的微生物，并提供适合发酵过程发生的条件。例如，天然产生大量L-色氨酸的微生物可以被遗传工程改造，以产生或过量产生用于促进产生monatin途径中的反应的一种或多种酶，并且提供合适的条件以便该微生物借此产生monatin。

在依据本发明的其它实施方式中，提供了生产monatin的方法，其中当L-色氨酸被转化为吲哚-3-丙酮酸时，底物形成L-氨基酸，吲哚-3-丙酮酸反应形成MP(其可以包括R-MP和S-MP，尽管优选地仅包括R-MP或绝大多数为R-MP)，并且当R-MP被转化为R,Rmonatin时，L-氨基酸反应重新产生(也被称为“再循环(recycle)”)底物。R-MP形成R,Rmonatin的反应由立体转化性氨基转移酶(stereoinvertingaminotransferase)，如D-蛋氨酸氨基转移酶(EC2.6.1.41)或具有D-苯甘氨酸氨基转移酶活性的酶促进。

在依据本发明的其它实施方式中，提供了生产monatin组合物的方法，其包括从L-色氨酸产生D-色氨酸，从D-色氨酸产生吲哚-3-丙酮酸，从吲哚-3-丙酮酸产生R-MP，和从R-MP产生R,Rmonatin。从L-色氨酸产生D-色氨酸由色氨酸消旋酶及其功能等价物促进。在某些另外的实施方式中，D-色氨酸形成吲哚-3-丙酮酸和MP形成monatin的反应由同一酶促进。在还有其他进一步的实施方式中，吲哚-3-丙酮酸的反应由具有R-特异的醛缩酶活性的酶促进并由此形成R-MP，并且D-色氨酸形成吲哚-3-丙酮酸的反应和R-MP形成R,Rmonatin的反应由同一酶促进。

在依据本发明的一些实施方式中，提供了生产monatin衍生物的方法，其包括使用具有R-特异的醛缩酶活性的酶催化反应，从取代的吲哚-3-丙酮酸和丙酮酸生产monatin衍生物。

本发明一个或多个实施方式的细节在下面的附图和说明书中叙述。依据本发明的其它特征、目标和优点将通过说明书和附图以及权利要求而清楚。从本文说明书应该认识到，本发明能够在各种实施方式中进行修改，而不背离本发明的精神和范围。因此，附图和详细的说明书被认为本质上是示例性的而非限制性的。

此处引述的所有出版物、专利、专利申请、GenBank序列和ATCC保藏物均被特意地引入，以作为参考，用于所有目的。

附图简述

下面的附图是本发明的方面的例证性说明，而不意图限制权利要求书所包括的本发明的范围。

图1是流程图，其显示了依据本发明，从L-色氨酸生产R,Rmonatin的酶促方法的实例。在该实例中，所述方法包括在L-色氨酸的反应中使用L-氨基转移酶(其例子包括L-色氨酸氨基转移酶、L-芳香族氨基转移酶、L-天冬氨酸氨基转移酶和L-丙氨酸氨基转移酶)，其对作为底物的L-色氨酸具有比对R-MP更高的特异性和/或选择性，和/或该方法包括使用对作为底物的R,Rmonatin具有有限活性和/或特异性的L-氨基酸氧化酶。在图1图示的特定实例中，L-氨基转移酶或L-氨基酸氧化酶将L-色氨酸转化为吲哚-3-丙酮酸，吲哚-3-丙酮酸与R-特异的醛缩酶和丙酮酸反应产生R-α-酮酸monatin(R-MP)，并且R-MP通过D-氨基转移酶或D-氨基酸脱氢酶被转化为R,Rmonatin。如图1所示，反应是可逆的，但是出于本发明的目的，不要求反应以反方进行。

图2是显示依据本发明，生产R,Rmonatin的另一方法的实例的流程图。在本实例中，该方法包括使用对R-MP有立体选择性的酶将R-MP转化为monatin。在图2图示的特定实例中，色氨酸被显示为在可逆反应中被转化为吲哚-3-丙酮酸。吲哚-3-丙酮酸可以与非立体特异性醛缩酶反应以可逆地形成α-酮酸monatin(R-MP和S-MP)。R-MP通过立体选择性D-氨基转移酶或立体选择性D-氨基酸脱氢酶被可逆地转化为R,Rmonatin。如果使用立体选择性D-氨基转移酶或D-氨基酸脱氢酶，通过非立体特异性醛缩酶形成的任何S-MP可以被转化回吲哚-3-丙酮酸。出于本发明的目的，显示为可逆的反应不需要以反向进行。

图3是显示依据本发明，从L-色氨酸生产R,Rmonatin的又一方法的实例的流程图。在本实例中，该方法包括使用色氨酸消旋酶将L-色氨酸转化为D-色氨酸，和在与形成吲哚-3-丙酮酸的反应偶联的反应中使用D-氨基酸产物，其中吲哚-3-丙酮酸作为与形成R,Rmonatin的反应偶联的反应中的底物。在图3图示的特定实例中，L-色氨酸在可逆反应中通过色氨酸消旋酶被转化为D-色氨酸。D-色氨酸与α-酮戊二酸(α-KG)和宽特异性的D-氨基转移酶反应，产生吲哚-3-丙酮酸和D-谷氨酸。吲哚-3-丙酮酸与丙酮酸和R-特异的醛缩酶反应并转化为R-α-酮酸monatin(R-MP)，并且R-MP与宽特异性的D-氨基转移酶和D-谷氨酸反应，形成R,Rmonatin和α酮戊二酸(α-KG)。如图3所示，每个反应都是可逆的，但是出于本发明的目的，不要求反应以反向进行。

图4是显示依据本发明，从L-色氨酸生产R,Rmonatin的另一方法的实例的流程图。在本实例中，该方法包括将在与L-色氨酸反应偶联的反应中形成的L-氨基酸转化为D-氨基酸；该D-氨基酸作为R-MP被转化为R,Rmonatin的反应的氨基供体。在图4图示的特定实例中，L-色氨酸与L-氨基转移酶和α-酮戊二酸反应，产生吲哚-3-丙酮酸和L-谷氨酸。吲哚-3-丙酮酸与丙酮酸和R-特异的醛缩酶反应并转化为R-α-酮酸monatin(R-MP)，并且R-MP与宽特异性的D-氨基转移酶和D-谷氨酸反应，形成R,Rmonatin和α-酮戊二酸。如图4所示，反应是可逆的，但是出于本发明的目的，不要求反应以反向进行。

图5是显示依据本发明，从L-色氨酸生产R,Rmonatin的另一方法的实例的流程图。在本实例中，该方法包括使用立体转化性酶(stereoinvertingenzyme)酶学上促进R-MP向R,Rmonatin的转化，以便由与L-色氨酸反应偶联的反应形成的L-氨基酸可以被用作与R-MP到R,Rmonatin的反应偶联的反应的底物。在图5图示的特定实例中，L-色氨酸与L-氨基转移酶和草酰乙酸(草酰乙酸盐(酯))、丙酮酸或α-酮戊二酸盐(α-KG)反应生成吲哚-3-丙酮酸，和L-天冬氨酸(如果使用草酰乙酸)、L-丙氨酸(如果使用丙酮酸)或L-谷氨酸(如果使用α-KG)。吲哚-3-丙酮酸与丙酮酸和R-特异的醛缩酶反应并被转化为R-α-酮酸monatin(R-MP)，并且R-MP与立体转化性氨基转移酶和L-天冬氨酸、L-丙氨酸或L-谷氨酸反应，形成R,Rmonatin和草酰乙酸(如果使用L-天冬氨酸)、丙酮酸(如果使用L-丙氨酸)或α-酮戊二酸(α-KG，如果使用L-谷氨酸)。如图5所示，反应是可逆的，但是出于本发明的目的，不要求反应以反向进行。

图6是显示依据本发明生产R,Rmonatin的另一方法的实例的流程图。在本实例中，该方法包括再利用形成吲哚-3-丙酮酸的反应中生成的L-氨基酸，以及D-氨基酸被用作与R-MP通过一些列转化反应形成R,Rmonatin的反应中的反应物。在图6图示的特定实例中，L-色氨酸与L-氨基转移酶和草酰乙酸可逆地反应生成吲哚-3-丙酮酸和L-天冬氨酸。吲哚-3-丙酮酸以可逆的方式与丙酮酸和R-特异的醛缩酶反应并被转化为R-α-酮酸monatin(R-MP)，并且R-MP与D-氨基转移酶和D-丙氨酸可逆地反应形成R,Rmonatin和丙酮酸。使用天冬氨酸4-脱羧酶，L-天冬氨酸被转化为L-丙氨酸和CO₂。用丙氨酸消旋酶，L-丙氨酸被转化为D-丙氨酸。出于本发明的目的，不要求显示为可逆地反应以反向进行。

图7是显示依据本发明生产R,Rmonatin的另一方法的实例的流程图。在本实例中，该方法包括通过将该反应的L-氨基酸副产物转化为另一种产物来推动L-色氨酸反应进行(即推动反应向吲哚-3-丙酮酸产生的方向进行)。在本实例中，使用脱羧酶，L-氨基酸L天冬氨酸副产物在不可逆反应中被转化为L-丙氨酸。在图7图示的特定实例中，L-色氨酸与L-氨基转移酶并与α-酮戊二酸(α-KG)或草酰乙酸可逆地反应，生成吲哚-3-丙酮酸和L-谷氨酸(如果使用α-KG)或L-天冬氨酸(如果使用草酰乙酸)。吲哚-3-丙酮酸与丙酮酸和R-特异的醛缩酶可逆地反应并被转化为R-α-酮酸monatin(R-MP)。R-MP以可逆的方式与D-氨基转移酶和D-氨基酸反应形成R,Rmonatin和草酰乙酸、丙酮酸或α-KG中任何一种。L氨基转移酶反应中的产物L-谷氨酸或L-天冬氨酸使用谷氨酸或天冬氨酸脱羧酶被转化为4-氨基丁酸盐(4-aminobutanoate)和CO₂(如果L-谷氨酸是底物)或β-丙氨酸和CO₂(如果L-天冬氨酸是底物)。出于本发明的目的，不要求显示为可逆的反应以反向进行。

图8是显示依据本发明生产R,Rmonatin的另一方法的实例的流程图。在本实例中，该方法包括通过一些列转化反应再利用L-色氨酸反应中的氨基酸副产物与R-MP反应中的氨基酸反应物。在图8图示的特定实例中，L-色氨酸与L-氨基转移酶并与α-酮戊二酸(α-KG)可逆地反应生成吲哚-3-丙酮酸和L-谷氨酸。吲哚-3-丙酮酸与丙酮酸和R-特异的醛缩酶可逆地反应并被转化为R-α-酮酸monatin(R-MP)。R-MP以可逆的方式与D-氨基转移酶和D-丙氨酸反应形成R,Rmonatin和丙酮酸。L-丙氨酸氨基转移酶和丙酮酸被用于将L-氨基转移酶反应的产物L-谷氨酸转化回α-KG，并带有L-丙氨酸为副产物。丙氨酸消旋酶将L-丙氨酸可逆地转化为D-丙氨酸，其用于第三反应(D-氨基转移酶反应)。出于本发明的目的，不要求显示为可逆的反应以反向进行。

图9是计算机系统的框图。

图10是一个流程图，该图示意性说明了用于将新核苷酸或蛋白序列与序列数据库进行比较以确定该新序列与数据库中序列之间的同源性水平的方法的一个实施方式。

图11是示意性说明计算机中确定两个序列是否同源的方法的一种实施方式的流程图。

图12是示意性说明用于检测序列中特征是否存在的鉴定器进程(identifierprocess)300的一种实施方式的流程图。

图13和14一同示意性说明了在monatin前体(MP)形成中58种不同醛缩酶的活性(每一种由其特定的SEQID编号鉴别)，由LC/MS/MS测量。

图15示意性说明了二硫苏糖醇对通过具有SEQIDNO:88的醛缩酶活性的多肽产生monatin的影响。

在不同的附图中同样的标记符号表示同样的要素。

详述

许多实施方式已经在上文被描述，并将在下面被更详细地描述。本发明的实施方式包括一个或多个所述方面。

缩写和术语

下面提供对术语和方法的解释以更好地描述本公开并在本公开的实施中指导本领域普通技术人员。如这里所用，“包括(includnig)”表示“包含(含有，comprising)”。此外，单数形式的“一/一个(a)”或“一/一个(an)”或“这/这个(该，所述，the)”包括复数指代，除非上下文有明确相反的说明。举例来说，“包含蛋白”的指代包括一种或多种这样的蛋白，而“包含该细胞”的指代包括本领域普通技术人员公知的一个或多个细胞及其等价物，等等。术语“大约”包含在任何测量中发生的实验误差的范围。除非另有说明，所有的测量数据被认为在其前面有词语“大约”，即使该词语“大约”没有明确使用。

保守置换：多肽中一个氨基酸置换另一个氨基酸，该置换对多肽的活性有很小或没有影响。该置换被认为是保守的，不依赖于被交换的氨基酸是否显示出结构或功能上的相似性。举例来说，理想地，包含一个或多个保守置换的色氨酸氨基转移酶多肽保留了色氨酸氨基转移酶的活性。多肽可以通过使用例如标准程序操作编码该多肽的核苷酸序列来产生以含有一个或多个保守置换，所述标准程序如位点定向诱变或PCR或本领域普通技术人员公知的其它方法。

可置换蛋白中原有氨基酸，并且如果对该多肽的活性有很小或没有影响，可被认为是保守置换的氨基酸的非限制性实例包括：Ala用ser或thr置换；arg用gln、his或lys置换；asn用glu、gln、lys、his、asp置换；asp用asn、glu或gln置换；cys用ser或ala置换；gln用asn、glu、lys、his、asp或arg置换；glu用asn、gln、lys或asp置换；gly用pro置换；his用asn、lys、gln、arg、tyr置换；ile用leu、met、val、phe置换；leu用ile、met、val、phe置换；lys用asn、glu、gln、his、arg置换；met用ile、leu、val、phe置换；phe用trp、tyr、met、ile或leu置换；ser用thr、ala置换；thr用ser或ala置换；trp用phe、tyr置换；tyr用his、phe或trp置换；val用met、ile、leu置换。

关于保守置换的其他信息可以在Ben-Bassat等，(J.Bacteriol.169:751-7,1987)，O′Regan等，(Gene77:237-51,1989)，Sahin-Toth等，(ProteinSci.3:240-7,1994)，Hochuli等，(Bio/Technology6:1321-5,1988)，WO00/67796(Curd等)及遗传和分子生物学的标准教科书等地方找到。

衍生：出于本说明书和权利要求书的目的，如果以下一项或多项为真，物质是由生物体或来源“衍生的”：1)该物质存在于生物体/来源中；2)该物质从天然宿主移取；或3)该物质从天然宿主移取并通过例如诱变进化。

分离的：术语“分离的”用在这里是指从其天然宿主移取的任何物质；该物质不需要被纯化。例如“分离的核酸”指的是天然发生的核酸，该核酸与其衍生的生物体天然发生的基因组中紧邻的两个序列(一个在5’端，一个在3’端)都不紧邻。举例来说，没有限制地，分离的核酸可以是任意长度的重组DNA分子，只要通常发现在天然发生的基因组中紧邻该重组DNA分子侧翼的核酸序列中的一个被移除或不存在。因此，没有限制地，分离的核酸包括独立于其它序列作为单独分子存在的重组DNA(如cDNA或由PCR或限制性核酸内切酶处理产生的基因组DNA片段)，以及整合入载体、自主复制的质粒、病毒(如反转录病毒、腺病毒或疱疹病毒)，或整合入原核生物或真核生物基因组DNA的重组DNA。此外，分离的核酸可以包括作为杂交或融合核酸序列的一部分的重组DNA分子。

用在这里，术语“分离的”表示该物质(如依据本发明的蛋白或核酸)被从其原始环境中(诸如天然环境，如果它是天然发生的话)移取。举例来说，存在于活的动物中的天然发生的多核苷酸或多肽不是分离的，但从天然系统中共存材料的部分或全部中分离出来的相同多核苷酸或多肽是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或多肽可以是组合物的一部分并仍是分离的，因为这样的载体或组合物不是其天然环境的一部分。

如这里所用指代核酸的术语“分离的”，也包括任何非天然发生的核酸，因为非天然发生的核酸序列不是在自然界中发现的，在天然发生的基因组中也不具有紧邻的序列。举例来说，非天然发生的核酸，如工程化的核酸，被认为是分离的核酸。工程化的核酸可以使用普通分子克隆或化学核酸合成技术制备。分离的非天然发生的核酸可以独立于其它序列，或整合入载体、自主复制的质粒、病毒(如反转录病毒、腺病毒或疱疹病毒)、或原核生物或真核生物的基因组DNA。此外，非天然发生的核酸可以包括作为杂交或融合核酸序列的一部分的核酸分子。

纯化的：术语“纯化的”用在这里不要求绝对纯净，而是意欲作为相对的术语。因此，举例来说，纯化的多肽或核酸制备物可以是这样的一种：主体多肽或核酸有比该多肽或核酸存在于生物体内其天然环境中更高的浓度，或比其移取的环境中更高的浓度。

从文库中获得的单独的核酸已经按常规方法纯化到电泳级同质性(electrophoretichomogeneity)。从这些克隆中获得的序列不能直接从文库或从总人类DNA获得。依据本发明的纯化的核酸已经从生物体基因组DNA的剩余物中纯化至少10⁴-10⁶倍。在一些实施方式中，术语“纯化的”包括从基因组DNA的剩余中或从文库的其它序列或其它环境中纯化至少一个数量级的核酸，例如，在一些实施方式中，纯化至少两个或三个数量级，或纯化至少四个或五个数量级。

氨基酸：如本文所使用，“氨基酸”或“氨基酸序列”是指寡肽、肽、多肽或蛋白序列，或者指寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基，以及指天然发生的或合成的分子。“氨基酸”或“氨基酸序列”包括寡肽、肽、多肽或蛋白序列，或者指寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基，以及指天然发生的或合成的分子。如本文所使用，术语“多肽”是指通过肽键或修饰的肽键即肽等排体(peptideisosteres)彼此结合在一起的氨基酸，可以含有除20个由基因编码的氨基酸之外的修饰的氨基酸。所述多肽可以通过天然过程，如，翻译后加工或者通过本领域所熟知的化学修饰技术修饰所述多肽。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在给定的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、葡聚体水解酶处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。(参见，Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.Freeman和Company,NewYork(1993)；PosttranslationalCovalentModificationofProteins,B.C.Johnson，Ed.,AcademicPress,NewYork,11-12页(1983))。依据本发明的肽和多肽也包括所有“模拟物”和“肽模拟物”形式，正如下面进一步详细描述的。

具有醛缩酶活性的多肽：“具有醛缩酶活性的多肽”是表示其自身，或与一个或多个额外的多肽(具有相同或不同的序列)关联的多肽，其是具有醛缩酶的酶活性的蛋白。

重组的：“重组的”多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白；即，由用编码期望多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。“合成的”多肽或蛋白是那些通过化学合成制备的多肽或蛋白。固相化学肽合成方法也可以用于合成依据本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12页)，并且这些方法近来已经被用于商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearchBiochemicals)中。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的教导，它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行，而所有的“杆”或者“钉”都被连接到一块板上。

基本相同：短语“基本上相同(substantiallyidentical)”在用于两个核酸或多肽时，是指当两个或更多个序列被比较和联配(比对，aligned)以寻找最大同一性(maximuncorrespondence)时，它们具有例如至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的核苷酸或氨基酸残基(序列)同一性，所述同一性可以使用任意一种已知的序列比较算法测量，或者通过视觉观察。在其他实施方式中，基本上相同存在于至少大约100或更多个残基的区域内，最经常地，在至少大约150至200或更多残基的区域内所述序列是基本上相同的。在一些实施方式中，本发明的核酸序列可以在编码区的整个长度范围内是基本上相同的。

此外，“基本上相同的”氨基酸序列可以是通过一个或多个保守或非保守氨基酸的置换、缺失或插入而与参考序列有所不同的序列。在一些实施方式中，置换发生在不是分子的活性位点的位置，或者可选地，置换发生在分子的活性位点的位置，前提是该多肽基本上保持其功能(酶促)特性。保守的氨基酸置换，例如用一个氨基酸置换另一个相同类别的氨基酸(例如用一个疏水氨基酸，如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸，置换另一个疏水氨基酸，或用一个极性氨基酸置换另一个极性氨基酸，例如用精氨酸置换赖氨酸、用谷氨酸置换天冬氨酸，或用谷氨酰胺置换天冬酰胺)。举例来说，一个或多个氨基酸可以从醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶多肽中缺失，产生多肽结构的修饰而不显著改变其生物学活性。举例来说，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的生物活性不需要的氨基-或羧基端氨基酸可以被除去。依据本发明的修饰的多肽序列可以通过多种方法中任何方法分析其醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶生物活性，所述方法包括将修饰的多肽序列与底物接触并确定修饰的多肽是否减少分析中特定底物的量或增加功能性醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽与底物的酶促反应的生物产物。

片段：如本文所使用，关于蛋白或多肽或核酸的“片段”分别是蛋白、多肽或核酸的一部分。片段可以与该片段从其衍生的更长的蛋白、多肽或核酸序列具有相同或基本相同的氨基酸或核酸序列。也包含与更长的蛋白、多肽或核酸具有不同三维结构的片段。这样的一个实例是“原-形式(pro-form)”分子，例如，低活性的蛋白原(proprotein)，其可以通过切割而被修饰，产生具有显著更高的活性的成熟酶。蛋白或多肽的片段可以是蛋白或多肽的酶学上的活性部分。

立体转化性氨基转移酶：“立体转化性氨基转移酶”是当使用相反手性底物作为氨基供体时，能够优选地或选择性地产生手性氨基酸产物(如monatin)的多肽。举例来说，立体转化性氨基转移酶可以是优选地或选择性地使用L-谷氨酸作为底物产生R,Rmonatin的D-苯基甘氨酸氨基转移酶(也被称作D-4-羟苯基甘氨酸氨基转移酶)。立体转化性氨基转移酶的非限制性实例包括D-蛋氨酸氨基转移酶(EC2.6.1.41)和具有D-苯基甘氨酸氨基转移酶或D-4-羟苯基甘氨酸氨基转移酶活性的酶。

本发明提供了具有醛缩酶，包括丙酮酸醛缩酶，例如没有限制地，HMG和/或KHG醛缩酶活性的多肽，编码它们的多核苷酸，以及制备和使用这些多核苷酸和多肽的方法。在一些实施方式中，本发明也提供了醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，编码这些酶的多核苷酸，这些多核苷酸和多肽的用途。

在一些实施方式中，本发明提供了修饰的或进化的醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶，与未修饰的或未进化的醛缩酶比较，其分别具有提高的比活性。

在一些实施方式中，提供了促进3,4-取代的2-酮-戊二酸产生的醛缩酶，例如丙酮酸醛缩酶，如没有限制地HMG和/或KHG醛缩酶。在一种实施方式中，本发明提供了制备3,4-取代的2-酮-戊二酸的方法，包括：(a)提供具有醛缩酶活性，例如丙酮酸醛缩酶活性，如没有限制地，HMG醛缩酶和/或KHG醛缩酶活性的多肽；(b)提供供体和受体化合物；和(c)在醛缩酶催化3,4-取代的2-酮-戊二酸合成的条件下，使步骤(a)的多肽与步骤(b)的化合物接触，其中任选地，供体和受体是丙酮酸或丙酮酸供体和α-酮酸受体、酮类和/或醛类。

在本发明的另一实施方式中，丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以与D-氨基转移酶结合使用以制备4-取代的D-谷氨酸或其衍生物。4-取代的D-谷氨酸和/或其衍生物可被用作抗生素，因为已经发现这些化合物抑制细菌谷氨酸消旋酶。在一种实施方式中，本发明提供了制备4-取代的D-谷氨酸的方法，包括：(a)提供具有醛缩酶活性，例如丙酮酸醛缩酶活性，如没有限制地，HMG醛缩酶和/或KHG醛缩酶活性的多肽；(b)提供α-酮酸受体和丙酮酸或丙酮酸供体；和(c)在醛缩酶催化4-取代的D-谷氨酸合成的条件下使步骤(a)的多肽与步骤(b)的化合物接触，其中任选地，该多肽具有丙酮酸醛缩酶、HMG醛缩酶和/或KHG醛缩酶活性，并且其中任选地，该方法进一步包括D-氨基转移酶的使用。

在一些实施方式中，本发明提供了含有依据本发明的酶、多肽或多核苷酸的组合物(如酶制备物、食品和食品添加剂、饲料和饲料添加剂、饮料和饮料添加剂、药物和药物添加剂、以及膳食补充剂)。这些组合物可以被配制为多种形式，如液体、凝胶、丸剂、片剂、喷雾剂、薄膜、胶束、粉末、食品、饲料球或胶囊化的形式，包括纳米胶囊化形式。

测量醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性，例如确定多肽是否具有醛缩酶活性，包括丙酮酸活性，如没有限制地，HMG和/或KHG醛缩酶活性的测定方法是本领域公知并且在依据本发明的范围内；参见E.E.Dekker&R.P.Kitson,J.Biol.Chem.267,10507-10514,1992；TahaTS,DeitsTL,Purificationandcharacterizationof2-keto-3-deoxy-6-phosphogluconatealdolasefromAzotobactervinelandii:evidencethattheenzymeisbifunctionaltowards2-keto-4-hydroxyglutaratecleavage,BiochemBiophysResCommun.1994Apr15；200(1):459-66；DekkerEE,KobesRD,GradySR,2-keto-4-hydroxyglutaratealdolasefrombovineliver,MethodsEnzymol.1975；42:280-5；DekkerEE,NishiharaH,GradySR,MethodsEnzymol.1975；42:285-90,2-keto-4-hydroxyglutaratealdolasefromEscherichiacoli；NishiharaH,DekkerEE,BiochimBiophysActa.1969Jul8；185(1):255-7,Astereospecific2-keto-4-hydroxyglutaratealdolasefromEscherichiacoli。确定多肽是否具有醛缩酶活性，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的合适的测定方法的一个实例在实施例3中描述。

在一些实施方式中，本发明的醛缩酶可以被有效地在多种pH条件下使用，包括例如从约3.0到约12.0的范围。在其它实施方式中，本发明的醛缩酶可以在pH值约为3.0、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、10.5、11.0、11.5或约12.0的条件下使用。在酸性或碱性条件下进行的反应条件也可以是有利的，例如在一些依据本发明的酶的工业或制药应用中。

本发明提供了以多种形式和制备物存在的依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽。在依据本发明的方法中，依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽以多种形式和制备物被使用。举例来说，纯化的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽可以用在酶制备物中，所述酶制备物在R-2-羟基-2-(吲哚-3-基甲基)-4-酮戊二酸(R-MP)和monatin的某些立体异构体，如R,R和S,Rmonatin及其盐，以及monatin衍生物的某些立体异构体，如R,R和S,Rmonatin衍生物构型及其盐的生产，或在药物或膳食辅助剂应用中被采用。可选地，依据本发明的酶可以直接用于生产R-2-羟基-2-(吲哚-3-基甲基)-4-酮戊二酸(R-MP)和monatin的某些立体异构体，如R,R和S,Rmonatin及其盐，以及monatin衍生物的某些立体异构体，如R,R和S,Rmonatin衍生物构型及其盐的过程中，以加工食品、液体或饲料等的过程中。

在一些实施方式中，依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽可以使用本领域已知的程序在微生物中表达。在一些实施方式中，依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶多肽可以在依据本发明的方法中在使用前固定在固态支持物上。将酶固定到固体支持物上的方法在本领域内是公知的，例如J.Mol.Cat.B:Enzymatic6(1999)29-39；Chivata等，Biocatalysis:Immobilizedcellsandenzymes，JMol.Cat.37(1986)1-24：Sharma等，ImmobilizedBiomaterialsTechniquesandApplications，Angew.Chem.Int.Ed.Engl.21(1982)837-54：Laskin(Ed.),EnzymesandImmobilizedCellsinBiotechnology。

核酸、探针和抑制性分子

本发明提供了分离的和重组的核酸，例如参见序列表；编码多肽的核酸，包括依据本发明的多核苷酸序列，例如参见序列表；包括表达盒，如含有依据本发明的核酸的表达载体和各种克隆载体。在一些实施方式中，本发明也包括使用依据本发明的核酸发现、鉴定或分离新醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶多肽序列的方法。在一些实施方式中，本发明也包括使用依据本发明的核酸抑制醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶编码基因和转录体表达的方法。

还提供了修饰本发明的核酸的方法，包括通过例如合成连接重装配、优化的定向进化系统和/或饱和诱变例如基因位点饱和诱变(GSSM)产生本发明的核酸变体的方法。术语“饱和诱变”、基因位点饱和诱变或“GSSM”包括使用简并寡核苷酸引物将点突变引入多核苷酸的方法，如在下面所详细描述的。术语“优化的定向进化系统”或“优化的定向进化”包括用于重新装配相关的核酸序列的片段的方法，所述的相关核酸序列例如相关的基因，下面对其进行了详细解释。术语“合成连接重装配”或“SLR”包括以非随机方式连接寡核苷酸片段的方法，下面进行了详细解释。术语“变体”是指在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基处被(分别地)修饰的本发明的多核苷酸或多肽，然而它们仍然保持本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶生物学活性。变体可以通过许多种方法产生，包括的方法诸如，例如易错PCR、改组、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、GSSM及其任意组合。

本发明的核酸可以通过，例如cDNA文库的克隆和表达、通过PCR进行的信息或基因组DNA扩增以及类似的技术来制造、分离和/或操纵。例如，本发明的序列最初来源于环境来源。因此，在一些实施方式中，本发明提供了优选地从常见来源，如环境、混合培养物或细菌来源衍生的编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸，以及它们编码的多肽。

在本发明方法的实践中，同源基因可以通过操纵模板核酸加以修饰，如同在文中所描述的。在一些实施方式中，本发明可以与本技术领域已知的任何方法或方案或设备一起实践，这些方法、方案或设备在科学和专利文献中得到充分描述。

如本文所使用，短语“核酸”或“核酸序列”是指寡核苷酸、核苷酸、多核苷酸，或者寡核苷酸、核苷酸、多核苷酸中任意一种的片段，或者基因组的或合成来源的DNA或RNA，它们可以是单链或双链，并且可以代表正义链或反义(互补)链，或者是指肽核酸(PNA)或者天然或合成来源的任何DNA样或RNA样的物质。短语“核酸”或“核酸序列”包括寡核苷酸、核苷酸、多核苷酸，或者寡核苷酸、核苷酸、多核苷酸中任意一种的片段，或者基因组的或合成来源的DNA或RNA(例如mRNA、rRNA、tRNA、iRNA)，它们可以是单链或双链，并且可以代表正义链或反义链，或者是指肽核酸(PNA)或者天然或合成来源的任何DNA样或RNA样的物质，例如包括iRNA、核糖核蛋白(例如双链iRNA，例如iRNPs)。该术语包括含有天然核苷酸的已知类似物的核酸，即寡核苷酸。该术语也包括具有合成骨架的核酸样结构，例如参见Mata(1997)Toxicol.Appl.Pharmacol.144:189-197；Strauss-Soukup(1997)Biochemistry36:8692-8698；Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。“寡核苷酸”或者包括单链的多脱氧核苷酸，或者包括两个互补的多脱氧核苷酸链，它们可以是化学合成的。这样的合成的寡核苷酸没有5’磷酸，因此如果不在存在激酶的情况下采用ATP添加磷酸，该合成寡核苷酸便不会连接到另一个寡核苷酸上。合成的寡核苷酸可以连接到没有被去磷酸化的片段上。

特定多肽或蛋白的“编码序列”或编码特定多肽或蛋白的“核苷酸序列”是这样的核酸序列，其当置于合适的调节序列的调控下时被转录和翻译成多肽或蛋白质。术语“基因”意指在产生多肽链中所涉及的DNA片段；其包括编码区之前的区域和之后的区域(前导区(leader)和尾区(trailer))，以及在适用的情况下，可以包括各个编码片段(外显子)之间的间插序列(内含子)。启动子序列“可操作地连接到”编码序列上，此时RNA聚合酶可以在启动子处起始转录，将编码序列转录成mRNA。正如此处所用，“可操作地连接(operablylinked)”是指两个或更多个核酸(例如DNA)片段之间的功能关系。“可操作地连接”可以指转录调控序列与被转录序列的功能关系。例如，如果启动子刺激或调节编码序列例如本发明的核酸在适当的宿主细胞或其它表达系统中的转录，那么该启动子便是可操作地连接到编码序列。通常，可操作地连接到被转录序列的启动子转录调控序列与被转录序列是物理上相邻的，即它们是顺式作用。然而，一些转录调控序列，如增强子，不需要与编码序列物理相邻或者位于与编码序列接近的位置，但这些转录调控序列仍增强编码序列的转录。

正如本文所用，术语“表达序列盒(expressioncassette)”指能影响结构基因(即蛋白编码序列，例如，编码本发明的醛缩酶，例如丙酮酸醛缩酶，HMG和/或KHG醛缩酶的序列)在与这样的序列相容的宿主中的表达的核苷酸序列。表达序列盒包括至少一个与多肽编码序列可操作地连接的启动子；并且任选地，可以与其它序列例如转录终止信号序列可操作地连接。也可以使用其它的在实现表达的方面必需的或有用的因子，例如增强子、α-因子。因此，表达序列盒也包括质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体，以及类似物。“载体”包括可以感染、转染、短暂或永久地转导细胞的核酸。应该认识到，载体可以是裸核酸、或与蛋白或脂质复合的核酸。该载体任选地包含病毒或细菌核酸和/或蛋白，和/或膜(例如细胞膜、病毒脂质包被等等)。载体包括但不限于复制子(例如RNA复制子、细菌噬菌体)，DNA片段可以连接到这些复制子上从而可被复制。因此，载体包括但不限于RNA、自主复制环状或线状DNA或RNA(例如质粒、病毒以及类似物，例如参见美国专利5,217,879)，并且包括表达质粒和非表达质粒。在重组微生物或细胞培养物被描述为“表达载体”的宿主的情况下，该载体包括染色体外环状和线状DNA，它们可以已经被整合到宿主染色体中。在载体通过宿主细胞来维持的情况下，该载体或者可以作为自主结构在有丝分裂过程中被细胞稳定地复制，或者被整合进宿主的基因组中。

正如此处所用，术语“重组的”包括与“骨架”核酸相邻的核酸，这些核酸在其天然环境中与该“骨架”核酸是不相邻的。在一些实施方式中，为了被“富集”，核酸表现为在核酸骨架分子群体中有大约5％或更多数量的核酸插入物。本发明的骨架分子包括核酸，如表达载体、自主复制核酸、病毒、整合核酸，以及用于维持或操纵感兴趣的核酸插入物的其它载体或核酸。在一些实施方式中，富集的核酸表现为在重组的骨架分子群体中有大约15％或更多数量的核酸插入物。在一些实施方式中，富集的核酸表现为在重组的骨架分子群体中有大约50％或更多数量的核酸插入物。在一些实施方式中，富集的核酸表现为在重组的骨架分子群体中有大约90％或更多数量的核酸插入物。

本发明的一个实施方式是分离的、合成的或重组的核酸，包括本发明的序列之一，或者含有本发明的核酸的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多个连续碱基的片段。该分离的、合成的或重组的核酸可以包含DNA，包括cDNA、基因组DNA和合成DNA。DNA可以是双链或单链，并且如果是单链，可以是编码链或非编码(反义)链。可选地，该分离的、合成的或重组的核酸包含RNA。

本发明的分离的、合成的或重组的核酸可用于制备本发明的多肽之一，或者含有本发明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段。因此，本发明的另一实施方式是分离的、合成的或重组的核酸，其编码本发明的多肽的一种，或者含有本发明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段。这些核酸的编码序列可以与本发明的核酸之一的编码序列之一相同或者可以是不同的编码本发明的多肽之一的编码序列，所述的多肽具有本发明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸，这是遗传密码子的冗余性或简并性的结果。遗传密码子对于本领域技术人员是熟知的，并可以例如在B.Lewin,GenesVI,OxfordUniversityPress,1997的第214页上得到。

编码本发明的多肽之一或与其基本一致的序列的分离的核酸可包括，但不限于：本发明的核酸的编码序列和另外的编码序列，例如前导序列或蛋白原序列(proproteinsequences)，以及非编码序列，例如内含子，或编码序列的5′和/或3′非编码序列。因此，如在本发明中所使用，术语“编码多肽的多核苷酸”包括多核苷酸，其包括多肽的编码序列以及包含另外的编码和/或非编码序列的多核苷酸。

可选地，使用常规技术，例如位点定向诱变或本领域技术人员熟悉的其它技术，本发明的核酸序列和与其基本一致的序列被诱变，以将沉默改变引入依据本发明的多核苷酸。如本文所使用，“沉默改变(silentchanges)”包括，例如不改变由所述多核苷酸编码的氨基酸序列的改变。这样的改变可能是期望的，以通过引入在宿主微生物中频繁发生的密码子或密码子对而增加由宿主产生多肽的水平，该宿主含有编码所述多肽的载体。

本发明还涉及具有核苷酸改变的多核苷酸，所述核苷酸改变在依据本发明的多肽中导致氨基酸置换、添加、缺失、融合和截短。使用技术例如位点定向诱变、随机化学诱变、外切核酸酶III缺失和其它重组DNA技术，可以导入这样的核苷酸改变。可选地，这样的核苷酸改变可以是天然存在的等位基因变体，其通过鉴定在本文所提供的高严紧条件、中度严紧条件或低严紧条件下特异性杂交到探针的核酸而分离出，所述探针含有依据本发明的序列(或其互补序列)之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基。

常规技术

用于实践本发明的核酸，不管是RNA、siRNA、miRNA、反义核酸、cDNA、基因组DNA、载体、病毒或其杂合体，都可以从多种来源分离、进行遗传工程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽(例如醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)可以被单独地分离或克隆，并且可测试其期望活性。可以使用任何重组表达系统，包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。

可选地，这些核酸可以通过公知的化学合成技术，如Adams(1983)J.Am.Chem.Soc.105:661；Belousov(1997)NucleicAcidsRes.25:3440-3444；Frenkel(1995)FreeRadic.Biol.Med.19:373-380；Blommers(1994)Biochemistry33:7886-7896；Narang(1979)Meth.Enzymol.68:90；Brown(1979)Meth.Enzymol.68:109；Beaucage(1981)Tetra.Lett.22:1859；美国专利号4,458,066中描述的技术，被体外合成。

用于操纵核酸的技术，例如亚克隆、标记探针(例如使用Klenow聚合酶、切口平移、扩增的随机引物标记)、测序、杂交以及类似的技术在科学和专利文献中有充分的描述，例如参见Sambrook编著，MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3卷,ColdSpringHarborLaboratory,(1989)；CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,NewYork(1997)；LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。

获得和操纵用于实践本发明的方法的核酸的另一个有用方法是从基因组样品中克隆，并且如果期望的话，筛选和再克隆插入物，插入物分离或扩增自例如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或cDNA文库，所述文库可以包含在例如哺乳动物人工染色体(MACs)，参见美国专利5,721,118；6,025,155；人类人工染色体，参见Rosenfeld(1997)Nat.Genet.15：333-335；酵母人工染色体(YAC)；细菌人工染色体(BAC)；P1人工染色体，参见Woon(1998)Genomics50：306-316；P1来源的载体(PACs)，参见Kern(1997)Biotechniques23：120-124；粘粒、重组病毒、噬菌体或质粒中。

在一些实施方式中，编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。

本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以被融合到异源肽或多肽上，如N-末端鉴定肽，其给予了期望的特性，如增加的稳定性或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达，其中所述融合蛋白中连接有一个或多个额外的结构域，例如用于产生免疫原性更强的肽、以便更易于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞，等等。有利于检测和纯化的结构域包括，例如金属螯合肽，如多组氨酸标记和组氨酸-色氨酸模块，其允许在固定的金属上纯化，还包括蛋白A结构域，其允许在固定的免疫球蛋白上纯化，还包括在FLAGS延伸/亲和纯化系统中所使用的结构域(ImmunexCorp，SeattleWA)。在纯化结构域和含有基序的肽或多肽之间可切裂的连接子序列的内含物有助于纯化，这样的内含物例如Xa因子或肠激酶(Invitrogen，SanDiegoCA)。例如，表达载体可以包括编码表位的核酸序列，其连接到六组氨酸残基上，然后连接到硫氧还蛋白和肠激酶切割位点(例如参见Williams(1995)Biochemistry34：1787-1797；Dobeli(1998)ProteinExpr.Purif.12：404-414)。组氨酸残基有助于检测和纯化，而肠激酶切割位点提供了将表位与融合蛋白的剩余部分纯化分离开的手段。关于编码融合蛋白的载体的技术以及融合蛋白的应用在科学和专利文献中进行了充分地描述，例如参见Kroll(1993)DNACell.Biol.，12:441-53。

转录和翻译控制序列

本发明提供了可操作地连接到表达(例如转录或翻译)控制序列(一个或多个)上的本发明的核酸(例如DNA)序列，所述控制序列例如启动子或增强子，它们可以指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。示例性的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR启动子以及鼠金属硫蛋白I启动子。

如本文所使用，术语“启动子”包括能够驱动编码序列在细胞中如植物或动物细胞中转录的所有序列。因此，在本发明的构建物中所用的启动子包括顺式作用转录控制元件和调节序列，它们涉及调节或调控基因转录的时间和/或速率。例如，启动子可以是顺式作用转录控制元件，包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5’和3’非翻译区或内含子序列，它们均涉及转录的调节。这些顺式作用序列可与蛋白或其它生物分子互相作用来执行(打开/关闭、调节、调控等等)转录。“组成型”启动子是那些在大部分环境条件和发育状态或细胞分化状态下持续地驱动表达的启动子。“诱导型”或“可调控型”启动子在环境条件或发育条件的影响下指导本发明的核酸的表达。可以通过诱导型启动子影响转录的环境条件的实例包括无氧条件、增高的温度、干旱或光的存在。

“组织特异性”启动子是仅仅在特定细胞或组织或器官中有活性的转录控制元件，例如在植物或动物的特定细胞或组织或器官中有活性。组织特异性调节可以通过某些内在因子来实现，这些内在因子确保对给定组织特异的蛋白编码基因被表达。这样的因子已知存在于哺乳动物和植物中，以便允许特异性组织的发育。

适合于在细菌中表达多肽的启动子包括大肠杆菌lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子和λPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子、以及酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs、以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。适合于在细菌中表达多肽或其片段的启动子包括大肠杆菌lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λP_R启动子和λP_L启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子、以及酸性磷酸酶启动子。真菌启动子包括α-因子启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。

组织特异性植物启动子

本发明提供了能够以组织特异性形式被表达，例如能够以组织特异性形式表达依据本发明的醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的表达盒。在一些实施方式中，本发明也提供了以组织特异性方式表达依据本发明的醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的植物或种子。组织特异性可以是种子特异性、茎特异性、叶特异性、根特异性、果实特异性以及类似的方式。

术语“植物”包括全植物、植物部分(例如叶、茎、花、根等等)、植物原生质体、种子和植物细胞以及它们的后代。可以用于本发明的方法中的植物的种类很广泛，广泛至能用转化技术进行处理的高等植物，包括被子植物(单子叶植物和双子叶植物)，以及裸子植物。它们包括各种倍数性水平的植物，包括多倍体、二倍体、单倍体和半合子植物。正如此处所用，术语“转基因植物”包括异源核酸序列已经被插入到其中的植物或植物细胞，所述异源核酸序列例如依据本发明的核酸和各种重组构建物(例如表达序列盒)。

在一些实施方式中，组成型启动子如CaMV35S启动子可以被用于在植物或种子的特定部分或在整个植物中的表达。例如，为了过度表达，可以使用植物启动子片段，其将指导核酸在植物例如再生植物的一些或所有组织中表达。此处，这样的启动子被称作“组成型”启动子，它们在大部分环境条件和发育或细胞分化状态下是有活性的。组成型启动子的实例包括花椰菜花叶病毒(CaMV)35S转录起始区、来自根瘤农杆菌的T-DNA的1’或2’启动子、以及来自本技术领域已知的多种植物基因的其它转录起始区。这样的基因包括，例如来自拟南芥(Arabidopsis)的ACT11(Huang(1996)PlantMol.Biol.33:125-139)；来自拟南芥的Cat3(GenbankNo.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203)；来自甘蓝型油菜(Brassicanapus)的编码硬酯酰基-酰基载体蛋白去饱和酶的基因(GenbankNo.X74782,Solocombe(1994)PlantPhysiol.104:1167-1176)；来自玉米的GPc1(GenbankNo.X15596；Martinez(1989)J.Mol.Biol.208:551-565)；来自玉米的Gpc2(GenbankNo.U45855；Manjunath(1997)Plant.Mol.Biol.33:97-112)；在美国专利4,962,028；5,633,440中描述的植物启动子。

本发明使用来自病毒的组织特异性或组成型启动子，这些启动子可以包括，例如烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683；稻米东格鲁杆状病毒(RTBV)，该病毒仅在受感染稻米植物中的韧皮细胞中复制，它的启动子驱动强的韧皮特异性报道基因的表达；木薯脉带花叶病毒(CVMV)启动子，其在导管元件、叶中轴细胞、根尖中具有最高活性(Verdaguer(1996)PlantMol.Biol.31:1129-1139)。

在一些实施方式中，植物启动子指导表达醛缩酶，例如丙酮酸醛缩酶、如HMG和/或KHG醛缩酶的核酸在特定的组织、器官或细胞类型中表达(即组织特异性启动子)，或可以在更精确的环境或发育控制或在诱导型启动子的控制下表达。可以影响转录的环境条件的例子包括厌氧条件、提高的温度、有光或喷撒化学品/激素。例如，本发明包括玉米的干旱诱导型启动子(Busk(1997)如上)，马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch(1997)PlantMol.Biol.33:897909)。

在一些实施方式中，组织特异性启动子只在该组织的发育阶段的某个时间段内促进转录。参见，例如描述拟南芥LEAFY基因启动子的Blazquez(1998)PlantCell10:791-800。也见，描述转录因子SPL3的Cardon(1997)PlantJ12:367-77，SPL3识别拟南芥(A.thaliana)的花分生组织特性基因(meristemidentitygene)AP1的启动子区域的保守序列基序；和描述分生组织启动子eIF4的Mandel(1995)PlantMolecularBiology,29卷,995-1004页。可以使用在特定组织的整个生命周期都具有活性的组织特异性启动子。在一些实施方式中，本发明的核酸与主要在棉花纤维细胞中有活性的启动子可操作地连接。在一些实施方式中，本发明的核酸与主要在棉花纤维细胞伸长的阶段具有活性的启动子可操作地连接，例如，Rinehart(1996)supra所描述的。核酸可以与Fbl2A基因启动子可操作地连接，这样它将偏好在棉花纤维细胞(Ibid)中表达。也见John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773；John等,美国专利5,608,148和5,602,321，描述了用于构建转基因棉花植物的棉花纤维特异性启动子和方法。也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包括乙醇脱氢酶基因中的启动子(DeLisle(1990)Int.Rey.Cytol.123:39-60)。也可以使用别的启动子来表达本发明的核酸，包括，例如，胚珠特异的、胚芽特异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的组合；叶特异的启动子(见，例如，Busk(1997)PlantJ.11:12851295，描述玉米的叶特异的启动子)；发根农杆菌(Agrobacteriumrhizogenes)的ORF13启动子(ORF13启动子在根部表现出高活性，见，例如Hansen(1997)如上)；玉米花粉特异性启动子(见，例如Guerrero(1990)Mol.Gen.Genet.224:161168)；番茄启动子，其在果实成熟、变老、从叶上脱落的过程中有活性，在花中具有低一些的活性(见，Blume(1997)PlantJ.12:731746)；马铃薯SK2基因的雌蕊特异性启动子(见，Ficker(1997)PlantMol.Biol.35:425431)；豌豆的Blec4基因，Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶中具有活性，这使它成为使外源基因靶向表达于活跃地生长的芽或纤维的表皮层的有用工具；胚珠特异的BEL1基因(见，Reiser(1995)Cell83:735-742,GenBank号:U39944)；和/或Klee，美国专利5,589,583中的启动子，描述了一种植物启动子区域，其可导致在分生组织和/或快速分裂细胞中的高水平转录。

在一些实施方式中，经由对植物激素例如植物生长素的暴露便能被诱导的植物启动子被用于表达依据本发明的核酸。例如，本发明可以使用大豆(GlycinemaxL.)的植物生长素响应元件E1启动子片段(AuxREs)(Liu(1997)PlantPhysiol.115:397-407)；植物生长素响应性拟南芥GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen(1996)PlantJ.10:955-966)；烟草的植物生长素诱导型parC启动子(Sakai(1996)37:906-913)；植物生物素响应元件(Streit(1997)Mol.PlantMicrobeInteract.10:933-937)；和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science274:1900-1902)。

依据本发明的核酸也可以与植物启动子可操作地连接，所述植物启动子暴露于可施用于植物的化学试剂例如除草剂或抗生素，便能够被诱导。例如，可以使用由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(DeVeylder(1997)PlantCellPhysiol.38:568-577)；不同的除草剂安全剂的应用诱导不同的基因表达模式，包括在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导的启动子的控制下，例如，针对含有燕麦(AvenasativaL.)(oat)精氨酸脱羧酶基因的转基因烟草植物所描述的(Masgrau(1997)PlantJ.11:465-473)；或者处于水杨酸响应元件的控制之下(Stange(1997)PlantJ.11:1315-1324)。使用化学(例如，激素或杀虫剂)诱导的启动子，即，对可施用于田间的转基因植物的化学剂发生响应的启动子，依据本发明的多肽的表达可以在植物发育的特定阶段被诱导。所以，本发明也提供含有可诱导基因的转基因植物，所述可诱导基因编码依据本发明的多肽，其宿主范围局限于靶向植物种类，例如玉米、稻、大麦、大豆、番茄、小麦、马铃薯或别的作物，并且所述可诱导基因在作物发育的任何阶段都可被诱导。

本领域技术人员会认识到，组织特异性的植物启动子可能驱动可操作地连接的序列在不是靶组织的组织中表达。因此，在一些实施方式中，组织特异性启动子是驱动在靶组织或细胞类型中产生优势表达的启动子，但是也可以导致在别的组织中的一些表达。

本发明的核酸也可以与在暴露于化学试剂时被诱导的植物启动子可操作地连接。这些试剂包括例如，除草剂、合成的植物生长激素或抗生素，它们可以通过例如喷雾施用于转基因植物。依据本发明的产生醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸的诱导型表达将允许栽培者对具有最佳的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶表达和/或活性的植物进行选择。植物部分的发育也可以因此被控制。这样，本发明提供了促进植物和植物部分的收获的方法。例如，在许多实施方式中，玉米的由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(DeVeylder(1997)PlantCellPhysiol.38:568-577)；应用不同的除草剂安全剂诱导出不同的基因表达模式，包括在根中、排水器中、芽尖分生组织中的表达。依据本发明的编码序列也可以处于四环素诱导的启动子的控制之下，例如，对含有燕麦(AvenasativaL.)(oat)精氨酸脱羧酶基因的转基因烟草植物的描述(Masgrau(1997)PlantJ.11:465-473)；或者，可以由水杨酸响应元件控制(Stange(1997)PlantJ.11:1315-1324)。

在一些实施方式中，适当的多肽表达在该编码区域的3’端可能需要多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、源自各种类别的其它植物(或者动物或其它)基因或者源自农杆菌T-DNA中的基因。

表达载体和克隆载体

本发明提供了含有依据本发明的核酸，例如编码依据本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的表达载体和克隆载体。依据本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒(phagemids)、粘粒、F粘粒(fosmids)、细菌人工染色体、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪狂犬病病毒和SV40的衍生物)、P1衍生的人工染色体、酵母质粒、酵母人工染色体和任何别的对感兴趣的特定宿主(例如，杆状菌、曲霉和酵母)特异性的载体。依据本发明的载体可以包括染色体、非染色体和合成的DNA序列。大量合适的载体对于本领域技术人员都是已知的，并且可以商业获得。典型的载体包括：细菌：pQE^TM载体(Qiagen,Valencia,CA)、pBLUESCRIPT^TM质粒、pNH载体、λ-ZAP载体(Stratagene,LaJolla,CA)；ptrc99a、PKK223-3、pDR540、pRIT2T(GEHealthcare,Piscataway,NJ)、pET载体(Novagen,Madison,WI)；真核细胞的：PXT1、pSG5(Stratagene,LaJolla,CA)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而，也可以使用任何别的质粒或别的载体，只要它们可以在宿主中复制和存活下去。可以在本发明中使用低拷贝数或高拷贝数的载体。“质粒”可以商购得到，在不受限制的基础上可以公开获得，或可以根据已公开的程序用可获得的质粒来构建。与本文描述的那些质粒等价的质粒在本技术领域是已知的，并且对于普通技术人员是显而易见的。

表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制原点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧翼非转录序列。在一些实施方式中，衍生于SV40剪接子和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录遗传元件。

在一些实施方式中，表达载体含有一个或多个选择性标记基因，使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。启动子区域可以从任何期望的基因中选择出来，这使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体。

在一些实施方式中，用于在真核细胞中表达多肽或其片段的载体含有增强子，以增加表达水平。增强子是DNA的顺式作用元件，一般长度为大约10到大约300bp。它们可以作用于启动子，增强其转录。示例性增强子包括在复制原点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制原点下游侧的多瘤增强子，和腺病毒增强子。

核酸序列可以通过多种方法插入载体。一般而言，将插入物和载体用合适的限制性内切酶消化后，序列可以连接到载体中的所希望的位置。可选择地，插入物和载体的平末端可以被连接。多种克隆技术在本领域内被公知，如Ausubel等，CurrentProtocolsinMolecularBiology，JohnWiley&Sons,Inc.1997和Sambrook等，MolecularCloning:ALaboratoryManual2ndEd.，ColdSpringHarborLaboratoryPress(1989)中所述。这些及其它方法被认为在本领域技术人员的范围内。

载体可以是质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。

可以使用的特定的细菌载体包括商业上可获得的质粒，其包括以下已知的克隆载体的遗传元件：pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、pQE-9(Qiagen,Valencia,CA)、pD10、psiX174pBLUESCRIPTIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene,Valencia,CA)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8、pET(Novagen,Madison,WI)和pCM7。特定的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene,LaJolla,CA)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而，可以使用任何别的载体，只要它可以在宿主细胞中复制和存活。

依据本发明的核酸可以在表达序列盒、载体或病毒中表达，在植物细胞和种子中短暂地或稳定地表达。一个示例性的短暂表达系统应用了附加体(episomal)表达系统，例如，通过含有超螺旋DNA的附加小染色体的转录而在核中产生的花椰菜花叶病毒(CaMV)病毒RNA，见，例如，Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637。作为选择，编码序列，即本发明的序列的全部或子片段，可以插入到植物宿主细胞基因组中，而成为该宿主染色体DNA的整合部分。正义和反义转录子可以以这种方式被表达。包含本发明的核酸的序列(例如，启动子或编码区域)的载体可以包含赋予植物细胞或种子选择性表型的标记基因。例如，所述标记可以编码生物杀灭剂抗性，特别是抗生素抗性，例如对卡那霉素、G418、博来霉素、潮霉素或除草剂的抗性，例如对氯磺隆或Basta的抗性。

可以在植物中表达核酸和蛋白的表达载体在本领域中是熟知的，可以包括，例如，根瘤农杆菌的载体、马铃薯病毒X(见，例如，Angell(1997)EMBOJ.16:3675-3684)、烟草花叶病病毒(见，例如，Casper(1996)Gene173:69-73)、番茄丛矮病毒(见，例如，Hillman(1989)Virology169:42-50)、烟草蚀纹病毒(见，例如，Dolja(l997)Virology234:243-252)、菜豆金色花叶病毒(见，例如，Morinaga(1993)Microbiolinimunol.37:471-476)、花椰菜花叶病毒(见，例如，Cecchini(1997)Mol.PlantMicrobeInteract.10:1094-110l)、玉米Ac/Ds转座元件(见，例如，Rubin(1997)Mol.Cell.Biol.17:6294-6302；Kunze(1996)Curr.Top.Microbiol.Inimunol.204:161-194)，和玉米抑制基因-突变基因(Spm)转座元件(见，例如Schlappi(1996)PlantMol.Biol.32:717-725)；和它们的衍生物。

在一些实施方式中，表达载体可以有两套复制系统，使其可以在两种生物中保持，例如在哺乳动物或昆虫细胞中表达，在原核宿主中克隆和扩增。进一步，对于整合表达载体，该表达载体可以包括至少一个与宿主细胞基因组同源的序列。它可以在该表达构建物的两侧包含两个同源序列。通过选择包含入载体的合适的同源序列，可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建在本领域是已知的。

依据本发明的表达载体也可以包括选择性的标记基因，以便对已经转化的细菌株进行选择，例如，使细菌对药物，例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素产生抗性的基因。选择性的标记也可以包括生物合成基因，例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。

表达载体中的DNA序列被可操纵连接到合适的表达控制序列(一种或多种)(启动子)，以指导RNA合成。具体命名的细菌启动子包括lacI、lacZ、T3、T7、gpt、λP_R、λP_L和trp。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs以及小鼠金属硫蛋白-I启动子。选择合适的载体和启动子在本领域技术人员的水平之内。表达载体还可以包括用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。启动子区域可以从任何期望的基因中选择出来，使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体。此外，在一些实施方式中，表达载体含有一个或多个选择性标记基因，以提供用于选择被转化的宿主细胞的表型特征，例如用于真核细胞培养的二氢叶酸还原酶或新霉素抗性，或例如大肠杆菌中的四环素或氨苄青霉素抗性。

哺乳动物表达载体还可以包括复制原点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5’侧翼非转录序列。在一些实施方式中，衍生于SV40剪接子的DNA序列和聚腺苷酸化位点可以用于提供所需要的非转录基因元件。

用于在真核细胞中表达多肽或其片段的载体也可以含有增强子，以增加表达水平。增强子是DNA的顺式作用元件，一般长度为大约10到大约300bp，其作用于启动子，以增强其转录。示例性增强子包括在复制起点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子，和腺病毒增强子。

此外，表达载体含有一个或多个选择性标记基因，使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。

在一些实施方式中，编码本发明的多肽之一和与其序列基本上相同的或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的相位进行装配。在一些实施方式中，该核酸可以编码融合多肽，其中本发明的多肽之一或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段被融合到异源肽或多肽，例如N-末端鉴定肽，其给予了期望的特性，如增加的稳定性或简化的纯化特性。

合适的DNA序列可以通过各种程序插入载体中。一般而言，将插入物和载体用合适的限制性内切酶消化后，DNA序列可以连接到载体中的所希望的位置。可选择地，插入物和载体的平末端可以被连接。多种克隆技术被公开于Ausubel等.CurrentProtocolsinMolecularBiology,JohnWiley503Sons,Inc.1997和Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。这样的程序和别的程序被认为在本领域技术人员的范围内。

载体可以是例如质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体在Sambrook等,MolecularCloning:ALaboratoryManual,2ndEd.,ColdSpringHarbor,N.Y.,(1989)中描述。

宿主细胞和转化的细胞

本发明也提供了含有依据本发明的核酸序列，例如编码依据本发明的醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的序列，或依据本发明的载体的转化的细胞。宿主细胞可能是本领域普通技术人员熟悉的任意宿主细胞，包括原核细胞，真核细胞，如细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。示例性的细菌细胞包括链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、假单胞菌属(Pseudomonas)或芽孢杆菌属(Bacillus)的任意种，包括大肠杆菌、枯草芽孢杆菌(Bacillussubtilis)、荧光假单胞菌(Pseudomonasfluorescens)、蜡状芽孢杆菌(Bacilluscereus)或沙门氏菌(Salmonellatyphimurium)。示例性的真菌细胞包括曲霉菌属(Aspergillus)的任意种。示例性的酵母细胞包括毕赤酵母属(Pichia)、酿酒酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或许旺酵母属(Schwanniomyces)的任意种，包括巴斯德毕赤酵母(Pichiapastoris)、酿酒酵母(Saccharomycescerevisiae)或粟酒裂殖酵母(Schizosaccharomycespombe)。示例性的昆虫细胞包括草地夜蛾属(Spodoptera)或果蝇属(Drosophila)的任何种，包括果蝇S2和草地夜蛾(Spodoptera)Sf9。示例性的动物细胞包括CHO、COS或黑色素瘤细胞或任何鼠或人的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是已知的，在技术和科学文献中有描述。参见Weising(1988)Ann.Rey.Genet.22:421-477；美国专利5,750,870。

载体可以使用各种技术导入宿主细胞中，包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。

在一些实施方式中，依据本发明的核酸或载体导入细胞是为了筛选，所以，所述核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞类型决定。示例性的方法包括CaPO₄沉淀法、脂质体融合、脂转染法(例如，LIPOFECTIN^TM)、电穿孔法、病毒感染法，等等。候选的核酸可以稳定地整合到宿主细胞基因组中(例如，用反转录病毒导入)或者可以短暂的或稳定的存在于细胞质中(即，通过使用传统的质粒，利用标准的调控序列、选择标记，等等)。因为许多药学上重要的筛选要求人或模型哺乳动物靶细胞，所以可以使用能够转染这些靶的反转录病毒载体。

在适当的情况下，工程宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后，用合适的方法(例如，温度变化或化学诱导)诱导被选择的启动子，细胞再培养一段时期，使得它们产生所需的多肽或其片段。

细胞可以通过离心收获，通过物理或化学方法破碎，保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎，包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞裂解试剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话，可以应用蛋白质重折叠步骤来完成多肽的构象。假如需要的话，在最终的纯化步骤中可以采用高效液相色谱(HPLC)。

宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。取决于重组生产方法中所用的宿主，由含有载体的宿主细胞产生的多肽可以糖基化或者非糖基化。依据本发明的多肽也可以包括或不包括起始甲硫氨酸残基。

也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA，所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些实施方式中，该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育，产生所需的多肽或其片段。

表达载体可以含有一个或多个选择性标记基因，为选择转化宿主细胞提供表型特征，例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性，或者例如大肠杆菌的四环素或氨苄青霉素抗性。

含有感兴趣多核苷酸如本发明的核酸的宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增基因。培养条件例如温度、pH和类似条件是先前选择宿主细胞用于表达所使用的培养条件，对于普通技术人员是明显的。然后，被鉴定为具有指定的酶活性的克隆被测序，以鉴定编码具有增强活性的酶的多核苷酸序列。

本发明提供了在细胞中过量表达重组醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的方法，该方法包括表达含有本发明的核酸的载体，本发明的核酸例如包含在至少约100个残基的区域内与依据本发明的序列具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的核酸序列的核酸，其中序列同一性通过使用序列比较算法的分析或通过视觉观察来确定；或者在严格条件下与本发明的核酸序列杂交的核酸或其子序列。过度表达可以通过任何方式例如使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。

依据本发明的核酸可以在任何体外或体内表达系统中被表达或过度表达。任何细胞培养系统可被用于表达或过度表达重组蛋白，包括细菌、昆虫、酵母、真菌或哺乳动物培养物。通过启动子、增强子、载体(例如，复制子载体、双顺反子载体的使用(见，例如Gurtu(1996)Biochem.Biophys.Res.Commun.229:295-8))、培养基、培养系统等等的合适选择，可以实现过度表达。在一些实施方式中，使用选择标记如谷氨酰胺合酶(见，例如Sanders(1987)Dev.Biol.Stand.66:55-63)在细胞系统中进行的基因扩增被用于过度表达依据本发明的多肽。

关于本方法的额外细节在公共文献中和/或为本领域技术人员公知。在特定的非限制性实例中，这些可公开获得的文献包括EP0659215(W09403612A1)(Nevalainen等)；Lapidot,A.,Mechaly,A.,Shoham,Y.，“Overexpressionandsingle-steppurificationofathermostablexylanasefromBacillusstearothermophilusT-6”，J.Biotechnol.Nov51:259-64(1996)；Lüthi,E.,Jasmat,N.B.,Bergquist,P.L.，“XylanasefromtheextremelythermophilicbacteriumCaldocellumsaccharolyticum:overexpressionofthegeneinEscherichiacoliandcharacterizationofthegeneproduct”，Appl.Environ.Microbiol.Sep56:2677-83(1990)；和Sung,W.L.,Luk,C.K.,Zahab,D.M.,Wakarchuk,W.，“OverexpressionoftheBacillussubtilisandcirculansxylanasesinEscherichiacoli”，ProteinExpr.Purif.Jun4:200-6(1993)，然而这些参考文献没有教导本申请的具有创造性的酶。

宿主细胞可能是本领域普通技术人员熟悉的任何宿主细胞，包括原核细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。作为合适宿主的代表性实例，可能提到的有：细菌细胞，如大肠杆菌、链霉菌属、枯草芽孢杆菌(Bacillussubtilis)、蜡状芽孢杆菌(Bacilluscereus)或沙门氏菌(Salmonellatyphimurium)和假单胞菌属(Pseudomonas)、链霉菌属(Streptomyces)和葡萄球菌属(Staphylococcus)中的各个种；真菌细胞，例如曲霉菌属(Aspergillus)；酵母，例如毕赤酵母属(Pichia)、酿酒酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或许旺酵母属(Schwanniomyces)的任意种，包括巴斯德毕赤酵母(Pichiapastoris)、酿酒酵母(Saccharomycescerevisiae)或粟酒裂殖酵母(Schizosaccharomycespombe)；昆虫细胞，例如果蝇S2和夜蛾Sf9；动物细胞，例如CHO、COS或Bowes黑素瘤及腺病毒。适当宿主的选择在本领域技术人员的能力中。

在适当的情况下，工程宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后，可以用合适的方法(例如，温度变化或化学诱导)诱导被选择的启动子，并且细胞再培养一段时期，使得它们产生所需的多肽或其片段。

各种哺乳动物细胞培养系统也可以被用于表达重组蛋白。哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系(由Gluzman,Cell,23:175,1981描述)，以及能从相容载体表达蛋白的其它细胞系，如C127、3T3、CHO、HeLa和BHK细胞系。

宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。根据重组产生方法中所用的宿主，由含有载体的宿主细胞产生的多肽可以糖基化或者非糖基化。依据本发明的多肽也可以包括或不包括起始甲硫氨酸残基。

可选地，依据本发明的多肽，或者含有其至少5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段，可以通过常规肽合成仪合成产生，例如，如下面所讨论。在其它实施方式中，通过肽合成，所述多肽的片段或部分可以被用于产生相应的全长多肽；因此，所述片段可用作产生全长多肽的中间物。

也可以采用无细胞的翻译系统来产生本发明的多肽之一或含有其至少5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段，其应用由DNA构建物转录得到的mRNA，所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些实施方式中，该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育，产生所需的多肽或其片段。

核酸的扩增

在本发明的实践中，本发明的核酸和编码本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸，或本发明的修饰的核酸，可以通过扩增来增殖，例如，通过PCR。扩增也可以被用于克隆或修饰本发明的核酸。因此，本发明提供了用于扩增本发明核酸的扩增引物序列对。本领域技术人员能设计用于这些序列的任何部分或全长的扩增引物序列对。

在一些实施方式中，本发明提供了通过本发明的扩增引物对扩增的核酸，所述扩增引物对例如本发明的核酸的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个残基以及互补链的大约前(5′)15、16、17、18、19、20、21、22、23、24或25或更多个残基所示的引物对。在一些实施方式中，本发明提供了用于扩增核酸的扩增引物序列对，所述核酸编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽，其中所述引物对能够扩增含有本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个成员或每一成员可以包含寡核苷酸，该寡核苷酸包含所述序列的至少约10至50个或更多个连续碱基，或所述序列的约12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个连续残基。在一些实施方式中，本发明提供了扩增引物对，其中所述引物对包括第一成员和第二成员，第一成员具有本发明核酸的大约前(5’)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个残基所示的序列，第二成员具有第一成员的互补链的大约前(5’)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个残基所示的序列。

本发明提供了通过扩增，例如聚合酶链反应(PCR)，使用依据本发明的扩增引物对产生的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。在一些实施方式中，本发明提供了通过扩增，例如聚合酶链反应(PCR)，使用依据本发明的扩增引物对制备醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的方法。在一些实施方式中，扩增引物对从文库，例如基因文库，如环境文库中扩增核酸。

扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸，或量化样品中特异性核酸的量。在本发明的一个实施方式中，扩增从细胞或cDNA文库分离出的信息。

技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增方法在本技术领域也是已知的，包括，例如聚合酶链式反应PCR(参见PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS，ed.Innis,AcademicPress,N.Y.(1990)和PCRSTRATEGIES(1995),ed.Innis,AcademicPress,Inc.N.Y.,连接酶链式反应(LCR)(参见Wu(1989)Genomics4:560；Landegren(1988)Science241:1077；Barringer(1990)Gene89:117)；转录扩增(参见Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173)；和自主维持序列复制(参见Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874)；Qβ复制酶扩增(参见Smith(1997)J.Clin.Microbiol.35:1477-1491)；自动Q-β复制酶扩增测定法(参见Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介导技术(例如NASBA,Cangene,Mississauga,Ontario)；也参见Berger(1987)MethodsEnzymol.152:307-316；Ausubel等,CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.1997和Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。美国专利4,683,195和4,683,202；Sooknanan(1995)Biotechnology13:563-564。

确定核酸和多肽中的序列同一性

本发明提供了包含这样的序列的核酸，该序列与依据本发明的核酸(参见序列表)在至少约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性(同源性)。在一些实施方式中，本发明提供了包含这样的序列的多肽，该序列与依据本发明的多肽(参见序列表)具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性。序列同一性(同源性)的程度可以使用任何计算机程序和相关参数来确定，包括本文描述的那些，如BLAST2.2.2或FASTA3.0t78版本，参数为默认值。

依据本发明的核酸序列可以包括本发明的序列和与其基本上相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多个连续核苷酸。本发明的核酸序列的同源序列和片段可以指与这些序列具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性(同源性)的序列。同源性(序列同一性)可以使用本文所描述的任何计算机程序和参数来确定，包括FASTA3.0t78版本，参数为默认值。同源序列还包括RNA序列，其中尿嘧啶置换本发明核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一种方法获得，或者从对测序错误的纠正中产生。应该意识到，本发明的核酸序列可以以传统的单字母格式表示(例如参见Stryer,Lubert.Biochemistry,3rdEd.,W.HFreeman&Co.,NewYork的内封底)，或以在序列中记录核苷酸的身份的任何其它格式表示。

在一些实施方式中，本文描述的序列比较程序被用于本发明的该方面，即，确定核酸或多肽序列是否在依据本发明的范围之内。然而，蛋白和/或核酸序列同一性(同源性)可以使用本技术领域已知的任何序列比较算法或程序来评价。这样的算法和程序包括，但不限于，TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(参见Pearson和Lipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988；Altschul等人,J.Mol.Biol.215(3):403-410,1990；Thompson,NucleicAcidsRes.22(2):4673-4680,1994；Higgins等人,MethodsEnzymol.266:383-402,1996；Altschul等人,J.Mol.Biol.215(3):403-410,1990；Altschul等人,NatureGenetics3:266-272,1993)。

在一些实施方式中，同源性或同一性可以使用序列分析软件来测量(例如，地址为1710UniversityAvenue，Madison,WI53705的威斯康星大学生物技术中心遗传学计算机组(GeneticsComputerGroup)的序列分析软件包)。这样的软件通过对各种缺失、置换和其它的修饰赋予同源性度数来匹配相似的序列。在一些实施方式中，用于表示两个或者更多个核酸或者多肽序列之间的关系的术语“同源性”和“同一性”，是指当两个或更多个序列或子序列在某一比较窗口(comparisonwindow)或者指定区域内被比较和联配以确定最大同一性时，这些序列是相同的，或者具有特定百分比例的相同氨基酸残基或核苷酸，其可以应用各种序列比较算法或者通过人工联配和视觉观察来确定。在一些实施方式中，对于序列比较，将一个序列作为参考序列，而将测试序列与之进行比较。当使用序列比较算法时，将测试序列和参考序列输入到计算机中，指定子序列坐标，如果必要，也指定序列算法程序参数。可以使用默认的程序参数，或者可以指定别的参数。然后基于程序参数，序列比较算法计算出测试序列相对于参考序列的序列同一性百分比。

正如本文所用，“比较窗口”包括参考具有任意数目的连续位置的片段，所述数目选自从20到600、通常大约50到大约200，更经常大约100到大约150，其中在序列和参考序列进行最优化联配后，序列可与具有相同数目的连续位置的参考序列作比较。用于比较的序列联配方法在本技术领域是熟知的。可以通过如下方法进行用于比较的序列的最优化联配：例如Smith和Waterman，Adv.Appl.Math.2：482,1981的局部同源性算法，Needleman和Wunsch,J.Mol.Biol.48:443,1970的同源性联配算法，person和Lipman,Proc.Nat′l.Acad.Sci.USA85：2444,1988的查找相似性的方法，这些算法的计算机化实施(WisconsinGeneticsSoftwarePackage中的GAP、BESTFIT、FASTA和TFASTA，GeneticsComputerGroup,575ScienceDr.，Madison,WI)，或手工联配和视觉观察。除了BLAST程序(生物信息国家中心的基本局部联配搜索工具(BasicLocalAlignmentSearchTool))外，用于确定同源性或者同一性的其它的算法包括，例如，ALIGN、AMAS(多重联配序列分析(AnalysisofMultiplyAlignedSequences))、AMPS(蛋白多重序列联配(ProteinMultipleSequenceAlignment))、ASSET(联配片段统计评估工具(AlignedSegmentStatisticalEvaluationTool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(BiologicalSequenceComparativeAnalysisNode))、BLIMPS(BLocksIMProvedSearcher)、FASTA、Intervals&Points、BMB、CLUSTALV、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、LasVegas算法、FNAT(强迫核苷酸联配工具(ForcedNucleotideAlignmentTool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(GlobalAlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(SensitiveSequenceComparison))、LALIGN(局部序列联配(LocalSequenceAlignment))、LCP(局部内容程序(LocalContentProgram))、MACAW(多重联配构建和分析工作台(MultipleAlignmentConstruction&AnalysisWorkbench))、MAP(多重联配程序(MultipleAlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多重序列联配(Pattern-InducedMulti-sequenceAlignment))、SAGA(通过遗传算法的序列联配(SequenceAlignmentbyGeneticAlgorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库，以鉴定具有大体上相同的序列的多核苷酸序列。大量的基因组数据库是可利用的，例如，作为人类基因组测序工程的构成部分的人类基因组的实质部分可以被利用(Gibbs，1995)。至少二十一个其它基因组已经被测序，如，生殖器支原体(M.genitalium)(Fraser等,Science270:397-403(1995))、甲烷球菌(M.jannaschii)(Bult等,Science23:1058-73(1996))、流行性感冒杆菌(H.influenzae)(Fleischmann等,Science269:496-512(1995))、大肠杆菌(E.coli)(Blattner等,Science277:1453-74(1997))和酵母(酿酒酵母(S.cerevisiae))(Mewes等,Nature387:7-65(1997))和黑腹果蝇(D.melanogaster)(Adams等,Science287:2185-95(2000))。在模式生物的基因组序列的测序上已经取得了很大的进展，如小鼠，线虫(C.elegans)和拟南芥某种(Arabadopsissp.)。含有用一些功能性信息注释的基因组信息的一些数据库由不同组织维护，可以通过互联网登录。

在一些实施方式中，BLAST和BLAST2.0算法被使用，其分别被描述于Altschul(1997)Nuc.AcidsRes.25:3389-3402，1997和Altschul(1990)J.Mol.Biol.215:403-410，1990。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法涉及首先通过鉴别待询序列(querysequence)中长度为W的短的字串来确定高分序列对(highscoringsequencepairs，HSPs)，所述高分序列对在与数据库序列中同样长度的字串联配时，匹配或者满足某个正值的阈值分数T。T是指邻近字串(neighborhoodword)的分数阈值(Altschul等，如上)。这些初始的邻近字串分数(hits)被用作启动搜索以发现包含有它们的更长的HSPs的种子。所述字串分数沿着每一个序列向两个方向延伸，直到累积的联配分数可被增加。对于核苷酸序列，使用参数M(一对匹配的残基的奖励分数；总是大于0)来计算累积分数。对于氨基酸序列，使用记分矩阵来计算累计分数。出现下面情况时，字串分数在各个方向上的延伸便停止：累积的联配分数由达到的最大值下降了数量X；由于一个或者多个记分为负的残基联配的累积，累积分数达到0或者0以下；或者达到到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是：字串长度(W)为11，期望值(E)为10，M＝5，N＝-4，对两条链进行比较。对于氨基酸序列，BLASTP程序默认的是：字串长度为3，期望值(E)为10，BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)联配(B)为50，期望值(E)为10，M＝5，N＝-4，对两条链进行比较。

BLAST算法也进行两个序列之间的相似性的统计学分析(参见Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallestsumprobability，P(N))，其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如，在测试核酸和参考核酸的比较中，如果最小合计概率小于大约0.2，在一些实施方式中小于0.01，在其它实施方式中小于大约0.001，就认为该核酸与参考序列相似。

在一些实施方式中，应用基本局部联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。具体而言，五个特定的BLAST程序可以用来进行以下的任务：

(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较；

(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较；

(3)BLASTX把待询核苷酸序列(两条链)的六个框架的概念上的翻译产物与蛋白序列数据库进行比较；

(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较；和

(5)TBLASTX把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。

BLAST程序通过确定相似片段来确定同源序列，所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoringsegmentpairs)”，在一些实施方式中，该受测序列从蛋白或者核酸序列数据库得到。在一些实施方式中，高分片段对利用记分矩阵来鉴定(即，联配)，很多的记分矩阵在本领域是已知的。在一些实施方式中，应用的记分矩阵为BLOSUM62矩阵(Gonnet(1992),Science256：1443-1445；Henikoff和Henikoff(1993)，Proteins17:49-61)。较不优选地，在一些实施方式中，也可以应用PAM或者PAM250矩阵(参见，Schwartz和Dayhoff,eds.,1978,MatricesforDetectingDistanceRelationships:AtlasofproteinSequenceandStructure,Washingion:NationalBiomedicalResearchFoundation)。BLAST程序通过美国国家医学图书馆(U.S.NationalLibraryofMedicine)可以获得。

根据所研究的序列长度和同源性程度，上述算法使用的参数可以被调整。在一些实施方式中，在无用户的指示的情况下，所述参数使用算法所采用的默认参数。

计算机系统和计算机程序产品

本发明提供了计算机、计算机系统、计算机可读取的介质、计算机程序产品以及其上记录或存储了本发明的核酸和多肽序列的类似设备。此外，在实践本发明的方法中，例如，为了在硅之中(insilico)确定和鉴定序列同一性(为了确定核酸是否在本发明的范围之内)、结构同源性、基序等等，依据本发明的核酸或多肽序列可以在可通过计算机读取和访问的任何介质上存储、记录和操作。

正如此处所用，词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练技术人员能容易地采用任何已知方法，在计算机可读取的介质上存储信息，以产生包括本发明的一个或多个核酸和/或多肽序列的产品。正如本文所用，术语“计算机”、“计算机程序”和“处理器”以它们在最广的普通语境中的含义被使用，包括了所有这样的设备，例如下面所详细描述的。特定多肽或蛋白的“编码序列”或“编码特定多肽或蛋白的序列”是指当被置于适当的调控序列的控制下时可被转录和翻译成多肽或蛋白的核酸序列。

依据本发明的多肽包括依据本发明的序列和与其基本上相同的序列以及前述序列的任一个的子序列和酶促活性片段。在一些实施方式中，基本上相同的、或同源的多肽序列是指与依据本发明的序列具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性(同源性)的多肽序列。

同源性(序列同一性)可以使用本文所描述的计算机程序和参数的任一种进行确定。本发明的核酸或多肽序列可以在可通过计算机读取和访问的任何介质上存储、记录和操作。正如此处所用，词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练技术人员能容易地采用任何目前已知的方法，在计算机可读取的介质上存储信息，以产生包括本发明的一个或多个核酸序列、本发明的一个或多个多肽序列的产品。本发明的另一实施方式是其上记录有至少2、5、10、15或20或更多个本发明的核酸或多肽序列的计算机可读取介质。

本发明的另一实施方式是其上记录有本发明的一个或多个核酸序列的计算机可读取介质。本发明的另一实施方式是其上记录有本发明的一个或多个多肽序列的计算机可读取介质。本发明的另一实施方式是其上记录有至少2、5、10、15或20或更多个如上面所述的核酸或多肽序列的计算机可读取介质。

计算机可读取介质包括磁性可读取介质、光学可读取介质、电子可读取介质和磁/光学介质。例如，计算机可读取的介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存取存储器(RAM)或只读存储器(ROM)以及本领域的技术人员已知的其它类型的其它介质。

本发明的一些实施方式包括系统(例如基于因特网的系统)，例如计算机系统，它们存储和操纵本文描述的序列信息。计算机系统100的一个实例以框图形式示意性地描述在图9中。正如此处所用，“计算机系统”指硬件部分、软件部分以及数据存储部分，它们用于分析本发明的核酸序列的核苷酸序列或本发明的多肽序列。在一些实施方式中，计算机系统100包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何熟知类型的中央处理单元，如来自英特尔公司的奔腾III，或来自Sun、Motorola、Compag、AMD或IBM公司的类似处理器。

在一些实施方式中，计算机系统100是一个通用的系统，该系统包括处理器105和用于存储数据的一个或多个内部数据存储部件110，以及用于检索数据存储部件上存储的数据的一个或多个数据检索设备。技术人员能容易地意识到，任何一种当前可获得的计算机系统都是合适的。

在一种实施方式中，计算机系统100包括连接到总线(bus)上的处理器105，总线连接到主存储器115(在一实施方式中，以RAM来实现)和一个或多个内部数据存储设备110，例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。在一些实施方式中，计算机系统100进一步包括一个或多个数据检索设备118，用于读取在内部数据存储设备110上存储的数据。

数据检索设备118可以代表，例如软盘驱动器、压缩磁盘驱动器、磁带驱动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些实施方式中，内部数据存储设备110是可移动的计算机可读介质，例如含有控制逻辑和/或其上记录的数据的软盘、压缩磁盘、磁带等等。计算机系统100可以有利地包括适当的软件或用适当的软件编程，用于当数据存储部件被插入到数据检索设备中时从数据存储部件读取控制逻辑和/或数据。

计算机系统100包括显示器120，用于给计算机用户显示输出。也应用注意到，计算机系统100可以被连接到网络或广域网中的其它计算机系统125a-c，以便给计算机系统100提供集中访问。

用于访问和处理依据本发明的核酸序列的核苷酸序列及与其基本相同的序列，或依据本发明的多肽序列及与其基本相同的序列的软件(例如，检索工具、比较工具和建模工具等等)在执行过程中可驻留于主存储器115中。

在一些实施方式中，计算机系统100可进一步包含用于比较存储在计算机可读介质上的依据本发明的核酸序列及与其基本相同的序列，或依据本发明的多肽序列及与其基本相同的序列与存储于计算机可读介质上的参考核苷酸或多肽序列的序列比较算法。“序列比较算法”指在计算机系统100上执行(本地或远程)的一种或多种程序，以比较核苷酸序列和数据存储设备中存储的其它核苷酸序列和/或化合物。举例来说，序列比较算法可比较存储在计算机可读介质上的依据本发明的核酸序列的核苷酸序列及与其基本相同的序列，或依据本发明的多肽序列及与其基本相同的序列与存储于计算机可读介质上的参考序列，以鉴定同源性或结构基序。

图10是示意性说明过程200的一个实施方式的流程图，该过程用于将新的核苷酸或蛋白序列与序列数据库进行比较，以便确定新序列和数据库中的序列之间的同源性水平。序列数据库可以是存储于计算机系统100上的私人数据库，或可以通过因特网获得的公共数据库如GENBANK。

过程200在起始状态201开始，然后转到状态202，其中要被比较的新序列被存储于计算机系统100的存储器上。正如上面所讨论的，该存储器可以是任何类型的存储器，包括RAM或内部存储设备。

然后过程200转到状态204，其中打开序列数据库以进行分析和比较。然后过程200转到状态206，其中数据库中存储的第一个序列被读取到计算机的存储器中。然后在状态210进行比较，以确定第一个序列是否与第二个序列相同。重要的是应该注意到，该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用于比较两个核苷酸或蛋白序列的熟知的方法对于本技术领域的普通技术人员是已知的，即使所述两个核苷酸或蛋白序列不相同。例如，可以在一个序列中引入空位，以提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入到序列中的参数通常由计算机系统的用户输入。

一旦已经在状态210进行两个序列的比较，在决策状态210就要作出两个序列是否相同的判断。当然，术语“相同的”不限于绝对相同的序列。在过程200中，在由用户输入的同源性参数范围内的序列都将被标记为“相同的”。

如果作出两个序列相同的判断，过程200转到状态214，其中来自数据库的序列的名称被显示给用户。该状态通知用户，具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列的名称被显示给用户，过程200转到决策状态218，其中作出数据库中是否存在更多序列的判断。如果数据库中不存在更多的序列，那么过程200在结束状态220终止。然而，如果数据库中确实存在更多的序列，那么过程200转到状态224，其中指针被指向数据库中的下一个序列，以便与新序列进行比较。以这种方式，将新序列与数据库中的每一序列联配并进行比较。

应该注意到，如果已经在决策状态212已经作出了序列不同源的判断，那么过程200将立即转到决策状态218，以便确定用于比较的数据库中的任何其它序列是否可利用。

因此，本发明的一种实施方式是计算机系统，该系统包括处理器，数据存储设备——其上存储有依据本发明的核酸序列及与其基本相同的序列或依据本发明的多肽序列及与其基本相同的序列，数据存储设备——其上以可检索方式存储了待与依据本发明的核酸序列及与其基本相同的序列或依据本发明的多肽序列及与其基本相同的序列比较的参考核苷酸序列或多肽序列，以及用于进行比较的序列比较器。该序列比较器可指出被比较序列之间的同源性水平，或鉴定上述依据本发明的核酸序列的核酸密码及与其基本相同的序列，或依据本发明的多肽序列及与其基本相同的序列中的结构基序，或其可鉴定与这些核酸密码和多肽密码比较的序列中的结构基序。在一些实施方式中，数据存储设备可具有存储于其上的依据本发明的核酸序列及与其基本相同的序列，或依据本发明的多肽序列及与其基本相同的序列的至少2、5、10、15、20、25、30或40或更多的序列。

本发明的另一实施方式是确定依据本发明的核酸序列及与其基本相同的序列，或依据本发明的多肽序列及与其基本相同的序列与参考核苷酸序列之间同源性水平的方法。所述方法包括通过使用确定同源性水平的计算机程序读取核酸密码或多肽密码以及参考核苷酸或多肽序列，以及用该计算机程序确定核酸密码或多肽密码与参考核苷酸或多肽序列之间的同源性水平。所述计算机程序可以是确定同源性水平的许多计算机程序的任何一种，包括本文中具体罗列的那些程序(例如，BLAST2N，具有默认参数或任何调整的参数)。该方法可使用上述计算机系统实施。所述方法还可以如下进行：通过使用所述计算机程序读取至少2、5、10、15、20、25、30或40个或更多个上述依据本发明的核酸序列及与其基本相同的序列或依据本发明的多肽序列及与其基本相同的序列，以及确定核酸密码或多肽密码与参考核苷酸或多肽序列之间的同源性水平。

图11是示意性说明计算机中实施的过程250的一个实施方式的流程图，该过程用于确定两个序列是否同源。过程250在起始状态252开始，然后转到状态254，其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态256被存储到存储器上。然后过程250转到状态260，其中读取第一个序列中的第一个字符，然后转到状态262，其中读取第二个序列的第一个字符。应该理解到，如果序列是核苷酸序列，那么字符将通常是A、T、C、G或U。如果序列是蛋白序列，那么在一些实施方式中，字符可以是单字母氨基酸密码，以便第一个序列和第二个序列可以被容易地比较。

然后在决策状态264作出两个字符是否相同的判断。如果它们相同，那么过程250转到状态268，其中第一个和第二个序列中的下一个字符被读取。然后作出该下一个字符是否相同的判断。如果它们相同，那么过程250继续循环，直到两个字符不相同。如果作出的判断是这两个字母不相符，那么过程250转到决策状态274，以确定是否有更多的字符或者序列可以读取。

如果没有任何更多的字符可读取，那么过程250转到状态276，其中第一个和第二个序列之间的同源性水平被显示给用户。同源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因此，如果第一个100个核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配，那么同源性水平将是100％。

可以选择地，计算机程序可以是这样的计算机程序，其将本发明所示的核酸序列的核苷酸序列与一个或多个参考核苷酸序列进行比较，以确定本发明的核酸密码及与其基本相同的序列是否在一个或多个位置上与参考核酸序列不同。任选地，这样的程序记录，相对于参考多核苷酸序列或者本发明的核酸序列及与其基本相同的序列，被插入、缺失或置换的核苷酸的长度和身份。在一些实施方式中，计算机程序可以是确定本发明的核酸序列及与其基本相同的序列是否相对于参考核苷酸序列含有单核苷酸多态性(SNP)的程序。

因此，本发明的另一实施方式是确定本发明的核酸序列及与其基本相同的序列是否在一个或多个核苷酸处与参考核苷酸序列不同的方法，所述方法包括步骤：通过使用鉴定核酸序列之间的差异的计算机程序读取核酸密码和参考核苷酸序列，并用该计算机程序鉴定核酸密码和参考核苷酸序列之间的差异。在一些实施方式中，计算机程序是鉴定单核苷酸多态性的程序。该方法可以通过上面描述的计算机程序和图11所示意性说明的方法执行。所述方法还可以如下进行：通过使用所述计算机程序读取至少2、5、10、15、20、25、30或40个或更多个本发明核酸序列及与其基本相同的序列和参考核苷酸序列，以及用该计算机程序鉴定核酸密码与参考核苷酸序列之间的差异。

在其它实施方式中，基于计算机的系统可进一步包含鉴定依据本发明的核酸序列或依据本发明的多肽序列及与其基本相同的序列中的特征的鉴定器(识别器，identifier)。“鉴定器”指的是鉴定依据本发明的核酸序列，或依据本发明的多肽序列中某些特征的一个或多个程序。在一些实施方式中，鉴定器可包含鉴定依据本发明的核酸序列及与其基本相同的序列中的开放阅读框的程序。

图12是示意性说明鉴定器过程300的一个实施方式的流程图，即用于检测序列中特征的存在与否。过程300在起始状态302开始，然后转到状态304，其中将被检查特征的第一个序列存储在计算机系统100的存储器115上。然后过程300转到状态306，其中打开序列特征数据库。这样的数据库包括每一特征的属性以及该特征的名称的列表。例如，特征名称可以是“起始密码子”，属性是“ATG”。另一个实例是特征名称“TAATAA序列盒”，特征属性是“TAATAA”。这样的数据库的实例由威斯康星大学遗传学计算机组(UniversityofWisconsinGeneticsComputerGroup)开发的数据库。可以选择地，这些特征可以是结构性多肽基序如α螺旋、β折叠，或功能性多肽基序如酶活性位点、螺旋-转角-螺旋基序或本技术领域技术人员已知的其它基序。

一旦在状态306打开特征数据库，过程300就转到状态308，其中从数据库读取第一个特征。然后在状态310将第一个特征的属性与第一个序列进行比较。接着在决策状态316作出在第一个序列中是否发现该特征的属性的判断。如果发现了属性，那么过程300转到状态318，其中所发现的特征的名称被显示给用户。

然后，过程300转到决策状态320，其中作出数据库中是否存在更多特征的判断。如果不存在更多特征，那么过程300在结束状态324终止。然而，如果数据库中确实存在更多的特征，那么过程300在状态326读取下一个序列特征，并循环回到状态310，其中将下一个特征的属性与第一个序列进行比较。应当注意，如果在决策状态316在第一个序列中没有发现特征属性，那么过程300直接转到决策状态320，以便确定数据库中是否存在更多特征。

因此，本发明的另一实施方式是鉴定本发明的核酸序列及与其基本相同的序列，或本发明的多肽序列及与其基本相同的序列中的特征的方法，所述方法包括通过使用鉴定其中特征的计算机程序读取核酸密码(一个或多个)或多肽密码(一个或多个)，并用该计算机程序鉴定核酸密码(一个或多个)中的特征。在一些实施方式中，计算机程序包括鉴定开放阅读框的计算机程序。所述方法可以如下进行：通过使用所述计算机程序读取本发明的核酸序列及与其基本相同的序列，或本发明的多肽序列及与其基本相同的序列中的一个序列或至少2、5、10、15、20、25、30或40个或更多个序列，以及用该计算机程序鉴定核酸密码或多肽密码中的特征。

依据本发明的核酸序列及与其基本相同的序列，或本发明的多肽序列及与其基本相同的序列可以以多种格式在各种数据处理器程序中存储和操作。例如，本发明的核酸序列及与其基本相同的序列，或本发明的多肽序列及与其基本相同的序列，可以以文本文件存储在字处理文件中，如MicrosoftWORD^TM或WORDPERFECT^TM，或以ASCII文件存储在本领域技术人员熟悉的各种数据库程序中，例如DB2^TM、SYBASE^TM或ORACLE^TM。此外，许多计算机程序和数据库可以被用作序列比较算法、鉴定器或与本发明的核酸序列及与其基本相同的序列或本发明的多肽序列及与其基本相同的序列进行比较的参考核苷酸序列或多肽序列的来源。下面的罗列不意图限制本发明，而是提供对本发明的核酸序列及与其基本相同的序列或本发明的多肽序列及与其基本相同的序列有用的程序和数据库的指导。

可以使用的程序和数据库，包括但不限于：MACPATTERN^TM(EMBL)、DISCOVERYBASE^TM(MolecularApplicationGroup)、GENEMINE^TM(MolecularApplicationGroup)、LOOK^TM(MolecularApplicationGroup)、MACLOOK^TM(MolecularApplicationGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等人,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等人,Comp.App.Biosci.6:237-245,1990)、CATALYST^TM(MolecularSimulationsInc.)、Catalyst/SHAPE^TM(MolecularSimulationsInc.)、Cerius².DBAccess^TM(MolecularSimulationsInc.)、HypoGen^TM(MolecularSimulationsInc.)、INSIGHTII^TM(MolecularSimulationsInc.)、DISCOVER^TM(MolecularSimulationsInc.)、CHARMm^TM(MolecularSimulationsInc.)、FELIX^TM(MolecularSimulationsInc.)、DELPHI^TM(MolecularSimulationsInc.)、QuanteMM^TM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、MODELER^TM(MolecularSimulationsInc.)、ISIS^TM(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulationsInc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDLAvailableChemicalsDirectory数据库、MDLDrugDataReport数据库、ComprehensiveMedicinalChemistry数据库、Derwent’sWorldDrugIndex数据库、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。基于本发明的公开内容，许多其它程序和数据库对于本技术领域的技术人员是显而易见的。

可以用上述程序检测的基序包括：编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、α螺旋和β折叠、编码指导被编码的蛋白分泌的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性伸展物(acidicstretches)、酶活性位点、底物结合位点和酶切割位点。

核酸的杂交

本发明提供了分离的、合成的或重组的核酸，其在严格条件下与依据本发明的序列杂交(如SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338)。严格条件可以是高度严格的条件、中等严格的条件和/或低严格的条件，包括本文所述的高的和降低的严格条件。在一些实施方式中，洗涤条件的严格性阐述了确定核酸是否在依据本发明的范围内的条件，如下文讨论。

“杂交”指这样一个过程，即，通过该过程核酸链与互补链通过碱基配对而结合。杂交反应可以是灵敏的并且是选择性的，以便感兴趣的特定序列可以被鉴定，甚至在其以低浓度存在的样品中也可以被鉴定。适度的严格条件(stringentconditions)可以通过，例如预杂交和杂交溶液中盐或甲酰胺的浓度来定义，或者通过杂交温度来定义，这些严紧条件在本技术领域是已知的。在其它实施方式中，严格性可以通过降低盐的浓度、增加甲酰胺的浓度或升高杂交温度来增加。在其它实施方式中，本发明的核酸通过它们在各种严紧条件(例如强、中等和低严格条件)下杂交的能力来定义，正如本文所示。

在一些实施方式中，高严格性条件下的杂交包括在约37℃到42℃下大约50％的甲酰胺。在一些实施方式中，杂交条件包括在约30℃到35℃下大约35％到25％的甲酰胺中的降低的严格性条件。在一些实施方式中，杂交条件包括高度严格性条件，例如，在42℃、在50％甲酰胺、5XSSPE、0.3％SDS中，和200n/ml的剪切和变性鲑精DNA。在一些实施方式中，杂交条件包括这些降低的严格性条件，但在降低的温度35℃在35％甲酰胺中。相应于特定的严格性水平的温度范围可以通过计算目标核酸中的嘌呤嘧啶比并相应调节温度而进一步缩小。上述范围和条件的变化在本领域中是熟知的。

在其它实施方式中，本发明的核酸，正如通过它们在严紧条件下杂交的能力所定义的，可以在本发明的核酸的大约五个残基到全长之间；例如它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多残基。也包括小于全长的核酸。这些核酸可以用作，例如杂交探针、标记探针、PCR寡核苷酸探针、siRNA或miRNA(单链或双链)、反义或编码抗体结合肽(表位)、基序、活性位点的序列以及类似序列。

在一些实施方式中，本发明的核酸通过它们在高度严格性下杂交的能力定义，高度严格性包括在大约37℃到42℃的温度下大约50％的甲酰胺的条件。在一些实施方式中，本发明的核酸通过它们在降低的严格性下杂交的能力定义，降低的严格性包括在大约30℃到35℃在大约35％至25％的甲酰胺中的条件。

可选地，本发明的核酸通过它们在高度严格性下杂交的能力定义，高度严格性包括的条件为：在42℃、在50％甲酰胺、5XSSPE、0.3％SDS中，和封闭核酸的重复序列，如cot-1或鲑精DNA(例如200n/ml的剪切和变性鲑精DNA)。在一些实施方式中，本发明的核酸通过它们在降低的严格性条件下杂交的能力定义，降低的严格性条件包括在35℃或42℃的降低温度下的35％或40％甲酰胺中。

在核酸杂交反应中，用于得到特定严格性水平的条件将根据杂交中的核酸的性质变化。例如，所述核酸的杂交区域的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)可以在选择杂交条件时加以考虑。另外的考虑因素是核酸之一是否被固定，例如固定在滤膜上。

杂交可以在低度严格性、中度严格性或高度严格性的条件下进行。作为核酸杂交的一个实例，含有固定化的变性核酸的聚合物膜首先在45℃在含有如下成分的溶液中预杂交30分钟：0.9MNaCl、50mMNaH₂PO₄,pH7.0、5.0mMNa₂EDTA、0.5％SDS、10XDenhardt’s和0.5mg/ml多核糖腺苷酸。然后在该溶液中加入大约2×10⁷cpm(比活性为4-9×10⁸cpm/ug)的³²P末端标记的寡核苷酸探针。在温育12-16小时后，在室温下在含有0.5％SDS的1×SET(150mMNaCl、20mMTris盐酸，pH7.8、1mMNa₂EDTA)中将膜洗涤30分钟，随后，为了该寡核苷酸探针在Tm-10℃的温度下、在新鲜的1×SET中洗涤30分钟。然后将膜暴露于放射自显影胶片，以检测杂交信号。所有的前述杂交将被认为在高严格性条件下。

杂交后，洗涤滤膜(filter)以除去任何非特异性结合的可检测探针。用于洗涤滤膜的严格性也可以根据如下方面进行变化：被杂交的核酸的性质、被杂交的核酸的长度、互补程度、核苷酸序列组成(例如GC对AT含量)和核酸类型(例如RNA和DNA)。逐步增高的严格性条件洗涤的实例如下：2×SSC，0.1％SDS，室温下洗涤15分钟(低度严格性)；0.1×SSC，0.5％SDS，室温下洗涤30分钟到1小时(中度严格性)；0.1×SSC，0.5％SDS，杂交温度和68℃之间洗涤15到30分钟(高度严格性)；和0.15MNaCl，72℃洗涤15分钟(极高严格性)。最终的低严格性洗涤可以在0.1×SSC中在室温下进行。上述的实例仅仅是可用于洗涤滤膜的一组条件的示例性说明。本领域技术人员将知道，对于不同严格性的洗涤，可以有多种方案。下面给出了一些其它实例。

在一些实施方式中，杂交条件包括洗涤步骤，其包括在室温下在含有1×150mMNaCl、20mMTris盐酸,pH7.8、1mMNa₂EDTA、0.5％SDS的溶液中洗涤30分钟，然后在新鲜溶液中洗涤30分钟。

与探针杂交的核酸通过放射自显影或其它传统技术识别。

可以对上述方法进行修饰，以鉴定与探针序列具有降低水平的序列同一性(同源性)的核酸。例如，为了获得与可检测的探针具有降低的序列同一性(同源性)的核酸，可以使用较低严格性的条件。例如，杂交温度可以以5℃的增量从68℃降低到42℃，杂交缓冲液的Na⁺浓度为大约1M。在杂交后，用2×SSC、0.5％SDS在杂交温度下洗涤滤膜。这些条件在高于50℃被认为是“中度”条件，在低于50℃被认为是“低度”条件。特定实例的“中度”杂交条件是当上述杂交在55℃进行。特定实例的“低度严格性”杂交条件是当上述杂交在45℃进行。

可以选择地，杂交可以在含有甲酰胺的缓冲液如6×SSC中在42℃的温度下进行。在这种情况下，杂交缓冲液中甲酰胺的浓度可以以5％的增量从50％降低到0％，以鉴定与探针具有降低水平的同源性的克隆。在杂交后，用6×SSC、0.5％SDS在50℃洗涤滤膜。这些条件在高于25％的甲酰胺被认为是“中度”条件，在低于25％甲酰胺被认为是“低度”条件。特定实例的“中度”杂交条件是当上述杂交在30％甲酰胺中进行。特定实例的“低度严格性”杂交条件是当上述杂交在10％甲酰胺中进行。

然而，杂交形式的选择不是关键性的——洗涤条件的严格性是决定核酸是否在本发明范围内的条件。用于鉴定本发明范围内的核酸的洗涤条件包括，例如：在pH7大约0.02M的盐浓度，至少大约50℃或大约55℃到大约60℃的温度；或者在72℃大约0.15MNaCl的盐浓度下大约15分钟；或者在至少大约50℃或大约55℃到大约60℃的温度下大约0.2×SSC的盐浓度下大约15到大约20分钟；或者用溶液将杂交复合物洗涤两次，所述溶液的盐浓度为含有0.1％SDS的大约2×SSC，在室温下洗涤15分钟，然后用含有0.1％SDS的0.1×SSC在68℃洗涤15分钟，洗涤两次；或者等同的条件。SSC缓冲液和等同条件的描述，参见Sambrook编辑,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3卷,ColdSpringHarborLaboratory,(1989),LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,第I部分.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)和Ausubel编辑.JohnWiley&Sons,Inc.,NewYork(1997)。

这些方法可以被用于分离或鉴定本发明的核酸及与其基本相同的序列。例如，前述方法可用于分离或鉴定核酸，所述核酸具有与选自本发明的序列及与其基本相同的序列或含有其至少大约10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500个连续碱基的片段以及其互补序列之一的核酸序列具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的序列同一性(同源性)的序列。序列同一性(同源性)可以使用联配算法来测量。例如，同源多核苷酸可以具有编码序列，该编码序列是本文描述的编码序列之一的天然发生的等位基因变体。当与本发明的核酸比较时，这样的等位基因变体可以具有一个或多个核苷酸的置换、缺失或添加。另外，上述的方法可用于分离编码多肽的核酸，所述多肽与本发明的多肽或者包含其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有至少大约99％、至少大约95％、至少大约90％、至少大约85％、至少大约80％、至少大约75％、至少大约70％、至少大约65％、至少大约60％、至少大约55％或至少大约50％的序列同一性(同源性)，正如使用序列联配算法(例如FASTA3.0t78版本算法，参数为默认值)所确定的。

寡核苷酸探针及其使用方法

本发明也提供了核酸探针，其可以被用于，诸如鉴定、扩增或分离编码具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽或其片段的核酸，或被用于鉴定醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶基因。在一些实施方式中，探针包含依据本发明的核酸的至少10个连续碱基。可选地，依据本发明的探针可以是依据本发明的核酸中所述序列的至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或约10到50、约20到60、约30到70个连续碱基。探针通过结合和/或杂交识别核酸。探针可以被用在依据本发明的阵列中，见下文讨论，如毛细管阵列。依据本发明的探针也可以被用于分离其它核酸或多肽。

依据本发明的分离的、合成的或重组的核酸，其互补序列，或包含依据本发明的序列之一的至少约10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段，或与其互补的序列也可以被用作探针，以确定生物样品，如土壤样品是否包含具有依据本发明的核酸序列的生物体或该核酸可从其中获得的生物体。在这样的方法中，获得潜在地具有从中可分离出所述核酸的生物体的生物样品，并从样品中获得核酸。将这些核酸在允许探针与样品中存在的任何互补序列特异性杂交的条件下与探针接触。

在必要的时候，允许探针与互补序列特异性杂交的条件，可以通过将探针与来自样品的互补序列以及对照序列进行接触来确定，所述样品已知含有互补序列，所述对照序列不含有互补序列。杂交条件，如杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度或杂交温度，可以被改变以确定允许探针与互补核酸特异性杂交的条件。

如果该样品含有从中可分离出核酸的生物体，那么探针的特异性杂交被检测到。杂交可以通过用可检测的试剂标记探针来检测，所述可检测的试剂如放射性同位素、荧光染料或能催化可检测产物形成的酶。

使用标记探针来检测样品中互补核酸的存在的许多方法对于本领域技术人员是熟知的。这些方法包括Southern印迹、Northern印迹、集落杂交方法和斑点印迹。这些方法中的每一种方法的方案在Ausubel等.CurrentProtocolsinMolecularBiology,JohnWiley503Sons,Inc.(1997)和Sambrook等,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)中提供。

可以选择地，多于一种的探针(其中至少一种探针能与核酸样品中存在的任何互补序列特异性杂交)可以在扩增反应中使用，以确定样品是否包含含有本发明的核酸的生物体(例如从中可分离出所述核酸的生物体)。在一些实施方式中，这些探针包括寡核苷酸。在一些实施方式中，扩增反应可以包括PCR反应。PCR实验方案在在Ausubel和Sambrook,supra中有所描述。可选地，扩增可以包括连接酶链式反应、3SR或链置换反应(见Barany,F.,"TheLigaseChainReactioninaPCRWorld",PCRMethodsandApplications1:5-16,1991；E.Fahy等,"Self-sustainedSequenceReplication(3SR):AnIsothermalTranscription-basedAmplificationSystemAlternativetoPCR",PCRMethodsandApplications1:25-33,1991；以及WalkerG.T.等,"StrandDisplacementAmplification-anIsothermalinvitroDNAAmplificationTechnique",NucleicAcidResearch20:1691-1696,1992)。在这样的方法中，将样品中的核酸与探针接触，进行扩增反应，检测所得到的扩增产物。扩增产物可以通过在反应产物上进行凝胶电泳并用嵌入剂如溴化乙啶染色凝胶来检测。可以选择地，可以用放射性同位素标记一种或多种探针，放射性扩增产物的存在在凝胶电泳后通过放射自显影术来检测。

衍生自本发明序列的末端附近的序列的探针也可以在染色体步移(chromosomewalking)方法中使用，以鉴定含有临近本发明的序列的基因组序列的克隆。这样的方法允许从宿主生物中分离编码额外蛋白的基因。

在一些实施方式中，本发明的分离、合成的或重组的核酸、与其互补的序列、或含有本发明的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500个或更多连续碱基的片段、或与其互补的序列，被用作探针，以鉴定和分离相关的核酸。在一些实施方式中，该相关的核酸可以是来自生物体的cDNA或基因组DNA，这些生物体并不是最初从中分离出所述核酸的生物体。例如，其它生物体可以是相关生物体。在这样的方法中，核酸样品在允许探针与相关序列特异性杂交的条件下与探针接触。然后用上面描述的任意一种方法检测探针与来自相关生物体的核酸的杂交。

通过改变用于鉴定与可检测探针杂交的核酸例如cDNA或基因组DNA的杂交条件的严紧性，可以鉴定并分离与探针具有不同同源性水平的核酸。严格性通过在低于探针的解链温度的变化温度下进行杂交来改变。解链温度Tm是50％的靶序列与完全互补的探针杂交时的温度(在确定的离子强度和pH下)。选择非常严格的条件，使其与特定探针的Tm相等，或比Tm低大约5℃。可以使用下述公式计算探针的解链温度：

对于长度在14到70个核苷酸的探针，使用如下公式计算解链温度(Tm)：Tm＝81.5+16.6(log[Na⁺])+0.41(G+C的比例分数)－(600/N)，其中N是探针的长度。

如果杂交在含有甲酰胺的溶液中进行，解链温度使用如下等式计算：Tm＝81.5+16.6(log[Na⁺])+0.41(G+C的比例分数)－(0.63％甲酰胺)－(600/N)，其中N是探针的长度。

预杂交可以在6×SSC、5×Denhardt’s试剂、0.5％SDS、100μg变性的片段化鲑精DNA或6×SSC、5×Denhardt’s试剂、0.5％SDS、100μg变性的片段化鲑精DNA、50％甲酰胺中进行。SSC和Denhardt’s溶液的配方已在Sambrook等，如上中列出。

在一些实施方式中，杂交通过将可检测探针加入到上面所列出的预杂交溶液中来进行。在探针包括双链DNA的情况下，在加入到杂交溶液之前对探针变性。在一些实施方式中，将滤膜与杂交溶液接触充足的时间，以允许探针与含有与其互补的序列或与其同源的序列的cDNA或基因组DNA杂交。对于长度超过200个核苷酸的探针，杂交可以在比Tm低15-25℃的温度进行。对于更短的探针，如寡核苷酸探针，杂交可以在比Tm低5-10℃的温度进行。在一些实施方式中，6×SSC中的杂交在大约68℃进行。通常，在含有50％甲酰胺的溶液中的杂交是在大约42℃进行的。

抑制醛缩酶的表达

本发明提供了与依据本发明的核酸，例如编码醛缩酶的核酸互补(如其反义序列)的核酸，如包含反义、siRNA、miRNA、核酶的核酸。含有反义序列的依据本发明的核酸能够抑制编码醛缩酶的基因的转运、剪接或转录。这种抑制可以通过靶向基因组DNA或信使RNA生效。作为靶标的核酸的转录或功能可以被抑制，例如通过杂交和/或切割。本发明提供的一组示例性的抑制剂包括能够结合醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶基因或信使，在任一种情况下阻止或抑制醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的产生或功能的寡核苷酸。结合可通过序列特异性杂交来完成。另一类有用的抑制剂包括引起醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶信使失活或剪切的寡核苷酸。所述寡核苷酸可以具有引起这样剪切的酶活性，如核酶。可以对寡核苷酸进行化学修饰，或与能切割互补核酸的酶或组分偶联。可以对许多不同的这样的寡核苷酸的库进行筛选来寻找那些具有期望活性的寡核苷酸。因此，本发明提供了在核酸和/或蛋白水平上抑制醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶表达的多种组合物，如含有依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶序列的反义、siRNA、miRNA和核酶，和抗如依据本发明的醛缩酶，例如抗丙酮酸醛缩酶，抗HMG和/或抗KHG醛缩酶的抗体。

醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶表达的抑制可以具有各种工业应用。例如，抑制醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的表达可以减慢或防止变坏。在一些实施方式中，本发明的抑制醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的表达和/或活性的组合物的使用，例如抗体、反义寡核苷酸、核酶、siRNA和miRNA的使用，被用于减慢或防止变坏。因此，在一些实施方式中，本发明提供了方法和组合物，包括将本发明的抗体、反义寡核苷酸、核酶、siRNA和miRNA应用于植物或者植物产品(如，谷物、谷粒、果实、种籽、根、叶等)，以阻止或者延缓变坏。这些组合物也可以由植物(如，转基因植物)或者其它生物(如，用本发明的醛缩酶，例如丙酮酸醛缩酶，HMG和/或KHG醛缩酶的基因转化的细菌或者其它微生物)表达。

依据本发明用于抑制醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶表达的组分(例如，反义序列、iRNA、核酶、抗体)可用作药物组合物，例如，抗病原剂，或用在其它治疗中，例如用作抗微生物剂，如用于沙门氏菌属。

反义寡核苷酸

本发明提供了能结合醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶信息的反义寡核苷酸，在一些实施方式中，其能通过以mRNA作为靶标来抑制醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性。设计反义寡核苷酸的策略在科学和专利文献中有很好的描述，技术人员能使用本发明的新试剂设计这样的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶寡核苷酸。例如，筛选有效的反义寡核苷酸的基因步移/RNA作图方法在本技术领域是熟知的，参见Ho(2000)MethodsEnzymol.314:168-183，该文献描述了RNA作图分析法，该分析法是基于标准的分子技术，以提供用于有效的反义序列选择的一种简单且可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。

自然发生的核酸被用作反义寡核苷酸。该反义寡核苷酸可以是任意长度；例如，在可选择的方面，该反义寡核苷酸在大约5到100之间，大约10到80之间，大约15到60之间，大约18到40之间。最适长度可以通过常规筛选来决定。这些反义寡核苷酸可以以任意浓度存在。最适浓度可通过常规筛选来决定。广泛种类的合成的、非天然发生的核苷酸和核酸类似物是已知的，它们可以解决这一潜在的问题。例如，可以使用含有非离子骨架的肽核酸(PNAs)，如含有N-(2-氨基乙基)甘氨酸单元。也可以使用具有硫代磷酸酯键的反义寡核苷酸，正如在如下文献中所描述的：WO97/03211；WO96/39154；Mata(1997)ToxicolApplPharmacol144:189-197；AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N.J.,1996)。正如上面所描述的，本发明提供的具有合成DNA骨架类似物的反义寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫代乙缩醛、亚甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸。

组合化学方法学可用于产生大量能被快速筛选特异性寡核苷酸的寡核苷酸，所述特异性寡核苷酸对任何靶标具有适当的结合亲和性和特异性，例如本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的正义和反义序列(参见Gold(1995)J.,Biol.Chem.270:13581-13584)。

抑制性核酶

本发明提供了能结合醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的信息的核酶。这些核酶能抑制醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性，例如通过以mRNA作为靶标。设计核酶和选择用于靶向的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶特异性反义序列的策略在科学和专利文献中有很好的描述，熟练技术人员能使用本发明的新试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分来与靶RNA结合，从而发挥作用，核酶的靶RNA结合部分与该RNA上切割靶RNA的酶促部分非常接近。这样，通过互补的碱基配对，核酶识别和结合靶RNA，而且一旦结合于正确的位置，便以酶促活性作用来切割靶RNA和使其失活。如果切割发生在编码序列中，以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合和切割其RNA靶之后，它可以从该RNA上释放出来并且重复结合和切割新的靶。

在一些情况下，核酶的酶促性质会优于其它的技术，如反义技术(其中核酸分子仅结合于核酸靶来阻止其转录、翻译或者与其它分子的联系)，因为实现治疗效果所必要的核酶有效浓度可能低于反义寡核苷酸的浓度。这一潜在的优点反映出核酶可以以酶促方式进行作用的能力。因此，单个核酶分子可以切割靶RNA的多个分子。在一些实施方式中，核酶是高度特异性的抑制物，其抑制作用的特异性不仅依赖于碱基配对的结合机制，也依赖于该分子抑制与其结合的RNA的表达的机制。即，所述抑制是由切割靶RNA引起的，因此特异性定义为靶RNA的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素，这种切割机制还依赖于另外的因素。这样，核酶作用的特异性比结合于同样的RNA位点的反义寡核苷酸强。

本发明的核酶，例如，具有酶活的核酶RNA分子，可以形成锤头状基序、发夹基序，如肝炎δ病毒基序、I类内含子基序和/或与RNA引导序列(guidesequence)相联系的RNaseP样RNA。锤头状基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有说明；发夹基序在Hampel(1989)Biochemistry28:4929和Hampel(1990)Nuc.AcidsRes.18:299中有说明；肝炎δ病毒基序在Perrotta(1992)Biochemistry31:16中有说明；RNaseP基序在Guetrier-Takada(1983)Cell35:849中有说明；I类内含子在Cech美国专利4,987,071中有说明。这些特定基序的引述并不是限制性的。本领域技术人员将认识到本发明的核酶，如，本发明的有酶活的RNA分子，可以有与一个或者多个靶基因的RNA区域互补的特异性底物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。

RNA干扰(RNAi)

在一些实施方式中，本发明提供了被称为“RNAi”分子的RNA抑制性分子，其含有本发明的醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的酶序列。RNAi分子可以包括双链RNA(dsRNA)分子，例如siRNA、miRNA和/或短发夹RNA(shRNA)分子。RNAi分子，如siRNA(小抑制性RNA)和/或miRNA(微小RNA)，可抑制醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的酶基因的表达。在一些实施方式中，RNAi分子如siRNA和/或miRNA的长度大约为11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或更多个双链核苷酸。尽管本发明不限于任何特殊的作用机制，但是RNAi可进入细胞中并引起相似或相同序列的单链RNA(ssRNA)的降解，包括内源性mRNA。当细胞暴露于双链RNA(dsRNA)时，来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为短的干扰RNA的短的碎片，它可触发与其序列匹配的mRNA的降解。在一些实施方式中，本发明的RNAi可用于基因沉默(gene-silencing)疗法中，见，例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一些实施方式中，本发明提供了使用本发明的RNAi的分子如siRNA和/或miRNA选择性降解RNA的方法。该方法可在体外、离体或体内实施。在一些实施方式中，本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的突变。

一方面，RNAi的细胞内引入是通过与含有吸附的RNAi(如小RNA)的RNA结合蛋白连接的靶细胞特异配体的内化(internalization)完成的。该配体对独特的靶细胞表面抗原是特异的。在结合细胞表面抗原后，该配体可以自发地内化。如果独特的细胞表面抗原与其配体结合后不能自然内化，内化可以通过向配体或RNA结合蛋白的结构中插入富含精氨酸的肽或其它膜渗透肽，或通过将这样的肽粘附到配体或RNA结合蛋白上来促进。参见美国专利申请公开号20060030003；20060025361；20060019286；20060019258。一方面，本发明提供了基于脂质的制剂，作为含有RNAi分子的核酸-脂质颗粒向细胞输送，如引入本发明的核酸。参见例如，美国专利申请公开号20060008910。

核酸的修饰——产生本发明变体酶

本发明提供了产生依据本发明的核酸的变体的方法，例如编码醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的核酸。这些方法可以被重复或以各种组合使用，以产生具有与模板核酸编码的醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶相比改变的或不同活性，或改变的或不同稳定性的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。这些方法也可以被重复或以多种组合使用，从而例如在基因/信息表达、信息翻译或信息稳定性方面产生变化。在其它实施方式中，细胞的遗传组成可以被改变，例如通过同源基因的离体修饰，随后再将其重新插入到细胞中。

可以通过任何方法改变本发明核酸。例如，无规则或随机方法，或非随机或“定向进化”方法，参见例如第6,361,974号美国专利。基因随机突变的方法在本领域为公知，参见例如第5,830,696号美国专利。例如，可使用诱变剂对基因进行随机突变。诱变剂包括单独或组合的，例如，紫外线或γ射线，或化学诱变剂，例如，丝裂霉素、亚硝酸、光活化补骨脂素，以诱导可以通过重组修复的DNA断裂。其它化学诱变剂包括，例如亚硫酸氢钠、亚硝酸、羟胺、肼或甲酸。其它诱变剂为核苷酸前体的类似物，例如亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或吖啶。这些试剂可以置换核苷酸前体加入PCR反应，从而突变所述序列。也可使用插入剂，如普罗黄素、吖啶黄素、喹吖因及类似物。

可使用分子生物学中的任何技术，例如随机PCR诱变，参见Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471；或，组合多重盒式诱变，参见Crameri(1995)Biotechniques18:194-196。可选地，核酸，例如基因，可以在无规则或“随机”片段化后进行重装配，参见第6,291,242；6,287,862；6,287,861；5,955,358；5,830,721；5,824,514；5,811,238；5,605,793号美国专利。在其它实施方式中，修饰、添加或缺失可以通过包括如下方法中的方法来引入，包括：易错PCR、改组、寡核苷酸诱导的定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配(诸如GeneReassembly，参见美国专利号6,537,776)、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成、染色体饱和诱变(CSM)和/或这些及其它方法的组合。

下列出版物描述了可结合入本发明方法的多种递归重组程序和/或方法：Stemmer(1999)“Molecularbreedingofvirusesfortargetingandotherclinicalproperties”(病毒的靶向和其它临床性质的分子育种)TumorTargeting4:1-4；Ness(1999)NatureBiotechnology17:893-896；Chang(1999)“EvolutionofacytokineusingDNAfamilyshuffling”(使用DNA家族改组对细胞因子进行进化)NatureBiotechnology17:793-797；Minshull(1999)“Proteinevolutionbymolecularbreeding”(通过分子育种进行蛋白进化)CurrentOpinioninChemicalBiology3:284-290；Christians(1999)“DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling”(使用DNA家族改组的胸苷激酶AZT磷酸化的定向进化)NatureBiotechnology17:259-264；Crameri(1998)“DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution”(来自多样化物种的基因家族的DNA改组加速定向进化)Nature391:288-291；Crameri(1997)“MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling”(通过DNA改组对砷酸盐解毒途径进行分子进化)NatureBiotechnology15:436-438；Zhang(1997)“DirectedevolutionofaneffectivefucosidasefromagalactosidasebyDNAshufflingandscreening”(通过DNA改组和筛选进行从半乳糖苷酶到有效岩藻糖苷酶的定向进化)Proc.Natl.Acad.Sci.USA94:4504-4509；Patten等(1997)“ApplicationsofDNAShufflingtoPharmaceuticalsandVaccines”(对药物和疫苗应用DNA改组)CurrentOpinioninBiotechnology8:724-733；Crameri等(1996)“Constructionandevolutionofantibody-phagelibrariesbyDNAshuffling(通过DNA改组进行抗体-噬菌体文库的构建和进化)”NatureMedicine2:100-103；Gates等(1996)“Affinityselectiveisolationofligandsfrompeptidelibrariesthroughdisplayonalacrepressor′headpiecedimer′”(通过在lac抑制子‘头片二聚体’上进行显示从肽文库中选择性亲和分离配体)JournalofMolecularBiology255:373-386；Stemmer(1996)“SexualPCRandAssemblyPCR”(有性PCR和装配PCR)，选自：TheEncyclopediaofMolecularBiology(分子生物学百科全书)，VCHPublisher，NewYork，第447-457页；Crameri和Stemmer(1995)“Combinatorialmultiplecassettemutagenesiscreatesallthepermutationsofmutantandwildtypecassettes”(组合多重盒式诱变创建突变型和野生型盒的全部排列)BioTechniques18:194-195；Stemmer等(1995)“Single-stepassemblyofageneandentireplasmidformlargenumbersofoligodeoxyribonucleotides”(一步装配基因和完整质粒形成大量寡脱氧核糖核苷酸)Gene，164:49-53；Stemmer(1995)“TheEvolutionofMolecularComputation”(分子计算的演变)Science270:1510；Stemmer(1995)“SearchingSequenceSpace”(搜索序列空间)Bio/Technology13:549-553；Stemmer(1994)“RapidevolutionofaproteininvitrobyDNAshuffling”(通过DNA改组在体外对蛋白进行快速进化)Nature370:389-391；和Stemmer(1994)“DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution”(通过随机片段化和重装配进行DNA改组：用于分子进化的体外重组)Proc.Natl.Acad.Sci.USA91:10747-10751。

产生多样性的突变方法包括，例如，位点定向诱变(Ling等(1997)“ApproachestoDNAmutagenesis:anoverview(DNA诱变方法综述)”AnalBiochem.254(2)：157-178；Dale等(1996)“Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod(使用硫代磷酸酯方法的寡核苷酸指导的随机诱变)”MethodsMol.Biol.57:369-374；Smith(1985)“Invitromutagenesis”(体外诱变)Ann.Rev.Genet.19:423-462；Botstein和Shortle(1985)“Strategiesandapplicationsofinvitromutagenesis”(体外诱变的策略和应用)Science229:1193-1201；Carter(1986)“Site-directedmutagenesis(位点定向诱变)”Biochem.J.237:1-7；和Kunkel(1987)“Theefficiencyofoligonucleotidedirectedmutagenesis”(寡核苷酸定向诱变的效率)，NucleicAcids&MolecularBiology(核酸与分子生物学)(Eckstein，F.和Lilley，D.M.J.编，SpringerVerlag，Berlin))；使用包含尿嘧啶的模板的诱变(Kunkel(1985)“Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection”(无需进行表型选择的快速、有效的位点特异性诱变)Proc.Natl.Acad.Sci.USA82:488-492；Kunkel等(1987)“Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection”(无需进行表型选择的快速、有效的位点特异性诱变)MethodsinEnzymol.154，367-382；和Bass等(1988)“MutantTrprepressorswithnewDNA-bindingspecificities”(使用新DNA结合特异性对Trp抑制子进行突变)Science242:240-245)；寡核苷酸定向诱变(MethodsinEnzymol.100：468-500(1983)；MethodsinEnzymol.154：329-350(1987)；Zoller(1982)“Oligonucleotide-directedmutagenesisusingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanyDNAfragment”(使用M13衍生载体的寡核苷酸定向诱变：在任何DNA片段中生产点突变的有效和通用的程序)NucleicAcidsRes.10:6487-6500；Zoller和Smith(1983)“Oligonucleotide-directedmutagenesisofDNAfragmentsclonedintoM13vectors”(克隆至M13载体的DNA片段的寡核苷酸定向诱变)MethodsinEnzymol.100:468-500；和Zoller(1987)“Oligonucleotide-directedmutagenesis:asimplemethodusingtwooligonucleotideprimersandasingle-strandedDNAtemplate”(寡核苷酸定向诱变：使用两个寡核苷酸引物和单链DNA模板的简单的方法)MethodsinEnzymol.154:329-350)；硫代磷酸酯改性的DNA诱变(Taylor(1985)“Theuseofphosphorothioate-modifiedDNAinrestrictionenzymereactionstopreparenickedDNA”(在限制性酶反应中使用硫代磷酸酯改性的DNA以制备带切口的DNA)Nucl.AcidsRes.13:8749-8764；Taylor(1985)“Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifiedDNA”(使用硫代磷酸酯改性的DNA高频快速产生寡核苷酸指导的突变)Nucl.AcidsRes.13:8765-8787(1985)；Nakamaye(1986)“InhibitionofrestrictionendonucleaseNciⅠcleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis”(通过硫代磷酸酯基团抑制限制性内切酶NciⅠ切割及其在寡核苷酸定向诱变中的应用)Nucl.AcidsRes.14:9679-9698；Sayers(1988)“Y-TExonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis”(基于硫代磷酸酯的寡核苷酸定向诱变中的Y-T外切核酸酶)Nucl.AcidsRes.16:791-802；和Sayers等(1988)“Strandspecificcleavageofphosphorothioate-containingDNAbyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide”(通过在存在溴化乙锭的条件下与限制性核酸内切酶反应对包含硫代磷酸酯的DNA进行链特异性切割)Nucl.AcidsRes.16:803-814)；使用带缺口的双链体DNA的诱变(Kramer等(1984)“ThegappedduplexDNAapproachtooligonucleotide-directedmutationconstruction”(构建寡核苷酸指导的突变的带缺口的双链体DNA方法)Nucl.AcidsRes.12:9441-9456；Kramer和Fritz(1987)MethodsinEnzymol.“Oligonucleotide-directedconstructionofmutationsviagappedduplexDNA”(通过带缺口的双链体DNA构建寡核苷酸指导的突变)154:350-367；Kramer(1988)“ImprovedenzymaticinvitroreactionsinthegappedduplexDNAapproachtooligonucleotide-directedconstructionofmutations”(改进构建寡核苷酸指导的突变的带缺口的双链体DNA方法中的体外酶反应)Nucl.AcidsRes.16:7207；和Fritz(1988)“Oligonucleotide-directedconstructionofmutations:agappedduplexDNAprocedurewithoutenzymaticreactionsinvitro”(构建寡核苷酸指导的突变：无需体外酶反应的带缺口的双链体DNA程序)Nucl.AcidsRes.16:6987-6999)。

可用于实施本发明的其它的方案包括点错配修复(Kramer(1984)“PointMismatchRepair”(点错配修复)Cell38:879-887)，使用修复缺陷宿主菌株的诱变(Carter等(1985)“Improvedoligonucleotidesite-directedmutagenesisusingM13vectors”(使用M13载体改进寡核苷酸定向诱变)Nucl.AcidsRes.13:4431-4443；和Carter(1987)“Improvedoligonucleotidesite-directedmutagenesisusingM13vectors”(使用M13载体改进寡核苷酸定向诱变)MethodsinEnzymol.154:382-403)、缺失诱变(Eghtedarzadeh(1986)“Useofoligonucleotidestogeneratelargedeletions”(使用寡核苷酸产生大缺失)Nucl.AcidsRes.14:5115)、限制-选择和限制-选择和限制-纯化(Wells等(1986)“Importanceofhydrogen-bondformationinstabilizingthetransitionstateofsubtilisin”(氢键形成在稳定枯草杆菌蛋白酶的转变状态中的重要性)Phil.Trans.R.Soc.Lond.A317:415-423)、通过合成完整基因进行的诱变(Nambiar等(1984)“TotalsynthesisandcloningofagenecodingfortheribonucleaseSprotein”(完整合成和克隆编码核糖核酸酶S蛋白的基因)Science223:1299-1301；Sakamar和Khorana(1988)“Totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein(transducin)”(完整合成和表达牛视杆细胞外节鸟嘌呤核苷酸-结合蛋白(转导素)的a-亚基的基因)Nucl.AcidsRes.14:6361-6372；Wells等(1985)“Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites”(盒式诱变：在指定位点产生多重突变的有效方法)Gene34:315-323；和Grundstrom等(1985)“Oligonucleotide-directedmutagenesisbymicroscale"shot-gun"genesynthesis”(通过微量“鸟枪法^”基因合成进行寡核苷酸定向诱变)Nucl.AcidsRes.13:3305-3316)、双链断裂修复(Mandecki(1986)；Arnold(1993)“Proteinengineeringforunusualenvironments”(用于特殊环境的蛋白质工程)CurrentOpinioninBiotechnology4:450-455。“Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:amethodforsite-specificmutagenesis”(大肠杆菌质粒中的寡核苷酸指导的双链断裂修复：一种位点特异性诱变方法)Proc.Natl.Acad.Sci.USA，83:7177-7181)。有关上述许多方法的其他的详情，可以参见MethodsinEnzymology，第154卷，它还描述了各种诱变方法的故障解决问题的有用调节。

可用于实施本发明的方案被描述于，例如，授予Stemmer的第5,605,793号美国专利(1997年2月25日)“MethodsforInVitroRecombination”(体外重组的方法)；授予Stemmer等的第5,811,238号美国专利(1998年9月22日)“MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination”(通过迭代选择和重组产生具有所需的特性的多核苷酸的方法)；授予Stemmer等的第5,830,721号美国专利(1998年11月3日)“DNAMutagenesisbyRandomFragmentationandReassembly”(通过随机片段化和重装配进行DNA诱变)；授予Stemmer等的第5,834,252号美国专利(1998年11月10日)“End-ComplementaryPolymeraseReaction”(末端互补的聚合酶反应)；授予Minshull等的第5,837,458号美国专利(1998年11月17日)“MethodsandCompositionsforCellularandMetabolicEngineering”(细胞和代谢工程的方法和组合物)；WO95/22625，Stemmer和Crameri，“MutagenesisbyRandomFragmentationandReassembly”(通过随机片段化和重装配进行诱变)；WO96/33207，Stemmer和Lipschutz，“EndComplementaryPolymeraseChainReaction”(末端互补的聚合酶链式反应)；WO97/20078，Stemmer和Crameri，“MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination”(通过迭代选择和重组产生具有所需的特性的多核苷酸的方法)；WO97/35966，Minshull和Stemmer，“MethodsandCompositionsforCellularandMetabolicEngineering”(细胞和代谢工程的方法和组合物)；WO99/41402，Punnonen等，“TargetingofGeneticVaccineVectors”(基因疫苗载体的靶向)；WO99/41383，Punnonen等，“AntigenLibraryImmunization”(抗原文库免疫)；WO99/41369，Punnonen等，“GeneticVaccineVectorEngineering”(基因疫苗载体工程)；WO99/41368，Punnonen等，“OptimizationofImmunomodulatoryPropertiesofGeneticVaccines”(基因疫苗免疫调节特性的优化)；EP752008，Stemmer和Crameri，“DNAMutagenesisbyRandomFragmentationandReassembly”(通过随机片段化和重装配进行DNA诱变)；EP0932670，Stemmer，“EvolvingCellularDNAUptakebyRecursiveSequenceRecombination”(通过递归序列重组实现细胞DNA进化)；WO99/23107，Stemmer等，“ModificationofVirusTropismandHostRangebyViralGenomeShuffling”(通过病毒基因组改组改变病毒嗜性和宿主范围)；WO99/21979，Apt等，“HumanPapillomavirusVectors”(人乳头状瘤病毒载体)；WO98/31837，delCardayre等，“EvolutionofWholeCellsandOrganismsbyRecursiveSequenceRecombination”(通过递归序列重组实现全细胞和生物体进化)；WO98/27230，Patten和Stemmer，“MethodsandCompositionsforPolypeptideEngineering”(多肽工程的方法和组合物)；WO98/27230，Stemmer等，“MethodsforOptimizationofGeneTherapybyRecursiveSequenceShufflingandSelection”(通过递归序列改组和选择优化基因治疗的方法)；WO00/00632，“MethodsforGeneratingHighlyDiverseLibraries”(产生高度多样化的文库的方法)，WO00/09679，“MethodsforObtaininginVitroRecombinedPolynucleotideSequenceBanksandResultingSequences”(体外获得重组多核苷酸序列库和所得序列的方法)，WO98/42832，Arnold等，“RecombinationofPolynucleotideSequencesUsingRandomorDefinedPrimers”(使用随机或确定的引物对多核苷酸序列进行重组)，WO99/29902，Arnold等，“MethodforCreatingPolynucleotideandPolypeptideSequences”(制备多核苷酸和多肽序列的方法)，WO98/41653，Vind，“AninVitroMethodforConstructionofaDNALibrary”(构建DNA文库的体外方法)，WO98/41622，Borchert等，“MethodforConstructingaLibraryUsingDNAShuffling”(使用DNA改组构建文库的方法)，和WO98/42727，Pati和Zarling，“SequenceAlterationsusingHomologousRecombination”(使用同源重组改变序列)。

可用于实施本发明的方案(提供有关产生多样化的各种方法的详情)描述于，例如，第(USSN)09/407,800号美国专利申请，“SHUFFLINGOFCODONALTEREDGENES”(密码子发生改变的基因的改组)，Patten等，1999年9月28日提交；“EVOLUTIONOFWHOLECELLSANDORGANISMSBYRECURSIVESEQUENCERECOMBINATION”(通过递归序列重组实现全细胞和生物体进化)，delCardayre等，第6,379,964号美国专利；“OLIGONUCLEOTIDEMEDIATEDNUCLEICACIDRECOMBINATION”(寡核苷酸介导的核酸重组)，Crameri等，第6,319,714；6,368,861；6,376,246；6,423,542；6,426,224号美国专利和PCT/US00/01203；“USEOFCODON-VARIEDOLIGONUCLEOTIDESYNTHESISFORSYNTHETICSHUFFLING”(使用密码子发生改变的寡核苷酸合成进行合成改组)，Welch等，第6,436,675号美国专利；“METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDES&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS”(制备具有所需的特性的字符串、多核苷酸和多肽的方法)，Selifonov等，2000年1月18日提交(PCT/US00/01202)和，例如“METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDES&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS”(制备具有所需的特性的字符串、多核苷酸和多肽的方法)，Selifonov等，2000年7月18日提交(美国序号09/618,579)；“METHODSOFPOPULATINGDATASTRUCTURESFORUSEINEVOLUTIONARYSIMULATIONS”(增加数据结构以用于进化模拟的方法)，Selifonov和Stemmer，2000年1月18日提交(PCT/US00/01138)；和“SINGLE-STRANDEDNUCLEICACIDTEMPLATE-MEDIATEDRECOMBINATIONANDNUCLEICACIDFRAGMENTISOLATION”(单链核酸模板介导的重组和核酸片段分离)，Affholter，2000年9月6日提交(美国序号09/656,549)；和第6,177,263、6,153,410号美国专利。

非随机或“定向进化”方法包括例如，饱和诱变如基因位点饱和诱变(GSSM)、合成连接重装配(SLR)或其组合，用于修饰本发明核酸以产生具有新的或改变的特性(例如，在强酸或强碱条件下，高温或低温下及类似条件下的活性)的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。在测试碳-碳键形成或切割或其它活性之前，可以对所述修饰的核酸编码的多肽进行活性筛选。任何测试模式或方案均可使用，例如，使用毛细管阵列平台。参见第6,361,974；6,280,926；5,939,250号美国专利。

基因位点饱和诱变或GSSM

本发明也提供了使用基因位点饱和诱变或GSSM制备酶的方法，如在本文中以及也在美国专利6,171,820和6,579,258所述的。在一些实施方式中，含有简并N,N,G/T序列的密码子引物被用于将点突变引入多核苷酸，例如醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶或本发明的抗体中，以便产生一组子代多肽，其中在每一氨基酸位置上可表现出全范围的单氨基酸置换，置换发生的位置例如酶活性位点中的氨基酸残基，或被靶向的待被修饰的配体结合位点。这些寡核苷酸可以包括相邻的第一同源序列，简并N,N,G/T序列，和任选地第二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化，这是由于N,N,G/T序列的简并性包括了所有20个氨基酸的密码子。在一些实施方式中，一个这样的简并寡核苷酸(例如包括一个简并N,N,G/T序列盒(cassette))被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子取代。在其它实施方式中，使用至少两个简并序列盒，或在相同的寡核苷酸中或不同的寡核苷酸中，用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子取代。例如，一个寡核苷酸中可以包含一个以上N,N,G/T序列，以便在多于一个的位点上引入氨基酸突变。这些多个N,N,G/T序列可以直接相邻，或由一个或多个额外的核苷酸序列分隔开。在其它实施方式中，用于引入插入和缺失的寡核苷酸可以单独使用，或者与含有N,N,G/T序列的密码子组合使用，以便引入氨基酸插入、缺失和/或置换的任何排列组合。

在一些实施方式中，两个或更多个连续氨基酸位置的同时诱变是使用含有相邻N,N,G/T三联体的寡核苷酸进行的，即简并(N,N,G/T)_n序列。在其它实施方式中，使用与N,N,G/T序列相比具有较低简并性的简并序列盒。例如，在一些情况下，可能期望(例如，在寡核苷酸中)使用仅包括一个N的简并三联体序列，其中所述的N可以在三联体的第一、第二或第三位置上。在该三联体的剩余两个位置上，可以使用包括任意排列组合的任何其它碱基。可以选择地，在一些情况下可期望使用(例如在寡聚体中)简并N,N,N三联体序列。

在一些实施方式中，使用简并三联体(例如N,N,G/T三联体)允许在多肽中的每一和每个氨基酸位置上系统且容易地产生完全范围的可能的天然氨基酸(总共20种氨基酸)(在其它实施方式中，这些方法也包括在每一氨基酸残基或密码子、位置产生低于所有可能种类的置换)。例如，对于100个氨基酸的多肽，可以产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)。通过使用含有简并N,N,G/T三联体的寡核苷酸或一组寡核苷酸，32种不同序列可编码所有20种可能的天然氨基酸。因此，在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的反应容器中，产生了编码20种不同多肽的32种不同的子代多核苷酸。相反，在位点定向诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。非简并寡核苷酸可以任选地与所公开的简并引物组合使用；例如，非简并寡核苷酸可以被用于在工作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。

在一些实施方式中，每一饱和诱变反应容器含有编码至少20种子代多肽(例如醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)分子的多核苷酸，以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置(其它实施方式使用了少于20个天然的组合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以进行克隆扩增(例如使用表达载体克隆到合适的宿主中，例如大肠杆菌宿主中)，并进行表达筛选。当单个子代多肽通过筛选鉴定，显示出有利的特性变化时(当与亲本多肽相比时，如在碱性或酸性条件下提高的碳-碳键形成或剪切活性)，可以对其测序以鉴定其中所含的相应的有利氨基酸置换。

在一些实施方式中，如本文所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后，可以在超过一个的氨基酸位置确定出的有利的氨基酸变化。可以产生一个或多个新的子代分子，其含有所有或部分这些有利的氨基酸置换的组合。例如，如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化，那么排列包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性，以及两个有利变化中的每一个的可能性)和3个位置。因此，总共有3×3×3或27种可能性，其中包括了先前被检验的7种可能性，即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。

而在另一实施方式中，位点饱和诱变可以与改组、嵌合、重组和其它诱变方法以及筛选一起使用。本发明提供了以反复的方式使用任何诱变方法，包括饱和诱变。在一个实例中，任何诱变方法的反复使用结合筛选使用。

本发明还提供了使用专有密码子引物(含有简并N,N,N序列)将点突变引入多核苷酸中，以便产生一组子代多肽，其中在每一氨基酸位置上可表现出全范围的单氨基酸置换(基因位点饱和诱变(GSSM))。这些使用的寡聚体包括相邻的第一同源序列，简并N,N,N序列，以及在一些实施方式中不必须包括第二同源序列。由使用这些寡聚体而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化，这是由于N,N,N序列的简并性包括了所有20个氨基酸的密码子。

在一些实施方式中，一个这样的简并寡聚体(包括一个简并N,N,N序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子取代。在其他实施方式中，使用至少两个简并N,N,N序列盒，或在相同的寡聚体中或不同的寡聚体中，用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子取代。因此，一个寡聚体中可以包含一个以上N,N,N序列，以便在多于一个的位点上引入氨基酸突变。这些多个N,N,N序列可以直接相邻，或由一个或多个额外的核苷酸序列分隔开。在其他实施方式中，用于引入插入和缺失的寡聚体可以单独使用，或者与含有N,N,N序列的密码子组合使用，以便引入氨基酸插入、缺失和/或置换的任何排列组合。

在一些实施方式中，使用含有相邻N,N,N三联体的寡聚体，即简并(N,N,N)_n序列，进行两个或更多个连续氨基酸位置的同时诱变是可能的。在其他实施方式中，本发明提供了使用与N,N,N序列相比具有较低简并性的简并序列盒。例如，在一些情况下可能期望使用(例如在寡聚体中)仅包括一个N的简并三联体序列，其中所述的N可以在三联体的第一、第二或第三位置上。在三联体的剩余两个位置上，可以使用包括任意排列组合的任何其它碱基。可以选择地，在一些情况下可能期望使用(例如在寡聚体中)简并N,N,N三联体序列、N,N,G/T或N,N,G/C三联体序列。

在一些实施方式中，由于若干个原因，使用简并三联体(例如N,N,G/T或N,N,G/C三联体序列)是有利的。在一些实施方式中，本发明提供了在多肽中的每一和所有氨基酸位置上系统且相对容易地产生完全范围的可能的天然氨基酸(总共20种氨基酸)的置换的方法。因此，对于100个氨基酸的多肽，本发明提供了系统且相对容易地产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)的方法。可以理解，通过使用含有简并N,N,G/T或N,N,G/C三联体序列的寡聚体，提供32种不同序列，其编码20种可能的氨基酸。因此，在其中使用至少一种这样的寡聚体对亲本多核苷酸序列进行饱和诱变的反应容器中，产生了编码20种不同多肽的32种不同的子代多核苷酸。相反，在位点定向诱变中使用非简并寡聚体在每个反应容器中仅仅导致一种子代多肽。

本发明还提供了非简并寡聚体的使用，其可以任选地与所公开的简并引物组合使用。可以理解，在一些情况中，使用非简并寡聚体在工作多核苷酸中产生特异性点突变是有利的。本发明提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。

因此，在本发明的一些实施方式中，每一饱和诱变反应容器含有编码至少20种子代多肽分子的多核苷酸，以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的大肠杆菌宿主中)，并进行表达筛选。当单个子代多肽通过筛选鉴定，显示出有利的特性变化时(当与亲本多肽相比时)，可以对其测序以鉴定其中所含的相应的有利氨基酸置换。

在一些实施方式中，如本文所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后，可以在超过一个的氨基酸位置鉴定出的有利的氨基酸变化。可以产生一个或多个新的子代分子，其含有所有或部分这些有利的氨基酸置换的组合。例如，如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化，那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性，以及两个有利变化中的每一个的可能性)和3个位置。因此，总共有3×3×3或27种可能性，其中包括了先前被检验的7种可能性，即6个单点突变的可能性(即三个位置的每一个位置有2个)和在任何位置上没有变化的可能性。

本发明提供了结合另外的诱变方法使用饱和诱变，例如其中两个或更多个相关多核苷酸被引入合适的宿主细胞的方法，以便通过重组和还原性重配产生杂合多核苷酸。

除了沿着基因的全序列进行诱变之外，本发明提供了：诱变可用于置换多核苷酸序列中任意数量的碱基的每一个，其中待被诱变的碱基的数量在一个方面为从15至100,000中的每一个整数。因此，并不是沿着分子诱变每一个位置，可以对每一个或独立数目的碱基(在一个方面为总共15至100,000的亚组)进行诱变。在一些实施方式中，单独的核苷酸被用于沿着多核苷酸序列诱变每一个位置或一组位置。待被诱变的3个位置可以是密码子。使用诱变引物可以引入突变，该诱变引物含有异源序列盒，也称为诱变序列盒。示例性的序列盒可以具有1至500个碱基。在这样的异源序列盒中每一个核苷酸位置可以是N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E，其中E是非A、C、G或T的任何碱基(E可以被称为设计寡聚体(designeroligo))。

在一些实施方式中，饱和诱变包括诱变有待诱变的限定多核苷酸序列(其中待诱变的序列长度一方面为约15至100,000个碱基)中的一整组诱变序列盒(其中每一个序列盒的长度一方面为约1-500个碱基)。因此，一组突变(从1至100个突变)被引入每一个待诱变的序列盒。在应用一轮饱和诱变的过程中，一组待被引入到一个序列盒的突变可以与第二组待被引入到第二个序列盒的突变不同或相同。这样的分组通过缺失、插入、特定密码子的分组以及特定核苷酸序列盒的分组加以例示。

在一些实施方式中，待被诱变的限定序列包括全基因、通路、cDNA、整个开放阅读框(ORF)以及整个启动子、增强子、阻抑物/反式激活蛋白、复制原点、内含子、操纵子或任何多核苷酸官能团。通常，为了此目的，“限定序列(definedsequence)”可以是15碱基多核苷酸序列以及长度在15个碱基和15,000个碱基的多核苷酸序列(本发明特别指出中间的每一个整数)的任何多核苷酸。选择密码子分组时的考虑因素包括由简并诱变序列盒编码的氨基酸类型。

在一些实施方式中，可被引入到诱变序列盒中的突变分组，本发明特别提供了在每一个位置编码2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20种氨基酸的简并密码子取代(使用简并寡聚体)以及由此编码的多肽文库。

合成连接重装配(SLR)

本发明提供了非随机的基因修饰系统，命名为“合成连接重装配”或简单地称作“SLR”，这是一种“定向进化方法”，可以产生具有新的或改变的特性的多肽，例如本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶或本发明的抗体。

SLR是将寡核苷酸片段非随机地连接在一起的一种方法。该方法与随机寡核苷酸改组不同的地方在于，核酸构件(buildingblocks)没有被随意地改组、连接或嵌合，而是被非随机地装配。参见美国专利6,773,900；6,740,506；6,713,282；6,635,449；6,605,449；6,537,776。在一些实施方式中，SLR包括下述步骤：(a)提供模板多核苷酸，其中模板多核苷酸包含编码同源基因的序列；(b)提供多个构件多核苷酸，其中这些构件多核苷酸被设计成可在预定的序列处与模板多核苷酸交换重装配(cross-overreassemble)，所述构件多核苷酸包含作为同源基因变体的序列和与变体序列两侧的模板多核苷酸同源的序列；(c)将构件多核苷酸与模板多核苷酸组合在一起，以便构件多核苷酸与模板多核苷酸交换重装配，以产生包含同源基因序列变异体的多核苷酸。

SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此，该方法可以被用于非随机地产生包括超过10¹⁰⁰个不同嵌合体的子代分子的文库(或集合)。SLR可以被用于产生包括超过10¹⁰⁰⁰个不同子代嵌合体的文库。因此，本发明的一些实施方式包括产生一组最终嵌合的核酸分子的非随机方法，所述最终嵌合的核酸分子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的步骤，以及装配这些核酸构件的步骤，这样可获得依设计而定的整个装配次序，所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。

待被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”，如果它们能使这些构件以预定次序偶联。因此，核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定。如果使用多于一个的装配步骤，那么核酸构件可被偶联的总装配次序也由装配步骤(一步或多步)的连续次序来确定。在一些实施方式中，用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段，以实现结构片段的共价结合。

在一些实施方式中，寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得，所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷酸模板因此作为序列信息的来源，它们在待被诱变例如被嵌合或改组的核酸构件的设计中有用。在该方法的一些实施方式中，多个亲本核酸模板的序列被联配，以便选择一个或多个分界点。这些分界点可以位于同源区域，由一个或多个核苷酸构成。在一些实施方式中，这些分界点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描绘待要产生的寡核苷酸构件的边界，以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可以选择地，分界点可以是由至少一半的亲本多核苷酸序列分享的同源区域，或者可以是由至少三分之二的亲本多核苷酸序列分享的同源区域。甚至更优选地，在一些实施方式中，有用的分界点是由至少四分之三的亲本多核苷酸序列分享的同源区域，或者可以是由几乎所有的亲本多核苷酸序列分享的同源区域。在一些实施方式中，分界点是由所有亲本多核苷酸序列分享的同源区域。

在一些实施方式中，连接再装配过程被彻底地进行，以便产生含有尽量可能多的子代嵌合多核苷酸的文库。换句话说，核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时，在其他实施方式中，在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)是如上所述地遵循预先的设计(或非随机地)。由于本发明的非随机特性，大大地降低了不需要的副产品的可能性。

在其它实施方式中，连接再装配方法被系统地进行。例如，实施该方法，以便产生子代分子的系统区分化的文库，该文库分成能被系统地筛选的数个部分，例如可以逐个地筛选。换句话说，通过选择性的和审慎的应用特定的核酸构件，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种设计可以实现，即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检查和筛选步骤。因此，这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力，尤其是当祖先分子之间具有低水平的同源性时，这些方法可以产生包含大量子代分子的文库(或集合)。由于本发明的连接再装配的非随机特性，所产生的子代分子一方面包含有最终嵌合核酸分子的文库，这些核酸分子具有按设计而选择的总装配次序。饱和诱变和优化的定向进化方法也可以被用于产生不同的子代分子种类。应该意识到，本发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择的自由度和可控制性。进一步，应该意识到，就本发明的可操作性而言，对分子间同源性的要求大大地放宽了。事实上，甚至可以在有很少的分子间同源性或没有分子间同源性的区域内选择分界点。例如，由于密码子的摆动，即密码子的简并性，可以将核苷酸置换引入核酸构件，同时又不会改变在相应的祖先模板中最初编码的氨基酸。可以选择地，可以改变密码子，从而改变对原始氨基酸的编码。在本发明中，这样的置换可以被引入到核酸构件中，以便增加分子间同源分界点的发生率，从而使得在构件之间可获得的偶联的数量增加，而这又允许产生更多数量的子代嵌合分子。

合成基因重装配

在一些实施方式中，本发明提供了非随机的方法，命名为合成基因重装配，其在一定程度上与随机改组相关，只是核酸构件不随机改组、连接或嵌合，而是被非随机地装配。参见美国专利6,537,776。

合成基因重装配法不依赖于将被改组的多核苷酸之间存在高度同源性。本发明可以被用于非随机地产生包括超过10¹⁰⁰个不同嵌合体的子代分子的文库(或集合)。可以想象地，合成基因重装配可以被用于产生包括超过10¹⁰⁰⁰个不同子代嵌合体的文库。

因此，在一些实施方式中，本发明提供了产生一组最终嵌合的核酸分子的非随机方法，所述最终嵌合的核酸分子具有按设计所选择的整个装配次序，该方法包括按设计产生多个特异性核酸构件的步骤，以及装配这些核酸构件的步骤，这样可获得依设计而定的整个装配次序，所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。

待被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”，如果它们能使这些构件以预定次序偶联。因此，在一些实施方式中，核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定，并且如果使用多于一个的装配步骤，那么核酸构件可被偶联的总装配次序也由装配步骤(一步或多步)的连续次序来确定。在本发明的一个实施方式中，用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段，以实现结构片段的共价结合。

在另一实施方式中，核酸构件的设计通过分析一组祖先核酸模板的序列来获得，所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些祖先核酸模板因此作为序列信息的来源，它们在将被诱变例如被嵌合或改组的核酸构件的设计中有用。

在一个实例中，本发明提供了相关基因的家族和它们编码的相关产物的家族之间的嵌合。在具体的示例中，编码的产物是酶。本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以依据本文所述的方法进行诱变。

因此，根据本发明的一个实施方式，多个祖先核酸模板序列(例如本发明的多核苷酸)被联配，以便选择一个或多个分界点，这些分界点可以位于同源区域。这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界。因此，在祖先分子中鉴定和选择的分界点作为子代分子的装配中的潜在嵌合点。

在一些实施方式中，有用的分界点是由至少两个祖先模板分享的同源区域(包括至少一个同源核苷酸碱基)，但分界点可以是由至少一半的祖先模板、至少三分之二的祖先模板、至少四分之三的祖先模板以及在一些实施方式中可以是由几乎所有的祖先模板分享的同源区域。甚至仍在一些实施方式中，有用的分界点是由所有祖先模板分享的同源区域。

在一种实施方式中，基因再装配过程被彻底地进行，以便产生含有尽量可能多的文库。换句话说，核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时，另一方面，在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)是设计的(或非随机地)。由于本方法的非随机特性，大大地降低了不需要的副产品的可能性。

在其它实施方式中，基因再装配过程在所述方法中被系统地进行，以便例如产生系统区分化的文库，该文库具有能被系统地筛选的数个区室(compartment)，例如可以逐个地筛选。换句话说，通过选择性的和审慎的应用特定的核酸构件，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种设计可以实现，即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检查和筛选步骤。因此，这些方法允许可能非常大量的子代分子以更小的组被系统地检查。

由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力，尤其是当祖先分子之间具有低水平的同源性时，本发明提供产生包含大量子代分子的文库(或集合)。由于本发明的基因再装配的非随机特性，所产生的子代分子在一些实施方式中包含有最终嵌合核酸分子的文库，这些核酸分子具有按设计而选择的总装配次序。在一些实施方式中，这样的所产生的文库包括大于10³至大于10¹⁰⁰⁰种不同的子代分子种类。

在一些实施方式中，如所述产生的一组最终嵌合的核酸分子包括编码多肽的多核苷酸。在一个实施方式中，该多核苷酸是基因，其可以是人造基因。在另一实施方式中，该多核苷酸可以是基因通路，其可以是人造基因通路。在一些实施方式中，本发明提供：本发明产生的一种或更多种人造基因可以掺入人造基因途径，例如在真核生物体(包括植物)中可操纵的途径。

在另一实例中，产生构件的步骤的合成属性允许设计和引入核苷酸(例如一个或多个核苷酸，例如可以是密码子或内含子或调控序列)，这些核苷酸随后可以在体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物体的基因剪接能力)被任选地去除。应该意识到，在许多情况下，除了产生有用的分界点的好处之外，还有许多其它原因也使得可能期望引入这些核苷酸。

因此，在一些实施方式中，核酸构件在本发明中被用于引入内含子。这样，功能性内含子在本发明中被引入到本发明的人造基因中。在一些实施方式中，功能性内含子在本发明中还可以被引入本发明的人造基因通路中。因此，本发明提供了嵌合多核苷酸的产生，该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因。

本发明还提供了嵌合多核苷酸的产生，该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因通路。在一些实施方式中，人工引入的内含子(一个或多个)主要是按天然存在内含子(一个或多个)在基因剪接中行使功能的方式在一个或多个宿主细胞中行使基因剪接功能。在一些实施方式中，本发明提供了产生含人造内含子的多核苷酸的方法，该多核苷酸将被引入宿主生物体中，用于重组和/或剪接。

使用本发明产生的人造基因也可作为底物发挥作用，用于与另一核酸重组。同样，使用本发明产生的人造基因途径也可作为底物发挥作用，用于与另一核酸重组。在一些实施方式中，重组由人造的含内含子基因和作为重组伙伴的核酸之间的同源区域促进，或发生在人造的含内含子基因和作为重组伙伴的核酸之间的同源区域中。在一些实施方式中，重组伙伴也可以是本发明产生的核酸，包括人造基因或人造基因途径。重组可以由人造基中一个(或多个)人工引入的内含子上存在的同源区域促进，或发生在由人造基中一个(或多个)人工引入的内含子上存在的同源区域。

在一些实施方式中，本发明的合成基因再装配方法使用多种核酸构件，其每一种一方面具有两个可连接末端。在每一个核酸构件上的两个可连接末端可以是两个平端(即，每一个末端具有零个核苷酸的突出)，或者在一些实施方式中可以是一个平端和一个突出端，或者在一些实施方式中可以是两个突出端。在一些实施方式中，用于该目的的一个有用的突出端可以是3′突出端或5′突出端。因此，核酸构件可以具有一个3′突出端或可选地具有一个5′突出端或可选地具有两个3′突出端或可选地具有两个5′突出端。核酸构件被装配来形成最终嵌合的核酸分子的整个装配次序通过有目的试验设计确定并且不是随机的。

在一些实施方式中，通过化学合成两个单链核酸(也称为单链寡聚体)并使它们接触促以便允许它们退火形成双链核酸构件来生成核酸构件。双链核酸构件可以具有不同的大小。这些构建的大小可以是小的或大的。构件的示例性大小在1碱基对(不包括任何突出端)至100,000碱基对(不包括任何突出端)之间。还提供了其它示例性大小范围，其具有1bp至10,000bp(包括中间的每一个整数)的下限和2bp至100,000bp(包括中间的每一个整数)的上限。

存在许多方法，通过这些方法，可以产生可用于本发明的双链核酸构件；并且这些方法在本领域中是已知的，且普通技术人员容易进行。在一些实施方式中，通过首先产生两个单链核酸并使它们退火形成双链核酸构件，从而产生双链核酸构件。双链核酸构件的两条链可以在每个核苷酸处互补，除了形成突出端的任何一个核苷酸；从而除了任何突出端外不含有错配。在另一实施方式中，双链核酸构件的两条链可以在比除了形成突出端外的每个核苷酸更少的核苷酸处互补。因此，根据该实施方式，双链核酸构件可用于引入密码子简并性。在一些实施方式中，使用本文描述的位点饱和诱变，使用一个或多个N,N,G/T序列盒，或者可选地，使用一个或多个N,N,N序列盒，引入密码子简并性。

本发明的体内重组方法可以在未知杂合体或具体多核苷酸或序列的等位物的库上进行盲试。然而，不必知道所述具体多核苷酸的精确DNA或RNA序列。采用混合基因群内的重组的方法可用于产生任何有用的蛋白质，例如，本发明的醛缩酶或其变体。该方法可用于产生具有改变的特异性或活性的蛋白质。该方法还可以用于产生杂合核酸序列，例如，基因的启动子区、内含子、外显子、增强子序列、3’未翻译区或5’未翻译区。因此，该方法可用于产生具有增加的表达速率的基因。该方法在研究重复DNA序列中也是有用的。最终，该方法可用于制备本发明的核酶或适体。

在一些实施方式中，本文中描述的发明涉及还原性重配、重组和选择的重复循环应用，其使得可以通过重组实现高度复杂的线性序列例如DNA、RNA或蛋白质的定向分子进化。

优化的定向进化系统

本发明提供了非随机的基因修饰系统，命名为“优化的定向进化系统”，以生产具有新的或者改变的性质的多肽，如本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶或者抗体。在一些实施方式中，优化的定向进化涉及还原性重配(reductivereassortment)、重组和选择的重复循环应用，其使得可以通过重组实现核酸的定向分子进化。

优化的定向进化允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件(crossoverevents)的序列。遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。

此外，这一方法与其他系统相比，提供了一种用于探究大数量的可能蛋白变异体的方便手段。以前，例如，如果在反应中产生了10¹³个嵌合分子，测试这样大数目的嵌合突变体的特定活性将会非常困难。此外，子代群体的相当部分将具有很高数目的遗传交换事件，其中得到的蛋白较不可能具有增高水平的特定活性。通过应用这些方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此，尽管在反应中可以仍然产生10¹³嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定数目的遗传交换事件，所以嵌合分子之间的功能多样性的范围缩少了。当要计算在最初的亲本多核苷酸中的哪一个寡核苷酸可能影响到特定的性质时，这便提供了更加可控数目的变量。

产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。在一些实施方式中，每一个寡核苷酸包括重叠的独特区域，这样把所述寡核苷酸混合在一起，得到具有以正确顺序装配的每个寡核苷酸片段的新的变异体。可选地，实践本发明的方法的方案可以在美国专利6,773,900；6,740,506；6,713,282；6,635,449；6,605,449；6,537,776；6,361,974中找到。

对应于每一个亲本变异体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如，为了发现具有如在高温下的更高活性的嵌合变异体，可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子，对应于每一个亲本变异体的每一部分可以产生总共50个寡核苷酸序列。相应地，在连接再装配过程中，在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中，有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接，而不导致遗传交换事件。如果在这一例子的任何连接步骤中，来自每一个亲本的每一种寡核苷酸的浓度都保持不变，那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变异体的寡核苷酸连接于嵌合序列内而不产生交换。

因此，可以确定概率密度函数(PDF)，预测在一个连接反应的每一步中可能发生的遗传交换事件的群体，其中给定了一套具有确定数目的亲本变异体、对应于每种变体的寡核苷酸、以及在连接反应的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法，可以计算这样的概率密度函数，而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外，可以预先确定遗传交换事件的目标数目，然后对该系统进行程序化，以计算在该连接反应的每一个步骤中，每种亲本寡核苷酸的起始量，从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用，通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般是在两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。

此外，这些方法与其他系统相比，提供了一种用于探究巨大量的可能蛋白变异体空间的方便手段。通过应用在这里描述的方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件(crossoverevent)的变异体。因此，尽管在反应中可以仍然产生10¹³个嵌合分子，但是所选择的用于进一步分析的每一个分子最可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件，所以造成嵌合分子之间的功能多样性的界线减少。当计算出在最初的亲本多核苷酸中的哪一个寡核苷酸可能负责影响到特定的性质时，便提供了更加可控制量的变量。

在一些实施方式中，该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸，产生嵌合子代多核苷酸序列。在一些实施方式中，每一个寡核苷酸包括重叠的独特区域，这样把所述寡核苷酸混合在一起，得到具有以正确顺序装配的每一寡核苷酸片段的新的变异体。也可参见美国专利6,773,900；6,740,506；6,713,282；6,635,449；6,605,449；6,537,776；6,361,974。

确定交换事件

本发明的多个实施方式包括系统和软件，它们接受所需的遗传交换的概率密度函数(PDF)、待再装配的亲本基因的数目以及在再装配中的片段数目作为输入量。该程序输出“片段PDF”，它可以用于确定用于产生重新装配的基因和那些基因的估计的遗传交换PDF的秘诀(recipe)。在一些实施方式中，在此描述的过程在MATLAB^TM中进行(TheMathworks,Natick,Massachusetts)，MATLAB^TM是一种用于技术计算的程序语言和开发环境。

迭代过程

本发明的任何过程可以被迭代重复，例如，编码本发明的改变的或者新的醛缩酶表型，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸可以被鉴定、再分离、再修饰、再测试活性。这一过程可以重复直到工程化得到所需的表型。例如，完整的生物化学合成代谢或分解代谢途径可以被工程化到细胞中，例如包括醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的细胞。

类似地，如果确定了某特定寡核苷酸对于所期望的特性(例如新的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶表型)不会造成任何影响，则可以通过合成包括这段待除去的序列在内的更大的亲本寡核苷酸，从而将这段序列作为变量除去。由于将这段序列合并到更大的序列中避免任何遗传交换事件，所以在子代多核苷酸中，这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系，以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的具有特定性质或者活性的蛋白变异体。

体内改组

在多种实施方式中，分子的体内改组在本发明的方法中使用，以提供本发明的多肽的变体，例如本发明的抗体、本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶以及类似物。体内改组可以利用细胞的天然特性以重组多聚体进行。尽管体内重组是提供分子多样性的主要天然途径，但遗传重组仍然是一种相对复杂的过程，该过程涉及1)同源性识别；2)链切割，链侵入，和导致产生重组交叉(recombinationchiasma)的代谢步骤；和最后3)分解交叉成分离的重组分子。交叉的形成需要同源序列的识别。

在其它实施方式中，本发明包括一种方法，用于由至少第一多核苷酸和第二多核苷酸获得杂合多核苷酸。在一些实施方式中，本发明可用于产生杂合多核苷酸，通过将共享至少一个部分序列同源的区域的至少第一多核苷酸和第二多核苷酸(例如，一个或两者都是依据本发明的编码醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸)引入到合适的宿主细胞中实现。部分序列同源的区域促进了导致产生杂合多核苷酸的序列再组织过程。正如此处所用，术语“杂合多核苷酸”是从本发明的方法产生的任何核苷酸序列，其含有来自至少两个原始多核苷酸序列的序列。这样的杂合多核苷酸可以来自可促进DNA分子间序列整合的分子间重组事件。此外，这样的杂合多核苷酸可以来自于分子内还原重配过程，该过程利用重复序列来改变DNA分子内的核苷酸序列。

在一些实施方式中，体内重装配集中在“分子间”的过程上，统称为“重组”；在细菌中，它一般被视为是“RecA-依赖”的现象。在一些实施方式中，本发明可以依赖于宿主细胞的重组过程来重组和重装配序列，或者依赖于细胞介导还原过程的能力，通过缺失来减少细胞中的准-重复序列的复杂性。该“还原性重配”过程通过“分子内的”、RecA-依赖过程而发生。

在本发明的其它实施方式中，通过还原性重配过程，产生新型的多核苷酸。该方法包括产生含有连续序列(起始的编码序列)的构建物，它们插入到合适的载体中，并且然后将它们引入到合适的宿主细胞。单个分子同一性的重装配通过在构建物中具有同源性区域的连续序列间的组合过程，或者准-重复单位间的组合过程而发生。重装配过程重组和/或降低重复序列的复杂性和程度，并且导致产生新型的分子种类。可以应用各种处理来提高重装配速率。这些处理包括用紫外光，或者损坏DNA的化学试剂处理，和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。因此，这样的重装配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。

重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。在一些实施方式中，“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现；以相似序列的连续单元出现。一旦连接，在连续序列之间的连接处变得基本上无形，并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板库，在模板上可以发生滑移事件。在一些实施方式中，含有准重复的构建物因此有效地提供了足够的分子弹性，缺失(和潜在的插入)事件实际上可以在准重复单元内的任何地方发生。

当准重复序列全部以相同方向连接，例如，头对尾或者反之亦然，细胞就不能区别各个单元。因此，还原过程可以在整个序列中发生。相反地，例如，当所述单元以头对头存在，而不是头对尾，相邻单元的头尾倒置，这样缺失的形成将有利于不连续单元的失去。因此，优选地，待重装配序列是处于相同的方向。准重复序列的随机定向将会导致重装配效率的损失，而序列的一致定向将会为序列的定向提供最高的效率。然而，虽然具有较少的相同方向的连续序列会降低效率，但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效率的准重复序列制备构建物。

应用各种方法中的任何一种，可以以头至尾的定向装配序列，包括以下方法：

a)可以使用包括poly-A头和poly-T尾的引物，当制成单链时，包括poly-A头和poly-T尾的引物将提供定向。这通过具有由RNA制备的引物的头几个碱基来完成，而且因此用RNaseH可以很容易去除RNA。

b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。

c)引物的内部几个碱基可以被硫醇化，并且用外切酶来产生合适的具有尾巴的分子。

在一些实施方式中，重装配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的确定。被重装配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降低的RI的克隆载体的回收可以这样被完成，即：

1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。

2)通过物理程序对缩短的载体进行物理回收。在这一情况下，克隆载体将应用标准的质粒分离程序进行回收，或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。

3)插入物的大小下降时，对含有可以选择的断裂基因的载体进行回收。

4)应用表达载体以及适当的选择，使用定向选择技术。

相关的生物体的编码序列(例如，基因)可以表现出高度的同源性，并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明中。然而，尽管下面所描述的例子证明了几乎相同的起始编码序列(准-重复)的再装配，这一过程并不限于这种几乎相同的重复。

下面的例子展示了本发明的示例性方法。描述了来自三个(3)独特种的编码性核酸序列(准-重复)。每一序列编码具有一套不同特征的蛋白质。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同被扩增并且被连接到随机的装配体中，以便所有可能的排列和组合可以在连接的分子群体中获得。准-重复单位的数目可以通过装配条件来控制。在构建物中，准-重复单位的平均数目通过重复指数(RI)来定义。

一旦形成，构建物可以，或不必按照出版的方法通过琼脂糖凝胶来按大小分馏，插入到克隆载体，并且转染到合适的宿主细胞中。然后细胞进行繁殖，并且进行“还原性重配”。如果需要，还原性重配过程的速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导，还是通过“分子间”的机制由类似重组的事件来介导是不重要的。最终的结果是分子被重装配，得到所有可能的组合。

任选地，本方法包括一个额外的步骤，即对改组的文库成员进行筛选，以确定个别的改组文库成员，其具有与一种预定的大分子如蛋白质受体、寡糖、病毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作用，或者催化特定的反应(如，酶的催化结构域)的能力。

从这样的文库所鉴定得到的多肽可以用于治疗、诊断、研究和相关目的(例如，催化剂，用于增加水溶液的渗透性的溶质等等)和/或可以进行改组和/或选择的一个或者多个另外的循环。

在其它实施方式中，可以预见，在重组或重装配之前，或者在重组或重装配的过程中，通过本发明的方法产生的多核苷酸可以用试剂处理或进行加工，这些处理或加工促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的试剂和过程可以包括，但不限于：(+)-CC-1065，或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley，(1992)；能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见，例如，vandePoll等(1992))，或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也见，vandePoll等(1992),751-758页)；三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物，如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的示例性方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别包含的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA加合物的多核苷酸，在进一步的处理前，其可以通过包括加热含有所述多核苷酸的溶液的过程进行释放或者去除。

在另外的实施方式中，本发明涉及产生具有生物活性的重组蛋白，其通过在根据本发明产生杂合或再装配多核苷酸的条件下处理含有编码野生型蛋白的双链模板多核苷酸的样品来实行。

产生序列变异体

本发明也提供了制备依据本发明的核酸(例如醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)序列的序列变异体的其它方法。在一些实施方式中，本发明也提供了使用依据本发明的核酸和多肽分离醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的其它方法。在一些实施方式中，本发明提供了依据本发明的醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶编码序列(例如基因、cDNA或信息)的变异体，其可以通过任何方式改变，包括例如随意或随机方法，或非随机或“定向进化”的方法，如上文所述的。

被分离的变异体可以是天然发生的。变异体也可以在体外产生。变异体也可以应用基因工程技术来产生，如位点定向诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地，可以应用化学合成或者修饰方法来产生这样的变异体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变异体的其它方法。这些方法包括这样的程序，其中，从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸，所述的特征使这些多肽在工业或者实验室应用中具有增加的价值。在这样的程序中，大量的变异体序列被获得和表征，这些变异体序列与从天然分离物中得到的序列相比，有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离得到的核酸序列编码的多肽的氨基酸变化。

例如，变异体可以通过易错PCR产生。在易错PCR的一个实施方式中，PCR在DNA聚合酶的复制保真性较低的情况下进行，这样便在全长的PCR产物中得到较高的点突变率。易错PCR在例如，Leung,D.W.,等,(1989)Technique,1：11-15；和Caldwell,R.C.和JoyceG.F.,(1992),PCRMethodsApplic.,2:28-33中描述。简要地说，在这样的程序中，待诱变的核酸与PCR引物、反应缓冲液、MgCl₂、MnCl₂、Taq聚合酶以及适当浓度的dNTP混合，在全长的PCR产物中得到高的点突变率。例如，反应可以使用20fmol待诱变的核酸进行，每种PCR引物30pmol，反应缓冲液包括50mMKCl、10mMTrisHCl(pH8.3)和0.01％明胶、7mM的MgCl₂、0.5mMMnCl₂、5units的Taq聚合酶、0.2mMdGTP、0.2mMdATP、1mMdCTP和1mMdTTP。PCR可以进行30个循环，每个循环为94℃1分钟；45℃1分钟；和72℃1分钟。然而，应该意识到，这些参数可以适当地变化。诱变的核酸克隆到一个适当的载体，并评价由诱变核酸编码的多肽的活性。

在一些实施方式中，变异体也可以用寡核苷酸诱导的定向突变产生，在任何感兴趣的克隆DNA中产生位点特异性的突变。寡核苷酸诱变(突变)在，例如，Reidhaar-Olson(1988)Science241:53-57中描述。简要地说，在这样的程序中，合成多个具有将要被导入被克隆的DNA中的一个或多个突变的双链寡核苷酸，将这些寡核苷酸插入到待诱变的克隆DNA中。在一些实施方式中，回收含有诱变DNA的克隆，表达，并评估它们编码的多肽的活性。

另一种产生变异体的方法是装配PCR。装配PCR涉及由小DNA片段的混合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生，一个反应的产物引发另一个反应的产物。装配PCR已经被描述，例如在美国专利5,965,408中。

在一些实施方式中，有性PCR诱变是产生本发明的变异体的示例性方法。在有性PCR诱变的一个实施方式中，由于基于序列同源性的DNA分子随机片段化，在不同的但是高度相关的DNA序列的DNA分子之间，在体外强行发生同源重组，然后通过PCR反应的引物延伸，遗传交换得到固定。有性PCR诱变在，例如，Stemmer(1994)Proc.Natl.Asad.Sci.USA91：10747-10751中描述。简要地说，在这样的程序中，多个待重组的核酸用DNase消化，产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段，重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如，PCR可以这样进行：将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mMMgCl₂、50mMKCl、10mM的Tris-HCl，pH9.0以及0.l％的TritonX-100的溶液中，其浓度为10-30ng/μ1。以100：1的比例在反应混合物中加入2.5Units的Taq聚合酶，用以下的条件进行PCR:94℃60秒，94℃30秒，50-55℃30秒，72℃30秒(30-45次)，然后72℃进行5分钟。然而，可以意识到，这些参数可以进行适当的变化。在一些实施方式中，寡核苷酸可以被包括在该PCR反应中。在其它方面，DNA聚合酶I的Klenow片段可以用于第一轮PCR反应，而Taq聚合酶可以用于后续的一组PCR反应。重组序列被分离，并评估它们编码的多肽的活性。

在一些实施方式中，变异体也可以通过体内诱变产生。在一些实施方式中，感兴趣的序列中的随机突变通过在细菌菌株中增殖该感兴趣的序列而产生，所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的增殖，最终可产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在，例如，PCT公开号WO91/16427中有描述，其在1991年10月31日公开，题目为“MethodsforPhenotypeCreationfromMultipleGenePopulations”。

变异体也可以通过应用盒式诱变产生。在盒式诱变中，双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“盒”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。

递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白诱变)的算法，它的开发是为了产生表型相关的突变体组成的多样性群体，其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA89:7811-7815中有描述。

在一些实施方式中，用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程，其中少部分的残基被随机化，同时在每一个被改变的位置鉴定导致功能性蛋白的氨基酸。指数整体诱变在如，Delegrave(1993)BiotechnologyRes.11:1548-1552中有描述。随机和位点定向诱变在如，Amold(1993)CurrentOpinioninBiotechnology4:450-455中有描述。

在一些实施方式中，变异体利用改组方法产生，其中编码不同的多肽的多个核酸的部分被融合在一起，产生编码嵌合多肽的嵌合核酸序列，其描述见美国专利5,965,408，其提交于1996年7月9日，题为“MethodofDNAReassemblybyInterruptingSynthesis”；以及美国专利5,939,250，其提交于1996年5月22日，题为"ProductionofEnzymesHavingDesiredActivitiesbyMutagenesis。

本发明的多肽的变异体可以是这样的变异体，其中本发明的多肽的一个或多个氨基酸残基被保守或非保守氨基酸残基(在一些实施方式中，保守氨基酸残基)置换，这样置换的氨基酸残基可以是由遗传密码编码或不被其编码的氨基酸。

在一些实施方法是中，保守置换是那些在多肽中一个给定的氨基酸被另一个具有类似特性的氨基酸置换的置换。在一些实施方式中，本发明的保守置换包括下列的置换：脂肪族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸用另一个脂肪族氨基酸置换；丝氨酸用苏氨酸置换，或苏氨酸用丝氨酸置换；酸性残基如天冬氨酸和谷氨酸用另一个酸性残基置换；具有酰胺基团的残基，如天冬酰胺和谷氨酰胺用另一个具有酰胺基团的残基置换；碱性残基如赖氨酸和精氨酸用另一个碱性残基来交换；芳香族残基如苯丙氨酸、酪氨酸用另一个芳香族残基置换。

其它变异体是那些在本发明的多肽的一个或多个氨基酸残基中包含有取代基团的变异体。在一些实施方式中，其它变异体是那些在其中多肽与别的化合物联接的变异体，所述化合物例如增加多肽的半衰期的化合物(例如聚乙二醇)。其它变异体是那些在其中额外的氨基酸被融合到多肽上的变异体，额外的氨基酸例如前导序列、分泌序列、蛋白原序列(proproteinsequence)或有助于多肽的纯化、富集或稳定的序列。

在一些实施方式中，片段、衍生物和类似物保持了与本发明的多肽和与其基本上相同的序列的相同的生物功能或活性。在其它实施方式中，片段、衍生物或类似物包括蛋白原，这样片段、衍生物或类似物可以通过蛋白原部分的切割来激活，以产生活性多肽。

优化密码子以便在宿主细胞中获得高水平的蛋白表达

本发明提供了修饰编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸来修饰(例如，优化)密码子使用的方法。在一些实施方式中，本发明提供了修饰编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸中的密码子来增加或者降低其在宿主细胞中的表达的方法。在一些实施方式中，本发明也提供了编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸——该核酸经过修饰从而其在宿主细胞中的表达增加——，这样修饰的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，以及制备修饰的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的方法。该方法包括鉴定编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸中的“非优选的”或“较不优选的”密码子，并且用编码相同氨基酸的“优选密码子”作为替换密码子替换一个或者多个这些非优选或者较不优选的密码子，并且在所述核酸中至少一个非优选或较不优选的密码子被编码相同氨基酸的优选密码子替换。优选密码子是在宿主细胞基因的编码序列中被过度表现(over-represented)的密码子，而不优选的或者较不优选的密码子是指在宿主细胞基因的编码序列中表现不足(under-represented)的密码子。

用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞(参见上面的讨论)。因此，本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸，以及由所述的密码子被改变的核酸编码的多肽。示例性的宿主细胞包括革兰氏阴性细菌，如大肠杆菌(Escherichiacoli)；革兰氏阳性细菌，如链霉菌属(Streptomycessp.)、加氏乳酸杆菌(Lactobacillusgasseri)、乳酸乳球菌(Lactococcuslactis)、乳脂乳球菌(Lactococcuscremoris)、枯草芽胞杆菌(Bacillussubtilis)、蜡状芽孢杆菌(Bacilluscereus)。示例性的宿主细胞也包括真核生物体，如，各种酵母，如酵母菌属(Saccharomycessp.)，包括酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomycespombe)、巴斯德毕赤酵母(Pichiapastoris)和乳酸克鲁维酵母(Kluyveromyceslactis)、多形汉森酵母(Hansenulapolymorpha)、黑曲霉(Aspergillusniger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此，本发明也包括在这些生物体和物种中表达被优化的核酸和多肽。

例如，从细菌细胞中分离出的编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸的密码子被修饰，以便该核酸在不同于获得该醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的细菌的细菌细胞、酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中被最优化地表达。优化密码子的方法在本领域是已知的，参见美国专利5,795,737；Baca(2000)Int.J.Parasitol.30:113-l18；Hale(1998)ProteinExpr.Purif.12:185-188；Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253，描述了在小鼠系统中优化密码子；Outchkourov(2002)ProteinExpr.Purif.24:18-24，描述了在酵母中优化密码子；Feng(2000)Biochemistry39:15399-15409，描述了在大肠杆菌中优化密码子；Humphreys(2000)ProteinExpr.Purif20:252-264，描述了大肠杆菌中影响分泌的优化的密码子使用。

转基因非人类动物

本发明提供了转基因的非人类动物，其含有依据本发明的核酸、多肽(例如，醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶)、表达盒或载体、或转染或转化的细胞。在一些实施方式中，本发明也提供了制备和使用这些转基因非人类动物的方法。

转基因非人类动物可以是，例如包含本发明的核酸的狗、山羊、兔、绵羊、猪(包括所有的猪(swine)、公猪和相关动物)、牛、大鼠和小鼠。这些动物可以用作例如体内模型来研究醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性，或者作为模型来在体内筛选改变醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性的试剂。要在转基因非人动物中表达的多肽的编码序列可以设计为组成型的，或者在组织特异性、发育特异性或者可诱导的转录调控因子的控制之下。

转基因非人动物可以应用本领域任何已知的方法设计和产生；参见，如，美国专利6,211,428；6,187,992；6,156,952；6,118,044；6,111,166；6,107,541；5,959,171；5,922,854；5,892,070；5,880,327；5,891,698；5,639,940；5,573,933；5,387,742；5,087,571，它们描述了制造和应用转化的细胞和卵以及转基因小鼠、大鼠、兔、羊、猪和牛。也参见，如，Pollock(1999)J.Immunol.Methods231:147-157，描述了在转基因奶牛动物的乳汁中生产重组蛋白；Baguisi(1999)Nat.Biotechnol.17:456-461，描述了转基因山羊的产生。美国专利6,211,428，描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人哺乳动物。美国专利5,387,742，描述了把克隆的重组子或者合成的DNA序列注射至小鼠受精卵中，移植注射的卵至假孕的雌鼠中，并生长成为转基因鼠，它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992，描述了制备和应用转基因小鼠。

“基因敲除动物”也可以被用于实践本发明的方法。例如，在一些实施方式中，本发明的转基因或修饰动物包括“基因敲除动物”，例如“基因敲除小鼠”，其被进行了遗传工程以至于不表达内源基因，该基因被表达本发明醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的基因或包含有本发明醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的融合蛋白的基因代替。

转基因植物和种子

本发明提供了转基因植物和种子，其含有依据本发明的核酸、多肽(例如，醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶)、表达盒或载体、或转染或转化的细胞。本发明也提供了包含本发明的核酸和/或多肽(如木聚糖酶)的植物产品或副产品，例如果实、油、种子、叶、提取物等，包括任何的植物部分，例如其中本发明的核酸或多肽对植物、植物部分、种子等是异源的。转基因植物(包括植物部分、果实、种子等)可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。在一些实施方式中，本发明也提供了制备和使用这些转基因植物及种子的方法。表达本发明的多肽的转基因植物或植物细胞可以根据本领域已知的任何方法构建。参见，例如美国专利号6,309,872。

依据本发明的核酸和表达构建体可以通过任何方法引入植物细胞。例如，核酸或表达构建物可以被引入期望的植物宿主的染色体，或者核酸或表达构建物可以是附加体(episome)。引入期望的植物的基因组可以是这样的，以至于宿主的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的产生被内源转录或翻译控制元件调节。在一些实施方式中，本发明也提供了“敲除植物”，其中例如同源重组导致的基因序列插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是属知的，参见Strepp(1998)ProcNatl.Acad.Sci.USA95:4368-4373；Miao(1995)PlantJ7:359-365。参见下面的转基因植物的讨论。

本发明的核酸可以用来将所需的性质赋予基本上任何植物，例如产淀粉的植物，如马铃薯、番茄、小麦、大豆、甜菜、玉米、稻、大麦以及类似的植物。本发明的核酸可以用于操作植物的代谢途径，以优化或者改变宿主的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶表达。依据本发明的核酸可以改变植物中天然产生的化合物或酶的表达或活性水平，或改变其性质。可选地，依据本发明的醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶可以用于转基因植物的产生，以生产不能由植物天然生成的化合物。这可以降低生产成本或产生新产品。

在一些实施方式中，生产转基因植物的第一步涉及制备用于在植物细胞中表达的表达构建物。这些技术在本领域是熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列，以及选择适当的基因终止子序列。一个示例性的组成型启动子是来自花椰菜花叶病毒的CaMV35S，它一般在植物中导致高水平的表达。其它的启动子是更特异的，并且对植物内部或者外部环境中的暗示有反应。一个示例性的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。

在一些实施方式中，修饰核酸来实现在植物细胞中更强的表达。例如，本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率，而一些植物优选G-C核苷酸对。因此，编码序列中的A-T核苷酸可以用G-C核苷酸置换，而不显著改变氨基酸序列，从而可以增加基因产物在植物细胞中的生产。

为了鉴定已经成功整合了转基因的植物细胞或者组织，可以将选择性标记基因加入到基因构建物中。这可能是必要的，因为在植物细胞中完成基因的整合和表达是稀有的事件，仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白，所述试剂一般对植物有毒性，如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时，只有已经整合了选择性标记基因的植物细胞可以成活。对于其它的插入基因，为了有恰当的功能，标记基因也需要启动子和终止序列。

在一些实施方式中，制备转基因植物或种子包括将本发明的序列以及任选的标记基因整合到目标表达构建物(如，质粒)中，同时安置启动子和终止子序列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如，构建物可以应用如电击转化和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中，或者构建物可以应用弹道方法(ballisticmethods)，如，DNA微粒轰击(DNAparticlebombardment)的方法直接引入到植物组织中。例如，参见Christou(1997)PlantMol.Biol.35:197-203；Pawlowski(1996)Mol.Biotechnol.6:17-30；Klein(1987)Nature327:70-73；Talcumi(1997)GenesGenet.Syst.72：63-69，讨论了应用微粒轰击引入转基因到小麦中；以及Adam(1997)如上，应用微粒轰击引入YAC至植物细胞中。例如，Rinehart(1997)如上，用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明；而且，可以商购得到BioRad(Biolistics)PDS-2000微粒加速设备；也参见，John，美国专利5,608,148；和Ellis，美国专利5,681,730，描述了微粒介导的裸子植物的转化。

在一些实施方式中，原生质体可以被固定，并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易，但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化，其中，DNA被包裹于钨微射弹(tungstenmicroprojectiles)上，射出物的大小为细胞大小的l/100，它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生，一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。

核酸，例如表达构建物，也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化，如，烟草花叶病毒衍生的载体(Rouwendal(1997)PlantMol.Biol.33:989-999)，参见Porta(1996)“Useofviralrepliconsfortheexpressionofgenesinplants”，Mol.Biotechnol.5:209-221。

可选择地，核酸，如表达构建物，可以与合适的T-DNA侧翼区组合，并导入到传统的根瘤农杆菌宿主载体中。根瘤农杆菌宿主的毒力功能将在植物细胞受该细菌感染时，引导构建物和邻近的标记插入至植物细胞DNA中。根瘤农杆菌介导的转化技术，包括disarming和应用二元载体，在科学文献中有详细的说明。参见，如，Horsch(1984)Science233:496-498；Fraley(1983)Proc.Natl.Acad.Sci.USA80:4803(1983)；GeneTransfertoPlants，Potrykus,ed.(Springer-Verlag,Berlin1995)。根瘤农杆菌细胞的DNA被包含在细菌染色体中，也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(～20kb长)和一系列毒力(毒性)基因，T-DNA在感染过程中被转移到植物细胞中，毒力基因则引导所述感染过程。根瘤农杆菌可以通过伤口感染植物：当一种植物的根或者茎受伤时，它释放某种化学信号，作为对这种信号的响应，根瘤农杆菌的毒力基因被激活，并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录，然后将自身插入到暴露的植物DNA中。为了应用根瘤农杆菌作为转基因载体，必须去除T-DNA的肿瘤诱导部分，而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间，从这里转移到植物细胞并且整合到植物的染色体中。

本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化，参见Hiei(1997)PlantMol.Biol.35:205-218。也参见如，Horsch,Science(1984)233:496；Fraley(1983)Proc.NatlAcad.SciUSA80:4803；Thykjaer(1997)如上；Park(1996)PlantMol.Biol.32:1135-1148，讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin，美国专利5,712,135，描述了包含在谷类或者其它单子叶植物的细胞中的具有功能的基因的DNA的稳定整合过程。

在一些实施方式中，第三步可能涉及完整植物的选择和再生，所述植物能够将整合的靶基因传递至下一代。这样的再生技术依赖于在组织培养生长培养基中对某些植物激素的操作。在一些实施方式中，该方法利用与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明，Evans等,ProtoplastslsolationandCulture,HandbookofPlantCellCulture,124-176页，MacMillilanPublishingCompany,NewYork,1983；和Binding，RegenerationofPlants,PlantProtoplasts,21-73页，CRCPress,BocaRaton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplantPhys.38:467-486中有总体的说明。为了从转基因组织如未成熟的胚胎获得整个植物，它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养，即称为组织培养的过程。一旦整个植物再生并且产生种子，便开始评测其子代。

在一些实施方式中，在表达序列盒稳定地整入到转基因植物之后，其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术，这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化，包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此，本发明的种子可以来自本发明的两个转基因植物的杂交，或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(例如醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)时，所需的效应(例如，表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。

在一些实施方式中，本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草，如牧草(蓝草，早熟禾属Poa)，饲料草如羊茅属，黑麦草属，温带草，如翦股颖属(Agrostis)，和谷类，如，小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草，豆类如羽扇豆，马铃薯，甜菜，豌豆，蚕豆和大豆，以及十字花科植物(Brassicaceae科)，如花椰菜，油菜籽，和紧密相关的模式生物拟南芥(Arabidopsisthaliana)。因此，本发明的转基因植物和种子包括很宽范围的植物，包括，但不限于，以下属的物种：腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、芸苔属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、Carthamus、椰子(Cocos)、咖啡(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、油棕属(Elaeis)、草莓属(Fragaria)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属(Medicago)、烟草属(Nicotiana)、木樨榄属(Olea)、稻属(Oryza)、稷属(Panieum)、狼尾草属(Pannisetum)、鳄梨属(Persea)、菜豆属(Phaseolus)、Pistachia、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、葫芦巴属(Trigonella)、小麦属(Triticum)、野豌豆属(Vicia)、葡糖属(Vitis)、豇豆属(Vigna)和玉蜀黍属(Zea)。

在可选择的实施方式中，本发明的核酸在含有纤维细胞的植物中表达，包括，如，棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、轻木(balsa)、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可供选择的实施方式中，本发明的转基因植物可以是棉属(Gossypium)的成员，包括任何棉种(Gossypium)的成员，如，亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。

本发明也提供了用于产生大量本发明多肽(例如醛缩酶，例如丙酮酸醛缩酶，HMG和/或KHG醛缩酶或抗体)的转基因植物。例如，参见Palingren(1997)TrendsGenet.13:348；Chong(1997)TransgenicRes.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′,2′)启动子，应用根瘤农杆菌介导的叶片圆盘(leafdisc)转化方法在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。

应用已知的程序，技术人员可以通过检测在转基因植物中转基因mRNA或蛋白的增加或减少来筛选本发明的植物。检测和定量mRNA或蛋白的方法在本领域是熟知的。

多肽和肽

在一些实施方式中，本发明提供了分离的、合成的或重组的多肽，其与依据本发明的序列，例如具有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334中所述序列的蛋白及其酶活性片段，具有序列同一性(例如至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全(100％)序列同一性，或同源性)。序列同一性的百分数可以在该多肽的全长上，或该同一性可以在至少约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多个残基的区域中。

依据本发明一些实施方式的多肽也可以比该多肽的全长短。在其它实施方式中，本发明提供了大小约5到多肽全长之间的多肽(肽、片段)，例如酶，例如醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶；示例性的大小为约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700或更多残基，例如依据本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的连续残基。依据本发明的肽(例如依据本发明的多肽的子序列)可以用作，例如标记探针，抗原(免疫原)，耐受原(toleragen)，基序，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性位点(如“催化域”)，信号序列和/或前原结构域(preprodomain)。

在其它实施方式中，依据本发明的，具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的多肽是共享与醛缩酶活性，包括丙酮酸活性，例如没有限制地HMG和/或KHG醛缩酶活性相关的特定结构元件，如氨基酸残基的一类多肽的成员。这些共享的结构元件可以用于醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶变异体的常规产生。本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的这些共享结构元件可用于指导本发明的多肽种类范围内的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶变体的常规产生。

用在这里，术语“醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶”包含能够催化羟醛加成反应或反向羟醛反应(retro-aldolreaction)的任何多肽或酶(如依据本发明的多肽，也参见下文的表1和实施例4、5和6)，或能够催化含碳-碳键物质的任何修饰，例如在R-2-羟基2-(吲哚-3基甲基)-4-同戊二酸(R-MP)和monatin的某些立体异构体，如R,R和S,Rmonatin，及它们的盐的生产中。

依据本发明一些实施方式的多肽在羟醛反应中催化碳-碳键的形成，并且具有在如下面总体方案所示的4-羟基-2-酮丁酸酯框架的合成中使用丙酮酸或磷酸烯醇丙酮酸作为亲核组分的能力。

R＝H、烷基、取代烷基、芳基、取代芳基、苄基、取代苄基

不被理论所限，应该相信在所有丙酮酸醛缩酶催化的缩合反应中制备的保守四碳片段被密集而有差别地官能化。而且，在每个加合物中，四个连续碳原子中包含碳的四种不同的氧化状态。由丙酮酸醛缩酶制备的框架因此允许α-氨基-γ-羟基羧酸、β-羟基羧酸、α,γ-二羟基羧酸和2-脱氧醛糖的制备，如下文方案中所示的。

因此，依据本发明一些实施方式的丙酮酸醛缩酶可以是合成上多用途的，并且可以被用于制备多种在动物饲料、人类食品、工业加工和制药上使用的产品(参见，例如Gijsen,H.J.M.等，RecentAdvancesintheChemoenzymaticSynthesisofCarbohydratesandCarbohydrateMimetics，Chem.Rev.1996,96,443-473；Henderson,D.P.等，J.Org.Chem.,StereospecificPreparationoftheN-TerminalAminoAcidMoietyofNikkomycinsKXandKZviaaMultipleEnzymeSynthesis，1997,62,7910-7911；Wymer,N.&Toone,E.J.Enzyme-catalyzedSynthesisofCarbohydrates，CurrentOpin.ChemicalBiology,2000,4,110-119。

依据本发明一些实施方式的多肽可以具有一种以上的酶活性，特别是醛缩酶活性和其它活性，例如，如下文表1所述。举例来说，依据本发明的多肽可以具有醛缩酶活性、丙酮酸活性、HMG和/或KHG醛缩酶活性。此外，基于其EC分类，该多肽可以具有，或可能被认为具有其它酶活性。表1包括“预期EC编号”的一列。EC编号是根据标准化的酶命名法方案指定给一种类型的酶的编号，该命名法是由国际生物化学与分子生物学联合会(IUBMB)命名法委员会的酶学委员会(EnzymeCommissionoftheNomenclatureCommitteeoftheInternationalUnionofBiochemistryandMolecularBiology)制定的。“预期EC编号”列中的结果根据Kegg(基因和基因组京都百科全书(KyotoEncyclopediaofGenesandGenomes))数据库通过BLAST搜索确定。如果顶端的BLAST匹配(也称为“命中事件”)具有等于或小于e^-6的E值，那么指定给顶端匹配的EC编号被输入该表。顶端命中事件的EC编号被用作本发明的序列的EC编号可能值的指导。在仅给出部分EC编号的例子中，只有宽的分类可以基于顶端命中被指定。例如，在第一行，对于由SEQIDNO:1编码的SEQIDNO:2，预期EC编号被列为“2…”。因此，被指定的类别是宽泛的转移酶。对于由SEQIDNO:25编码的SEQIDNO:26，可基于顶端命中被指定的最特异类别是醛裂解酶。

表1

本发明的多肽和肽可以分离自天然来源，可以是合成的，或者可以是重组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明的肽和多肽可以使用本技术领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本技术领域熟知的化学方法全部或部分合成。参见Caruthers(1980)NucleicAcidsRes.Symp.Ser.215-223；Horn(1980)NucleicAcidsRes.Symp.Ser.225-232；Banga，A.K.，TherapeuticPeptidesandProteins,Formulation,ProcessingandDeliverySystems(1995)TechnomicPublishingCo.，Lancaster，PA。例如，肽合成可以使用各种固相技术进行(参见Roberge(1995)Science269:202；Merrifield(1997)MethodsEnzymol.289:3-13)，自动合成可以根据制造商提供的说明书来实施，例如使用ABI431A肽合成仪(PerkinElmer)。

依据本发明的肽和多肽也可以是糖基化的，所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上，其中后者包括应用已知的糖基化作用基序，所述糖基化作用基序可以对于所述序列是天然的，或者是作为肽段而被加入的，或者是在核酸编码序列中加入的。糖基化作用可以是O-连接的或者是N-连接的。

在一些实施方式中，本发明的肽和多肽，如以上所定义的，包括所有的“模拟物(mimetic)”和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成，或者是由部分天然的肽氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守置换，只要这样的置换本质上不改变该模拟物的结构和/或活性。对于作为保守性变异体的本发明的多肽或一类本发明的多肽的成员(例如，具有与本发明的示例性序列具有大约50％或更高的序列同一性的成员)，常规实验将可以确定一种模拟物是否在本发明的范围内，即，其结构和/或功能并没有实质上的改变。因此，在一些实施方式中，如果一种模拟组合物具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性，那么它在本发明的范围内。

本发明的多肽模拟组合物可以包含非天然结构成分的任何组合。在可供选择的实施方式中，本发明的模拟组合物包括以下三种结构基团中的一种或所有：a)不是天然酰胺键(“肽键”)连接的残基连接基团；b)置换天然发生的氨基酸残基的非天然残基；或者c)诱导二级结构拟态(mimicry)的残基，即，可以诱导或者稳定二级结构，如β转角、γ转角、β折叠、α螺旋构象，以及类似的结构。例如，当本发明的多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时，该多肽可以作为模拟物来表征。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接，如，通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N,N′-二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的连接基团包括，如，酮基亚甲基(如，-C(＝O)-CH₂-代替-C(＝O)-NH-)、氨基亚甲基(CH₂-NH)、乙烯、烯烃(CH＝CH)、醚(CH₂-O)、硫醚(CH₂-S)、四唑(CN₄-)、噻唑、逆酰胺(retroamide)、硫代酰胺或者酯(参见Spatola(1983)在ChemistryandBiochemistryofAminoAcids,PeptidesandProteins,第7卷,267-357页，“PeptideBackboneModifications”MarcellDekker,NY)。

本发明的多肽也可以通过含有全部或者部分替代了天然发生的氨基酸残基的非天然残基而被表征为模拟物。在科学和专利文献中描述了非天然的残基；作为天然氨基酸残基的模拟物的一些典型的非天然化合物及指导在下面有描述。芳香族氨基酸的模拟物可以通过用以下的置换来产生，如，D-或L-萘基丙氨酸；D-或L-苯基甘氨基，D-或L-2噻吩丙氨酸(thieneylalanine)；D-或L-l,-2,3-或4-芘基丙氨酸；D-或L-3噻吩丙氨酸；D-或L-(2-吡啶基)-丙氨酸；D-或L-(3-吡啶基)-丙氨酸；D-或L-(2-吡嗪基)-丙氨酸，D-或L-(4-异丙基)-苯基甘氨酸；D-(三氟甲基)-苯基甘氨酸；D-(三氟甲基)-苯基丙氨酸；D-p-氟-苯基丙氨酸；D-或L-p-二苯基苯基丙氨酸；D-或L-p-甲氧基-二苯基苯基丙氨酸；D-或L-2-吲哚(烷基)丙氨酸；和，D-或L-烷基丙氨酸，其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括，如噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。

酸性氨基酸的模拟物可以通过用以下的置换来产生，如，保持有负电荷的非羧酸氨基酸；(膦酰基)丙氨酸；硫酸化的苏氨酸。羧基侧链(如，天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰，所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮-4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如，(除了赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸，或者(胍基)烷基-乙酸的取代产生，其中烷基如以上定义。腈衍生物(如，含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂在一些实施方式中在碱性的条件下反应而产生，所述的常规试剂包括如苯乙二醛、2,3-丁二酮、l,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-乙酰亚胺基(acetylimidizol)和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生；得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-咪唑基(imidozoyl))丙酸；氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物；甲基2-吡啶基二硫化物；p-氯汞苯甲酸盐；2-氯汞-4硝基苯酚，或者，氯-7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和可改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如皮考啉亚氨酸甲酯(methylpicolinimidate)、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应，和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括，例如，哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸，或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括，例如，由脯氨酸和赖氨酸的羟基化作用产生的模拟物；由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物；由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物；由N-末端胺的乙酰化作用而产生的模拟物；由主链酰胺残基的甲基化或用N-甲基氨基酸置换而产生的模拟物；或者，由C-末端羧基的酰胺化而产生的模拟物。

在一些实施方式中，依据本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。在一些实施方式中，天然发生的L-构型(也可以被称为R或者S，取决于化学实体的结构)的任何氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代，相反手性的氨基酸称为D-氨基酸，但也可以称R-或者S-型。

本发明也提供了通过天然过程，如，翻译后加工(如，磷酸化，酰化以及类似作用)或者通过化学修饰技术来修饰本发明的多肽的方法，以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。在一些实施方式中，修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或核苷酸衍生物、共价连接脂质或脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。参见，Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.FreemanandCompany,NewYork(1993)；PosttranslationalCovalentModificationofProteins,B.C.Johnson，Ed.,AcademicPress,NewYork,11-12页(1983)。

固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12页)，并且这些方法近来已经可以通过商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearchBiochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法，它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行，而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时，一个板的杆或者钉被倒转并插入到另一个板的相应孔或者贮存器中，所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤，即是，反转和插入所述杆和钉的顶端至适当的溶液中，将氨基酸构建成所要的肽。此外，大量的可利用的FMOC肽合成系统是可利用的。例如，应用AppliedBiosystems,Inc.的Model431A^TM自动肽合成仪，可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得，或者通过直接的合成或者合成用其它已知的技术可偶联起来的一系列片段。

本发明的多肽包括活性或非活性形式的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。例如，本发明的多肽包括在“成熟”或例如通过蛋白原加工酶如蛋白原转化酶来产生“活性”的成熟蛋白来加工前原序列之前的蛋白原。本发明的多肽包括由于其它原因而不具有活性的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，所述其它原因例如在通过翻译后加工事件诸如内切或外切肽酶或蛋白酶作用、磷酸化事件、酰胺化、糖基化或硫酸化或二聚化事件等等进行“活化”之前。本发明的多肽包括所有的活性形式，包括酶的活性子序列，例如，催化结构域或活性位点。

本发明包括固定化的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，抗醛缩酶抗体，如抗丙酮酸醛缩酶抗体、抗HMG和/或抗KHG醛缩酶抗体及其片段。在一些实施方式中，本发明提供了抑制醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的方法，例如使用本发明的显性负突变体或抗醛缩酶抗体，如抗丙酮酸醛缩酶抗体、抗HMG和/或抗KHG醛缩酶抗体。在一些实施方式中，本发明包括含有本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的异源复合物，例如融合蛋白、异二聚体等等。

在一些实施方式中，依据本发明的多肽可以在多种条件下，例如在极端pH和/或温度，或在一些实施方式中，在氧化试剂存在的情况下，具有醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性。在一些实施方式中，本发明提供了产生，例如对温度、氧化试剂和改变的清洗条件具有不同催化效率和稳定性的可选的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶制备物的方法。在一些实施方式中，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶变异体可以使用位点定向诱变和/或随机诱变的技术产生。在一些实施方式中，定向进化可以被用于产生各种具有可选的特异性及稳定性的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的变异体。

依据本发明的蛋白也被用作研究试剂以鉴定醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的调节剂，如醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的激活剂或抑制剂。简单地说，测试样品(化合物、培养基、提取物等)被加入到醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶测定中，以确定它们抑制底物切割的能力。这种方法鉴定的抑制剂可以被用在工业和研究中，以降低或防止不希望的蛋白水解。至于醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，抑制剂可以被组合以增加活性谱。

依据本发明的酶也可用作消化蛋白质的研究试剂或用在蛋白测序中。例如，为了使用例如自动测序仪进行测序，可以使用醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶将多肽破碎成更小的片段。

本发明也提供了应用本发明的核酸、多肽和抗体来发现新的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的方法。在一些实施方式中，筛选噬粒文库，基于表达来发现醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。在其他实施方式中，筛选λ噬菌体文库，基于表达来发现醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。通过筛选噬菌体或噬粒文库，可以检测到毒性克隆；更方便地利用底物；减少工程改造宿主的需要，绕过由文库中大的切除带来任何偏差的可能性；以及获得在低克隆密度下更快的生长速率。噬菌体或噬粒文库的筛选可以是在液相中或者固相中。在一些实施方式中，本发明提供了在液相中的筛选。与固相筛选相比，这给予了分析条件上的更大灵活性；额外底物的可行性；对于弱的克隆的更高灵敏性；和更容易实现的自动化。

本发明提供了使用本发明的蛋白和核酸以及机器人自动化来进行筛选的方法，以使得在例如一天的短时间内能进行数千个生物催化反应和筛选分析，并且保证了高水平的精确度和可重复性(参见下面关于阵列的讨论)。结果，衍生化合物的文库可以在数周内产生。对于包括小分子在内的分子的修饰的进一步教导，参见PCT/US94/09174；美国专利6,245,547。

在一些实施方式中，通过生物化学富集或纯化步骤获得本发明的多肽或片段。通过醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶测定(参见例如下面的实施例3、4和5)、凝胶电泳和/或微测序可以确定潜在同源的多肽或片段的序列。本发明的预期多肽或片段的序列可使用上述的任何程序，与本发明的多肽或片段例如含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段相比较。

本发明的另一个实施方式是用于鉴定本发明的片段或变异体的分析方法，所述本发明的片段或变异体保留了本发明的多肽的酶功能。例如，所述多肽的片段或变异体可用来催化生物化学反应，这样的反应表明所述片段或变异体保留了本发明的多肽的酶活性。确定变体或片段是否保留本发明的多肽的酶活性的示例性测定方法包括下面的步骤：将多肽片段或变异体与底物分子在允许该多肽片段或变异体发挥作用的条件下接触，并检测底物水平的降低或该多肽和底物之间反应的特异反应产物水平的增加。

本发明开发了酶的独特的催化性质。鉴于生物催化剂(即，纯化的或者粗制的酶，非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂，本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物如小分子中的功能基团具有特异性的。每种生物催化剂对于一种功能基团或者几种相关的功能基团是特异的，并且可以和含有这一功能基团的许多起始化合物反应。

在一些实施方式中，生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过生物催化的衍生作用的每一次迭代可以产生起始小分子或化合物的数千种变化。

酶在起始化合物的特定位点发生反应而不影响分子的其它部分，该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于在文库中鉴定单个活性化合物的方法。该文库通过用于产生该文库的一系列生物催化反应来表征，这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序，并确认合成出的化合物的结构。这种鉴定方式，不同于其它的合成和筛选方法，并不需要固定化技术，并且化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。重要的是，注意到酶反应对功能团的高度特异性允许“追踪”特定的酶促反应，由所述酶促反应制备出了生物催化产生的文库。

在一些实施方式中，许多程序化的步骤可使用自动化机器人来实施，这使得每天可执行数千个生物催化反应和/或筛选分析，并保证高水平的准确性和可重复性。自动化机器人也可用于筛选醛缩酶活性，以确定多肽是否在本发明的范围内。结果，在一些实施方式中，在几周内便产生了衍生化合物的文库，而采用“传统”的化学或酶促筛选方法则需要几年的时间。

在一种实施方式中，本发明提供了修饰小分子的方法，包括将在此所述的由多核苷酸编码的多肽或其酶活性片段与小分子接触，产生修饰的小分子。检测被修饰的小分子的文库以确定显示出所需活性的修饰小分子是否存在于文库内。产生具有所需活性的修饰小分子的特异性生物催化反应的鉴定可通过系统性地去除用来产生一部分文库的每个生物催化反应，然后检测在这一部分文库中产生的小分子是否存在具有所需活性的修饰小分子。产生具有所需活性的修饰小分子的特异生物催化反应可任选地被重复。生物催化反应可用一组生物催化剂来进行，它们可与在小分子的结构中发现的各种不同结构部分反应，每个生物催化剂对一个结构部分或一组相关的结构部分是特异的；每个生物催化剂可与含有各种不同的结构部分的许多不同的小分子反应。

醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的信号序列、前原结构域和催化结构域

本发明提供了醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶信号序列(例如信号肽(SPs))、前原(prepro)结构域和催化结构域(CDs)。本发明的SPs、前原结构域和/或CDs可以是分离的、合成的或重组的肽或可以是融合蛋白的一部分，例如作为嵌合蛋白中的异源结构域。在一些实施方式中，本发明提供了编码这些催化结构域(CDs)、前原结构域和信号序列(SPs，例如具有包括本发明的多肽的氨基末端残基或由本发明的多肽的氨基末端残基组成的序列的肽)的核酸。

本发明提供了分离的、合成的或重组的信号序列(如信号肽)，该信号序列包括下列序列或由下列序列组成，所述序列如本发明的多肽的残基1到14、1到15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、1到34、1到35、1到36、1到37、1到38、1到39、1到40、1到41、1到42、1到43、1到44、1到45、1到46或1到47或更多残基所示的序列，例如本发明的多肽，也参见表1、下面的实施例4、5和6以及序列表。例如，上文的表1列出了依据本发明的示例性的信号(前导)序列，如在具有由例如SEQIDNO:65编码的SEQIDNO:66中所列的序列的多肽中，有这样的信号序列，该信号序列包含氨基端27个残基，或对应于SEQIDNO:66的前27个氨基酸的MSIVVTKIERAGAAAVAALRTSGVATV(SEQIDNO:407)(或由之组成)。

在一些实施方式中，本发明提供了包含依据本发明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基端残基的信号序列。

本发明包括具有和没有信号序列和/或前原序列的多肽。在一些实施方式中，本发明包括具有异源信号序列和/或前原序列的多肽。前原序列(包括用作异源前原结构域的本发明序列)可以位于蛋白质的氨基末端或羧基末端。在一些实施方式中，本发明还包括分离或重组的含有本发明序列的信号序列、前原序列和催化结构域(例如，活性位点)。所述含有本发明的信号序列的多肽可以是本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，或另一种醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，或另一种酶或其它多肽。鉴定“前原”结构域和信号序列的方法在本领域是熟知的，例如VandeVen(1993)Crit.Rev.Oncog.4(2):115-136。例如，为了鉴定前原序列，从胞外空间纯化出蛋白质，确定其N末端蛋白序列，并将其与未加工的形式进行比较。

本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶信号序列(SP)和/或前原序列可以是分离的、合成的或重组的肽，或与另一种醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶或非醛缩酶，例如非丙酮酸醛缩酶，如非HMG和/或非KHG醛缩酶多肽连接的序列，例如融合(嵌合)蛋白。在一些实施方式中，本发明提供了含有本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶信号序列的多肽。在一些实施方式中，含有本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶信号序列SP和/或前原序列的多肽包含与本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶异源的序列(例如，含有本发明的SP和/或前原序列和来自另一种醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶或非醛缩酶，例如非丙酮酸醛缩酶，如非HMG和/或非KHG醛缩酶蛋白的序列的融合蛋白)。在一些实施方式中，本发明提供了具有异源SP和/或前原序列的本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，例如具有酵母信号序列的序列。本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以含有存在于载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中的异源SP和/或前原序列。

在一些实施方式中，本发明的SP和/或前原序列在鉴定出新的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶之后被鉴定出来。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路(proteintargetingpathways)。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列，称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置，并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列，这些信号序列标示着它们将转位至内质网腔内。信号序列的长度可以为从10至65或更多个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。例如，在一些实施方式中，新的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的信号肽可通过称为SignalP的方法来鉴定。SignalP应用了既可识别信号肽，又可识别其切割位点的组合神经网络。(Nielsen(1997)，“Indentificationofprokaryoticandeukaryoticsignalpeptidesandpredictionoftheircleavagesites”ProteinEngineering,卷10,1,1-6页)。

在一些实施方式中，依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶不具有SPs和/或前原序列或“结构域”。在一些实施方式中，本发明提供了缺少全部或部分SP和/或前原结构域的依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。在一些实施方式中，本发明提供了编码来自一种醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的信号序列(SP)和/或前原结构域的核酸序列，其与不同醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的核酸序列可操作地连接，或任选地，来自非醛缩酶，例如非丙酮酸醛缩酶，如非HMG和/或非KHG醛缩酶蛋白的信号序列(SP)和/或前原结构域可能是希望的。

本发明也提供了分离出的、合成的或重组的多肽，其含有本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)和异源序列。所述异源序列是与SP、前原结构域和/或CD天然不相关(如对于酶)的序列。与SP、前原结构域和/或CD天然不相关的序列可以在SP、前原结构域和/或CD的氨基末端、羧基末端，和/或SP和/或CD的两个末端上。在一些实施方式中，本发明提供了分离出的、合成的或重组的多肽，其包括(或构成)含有本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)的多肽，条件是它同与其天然相关的任何序列(例如，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)是不连接的。同样，在一个方面，本发明提供了编码这些多肽的分离出的、合成的或重组的核酸。因此，在一些实施方式中，本发明的分离出的、合成的或重组的核酸包括本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)的编码序列和异源序列(即，与本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)天然不相关的序列)。异源序列可在SP、前原结构域和/或CD编码序列的3’末端、5’末端和/或两个末端上。

杂交(嵌合)醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶和肽文库

在一些实施方式中，本发明提供了包含本发明的序列的杂合醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶和融合蛋白，包括肽文库。本发明的肽文库可以用于分离目标的肽调节剂(如，激活剂或者抑制剂)，如醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶底物、受体、酶。本发明的肽文库可以用于鉴定目标的形式结合伴侣，如，配体，例如，细胞因子、激素以及类似物。在一些实施方式中，本发明提供了含有本发明的信号序列(SP)、前原序列和/或催化结构域(CD)或其组合以及异源序列的嵌合蛋白质(见上)。

在一些实施方式中，本发明的融合蛋白(如，肽部分)是构象稳定的(相对于线形肽)，对靶标具有更高的结合亲和性。在一些实施方式中，本发明提供了本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶与其它肽的融合，所述其它肽包括已知的肽和随机的肽。它们可以以这样一种方式融合，使得所述醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的结构没有明显地被扰乱，并且该肽在代谢上或者结构构象上是稳定的。这样便允许获得这样的肽文库，其在细胞内的存在及其数量都是容易监测的。

依据本发明的氨基酸序列变异体可以通过该变异的预先确定的性质来表征，所述的预先确定的性质也就是将它们与天然发生的形式区分开的特征，所述的天然发生的形式例如醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶序列的等位基因的或者种间的变异。在一些实施方式中，本发明的变异体表现出与天然发生的类似物相同性质的生物活性。可选择地，可以选择具有改变的特征的变异体。在一些实施方式中，尽管引入氨基酸序列变化的位点或区域是预先决定的，但突变本身并不需要预先决定。例如，为了优化在一个给定位点出现的突变所带来的性能，可以在目标密码子或者区域进行随机诱变，并筛选被表达的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶变异体，以寻找所需活性的优化组合。在具有已知序列的DNA的预先决定的位点产生置换突变的技术是已熟知的，正如在此讨论的，例如，M13引物诱变和PCR诱变。突变体的筛选可以通过应用例如碳碳键形成或切割的分析来进行。在其他实施方式中，氨基酸置换可以是单个残基；插入可以是大约1到20个氨基酸的水平，尽管可以插入相当大的片段。缺失的范围可以是大约1到大约20、30、40、50、60、70个残基或者更多。为了得到具有优化性质的最终衍生物，替代、缺失、插入或者它们的任何组合都可以被应用。一般地，这些变化是在为数不多的氨基酸上进行，以使分子的改变最小化。然而，在某些情况下，可以容忍更大的改变。

本发明提供了醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，其中多肽骨架的结构、二级结构或三级结构，例如，α螺旋或β折叠结构，已被修饰。在一些实施方式中，电荷或疏水性已被修饰。在一些实施方式中，侧链基团已被修饰。通过选择较不保守的置换来产生功能或免疫性的实质变化。例如，可以进行这样的置换，它们将更加显著地影响：发生变化的区域的多肽骨架的结构，例如α螺旋或β折叠结构；分子的电荷或疏水位点，其可以是活性位点；或侧链。在一些实施方式中，本发明提供在本发明的多肽中的置换，其中(a)亲水残基，例如丝氨酰或苏氨酰，被疏水残基例如亮氨酰、异亮氨酰、苯基丙氨酰、缬氨酰或丙氨酰置换(或者相反)；(b)半胱氨酸或脯氨酸被任何别的残基置换(或者相反)；(c)具有正电性侧链的残基，例如赖氨酰、精氨酰或组氨酰被带负电的残基例如谷氨酰或天冬氨酰置换(或者相反)；或者(d)具有大体积侧链的基团，例如苯丙氨酸，被不具侧链的氨基酸例如甘氨酸置换(或者相反)。所述变异体可以表现出相同性质的生物学活性(即，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性)，尽管变异体可经选择来按需改变醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的特征。

在一些实施方式中，本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶包括表位(epitopes)或者纯化标记、信号序列或其它的融合序列，等。在一些实施方式中，本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以与随机的肽融合，形成融合多肽。“融合”或者“可操作地连接”在此是指随机肽和醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶连接在一起，其连接方式最小化了对醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的结构的稳定性的破坏，例如，其仍保持醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性。所述的融合多肽(或者编码该融合多肽的融合多核苷酸)还可以包含进一步的成分，包括在多个环(multipleloops)处的多个肽。

在一些实施方式中，所述肽和编码它们的核酸被随机化，或者是被完全随机化的，或者是在它们的随机化中有偏向，例如，在核苷酸/残基的总的频率或者每个位置处的频率方面有偏向。“随机化”是指每一核酸和肽分别由实质上随机的核苷酸和氨基酸组成。在一些实施方式中，产生所述肽的所述核酸可以化学合成，从而可以在任何位置整合进任何核苷酸。因此，当所述核酸被表达而形成肽时，任何氨基酸残基可以整合进任何位置。可以设计合成过程来产生随机化的核酸，从而允许在所述核酸的长度范围内形成所有的或大多数的可能组合，由此形成随机核酸文库。该文库可以提供足量的结构多样的随机化表达产物群体，可以获得概率上充分的细胞响应范围，从而可以提供一种或多种表现出所需响应的细胞。因此，本发明提供了一个足够大的相互作用文库，这样，其成员中的至少一个将具有使其对于一些分子、蛋白或者其他因子具有亲和性的结构。

在一些实施方式中，依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶是包含信号肽，糖类结合模块，醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶催化结构域，连接子(linker)和/或另一催化结构域的多结构域的酶。

本发明提供了产生可以编码生物学活性杂合多肽(例如，杂合醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)的嵌合多肽的方法和序列。在一些实施方式中，原始的多核苷酸(例如，本发明的核酸)编码生物学活性的多肽。在一些实施方式中，本发明的方法通过利用细胞内过程产生了新的杂合多肽，所述的细胞内过程可整合原始多核苷酸序列，这样，得到的杂合多核苷酸编码证明具有源自但不同于原始生物学活性多肽的活性的多肽(例如，本发明的醛缩酶或抗体)。例如，原始的多核苷酸可以编码来自或发现于不同微生物的特定酶(例如，醛缩酶)。由来自一个生物体或变异体的第一多核苷酸编码的酶可以，例如，在特殊的环境条件下，例如，高盐条件下，有效地发挥功能。来自不同生物体或变异体的第二多核苷酸编码的酶可在不同的环境条件下，如超高温条件下，有效地发挥功能。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸编码的酶可以显示了原始多核苷酸编码的两种酶的特性。因此，本发明的杂合多核苷酸编码的酶可在第一和第二多核苷酸编码的酶所共有的环境条件下，例如高盐和极端温度下，有效地发挥功能。

在一些实施方式中，由本发明的方法得到的杂合多肽可显示出在原始酶中不具有的特殊酶活性。例如，在编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的多核苷酸重组和/或进行还原性重配后，从得到的由杂合多核苷酸编码的杂合多肽中可筛选出由各个原始酶获得的特异非醛缩酶，例如非丙酮酸醛缩酶，如非HMG和/或非KHG醛缩酶活性，例如，水解酶、肽酶、磷酸化酶等活性。在一些实施方式中，杂合多肽被筛选以确定那些可区分杂合多肽和原始亲本多肽的化学功能性，如杂合多肽发挥作用的温度、pH或盐浓度。

在一些实施方式中，本发明涉及用于产生具有生物活性的杂合多肽以及筛选具有更高活性的多肽的方法，通过：

1)以可操纵的连接导入至少第一多核苷酸和以可操纵的连接导入至少第二多核苷酸到合适的宿主细胞，所述的至少第一多核苷酸和第二多核苷酸共有具有部分的序列同源性的至少一个区域；

2)在促进序列再组织的条件下培养宿主细胞，得到可操纵连接的杂合多核苷酸；

3)表达由所述杂合多核苷酸编码的杂合多肽；

4)在有利于鉴定增强的生物活性的条件下筛选所述的杂合多肽；和

5)分离编码该杂合多肽的多核苷酸。

分离并发现醛缩酶

本发明提供了分离和发现醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶以及编码它们的核酸的方法。多核苷酸或酶可以分离自个体生物体(“分离物”)、已经在成分确定的培养基中生长的生物体收集物(“富集培养物”)，或者未经培养的生物体(“环境样品”)。生物体可以通过例如体内生物淘选进行分离(参见下面的讨论)。应用不依赖于培养物的方法从环境样品获得编码新的生物活性的多核苷酸是最优选的，因为这样便可接触到具有生物多样性的原始来源。多核苷酸或酶也可以分离自许多生物体的任何一种，例如细菌。除了全细胞之外，多核苷酸或酶也可以分离自来源于这些生物体例如细菌的培养物的粗酶制备物。

“环境文库”可以从环境样品中获得，其代表天然发生的生物体的基因组集合，这些“环境文库”可以用克隆载体完成，所述克隆载体可以在适合的原核宿主中扩增繁殖。因为被克隆的DNA起初是直接从环境样品中提取的，所以所述文库并不限于可以在纯培养物中生长的小部分原核生物。另外，存在于这些样品中的来自环境的DNA的标准化使其可以更加公正地代表存在于原始样品的所有物种的DNA。这可以大大增加从所述样品的次要组成中发现令人感兴趣的基因的效率，所述次要组成与优势种相比，其所占的量可能小几个数量级。

在一些实施方式中，从一个或者多个未经培养的微生物中获得的基因文库被筛选以发现感兴趣的活性。编码感兴趣的生物活性分子的潜在途径首先在原核细胞中以基因表达文库的形式捕获。在一些实施方式中，编码令人感兴趣的活性的多核苷酸从这样的文库中分离出来并导入到宿主细胞中。该宿主细胞在促进重组和/或还原性重配的条件下生长，产生潜在的具有新的或者增强的活性的生物分子。

可利用基于FACS和基于非光学(例如，磁性)的仪器进行体内生物淘选。在一些实施方式中，用载体构建复杂基因文库，所述载体含有稳定转录的RNA的元件。例如，含有这样的序列将用于增强RNA的稳定性，从而增加它们在细胞中的半衰期，所述序列形成二级结构，例如发夹结构，其被设计来位于转录的RNA区的侧翼。用于生物淘选过程中的探针分子由用报告分子标记的寡核苷酸组成，所述报告分子仅在探针与靶分子结合后发荧光。使用几种转化技术的一种，这些探针被引入文库中的重组细胞。所述探针分子结合到转录的靶mRNA，得到DNA/RNA异源双链体分子。探针与靶标结合将产生荧光信号，该信号在筛选过程期间用FACS仪器检测和分选。

在一些实施方式中，可进行亚克隆以进一步分离感兴趣的序列。在亚克隆中，DNA的一部分被扩增、消化——通常是通过限制性酶——以剪切所需的序列，所需的序列被连接进接受载体中，并被扩增。在亚克隆的每个步骤中，该部分被检测感兴趣的活性，以保证编码结构蛋白的DNA不被排除。插入物可在亚克隆的任何步骤中被纯化，例如在连接入载体之前通过凝胶电泳，或在含有接受载体的细胞和不含有接受载体的细胞被置于选择性培养基中时，所述培养基含有例如抗生素，其可杀死不含有接受载体的细胞。将cDNA插入物亚克隆进载体中的具体方法在本领域中是为人所熟知的(Sambrook等人，MolecularCloning:ALaboratoryMannual,第二版，ColdSpringHarborLaboratoryPress(1989))。在其他实施方式中，本发明的酶是亚克隆。这种亚克隆与亲代克隆的差别在于，例如，长度、突变、标志物(tag)或标记(label)。

可以发现、分离或制备所述多核苷酸的微生物包括原核微生物如真细菌和古细菌，低等真核微生物如真菌、一些藻和原生动物。多核苷酸可以是发现于、分离自或制备于环境样品，在这种情况下，核酸被回收而不需培养某一种生物体，或者是从一种或者多种培养的生物中回收。在一些实施方式中，这样的微生物可以是适于极端环境的，如，嗜高温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的酶的多核苷酸可以被应用。本发明的酶可以超过100℃的温度有作用，例如在地表温泉和深海的热火山口发现的那些，或者在低于0℃的温度有作用，例如在北极水域中发现的那些，在饱和的盐环境下有作用，例如在死海中发现的那些，在pH值在0附近起作用，例如在煤层沉积物和地热富硫矿泉中发现的那些，或者在pH值超过11下起作用，例如在污水污泥中发现的那些。在一些实施方式中，本发明的酶在很宽的温度和pH范围内具有高活性。

如上所述的选择和分离的多核苷酸被导入进合适的宿主细胞中。合适的宿主细胞是能够促进重组和/或还原性重配的任何细胞。被选择的多核苷酸在一些实施方式中已经在包括有合适的控制序列的载体中。宿主细胞可以是高等的真核细胞，如哺乳动物细胞，或低等真核细胞，如酵母细胞，或在一些实施方式中，宿主细胞可以是原核细胞，如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染，或电穿孔来实现。

示例性的宿主包括：细菌细胞，如大肠杆菌、链霉菌、鼠伤寒沙门氏菌；真菌细胞，如酵母；昆虫细胞如果蝇S2和草地夜蛾Sf9；动物细胞如CHO、COS或者黑色素瘤细胞；腺病毒和植物细胞；参见上面的讨论。通过本文的教导，选择适合的宿主被认为是在本领域技术人员已知的范围内。

各种哺乳动物细胞培养系统可以用于表达重组蛋白；哺乳动物表达系统的例子包括猴肾纤维原细胞的COS-7系，其在“SV40-transformedsimiancellssupportthereplicationofearlySV40mutants”(Gluzman,1981)中有说明，和其它的可以表达相容性载体的细胞系，例如，C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子，以及任何必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列，以及5’侧翼的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。

在其它实施方式中，本发明的核酸、多肽和方法可以用于生物化学途径中，或用于产生编码来自一个或者多个操纵子或者基因簇或者其中的部分的生物化学途径的新的多核苷酸。例如，细菌和很多真核生物具有用于调控基因的协作机制，所述基因的产物涉及相关的过程。基因成簇排列在单一染色体上，在结构上称为“基因簇”，它们在单个调控序列的控制下一起转录，所述调控序列包括起始整个簇的转录的单个启动子。因此，基因簇是指一组或者相同或者相关的相邻基因，一般是指功能上相关的邻近的基因(通过基因簇编码的生物化学途径的一个例子是聚酮化合物(polyketides))。

在一些实施方式中，基因簇DNA可以从不同的生物体中分离出来并且连接到载体中，尤其是含有表达调控序列的载体，所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于外源DNA引入具有非常大的容量的载体特别适合用于这样的基因簇的情况，在这里通过括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒，在接合过程中它能实现自身的高频率转移，f-因子对于获得和稳定扩增大DNA片段，如来自混合的微生物样品的基因簇是理想的。在一些实施方式中，使用被称作“F粘粒”的克隆载体，或者细菌人工染色体(BAC)载体。它们是源于大肠杆菌f因子，可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时，这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。用于本发明的另一类型的载体是黏粒载体。黏粒载体最初是设计用来克隆和扩增基因组DNA的大片段。应用黏粒载体的克隆在Sambrook等,MolecularCloning:ALaboratoryMannual，第二版，ColdSpringHarborLaboratoryPress(1989)中有详细说明。一旦连接到适当的载体，含有不同的聚酮化合物合成酶基因簇的两个或者更多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选，以寻找在起初的基因簇没有发现的增强的活性。

筛选各种酶活性的方法被本领域技术人员公知并且贯穿全部本说明书被讨论，参见下文实施例1、2和3。当分离依据本发明的多肽和多核苷酸时，可以采用这些方法。

在一些实施方式中，本发明提供了发现和分离醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的方法，或者使用全细胞方法修饰这些酶的活性的化合物(参见下面的讨论)。可以从基因组DNA文库筛选编码醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的推定克隆。

筛选方法和“在线”监控设备

在实践本发明的方法中，多种仪器和方法可以与本发明的多肽和核酸一起使用，例如，用来筛选多肽的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性，用来筛选作为醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的潜在调节剂的化合物，诸如激活剂或抑制剂，还可以用来筛选与本发明的多肽结合的抗体、与本发明的核酸杂交的核酸，用来筛选表达本发明的多肽的细胞，等等。除了下面详细描述的用于筛选样品的阵列形式以外，也可使用可选形式来实施本发明的方法。这样的形式包括，例如质谱仪、色谱仪，例如，高通量HPLC和其它形式的液相色谱，和更小的形式，如1536-孔板、384-孔板等等。高通量筛选仪器可被改装并用来实施本发明的方法，见美国专利申请20020001809；20050272044。

毛细管阵列

本发明的核酸或多肽可被固定或应用于阵列上。阵列可用来筛选或监测组合物(例如，小分子、抗体、核酸等)的文库，以发现它们结合本发明的核酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列，如GIGAMATRIX^TM,戴弗萨公司(DiversaCorporation),SanDiego,CA；和描述在例如美国专利申请20020080350Al；WO0231203A；WO0244336A中的阵列，提供了容纳和筛选样品的可供选择的装置。在一些实施方式中，毛细管阵列包括多个毛细管，它们形成具有相互邻接的毛细管的阵列，其中所述的每个毛细管含有至少一个壁，其限定了一个用以保留样品的内腔。这个内腔可以是圆柱形的、正方形的、六边形的或其它任何几何形状，只要其壁能够形成内腔以保留液体或样品。毛细管阵列的毛细管可相互靠近联合在一起形成一个面状的构造。毛细管可通过融合(例如，当毛细管由玻璃制成时)、粘合、键合或面对面的夹合而结合在一起。此外，毛细管阵列可以包括在阵列中相邻毛细管之间放置的间质材料(interstitialmaterial)，从而形成含有多个穿通孔(through-holes)的固体平面装置。

毛细管阵列可由任何数量的毛细管形成，例如，100至4,000,000个毛细管。进一步，具有大约100,000或更多个单个毛细管的毛细管阵列可形成标准大小和形状的板，其适合于标准的实验室设备。通过毛细作用或使用细针的微注射，人工或自动地将腔充满。随后可以从毛细管中移出感兴趣的样品以进行进一步的分析或定性。例如，安置细针样的探头，使其与选择的毛细管能够液体连通，从而可以向腔内加入材料或移走材料。

在单区筛选分析(single-potscreeningassay)中，分析组分在插入到毛细管阵列中之前被混合在一起，产生目的溶液。当至少一部分阵列被浸入目标溶液中时，通过毛细作用充满内腔。在每个毛细管中的化学或生物学反应和/或活性被监测，以发现可检测事件。所述的可检测事件常常被称为“命中事件(hit)”，其常常可以通过光学检测与产生“非命中事件(non-hit)”的毛细管区分开来。因此，毛细管阵列可大量地并行检测“命中事件”。

在多区筛选分析(multi-potscreeningassay)中，多肽或核酸，例如，配体可被导入进第一组分中，该组分被导入进毛细管阵列的至少一部分毛细管中。然后将气泡导入进第一组分后面的毛细管中。然后将第二组分导入进毛细管内，其中所述的第二组分与第一组分通过气泡相隔。通过在毛细管阵列的两侧施加静水压挤破气泡将第一和第二组分混合在一起。然后监测毛细管阵列中由两个组分的反应或非反应而发生的可检测事件。

在结合筛选分析(bindingscreeningassay)中，目标样品可作为用可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中，其中为了使可检测颗粒与内腔结合，毛细管的内腔包被了一种结合材料。然后第一液体可从毛细管中移去，其中结合的可检测颗粒仍保留在毛细管内，可以将第二液体导入进毛细管内。然后监测毛细管中由颗粒与第二液体的反应或非反应而发生的可检测事件。

阵列或“生物芯片”

本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测组合物(例如，小分子、抗体、核酸等等)的文库，所述筛选或者监测是针对它们结合本发明的核酸或多肽或者调控本发明的核酸或多肽的活性的能力。例如，在本发明的一些实施方式中，一个被监测的参数是醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶基因的转录表达。细胞的一种或多种或所有的转录物可以通过杂交到阵列或“生物芯片”上的固定化核酸与包含细胞转录物、或代表细胞转录物的核酸、或与细胞转录物互补的核酸的样品的杂交来测定。通过在微型芯片上应用核酸“阵列”，细胞的一些或所有的转录物可以同时被定量。可选择地，包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。本发明可以用任何已知的“阵列”进行实践，所述“阵列”也被称为“微阵列”或“核酸阵列”或“多肽阵列”或“抗体阵列”或“生物芯片”，或者它们的变体。阵列一般是多个“点”或者“靶元素”，每一个靶元素包括确定数量的一种或多种生物分子，例如，固定于基材表面的确定区域、用于特异结合样品分子如mRNA转录物的寡核苷酸。

在此使用的术语“阵列”或“微阵列”或“生物芯片”或“芯片”是多个靶元素，每个靶元素包括固定在基材表面的确定区域上的确定量的一种或多种多肽(包括抗体)或核酸，以下进一步详细讨论。

在实践本发明的方法时，任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地并入，或者引入它们的变体，例如在下列文献中说明的：美国专利6,277,628、6,277,489、6,261,776、6,258,606、6,054,270、6,048,695、6,045,996、6,022,963、6,013,440、5,965,452、5,959,098、5,856,174、5,830,645、5,770,456、5,632,957、5,556,752、5,143,854、5,807,522、5,800,992、5,744,305、5,700,637、5,556,752、5,434,049；也参见，例如WO99/51773、WO99/09217、WO97/46313、WO96/17958；也参见，例如Johnston(1998)Curr.Biol.8:R171-R174；Schummer(1997)Biotechniques23:1087-1092；Kern(1997)Biotechniques23:120-124；Solinas-Toldo(1997)Genes,Chromosomes&Cancer20:399-407；Bowtell(1999)NatureGeneticsSupp.21:25-32。也参见公开的美国专利申请号20010018642、20010019827、20010016322、20010014449、20010014448、20010012537、20010008765。

抗体和基于抗体的筛选方法

本发明提供了分离的、合成的或重组的抗体，其特异地结合依据本发明的醛缩酶，例如丙酮酸醛缩酶、HMG和/或KHG醛缩酶。这些抗体可以用于分离、识别或量化依据本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶或相关多肽。这些抗体可以被用于分离在本发明范围内的其它多肽，或其它相关醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。抗体可以被设计以结合醛缩酶，如丙酮酸醛缩酶、HMG和/或KHG醛缩酶的活性位点。因此，本发明提供了使用依据本发明的抗体抑制醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的方法(参见上文关于依据本发明的抗醛缩酶，如抗丙酮酸醛缩酶，如抗HMG和/或抗KHG醛缩酶组合物的使用的讨论)。

术语“抗体”包括来源于(derivedfrom)、出自于(modeledafter)或大体上编码于(substantiallyencodedby)一个免疫球蛋白基因或多个免疫球蛋白基因的肽或多肽或者其片段，它们能特异地结合于抗原或表位，见例如，FundamentalImmunology，第三版，W.E.Paul,ed.,RavenPress,N.Y.(1993)；Wilson(1994)J.Immunol.Methods175:267-273；Yarmush(1992)J.Biochem.Biophys.Methods25:85-97。术语抗体包括结合抗原的部分，即，保留与抗原结合的能力的“抗原结合位点”(例如，片段、子序列、互补决定区(CDRs))，包括(i)Fab片段，由VL、VH、CL和CH1结构域组成的单价片段；(ii)F(ab’)2片段，包括在铰链区由二硫键连接的两个Fab片段的二价片段；(iii)由VH和CH1结构域组成的Fd片段；(iv)由抗体单臂(asinglearm)的VL和VH结构域组成的Fv片段；(v)由VH结构域组成的dAb片段(Ward等,(1989)Nature341:544-546)，和(vi)分离出的互补决定区(CDR)。单链抗体也被包括在术语“抗体”中。

本发明提供了本发明的酶(例如肽)的片段，包括本发明的多肽的免疫原性片段(例如，子序列)。在一些实施方式中，本发明提供了含有本发明的多肽或肽和佐剂或载体以及类似物的组合物。

所述抗体可以在免疫沉淀、染色、免疫亲合柱等等中被应用。如果需要的话，编码特异抗原的核酸序列可以通过免疫方法获得，随后分离出多肽或者核酸，进行扩增或者克隆，将多肽固定在本发明的阵列上。可供选择的，本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构，如，抗体的亲和性可以增加或者降低。而且，制备或者修饰抗体的能力可以是通过本发明的方法设计细胞表型。

免疫、产生和分离抗体(多克隆的或者单克隆的)的方法是本领域技术人员所了解的，并且在科学和专利文献中有描述，参见，如，Coligan,CURRENTPROTOCOLSINIMMUNOLOGY,Wiley/Greene,NY(199l)；Stites(eds.)BASICANDCLINICALIMMUNOLOGY(第7版)LangeMedicalPublications,LosAltos,CA(“Stites”)；Goding，MONOCLONALANTIBODIES：PRINCIPLESANDPRACTICE(第2版)AcademicPress,NewYork,NY(1986)；Kohler(1975)Nature256:495；Harlow(1988)ANTIBODIES,ALABORATORYMANUAL,ColdSpringHarborPublications,NewYork。除了使用动物的传统的体内方法外，抗体也可以在体外产生，例如，应用表达重组抗体结合位点的噬菌体展示文库。参见如，Hoogenboom(1997)TrendsBiotechnol.15：62-70；Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26：27-45。

依据本发明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段，也可用来产生与所述多肽或片段特异结合的抗体。得到的抗体可应用于免疫亲和层析程序，以分离或纯化多肽，或确定多肽是否存在于生物样品中。在这样的程序中，蛋白制备物，如提取物，或生物样品与能够同本发明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段之一特异结合的抗体接触。

在免疫亲和步骤中，抗体被连接到固态支持物，如珠子或其它柱基质。蛋白制备物被置于在抗体特异结合一种依据本发明的多肽或其片段的条件下与抗体接触。清洗去除非特异结合蛋白之后，特异结合的多肽被洗脱。

在生物样品中蛋白结合所述抗体的能力可以通过使用本领域技术人员所熟悉的各种方法来确定。例如，结合可以通过用例如荧光试剂、酶标记或者放射性同位素的可检测标记物来标记所述抗体来确定。可选择地，所述抗体与所述样品的结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分析、放射免疫分析以及Western印迹。

针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段产生的多克隆抗体可通过直接将多肽注射进动物中或通过将多肽给予动物，例如非人动物而获得。这样获得的抗体可与多肽本身结合。以这种方式，甚至仅编码多肽的一个片段的序列也可用来产生可与整个天然多肽结合的抗体。这种抗体然后可用来从表达所述多肽的细胞中分离多肽。

为了制备单克隆抗体，可使用可通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术(Kohler和Milstein,Nature,256:495-497,1975)、三体瘤技术、人B-细胞杂交瘤技术(Kozbor等人，ImmunologyToday4:72,1983)和EBV-杂交瘤技术(Cole等人,1985,inMonoclonalAntibodiesandCancerTherapy,AlanR.Liss,Inc.,pp.77-96)。

用于产生单链抗体的技术(美国专利4,946,778)可被改动，以使之适于产生本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的单链抗体。可选择地是，转基因小鼠可用来表达这些多肽或其片段的人源化抗体。

产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的抗体可用于筛选来自其它生物体和样品的类似多肽。在这些技术中，来自生物体的多肽与抗体接触，并且检测可与抗体特异结合的那些多肽。上述的任何程序可用来检测抗体的结合。一种这样的筛选试验在ShulmanH,EberhardA,EberhardC,UlitzurS,KeinanE,BioorgMedChemLett.2000Oct16；10(20):2353-6，Highlysensitiveandrapiddetectionofantibodycatalysisbyluminescentbacteria(高度灵敏和快速检测发光细菌产生的抗体催化)中描述。

试剂盒

本发明提供了包含组合物，如依据本发明的核酸、表达盒、载体、细胞、转基因种子或植物或植物部分、多肽(如醛缩酶)和/或抗体的试剂盒。所述试剂盒也可以包括如在此所述的用于教导本发明的方法学以及工业、医疗和饮食应用的指导性材料。

全细胞工程和测定代谢参数

依据本发明的方法提供了细胞的全细胞进化或全细胞工程化，以通过修饰细胞的遗传组成开发出具有新表型，如新的或修饰的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的新细胞株。参见美国专利申请号20040033975。

可以通过向细胞中加入本发明的核酸，例如本发明的酶的编码序列而修饰遗传组成。见，例如，WO0229032；WO0196551。

为了探测新的表型，在“实时”或者“在线”的时间范围内监测被修饰的细胞的至少一种代谢参数。在一些实施方式中，多个细胞，如培养细胞物被“实时”或者“在线”监测。在一些实施方式中，“实时”或者“在线”监测多个代谢参数。代谢参数可以应用本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶进行监测。

代谢流分析(MFA)是以已知的生物化学框架为基础。以质量守恒定律和关于细胞内代谢的假稳态假说(PSSH)为基础，构建线性独立代谢矩阵。在实践本发明的方法时，建立代谢网络，包括：

·所有途径底物、产物和中间代谢物的特性；

·使途径代谢物互变的所有化学反应的特性，途径反应的化学计量学；

·催化反应的所有酶的特性，酶反应动力学；

·途径组分之间的调控性相互作用，如变构效应相互作用，酶-酶相互作用等；

·酶或者酶的任何其它超大分子组织在细胞内的区室化，以及

·任何浓度梯度的代谢物、酶或者效应分子的存在，或者它们运动的扩散障碍。

一旦针对给定的细胞株建立了代谢网络，如果在线代谢数据可用，那么可以通过矩阵概念引入数学表达来评估细胞内的代谢流。代谢表型依赖于细胞内整个代谢网络的变化。代谢表型依赖于途径利用对环境条件、遗传调控、发育状态和基因型等等作出的变化。在本发明方法的一些实施方式中，当计算了在线MFA之后，通过研究所述的途径利用来分析细胞的动力学行为、它们的表型和其它性质。例如，在酵母发酵中，如果葡萄糖供应增加，氧气减少，呼吸途径的利用将会降低和/或者停止，而发酵途径的利用将占优势。在所述的途径分析之后，细胞培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导物的使用等来控制细胞的生理状态朝着所需的方向进行，本发明的方法可以有助于确定如何操纵发酵。在实践本发明的方法时，MFA的结果也可以与转录物组(transcriptome)和蛋白质组(proteome)的数据比较，设计实验和方案用于代谢工程或者基因重排等等。

在实践本发明的方法时，可以产生和检测到任何经修饰改变的或者新的表型，包括在细胞中新的或者改进的特征。可以监测代谢或者生长的任何方面。

监测mRNA转录物的表达

在本发明的一些实施方式中，工程化的表型包括增加或者降低mRNA转录物(如，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶信息)的表达或者在细胞中产生新的(如，醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)转录物。这一增加或者减少的表达可以通过测定本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的存在，或者通过醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性分析来跟踪。mRNA转录物或者信息也可以通过本领域已知的任何方法来检测或者定量，包括，例如，Northern印迹、定量扩增反应、阵列杂交以及类似的方法。定量扩增反应包括，如，定量PCR，包括，如，定量反转录聚合酶链式反应，或者RT-PCR；定量实时RT-PCR，或者“实时动力学RT-PCR”(参见Kreuzer(2001)Br.J.Haematol.114:313-318；Xia(2001)Transplantation72：907-914)。

在本发明的一些实施方式中，工程化的表型是通过敲除同源基因的表达产生。可以敲除所述基因的编码序列或者一个或多个转录控制元件，如启动子或者增强子。这样，转录物的表达可以完全去除或者仅被降低。

在本发明的一些实施方式中，所述工程化的表型包括增加同源基因的表达。这可以通过敲除负调控元件或者诱变正调控元件而实现，负调控元件包括以顺式或者反式起作用的转录调控元件。细胞的一种或者多种或者所有的转录物可以通过阵列上的固定化核酸与包含细胞转录物的样品，或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。

监测多肽、肽和氨基酸的表达

在本发明的一些实施方式中，工程化的表型包括增加或者降低多肽(如醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)的表达或者在细胞内产生新的多肽。这一增加或者减少的表达可以通过确定存在的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的量或者通过醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性分析来跟踪。也可以通过本领域任何已知的方法来检测并定量多肽、肽和氨基酸，所述方法包括，如，核磁共振(NMR)、分光光度测定法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)、超扩散色谱，各种免疫学方法，如，免疫沉淀、免疫扩散、免疫电泳、放射性免疫分析(RIAs)、酶联免疫吸附分析(ELISAs)、免疫荧光分析，凝胶电泳(如，SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热分解质谱、傅立叶变换红外光谱测定、拉曼光谱、GC-MS和LC-电喷以及cap-LC-串联-电喷质谱，以及类似的方法。应用这些方法或者它们的变体也可以筛选新的生物活性，在美国专利6,057,103中有描述。而且，正如以下详细讨论的，可以应用蛋白阵列测定细胞的一种或者多种或者所有的多肽。

工业、药物和其它应用

依据本发明的多肽(例如具有醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶)可以催化碳-碳键的形成或剪切。依据本发明的酶可以是高度选择性催化剂。在一些实施方式中，本发明提供了使用依据本发明的酶的工业过程，如在药物或营养(膳食)补充剂工业，在食品和饲料工业中，如在制备食品和饲料产品及食品和饲料添加剂的方法中。在一些实施方式中，本发明提供了在医药工业中使用依据本发明的酶的方法，如生产药物或膳食辅助剂或补充剂，或食品补充剂和添加剂。

生物质转化和清洁生物燃料的生产

本发明提供了酶，例如醛缩酶，包括丙酮酸醛缩酶，如没有限制地，HMG和/或KHG醛缩酶(包括混合物，或酶的“混合物”)，以及使用本发明的酶将生物质或任何木质纤维材料(如包含纤维素、半纤维素和木质素的任何组合物)转化为除饲料、食品和化学药品外的燃料(如生物乙醇、生物丁醇、生物丙醇、生物甲醇、生物柴油)。因此，本发明的组合物及方法提供了石油基产品使用的有效并可持续的替代选择或附属物，如生物乙醇与汽油的混合物。本发明提供了表达本发明的酶的生物，用于参与涉及天然生物质转化的化学循环。在一种实施方式中，用于转化的酶和方法被用在酶整体(enzymeensembles)中，以有效解聚纤维素和半纤维素的聚合物为可代谢的碳部分。本发明提供了发现并实施最有效的酶的方法，以使这些重要的新“生物质转化”和可选的能源工业过程能够进行。

本发明的方法也包括利用被转化的木质纤维材料(通过本发明的酶处理)并通过发酵和/或通过化学合成将其制成燃料(如生物乙醇、生物丁醇、生物丙醇、生物甲醇、生物柴油)。在一种实施方式中，产生的糖被发酵和/或不发酵的产品被气化。

本发明的酶(包括，例如生物体，如微生物，例如真菌、酵母或细菌，产生和在一些实施方式中分泌本发明的重组酶)可以在任何生物质转化过程的任何步骤被使用或包含/纳入，如在任意一步、若干步，或在所有步骤中被包含，或包含在所有以下生物质转化过程的方法中，或所有这些生物燃料的替换选择中：

·直接燃烧：材料通过直接加热燃烧并且是最简单的生物质技术；如果生物质来源在附近，可以是非常经济的。

·热分解：是生物质在无氧的条件下通过加热的热降解。在一种实施方式中，生物质被加热到约800到1400华氏度之间的温度，但是没有氧气被引入以支持燃烧，导致气体、燃料油和炭的产生。

·气化：生物质可以被用于通过加热或厌氧消化生产甲烷。合成气，一氧化碳和氢气的混合物，可以从生物质衍生得到。

·堆填区沼气(LandfillGas)：通过堆填区掩埋垃圾的腐败(厌氧消化)产生。当有机废物降解，其产生包含约50％甲烷的气体，甲烷是天然气的主要成分。

·厌氧消化：将有机物质转化为甲烷和二氧化碳的混合物，甲烷是天然气的主要成分。在一种实施方式中，生物质，如废水(污水)、肥料或食品加工废物，与水混合并在没有空气的情况下被注入消化器罐。

·发酵

·醇发酵：燃料醇通过将淀粉转化为糖，糖发酵成为醇，随后通过蒸馏分离醇水混合物产生。原料，如小麦、大麦、马铃薯和废纸、锯末和含有糖的秸秆、淀粉或纤维素可以通过用酵母发酵被转化为醇类。

·酯交换：将油转化为生物柴油的一个示例性反应被称作酯交换。酯交换方法将醇(像甲醇)与植物油、动物脂肪或循环利用的油脂中含有的甘油三酯油反应，形成脂肪酸烷基酯(生物柴油)和甘油。该反应要求加热和强碱催化剂，如氢氧化钠或氢氧化钾。

·生物柴油：生物柴油是由植物油、动物脂肪或循环利用的油脂制备的脂肪酸烷基酯的混合物。生物柴油能够以其纯净的形式用作车辆的燃料，但是其通常被用作石油柴油的添加剂，以降低柴油驱动的车辆释放的微尘、一氧化碳、烃和空气毒物的水平。

·水解：包括使用本发明的酶催化，催化化合物，例如生物质，如木质纤维材料的水解。

·共产生(Congeneration)：是使用单一燃料和设备同时产生一种以上形式的能量。在一种实施方式中，生物质共产生具有比生物质单独产生更有潜力的生长，因为共产生的方式产生热量和电。

在一种实施方式中，本发明的多肽具有醛缩酶活性，包括丙酮酸醛缩酶活性，如没有限制地，HMG和/或KHG醛缩酶活性，或用于从有机材料中产生生物柴油、生物乙醇、生物丁醇、生物丙醇或生物甲醇的其它酶活性，所述有机材料例如生物质，如从植物和动物，包括任何农作物或其它可再生原料，农业残余物或动物排泄物衍生的组合物，或市政和工业废料的有机组分，或微生物，如藻类或酵母。在一种实施方式中，本发明的多肽被用在将木质纤维生物质转化为乙醇、丁醇、丙醇、甲醇的过程或被用在水解或消化生物材料以便其可以被用作生物燃料(包括生物乙醇、生物丁醇、生物丙醇、生物甲醇或生物柴油)，或使生物质更容易加工成燃料的过程中。在可选的实施方式中，本发明的多肽被用在酯交换过程的方法中，使醇(像甲醇)与植物油、动物脂肪或循环利用的油脂中含有的甘油三酯油反应，形成脂肪酸烷基酯(生物柴油)和甘油。在一种实施方式中，生物柴油从大豆油或循环利用的烹调油中制备。动物的脂肪、其它植物油和其它循环利用的油也可以用于生产生物柴油，这取决于其成本和可用性。在另一种实施方式中，所有种类的脂肪和油的混合物被用于生产本发明的生物柴油燃料。

本发明的酶也可以被用于甘油精炼。甘油副产物含有未反应的催化剂和用酸中和的(肥)皂。水和醇被除去以产生50％到80％的粗甘油。剩余的污染物包括未反应的脂肪和油，其可以使用本发明的多肽处理。在本发明的大型生物柴油厂中，甘油可以被进一步纯化，如达到99％或更高的纯度，用于制药和化妆品工业。

使用本发明的多肽生产的生物乙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油可以与燃料氧合物(oxygenate)使用，以改善燃烧性质。加入氧导致更完全的燃烧，这降低了一氧化碳的释放。这是用生物燃料(如本发明的燃料)替代石油燃料的另一环境优点。使用本发明的组合物和/或方法生产的生物乙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油可以与汽油混合，以形成E10混合物(约5％到10％的乙醇和约90％到95％的汽油)，但是其可以更高浓度，如E85，或以其纯净的形式被使用。使用本发明的组合物和/或方法生产的生物乙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油可以与石油柴油混合形成B20混合物(20％生物柴油和80％石油柴油)，尽管其它混合水平可以被使用达B100(纯生物柴油)。

本发明也提供了从含有木质纤维材料的组合物生产乙醇(“生物乙醇”)、丁醇(“生物丁醇”)、丙醇(“生物丙醇”)、甲醇(“生物甲醇”)和/或柴油(“生物柴油”)的方法。木质纤维生物质材料可以从农作物中，作为食品或饲料生产的副产物，或作为木质纤维废料产品，如植物残余物和废纸获得。用本发明的多肽处理的合适的植物来源或植物残余物的实例包括海草灰、藻类、谷类、种子、茎、叶、壳、外壳、玉米芯、玉米秆、秸秆、草类(例如印度草，如Sorghastrumnutans；或柳枝稷(switchgrass)，如黍属(Panicumspecies)，如柳枝稷(Panicumvirgatum))等，以及木材、木片、木浆和锯屑。适合用本发明的多肽处理的纸废物的实例包括丢弃的复印纸、计算机打印纸、笔记本纸、便笺纸、打字机纸等，以及报纸、杂志、纸板和纸基的包装材料。

在一种实施方式中，本发明的酶和方法可以与更“传统的”从生物质生产乙醇、甲醇、丁醇、丙醇和/或柴油的方法联合使用，所述方法例如包括通过使干燥过的木质纤维素材料在反应器中与由强酸和金属盐的稀释溶液组成的催化剂接触而水解木质纤维素材料；这可以降低纤维素水解的活化能或温度，以获得更高的糖产率；参见，例如美国专利号6,660,506和6,423,145。

使用本发明的酶的另一种实施方式包括：通过使木质素纤维素材料在一定的温度和压力下在含水介质中经受第一阶段的水解步骤而水解含有半纤维素、纤维素和木素的木质纤维素材料，所述温度和压力被选择来实现半纤维素的初步解聚而不将纤维素大部分解聚成葡萄糖。该步骤得到一种浆，其中含水液相含有从半纤维素解聚得到的溶解的单糖，而固相含有纤维素和木素。第二阶段水解步骤可以包括使得至少大部分纤维素被解聚的条件，该步骤产生含有溶解的/可溶的纤维素解聚产物的含水液相。参见，例如，美国专利5,536,325。本发明的酶可以在该示例性方法中的任何阶段加入。

使用本发明的酶的另一种实施方式包括：通过一个或多个用大约0.4％至2％的强酸进行稀释酸水解的阶段来处理含木质纤维素的生物质材料；以及通过碱性去木质作用来处理酸水解的生物质材料的未反应的固体木质纤维素成分，以产生可生物降解的热塑塑料和衍生产品的前体。参见，例如，美国专利6,409,841。本发明的酶可以在该示例性方法中的任何阶段加入。

使用本发明的酶的另一种实施方式包括：在预水解反应器中预水解木质纤维素材料；向该固体木质纤维素材料加入酸性液体，制备混合物；将该混合物加热至反应温度；维持反应足够的时间，以将木质纤维素材料分馏成含有至少大约20％的来自木质纤维素材料的木质素的溶解部分以及含有纤维素的固体部分；当处于或接近其中固体部分中的纤维素变得更易于进行酶促降解的反应温度时，从固体部分除去溶解部分；以及回收溶解部分。参见，例如，美国专利5,705,369。本发明的酶可以在该示例性方法中的任何阶段加入。

本发明提供了制备基于液体烃的发动机燃料组合物(例如，用于火花点火发动机)的方法，所述液体烃掺混有利用本发明的酶或方法制备的燃料级醇。在一种实施方式中，利用本发明的酶生产的燃料包括，例如液体煤气或液体天然气-乙醇、甲醇、丁醇、丙醇和/或柴油混合物。在一种实施方式中，共溶剂是生物质衍生的2-甲基四氢呋喃(MTHF)。参见，例如，美国专利6,712,866。

在一种实施方式中，用于木质纤维素的酶促降解的本发明方法，例如，用于从木质纤维素材料生产乙醇的方法，还可以包括生物质材料的超声处理；参见，例如，美国专利6,333,181。

在另一实施方式中，本发明用于从纤维素底物生产生物乙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油的方法包括提供浆体形式的反应混合物，其包含纤维素底物、本发明的酶和发酵试剂(如，在反应容器内，例如半连续固体送料生物反应器)，以及该反应混合物在足以起始并维持发酵反应的条件下反应(如美国专利申请号20060014260中所述)。在一种实施方式中，实验或理论计算可以确定最优的给料频率。在一种实施方式中，额外量的纤维素底物和酶根据优化的送料频率的间隔被送进反应容器。

本发明生产生物燃料(如生物乙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油)的一个示例性方法在美国专利申请公开号20050069998、20020164730中描述；并且在一种实施方式中，包括以下步骤：研磨木质纤维素生物质(如，到15-30mm的大小)，使获得的产物在反应器中经历蒸汽爆碎(steamexplosion)预处理(如，在190-230℃的温度)1到10分钟；在气旋中收集预处理的材料或产生的相关产物；以及通过在压力过滤机(filterpress)中过滤分离液态和固态馏分，向发酵沉积物引入固态馏分并加入一种或多种本发明的酶，如纤维素酶和/或β-葡萄糖苷酶(如溶解在柠檬酸缓冲液pH4.8中)。

使用本发明的酶生产本发明的生物燃料(如生物乙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油)的另一个示例性的方法包括：预处理包含木质纤维原料的起始材料，所述木质纤维原料至少包含半纤维素和纤维素。在一种实施方式中，起始材料包括马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗或成分或废物或食品或饲料生产副产物。起始材料(“原料”)在破坏植物纤维结构的条件下发生反应，以实现半纤维素和纤维素的至少部分水解。破坏性条件可以包括，例如使起始材料在pH0.5至2.5下经受180℃至270℃的平均温度大约5秒至60分钟的时间；或，在pH0.5至2.5下经受220℃至270℃的温度大约5秒至120秒的时间，或同等条件。这产生增加了可利用性的原料，该原料有待本发明的酶例如纤维素酶消化。美国专利6,090,595。

木质纤维材料水解的示例性条件包括在约30℃到48℃和/或约pH4.0到6.0的条件下反应。其它示例性条件包括在约30℃到60℃和pH在约4.0到8.0之间。

依据本发明的酶可以催化具有精细的立体-、区域(regio)-和化学(chemo)-选择性的反应。依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以被工程化以在各种溶剂中发挥功能，在极端pHs(例如高pHs和低pHs)、极端温度(例如高温和低温)、极端盐水平(例如高盐和低盐)下运作，并催化与这样的化合物的反应，该化合物与天然的、生理底物结构上不相关。

饲料和食品或饲料和食品添加剂

除了提供膳食辅助物或补充剂，或食品补充剂和添加剂，本发明也提供了使用依据本发明的多肽，例如具有依据本发明的醛缩酶活性，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的蛋白，和/或依据本发明的抗体处理人类和动物饲料和食品及食品或饲料添加剂的组合物和方法。在一些实施方式中，本发明提供了包含依据本发明的醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶和/或依据本发明的抗体的动物饲料、食品和添加剂。动物可以是任何家畜或任何动物。

依据本发明的动物饲料添加剂可能是颗粒化的酶产物，其可能被容易地与饲料组分混合。可选地，依据本发明的饲料添加剂可以形成预混合的组分。依据本发明的颗粒化的酶产物可能被包被或不包被。酶颗粒的颗粒大小可以与饲料和预混组分的大小相容。这提供了将酶合并进饲料的安全且方便的方式。可选地，依据本发明的动物饲料添加剂可能是稳定的液态组合物。其可能是水基或油基的浆体。参见美国专利号6,245,546。

在饲料或食品的改善(或者修饰)中，本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以在体外(通过改变饲料或食品的成分)或在体内加工食品或饲料。本发明的多肽可被加入动物饲料或食品组合物中。

在一些实施方式中，本发明的酶与另一种酶一起加入，例如，β-半乳糖苷酶、过氧化氢酶、漆酶、纤维素酶、其它醛缩酶、内切糖苷酶、内切-β-l,4-漆酶、淀粉葡糖苷酶、葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、肌醇六磷酸酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。这些酶消化产物更容易被动物消化。因此，本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶有助于饲料或食物的能量的有效利用，或者通过降解纤维素，有助于食物或饲料的可消化性。

在其它实施方式中，依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以通过直接在转基因饲料作物(作为，例如转基因植物、种子等)，如谷类、谷物、玉米、大豆、油菜籽、羽扇豆等中表达所述酶而供应。如上文讨论，本发明提供了包含编码依据本发明多肽的核酸的转基因植物、植物部分和植物细胞。在一些实施方式中，核酸被表达，以至于依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶以可回收的量被生产。醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶可以从任何植物或植物部分中被回收。可选择的是，含有重组多肽的植物或植物部分可用来改善食物或饲料的性质，例如，改善营养价值、可口性等等。

在一些实施方式中，本发明的酶输送基质是以分散的多个微粒、小丸或颗粒形式存在。“颗粒”的含义是被压扁或压紧的微粒，如通过制丸、挤压或类似的压制过程从基质中去除水分。微粒的这种压缩或压紧也可促进微粒的微粒内粘聚性。例如，通过在制丸机(pelletmill)中将基于谷物的基质制丸来制备颗粒。由此制备的小丸被研磨或粉碎成适合用作动物饲料辅料的颗粒大小。由于基质本身被批准用于动物饲料，所以在动物饲料中它可用作输送酶的稀释剂。

在一些实施方式中，本发明的酶输送基质和方法中包含的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶是如本文所述的热稳定醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶，以便抵御生产过程中醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的失活，在生产过程中升高的温度和/或蒸汽可能被用来制备丸化的酶输送基质。在消化含有本发明的酶输送基质的饲料的过程中，水相消化液将引起活性酶的释放。其它类型的热稳定酶和热稳定的营养补充剂也可被掺入输送基质中，其可在任何类型的含水条件下释放。

在一些实施方式中，出于许多不同的目的，可以对本发明的酶基质微粒应用包衣，如为了向动物饲料中添加调味剂或营养补充剂，为了在胃内条件下延缓动物饲料补充剂和酶的释放，以及类似的目的。在一些实施方式中，可应用包衣来实现功能性的目的，例如在需要延缓酶从基质微粒中释放或控制酶将被释放的条件时。包衣材料的组分可以是这样的，其可选择性地被其敏感的试剂(如热、酸或碱、酶或其它化学物质)分解。可选择地是，对不同的这样的分解剂敏感的两种或更多种包衣可被连续地应用于基质微粒。

本发明也涉及制备酶释放基质的方法。根据本发明，该过程包括提供基于谷粒的基材的多个分散颗粒，其颗粒大小适合用作酶释放基质，其中所述的颗粒包括由本发明的氨基酸序列编码的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶。在一些实施方式中，该方法包括将酶释放基质的颗粒压制或压缩成微粒，在一些实施方式中主要是通过制丸来完成。防霉剂和粘聚剂，当被应用时，可在任何适合的时间被加入，并且在一些实施方式中，与基于谷粒的基材以所需的比例在将基于谷粒的基材制丸之前混合。制丸机进料中的含水量在一些实施方式中是上面所示的与最终产物含水量对应的范围，在一些实施方式中是大约14-15％。在一些实施方式中，水分以酶的含水制备物形式加入至原料中，使该原料达到此含水量。在制丸机中的温度在一些实施方式中用蒸汽达到大约82℃。制丸机可在任何条件下进行操作，对原料进行足够的操作以提供小丸。对于从含酶组合物中去除水分来说，制丸方法本身是一个很经济的方法。

依据本发明的组合物和方法可以结合施用益生素(prebiotics)进行实践，益生素是高分子量糖类，如低聚果糖(FOS)；低聚半乳糖(GOS)、GRAS(通常认为安全的(GenerallyRecognizedAsSafe))材料。这些益生素可以通过一些益生乳酸菌(LAB)进行代谢。它们对于大多数小肠微生物是不可消化的。

处理食品和食品加工

本发明提供了包含依据本发明的酶的食品和饲料，以及在加工食品和饲料的过程中使用依据本发明的酶的方法。依据本发明的醛缩酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶在食品加工工业中有多种应用。在一些实施方式中，本发明提供了水解含纤维素组合物的方法，所述组合物包括例如植物细胞、细菌细胞、酵母细胞、昆虫细胞或动物细胞，或任何植物或植物部分，或任何食品或饲料，废物产品等。

例如，本发明提供了包含本发明的醛缩酶，例如丙酮酸醛缩酶，HMG和/或KHG醛缩酶的饲料或食品，例如在饲料、液体，如饮料(如果汁或啤酒)，面包或面团或面包产品，或饮品(如啤酒)或饮料前体(如麦芽汁)中。

依据本发明的食品处理工艺还可以包括使用其它酶的任何组合，其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它醛缩酶、纤维素酶、内切糖苷酶、内切-β-l,4-漆酶、淀粉葡糖苷酶、葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或转谷氨酰胺酶。

药物组合物和膳食补充剂

本发明也提供了包含依据本发明的醛缩酶的药物组合物和膳食补充剂(如膳食辅助剂)。醛缩酶活性包括丙酮酸醛缩酶、HMG和/或KHG醛缩酶活性。在一些实施方式中，药物组合物和膳食补充剂(如膳食辅助剂)被配制为口服(oralingestion)。

牙周治疗化合物可以包括本发明的酶，例如，如在美国专利6,776,979所述。用于治疗或预防酸性肠道综合症的组合物和方法可以包括本发明的酶，例如，如美国专利6,468,964所述。

在其它实施方式中，创伤敷料、植入物和类似物包括抗微生物(如，抗生素-作用)酶，包括本发明的酶(包括，例如，本发明的序列)。本发明的酶也可用于藻酸盐敷料、抗菌防护敷料、烧伤敷料、压迫绷带、诊断工具、凝胶敷料、透水性敷料(hydro-selectivedressings)、吸水(泡沫)敷料(hydrocellular(foam)dressings)、水胶敷料、I.V敷料、开刀防护巾(incisedrapes)、低附着敷料(lowadherentdressings)、气味吸收敷料、石膏绷带(pastebandages)、术后敷料、伤疤控制、皮肤护理、透明膜敷料和/或伤口闭合。本发明的酶可用于伤口清洁、创面床准备，以治疗压迫性溃疡、腿部溃疡、烧伤、糖尿病足溃疡、伤疤、IV固定、手术创伤和微创。本发明的酶可用于无菌酶促清创组合物如软膏中。在各个方面，纤维素酶被配制成片剂、凝胶、药丸、植入物、液体、喷剂、粉末、食物、饲料球或配制成胶囊化的制剂。

依据本发明的药物组合物和膳食补充剂也可以包括其它酶的任意组合的使用，例如β-半乳糖苷酶、过氧化氢酶、漆酶、纤维素酶、其它醛缩酶、内切糖苷酶、内切-β-l,4-漆酶、淀粉葡糖苷酶、葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-l,3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、肌醇六磷酸酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。

产生R,R和其它的monatin立体异构体生物合成途径

另外，如在WO03/091396A2中所述(参见图1-3和11-13)，monatin可以从色氨酸通过包括生物转化(即用多肽促进底物向产物的反应)的多步途径产生。所述途径涉及生物转化色氨酸为吲哚-3-丙酮酸，生物转化吲哚-3-丙酮酸为2-羟基2-(吲哚-3-基甲基)-4-酮戊二酸(“MP”)，和生物转化MP为monatin。在一些实施方式中，本发明的多肽可以被用于促进吲哚-3-丙酮酸形成MP的反应。在一些实施方式中，本发明的多肽可以被用于优选地促进R-MP的产生。

在一些实施方式中，选自SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334或其具有醛缩酶活性的片段或子序列的分离或重组多肽的一种或多种多肽可被用于促进产生选自monatin、monatin衍生物、其盐及其组合的产品的多步途径中的反应。在一种实施方式中，具有醛缩酶活性的多肽可被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

在另一实施方式中，选自SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304或其具有醛缩酶活性的片段或子序列中任意的具有HMG醛缩酶活性的分离或重组多肽中的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，具有HMG醛缩酶活性的多肽可能被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

而在另一实施方式中，选自SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332、或SEQIDNO:334或其具有醛缩酶活性的片段或子序列中任意的具有KHG醛缩酶活性的分离或重组多肽中的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，具有KHG醛缩酶活性的多肽可能被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

此外，由与依据本发明的核酸，包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个残基的区域内，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的一种或多种核酸序列编码的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，所述一种或多种多肽，或其具有KHG醛缩酶活性的片段或子序列可被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

在本发明的另一实施方式中，由与依据本发明的核酸，包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个残基的区域内，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列编码的，具有HMG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，具有HMG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

而在本发明的另一实施方式中，由与依据本发明的核酸，包括SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个残基的区域中，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列编码的，具有KHG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，具有KHG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

而且，由在严格条件下与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338的核酸杂交的核酸序列编码的、具有醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，具有醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

在本发明的另一实施方式中，由在严格条件下与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305的核酸杂交的核酸序列编码的、具有HMG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，具有HMG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

而在本发明的另一实施方式中，由在严格条件下与SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338的核酸杂交的核酸序列编码的、具有KHG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸和C3碳源之间的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。在一种实施方式中，具有KHG醛缩酶活性的一种或多种多肽可被用于促进吲哚-3-丙酮酸被转化为MP的反应，该反应是产生选自moantin、monatin衍生物、其盐及其组合的产品的多步途径中的一步。

本文所述的具有醛缩酶活性的多肽可能被用于促进吲哚-3-丙酮酸和C3碳源之间的反应。C3碳源可以是，但不限于草酰乙酸、丙酮酸或丙酮酸衍生物，例如磷酸烯醇丙酮酸。在一种实施方式中，C3碳源是丙酮酸。

用于吲哚-3-丙酮酸和C3碳源之间的反应产物转化为monatin的示例性的酶包括以下酶类别的成员：色氨酸氨基转移酶(2.6.1.27)、色氨酸脱氢酶(1.4.1.19)、D-氨基酸脱氢酶(1.4.99.1)、谷氨酸脱氢酶(1.4.1.2-4)、苯丙氨酸脱氢酶(EC1.4.1.20)、色氨酸-苯基丙酮酸转氨酶(2.6.1.28)，或更一般地，氨基转移酶家族(2.6.1.-)的成员，例如天冬氨酸氨基转移酶(EC2.6.1.1)、(芳香族)氨基转移酶(2.6.1.5)、D-色氨酸氨基转移酶、或D-丙氨酸氨基转移酶(2.6.1.21)(参见WO03/091396A2的图2)。该反应也可以使用化学反应进行。酮酸(MP)的胺化作用通过使用氨水和氰基硼氢化钠的还原性氨基化进行。WO03/091396A2的图11-13显示了可以被用于将MP转化为monatin的其他多肽，并提供了从吲哚-3-丙酮酸或色氨酸产生monatin的提高的产率。在一种实施方式中，这些酶被用于催化MP，吲哚-3-丙酮酸和丙酮酸之间的反应产物转化为monatin。

Monatin组合物的口味特性可以通过控制组合物中monatin的各种立体异构体的相对量而改变。本公开提供了生产带有期望的R,Rmonatin和/或S,Rmonatin百分比的monatin组合物的途径和底物。

由公开的途径产生的monatin化合物的手性可以被pH和用于生物转化的多肽两者影响。本文所述的具有醛缩酶活性的多肽可被用于控制吲哚-3-丙酮酸被转化为MP的反应中monatin碳-2(参见上文的式I)的手性。

一旦吲哚-3-丙酮酸和C3碳源之间反应的反应产物产生，氨基基团可以被立体特异性地加入。碳-4的R或S构型(参见上文的式I)可以被产生，这取决于使用的是D-还是L-芳香酸氨基转移酶。多种氨基转移酶对L-异构体是特异的，但是，D-色氨酸氨基转移酶存在于某些植物中(Kohiba和Mito，Proceedingsofthe8thInternationalSymposiumonVitaminB6andCarbonylCatalysis,Osaka,Japan1990)。而且，D-丙氨酸氨基转移酶(2.6.1.21)、D-蛋氨酸-丙酮酸氨基转移酶(2.6.1.41)和(R)-3-氨基-2-甲基丙酸酯氨基转移酶(2.6.1.61)、(S)-3-氨基-2-甲基丙酸酯氨基转移酶(2.6.1.22)、和D-苯基甘氨酸氨基转移酶已经被鉴定得到。某些氨基转移酶可能仅接受用于该反应的在C2碳具有特定构型的底物。因此，即使吲哚-3-丙酮酸与C3碳源之间的反应产物的转化不是立体特异性的，终产物的立体化学可以通过氨基转移酶的适当选择被控制。因为反应是可逆的，未反应的反应产物(不期望的异构体)可以被循环回其成分并且反应产物的消旋混合物可以被改善。

用于向吲哚-3-丙酮酸和C3碳源之间反应的反应产物加入氨基基团的合适的氨基供体的实例包括，但不限于氨基酸，例如丙氨酸、天冬氨酸、赖氨酸、谷氨酸、甘氨酸和色氨酸。

现在请参见附图，以下应该注意。流程图确认了生产monatin的途径，但不限于实施该途径的任何特定方法。例如，该途径可被体内、体外实施或其组合。

而且，该途径的实施不要求每个被确认的组分(如反应物和酶)明确地由实施者提供，只要足够的组分、或组分来源、以及反应条件被提供以便该途径可以潜在地进行。换句话说，例如，如果附图描述了生产monatin组合物的方法，其包括从L-色氨酸产生吲哚-3-丙酮酸，从吲哚-3-丙酮酸产生2-羟基2-(吲哚-3-基甲基)-4-酮戊二酸(“monatin前体”或“MP”)，以及从MP生产monatin，其中每个反应被合适的酶促进，在适合每个反应发生但也不明确提供吲哚-3-丙酮酸或MP的条件下，可以预期，该途径的实施包括将L-色氨酸与α-酮戊二酸以及预期用于促进确认的反应的酶混合。在这样的例子中，L-色氨酸可以与α-酮戊二酸反应生成吲哚-3-丙酮酸。由于设置的条件和提供的酶，从L-色氨酸反应产生的吲哚-3-丙酮酸可以反应形成MP，并且由于设置的条件和提供的酶，从吲哚-3-丙酮酸反应产生的MP可以反应生成monatin。

也应该注意，所述途径的实施不要求实施者明确地提供被确认的初始材料或酶。换句话说，可以预期，将L-色氨酸确认为初始材料的任何途径的实施将包括提供可以在适合L-色氨酸产生发生的条件下能产生L-色氨酸的化合物，以及在适合那些反应发生的条件下混合该化合物与能促进所述一系列反应的酶。作为另一个实例，也可以预期实施确认的途径将包括提供遗传工程化的微生物以根据所述途径生产monatin，以及提供发酵过程发生的合适条件。举例来说，天然产生大量L-色氨酸的微生物可以被遗传工程化以产生或过量产生一种或多种用于促进monatin产生途径中的反应的酶，并且合适的条件可被提供以便该微生物可以由此产生monatin。

图1确认了特定的实施方式，其中R-特异性醛缩酶促进吲哚-3-丙酮酸和丙酮酸形成R-MP的反应。图1的流程图示意性地描述了依据本发明制备包括R,Rmonatin的monatin组合物的方法。如图1所示，总体途径包括色氨酸形成吲哚-3-丙酮酸的反应，吲哚-3-丙酮酸产生MP的反应，和MP产生monatin，包括R,Rmonatin的反应。

图1进一步显示了该总体途径的特定排列(specificpermutation)，其被设计为以S,S、R,S和S,R形式的monatin为代价提高R,R形式monatin的产生。特别地，图1显示了这样的实施方式，其中：L-色氨酸反应中使用的氨基转移酶对该反应相对于MP和4Smonatin的反应具有更高的活性和/或特异性，或者氧化酶对L-色氨酸比对4Rmonatin具有更高的活性和/或特异性；促进吲哚-3-丙酮酸反应的酶是本文公开的具有醛缩酶活性的多肽，并且促进MP反应的酶是宽特异性的D-酶，优选地进化为对MP的R异构体作用效率更高。

图1也显示了设计为使R,Rmonatin的生产更经济的特定排列。例如，在图1中，L-色氨酸——与D-色氨酸或L-和D-色氨酸的组合相对——被确认为初始材料。尽管特定形式的色氨酸的选择不影响monatin组合物中最终monatin化合物的手性(因为色氨酸反应形成没有手性的吲哚-3-丙酮酸)，一些人可能优选使用L-色氨酸作为起始材料，至少是因为目前L色氨酸比D-色氨酸便宜且更容易获得。

现在注意图1中所示的第一个反应，当色氨酸被转化为吲哚-3-丙酮酸时，α-酮戊二酸盐、草酰乙酸和丙酮酸的任意一种或多种反应形成氨基酸(分别是谷氨酸、天冬氨酸和丙氨酸)。图1描述了实施方式，其中色氨酸初始材料是L-色氨酸，并且α-酮戊二酸盐、草酰乙酸和/或丙酮酸生产L-异构体形式的氨基酸(如分别是L-谷氨酸、L-天冬氨酸和/或L-赖氨酸)。

如图1所示，增加R,Rmonatin生产的方法包括促进L-色氨酸与对色氨酸而非MP或monatin具有更强特异性，更高活性或两者的酶反应，以及促进MP与D-酶的反应。如WO03/091396A2中公开，某些酶可以促进色氨酸的反应以产生吲哚-3-丙酮酸，以及MP的胺化作用以生产monatin。L-氨基转移酶在胺化步骤中的使用在monatin的C-4位置产生了S手性中心，而D-酶的使用在monatin的C-4位置产生了D手性中心。因此，在促进色氨酸反应的L-氨基转移酶在MP反应中也有活性的情况下，R,S和S,Smonatin可以形成，这取决于MP存在的形式。此外，某些其它酶——L-氨基酸氧化酶——不仅能够促进色氨酸到吲哚-3-丙酮酸的反应，也可能对R,Rmonatin降解具有副活性。依据一些实施方式，4R副活性被最小化或消除。对4S形式monatin的氧化酶副活性使它们在终产物中减少或最小化，并且取决于期望的最终组合物，可能是有利的。因此，对色氨酸而非MP或monatin选择的L-酶的特异性和/或活性越高，产生的R,R和S,R相对S,S和R,Smonatin的量越多。

依据图1所示的实施方式，对色氨酸反应合适的酶包括：L-氨基转移酶，其能够促进L-色氨酸反应形成吲哚-3-丙酮酸，并且其对该反应比R-MP形成monatin的4S异构体的反应具有更高的特异性；和L-氨基酸氧化酶，其能够促进L-色氨酸形成吲哚-3-丙酮酸的反应，并且对该反应比monatin的4R异构体形成MP的反应具有更高的特异性和/或活性，以及上述任意酶的功能等效物。更特别地，合适的酶的非限定性实例可以选自L-色氨酸氨基转移酶(E.C.2.6.1.27)和酪氨酸(芳族)氨基转移酶(EC2.6.1.5)和L-氨基酸氧化酶(EC1.4.3.2)，以及从具有天冬氨酸氨基转移酶活性的酶衍生的突变体。

实施例16鉴定了特定的酶——HEXaspC多肽的突变体，其包括酪氨酸对脯氨酸9(Pro9)的替代和甘氨酸对精氨酸122(Arg122)的替代，用于促进L-色氨酸和α-KG、草酰乙酸、丙酮酸、或其组合反应分别形成吲哚-3-丙酮酸和L-谷氨酸、L-天冬氨酸和L-丙氨酸的反应。另一具有“限定的”活性的特定酶是TatA，来自苜蓿中华根瘤菌(S.meliloti)的L-色氨酸氨基转移酶。依据图1所示途径的优选的实施方式，适合色氨酸反应的其它酶包括具有以下特征的那些：以1/10的速率或低于实施例16中L-色氨酸速率使MP转氨基的酶，和当与消旋酶使用时，如实施例18，产生大于90％的monatin的4R异构体的酶。

与MP向monatin的转化相比，对L-色氨酸向吲哚-3-丙酮酸的转化不具有更高特异性的酶的实例包括：HEXAspC(实施例16)、硕大利什曼原虫(Leishmaniamajor)宽特异性氨基转移酶(WO03/091396A2)、猪氨基转移酶(WO03/091396A2)和球形红细菌(Rhodobactersphaeroides)TatA(实施例18)。但是，这些酶可能通过，例如诱变而进化，以对R-MP和/或R,Rmonatin相对于色氨酸具有有限的活性。

现在关注图1中确认的第2个反应，促进吲哚-3-丙酮酸到MP反应的酶的选择影响产生的R,Rmonatin对S,Rmonatin的相对量。一般地，产生的R-MP对S-MP的相对量越高，产生的R,Rmonatin对S,Rmonatin的相对量越高(当D-酶促进MP到monatin的反应时)。在期望具有R,R形式的monatin作为其唯一monatin组分的monatin组合物时，选择性地产生与S-MP相对的R-MP的酶(“R-特异性酶”)应该被使用。本文所述的具有醛缩酶活性的多肽被用于选择性地产生R-MP，与S-MP相对。高度R-特异性的醛缩酶的若干实例在上文的表1，下文的实施例4、5和6，以及序列表中显示。

现在关注图1确认的途径的最后一步，R-MP形成R,Rmonatin的反应被显示为由宽特异性的D-氨基转移酶，如D-丙氨酸氨基转移酶(E.C.2.6.1.21，也被称为D-氨基酸氨基转移酶或D-天冬氨酸氨基转移酶)或D-氨基酸脱氢酶促进。如上文讨论，MP向monatin的转化是胺化反应，其在monatin的C-4碳上产生手性中心。在C-4位置期望R-手性形式之处，在氨基酸中产生“R”手性中心的酶应该被使用。

依据一些实施方式，D-氨基转移酶对R-MP比吲哚-3-丙酮酸具有更高的特异性，更高的活性或两者兼具。依据一些实施方式，D-氨基转移酶对吲哚-3-丙酮酸具有有限的活性。具有这些特征的酶可从已有的酶中进化或突变得到，例如如实施例16中所示。

实施例9到12显示了从D-色氨酸产生R,R-monatin。

图2显示了生产R,Rmonatin和S,Rmonatin的方法。而在图1的实施方式中，用在吲哚-3-丙酮酸形成R-MP反应中的醛缩酶影响形成的R,R:S,R比例，在图2的实施方式中，促进MP向monatin转化的D-酶影响形成的R,R:S,R比例。依据图2的途径，如果非立体特异性的酶被用于促进吲哚-3-丙酮酸向MP的转化，那么S-MP和R-MP可以形成。如果非立体特异性的醛缩酶被用于转化吲哚-3-丙酮酸为MP，那么需要立体选择性转氨酶以转化MP为R,Rmonatin或S,Rmonatin。如图2所示，使用对R-MP具有立体特异性的D-氨基转移酶或D-氨基酸脱氢酶导致R,Rmonatin的产生。

图3显示了瞄准R,Rmonatin产生的另一可选的途径。图3的途径是图1途径的修改，其中吲哚-3-丙酮酸从L-色氨酸被间接而非直接产生。更特别地，L-色氨酸被转化为D-色氨酸，并且D-色氨酸随后被转化为吲哚-3-丙酮酸。

L-色氨酸向D-色氨酸的转化可以由色氨酸消旋酶或其功能等效物促进。实施例15提供了色氨酸消旋酶的潜在来源以及鉴定这些酶的筛选方法。也预期色氨酸消旋酶可从已有的氨基酸消旋酶进化(如通过诱变或重组工程化)，以提高性能。

色氨酸消旋酶的非限制性实例包括氨基酸消旋酶(EC5.1.1.-)，例如丝氨酸消旋酶的同系物或突变体，其中同系物或突变体能够将L-色氨酸转化为D-色氨酸。可获得氨基酸消旋酶的来源的非限定性实例包括：微生物，例如鼠伤寒沙门氏菌(Salmonellatyphimurium)、大肠杆菌、枯草芽孢杆菌(Bacillussubtilis)、铜绿假单孢菌(Pseudomonasaeruginosa)、霍乱弧菌(Vibriocholerae)、粟酒裂殖酵母(Schizosaccaroycespombe)、蜡状芽孢杆菌(Bacilluscereus)、鹑鸡肠球菌(Enterococcusgallinarum)、戊糖片球菌(Pediococcuspentosaceus)、短小芽孢杆菌(Bacilluspumilus)、发酵乳杆菌(Lactobacillusfermenti)、短乳杆菌(Lactobacillusbrevis)、Aquifexpyrophilus、乳酸杆菌(Lactobacilli)、链球菌(Streptococcus)、鱼腥藻某种(Anabaenasp.)、沟槽假单胞菌(Pseudomonasstriata)、香菇(Lentinusedodes)、Scapharcabrouhtonii、除硫菌属某种(Desulfurococcussp.)、超嗜热古菌某种(Thermococcussp.)和沟槽假单胞菌(Pseudomonasstriata)。可获得氨基酸消旋酶的来源的其它非限定性实例包括蚕、大鼠脑和小鼠脑。

可获得合适的色氨酸消旋酶的潜在来源的非限定性实例包括：微生物如假单胞菌(Pseudomonas)，例如绿针假单胞菌(Pseudomonaschlororaphis)(致黄假单胞菌(Pseudomonasaurereofaciens))(ATCC15926)和Burkholderiapyrrocina(ATCC15958)。可获得合适的色氨酸消旋酶的潜在来源的其它非限定性实例包括植物，例如烟草植物，如烟草(Nicotianatabacum)；小麦植物，如小麦(Triticumaestivum)；甜菜；番茄和Sclerochitonilicifolius。

图3所示的途径具有某些好处，包括甚至在R,Rmonatin是期望的产物之处，与产生monatin的反应相同的酶可以被用于产生吲哚-3-丙酮酸的反应。也就是说，在图1所示的途径中，L-氨基转移酶(或合适的L-酶)促进产生吲哚-3-丙酮酸的反应，但是D-氨基转移酶促进产生monatin的反应。与图3的途径相反，某些促进产生吲哚-3-丙酮酸的D-氨基转移酶也可以促进产生monatin的反应。因此，在依据图3的途径中，当期望使用与形成monatin的反应相同的酶进行形成吲哚-3-丙酮酸的反应时，宽特异性的D-氨基转移酶是优选的。相反，在依据图1、2、4、6、7和8的途径中，当选择相比R-MP对吲哚-3-丙酮酸具有有限活性和/或特异性的D-氨基转移酶时，monatin的生产可更有效地进行。

图3中示意性显示的途径的另一好处是与产生吲哚-3-丙酮酸的反应偶联的反应的氨基酸产物现在可以被用作与产生monatin的反应偶联的反应中的起始物质。也就是说，在图1所示的途径中，L-色氨酸反应生成吲哚-3-丙酮酸并且在同时草酰乙酸、α-酮戊二酸和/或丙酮酸反应生成L-氨基酸。因为R-MP形成monatin的反应与使用D-氨基酸作为底物的反应偶联，在所示的条件下，形成吲哚-3-丙酮酸反应的L-氨基酸不被循环用于与R-MP反应偶联的反应中。相反，在图3所示的途径中，D-色氨酸形成吲哚-3-丙酮酸的反应与形成D-氨基酸产物的反应偶联，该D-氨基酸可以被循环用于与R-MP反应偶联的反应。这允许技术人员在步骤一中使用非化学计量数量的氨基受体。在本发明的一些实施方式中，D-氨基酸是D-丙氨酸。

图4和5显示了图1所示途径的其它修改，所述修改涉及循环使用由与L-色氨酸和氨基酸反应物反应偶联的反应形成的氨基酸产物，所述氨基酸反应物是与MP生成monatin反应偶联的反应的氨基酸反应物。

下面参见图4，循环利用通过提供能够促进L-氨基酸向D-氨基酸转化的酶完成，且反之亦然。更特别地，在如图4所示之处，当L-色氨酸反应形成吲哚-3-丙酮酸时，α-KG反应形成L-谷氨酸，可以提供能够促进L-谷氨酸向D-谷氨酸转化且反之亦然的谷氨酸消旋酶(EC5.1.1.3)或功能等效物。在这样的情况下，随着吲哚-3-丙酮酸产生而形成的L-谷氨酸借助于其转化为D-谷氨酸而被除去，并且由L-谷氨酸转化而形成的D-谷氨酸随后可用作与MP生成monatin的反应偶联的反应的底物。相似地，D-谷氨酸反应中形成的α-KG可以用作与L-色氨酸形成吲哚-3-丙酮酸的反应偶联的反应的底物。

可以获得谷氨酸消旋酶的潜在来源的非限定性实例包括戊糖片球菌(Pediococcuspentosaceus)、短小芽孢杆菌(Bacilluspumilus)、发酵乳杆菌(Lactobacillusfermenti)、短乳杆菌(Lactobacillusbrevis)、大肠杆菌、Aquifexpyrophilus和枯草芽孢杆菌(Bacillussubtilis)。更特别地(也是非限定地)，谷氨酸消旋酶可从诸如戊糖片球菌murI基因(Genbank登记号L22789)或短乳杆菌谷氨酸消旋酶的核酸表达。

在当L-色氨酸反应形成吲哚-3-丙酮酸时草酰乙酸反应形成L-天冬氨酸的情况下，天冬氨酸消旋酶(EC5.1.1.13)或功能等效物可以被提供以将L-天冬氨酸转化为D-天冬氨酸。在这样的情况下，随着吲哚-3-丙酮酸的产生得到的L-天冬氨酸借助其转化为D-天冬氨酸而被除去，并且从L-天冬氨酸转化而形成的D-天冬氨酸随后可用作与MP形成monatin反应偶联的反应的底物。相似地，D-天冬氨酸反应中形成的草酰乙酸可以用作与L-色氨酸形成吲哚-3-丙酮酸的反应偶联的反应的底物。

具有天冬氨酸消旋酶活性的合适的酶的非限定性实例包括ASPR-101(BioCatalytics,Inc.,Pasadena,CA)和能够促进L-天冬氨酸转化为D-天冬氨酸的氨基酸消旋酶(EC5.1.1.-)的同系物或突变体。

天冬氨酸消旋酶可能从其中获得的潜在来源的非限定性实例包括：除硫球菌属(Desulfurococcus)、超嗜热古菌(Thermococcus)、双壳类软体动物魁蚶(Scapharcabrouhtonii)、不动杆菌(Acinetobacter)、农杆菌(Agrobacterium)、古球菌(Archaeoglobus)、芽孢杆菌(Bacillus)、百日咳杆菌(Bordetella)、慢生大豆根瘤菌(Bradyrhizobium)、短杆菌(Brevibacterium)、伯克霍尔德菌(Burkholderia)、弯曲杆菌(Campylobacter)、白色念珠菌(Candida)、柄杆菌(Caulobacter)、梭菌(Clostridium)、亚硫酸菌(Desulfitobacterium)、Desulfotalea、粪肠球菌(Enterococcus)、欧文氏菌(Erwinia)、埃希氏菌(Escherichia)、铁原体属(Ferroplasma)、幽门螺杆菌(Helicobacter)、克雷伯菌(Klebsiella)、乳杆菌(Lactobacillus)、曼海姆菌(Mannheimia)、苜蓿(Medicago)、中慢生根瘤菌(Mesorhizobium)、产甲烷球菌(Methanococcus)、甲烷杆菌(Methanosarcina)、Oceanobacillus、酒球菌(Oenococcus)、戊糖片球菌(Pediococcus)、极地杆菌(Polaribacter)、假单胞菌(Pseudomonas)、嗜热球菌(Pyrococcus)、Ralsonia、志贺菌(Shigella)、中华根瘤菌(Sinorhizobium)、沙门氏菌(Salmonella)、鞘氨醇单胞菌(Sphingomonas)、链球菌(Streptococcus)、嗜热厌氧菌(Thermoanaerobacter)、弧菌(Vibrio)、沃廉菌(Wolinella)、黄单胞菌(Xanthomonas)、黄色杆菌(Xanthobacter)、耶尔森菌(Yersinia)和发酵单胞菌(Zymomonas)。

在当L-色氨酸反应形成吲哚-3-丙酮酸时丙酮酸反应形成L-丙氨酸的情况下，丙氨酸消旋酶或功能等效物可以被提供以转化L-丙氨酸为D-丙氨酸。在这样的情况下，随着吲哚-3-丙酮酸的产生而形成的L-丙氨酸借助其转化为D-丙氨酸而被除去，并且从L-丙氨酸转化形成的D-丙氨酸随后可用作与MP形成monatin反应偶联的反应的底物。相似地，D-丙氨酸反应中形成的丙酮酸可以用作与L-色氨酸形成吲哚-3-丙酮酸的反应偶联的反应的底物。

合适的丙氨酸消旋酶的非限定性实例包括A8936(Sigma-Aldrich,St.Louis,MO)。

丙氨酸消旋酶可能从中获得的潜在来源的非限定性实例包括：流产布鲁氏菌(Brucellaabortus)、粪链球菌(Streptococcusfaecalis)、鼠伤寒沙门氏菌(Salmonellatyphimurium)、大肠杆菌、枯草芽孢杆菌(Bacillussubtilis)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、铜绿假单胞菌(Pseudomonasaeruginosa)、霍乱弧菌(Vibriocholerae)、粟酒裂殖酵母(Schizosaccaroycespombe)、蜡状芽孢杆菌(Bacilluscereus)和香菇菌(Lentinusedodes)。

实施例18和21显示了上述消旋酶的使用，它们对提高期望的monatin产物的比例的影响，并提供了消旋酶的潜在来源。

参见图5，立体转化性氨基转移酶被用于促进R-MP向monatin的反应。尽管典型地，R-MP(或S-MP)反应形成R,Rmonatin(或S,Rmonatin)与D-氨基酸的反应偶联，立体转化性氨基转移酶可以促进使用L-氨基酸的R-MP(或S-MP)形成R,Rmonatin(或S,Rmonatin)的偶联反应。这样，L-色氨酸氨基转移酶反应的L-氨基酸产物可以被用作MP向monatin的转氨基作用的底物，并且与MP向monatin反应偶联的反应的产物(即草酰乙酸、丙酮酸和/或α-KG)可以被用作与L-色氨酸向吲哚-3-丙酮酸反应偶联的反应的起始材料。可被使用的立体转化性氨基转移酶的非限定性实例包括D-苯基甘氨酸氨基转移酶(EC2.6.1.72，也被称为D-4-羟苯甘氨酸氨基转移酶)和D-蛋氨酸氨基转移酶(EC2.6.1.41，也被称为D-蛋氨酸-氨基转移酶和D-蛋氨酸-丙酮酸氨基转移酶)。D-苯基甘氨酸氨基转移酶可能从中获得的潜在来源的非限定性实例包括：假单胞菌(Pseudomonas)，例如恶臭假单胞菌(Pseudomonasputida)LW-4和施氏假单胞菌(Pseudomonasstutzeri)ST-201。D-蛋氨酸氨基转移酶可能从中获得的潜在来源的非限定性实例包括花椰菜和花生。

实施例19和20一起提供了立体转化性氨基转移酶的潜在来源，以及制备这些酶的方法。这些实施例也提供了鉴定这些酶的筛选方法。也预期这些酶可从自然界中已知的或发现的立体反转酶进化得到。作为非限定性实例，立体转化性氨基转移酶可以是D-氨基酸氨基转移酶的同系物或突变体，或氨基酸消旋酶(EC5.1.1.-)的同系物或突变体。

图6-8也显示了图1途径的修改。图6-8中所示的途径提供了通过除去色氨酸反应的副产物以及在一些情况下，提供MP反应的底物来推动平衡反应向前进行的方法。

参见图6，所示的途径通过将L-氨基酸产物转化为不同的L-氨基酸除去与色氨酸反应偶联的反应的L-氨基酸产物，并且随后通过将新形成的L-氨基酸转化为D-氨基酸向与MP反应偶联的反应提供底物。特别地，L-色氨酸显示与草酰乙酸一起反应形成吲哚-3-丙酮酸和L-天冬氨酸。天冬氨酸4-脱羧酶(EC4.1.1.12)或功能等效物被用于促进L-天冬氨酸向L-丙氨酸和二氧化碳的转化，并且具有丙氨酸消旋酶活性的酶被用于促进L-丙氨酸向D-丙氨酸的转化，所述D-丙氨酸可以作为R-MP向monatin转化的氨基供体。

参见图7，所示的途径显示了除去与色氨酸反应偶联的反应的L-氨基酸产物的其它方法。图中所示的实施方式产生了不可用于反方向反应的副产物，例如由于挥发性(如二氧化碳)或通过自发转化为不反应的末端产物。这样的方法的实例包括α-KG随同L-色氨酸反应产生L-谷氨酸，谷氨酸脱羧酶(EC4.1.1.15)或功能等效物可以被提供，其能够促进L-谷氨酸向4-氨基丁酸盐的转化(二氧化碳是副产物)。L-谷氨酸脱羧酶可从中获得的潜在来源的非限定性实例包括：产气荚膜梭菌(Clostridiumperfringens)、韦氏梭菌(C.welchii)或大肠杆菌。

推动色氨酸反应向前进行的该方法的另一实例包括在草酰乙酸随同L-色氨酸反应的情况下，天冬氨酸脱羧酶(EC4.1.1.11)或功能等效物可以被提供以促进L-天冬氨酸向β丙氨酸的转化(二氧化碳是副产物)。

参见图8，所示的途径还显示了去除与色氨酸反应偶联的反应的L-氨基酸产物以及为与MP反应偶联的反应提供底物的其它方法。特别地，在α-KG与L-色氨酸一起反应形成L-谷氨酸的情况下，具有L-丙氨酸氨基转移酶活性的酶和丙酮酸可以被提供，其中L-丙氨酸氨基转移酶促进丙酮酸和L-谷氨酸形成L-丙氨酸的反应。丙氨酸消旋酶或功能等效物也可以被提供，以便促进L-丙氨酸向D-丙氨酸的转化，所示D-丙氨酸可以与MP一起用作底物形成monatin和丙酮酸。参见实施例18和21。

产生R,R和其它monatin立体异构体衍生物的生物合成途径

所述发明的方法包括使用本文所述的具有醛缩酶活性的多肽可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间的反应。

用于促进取代的吲哚-3-丙酮酸和C3碳源之间反应的酶包括SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334中任意的、具有醛缩酶活性的一种或多种多肽，或其具有醛缩酶活性的片段或子序列。

在一种实施方式中，SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:276、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304中任意的、具有HMG醛缩酶活性的一种或多种多肽，或其具有醛缩酶活性的片段或子序列可以被用于促进取代的吲哚-3-丙酮酸和C3碳源之间反应。

在另一实施方式中，SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334中任意的、具有KHG醛缩酶活性的一种或多种多肽，或其具有醛缩酶活性的片段或子序列可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间反应。

可选地，由与依据本发明的核酸，包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个残基的区域中，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列编码的、具有醛缩酶活性的一种或多种多肽可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间的反应。

在本发明的一种实施方式中，由与依据本发明的核酸，包括SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个残基的区域内，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列编码的、具有HMG醛缩酶活性的一种或多种多肽可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间的反应。

在本发明的另一个实施方式中，由与依据本发明的核酸，包括SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338，在至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多个残基的区域内，具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列编码的、具有KHG醛缩酶活性的一种或多种多肽可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间的反应。

由在严格条件下与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338的核酸杂交的核酸序列编码的、具有醛缩酶活性的一种或多种多肽可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间的反应。

在本发明的一种实施方式中，由在严格条件下与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:275、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305的核酸杂交的核酸序列编码的、具有HMG醛缩酶活性的一种或多种多肽可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间的反应。

在本发明的另一实施方式中，由在严格条件下与SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337和SEQIDNO:338的核酸杂交的核酸序列编码的、具有KHG醛缩酶活性的一种或多种多肽可被用于促进取代的吲哚-3-丙酮酸和C3碳源之间的反应。

在一种实施方式中，取代的吲哚-3-丙酮酸的取代基团是与吲哚环上任意碳原子连接的卤素原子。在另一实施方式中，取代基团是与吲哚环上任意碳原子相连的氯原子。而在另一实施方式中，monatin衍生物是4-羟基-4-(6-甲基吲哚-3-基甲基)谷氨酸。

具有醛缩酶活性的多肽，并且依据本发明的一些实施方式，可被用于多步途径中，其中一个或多个步骤是化学合成反应。例如，在一些实施方式中，具有醛缩酶活性的一种或多种多肽可以促进丙酮酸和吲哚-3-丙酮酸之间的反应以产生monatin前体。Monatin前体随后可以被纯化。Monatin前体的还原性胺化反应可以随后被使用以产生monatin。

具有醛缩酶活性的多肽，并且依据本发明的一些实施方式，以及用在生产monatin和monatin衍生物过程中的其它酶可以以纯的、粗提的、分离的或硫酸铵悬液的形式被使用。

具有醛缩酶活性的多肽，并且依据本发明的一些实施方式，可以使用稳定剂，包括二硫苏糖醇(“DTT”)和β-巯基乙醇进化优化。

使用本文公开的一种或多种多肽产生的monatin或monatin衍生物通常有占产生的总monatin或monatin衍生物重量的至少约50％到约99％的R,R-monatin或R,R-monatin衍生物。在其它实施方式中，使用本文公开的一种或多种多肽产生的monatin或monatin衍生物具有占产生的总monatin重量的60％以上的R,R-monatin或R,R-monatin衍生物；例如，R,R-monatin或R,R-monatin衍生物占产生的总monatin或monatin衍生物的70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。可选地，各种数量的monatin或monatin衍生物的两种或多种制备物可以被组合以产生期望R,R-monatin或R,R-monatin衍生物百分比的制备物。例如，60％R,R-monatin的monatin制备物可以与90％R,R-monatin的monatin制备物混合；如果相等量的60％和90％的R,R-monatin制备物被混合，产生的monatin制备物为75％的R,R-monatin。

使用本文公开的一种或多种多肽产生的monatin或monatin衍生物，或中间体(包括monatin前体)，可从反应组分纯化出来。在一种实施方式中，monatin、monatin衍生物或中间体，如monatin前体可通过从合成其的酶制备物移取待被纯化的物质而简单地纯化。

在其它实施方式中，中间体、monatin前体、monatin或monatin衍生物从其被合成的制备物中纯化，以便产生的“纯化”组合物或制备物具有占总有机化合物重量的至少约5-60％的monatin。在另一实施方式中，monatin、monatin衍生物或中间体，如monatin前体，可被纯化到占总有机化合物重量至少约70％、80％、90％、95％或99％的纯度。使用本文公开的一种或多种多肽产生的monatin、monatin衍生物或中间体(包括monatin前体)可通过本领域普通技术人员已知的任何方法从反应组分中纯化。优选地，纯化的monatin或中间体可被反复重结晶，直到达到期望的纯度水平。

以下实施例被提供以举例说明而非限制所要求保护的发明。

实施例

实施例1

Monatin、monatin前体、色氨酸、丙氨酸、天冬氨酸和谷氨酸的检测

本实施例描述了用于检测monatin、monatin前体(“MP”)、色氨酸、丙氨酸、天冬氨酸和谷氨酸存在的方法。其也描述了分离并检测monatin的四种立体异构体的方法。

Monatin和色氨酸的LC/MS/MS多反应监测(“MRM”)分析

体外或体内生化反应产生的monatin和色氨酸混合物的分析使用Waters/Micromass液相色谱-串联质谱(LC/MS/MS)仪器进行，其包括Waters2795液相色谱，带有串联置于色谱和MicromassQuattroUltima三级四极质谱仪(triplequadrupolemassspectrometer)之间的Waters996发光二极管阵列(PDA)吸收监测器。LC分离使用2.1mm×250mm的XterraMSC₈反相色谱柱在40℃进行。LC移动相包括A)含有(i)0.05％(v/v)三氟醋酸或(ii)0.3％甲酸及10mM甲酸铵的水；和B)含有(i)0.05％(v/v)三氟醋酸或(ii)0.3％甲酸及10mM甲酸铵的甲醇。

如果LC移动相包括A)含有0.05％(v/v)三氟醋酸的水；和B)含有0.05％(v/v)三氟醋酸的甲醇，梯度洗脱从5％B到35％B是线性的，0-4分钟；从35％B到60％B是线性的，4-6.5分钟；从60％B到90％B是线性的，6.5-7分钟；在90％B是等度洗脱，7-11分钟；从90％B到95％B是线性的，11-12分钟；从95％B到5％B是线性的，12-13分钟；在每轮运行之间有2分钟的重平衡时间。流速为0.25mL/分钟，并监测200nm到400nm的PDA吸光度。所有的ESI-MS参数都基于目标分析物的质子化分子离子([M+H]+)的产生，和特征片段离子的产生而被优化和选择。以下仪器参数被用于对monatin和色氨酸进行LC/MS/MS多反应监测(MRM)分析：毛细管：3.5kV；锥(Cone)：40V；Hex1：20V；孔(Aperture)：0V；Hex2：0V；源温度：100℃；去溶剂化温度：350℃；去溶剂化气体：500L/h；锥气体(Conegas)：50L/h；低质量分辨率(Lowmassresolution)(Q1)：12.0；高质量分辨率(Q1)：12.0；离子能量：0.2；入口：-5V；碰撞能量：8；出口：1V；低质量分辨率(Q2)：15；高质量分辨率(Q2)：15；离子能量(Q2)：3.5；倍增器(Multiplier)：650。五种monatin特定亲代到子代MRM转变被用于特定地检测体外和体内反应中的monatin。监测的转变是293.1到158.3、293.1到168.2、293.1到211.2、293.1到230.2和293.1到257.2。色氨酸经监测MRM转变为204.7到146.4。对于monatin和色氨酸的内标量化，含有四种不同比例的每种分析物与d5-色氨酸和d5-monatin的四种校准标准被分析。这些数据进行线性最小二乘法分析(linearleastsquaresanalysis)形成monatin和色氨酸的校准曲线。向每个样品中加入固定量的d5-色氨酸和d5-monatin(d5-monatin根据WO03/091396A2的方法由d5-色氨酸合成)，并且反应比例(monatin/d5-monatin；色氨酸/d5-色氨酸)与上述校准曲线组合使用，以计算混合物中每种分析物的量。

如果LC移动相是A)含有0.3％的甲酸和10mM甲酸铵的水及B)含有0.3％的甲酸和10mM甲酸铵的甲醇，梯度洗脱从5％B到45％B是线性的，0-8.5分钟；从45％B到90％B是线性的，8.5-9分钟；从90％B到90％B等度洗脱，9-12.5分钟；从95％B到5％B是线性的，12.5-13分钟；在每个运行之间有4分钟的重平衡期。流速为0.27mL/min，并监测从210nm到400nm的PDA吸光度。ESI-MS的所有参数基于目标分析物的质子化分子离子([M+H]+)的产生，以及特征片段离子的产生被优化和选择。用于该次级移动相的仪器参数与上述相同。四种monatin特定亲代到子代MRM转变和一种色氨酸特定亲代到子代MRM转变被用于特定地检测体外和体内反应中的monatin和色氨酸。监测的转变是293.1到158.0、293.1到168.0、293.1到211.5、293.1到257.0。色氨酸经监测MRM转变为205.2到146.1。对于monatin和色氨酸的内标量化，含有四种不同比例的每种分析物与d5-色氨酸和d5-monatin的四种校准标准被分析。这些数据进行线性最小二乘法分析形成monatin和色氨酸的校准曲线。向每个样品中加入固定量的d5-色氨酸和d5-monatin(d5-monatin根据WO03/091396A2的方法由d5-色氨酸合成)，并且反应比例(monatin/d5-monatin；色氨酸/d5-色氨酸)与上述校准曲线结合使用，以计算混合物中每种分析物的量。对d5-色氨酸和d5-monatin，监测的亲代到子代质量转变分别是210.2到151.1和298.1到172.0。

Monatin的精确质量测定

高分辨率MS分析使用AppliedBiosystems-PerkinElmerQ-Star杂交四极/时间飞行质谱仪(hybridquadrupole/time-of-flightmassspectrometer)进行。质子化monatin测量的质量使用色氨酸作为内部质量校准标准。质子化monatin的计算质量，基于元素组成C₁₄H₁₇N₂O₅是293.1137。使用实施例2和3中所述的生物催化方法生成的monatin显示出293.1144的测量质量。这是小于百万分之(“ppm”)二的测量误差，提供了酶促产生的monatin的元素组成的结论性证明。

Monatin的手性LC/MS/MS(“MRM”)测量

体外和体内反应中monatin立体异构体分布的确定通过用1-氟-2-4-二硝基苯基-5-L-丙氨酸酰胺(“FDAA”)衍生，然后通过反相LC/MS/MSMRM测量完成。使用FDAA对monatin衍生化

向50μL样品或标准物和10μL内标物中加入100μL或200μL的1％的FDAA的丙酮溶液。分别加入20μL或40μL的1.0M碳酸氢钠，并且将该混合物在40℃温育1小时，偶尔混合。样品被移去并冷却，并且用20μL的2.0MHCl中和(可能需要更多的HCl以使缓冲的生物混合物实现中和)。除气完成后，样品准备通过LC/MS/MS进行分析。

用于体外和体内反应中monatin的立体异构体分布确定的LC/MS/MS多反应监测

分析使用上述LC/MS/MS仪器进行。能够分离全部四种monatin立体异构体(特别是FDAA-monatin)的LC分离在PhenomenexLuna2.0×250mm(3μm)C18(2)反相色谱柱上在40℃进行。LC移动相包含A)含有0.05％(质量/体积)醋酸铵的水和B)乙腈。洗脱在13％B是等度洗脱，0-2分钟；从13％B到30％B是线性的，2-15分钟；从30％B到80％B是线性的，15-16分钟；在80％B是等度洗脱，16-21分钟；并且从80％B到13％B是线性的，21-22分钟；每个运转之间有8分钟的重平衡期。流速为0.23mL/min，并监测200nm到400nm的PDA吸光度。ESI-MS的所有参数基于FDAA-monatin的去质子化的分子离子([M-H]-)的产生，以及特征片段离子的产生被优化和选择。

以下仪器参数被用于对monatin进行负离子ESI/MS模式的LC/MS分析：毛细管：2.0kV；锥：25V；Hex1：10V；孔：0V；Hex2：0V；源温度：100℃；去溶剂化温度：350℃；去溶剂化气体：500L/h；锥气体：50L/h；低质量分辨率(Q1)：12.0；高质量分辨率(Q1)：12.0；离子能量：0.2；入口：-5V；碰撞能量：20；出口：1V；低质量分辨率(Q2)：12；高质量分辨率(Q2)：12；离子能量(Q2)：3.0；倍增器：650。三种FDAA-monatin特定亲代到子代MRM转变被用于特定地检测体外和体内反应中的FDAA-monatin。监测到的monatin转变是543.2到268.1，543.2到499.3，和543.2到525.3。监测到的monatin内标衍生物的质量转变为548.2到530.3。FDAA-monatin立体异构体的鉴定基于与纯化的合成monatin立体异构体比较的色谱保留时间，以及质谱数据。内标被用于监测反应的进程，并用于确认S,S立体异构体保留时间。

包含谷氨酸和丙氨酸的氨基酸的液相色谱-后柱荧光检测

液相色谱与后柱荧光检测(LC/OPA)用于确定体外和体内反应中的谷氨酸和丙氨酸，这在Waters2690LC系统或等效物上进行，该Waters2690LC系统或等效物组合有Waters474扫描荧光检测器以及Waters后柱反应模块。Monatin和色氨酸的半定量分析也使用该方法进行。LC分离在钠交互加载的离子交换柱中(Interaction-Sodiumloadedionexchangecolumn)于60℃下进行。移动相A是PickeringNa328缓冲液(PickeringLaboratories,Inc.；MountainView,CA)。移动相B是PickeringNa740缓冲液。梯度洗脱从0％B到100％B，0-20分钟；在100％B为等度洗脱，20-36分钟；并且从100％B到0％B是线性的，36-37分钟；每个运行之间有至少5分钟的重平衡期，取决于样品基质。移动相的流速为0.5mL/min。OPA后柱衍生溶液的流速为0.5mL/min。荧光检测器的设置是EX338-340nm和Em420-425nm。正亮氨酸被用作分析的内标。氨基酸的鉴定基于纯化的标准物的色谱保留时间的数据。

通过LC/MS/MS检测L-和D-氨基酸

含有L-和D-氨基酸，如来自生化反应实验的赖氨酸、丙氨酸、蛋氨酸、酪氨酸、亮氨酸、苯丙氨酸、色氨酸、谷氨酸和天冬氨酸混合物的样品首先用甲酸处理，使蛋白变性。样品随后被离心并通过0.45μm尼龙注射过滤器过滤，之后进行LC/MS/MS分析。L-和D-氨基酸的鉴定基于保留时间和质量选择检测。LC分离通过使用Waters2690液相色谱系统和ASTEC2.1mm×250mmChirobioticTAG色谱柱完成，柱温度设置在45℃。LC移动相A和B分别是0.25％乙酸和甲醇中的0.25％乙酸。等度洗脱被用于所有的方法以分离L和D异构体。赖氨酸使用80％移动相A和20％移动相B洗脱。谷氨酸、丙氨酸和蛋氨酸通过60％移动相A和40％移动相B的洗脱而分离，流速为0.25mL/min。天冬氨酸、色氨酸、酪氨酸、亮氨酸和苯丙氨酸用30％移动相A和70％移动相B以异构的方式分离，对除苯丙氨酸外的所有氨基酸流速为0.3mL/min，对苯丙氨酸以0.25mL/min的流速进行。

用于L-和D-氨基酸分析的检测系统包括Waters996发光二极管阵列(PDA)监测器和MicromassQuattroUltima三级四极质谱仪。在195到350nm之间扫描的PDA被串联置于色谱系统和质谱仪之间。用于以正电喷射离子化模式(+ESI)操作的MicromassQuattroUltima三级四极质谱仪的参数按如下设置：毛细管：3.0kV；锥：20V；Hex1：15V；孔：1V；Hex2：0V；源温度：100℃；去溶剂化温度：350℃；去溶剂化气体：530L/h；锥气体：30L/h；低质量Q1分辨率12.5；高质量Q1分辨率：12.5；离子能量1：0.2；入口：-5；碰撞：8；出口1：10；低质量Q2分辨率：12.5；高质量Q2分辨率：12.5；离子能量2：0.5；倍增器：650V。使用多反应监测(MRM)模式的MS/MS实验被建立，以选择性地监控谷氨酸147.8到84.2和147.8到102.1的反应转变，天冬氨酸134.00到74.30和134.00到88.2的反应转变，赖氨酸147.3到85.0的反应转变，蛋氨酸150.3到104.8的反应转变，酪氨酸182.3到137.0的反应转变，亮氨酸132.3到87.0的反应转变，和苯丙氨酸166.3到121.0的反应转变。在两个转变被列出的情况中，后一个转变被用于定量。对于色氨酸，建立使用多反应监测(MRM)模式的MS/MS实验，以选择性地监控205.2到118.2，205.2到146.1，和205.2到188.2的反应转变，以及d8-DL色氨酸从212.1到151.1的转变。色氨酸定量通过确定响应于转变205.2到146.1的分析物与内标d8-D,L色氨酸的比例完成。可选地，色氨酸、谷氨酸和天冬氨酸的定量分别取决于(baseoff)m/z＝146.5、m/z＝102.1和m/z＝88.2的信号反应。

用于标准物和用于monatin测定产生的monatin和monatin前体(“MP”)的产生

R,R和R,Smonatin的消旋混合物按照美国专利号5,128,482所述合成产生。

R,R和S,Smonatin通过衍生和水解步骤被分离。简单地说，monatin消旋混合物被酯化，自由氨基用Cbz封闭，形成内酯，并且S,S内酯使用固定化的蛋白酶选择性地水解。Monatin也可以按照Bassoli,A.等,Eur.J.Org.Chem.,8:1652-1658,(2005)描述方法分离。

MP产生

使用丙酮酸钠作为氨基受体，并使用0.1M磷酸钾缓冲液中的AT-103宽范围D-氨基转移酶(BioCatalytics,Padadena,CA)，对R,Rmonatin进行转氨基作用，产生R-MP。使用丙酮酸钠作为氨基受体，并使用0.1M磷酸钾缓冲液中的AT-102L-氨基转移酶(BioCatalytics,Padadena,CA)，对S,Smonatin进行转氨基作用，产生S-MP。两个反应都在30℃，约为8.0-8.3的pH值中进行大约20小时。两种化合物都使用带有Rohm和Haas(Philadelphia,PA)疏水性树脂(XADTM1600)的制备级HPLC纯化，并在水中洗脱。收集包含大于90％纯度的monatin前体的样品并冻干。

实施例2

检测monatin前体

本实施例描述了用于分离和检测monatin前体的两种对映异构体的方法。

检测monatin前体的非手性方法

来自96孔板的反应样品使用CTCPal自动点样仪(auto-sampler)(LEAPTechnologies,Carrboro,N.C.)被注射到AgilentZorbaxRX-C18，3.5μm，3.0×150mm柱上。产物使用H₂O/CAN(0.1％甲酸)梯度分离：

时间：0.00min5％B

时间：4.00min100％B

时间：5.00min100％B

时间：5.10min5％B

时间：6.50min5％B

所述梯度由LC-10ADvp泵(Shimadzu,Kyoto，日本)以0.8mL/min提供。产物使用API4000TurboIon-Spray三级-四级质谱仪(AppliedBiosystems,FosterCity,CA)检测。离子喷射和多离子监测以负离子模式(negativeionmode)对目标分析物进行，每个分析持续6.5分钟。

丙酮酸＝87.1[M–H+]-

吲哚-3-丙酮酸＝202.1[M–H+]-

产物＝290.0[M–H+]-

R&Smonatin前体的手性CE分析

使用P/ACE^TMMDQ毛细管电泳仪(BeckmanCoulter,Fullerton,CA)。手性展开试剂盒(ChiralDevelopmentkit)被使用并且包括少量的若干手性选择器(selector)，必要的缓冲液和2根毛细管(BeckmanCoulter,Fullerton,CA)。可选地，仅对于MP测定，以下试剂和其它供应品可以分别从BeckmanCoulter(Fullerton,CA)或它处获得：

包被的毛细管N-CHO；50μmID，总长度65cm或融合的二氧化硅毛细管。

25mM磷酸盐缓冲液，pH5

25mg羟丙基-β-环糊精

毛细管调节溶液(conditioningsolution)，10mL(可选地，可以使用0.5％聚环氧乙烷溶液，M_w600,000或300,000道尔顿)。

毛细管电泳(“CE”)分析

中性包被的毛细管，50μmID，60cm(50cm用于检测)或30(20)cm与DAD检测(或简单的UV)在214nm一起使用。分离毛细管被恒温在15℃，样品在4℃。分离缓冲液是20mM羟丙基-β-环糊精，25mM磷酸盐，pH5。样品注入典型地是0.5psi，5s。分离在500V/cm，反向极性(30cm毛细管15kV，60cm毛细管30kV)进行。分离过程中使用的典型电流为-28μA。MP峰的典型移动时间约为3.5分钟(20cm有效长度)或8分钟(50cm)。

样品分析之前，任选的毛细管清洁/清洗/调节步骤使用H₂O4分钟，0.1MHCl1分钟，H₂O1.5分钟，毛细管调节溶液4分钟，H₂O1分钟，分离缓冲液4分钟。

操作方法总结如下：分离缓冲液润洗1-2分钟，样品注射0.5psi，5s，在反向电压极性15或30kV下分离5-10分钟，取决于毛细管长度。

实施例3

丙酮酸醛缩酶的一般测定

测量不同丙酮酸醛缩酶活性的示例性的方法使用通用底物，4-羧基-4-羟基-2-氧代己二酸(oxoadipate)(CHA)。CHA测定从文献测定(例如，参见E.E.Dekker&R.P.Kitson,J.Biol.Chem.267,10507-10514,1992)中改进而来。典型的测定包括50mM磷酸钠pH7.5，1mMMgCl₂，1mMCHA，10μg/ml来自莱士曼氏乳酸杆菌(Lactobacillusleichmannii)的D-乳酸脱氢酶(LDH)(Sigma-Aldrich,St.Louis,MO)，0.5mMNADH。该测定通过加入酶(典型地在1到5μL之间)起始。与NAD⁺形成偶联的丙酮酸释放在分光光度计中340nm处被连续监测。

CHA依据Tack，B.F.Chapman,P.J.，和S.Dagley.J.Biol.Chem.2476438-6443(1972)中描述的方法被合成。

酶，例如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶的活性单位被定义为释放足够的丙酮酸以每分钟降低340nm处吸光度1OD的量。

实施例4

从Diversa环境文库中发现新的酮-羟基-戊二酸(KHG)和羟基-甲基-酮-戊二酸(HMG)醛缩酶

通过筛选各种DNA文库发现超过150种独特的HMG醛缩酶和15种KHG醛缩酶。这些醛缩酶基因被测序并亚克隆进合适的表达载体中。该载体随后被转化进合适的表达宿主中，以产生用于酶表征的足够的醛缩酶。测试选定的一组醛缩酶对CHA以及对monatin前体(MP)形成的活性。在本专利中被发现以及描述的所有酶都具有用于α-酮酸受体和丙酮酸或丙酮酸衍生物供体之间其它碳-碳键形成反应的潜力，如下面的一般反应示意图中示例的。

R＝H、烷基、取代烷基、芳基、取代芳基、苄基、取代苄基

实施例5

选定的醛缩酶的表征

表征选定的醛缩酶在催化吲哚-3-丙酮酸和丙酮酸向monatin前体(MP)的转化的能力，如以下示意图所示的：

图13和14显示了58种不同醛缩酶在MP形成中的活性，由LC/MS/MS测量。

醛醇缩合反应用20mM吲哚-3-丙酮酸(“I3P”)，50mM丙酮酸，100mM磷酸钠pH7，1mMMgCl₂，100μg/mL醛缩酶进行。反应在黑暗中室温下温育。在不同的时间移去等分试样(30μL)，并且通过储存样品于冰上停止反应。每个等分试样的一部分被送交CE分析，而剩余部分在50％乙腈中以1:1000稀释并送交LS/MS分析。

表2：由手性CE确定的不同醛缩酶对从I3P和丙酮酸形成MP的对映选择性

注意到对98+％的R-MP的选择性表明没有检测到S-MP。考虑到CE测定的灵敏性，该结果表明形成的至少98％MP是R-对映异构体。因此，列为98+％的酶对R-MP具有至少98％的选择性，并且可能达到100％的选择性。

表2也显示了酶对普通醛缩酶底物CHA的活性，以及每种酶的相对表达量，如SDS-PAGE确定。注意到若干酶没有对CHA显示可检测的活性，但它们确实在产生MP中显示了活性。

总之，醛缩酶显示了广泛的活性、表达和选择性。并且，有许多对R-MP显示出异常高的选择性(98％或更高)的酶。

实施例6

植物丙酮酸醛缩酶的发现

简并PCR引物(见下文)被设计并用于从由Sclerochitonilicifolius制备的cDNA中提取醛缩酶基因。回收该基因的5’和3’末端，并随后通过PCR扩增全长基因。

实施例7

球形芽孢杆菌D-氨基酸氨基转移酶的克隆

球形芽孢杆菌(B.sphaericus)D-氨基酸氨基转移酶(EC2.6.1.21，也被称为D-丙氨酸氨基转移酶或D-天冬氨酸氨基转移酶)被重组产生，用于与多种醛缩酶的偶联测定。该酶与前述生产monatin的D-氨基转移酶(美国公开号20040063175和美国公开号20050282260)同源。

菌株

球形芽孢杆菌(ATCC编号10208)在营养琼脂(NutrientAgar)上30℃生长过夜。几组菌落被置于100μL无菌水中并在95℃加热5分钟，使细胞破裂。3μL被用于后续的聚合酶链反应(PCR)扩增。

聚合酶链反应步骤

引物被设计用于克隆进pET28b和pET30a载体(Novagen,Madison,WI)，这使用NcoI和BamHI位点。pET30构建物包含N端His标记和S标记，而pET28构建物未标记。

球形芽孢杆菌dat引物

N端：5′-GATATACCATGGCATACTCATTATGGAATG-3′(SEQIDNO:383)和C端：5′-GTTATCGGATCCTTAGGCATTAATTGAAATTG-3′(SEQIDNO:384)。

编码序列使用以下PCR步骤扩增。在50μL反应中，使用了3μL模板，1.6μM每种引物，0.25mM每种dNTP，3.5UExpand高保真度聚合酶(Roche,Indianapolis,IN)和带有Mg的1×Expand^TM缓冲液。所用的温度循环仪(thermocycler)程序包括94℃热启动3分钟，接着8次重复以下步骤：94℃30秒，52℃30秒，和72℃2分钟。使用58℃的退火温度进行22个后续循环。30个循环后，样品被保持在72℃7分钟并随后储存在4℃。获得正确大小的纯净PCR产物(对dat基因约为850bp)。

克隆

PCR产物使用QiagenQIAquickPCR纯化试剂盒(Qiagen,Valencia,CA)纯化，并且用BamHI和NcoI在BamHI缓冲液(NewEnglandBiolabs,Ipswich,MA)中消化。

消化的载体和插入片段使用QiagenQIAquick凝胶提取试剂盒(Qiagen,Valencia,CA)纯化。连接使用Roche快速DNA连接试剂盒(Roche,Indianapolis,IN)完成并且使用QIAquickPCR纯化试剂盒(Qiagen,Valencia,CA)纯化。连接物使用0.2cm杯(cuvette)和Bio-Rad电穿孔手册中描述的Bio-RadGenePulserII系统(Bio-Rad,Hercules,CA)被转化进大肠杆菌DH10B。该细胞被允许在900μLSOC培养液中，在37℃和225rpm下回收30分钟。细胞被铺于含有卡那霉素(25μg/mL)的LB-琼脂平板上。

质粒DNA使用Qiagen离心小量制备试剂盒(Qiagenspinminiprepkit)(Qiagen,Valencia,CA)纯化，并通过用BamHI和NcoI限制性消化来筛选正确的插入片段。似乎具有正确的插入片段的质粒的序列在AgencourtBioScienceCorporation(Beverly,MA)通过双脱氧链终止DNA测序证实。测序证实在NCBI登录号AF081278区域：134..985(gi:3513754)发现的编码序列，其产生具有登录号AAC33964(gi:3513755)所列的氨基酸序列的蛋白。

基因表达和测试

质粒DNA被亚克隆进大肠杆菌表达宿主BL21(DE3)(Novagen,Madison,WI)。培养物被生长并且质粒使用Qiagen小量制备试剂盒(miniprepkit)(Qiagen,Valencia,CA)分离，并通过限制性消化分析以确定身份。诱导通常在含有卡那霉素(50μg/mL)的LB培养基中进行。细胞被生长到OD₆₀₀值为0.4-0.8，用0.1mMIPTG(异丙基巯基半乳糖)诱导，并且在诱导后4小时取样。细胞提取物根据NovagenBugBuster^TM试剂(Novagen,Madison,WI)(加入benzonase核酸酶和Roche完全蛋白酶抑制剂(Roche,Indianapolis,IN))附带的方案制备。非常高水平的可溶性蛋白在预期的分子量获得，如通过SDS-PAGE判断。对于一些反应，pET30基因产物按照制造商的方案使用His-Bind药筒(cartridges)纯化。洗脱物馏分在PD-10(GEHealthcare,Piscataway,NJ)柱上脱盐并在25-100mM磷酸钾缓冲液，pH7.5中洗脱。

细胞提取物通过使用以下方案按照从丙酮酸和D-色氨酸产生丙氨酸被分析其D-氨基转移酶的活性。1mL反应通常在100mM磷酸钾缓冲液(pH7.5)，50μM磷酸吡哆醛，25mM丙酮酸钠和50mMD-色氨酸中进行。该反应通过加入无细胞提取物或纯化的酶起始，并且在温和摇动的条件下30℃温育15分钟-过夜。甲酸以2％的终浓度被加入以停止反应，并且沉淀的蛋白通过离心被除去。也进行不添加蛋白的对照反应。时间原点也被用作阴性对照。丙氨酸使用如实施例1所述的OPA衍生化作用检测。

实施例8

将SEQIDNO:8、SEQIDNO:4、SEQIDNO:12和SEQIDNO:28的具有醛缩酶活性的多肽的总monatin生产和异构体分布与睾丸酮丛毛单胞菌(C.testosteroni)ProA比较

AT-103转氨酶(宽特异性的D-氨基转移酶)从BioCatalytics(Pasadena,CA)购买，并且这种酶或实施例7中产生的重组酶被用在与HMG醛缩酶的偶联的反应中以从D-色氨酸和丙酮酸生产monatin，如美国公开的申请号20050282260中所述。来自睾丸酮丛毛单胞菌(C.testosteroni)的ProA醛缩酶被用作比较目的的基准醛缩酶，并且如美国公开的申请号20040063175和WO03091396A2所述制备。测试的醛缩酶按照上文实施例4中所述被分离并转化。

为了生产测试量的每种醛缩酶，50mL培养物在含有氨苄青霉素(100μg/mL)的LB培养基中生长到OD600值约0.5。含有SEQIDNO:7、SEQIDNO:3和SEQIDNO:11构建物的菌株用100μM的IPTG诱导。含有SEQIDNO:27构建物的菌株用200μg/L脱水四环素诱导。细胞在诱导后生长5小时，并且细胞提取物根据制造商的方案(Novagen,Madison,WI,Bugbuster试剂)制备。苯并核酸酶(Benzonuclease)和蛋白酶抑制剂也被添加。细胞提取物中的可溶性蛋白在Bio-Rad实验室Experion自动电泳仪(Bio-RadLaboratoriesExperionAutomatedElectrophoresisStation)(Bio-Rad,Hercules,CA)上被分离，并用Experion软件(ExperionSoftware)版本1.1.98.0分析浓度和表达百分数。

每1mL反应混合物被加入以下试剂：约50μg醛缩酶(以细胞提取物的形式提供，除非另有说明)，4mMMgCl₂，50mMD-色氨酸，0.5mg纯化的球形芽孢杆菌D-氨基转移酶，200mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，和0.05mMPLP。实验一式两份进行，带有其中没有加入醛缩酶的阴性对照。样品在温和摇动的条件下在30℃被温育1小时、2小时和过夜(17-20小时)。由于由镁和磷酸盐催化的非酶促反应，在过夜反应中，在没有醛缩酶的情况下产生小量monatin(<0.5ppm)。那些值被从下面显示的数字中减去，并且平均结果被显示。当使用这些方法生产monatin时，检测到的唯一立体异构体是R,R和S,R。R,R的百分数列于下表，并且通过反相LC峰面积确定。

表3：从D-色氨酸产生的总monatin和％R,R

SEQIDNO:28的18小时样品也通过实施例1所列的FDAA衍生法被分析立体异构体的分布，其产生94.9％R,R和5.1％S,Rmonatin的结果。

同时，相同的实验使用L-色氨酸作为起始底物，并偶联醛缩酶与根据美国公开的申请号20050282260的描述产生并纯化的HexAspC宽特异性L-氨基转移酶进行并纯化。这些反应应该主要产生S,Smonatin和R,Smonatin。该反应也补充有10mMα-酮戊二酸用作L-色氨酸转氨基作用的氨基受体。同时，对总monatin(减去没有醛缩酶存在的背景水平)，将两份结果在下面被平均，并且S,Smonatin的百分数基于反相LC峰面积被显示。在一些情况下，因为醛缩酶是相当R-特异性的并且几乎不产生总monatin，加上由于色氨酸峰的一些尾部(tailing)可以与S,S/R,Rmonatin的峰共洗脱，立体异构体分布的反相估计值比较不准确。该趋势在比较醛缩酶的R-特异性方面仍是有益的(informative)。对几个样品采用FDAA衍生法的进一步分析的结果显示在括号中，并且更准确。大于约400ppm的总monatin数比用于定量结果的标准物的线性标度范围高，定性结果也一样。睾丸酮丛毛单胞菌ProA醛缩酶典型地产生95-100％的S,Smonatin，如美国公开的申请号20050282260所示。

表4：从L-色氨酸产生的总monatin和％S,S

可以看出，与基准ProA酶相比，SEQIDNO:28的具有醛缩酶活性的多肽的R-特异性相当高，这也反映在产生低％S,Smonatin，而不管HexAspC氨基转移酶对S-MP在这些反应中的高度特异性。当比较S,Smonatin生产和R,Rmonatin生产时，总monatin数量不指示醛缩酶活性。D-氨基转移酶不如HexAspC活跃，特别在这些反应中存在的MP浓度的条件下。

对于SEQIDNO:28的具有醛缩酶活性的多肽与来自睾丸酮丛毛单胞菌的ProA酶的进一步比较，在D-色氨酸起始的反应中使用各种比例的D-氨基转移酶和醛缩酶(这些实验没有一式两份的样品)。反应按上文进行。对于醛缩酶浓度保持恒定的反应，使用大约50μg。对于D-氨基转移酶保持恒定的反应，使用0.5mg。对于D-氨基转移酶浓度为2和10mg/mL，使用冻干的酶。对于2种最高的D-氨基转移酶浓度，进行一式两份实验。

表5：D-氨基转移酶对R,Rmonatin生产的影响

对于高于400ppm的monatin水平，结果不在标准曲线的线性范围内，并且只是近似值。当被适当稀释时，产生的R,Rmonatin的最大量为1100ppm。用10mgmL的D-氨基转移酶样品对SEQIDNO:28的具有醛缩酶活性的多肽进行FDAA立体异构体分析。在2小时时，样品含98.5％的R,Rmonatin。在17小时时，样品包含95.9％的R,Rmonatin。SEQIDNO:28的具有醛缩酶活性的多肽甚至在长温育时间和使用大量氨基转移酶后，产生高百分比的R,Rmonatin。如果提供足够的D-氨基转移酶，SEQIDNO:28的具有醛缩酶活性的多肽产生与睾丸酮丛毛单胞菌ProA醛缩酶一样多的总monatin，表明了相似的比活性。

表6：醛缩酶浓度对R,Rmonatin生产的影响

当醛缩酶浓度被改变时，总monatin没有增加很多。R,R的百分比随时间并也随醛缩酶浓度降低，特别当D-氨基转移酶有限时。

要进一步检查测试醛缩酶的R-特异性，以L-色氨酸和HexAspC氨基转移酶为起始进行实验，所述HexAspC氨基转移酶按照美国公开的申请号20050282260制备并纯化。HexAspC显示出对S-MP比R-MP强烈的选择性，因此高于50％R,Smonatin的比例表明高立体特异性的醛缩酶。10mM的α-酮戊二酸作为氨基受体被提供；但是，在高浓度，丙酮酸也被L-氨基转移酶利用。在这些反应中，典型地仅S,S和R,Smonatin在FDAA衍生方案的检测极限内被产生。

表7：L-氨基转移酶的浓度对S,Smonatin产生的影响

表8：醛缩酶浓度对S,Smonatin产生的影响

对于高R-特异性的醛缩酶，如SEQIDNO:28的具有醛缩酶活性的多肽，较少的总monatin被产生，并且提高醛缩酶的量确实提高总monatin(以及％S,S)。这些醛缩酶产生较少的S-MP底物，其是使用的L-氨基转移酶的优选底物。对于R-特异性较小的醛缩酶，如ProA，提高醛缩酶的量不显著提高总monatin的产生或％S,Smonatin。提高加入的L-氨基转移酶的量降低产生的S,Smonatin的百分比。基于上述分析，SEQIDNO:8的具有醛缩酶活性的多肽在R-特异性方面介于ProA和SEQIDNO:28的具有醛缩酶活性的多肽之间，这与上述数据一致，其中对于单独的醛醇缩合步骤测量％R-MP。

SEQIDNO:27的亚克隆

以下引物被用于PCR扩增醛缩酶基因：5’-gaggagctcgagtcagacgtatttcagtcctttttc-3’(SEQIDNO:385)和5’-agaagacatatgatttatcagccggggac-3’(SEQIDNO:386)。醛缩酶基因SEQIDNO:27编码SEQIDNO:28的具有醛缩酶活性的多肽。产生的PCR产物用XhoI和NdeI消化，以在被工程化进引物的位点上剪切。片段被凝胶纯化(QIAquick凝胶提取试剂盒(Qiagen,Valencia,CA))并与已经被XhoI和NdeI消化并凝胶纯化的pET28b连接(使用T4DNA连接酶)。连接物被转化进TOP10F’化学感受态细胞中。对生长在平板上的菌落筛选插入片段，若干带有插入片段的分离物被进行DNA测序分析(Agencourt,Beverly,MA)。

SEQIDNO:28的具有醛缩酶活性的多肽的纯化

确认的醛缩酶克隆被转化进BL21DE3或BL21DE3pLysS中。用合适抗生素培养过夜的培养物用新鲜培养基稀释(典型地1:100)并在通气条件下37℃生长到OD₆₀₀值约为0.6。培养物随后用1mMIPTG诱导并被转移到30℃(通气)，并且继续温育过夜。细胞通过离心收集。细胞沉淀物(pellet)通常经受一个冻融循环以帮助细胞裂解。细胞沉淀物在BugBuster和Benzonase(Novagen,Madison,WI)中裂解(根据制造商的方案)。细胞残片通过离心去除。粗蛋白提取物被加到根据制造商的方案准备的HisBind柱(Novagen,Madison,WI)上。该柱被润洗并且蛋白根据制造商的方案洗脱。纯化的蛋白用PD-10柱(GEHealthcare,Piscataway,NJ)脱盐。用于交换的缓冲液是50mM磷酸钾pH7.5，100mMNaCl，4mMMgCl₂。纯化的蛋白用Amicon离心浓缩器(Millipore,Billerica,MA)浓缩。

实施例9

SEQIDNO:40、SEQIDNO:298、SEQIDNO:36、SEQIDNO:62、SEQIDNO:64、SEQIDNO:96、SEQIDNO:54、SEQIDNO:122、SEQIDNO:142、SEQIDNO:42、SEQIDNO:130、SEQIDNO:112、SEQIDNO:108、SEQIDNO:94、SEQIDNO:80和SEQIDNO:28的具有醛缩酶活性的多肽的总monatin产生和异构分布的比较

AT-103转氨酶(宽特异性D-氨基转移酶)从BioCatalytics(Pasadena,CA)购买，并且这种酶或实施例7中产生的重组酶被用于与HMG醛缩酶偶联的反应，以从D-色氨酸和丙酮酸产生monatin，如美国公开申请号20050282260所述。SEQIDNO:28的具有醛缩酶活性的多肽(his-标记的)被用作比较目的的基准醛缩酶，并且按照实施例8末尾所述地产生并纯化。测试的其它醛缩酶按照上文实施例4所述地分离和转化。

为了产生测试量的每种醛缩酶，25mL培养物在含有氨苄青霉素(100μg/mL)的LB培养基中生长到OD₆₀₀值约0.4。菌株用100μM的IPTG诱导。细胞在诱导后生长4小时，并且细胞提取物根据制造商的方案(Novagen,Madison,WI,Bugbuster试剂)使用苯并核酸酶制备。细胞提取物中的可溶性蛋白在Bio-Rad实验室Experion自动电泳台(Bio-RadLaboratoriesExperionAutomatedElectrophoresisStation)(Bio-Rad,Hercules,CA)上被分离，并用Experion软件(ExperionSoftware)版本1.1.98.0分析浓度和表达百分数。

每1mL反应混合物被加入以下试剂：约50μg醛缩酶(以细胞提取物的形式提供，除非另有说明)，4mMMgCl₂，50mMD-色氨酸，2mgAT-103(BioCatalytics,Pasadena,CA)，200mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，和0.05mMPLP。D-色氨酸在这样较高的浓度下不溶解，但是被用于确保反应保持在D-色氨酸的饱和量下。实验一式两份进行，其中没有加入醛缩酶的为阴性对照。样品在温和摇动下在30℃温育2小时和过夜(17-20小时)。由于由镁和磷酸盐催化的非酶促反应，没有醛缩酶的情况下，过夜产生少量monatin(～0.5ppm)。％R,Rmonatin的典型值对这些样品是50％。阴性对照的值被从下面显示的数字中减去，并且平均结果被显示。当使用这些方法生产monatin时，检测到的唯一立体异构体是R,R和S,R。R,R的百分数列于下表，并且通过反相LC峰面积确定。相同的实验在将细胞提取物和纯化的SEQIDNO:28的具有醛缩酶活性的多肽在-20℃储存2个月后进行，这一次使用50mMD-色氨酸，如实施例8中。两倍醛缩酶的量被加入，除了SEQIDNO:28的具有醛缩酶活性的多肽以外，其再次以约50μg利用。这些结果显示在表9的右侧。异构体分布的FDAA衍生化结果在括号中显示。

表9：从D-色氨酸产生的总monatin和％R,R

基于活性的比例可以看出，某些酶比其它醛缩酶对储存更稳定。次级产物，非常可能的是4-羟基-4-甲基谷氨酸也可以在这些反应过程中形成。上述酶通过比较其与副产物的峰面积为它们对monatin产生的特异性进行排序。结果是具有醛缩酶活性的多肽SEQIDNO:122>SEQIDNO:42>SEQIDNO:80>SEQIDNO:108>SEQIDNO:96>SEQIDNO:112>SEQIDNO:130>SEQIDNO:36>SEQIDNO:94>SEQIDNO:298>SEQIDNO:40>SEQIDNO:142>SEQIDNO:54>SEQIDNO:64>SEQIDNO:28>SEQIDNO:62。

基于初始实验，SEQIDNO:298、SEQIDNO:54和SEQIDNO:42的具有醛缩酶活性的多肽在活性水平和产生的％R,Rmonatin方面被认为是最有前景的。这些酶被亚克隆进带有和不带hig-标记的pET表达载体。

SEQIDNO:297、SEQIDNO:53和SEQIDNO:41的克隆

用于克隆的引物

表10

SEQIDNO:297、SEQIDNO:53和SEQIDNO:41通过PCR被扩增并用合适的酶(NdeI和BamHI，用于包含SEQIDNO:297和SEQIDNO:53的PCR产物；NcoI和BamHI，用于包含SEQIDNO:41的PCR产物)消化，并被凝胶提纯(QIAquick凝胶提取试剂盒(Qiagen,Valencia,CA))。SEQIDNO:297和SEQIDNO:53被单独地连接入已用NdeI和BamHI消化并凝胶提纯的pET28。SEQIDNO:41被连接到已用NcoI和BamHI消化并凝胶提纯的pET30。连接物被转化进TOP10。筛选带有插入片段的菌落。带有插入片段的分离物进行DNA测序分析(Agencourt,Beverly,MA)。

醛缩酶的纯化

确认的醛缩酶克隆被转化入BL21DE3或BL21DE3pLysS。用合适抗生素培养的过夜培养物用新鲜培养基稀释(典型地1:100)并在通气条件下37℃生长到OD₆₀₀值约为0.6。培养物随后用1mMIPTG诱导并被转移到30℃(通气)，并且继续温育过夜。细胞通过离心收集。细胞沉淀物通常经受一个冻融循环以帮助细胞裂解。细胞沉淀物在BugBuster和Benzonase(Novagen,Madison,WI)中裂解(根据制造商的方案)。细胞残片通过离心去除。粗蛋白提取物被加到根据制造商的方案准备的HisBind柱(Novagen,Madison,WI)上。该柱被润洗并且蛋白根据制造商的方案洗脱。纯化的蛋白用PD-10柱(GEHealthcare,Piscataway,NJ)脱盐。用于交换的缓冲液是50mM磷酸钾pH7.5，100mMNaCl，4mMMgCl₂。纯化的蛋白用Amicon离心浓缩器(Millipore,Billerica,MA)浓缩。

测试纯化的醛缩酶

测试纯化的醛缩酶从D-色氨酸产生R,Rmonatin的能力。每1mL反应混合物中加入以下试剂：约50μg纯化的醛缩酶，4mMMgCl₂，50mMD-色氨酸，0.5mg纯化的球状芽孢杆菌D-氨基转移酶，200mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，和0.05mMPLP。样品在2小时和过夜被取出。结果显示于下面的表11。

表11：从D-色氨酸产生的总monatin和％R,R

相同的实验使用L-色氨酸作为起始底物，并偶联醛缩酶与根据美国公开申请号20050282260所述生产并纯化的HexAspC宽特异性L-氨基转移酶(0.5mg纯化的蛋白)进行。总monatin产生的结果(减去没有醛缩酶存在的背景水平)显示于下面的表12，并且S,Smonatin的百分比基于反相LC峰面积显示。大于400ppm的数值在标准曲线的线性范围以外，并且是近似值。

表12：从L-色氨酸产生的总monatin和％S,S

醛缩酶(时间点)

总monatin

％S,S monatin(反

％S,S monatin

	(ppm)	向LC峰面积)	(FDAA衍生化)
				SEQ ID NO:298(1hr)	186.6	64.0	n/a
SEQ ID NO:298(过夜)	197.5	64.3	67.6
				SEQ ID NO:54(1hr)	70.4	36.5	n/a
SEQ ID NO:54(过夜)	87.8	41.7	42.1
				SEQ ID NO:42(1hr)	401.1	80.9	n/a
SEQ ID NO:42(过夜)	507.5	82.9	85.8
				SEQ ID NO:28(1hr)	56.2	30.1	n/a
SEQ ID NO:28(过夜)	88.8	32.2	33.8

这些数据和上面R,Rmonatin的数据显示了对于R-MP的特异性，具有醛缩酶活性的多肽具有以下顺序：SEQIDNO:28>SEQIDNO:54>SEQIDNO:298>SEQIDNO:42。

实施例10

对于SEQIDNO:116、SEQIDNO:76、SEQIDNO:44、SEQIDNO:148、SEQIDNO:46、SEQIDNO:134、SEQIDNO:74、SEQIDNO:126、SEQIDNO:102、SEQIDNO:58、SEQIDNO:88、SEQIDNO:50、SEQIDNO:106、SEQIDNO:304、SEQIDNO:300和SEQIDNO:28的具有醛缩酶活性的多肽，总monatin产生和异构体分布的比较

实施例7中产生的重组酶被用于与HMG醛缩酶偶联的反应中，以从D-色氨酸和丙酮酸产生monatin，如美国公开申请号20050282260所述。SEQIDNO:28的具有醛缩酶活性的多肽被用作这些测定方法中的基准，并且已经如实施例8所述被纯化。

为了产生测试量的每种醛缩酶，25mL培养物在含有氨苄青霉素(100μg/mL)的LB培养基中生长到OD₆₀₀值约0.5。培养物用1mM的IPTG诱导。细胞被转移到30℃并生长过夜。细胞提取物根据制造商的方案(Novagen,Madison,WI,Bugbuster试剂)制备。也加入苯并核酸酶。细胞提取物中的可溶性蛋白在Bio-Rad实验室Experion自动电泳台(Bio-Rad,Hercules,CA)上被分离，并用Experion软件版本1.1.98.0分析浓度和表达百分数。

每1mL反应混合物被加入以下试剂：约50μg醛缩酶(以细胞提取物的形式提供，除非另有说明)，4mMMgCl₂，50mMD-色氨酸，0.5mg纯化的球状芽孢杆菌D-氨基转移酶，200mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，和0.05mMPLP。二硫苏糖醇(“DTT”)被加入(终浓度2mM)下文所注样品中。实验一式两份进行。样品在温和摇动的条件下在30℃被温育2小时和过夜(20小时)。平均的结果被显示在下面。当使用这些方法产生monatin时，检测到的唯一立体异构体是R,R和S,R。R,R的百分数列于下表，并且通过反相LC峰面积确定。

表13：从D-色氨酸产生的总monatin和％R,R

醛缩酶(时间点)	总monatin(ppm)	％R,R monatin
			SEQ ID NO:116(2hr)	34.5	97
SEQ ID NO:116(18hr)	99	95
			SEQ ID NO:76(2hr)	40	76
SEQ ID NO:76(18hr)	112	67
			SEQ ID NO:44(2hr)	32.5	97
SEQ ID NO:44(18hr)	93.5	94
			SEQ ID NO:148(2hr)	31.5	94
SEQ ID NO:148(18hr)	98	89
			SEQ ID NO:46(2hr)	42.5	84
SEQ ID NO:46(18hr)	169	72
			SEQ ID NO:134(2hr)	43.5	92
SEQ ID NO:134(18hr)	113	86
			SEQ ID NO:74(2hr)	23.5	96
SEQ ID NO:74(18hr)	78.5	92
			SEQ ID NO:126(2hr)	18	94
SEQ ID NO:126(18hr)	72	92
			SEQ ID NO:102(2hr)	1	0
SEQ ID NO:102(18hr)	4.5	91
			SEQ ID NO:58(2hr)	23	92
SEQ ID NO:58(18hr)	122	88
			SEQ ID NO:88(2hr)	57.5	74
SEQ ID NO:88(18hr)	200.5	64
			SEQ ID NO:50(2hr)	32.5	99
SEQ ID NO:50(18hr)	131.5	97
			SEQ ID NO:106(2hr)	4.5	78
SEQ ID NO:106(18hr)	20	95
			SEQ ID NO:304(2hr)	0	0
SEQ ID NO:304(18hr)	0.45	55
			SEQ ID NO:304DTT(2hr)	0	0
SEQ ID NO:304DTT(18hr)	0.55	53
			SEQ ID NO:300(2hr)	0.85	34
SEQ ID NO:300(18hr)	5.5	36
			SEQ ID NO:300DTT(2hr)	1.5	55
SEQ ID NO:300DTT(18hr)	9	40
			SEQ ID NO:28(2hr)	25	99

醛缩酶(时间点)	总monatin(ppm)	％R,R monatin
			SEQ ID NO:28(18hr)	69	97

总monatin产生在从1ppm到超过200ppm的范围内，并且％R,R在从0％到99％范围内。因为氨基转移酶对所有的醛缩酶都一样，改变醛缩酶可以对产生的monatin的量和产生的monatin的立体异构体的分布具有显著影响。DTT(如在下文的样品中)似乎提高了产生的总monatin的量。

与上文相同的实验使用L-色氨酸作为起始底物，并偶联醛缩酶(以细胞提取物提供)与部分纯化的HexAspC宽特异性L-氨基转移酶(0.5mgHexAspC)进行。总monatin产生(减去无醛缩酶存在下的背景水平)的平均结果(一式两份)显示于下面的表14中，并且S,Smonatin的百分比基于反相LC峰面积显示。大于400ppm的数值在标准曲线的线性范围以外，并且是近似值。SEQIDNO:28的具有醛缩酶活性的纯化多肽被用作基准。SEQIDNO:304和SEQIDNO:300的具有醛缩酶活性的多肽(从植物获得的)在含有和不含2mMDTT的条件下被使用。Shannon和Marcus(TheJournalofBiologicalChemistry237:3342-3347,1962)使用巯基乙醇作为花生HMG醛缩酶初始纯化中的还原剂。

表14：从L-色氨酸产生的总monatin和％S,S

醛缩酶(时间点)	总monatin(ppm)	％S,S monatin
			SEQ ID NO:116(2hr)	129	47.9
SEQ ID NO:116(21hr)	207	56.4
			SEQ ID NO:76(2hr)	949	90.6
SEQ ID NO:76(21hr)	1181	89.0
			SEQ ID NO:44(2hr)	128	55.0
SEQ ID NO:44(21hr)	237	61.7
			SEQ ID NO:148(2hr)	199	71.5
SEQ ID NO:148(21hr)	358	74.4
			SEQ ID NO:46(2hr)	346	79.3
SEQ ID NO:46(21hr)	757	83.3
			SEQ ID NO:134(2hr)	215	69.2
SEQ ID NO:134(21hr)	370	74.1
			SEQ ID NO:74(2hr)	75	51.4
SEQ ID NO:74(21hr)	137	58.8
			SEQ ID NO:126(2hr)	47	56.7
SEQ ID NO:126(21hr)	113	56.7
			SEQ ID NO:102(2hr)	与对照相同	n/a
SEQ ID NO:102(21hr)	11.5	61.1
			SEQ ID NO:58(2hr)	113	71.9

SEQ ID NO:58(21hr)	351	75.5
			SEQ ID NO:88(2hr)	852	90.1
SEQ ID NO:88(21hr)	1352	88.8
			SEQ ID NO:50(2hr)	62	30.8
SEQ ID NO:50(21hr)	145	38.6
			SEQ ID NO:106(2hr)	3.5	31.0
SEQ ID NO:106(21hr)	45	34.4
			SEQ ID NO:304(2hr)	与对照相同	n/a
SEQ ID NO:304+DTT(2hr)	1	n/a
			SEQ ID NO:304(21hr)	与对照相同	n/a
SEQ ID NO:304+DTT(21hr)	10	n/a
			SEQ ID NO:300(2hr)	73	75.2
SEQ ID NO:300+DTT(2hr)	121	83
			SEQ ID NO:300(21hr)	91	63.6
SEQ ID NO:300+DTT(21hr)	197	71.6
			SEQ ID NO:28(2hr)	55	35.1
SEQ ID NO:28(21hr)	87	40.4

实施例11

二硫苏糖醇(DTT)对monatin产生的影响

实施例10中的若干种酶被选择进行进一步研究。植物衍生的醛缩酶在加入DTT作为还原试剂时显示出改善。注意到来自环境样品的微生物衍生的醛缩酶也包含高百分比的半胱氨酸残基。因此，进行进一步试验检测DTT是否也提高非植物醛缩酶的monatin生产。

每1mL反应混合物被加入以下试剂：约50μg醛缩酶(以细胞提取物的形式提供，除非另有说明)，4mMMgCl₂，50mMD-色氨酸，2mgAT-103，200mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，和0.05mMPLP。二硫苏糖醇(“DTT”)被加入(终浓度2mM)下文所注样品。实验一式两份进行。样品在温和摇动的条件下在30℃被温育2小时和过夜(20小时)。由LC/MS/MS确定的总monatin的平均结果被显示在下面，并且减去monatin的背景生产(没有醛缩酶的对照)。

表15：从D-色氨酸产生总monatin

醛缩酶	总monatin(ppm)
		SEQ ID NO:116	126
SEQ ID NO:116+DTT	102
		SEQ ID NO:44	107
SEQ ID NO:44+DTT	103
		SEQ ID NO:46	88
SEQ ID NO:46+DTT	161

SEQ ID NO:58	118
		SEQ ID NO:58+DTT	141
SEQ ID NO:50	243
		SEQ ID NO:50+DTT	170
SEQ ID NO:28纯化的蛋白	174
		SEQ ID NO:28+DTT纯化的蛋白	196

没有醛缩酶的对照在含有和不含DTT的情况下产生10ppm的monatin，表明DTT不通过副产物的还原影响总反应，也不影响D-氨基转移酶的活性。SEQIDNO:46、SEQIDNO:58和SEQIDNO:28的具有醛缩酶活性的多肽都显示了DTT加入的好处。SEQIDNO:46的具有醛缩酶活性的多肽显示最高的益处，在含有2mMDTT的情况下有大约1.8倍高的活性。具有醛缩酶活性的两种多肽(SEQIDNO:116和SEQIDNO:50)似乎已经被DTT抑制，而没有注意到对SEQIDNO:44的具有醛缩酶活性的多肽在实验误差范围内的影响。然而，可能的是，对于使用每种醛缩酶，有最佳的DTT浓度以便检测提供还原试剂的益处。

选择SEQIDNO:88的具有醛缩酶活性的多肽，以研究DTT浓度对monatin生产的影响。偶联反应按上文进行。结果被绘制于图15。对于加入的醛缩酶量，该测试中最佳的DTT浓度在2.5到5mM之间。有趣地，如果没有加入DTT，产生的monatin的量几乎与加入2.5mMDTT一样高，但是加入不是最佳量的DTT(0.5-1mM)实际上似乎是抑制性的，加入太多的DTT(20mM)也是一样的情况。

实施例12

对于SEQIDNO:278、SEQIDNO:162、SEQIDNO:276、SEQIDNO:178、SEQIDNO:202、SEQIDNO:166、SEQIDNO:218、SEQIDNO:224、SEQIDNO:226、SEQIDNO:244、SEQIDNO:250、SEQIDNO:252、SEQIDNO:264、SEQIDNO:268、SEQIDNO:272、SEQIDNO:184、SEQIDNO:282、SEQIDNO:186、SEQIDNO:192、SEQIDNO:200、SEQIDNO:280、SEQIDNO:284、SEQIDNO:172、SEQIDNO:180、SEQIDNO:168、SEQIDNO:228、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:270、SEQIDNO:156和SEQIDNO:28的具有醛缩酶活性的多肽，总monatin产生和异构体分布的比较

实施例7中产生的重组酶被用在与HMG醛缩酶偶联的反应中，以从D-色氨酸和丙酮酸产生monatin，如美国公开申请号20050282260所述。SEQIDNO:28的具有醛缩酶活性的多肽被用作这些测定方法中的基准，并已经如实施例8所述进行纯化。

为了生产测试量的每种醛缩酶，25mL培养物在含有氨苄青霉素(100μg/mL)的LB培养基中生长到OD₆₀₀值约0.5。培养物用1mM的IPTG诱导。细胞被转移到30℃并生长过夜。细胞提取物根据制造商的方案(Novagen,Madison,WI,Bugbuster试剂)使用Bugbuster试剂提取。也加入苯并核酸酶。细胞提取物中的可溶性蛋白在Bio-Rad实验室Experion自动电泳台(Bio-Rad,Hercules,CA)上被分离，并用Experion软件版本1.1.98.0分析浓度和表达百分数。

每1mL反应混合物中加入以下试剂：大约200μg的SEQIDNO:278、SEQIDNO:162、SEQIDNO:276、SEQIDNO:178、SEQIDNO:202、SEQIDNO:166、SEQIDNO:218、SEQIDNO:224、SEQIDNO:226、SEQIDNO:244、SEQIDNO:250、SEQIDNO:252、SEQIDNO:264、SEQIDNO:268、SEQIDNO:272、SEQIDNO:184、SEQIDNO:282、SEQIDNO:186、SEQIDNO:192和SEQIDNO:200的具有醛缩酶活性的多肽，或50gSEQIDNO:280、SEQIDNO:284、SEQIDNO:172、SEQIDNO:180、SEQIDNO:168、SEQIDNO:228、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:270和SEQIDNO:156的具有醛缩酶活性的多肽(以细胞提取物的形式提供，除非另有说明)，4mMMgCl₂，50mMD-色氨酸，0.5mg纯化的球状芽孢杆菌D-氨基转移酶，200mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，和0.05mMPLP。实验一式两份进行。样品在温和摇动的条件下在30℃被温育2小时和过夜(20小时)。平均的结果被显示在下面。当使用这些方法生产monatin时，检测到的唯一立体异构体是R,R和S,R。R,R的百分数列于下表，并且通过反相LC峰面积确定。

表16：从D-色氨酸产生的总monatin和％R,R

醛缩酶(时间点)	总monatin(ppm)	％R,R monatin
			SEQ ID NO:278(1hr)	11.35	100
SEQ ID NO:278(18hr)	282.15	96
			SEQ ID NO:162(1hr)	19.35	100
SEQ ID NO:162(18hr)	277.9	98
			SEQ ID NO:276(1hr)	27.2	100
SEQ ID NO:276(18hr)	421	98
			SEQ ID NO:178(1hr)	24.8	98
SEQ ID NO:178(18hr)	394.25	94
			SEQ ID NO:202(1hr)	0	0
SEQ ID NO:202(18hr)	19.2	91
			SEQ ID NO:166(1hr)	42.8	89
SEQ ID NO:166(18hr)	601.25	71
			SEQ ID NO:218(1hr)	15.6	99
SEQ ID NO:218(18hr)	456.05	96
			SEQ ID NO:224(1hr)	19.7	98
SEQ ID NO:224(18hr)	406.55	93
			SEQ ID NO:226(1hr)	41.3	95
SEQ ID NO:226(18hr)	460.15	84
			SEQ ID NO:244(1hr)	11.6	99
SEQ ID NO:244(18hr)	168.3	98
			SEQ ID NO:250(1hr)	20.25	95
SEQ ID NO:250(18hr)	289.25	89
			SEQ ID NO:252(1hr)	48.4	81

醛缩酶(时间点)	总monatin(ppm)	％R,R monatin
			SEQ ID NO:252(18hr)	335.8	73
SEQ ID NO:264(1hr)	31.65	82
			SEQ ID NO:264(18hr)	252.35	77
SEQ ID NO:268(1hr)	12.95	98
			SEQ ID NO:268(18hr)	252.55	95
SEQ ID NO:272(1hr)	13.8	98
			SEQ ID NO:272(18hr)	165.8	98
SEQ ID NO:184(1hr)	19.55	96
			SEQ ID NO:184(18hr)	221.85	94
SEQ ID NO:282(1hr)	29.75	95
			SEQ ID NO:282(18hr)	399.05	91
SEQ ID NO:186(1hr)	14.4	94
			SEQ ID NO:186(18hr)	116.15	93
SEQ ID NO:192(1hr)	17.1	97
			SEQ ID NO:192(18hr)	131.25	97
SEQ ID NO:200(1hr)	32.1	97
			SEQ ID NO:200(18hr)	331.05	94
SEQ ID NO:28(1hr)(200μg)	32.1	100
			SEQ ID NO:28(18hr)(200μg)	111.45	99
SEQ ID NO:280(1hr)	0	n/a
			SEQ ID NO:280(18hr)	3.25	61
SEQ ID NO:284(1hr)	2.3	100
			SEQ ID NO:284(18hr)	55.35	98
SEQ ID NO:172(1hr)	12.75	99
			SEQ ID NO:172(18hr)	205.9	96
SEQ ID NO:180(1hr)	38.7	93
			SEQ ID NO:180(18hr)	310.9	75
SEQ ID NO:168(1hr)	28	98
			SEQ ID NO:168(18hr)	301.1	90
SEQ ID NO:228(1hr)	39.2	99
			SEQ ID NO:228(18hr)	367	95
SEQ ID NO:236(1hr)	14.85	96
			SEQ ID NO:236(18hr)	250.05	90
SEQ ID NO:238(1hr)	30.05	97
			SEQ ID NO:238(18hr)	466.15	90
SEQ ID NO:240(1hr)	2.65	100
			SEQ ID NO:240(18hr)	51.55	96
SEQ ID NO:270(1hr)	12.2	91
			SEQ ID NO:270(18hr)	214.3	83
SEQ ID NO:156(1hr)	62.5	88
			SEQ ID NO:156(18hr)	623.9	71
SEQ ID NO:28(1hr)(50μg)	31.3	98
			SEQ ID NO:28(18hr)(50μg)	444.25	97

总monatin生产数在从不可检测到超过600ppm的范围内，并且％R,R在从61％到100％范围内。因为氨基转移酶对所有的醛缩酶都一样，改变醛缩酶可以对产生的monatin的量和产生的monatin的立体异构体分布具有显著影响。

与上文相同的实验用L-色氨酸作为起始底物，并偶联醛缩酶(以细胞提取物提供)与如美国公开申请号20050282260所述制备并纯化的HexAspC宽特异性L-氨基转移酶(0.5mg纯化蛋白)进行。总monatin产生的结果显示于下面的表17中(减去没有醛缩酶存在的背景水平)，并且S,Smonatin的百分比基于反相LC峰面积显示。大于400ppm的数值在标准曲线的线性范围以外，并且是近似值。表12显示了基准R-特异性酶以及同时被测试的SEQIDNO:28的具有醛缩酶活性的多肽的结果。

表17：从L-色氨酸产生的总monatin和％S,S

实施例13

使用D-氨基转移酶从吲哚-3-丙酮酸生产monatin

AT-103转氨酶是从BioCatalytics(Pasadena,CA)购买的转氨酶文库的一部分，并且测试该酶在使用来自睾丸酮丛毛单胞菌的ProA醛缩酶的偶联反应中monatin的产生。醛缩酶如WO03/091396A2所述制备。AT-103是来自芽孢杆菌属菌种的宽特异性D-氨基转移酶(E.C.2.6.1.21)，其需要D-氨基酸(如D-谷氨酸、D-天冬氨酸或D-丙氨酸)作为氨基供体。酶和其它组分/底物被直接加入到试剂盒提供的反应缓冲液中，其含有100mM磷酸钾缓冲液pH7.5，100mM氨基供体，和0.1mMPLP。向1mL反应缓冲液中加入：4mg吲哚-3-丙酮酸，20mg丙酮酸，以细胞提取物形式提供的约50μgProA，1μL的2MMgCl₂，和2mg氨基转移酶。反应进行一式两份。该反应在温和摇动下(100rpm)于30℃温育过夜。样品过滤并进行如实施例1所述的反向LC/MS/MS分析。结果表明使用AT-103酶产生了大约370μg/mL的monatin。基于在色谱分离过程中解析的两种立体异构体混合物(pool)的峰面积，该结果被进一步分析以确定S,R/R,S对R,R/S,Smonatin的比例。在由AT-103产生的总monatin中，与混合的异构体相比，69％是R,R/S,Smonatin。该酶与WO03/091396A2中所述的枯草芽孢杆菌DAT酶同源，DAT酶已知对D-氨基酸具有宽特异性。手性分析使用实施例1所述的FDAA法进行，其证实D-氨基转移酶主要产生R,Rmonatin，及一些S,Rmonatin，如所预期的。用S,Smonatin或R,Rmonatin和α-酮戊二酸作为底物的进一步转氨基实验证实BioCatalytics酶对D-构型在碳-4上具有高度选择性，如所预期的。在这些实验中，用S,Smonatin和α-酮戊二酸作为底物的反应中没有检测到谷氨酸。

为了降低与AT-103(宽范围D-转氨酶)和ProA醛缩酶偶联的反应中作为副产物产生的S,Smonatin或R,Smonatin的量，醛缩酶使用His结合(His-Bind)药筒，按照制造商的方案(Novagen,Madison,WI)被纯化。纯化的酶优选地不应该包含能够在细胞提取物中存在的野生型L-氨基转移酶的活性(如天然大肠杆菌AspC或TyrB活性)。His-结合洗脱物使用PD-10柱(G25Sephadex,GEHealthcare,Piscataway,NJ)脱盐以除去咪唑，并在50mMTris-Cl,pH7中洗脱。实验以1mL的体积一式两份进行，并包含100mMTris-Cl缓冲液pH7.8，50μgProA醛缩酶，4mg吲哚-3-丙酮酸，1或2mgD-氨基转移酶，200mM丙酮酸钠，2mMMgCl₂，3mM磷酸钾，0.1mMPLP，和14.7mgD-谷氨酸。试管在轻微摇动下于30℃温育。在2小时的时间点被取出并立即在-20℃冷冻。pH值在2小时时使用NaOH从5调整到7-8，并且该测定物被温育过夜。样品被过滤并分析monatin，如实施例1所述。2小时的样品不含有可检测量的monatin，这可能是由于pH低的缘故。当1mgD-氨基转移酶被使用时，过夜样品含有约190ng/mLmonatin，并且约84％是R,Rmonatin以及16％为S,Rmonatin。当2mg的D-氨基转移酶被使用时，产生540ng/mLmonatin，约71％为R,Rmonatin。

相似地实验使用BioCatalytics氨基转移酶缓冲液(BioCatalytics,Pasadena,CA)进行，其含有100mM磷酸钾pH7.5，0.1mMPLP，和100mMD-谷氨酸。固体吲哚-3-丙酮酸和D-氨基转移酶按上文被加入。ProA醛缩酶(50μg)，MgCl₂和50mM丙酮酸从母液中加入。尽管在本例中不要求pH调整，但是该测定按上文处理。仅含有BioCatalytics提供的酶和缓冲液的阴性对照被实施，其不含monatin。试验结果显示于表18。

表18：在磷酸盐缓冲液中从吲哚-3-丙酮酸产生monatin

磷酸盐缓冲液中monatin的产生明显比Tris缓冲系统更高。

为了比较来自WO03/091396A2的克隆的枯草芽孢杆菌DAT与BioCatalytics酶(AT-103)(BioCatalytics,Pasadena,CA)的活性，进行了额外的测定。枯草芽孢杆菌dat基因也被亚克隆进pET30a以除去His-6标记。无标记和标记的酶在BL21(DE3)中产生，如WO03/091396A2中所述。按照先前描述，制备细胞提取物并进行总蛋白测定，以估计蛋白浓度。两份1mL反应被进行，其包含500μgD-氨基转移酶，50μgProA醛缩酶，100mM磷酸钾pH7.5，3mMMgCl₂，4mg吲哚-3-丙酮酸，200mM丙酮酸钠，7.35mg(50mM)D-谷氨酸，和0.1mMPLP。样品在30℃温育被温育1小时，2小时和过夜，并且被过滤用于LC/MS/MS分析。由实施例1所述的FDAA衍生方案确定，样品仅含有monatin的S,R和R,R立体异构体。结果总结于下面的表19。％RR通过由反相色谱分离的峰面积确定。

表19：D-氨基转移酶的比较

酶	时间(hr)	Monatin(ppb)	％RR monatin
				B.sub DAT-HIS	1	512	未确定
B.sub DAT无标记	1	1056	未确定
				BioCatalytics AT-103	1	2353	未确定
B.sub DAT-HIS	2	894	～80-90％
				B.sub DAT无标记	2	1913	～80％
BioCatalytics AT-103	2	6887	92.5％
				B.sub DAT-HIS	16	3014	31
B.sub DAT无标记	16	5612	33
				BioCatalytics AT-103	16	16131	66

HIS-6标记的去除似乎提高了枯草芽孢杆菌D-氨基转移酶活性；但是，BioCatalyticsD-氨基转移酶同系物明显具有最高的活性。BioCatalyticsD-氨基转移酶同系物也对R-monatin前体显示出更高的底物特异性。增加的温育时间似乎降低了产生的过量R,Rmonatin对映体。

因为芽孢杆菌D-氨基转移酶优选丙酮酸作为氨基受体和D-丙氨酸作为氨基供体，预期D-丙氨酸可以被用作MP向monatin转化的氨基供体，具有相似或更好结果。进行两份1mL反应，其包含500μgD-氨基转移酶，50μg纯化的ProA醛缩酶，100mM磷酸钾缓冲液pH7.5，3mMMgCl₂，4mg吲哚-3-丙酮酸，100mM丙酮酸钠，25mMD-谷氨酸或D-赖氨酸，和0.1mMPLP。样品被温育2小时，并在分析前按上文处理。当D-丙氨酸被用作氨基供体时，如预期地产生稍微较高水平的monatin(23ppm对21ppm)。此外，预期高浓度丙酮酸可抑制转氨基步骤，因此随着时间推移加入较小量的丙酮酸可提高monatin生产的总速率。可以从上面的数据看出，尽管与上表相比本例中使用了1/2的丙酮酸，但是产生了明显更多的monatin。AT-103是对S-MP具有限制活性的酶的实例。即使本研究中使用的ProA醛缩酶产生高于90-95％的S-MP，但AT-103产生高达92％的R,Rmonatin。

实施例14

从D-色氨酸生产R,R-monatin

每1mL反应混合物中加入以下试剂：约60μg睾丸酮丛毛单胞菌ProA醛缩酶(以细胞提取物形式提供，如WO03/091396A2所述)，4mMMgCl₂，50mMD-色氨酸，0.5mgBioCatalyticsD-氨基转移酶(AT-103)(BioCatalytics,Pasadena,CA)，100mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5或100mM醋酸钠缓冲液pH8，0.05mMPLP，3mM磷酸钾(仅向醋酸盐反应中加入)，和10mMα-酮戊二酸。实验一式两份进行，带有其中不加入醛缩酶的阴性对照。样品在轻微摇动的条件下于30℃温育过夜(20小时)。醋酸钠样品的实际pH值约为5，而磷酸盐缓冲的样品的最终pH值约为7。所有的醛缩酶在pH5似乎都不具有显著的活性，含有ProA醛缩酶的样品稍微高于阴性对照，但可能不高于实验误差。在磷酸钾中，ProA醛缩酶产生了73.4ppm的monatin，其中R,R:S,R的比例为1.7:1(约63％的R,R来自D-色氨酸)。

因为芽孢杆菌D-氨基转移酶优选丙酮酸作为氨基受体和D-丙氨酸作为氨基供体，预期当从D-色氨酸生产R,R或S,Rmonatin时，α-酮戊二酸的加入是不必要的。上述实验使用纯化的ProA醛缩酶(50-60μg)和2.5小时的温育时间重复进行(在100mM磷酸钾缓冲液中)。进行两份实验，含有和不含α-酮戊二酸。加入10mMα-酮戊二酸，56.1ppm的monatin从D-色氨酸形成(79.5％R,R，20.5％S,R)。不加入α-酮戊二酸，形成102.5ppm的monatin(79％R,R，21％S,R)。

实施例15

色氨酸消旋酶

当D-色氨酸被用作初始原料时，使用D-氨基转移酶和醛缩酶已经产生了R,R-monatin(实施例14)。尽管如此，虽然出于一些原因，L-色氨酸可能是优选的起始材料。例如，L-色氨酸可能比D-色氨酸更便宜并且更容易获得。本公开描述了获得活性色氨酸消旋酶的若干方法。通过使用R-特异性醛缩酶，即优选地或选择性地产生R-MP的醛缩酶，R,Rmonatin的产率被提高。图3显示了使用色氨酸消旋酶、D-氨基转移酶和R-特异性醛缩酶从L-色氨酸产生立体异构上富集的R,Rmonatin的方法。

色氨酸消旋酶的选择通过构建需要活性消旋酶以生长的菌株产生。当在基本培养基上生长时，色氨酸营养缺陷型需要L-色氨酸源。用D-色氨酸补充该培养基是选择转化D-色氨酸为L-色氨酸的一种途径。在补充有D-色氨酸的基本培养基上测试色氨酸营养缺陷型的生长。来自大肠杆菌遗传储备中心(ColiGeneticStockCenter)的CAG18455和CAG18579菌株，以及NRRL12264菌株(也为lipA^—、溶源化的和其质粒治愈的λDE3)，当补充有D-色氨酸时不生长，但补充L-色氨酸时生长。大肠杆菌可被用作宿主生物体，但其它宿主生物体也可被使用，例如酵母、其它细菌或其它真核生物。当其被转化有D-氨基转移酶时，色氨酸营养缺陷型(特别是NRRL12264(也为lipA^—、溶源化的和其质粒治愈的λDE3))可以在D-色氨酸中生长。这证实了大肠杆菌将D-色氨酸转运进入细胞的能力。

Salcher和Lingens描述了在致黄假单胞菌(Pseudomonasaureofaciens)(ATCC15926)中存在色氨酸消旋酶。色氨酸消旋酶也已经在若干植物中被描述，包括烟草、甜菜、番茄和小麦，并且该酶似乎被渗透压和干旱的条件诱导。色氨酸消旋酶可能在Sclerochitonilicifolius的天然monatin产生途径中发挥作用。为了分离这种消旋酶活性，从ATCC15926(或具有色氨酸消旋酶活性的另一生物)构建表达文库，并且该文库被转化进色氨酸营养缺陷型。使用D-色氨酸作为色氨酸来源的菌株被选择。相似的方法也被用于筛选带有已知消旋酶的多个菌株，以寻找对D-色氨酸具有活性的消旋酶。实例包括：丙氨酸、丝氨酸和谷氨酸消旋酶(T.Yoshimura和N.Esaki，“AminoAcidRacemases:FunctionsandMechanisms”，JournalofBioscienceandBioengineering，第96卷，No.2,103-109,2003)。丙氨酸消旋酶是PLP依赖性的，并且已经从鼠伤寒沙门氏菌(Salmonellatyphimurium)中被克隆出来(dadB基因)。其它来源是大肠杆菌、枯草芽孢杆菌、铜绿假单胞菌、霍乱弧菌、粟酒裂殖酵母和蜡状芽孢杆菌。担子菌类(basidiomycetous)的蘑菇、香菇(Lentinusedodes)也含有宽活性的丙氨酸消旋酶。丝氨酸消旋酶也是PLP依赖性的，并且在真核生物(如蚕、大鼠脑、小鼠脑cDNA)及细菌(鹑鸡肠球菌(Enterococcusgallinarum))中被发现。谷氨酸消旋酶不是PLP依赖性的，并且已经从戊糖片球菌、短小芽孢杆菌、发酵乳杆菌、短乳杆菌、大肠杆菌、嗜火产液菌和枯草芽孢杆菌中克隆。谷氨酸消旋酶非常特异，并且因此，即使结构相似的氨基酸，天冬氨酸、天冬酰胺和谷氨酰胺也不是该酶的底物。天冬氨酸消旋酶也存在并且是不依赖PLP的。这些酶在乳酸杆菌、链球菌菌株和一些古细菌如除硫球菌和超嗜热古菌菌株中被找到。双壳类软体动物魁蚶也含有天冬氨酸消旋酶。文献中找到的其它消旋酶包括来自鱼腥藻某种(Anabaenasp.)和沟槽假单胞菌的氨基酸消旋酶(EC5.1.1.10)，脯氨酸消旋酶，多功能苯丙氨酸消旋酶。相关的差向异构酶或消旋酶也被测试。潜在的消旋酶被测试以确保它们不是D-色氨酸氨基转移酶。筛选通过序列分析和/或酶测定完成。

通过消旋酶测试的酶按实施例17所述被筛选其对monatin的活性。理想地，能够获得对色氨酸非常特异并且对monatin具有很小或没有消旋酶活性的酶。

色氨酸消旋酶也可能从已有的消旋酶、转氨酶或差向异构酶进化和/或改进而来(通过诱变或重组工程化)。此外，因为丙氨酸氨基转移酶的晶体结构已知，这些可被用作合理的、基于结构的诱变的基础。上述方法被用作色氨酸消旋酶活性的初始选择并被用作对改进的活性的筛选。

色氨酸消旋酶文库

文库的构建

伯克霍尔德菌(Burkholderiapyrrocina)(ATCC15958)和绿针假单胞菌(Pseudomonaschlororaphis)(ATCC15926)从美国典型培养物保藏中心(AmericanTypeCultureCollection)获得。它们按照ATCC的推荐方法培养，并且根据MekalanosJJ.(DuplicationandamplificationoftoxingenesinVibriocholerae，Cell.1983.35:253-63)的方法制备基因组DNA。基因组DNA使用Sau3AI限制性酶部分消化。1-3Kbp的片段使用QIAquick凝胶提取试剂盒(Qiagen,Valencia,CA)凝胶纯化。纯化的DNA被连接到已经用BamHI消化并按上述纯化的pTrc99a(Amersham,Piscataway,NJ)中。连接使用3:1摩尔比的插入片段:载体，在室温下温育过夜进行。连接的文库被转化进TOP10F’化学感受态细胞中(Invitrogen,Carlsbad,CA)，并在含有100μg/ml的LB培养基上铺平板。转化平板温育过夜后，菌落被从平板上刮去，用液体LB培养基清洗，并且使用QiagenQIAquick小量制备试剂盒(Qiagen,Valencia,CA)小量制备合适大小的细胞小球(pellet)。大约30,000个菌落被合并及小量制备。

合并的质粒被转化进CAG18455(trpC83::Tn10,rph-1)或CAG18579(trpC::Tn10kan,rph-1)。两个菌株都是色氨酸营养缺陷型，因此它们在M9基本培养基(Difco)上不生长，除非用色氨酸补充该培养基。转化体在D-色氨酸补充的M9基本培养基上被铺平板。这选择了可以转化D-色氨酸为L-色氨酸的菌株。

文库转化之前，菌株被测试在含有L-或D-色氨酸的基本培养基上生长。菌株被测试在D-色氨酸补充的基本培养基上的生长并且没有观察到生长。两个菌株都在补充有L-色氨酸替代D-色氨酸的相同培养基上生长。此外，NRRL12264(除了其它染色体编码的突变(serB、ΔtrpED、tnaA2、aroP)，所用的菌株已被色氨酸操纵子质粒治愈，被λDE3溶原化，并被删除lipA(该菌株不能在D-色氨酸补充的基本培养基中生长，但在L-色氨酸取代D-色氨酸补充的相同基本培养基中生长)的衍生物用从枯草芽孢杆菌获得的D-特异性氨基转移酶转化(WO03/091396)。D-氨基转移酶的表达由T7启动子促进。转化的菌株能够在D-色氨酸补充的M9基本培养基上生长。

筛选在D-色氨酸培养基上生长的菌落。质粒被分离并重转化进亲代菌株(CAG18455或CAG18579)，以证实在D-色氨酸培养基上的生长依赖于质粒而不是宿主突变。补充色氨酸营养缺陷型的质粒的核苷酸序列被分析。经确定包含色氨酸消旋酶基因的克隆被进一步分析。

来自其它组织来源的色氨酸消旋酶以相似地方式被分离。有文献报道了在烟草组织培养细胞(NicotianatabacumL.var.Wisconsin38)(Miura,G.A.和Mills,S.E.，TheconversionofD-tryptophantoL-tryptophanincellculturesoftobacco，PlantPhysiol.1971.47:483-487)和小麦(Triticumaestivum)粗蛋白提取物(Rekoslavskaya,N.I.,Yur’eve,O.V.,Shibanova,L.A.,和Salyaev,R.K.，SynthesisandphysiologicalfunctionofD-tryptophanduringwheatgermination，RussianJ.PlantPhysiol.1997.44:196-203)中色氨酸醛缩酶活性。cDNA表达文库按照文献描述从组织中制备，并且该表达文库被用于按上文所述转化色氨酸营养缺陷型。

色氨酸消旋酶测定

被鉴定为潜在地具有色氨酸消旋酶的克隆被转化进通常用于表达重组蛋白的大肠杆菌菌株，如BL21。细胞在LB培养液中生长到在600nm的光密度为0.4-0.6。启动子促进的消旋酶的表达用IPTG(0.1mM终浓度)诱导。诱导后，细胞被允许在37℃(通气)表达蛋白1-3小时。收集细胞并通过弗氏压碎器(Frenchpress)、声波或通过化学方式(如BugBuster(Novagen,Madison,WI))裂解。离心裂解的细胞以除去细胞碎片。澄清的提取物被直接用于测定。

各种量的提取物被加入溶液，以便终浓度为50mM磷酸钾(pH7.0)和2mML-色氨酸。5′-磷酸吡哆醛以10μM的终浓度被加入。样品被温育并随后由LC/MS分析。当仅使用L-色氨酸作为底物时，D-色氨酸峰的出现表明阳性结果。D-色氨酸浓度应该随时间的增加而增加直到达到平衡，并且速率也应该随蛋白浓度增加直到酶浓度足够高，它不再被底物饱和。D-色氨酸也可如上述被转化为L-色氨酸。

补充的基因可编码D-氨基转移酶(“补充的基因”是当被表达时，使生物体中变异突变的基因)。例如，如果生物体在细胞需要以合成色氨酸的基因之一中具有无效突变，那么补充的基因可以是当被表达时，允许菌株在基本培养基(即没有色氨酸)上生长的基因。该反应要求α-酮酸，如α-酮戊二酸、草酰乙酸或丙酮酸作为氨基受体。这些化合物可能存在于细胞提取物中(小量)。这些化合物可使用PD-10脱盐柱(GEHealthcare,Piscataway,NJ)除去，并且测定仍可以在粗提物中进行。色氨酸消旋酶活性使用常规的柱色谱纯化。最后，鉴定为潜在的色氨酸消旋酶的开放阅读框被克隆进带有亲和标记的表达载体。潜在的色氨酸消旋酶随后通过亲和色谱被纯化。在任一情况下，纯化的蛋白被用在基本上如上文所述的酶测定中。

色氨酸消旋酶的反向遗传工程

色氨酸消旋酶可通过常规的蛋白纯化技术包括硫酸铵分馏和常规的柱色谱而从植物或微生物来源中纯化。一旦蛋白被纯化，以至于可以在2-D凝胶上分离出一个斑点，肽微测序技术或常规的Edman型氨基酸测序被使用(用于这类工作的方案和仪器的描述参见golgi.harvard.edu/microchem/)。但是，在一些情况下，生物体的基因组序列不能被用作蛋白纯化的蛋白来源，因为这些序列还没有被确定。在那种情况下，可以基于从该蛋白的最密切的已知亲缘序列可获得的序列，设计出第一组简并引物。简并PCR和基因组步移随后根据已经建立的方案进行，以分离色氨酸消旋酶编码序列。

色氨酸消旋酶monatin产生

每1mL反应混合物中加入以下试剂：约60μg睾丸酮丛毛单胞菌ProA醛缩酶(以细胞提取物的形式提供，如WO03/091396A2所述)，100μL/mL的色氨酸消旋酶细胞提取物或1mg/mL纯化的色氨酸消旋酶，4mMMgCl₂，50mML-色氨酸，0.5mgBioCatalyticsD-氨基转移酶(AT-103)(BioCatalytics,Pasadena,CA)，100mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，0.05mMPLP，和10mMα-酮戊二酸。因为丙酮酸对宽特异性的D-氨基转移酶是可接受的氨基受体，α-酮戊二酸是任选的。实验一式两份进行，带有不加入醛缩酶或不加入色氨酸消旋酶的阴性对照。样品在轻微摇动下于30℃温育约1小时或过夜(20小时)。

测试色氨酸消旋酶对monatin的活性。与实施例17中相似的测定使用monatin作为底物，并且与酶对色氨酸的活性进行比较。理想的酶对色氨酸具有活性，但是对其它氨基酸，特别是谷氨酸和monatin只有很小或没有活性。如果酶对monatin有明显的活性，该酶可被诱变以降低其对monatin和/或谷氨酸的活性，同时保持色氨酸活性不变或在足够高的水平以使该酶可被用于monatin的生产。可被用于诱变的技术包括但不限于易错PCR、位点定向诱变、建模以鉴定位点定向诱变目标(可能涉及底物结合的位点)，诱变菌株的通道(passagethroughmutagenicstrains)和DNA改组。

可使用上述平板测定方法筛选诱变的消旋酶的色氨酸活性。随后筛选保持色氨酸活性的克隆对monatin的活性丧失。

实施例16

HEXAspC的位点定向诱变

实验概述

与WO03/091396A2的实施例6中所述的用于S,Smonatin生产的AspC相比，大肠杆菌AspC的六突变体(hexamutant)(HEXaspC)被发现具有更高的活性。HEX(登录号：/AHFAgi:127190)包含以下来自AspC(大肠杆菌编号)的突变：V35L、K37Y、T43I、N64L、T104S和N285S。基于结构分析和文献报道(S.Rothman和J.Kirsch,J.Mol.Biol.(2003),327,593-608；S.Rothman等，ProteinScience(2004),13:763-772)，产生另外5种突变体，其被预期提高对monatin生产途径中使用的底物：L-色氨酸、S-MP或两者的动力学活性。其中两个突变体提高色氨酸和S,Smonatin两者的转氨基速率。突变体中的两种对S,Smonatin的形成显示了提高的立体选择性，而一种立体选择性较差。基于此，预期来自芽孢杆菌属某种、具有相似突变的宽特异性D-氨基转移酶可作为D-氨基转移酶用在图3所示和实施例15所述的R,Rmonatin途径中。突变体中的一种(HEXaspCP9T/R122G)对L-色氨酸转氨基作用具有提高的活性，但是在S,Smonatin生产或S,Smonatin转氨基作用中的活性明显降低。因此，预期该酶可被用在图1、2、4、5、6、7和8所示及实施例18和19所述的R,Rmonatin生产途径的第一步中。通常地，具有与AspC对L-色氨酸相似活性和对R-MP及S-MP有限活性的氨基转移酶可被用在图1、2、4、5、6、7和8所示的方法中。

方法和材料

克隆进pUC19的HEX基因由J.F.Kirsch教授(加州大学伯克利分校，细胞与分子生物学系,Berkeley,CA94720-3206)提供，并被用作将该基因克隆入pET23a的模板。参见JamesJ.Onuffer和JackF.Kirsch，RedesignofthesubstratespecificityofEscherichiacoliaspartateaminotransferasetothatofEscherichiacolityrosineaminotransferasebyhomologymodelingandsite-directedmutagenesis，ProteinScience，4:1750-1757(1995)。也参见NCBI登录号1AHF_AGI:1127190(HEX氨基酸序列)。设计以下引物，以将HEX基因克隆入pET23a载体(Novagen,Madison,WI)：

HEXaspC引物：

N端：5′-GCGGAACATATGTTTGAGAACATTACCGCC-3′(SEQIDNO:393)；

C段：5′-ATAACCGGATCCTTACAGCACTGCCACAATCG-3′(SEQIDNO:394)

以下PCR方案被用于基因扩增：在100μL反应中加入50ngDNA模板，1.0μM每种引物，0.2mM每种dNTP，1UPfuTurbo聚合酶(Stratagene,LaJolla,CA)，和1×克隆(Cloned)Pfu缓冲液。热循环仪程序使用94℃热启动5分钟；接着是25个循环：在94℃(30秒)的变性步骤，在55℃(1分钟)的退火步骤，和在72℃(2分钟)的延伸步骤；以及最后在72℃(7分钟)的终止步骤。标准的分子生物学技术被用于使用NdeI和BamHI限制性位点将PCR产物克隆入pET23a。

在130位的色氨酸残基被认为对吡哆醛环(pyridoxylring)的堆叠相互作用(stackinginteraction)重要，但是也似乎是S-monatin前体(MP)底物位阻的来源，这基于蛋白建模的观察。因此，带有较小疏水侧链的氨基酸(苯丙氨酸)被用于代替色氨酸。剩余的突变基于文献中的动力学数据，尽管产生了期望突变的新组合。HEXaspC的所有突变，除了W130F，使用StratageneMulti-Change试剂盒(Stratagene,LaJolla,CA)按照制造商的说明制备。W130F突变使用StratageneQuikChange试剂盒(Stratagene,LaJolla,CA)根据制造商的说明制备，唯一的例外是PCR反应的延伸温度被降低到66℃。用于多变试剂盒(multi-changekit)的引物使用www.stratagene.com上的QuikChange多变试剂盒引物设计工具设计，除了W130F单突变引物。

引物序列被列于下表20

表20

^a表示通过5′磷酸化修饰的引物

HEXaspC突变体基因的表达和酶活性分析

Novagen过夜Express^TM自诱导系统2(OvernightExpress^TMAutoinductionSystem2)(Catalog#71366-3；溶液1-6)(Novagen,Madison,WI)的液体培养基(5mL)用以下菌株的新鲜平板或冷冻甘油储备接种：

E.coliBL21(DE3)::HEXaspCpET23a

E.coliBL21(DE3)::HEXaspCW130FpET23a

E.coliBL21(DE3)::HEXaspCT156ApET23a

E.coliBL21(DE3)::HEXaspCP9T/T156ApET23a

E.coliBL21(DE3)::HEXaspCP9T/R122GpET23a

E.coliBL21(DE3)::HEXaspCR122G/T156ApET23a。

培养物在230rpm，37℃下温育6-8小时。确定每种培养物的OD₆₀₀，并且计算出在25mL中获得0.03-0.05的OD₆₀₀所必需的培养物的体积。每种液态培养物的计算体积被转移到含有25mL相同培养基的烧瓶中。过夜Express^TM自诱导系统2(OvernightExpress^TMAutoinductionSystem2)是用于IPTG可诱导的表达系统高水平表达的完全的、化学成分确定的培养基，其使用乳糖作为诱导剂并且不需要监测细胞生长。过夜表达培养物在230rpm摇动下于30℃温育18小时。细胞通过离心收集，并用冷的50mMMOPSpH7.0洗涤一次。细胞随后使用含有1μL/mLbenzonase核酸酶(Novagen目录号70746-3)(Novagen,Madison,WI)，5μL/mL蛋白酶抑制剂混合物II组(Novagen目录号539132)(Novagen,Madison,WI)和0.33μL/10mLr-溶菌酶(Novagen目录号71110-3)(Novagen,Madison,WI)的Bugbuster^TM(不含伯胺)提取试剂(Novagen目录号70923-3)(Novagen,Madison,WI)，根据Novagen推荐的方案裂解。轻微摇动下于25℃温育15分钟后，每份悬液中的细胞碎片通过在4℃，21,000g离心15分钟沉淀。小心地滗去上清液，并作为无细胞提取物分析。如下分离包涵体部分：将细胞碎片部分悬浮在30％的Bugbuster^TM(不含伯胺)提取试剂中，在21,000×g离心10分钟；将离心的沉淀悬浮在10％Bugbuster^TM(不含伯胺)提取试剂中，再次离心以分离被洗涤的沉淀。通过在4-15％的梯度凝胶(BioRad#161-1104,Hercules,CA)上SDS-PAGE，分析不含细胞的提取物和包涵体部分的蛋白表达。对于细胞提取物样品，20微克可溶性蛋白被点样到每个凝胶泳道(与1×蛋白加样缓冲液预混合并在95℃加热5分钟)。包涵体部分被溶解在1×蛋白加样缓冲液(0.2mL)中，在95℃加热10分钟，并且5μL每种溶液被加样到每条凝胶泳道。与加样到每条泳道的总可溶性蛋白相比，每种HEX突变体的量使用LabworksBioImaging1D-凝胶工具(UVP,Inc.Upland,CA)通过条带强度分析被计算出来，并报告在下表中：

表21

凝胶分析显示，HEXaspCR122A/T156A突变体是作为包涵体大量被发现的唯一蛋白。HEXaspCP9T/T156A蛋白产生了最高水平的表达，比HEXaspC蛋白高达约90％。相反，W130F、T156A和P9T/R122G蛋白以比HEXaspC低的浓度表达。

HEXaspC突变体蛋白对S,S-monatin生产的活性使用以下反应条件测量：每1mL反应含有50mMTAPSpH8.2，4mMMgCl₂，3mM磷酸钠pH8.0，200mM丙酮酸钠(pH调整到8)，5mMα-酮戊二酸(pH调整到8)，50mM色氨酸，0.05mM3-磷酸吡哆醛，50μg/mLProA醛缩酶(作为不含细胞的提取物加入)和各种浓度(大约50和500μg/mL)的氨基转移酶(作为不含细胞的提取物加入)。除气水被用于制备储备液以及调整反应混合物的体积到1.0mL。加入酶之前加入磷酸吡哆醛。反应试管在轻微摇动条件下在30℃温育4小时。样品(0.01mL)在加入酶后的1、2和4小时被取出，过滤并由LC/MS/MS分析，如实施例1所述。Monatin的生产基于反应中存在的氨基转移酶的量被标准化。在这些测定的条件下，HEXaspC和HEXaspCT156A每毫克氨基转移酶产生了最多的总monatin，而P9T/R122G蛋白产生的最少，接着是HEXaspCW130F。HEXaspCW130F和P9T/R122G酶对S-MP显示出最大的立体选择性(大于98％的S,S-monatin)，甚至当使用高的酶浓度时(高于300μg/mL)。在含有高浓度P9T/T156A酶的酶反应中，S,S-monatin产物的百分比降低到小于90％。其它突变体显示了与原始HEXaspC突变体非常相似的产物立体选择性(约95％的S,S-monatin)。使用实施例1所述的FDAA衍生试剂对含有HEXaspC酶的反应产物的分析显示，形成的第二种立体异构体是R,S-monatin。

色氨酸和monatin氨基转移酶活性的测定

使用S,Smonatin和L-色氨酸作为底物测试突变体的转氨基作用活性。在反应副产物谷氨酸的形成后，通过HPLC和实施例1所述OPA后柱衍生方法测量氨基转移酶活性。1.0mL反应混合物中含有100mMHEPPS缓冲液pH8.0，20mMα-酮戊二酸，0.08mM磷酸吡哆醛，25mM色氨酸或S,Smonatin，以及酶(以2.5mg细胞提取物蛋白的形式提供)。除了酶，所有的组分被混合在一起，酶被加入以起始反应，并且该反应溶液在30℃(轻微摇动)温育90分钟。反应一式两份进行，以没有加入酶的反应为阴性对照。该反应通过加入10％的甲酸(终浓度)停止，混合物在21,000rpm离心，并且上清液被小心地除去并过滤。数据针对谷氨酸的背景水平并针对由酸加入沉淀蛋白引起的稀释进行校正，随后通过加入的氨基转移酶突变体的量被标准化。当使用色氨酸作为底物时，HEXaspC每小时每毫克氨基转移酶产生13.0mM谷氨酸。突变体的相对活性，以百分比表达如下：HEXaspCW130F(156％)、HEXaspCT156A(151％)、HEXaspCP9T/T156A(63.7％)、HEXaspCP9T/R122G(116％)和HEXaspCR122G/T156A(107％)。当S,Smonatin被用作底物时，HEXaspC每小时每毫克氨基转移酶产生7.43mM谷氨酸。突变体的相对活性，以百分比表达如下：HEXaspCW130F(113％)、HEXaspCT156A(87.7％)、HEXaspCP9T/T156A(67.3％)、HEXaspCP9T/R122G(11.2％)和HEXaspCR122G/T156A(114％)。

HEXaspCP9T/R122G突变体提高色氨酸转化为吲哚-3-丙酮酸的活性，但对S,Smonatin转氨基作用降低活性。与其与HEXaspC的1.75相比，色氨酸与monatin活性的比例是18.2，这使其成为使用需要L-氨基转移酶的途径生产R,Rmonatin的理想候选，所述L-氨基转移酶如实施例18和19所述的那些。同样地，HEXaspCP9T/R122G是对S,Smonatin(和MP)具有有限活性的氨基转移酶的实例。

大多数突变提高L-色氨酸活性，但是仅两种突变体增加对L-色氨酸和S,Smonatin两者的活性(HEXaspCW130F和HEXaspCR122G/T156A)。因为在这些测定中使用了25mM的底物，酶极其有可能被饱和并且活性是酶的k_cat的反应。然而，在对S,Smonatin生产进行测定的条件下(上文)，S-MP的浓度不可能足以饱和该酶，因此k_cat的增加没有被反应。据报道，对于相似的底物，制备的突变中的一些提高k_cat，但是也提高对氨基酸底物的表观K_m。如果使用提高浓度的底物，预期这两种变异体与HEXaspC相比将在S,Smonatin的生产速率方面提供益处。在上述用于S,Smonatin生产的条件下，HEXaspCT156A突变似乎具有提高的色氨酸转氨基作用的速率，而对MP转氨基作用的速率没有显著影响。

通过HEXaspC和芽孢杆菌属某种的D-氨基转移酶的一种的结构比较(参见，例如S.Sugio,G.A.Petsko,J.M.Manning,K.Soda和D.Ringe,Biochemistry34(1995)pp.9661-9669)，AspC的W130F、R122G、T156A和HEX突变可以被绘制于D-氨基转移酶结构中的相应残基。预期宽特异性D-氨基转移酶中的相似突变将提高如实施例14中所述的R,Rmonatin的总产生。例如，由AspC中色氨酸130提供的功能性在芽孢杆菌D-氨基转移酶中由丝氨酸179-181和谷氨酸166(YM-1编号方法)侧链之间的氢键替代。为了减小位阻，谷氨酸可以被突变成天冬氨酸残基。一些D-氨基转移酶在179位置具有苏氨酸残基，其增大位阻并应该被避免。球形芽孢杆菌酶在181位用丙氨酸代替丝氨酸，其可能也减小位阻。

来自天冬氨酸氨基转移酶研究的其它信息也可以被应用于D-氨基转移酶。AspC酶在与二羧酸(dicarboxylate)底物的侧链相互作用的活性位点具有精氨酸，D-氨基转移酶具有Ser240到Ser243的环。Ser240、Thr242和Ser243的侧链面向相同的方向并与Ser180的羟基基团形成口袋，Ser180提供了非极性和极性底物可以相互作用的表面。Ser180被包含在PLP结合中；但是要提高D-氨基转移酶对R-MP的活性，可以修饰Ser240、Thr242或Ser243残基以接受更大的底物或偏爱带负电荷的底物。例如，Thr242可以被突变为Ser，以减小侧链的长度。残基之一可以被突变为赖氨酸或精氨酸，如Ser243。残基(YM-1编号)Val30-Val36位于贯穿D-氨基转移酶活性位点的β链，并且对活性也是重要的。Tyr31、Val33、Glu32和Lys35被认为朝向活性位点。Tyr31、Glu32和Val33在所有芽孢杆菌同系物中是不变的。Ro等(FEBSLett398(1996)pp.141-145)将Val33诱变为Ala并发现对α-酮戊二酸转氨基作用具有稍微提高的催化效率和对较大的底物(较小位阻)具有明显提高的催化效率。在一些同系物中，Lys35被Arg替代，但是如果关心位阻，Lys残基是优选的。也由于对大分子如MP具有较小的位阻，缬氨酸34和36对保守替代如异亮氨酸也是优选的。

实施例17

谷氨酸和天冬氨酸消旋酶的克隆、表达及测试

本实施例描述了用于克隆并测试可被用于L-谷氨酸和D-谷氨酸(或L-和D-天冬氨酸或L-和D-丙氨酸)之间相互转化的氨基酸消旋酶的方法。当该生物合成途径中的一个步骤产生L-氨基酸(如L-谷氨酸、L-天冬氨酸或L-丙氨酸)并且该途径另一步骤消耗D-氨基酸(如D-谷氨酸、D-天冬氨酸或D-丙氨酸)时，谷氨酸、天冬氨酸或丙氨酸消旋酶被用在该生物合成途径中以产生monatin。图4显示了使用L-色氨酸特异性氨基转移酶、R-特异性醛缩酶、D-氨基转移酶和谷氨酸(或天冬氨酸或丙氨酸)消旋酶从L-色氨酸生产R,Rmonatin的生物合成途径。

基因被克隆进pET28和pET30载体，以产生无标记蛋白和带有可切割的N端HIS₆-标记/T7-标记的融合蛋白。产生的蛋白使用固定化的金属亲和色谱纯化。

实验概述

编码来自短乳杆菌(Genbank登录号D29627，核酸序列)和戊糖片球菌(murI基因)(Genbank登录号L22789)的谷氨酸消旋酶(EC5.1.1.3)的基因在大肠杆菌中被克隆并表达。测试提取物在L-谷氨酸向D-谷氨酸的转化和D-谷氨酸向L-谷氨酸转化中的活性。也测试BioCatalytics天冬氨酸消旋酶(EC5.1.1.13)(BioCatalytics,Pasadena,CA)在L-和D-天冬氨酸之间相互转化中的活性。

用于克隆的基因组DNA的分离

短乳杆菌基因组DNA(ATCC8287D)从美国典型培养物保藏中心(AmericanTypeCultureCollection)获得。戊糖片球菌(ATCC25745)生长在37℃乳酸杆菌MRS培养液中，并且2ml被用于使用MekalanosJJ.DuplicationandamplificationoftoxingenesinVibriocholerae，Cell.1983.35:253-63的方法分离基因组DNA。

聚合酶链反应方案

引物被设计为带有5′限制性位点和突出端，用于克隆进pET28和pET30载体(Novagen,Madison,WI)。

短乳杆菌谷氨酸消旋酶引物：

N端：5′-GCGGCGCCATGGAAAATGATCCGATTGGTCTAATG-3′(SEQIDNO:401)，和

C端：5′-GCGGCGGTCGACGCAATTACAATTGTGTTTGTC-3′(SEQIDNO:402)。

戊糖片球菌谷氨酸消旋酶引物：

N端：5′-GCGGCGCCATGGATGTATGTATAATTTTATTTAG-3′(SEQIDNO:403)，和

C端：5′-GCGGCGGTCGACAAATTTCATTATTCATTCTAATTT-3′(SEQIDNO:404)。

由短乳杆菌衍生的基因使用以下PCR方案被扩增。在50μL反应中，使用0.150μg模板，1.6μM每种引物，0.4mM每种dNTP，2.8UExpand高保真度(ExpandHighFidelity^TM)聚合酶(Roche,Indianapolis,IN)，0.5UPfu聚合酶(Stratagene,LaJolla,CA)和含有Mg的1×Expand^TM缓冲液。使用的热循环仪程序包括96℃热启动3分钟，以下步骤的8次重复：94℃30秒，52℃45秒和72℃2分钟；接着是以下步骤的22次重复：94℃30秒，60℃45秒和72℃2分钟。22次重复之后，样品被保持在72℃7分钟并然后储存在4℃。该PCR方案产生约830bp的产物，其大小通过与DNA尺寸标记比较而判定。

从戊糖片球菌衍生的基因使用以下PCR步骤被扩增。在50μL反应中，加入0.15μg模板，1.6μM每种引物，0.4mM每种dNTP，2.8UExpand高保真度(ExpandHighFidelity^TM)聚合酶，0.5UPfu聚合酶和含有Mg的1×Expand^TM缓冲液。使用的热循环仪程序包括96℃热启动3分钟，以下步骤的8次重复：94℃30秒，37℃45秒和72℃2分钟；接着是以下步骤的8次重复：94℃30秒，45℃45秒和72℃2分钟；接着是以下步骤的14次重复：94℃30秒，55℃45秒和72℃2分钟。14次重复之后，样品被保持在72℃7分钟并然后储存在4℃。该PCR方案产生约840bp的产物，其大小通过与DNA尺寸标记比较而判定。

克隆

PCR产物使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％的TAE-琼脂糖凝胶中被提纯。PCR产物使用SmartSpec3000^TM分光光度计定量。该产物使用限制性酶NcoI和SalI按照制造商推荐的方案(NewEnglandBiolabs,Beverly,MA)被消化，使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％的TAE-琼脂糖凝胶经凝胶纯化。载体pET28和pET30如下制备：用限制性酶NcoI和SalI消化，接着用虾碱性磷酸酶处理，并用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％的TAE-琼脂糖凝胶中纯化。

消化的载体和插入片段使用Rapid^TMDNA连接试剂盒(Rapid^TMDNALigationKit)(Roche,Indianapolis,IN)连接。大约50ng处理的插入片段，100ng处理的载体(插入片段与载体以3比1的摩尔比)，5U的T4DNA连接酶和1×连接酶缓冲液在室温下被温育5分钟。连接反应物使用高纯PCR产物纯化试剂盒(HighPurePCRProductPurificationKit)(Roche,Indianapolis,IN)纯化，并被用于转化大肠杆菌DH10B电感受态细胞(Invitrogen,Carlsbad,CA)。10μl每种连接反应被加入到40μl的DH10B细胞中，并使用Bio-Rad基因脉冲发生器II(Bio-RadGenePulserII)(Bio-Rad,Hercules,CA)，在以下条件下：2.5kV，25μF，200ohm，在0.2cm小槽中电穿孔而转化。细胞被允许在1mL室温SOC中伴随225rpm的摇动于37℃下回收1小时。细胞在含有卡那霉素(50μg/mL)的LB平板上被铺平板。

质粒DNA使用Qiagen离心小量制备试剂盒(spinminiprepkit)(Qiagen,Valencia,CA)从产生的转化体中纯化，并通过用NcoI和SalI限制性消化来筛选正确的插入片段。好像具有正确插入片段的质粒的序列通过双脱氧链终止DNA测序证实。

基因表达和测试

通过序列分析证实的质粒DNA被亚克隆进大肠杆菌表达宿主BL21(DE3)(Novagen,Madison,WI)。培养物生长。质粒使用Qiagen小量制备试剂盒(Qiagen,Valencia,CA)分离，并通过限制性消化分析以证实其身份。

BL21(DE3)的诱导初始采用短乳杆菌和戊糖片球菌谷氨酸消旋酶在pET28(无标记)和pET30(组氨酸标记)载体中进行。时程(timecourse)研究用这样的培养物进行，该培养物在250mL含有卡那霉素(50mg/L)的LB中生长到OD₆₀₀值为0.5-0.6，用100mMIPTG(异丙基巯基半乳糖)诱导，并在诱导后0和3小时取样。来自600μL(0小时)和275μL(3小时)的细胞被重悬浮在40μL含有2-巯基乙醇的十二烷基磺酸钠缓冲液中，在95℃加热10分钟并冷却。这些总细胞蛋白样品的等分试样通过使用4-15％梯度凝胶的SDS-PAGE进行分析。

细胞提取物也从3小时的培养物中如下制备：在轻微摇动下，于室温下，将来自5mL培养物的细胞沉淀悬浮在0.625mL含有0.625μLbenzonase核酸酶和3μL蛋白酶抑制剂混合物组#3(Calbiochem-NovabiochemCorp.,SanDiego,CA)的NovagenBugBuster^TM试剂中20分钟，并在16,000×g下离心除去细胞碎片。上清液(细胞提取物)被点样在4-15％梯度凝胶上以分析细胞可溶性蛋白。

来自克隆的短乳杆菌谷氨酸消旋酶和戊糖片球菌谷氨酸消旋酶的3小时样品显示出对应于正确大小(大约31kDa)的总蛋白和可溶性蛋白。在两种载体中，短乳杆菌pET30(组氨酸标记)基因产物以比短乳杆菌pET28(无标记)基因产物以及戊糖片球菌基因产物更高的水平被过量表达，并且也比它们更可溶(20％可溶性蛋白)。戊糖片球菌基因产物在pET28和pET30载体中显示出相同的过量表达和溶解性，其比短乳杆菌pET30基因产物观察到的明显要低。

来自诱导的培养物(250mL)的细胞被离心并且用0.85％NaCl洗涤一次。细胞沉淀物以5mL/克湿细胞重量被重新悬浮在含有5μL/mL蛋白酶抑制剂混合物组#3(Calbiochem-NovabiochemCorp.,SanDiego,CA)和1μL/mLbenzonase核酸酶的BugBuster^TM(Novagen,Madison,WI)试剂中。样品在轨道式摇动器(orbitalshaker)上室温中温育20分钟。不溶性的细胞碎片通过在4℃，以16,000×g离心20分钟除去。

使用以下方案测定细胞提取物的谷氨酸消旋酶。在10mM磷酸钾(pH8.0)，0.2mMDTT和10mML-谷氨酸或D-谷氨酸中进行400μL的反应。该反应通过加入20-100μL不含细胞的提取物起始，并在室温下温育。样品等分试样按1分钟、5分钟、10分钟、20分钟和1小时的时间顺序被取出(0分钟样品作为对照反应)。2M甲酸(25μL)被加入每个40μL的样品等分试样以停止反应，并且沉淀的蛋白通过离心除去。上清液被移出并在-80℃冷冻直到它们由LC/MS/MS分析。

来自由100mMIPTG诱导(3小时)的pET30细胞提取物的测定结果显示，短乳杆菌(Genbank登录号BAA06106.1GI:468450)和戊糖片球菌(Genbank登录号AAA16761.1GI:349029)酶对两种谷氨酸异构体都具有显著的消旋酶活性水平。戊糖片球菌消旋酶(20μL细胞提取物)在用L-和D-谷氨酸中任一底物起始10-20分钟时达到L-和D-谷氨酸之间的平衡。短乳杆菌酶(20μL细胞提取物)在约20分钟内也达到平衡。

使用与上面的一个方案相似的方案，测定购自BioCatalytics,Inc.(Pasadena,CA)的部分纯化的天冬氨酸消旋酶(目录号ASPR-101)对L-天冬氨酸和D-天冬氨酸的活性。该商业酶对两种异构体都显示出消旋酶的活性。使用0.5-1mg的酶，在20-60分钟达到平衡。

使用以下方案，也测定全部三种消旋酶(短乳杆菌谷氨酸消旋酶、戊糖片球菌谷氨酸消旋酶和BioCatalytics天冬氨酸消旋酶)对S,Smonatin的活性。在10mM磷酸钾(pH8.0)，0.2mMDTT和10mMS,Smonatin中进行400μL的反应。通过加入不含细胞的提取物(短乳杆菌和戊糖片球菌)或纯化的酶(BioCatalytics天冬氨酸消旋酶)起始该反应，并在室温下温育。样品等分试样按1分钟、5分钟、10分钟、20分钟和1小时的时间顺序被取出(0分钟样品作为对照反应，无酶样品也作为对照)。2M甲酸(25μL)被加入每个40μL的样品等分试样以停止反应，并且沉淀的蛋白通过离心除去。上清液被移出并在-80℃冷冻直到它们由LC/MS/MS分析(实施例1)。没有观察到S,Smonatin浓度随时间的降低，也没有S,Rmonatin的任何增加(初始以<5％的污染副产物存在，甚至在没有酶的对照中)。因此，测定的消旋酶中都没有显示出对monatin的活性。

实施例18

使用谷氨酸或天冬氨酸消旋酶从L-色氨酸生产R,Rmonatin

本实施例描述了使用L-色氨酸(L-酪氨酸或芳香族的)氨基转移酶、ProA醛缩酶、谷氨酸或天冬氨酸消旋酶和宽特异性D-氨基酸氨基转移酶从L-色氨酸产生立体异构上富集的R,Rmonatin的方法。图5是显示该途径的图。这种产生立体异构上富集的R,Rmonatin的方法对于步骤1需要这样的酶，该酶在从monatin前体(MP)产生monatin中具有低活性。基于先前的结果，我们使用WO03/091396A2实施例1中所述的苜蓿中华根瘤菌(Sinorhizobiummeliloti)和球形红细菌(Rhodobactersphaeroides)tatA基因产物。

材料和方法

来自短乳杆菌和戊糖片球菌的谷氨酸消旋酶按照实施例17所述在大肠杆菌中生产。在一些情况下，这些酶的His₆标记形式使用His-结合900药筒(cartridge)根据制造商的方案(Novagen,Madison,WI)纯化，并使用PD-10柱(G25Sephadex,GEHealthcare,Piscataway,NJ)脱盐以除去咪唑。酶在25mM磷酸钾pH8.0中洗脱。天冬氨酸消旋酶(ASPR-101)和D-氨基转移酶(AT-103)从BioCatalytics,Inc.(Pasadena,CA)购买。苜蓿中华根瘤菌和球形红细菌酪氨酸(芳香族的)氨基转移酶按照WO03/091396A2的实施例1所述制备。睾丸酮丛毛单胞菌ProA醛缩酶按照WO03/091396A2的实施例4所述制备。总蛋白测定使用Bio-Rad蛋白测定方法(Bio-RadProteinAssay)根据制造商的方案(Hercules,CA)完成。

使用消旋酶产生的S,Smonatin量的减少

反应混合物(1mL体积，一式两份进行)含有100mM磷酸钾缓冲液(pH8)，2mMMgCl₂，0.05mM5′-磷酸吡哆醛(PLP)，200mM丙酮酸钠，5mMα-酮戊二酸钠或草酰乙酸钠，以细胞提取物形式提供的约280μg/mL苜蓿中华根瘤菌TatA，1mg/mLBioCatalyticsD-氨基转移酶(AT-103)(BioCatalytics,Pasadena,CA)，100μL/mL谷氨酸消旋酶细胞提取物或1mg/mL天冬氨酸消旋酶和以细胞提取物形式提供的约100μg/mL的ProA醛缩酶。固体色氨酸以10.2mg/ml的浓度加入。阴性对照不含有消旋酶。样品在30℃温育(在250rpm摇动下)1小时、2小时或过夜。样品被离心以除去沉淀，注射器过滤，并在储存在-80℃，之后用实施例1中所述的LC/MS/MS方法分析monatin。由于细胞提取物中存在的天然L-氨基转移酶的量，大多数样品含有>95％的S,Smonatin。然而，由于消旋酶使得L-谷氨酸对MP的转氨基作用供应不足，含有消旋酶的样品具有减少量的总monatin。没有消旋酶的情况下，在这个时间段内产生了1545-2355ppmmonatin(主要是S,S)。有消旋酶存在的情况下，仅产生了340-879ppm(短乳杆菌酶)，444-531ppm(戊糖片球菌酶)和506-1460ppmmonatin(天冬氨酸消旋酶)。这些数据表明，消旋酶在产生monatin所需的反应条件下是有活性的。要将从细胞提取物酶如天冬氨酸氨基转移酶形成的S,Smonatin减到最少，使用纯化的酶和更高的D-氨基转移酶与L-氨基转移酶比例进行了进一步的试验。

L-色氨酸向含有monatin异构体的4-R转化

使用大约54μg纯化的L-氨基转移酶(苜蓿中华根瘤菌或球形红细菌TatA)、1mg天冬氨酸氨基转移酶(BioCatalytics,Pasadena,CA)、1mgD-氨基转移酶、草酰乙酸作为氨基受体和75μg纯化的醛缩酶，重复上述实验。反应一式两份进行，有2小时的取样时间和过夜温育时间。阴性对照用苜蓿中华根瘤菌L-氨基转移酶进行，但没有消旋酶。除了基于反相色谱对R,R/S,S和S,R/R,Smonatin峰定量，每种立体异构体的百分比使用实施例1所述的FDAA衍生技术确定。结果如下：

表22

明显地，当使用苜蓿中华根瘤菌TatA作为L-色氨酸转氨基作用的酶时，消旋酶的存在提高了产生的monatin的总量。Monatin的水平在2小时测定中从平均6.4提高到16.5ppm，在过夜测定中从41提高到73ppm。此外，通过使用消旋酶，形成的R,R的百分比从约1％提高到高达58％。Monatin的S,R立体异构体——另一种强效甜味剂，是另一种主要成份，从阴性对照中的几乎0提高到31％。球形红细菌TatA比苜蓿中华根瘤菌对S-MP明显具有更高的活性，这显示出当monatin的4-R异构体是期望的产物时，具有与对MP相比对L-色氨酸具有高底物特异性的酶的重要性。在2小时的时间点具有约10％的总monatin，苜蓿中华根瘤菌TatA可以被认为对MP具有有限的活性。

该实验使用纯化的苜蓿中华根瘤菌TatA(54μg)和短乳杆菌谷氨酸消旋酶重复。当纯化的谷氨酸消旋酶被使用时，每1mL反应使用大约64μg。含有谷氨酸消旋酶的细胞提取物也被测试，并且使用1.4mg可溶性蛋白。再次使用无消旋酶的阴性对照，并且所有样品一式两份进行。结果如下：

表23

而且，明显地是，消旋酶的加入提高从L-色氨酸产生的总monatin，并且与S,Smonatin相比提高了含4R的monatin异构体的相对量。纯化的醛缩酶、消旋酶和L-氨基转移酶的使用极大地改善了控制期望立体异构体形成的能力。L-与D-氨基转移酶的比例也是操控终产物立体化学的方法。

当将实施例13中表18和19所示的结果和与上述条件相似的反应条件的结果比较时，可以看出大约7-29ppm的monatin从吲哚-3-丙酮酸形成，并且形成的R,Rmonatin的百分比约为51-90％。使用天冬氨酸消旋酶将产生的monatin的总量提高到16-78ppmmonatin，％R,R为约40-58％。此外，使用了更稳定且较便宜的原料——L-色氨酸。在实施例14中，大约73ppm的monatin以R,R:S,R约1.7:1的比例从D-色氨酸产生。4R异构体的总量大于总monatin的80％。因为R,R-monatin和S,R-monatin都是强效甜味剂(比蔗糖甜>1000倍)，富集这些异构体而不需要昂贵的D-氨基酸底物的能力是关键的。

如实施例13和14中所述，D-丙氨酸可以作为MP向monatin转氨基作用的氨基供体。在一种程度上，许多L-氨基转移酶具有利用丙酮酸作为氨基受体的能力，并产生L-丙氨酸。因为上述反应使用高浓度丙酮酸，一些丙酮酸可能被转化为L-丙氨酸。例如，在L-色氨酸转氨基作用中，如果不存在α-酮戊二酸，实施例16中所述的HexAspC酶被发现在2小时内转化10-18％的丙酮酸(50-200mM的初始浓度)为L-丙氨酸。当两种氨基受体都以高浓度(>50mM)存在时，该酶对α-酮戊二酸显示出10倍的优选。AspC(WO03/091396A2中所述)也从丙酮酸产生一些L-丙氨酸。因此，预期在上述反应中可以省略加入α-酮戊二酸或草酰乙酸，并使用丙氨酸消旋酶(EC5.1.1.1)代替谷氨酸或天冬氨酸消旋酶。丙氨酸消旋酶最先在流产布鲁氏菌(Brucellaabortus)和粪链球菌(Streptococcusfaecalis)中被发现(Marr,A.G.和Wilson,P.W.Arch.Biochem.Biophys.,49(1954)424-433及Wood,W.A.和Gunsalus,I.C.J.Biol.Chem.,190(1951)403-416)。鼠伤寒沙门氏菌(Salmonellatyphimurium)中的dadB基因被识别为丙氨酸消旋酶活性的来源，并且几百种同系物可以在基因组数据库中找到。丙氨酸消旋酶活性的其它已知来源是大肠杆菌、枯草芽孢杆菌、铜绿假单胞菌、霍乱弧菌、粟酒裂殖酵母和蜡状芽孢杆菌。担子菌类蘑菇、香菇也含有宽活性的丙氨酸消旋酶。来自嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)的热稳定同系物可以从Sigma-Aldrich(目录号A8936)(Sigma-Aldrich,St.Louis,MO)购买，并且已经被固定化用于商业应用(Inagaki,K.,Biochemistry,25:32681986)。丙氨酸消旋酶通过随机方法，如诱变PCR、诱变菌株通道或本领域普通技术人员已知的其它方法被转化为谷氨酸或天冬氨酸消旋酶。丙氨酸消旋酶更集中的进化集中在活性位点残基，包括Lys129、Met134，以及Gly283和Trp288及它们之间的残基(由嗜热脂肪芽孢杆菌编号)。

实施例19

D-苯基甘氨酸氨基转移酶(D-4-羟苯甘氨酸氨基转移酶)

如图3所示，D-苯基甘氨酸氨基转移酶被用在生产monatin的生物合成途径中。例如，D-苯基甘氨酸氨基转移酶使用L-谷氨酸作为氨基供体从R-MP产生R,Rmonatin。

由寡核苷酸引物通过PCR合成施氏假单胞菌(P.stutzeri)4D-羟苯甘氨酸氨基转移酶

本实施例描述了被用于合成4D-羟苯甘氨酸氨基转移酶的方法，该酶是一种可以被用于使用L-谷氨酸作为氨基供体转化Rmonatin前体为R,Rmonatin的立体转化性酶。

引物设计

施氏假单胞菌(Pseudomonasstutzeri)4D-羟苯甘氨酸氨基转移酶(4D-HPGAT)的公开序列(Genbank登录号AY319935，核酸序列；Genbank登录号AAQ8290，蛋白序列)被用作PCR引物设计的模板。可选地，施氏假单胞菌的4-D-羟苯甘氨酸氨基转移酶(CAD42450(蛋白)，AX467211(核苷酸))被用作序列模板。共设计了34个正向引物和35个反向引物；正向和反向引物是共享20个重叠碱基对的40聚体。此外，设计了2个外引物(outerprimer)，其带有5′限制性位点和突出端，用于克隆进pET28和pET30载体(Novagen,Madison,WI)。

施氏假单胞菌4D-HPGAT外引物：N端(带有NdeI位点)：

5′-GGCCGGCATATGTCGATCCTTAACGACTACAAACGT-3′(SEQIDNO:405)，和C端(带有XhoI位点)：

5′-GGAAGGCTCGAGTCATGATTGGTTTCCAGACAAATT-3′(SEQIDNO:406)。

聚合酶链反应方案

来自施氏假单胞菌的基因序列使用以下方案被扩增。第一轮100μLPCR反应包括0.05μM的每一种内部69种引物，0.4mM每种dNTP，10UrTth聚合酶XL(Roche,Indianapolis,IN)，0.625UPfu聚合酶(Stratagene,LaJolla,CA)，1XXL缓冲液和1mMMg(OAc)₂。使用的热循环仪程序包括94℃热启动3分钟；以下步骤的15次重复：94℃30秒，42℃30秒和68℃15秒；接着是以下步骤的10次重复：94℃30秒，52℃30秒和68℃30秒；接着是以下步骤的10次重复：94℃30秒，60℃30秒和68℃1分15秒。最后的10个循环后，样品被保持在68℃7分钟并随后储存在4℃。该PCR方案在0.8％TAE-琼脂糖凝胶上产生了约0.5kb的弥散产物带。

第二轮PCR反应使用第一轮PCR反应物作为模板建立。第二轮100μLPCR反应包括2.5μL第一轮PCR反应，0.5μM每种2个外引物(带有NdeI和XhoI限制性位点)，0.4mM每种dNTP，10UrTth聚合酶XL，0.625UPfu聚合酶，1XXL缓冲液和1mMMg(OAc)₂。使用的热循环仪程序包括94℃热启动3分钟；以下步骤的10次重复：94℃30秒，52℃30秒和68℃1分30秒；接着是以下步骤的15次重复：94℃30秒，60℃30秒和68℃1分30秒。15个循环后，样品被保持在68℃7分钟并随后储存在4℃。该PCR方案在0.8％TAE-琼脂糖凝胶上产生了约1.4kb的清晰产物带。

PCR产物使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％TAE-琼脂糖凝胶中被凝胶提纯。该产物被TOPO克隆并根据制造商的方案(Invitrogen,Carlsbad,CA)被转化进TOP10细胞中。质粒DNA使用Qiagen离心小量制备试剂盒(Qiagen,Valencia,CA)从产生的转化体中纯化，并通过用NdeI和XhoI限制性消化筛选正确的插入片段。似乎具有正确插入片段的质粒序列通过使用通用M13正向和M13反向引物进行双脱氧链终止DNA测序被证实。测序的10个克隆中，都具有期望序列的至少一个突变。最佳克隆具有导致氨基酸变化的单碱基对突变。该克隆的序列使用快速变化诱变方案(QuickChangeMutagenesisprotocol)根据制造商(Stratagene,LaJolla,CA)的推荐被修正。

被修正的TOPO克隆使用限制性酶NdeI和XhoI按照制造商推荐的方案(NewEnglandBiolabs,Beverly,MA)被消化，并使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％TAE-琼脂糖凝胶中被凝胶提纯。载体pET28和pET30如下制备：用限制性酶Nde1和Xho1的消化，随后用虾碱性磷酸酶处理，并使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％TAE-琼脂糖凝胶中纯化。

被消化的载体和插入片段使用NEB快速连接试剂盒(Beverly,MA)连接。大约50ng处理的插入片段，100ng处理的载体(插入片段与载体的摩尔比为3比1)，5U的T4DNA连接酶和1X连接缓冲液在室温下温育5分钟。连接混合物被转化进TOP10F’化学感受态细胞(Invitrogen,Carlsbad,CA)。该细胞被允许在0.25mL室温SOC中在225rpm摇动及37℃下回收1小时。细胞被铺平板在含有卡那霉素(50μg/mL)的LB平板上。使用Qiagen离心小量制备试剂盒(Qiagen,Valencia,CA)，从产生的转化体纯化质粒DNA，并通过用NdeI和XhoI限制性消化筛选正确的插入片段。

基因表达和测定

质粒DNA被转化进大肠杆菌表达宿主BL21(DE3)(Novagen,Madison,WI)。培养物被生长并且质粒使用Qiagen离心小量制备试剂盒(Qiagen,Valencia,CA)分离，并通过限制性消化进行分析以证实身份。

BL21(DE3)中的诱导最初使用施氏假单胞菌4D-HPG在pET28(组氨酸标记)和pET30(无标记)载体中进行。对培养物进行时程研究，该培养物在250mL含有卡那霉素(50mg/L)的LB中生长到OD₆₀₀值为0.5-0.6，用100mMIPTG(异丙基巯基半乳糖)诱导，并在诱导后0和3小时取样。来自0小时和3小时的适当体积的细胞被重悬浮在40μL含有2-巯基乙醇的十二烷基磺酸钠缓冲液中，在95℃加热10分钟并冷却。这些总细胞蛋白样品的等分试样通过使用4-15％梯度凝胶的SDS-PAGE进行分析。

细胞提取物也从3小时的培养物中如下制备：在轻微摇动下，于室温下，将来自5mL培养物的细胞沉淀悬浮在0.625mL含有0.625μLbenzonase核酸酶和3μL蛋白酶抑制剂混合物组#3(Calbiochem-NovabiochemCorp.,SanDiego,CA)的NovagenBugBuster^TM试剂(Novagen,Madison,WI)中20分钟，并在16,000×g下离心除去细胞碎片。上清液(细胞提取物)被点样在4-15％梯度凝胶上以分析细胞可溶性蛋白。当需要时，蛋白使用His-结合900药筒根据制造商的方案(Novagen,Madison,WI)被纯化，并使用PD-10柱(G25Sephadex,GEHealthcare,Piscataway,NJ)脱盐以除去咪唑。

含有D-苯基甘氨酸氨基转移酶(DPGAT)的生物体

含有立体转化性D-苯并甘氨酸氨基转移酶(也被称作D-4-羟苯甘氨酸氨基转移酶)的假单胞菌属和类似属的生物体用以下方式分离。土壤样品在含有以下培养基的培养皿上温育：(每升)15g琼脂，3.4gKH₂PO₄，3.55gNa₂HPO₄，0.2gMgSO₄·7H₂O，8mgCaCl₂·2H₂O，10mg酵母提取物，1ml1000x痕量元素溶液，1gD-苯基甘氨酸(D-4-羟苯甘氨酸)。

通过PCR测定分离物是否存在立体转化性氨基转移酶(从已知的D-苯基甘氨酸氨基转移酶设计的引物)或被进一步富集如下测定立体转化性氨基转移酶的存在：从平板分离的可以在不含琼脂的上述液态培养基中在30℃摇动的条件下生长到OD₆₀₀值约为1.0。通过离心收集细胞并用0.85％NaCl洗涤两次。10mg(湿重)样品被悬浮在1ml磷酸钾缓冲液(pH7.0)和5mMD-苯基甘氨酸(或D-4-羟苯甘氨酸)中。中和的15mM(氨基氧(aminooxy))乙酸被加入按上文所述制备的一式两份样品中。D-苯基甘氨酸(或D-4-羟基甘氨酸)的消耗通过HPLC测量。能够降解D-苯基甘氨酸(或D-4-羟苯甘氨酸)，但是在(氨基氧)乙酸存在的情况下以较低的速率降解的分离物被选择进行进一步分析。通过PCR测定分离物中立体转化性氨基转移酶的存在(从已知的D-苯基甘氨酸氨基转移酶设计的引物)。

如下证实立体转化性氨基转移酶的存在：在上述液态培养基中生长培养物，收集细胞和制备无细胞粗提物(CFE)并检测D-苯基甘氨酸氨基转移酶(或D-4-羟苯甘氨酸)酶活性。CFE被加入反应混合物，具有以下终浓度：0.1MCAPS(pH9.5)，60mML-谷氨酸(钠盐)，5mM苯甲酰甲酸酯(或4-羟基苯甲酸)和50μMPLP。逆反应通过以以下终浓度将CFE加入到反应混合物中而测量：50mM磷酸钾(pH7.0)，60mMD-苯基甘氨酸(或D-4-羟苯甘氨酸)，5mMα-酮戊二酸，50μMPLP。测定物在35℃温育并且在各时间点取出等分试样，并通过煮沸2分钟停止。利用Gil-Av,E.,Tishbee,A.,Hare,P.E.，Resolutionofunderivatizedaminoacidsbyreversedphasechromatography，J.Am.Chem.Soc.,102:5115-5117(1980)的HLPC方法或通过实施例1所述的方法(谷氨酸形成的测量)，产物被量化。

作为基于PCR方法的替换方案，立体转化性D-苯基甘氨酸氨基转移酶通过传统的蛋白纯化技术包括硫酸铵分级法和传统的柱色谱从被分离的细菌中纯化。一旦该蛋白被纯化到合理的程度，肽微测序技术或传统的Edman型氨基酸测序被使用(用于这类工作的方案和仪器的描述参见golgi.harvard.edu/microchem/)。基于从该蛋白最密切的已知亲缘序列可获得的序列，设计出简并引物。简并PCR和基因组步移随后根据已经建立的方案进行，以分离立体转化性D-苯基甘氨酸氨基转移酶编码序列。

DPGATmonatin产生

如上文(1)和(2)所述，D-羟苯甘氨酸氨基转移酶被用于无细胞蛋白粗提物或如上文(1)所述被纯化。苜蓿中华根瘤菌和球形红细菌酪氨酸(芳香族)氨基转移酶根据WO03/091396A2的实施例1所述被制备。睾丸酮丛毛单胞菌ProA醛缩酶根据WO03/091396A2中实施例4所述被制备。总蛋白测定使用Bio-Rad蛋白测定方法根据制造商的方案(Hercules,CA)完成。

反应混合物(1mL体积，一式两份进行)含有100mM磷酸钾缓冲液(pH8)，2mMMgCl₂，0.05mM5′-磷酸吡哆醛(PLP)，200mM丙酮酸钠，5mMα-酮戊二酸钠，以细胞提取物形式提供的约280μg/mL苜蓿中华根瘤菌TatA，100μL/mLD-羟苯甘氨酸氨基转移酶细胞提取物或1mg/mL纯化的D-羟苯甘氨酸氨基转移酶，和以细胞提取物形式提供的约100μg/mL的ProA醛缩酶。固态色氨酸以10.2mg/ml的浓度加入。建立不含D-羟苯甘氨酸氨基转移酶的阴性对照。样品在30℃轻微摇动条件下温育约1小时或过夜。样品被离心以除去沉淀，注射器过滤，并在用实施例1中所述的LC/MS/MS方法分析monatin之前被储存在-80℃。

带有对monatin生产提高的活性的D-羟苯甘氨酸氨基转移酶通过本领域普通技术人员已知的诱变技术制备，包括：诱变PCR、诱变菌株通道或位点定向诱变。改善的D-羟苯甘氨酸氨基转移酶使用R,R-monatin作为氮源通过在基本培养基上生长而被选择。初始地选择基于生长，但是随着改善的氨基转移酶被选出，筛选是基于生长速率的。也就是说，带有基因突变版本的细胞被生长，并且基因在用R,R-monatin作为氮源的基本培养基中被表达。带有基因突变版本的细胞的生长速率与未突变的版本比较。具有较快生长速率的细胞被选择，并且氨基转移酶被进一步分析。D-羟苯甘氨酸氨基转移酶通过可用的技术被诱变，如通过易错PCR和诱变菌株通道，或通过已经取得许可的技术，如DNA改组和其它定向进化技术。

DPGAT测定

具有重组D-羟苯甘氨酸氨基转移酶的细胞被生长，蛋白被表达，并且细胞如实施例17所述或通过标准方案裂解。使用所述的方法(Wiyakrutta,W.,Meevootisom,V.,AstereoinvertingD-phenylglycineaminotransferasefromPseudomonasstutzeriST-201:purification,characterization,andapplicationforD-phenylglycinesynthesis，J.Biotechnol.,55:193-203(1997))，在其天然宿主中表达蛋白。

无细胞提取物以以下终浓度被加入反应混合物：100mM磷酸钾(pH7.0-8.5)，60mMD-苯基甘氨酸(或D-4-羟苯甘氨酸)，5mMα-酮戊二酸，50μMPLP。测定物在室温下温育，且在各时间点取出等分试样，并且通过加入等体积甲酸终止反应。产物(L-谷氨酸)通过实施例1所述的方法被定量。

实施例20

D-蛋氨酸氨基转移酶基因的发现

背景

尽管罕见，D-蛋氨酸-丙酮酸氨基转移酶(EC2.6.1.41)被认为是立体转化性氨基转移酶的另一实例。该酶催化D-蛋氨酸和丙酮酸与L-丙氨酸和4-甲硫基-2-氧代丁酸酯的可逆转化。草酰乙酸盐(酯)、苯基丙酮酸盐(酯)、2-氧代丁酸盐(酯)、2-氧代戊酸盐(酯)、2-氧代庚酸盐(酯)、乙醛酸盐(酯)和氧化戊二酸盐(酯)也可以作为氨基受体。

D-或L-蛋氨酸的转氨基作用被认为是高等植物(花椰菜、番茄、苹果、豆茎、香蕉、花生)以及土壤微生物(大肠杆菌、豌豆假单胞菌(Pseudomonaspisi)、铜绿假单胞菌、蕈状芽孢杆菌(Bacillusmycoides)、乙酸钙不动杆菌(Acinetobactercalcoaceticus)、嗜水气单胞菌(Aeromonashydrophila)B12E、三叶草根瘤菌(Rhizobiumtrifolii)N2P7、指状青霉(Penicilliumdigitatum)、酿酒酵母(Saccharomycescerevisiae)、棒状杆菌(Corynebacterium)D7F)中乙烯产生途径的一部分。D.C.Billington,B.T.Golding和S.B.Primrose，BiochemJ.(1979)182,827-836。在细菌中，L-蛋氨酸典型地被用作乙烯产生研究中的底物，并且宽特异性酶，如来自大肠杆菌的TyrB或AspC被认为负责转氨基作用。然而，S.B.PrimroseJ.Gen.Microbiol.(1976),95(1),159-65和S.B.PrimroseJ.Gen.Microbiol.(1977),98,519-528显示，大肠杆菌菌株SPAO(UniversityofWarwick的菌种保藏中心)在分批培养中从D-蛋氨酸产生与从L-蛋氨酸几乎一样多的乙烯。因为没有宽特异性D-氨基转移酶在大肠杆菌中被鉴定出，一种可能的解释可以是大肠杆菌D-氨基酸脱氢酶(由dadA基因编码)将D-蛋氨酸转化为4-甲硫基-2-氧代丁酸盐。也可能是大肠杆菌中有蛋氨酸消旋酶；但是文献中没有描述这些酶。

与大肠杆菌相反，当D-蛋氨酸和丙酮酸被提供给酶提取物时，花椰菜小花(线粒体提取制备物)和发芽的花生种子中产生的乙烯比L-蛋氨酸和丙酮酸高(L.W.Mapson,J.F.March和D.A.WardaleBiochemJ.(1969)115,653-661；J.I.Durham,P.W.Morgan,J.M.Prescott和C.M.LymanPhytochemistry(1973)12,2123-2126)。因此蛋氨酸消旋酶和L-氨基转移酶组合的可能性不被数据支持。脱氢酶活性通过花椰菜细胞提取物的透析排除，测定混合物中没有NAD存在。由于没有观察到氧气的消耗并且不需要FAD，氧化酶活性被排除。来自花生组织的D-蛋氨酸氨基转移酶被纯化，显示为PLP依赖性，并且显示为不依赖L-蛋氨酸氨基转移酶的活性。存在这样的可能性，这些D-蛋氨酸-丙酮酸氨基转移酶实际上产生D-丙氨酸作为副产物(与实施例13和14中所述的芽孢杆菌酶类似)，并且细胞含有丙氨酸消旋酶以将D-丙氨酸循环转化回L-丙氨酸(或类似的氨基供体)。在任一情况下，从高等植物中发现宽特异性D-氨基转移酶有利于开发产生R,Rmonatin或S,Rmonatin的方法。

实验概述

来自花椰菜小花和发芽的花生胚胎的D-蛋氨酸氨基转移酶使用标准色谱方案和PharmaciaAKTAExplorer系统被部分纯化。同源蛋白的蛋白序列通过LC/MS/MS指纹技术确定，并且通过哈佛微量化学系(HarvardMicrochemistryfacility)进行数据库搜索。植物基因的编码区域使用标准PCR方案或通过实施例19所述的基因合成从cDNA文库中被克隆。

可选地，从D-蛋氨酸存在(并产生乙烯)的条件下生长的花椰菜组织或花生种子中构建cDNA表达文库(Stratagene,LaJolla,CA)。文库被转化进来自大肠杆菌遗传储备中心(E.coliGeneticStockCenter)(耶鲁大学)的大肠杆菌蛋氨酸营养缺陷型，如菌株RC519或AB1931。能够在含有D-蛋氨酸的基本培养基上生长的菌株的质粒包含感兴趣的编码区域(参见实施例15，类似的筛选技术)。

一旦获得感兴趣的编码区域并且在标准大肠杆菌实验室菌株中表达，产生的基因产物可以被用在测定中，以代替D-羟苯甘氨酸氨基转移酶按实施例19所述产生R,Rmonatin，除了pH值为7.5(对氨基转移酶的最优pH值)。如果D-蛋氨酸氨基转移酶对D-氨基酸供体底物具有严格的要求，该酶可以被用于按实施例13和14所述制备R,Rmonatin。该基因可以按实施例19所述被诱变并筛选提高的活性。方法

从花椰菜分离

400克新鲜采摘的花椰菜小花使用400mL的4℃蔗糖/缓冲溶液(0.4M蔗糖和0.1M磷酸钠缓冲液pH7.4)通过交替浸泡和使用搅拌器混合而被提取。细胞碎片通过用粗棉布(cheesecloth)过滤被除去，并且产生的溶液在4℃以40,000×g离心30分钟。固体材料(包含线粒体细胞器)被重悬浮在20mL的10mM磷酸钠缓冲液pH7.4中，并且酶用200mL冷的(-30℃)丙酮提取。悬液被离心并且沉淀使用SavantSpeedVac干燥。固体材料被溶解在10mM磷酸钠缓冲液pH7.4中，并且残留的丙酮使用PD-10柱(GEHealthcare,Piscataway,NJ)被除去。

通过用5mMD-蛋氨酸，1mM丙酮酸，0.05mMPLP和在0.1M磷酸钠缓冲液(pH7.4)中的2mMEDTA温育酶制备物，测定氨基转移酶活性。该测定在25℃进行16个小时。通过2,4-二硝基苯基腙衍生物的形成，使用LC/MS(m/z＝328)或实施例1中所述的相似技术，测量4-甲硫基-2-氧代丁酸盐。制备2,4-二硝基苯基腙在2M硫酸中的0.4％(w/v)溶液，并且在温育后将一半体积加入到测定混合物中。混合物于30℃在轻微摇动下混合30分钟，并且沉淀通过离心收集并且由LC/MS分析。由标准色谱技术分离的蛋白馏分以相似的方式测定活性，但是副产物丙氨酸通过实施例1所述的OPA后柱衍生技术来测量。

从花生(ArachiahypogeaL.cv.Starr)分离

来自发芽的花生胚胎匀浆(减去子叶)的D-蛋氨酸氨基转移酶根据J.I.Durham,P.W.Morgan,J.M.Prescott和C.M.LymanPhytochemistry(1973)12,2123-2126的方法纯化。在粗提物的制备过程中使用还原试剂以稳定酶，并且细胞碎片通过在33,000×g离心被除去。35-50％硫酸铵部分通过在低温下温育，并通过去除沉淀中的蛋白而被进一步纯化。上清液使用丙酮被进一步分馏。活性合并物随后通过凝胶过滤色谱(Sephadex200,GEHealthcare,Piscataway,NJ)被进一步纯化。

由于蛋白部分富集了转氨酶蛋白，2D-凝胶电泳被用于分离目的酶以进行微测序。在阐明NCBI中存储的植物序列中的同源编码区后，D-氨基转移酶蛋白使用标准分子生物学技术在大肠杆菌中被重组产生。预期来自花椰菜小花或花生种子的细胞提取物或重组产生的同源酶可以被用于实施例19(如果是立体转化性转氨酶)或实施例13和14(如果是宽特异性D-氨基转移酶)所述的R,Rmonatin的产生中。

实施例21

L-丙氨酸氨基转移酶/丙氨酸消旋酶/D-丙氨酸氨基转移酶

图4、6和8显示了使用L-氨基酸氨基转移酶(如L-丙氨酸氨基转移酶和/或L-色氨酸-氨基转移酶)、R-特异性醛缩酶、丙氨酸消旋酶和D-丙氨酸氨基转移酶从L-色氨酸产生立体异构上富集的R,Rmonatin的生物合成途径。

色氨酸特异性氨基转移酶在实施例16中描述。可选地，苜蓿中华根瘤菌和球形红细菌的酪氨酸(芳香族)氨基转移酶根据WO03/091396A2的实施例1中所述制备。睾丸酮丛毛单胞菌ProA醛缩酶根据WO03/091396A2的实施例4中所述制备。总蛋白测定利用Bio-Rad蛋白测定方法按照制造商的方案(Bio-Rad,Hercules,CA)完成。丙氨酸消旋酶从Sigma-Aldrich(St.Louis,MO)(目录号A8936)购买。D-丙氨酸氨基转移酶从BioCatalytics(目录号AT-103)(BioCatalytics,Pasadena,CA)购买。

L-丙氨酸氨基转移酶广泛分布于真核生物、细菌和古细菌。以下生物体被鉴定(基于序列同源性)为含有L-丙氨酸氨基转移酶(E.C.2.6.1.2)：拟南芥(Arabidopsisthaliana)、棉阿舒囊霉(Ashbyagossypii)、棕色固氮菌(Azotobactervinelandii)、长双歧杆菌(Bifidobacteriumlongum)、线虫(Caenorhabditiselegans)、白色念珠菌(Candidaalbicans)、光滑念珠菌(Candidaglabrata)、莱茵衣藻(Chlamydomonasreinhardtii)、新生隐球菌(Cryptococcusneoformans)、汉氏德巴利氏酵母(Debaryomyceshansenii)、智人(Homosapiens)、大麦(Hordeumvulgare)、乳酸克鲁维酵母(Kluyveromyceslactis)、稻瘟菌(Magnaporthegrisea)、蒺藜苜蓿(Medicagotruncatula)、小家鼠(Musmusculus)、粗糙脉孢菌(Neurosporacrassa)、水稻(Oryzasativa)、黄孢原毛平革菌(Phanerochaetechrysosporium)、火炬松(Pinustaeda)、恶臭假单胞菌(Pseudomonasputida)、Pyrococcusabyssi、强烈炙热球菌(Pyrococcusfuriosus)、极端嗜热古菌(Pyrococcushorikoshii)、褐家鼠(Rattusnorvegicus)、酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomycespombe)、红鳍东方鲀(Takifugurubripes)、克氏锥虫(Trypanosomacruzi)、霍乱弧菌(Vibriocholerae)、副溶血弧菌(Vibrioparahaemolyticus)、创伤弧菌(Vibriovulnificus)、解脂耶氏酵母(Yarrowialipolytica)和玉米(Zeamays)。其它多种氨基转移酶具有低水平的氨基转移酶活性，并且在给予高水平的L-谷氨酸和丙酮酸的情况下，可以将其转化为L-丙氨酸和α-酮戊二酸。具有低活性的酶用标准诱变技术，如易错PCR和诱变菌株通道或通过定向进化技术改善。使用公众可获得的来设计引物，并使用标准技术以扩增、克隆、表达并纯化基因/酶，L-丙氨酸氨基转移酶的基因被克隆。

反应混合物(1mL体积，一式两份进行)含有100mM磷酸钾缓冲液(pH8)，2mMMgCl₂，0.05mM5′-磷酸吡哆醛(PLP)，200mM丙酮酸钠，5mMα-酮戊二酸钠，以细胞提取物形式提供的约280μg/mL苜蓿中华根瘤菌TatA(或其他L-色氨酸特异性氨基转移酶)，100μL/mL丙氨酸消旋酶细胞提取物或1mg/mL纯化的丙氨酸消旋酶，和以细胞提取物形式提供的约100μg/mL的ProA醛缩酶。固态色氨酸以10.2mg/ml的浓度加入。建立不含丙氨酸消旋酶的阴性对照。样品在30℃轻微摇动条件下温育约1小时或过夜。样品被离心以除去沉淀，注射器过滤，并在用实施例1中所述的LC/MS/MS方法分析monatin之前被储存在-80℃。在这些反应中，如果L-色氨酸氨基转移酶可以使用α-酮戊二酸钠而非丙酮酸作为氨基受体，可以加入将L-谷氨酸和丙酮酸转化为L-丙氨酸和α-酮戊二酸钠的L-丙氨酸氨基转移酶，如图6所述。

实施例22

编码SEQIDNO:276、244、218、228、162、50、74、44和116的醛缩酶的基因的亚克隆

编码具有SEQIDNO:276、244、218、228、162、50、74、44和116的氨基酸序列的醛缩酶的基因被亚克隆进pET28b表达载体(Novagen,Madison,WI)，带有N-末端His标记以允许纯化。SEQIDNO:275是编码具有SEQIDNO:276氨基酸序列的醛缩酶的基因序列。SEQIDNO:243是编码具有SEQIDNO:244氨基酸序列的醛缩酶的基因序列。SEQIDNO:217是编码具有SEQIDNO:218氨基酸序列的醛缩酶的基因序列。SEQIDNO:227是编码具有SEQIDNO:228氨基酸序列的醛缩酶的基因序列。SEQIDNO:161是编码具有SEQIDNO:162氨基酸序列的醛缩酶的基因序列。SEQIDNO:49是编码具有SEQIDNO:50氨基酸序列的醛缩酶的基因序列。SEQIDNO:73是编码具有SEQIDNO:74氨基酸序列的醛缩酶的基因序列。SEQIDNO:43是编码具有SEQIDNO:44氨基酸序列的醛缩酶的基因序列。SEQIDNO:115是编码具有SEQIDNO:116氨基酸序列的醛缩酶的基因序列。

用于克隆的引物如表24所示。

表24

编码上述醛缩酶的基因通过PCR被扩增并用合适的酶(NdeI和BamHI)消化并凝胶提纯(凝胶提取试剂盒(Qiagen,Valencia,CA))。消化物被单独连接进已经用NdeI和BamHI消化并凝胶纯化的pET28中。连接物被转化进TOP10细胞(Invitrogen,Carlsbad,CA)。通过使用琼脂糖凝胶电泳的尺寸分析，分析来自单个克隆的微量制备DNA中插入片段的存在。带有插入片段的分离物被送交DNA测序分析(Agencourt,Beverly,MA)。

醛缩酶的纯化

确认的醛缩酶克隆被转化进BL21(DE3)或BL21(DE3)pLysS中。在Terrific培养液中30℃进行诱导过夜。用合适抗生素生长的过夜培养物用新鲜培养液稀释(典型地1:100)，并在通气条件下37℃生长到OD₆₀₀值约为0.6。培养物随后用1mMIPTG诱导并被转移到30℃(通气)，并且继续温育过夜。通过离心收集细胞。细胞沉淀物通常经受一个冻融循环以辅助细胞裂解。细胞沉淀物在BugBuster和Benzonase核酸酶(Novagen,Madison,WI)中裂解(根据制造商的方案)。细胞碎片通过离心去除。粗蛋白提取物被加到根据制造商的方案准备的His结合柱(Novagen,Madison,WI)上。该柱被洗涤并且根据制造商的方案洗脱蛋白。纯化的蛋白用PD-10柱(GEHealthcare,Piscataway,NJ)脱盐，并在含有4mMMgCl₂和200mMNaCl的50mM磷酸钾缓冲液pH7.5中被洗脱。纯化的蛋白用Amicon离心浓缩器(5000MW截止(cutoff))(Millipore,Billerica,MA)浓缩。浓缩后，注意到SEQIDNO:44、SEQIDNO:28和SEQIDNO:276的醛缩酶显示出一定水平的沉淀，尽管活性仍相当高。蛋白被储存在-80℃直到测试。

蛋白测定使用PierceBCA试剂盒(Pierce,Rockford,IL)和微量滴定板方案进行，以牛血清白蛋白(“BSA”)作为蛋白标准。ExperionPro260电泳系统(Bio-Rad,Hercules,CA)或SDS-PAGE被用于估计纯化样品中醛缩酶的百分比，并用于评估可溶性细胞提取物中和总蛋白中的表达水平。

测试纯化的醛缩酶

测试纯化的醛缩酶从D-色氨酸生产R,Rmonatin的能力，并与以相同方式制备的SEQIDNO:28和SEQIDNO:54的醛缩酶比较。测定在装有纯化蛋白的微量离心管中进行(一式两份)，每个测定使用相同的酶浓度(50μg/mL)，除了SEQIDNO:244，其使用25μg/mL。SEQIDNO:243表达不好并产生较小量的纯化蛋白。2mg/mL的BioCatalyticsAT-103(BioCatalytics,Pasadena,CA)被用作D-氨基转移酶。每1mL反应混合物中加入以下试剂：醛缩酶，4mMMgCl₂，50mMD-色氨酸，D-氨基转移酶，200mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5，和0.05mMPLP。样品在30℃温育。取30分钟、1小时、3小时和过夜(19小时)样品。表25显示了在每个时间点产生的总monatin的平均结果和产生的％R,Rmonatin，由反相峰面积确定。在表25的第3列，对一些反应进行了如实施例1所述的额外的FDAA-衍生LC/MS/MS分析，并且那些结果显示在括号中。

表25：从D-色氨酸产生的总monatin和％R,R

色氨酸(hr)	总monatin(ppm)	％R,R monatin
			SEQ ID NO:28(0.5)	16	99.1
SEQ ID NO:28(1)	53.2	99.2(99.0)
			SEQ ID NO:28(3)	207.8	98.6(98.1)
SEQ ID NO:28(19)	544.9	95.3(93.2)
			SEQ ID NO:44(0.5)	46.2	88.0
SEQ ID NO:44(1)	92.5	86.8
			SEQ ID NO:44(3)	319.7	76.4
SEQ ID NO:44(19)	762.9	67.1
			SEQ ID NO:54(0.5)	35.3	96.2
SEQ ID NO:54(1)	82.7	96.1
			SEQ ID NO:54(3)	280.1	92.9
SEQ ID NO:54(19)	715.3	77.1
			SEQ ID NO:74(0.5)	51.1	92.6
SEQ ID NO:74(1)	89.3	94.3
			SEQ ID NO:74(3)	269.5	89.9
SEQ ID NO:74(19)	701.9	76.2

色氨酸(hr)	总monatin(ppm)	％R,R monatin
			SEQ ID NO:50(0.5)	55.9	96.7
SEQ ID NO:50(1)	96.5	96.2
			SEQ ID NO:50(3)	272.2	95.6
SEQ ID NO:50(19)	645.8	88.5
			SEQ ID NO:162(0.5)	37.3	95.7
SEQ ID NO:162(1)	75.0	97.1
			SEQ ID NO:162(3)	261.0	95.9
SEQ ID NO:162(19)	633.1	87.0
			SEQ ID NO:276(0.5)	37.8	98.8
SEQ ID NO:276(1)	71.2	99.3(99.5)
			SEQ ID NO:276(3)	245.2	99.0(99.0)
SEQ ID NO:276(19)	585.4	96.7(96.1)
			SEQ ID NO:244(0.5)	30.2	97.7
SEQ ID NO:244(1)	46.4	98.3(99.2)
			SEQ ID NO:244(3)	165	98.4(98.7)
SEQ ID NO:244(19)	572.5	95.6(93.7)
			SEQ ID NO:228(0.5)	52	95.0
SEQ ID NO:228(1)	81.7	96.5
			SEQ ID NO:228(3)	251	95.9
SEQ ID NO:228(19)	723	87.1
			无醛缩酶(0.5)	0
无醛缩酶(1)	0
			无醛缩酶(3)	0.6	58.3
无醛缩酶(19)	6.5	61.5

SEQIDNO:276醛缩酶保持高水平的活性，以及对R,Rmonatin生产最高的立体特异性。该酶在省去氯化钠的缓冲液中的储存似乎降低了早先注意到的沉淀的水平。储存缓冲液中的镁浓度似乎对沉淀水平没有影响。

SEQIDNO:276、SEQIDNO:28和SEQIDNO:244的醛缩酶都显示出高活性和对R,Rmonatin生产的高立体选择性。这三种酶根据实施例23所述制备并如实施例24所述，使用10mL血清小管进行厌氧测定。7mL测定使用0.05mg/mL每种醛缩酶(纯化的)和按实施例24所述制备的2mg/mL纯化的球形芽孢杆菌D-氨基转移酶进行。每种醛缩酶在从D-色氨酸生产monatin中的活性都与按实施例27所述的苜蓿中华根瘤菌HMG醛缩酶比较。总monatin用实施例1所述的LC-OPA方法估计。形成的R,Rmonatin的百分比使用实施例1所述的FDAA衍生法确定。结果显示于下面的表26。

表26

醛缩酶	时间(hr)	Monatin(g/L)	形成的％R,R
				苜蓿中华根瘤菌	23	3.9	82.0
SEQ ID NO:28	23	4.0	84.6
				SEQ ID NO:276	23	4.0	95.7
SEQ ID NO:244	23	3.7	88.8
				苜蓿中华根瘤菌	47	4.5	76.2
SEQ ID NO:28	47	4.3	84.6
				SEQ ID NO:276	47	4.3	93.2
SEQ ID NO:244	47	4.5	85.2

这些结果显示，SEQIDNO:276的醛缩酶在较大体积厌氧反应中也产生高水平的R,Rmonatin。

实施例23

SEQIDNO:276醛缩酶的表达和纯化

携带有pET28b质粒上SEQIDNO:275所列的醛缩酶基因的大肠杆菌BL21(DE3)pLysS宿主的克隆如上文实施例22所述。

带有氨基端HIS₆纯化标记的SEQIDNO:276醛缩酶使用含有50μg/mL卡那霉素的EMDBiosciences过夜表达系统II(OvernightExpressSystemII)(Novagen,Madison,WI)(溶液1-6)在摇瓶中产生。该表达系统诱导IPTG可诱导的系统表达而不需要监测细胞生长。来自醛缩酶构建物的液态培养物或平板培养物的200mL培养基等分试样(在1L烧瓶中)接种后，培养物在30℃于225rpm摇动下温育过夜。当OD_600nm达到最小值6时，通过离心收集细胞并用缓冲液清洗1次。

为了制备含有醛缩酶的无细胞提取物，细胞被悬浮在3-4倍体积的100mM磷酸钾pH7.8溶液中，并随后使用Microfluidics均质器(Microfluidicshomogenizer)(Microfluidics,Newton,MA)(在18,000psi进行3次)破碎，保持悬浮物的温度低于15℃。可选地，无细胞提取物使用含有1μL/mL核酸酶，5μL/mL蛋白酶抑制剂混合物组II和0.033μL/mLrLysozyme^TM的EMDBiosciences(不含伯胺)提取试剂(Novagen,Madison,WI)，按照制造商的方案制备。所有后续纯化步骤在4℃进行。细胞悬液在15,000-20,000×g被离心20-30分钟以除去细胞碎片。20-25mL无细胞提取物等分试样被应用于45mL的GEHealthcareChelatingSepharose^TMFastFlow树脂柱(镍(II)型)(GEHealthcare,Piscataway,NJ)，该柱提前用含有200mM氯化钠的100mM磷酸钾平衡。为了产生镍形式的树脂，该树脂用150mL的200mM六水合硫酸镍(II)洗涤并随后用150mL蒸馏水洗涤。加样后，该柱用150mL含有25mM咪唑的平衡缓冲液，150mL含有50mM咪唑的平衡缓冲液和150mL含有500mM咪唑的平衡缓冲液洗涤/洗脱。HIS₆标记的蛋白在最后的洗涤中被洗脱。500mM咪唑洗涤物用Millipore/AmiconCentriconPlus-70离心过滤装置(centrifugalfilterdevices)(MWCO10kDa)(Millipore,Billerica,MA)根据制造商的说明被浓缩到15-20mL。咪唑和氯化钠通过穿过用100mM磷酸钾pH7.8预先平衡的一次性GEHealthcarePD10柱(GEHealthcare,Piscataway,NJ)(每柱2.5mL样品)而被除去。纯化的醛缩酶用每柱3.5mL相同的缓冲液洗脱。

每一馏分的蛋白浓度使用PierceBCA测试试剂盒(Pierce,Rockford,IL)用BSA作为蛋白标准而确定。每一馏分的纯度和无细胞提取物中的表达水平使用Bio-RadExperion微毛细管芯片系统(microcapillarychipsystem)(Bio-Rad,Hercules,CA)或使用在Mini3细胞器(cellapparatus)(Bio-Rad,Hercules,CA)中进行的Bio-Rad4-15％SDS-聚丙烯酰胺梯度凝胶确定。蛋白使用Bio-RadBio-SafeG-250考马斯染色(Coomassiestain)(Bio-Rad,Hercules,CA)，在聚丙烯酰胺凝胶中观察并用水脱色。典型地，该过程从400mL过夜培养物中产生约50mg的酶，其由Experion软件判断具有85-95％的纯度。纯化酶的等分试样(1-5mL)被储存在-80℃直到使用。以这种方式制备的酶降低了先前注意到的酶沉淀水平。储存缓冲液中镁的存在对沉淀水平没有影响。

实施例24

使用SEQIDNO:276醛缩酶产生R,R-monatin：反应条件的优化

实施例7中克隆的球形芽孢杆菌(ATCC菌株10208)D-丙氨酸氨基转移酶作为HIS₆标记的蛋白按如下描述被纯化，使用EMDBiosciences过夜表达系统II(OvernightExpressSystemII)(Novagen,Madison,WI)，以用于生长和诱导。在摇瓶中EMDBiosciences过夜表达系统II(溶液1-6)(Novagen,Madison,WI)含有50μg/mL卡那霉素。该表达系统诱导IPTG可诱导的系统表达而不需要监测细胞生长。来自氨基转移酶构建物的液态培养物或平板培养物的200mL培养基等分试样(在1L烧瓶中)接种后，培养物在30℃于225rpm摇动下温育过夜。当OD_600nm达到最小值6时，通过离心收集细胞并用缓冲液洗涤1次。

为了制备含有D-丙氨酸氨基转移酶的无细胞提取物，细胞被悬浮在3-4体积含有50μM磷酸吡哆醛(PLP)的100mM磷酸钾pH7.8溶液中，并随后使用Microfluidics均质器(Microfluidics,Newton,MA)(在18,000psi进行3次)破碎，悬浮物的温度保持低于15℃。可选地，无细胞提取物使用含有1μL/mL核酸酶，5μL/mL蛋白酶抑制剂混合物组II和0.033μL/mLrLysozyme^TM的EMDBiosciences(不含伯胺)提取试剂(Novagen,Madison,WI)，按照制造商的方案制备。所有后续纯化步骤在4℃进行。细胞提取物在15,000×g被离心20-30分钟以除去细胞碎片。20-25mL无细胞提取物等分试样被应用于45mL的GEHealthcareChelatingSepharose^TMFastFlow树脂柱(镍(II)型)(GEHealthcare,Piscataway,NJ)，该柱已经提前用含有200mM氯化钠和50μMPLP的100mM磷酸钾平衡。为了产生镍形式的树脂，该树脂用150mL的200mM六水合硫酸镍(II)洗涤并随后用150mL蒸馏水洗涤。加样后，该柱用150mL含有25mM咪唑的平衡缓冲液，150mL含有50mM咪唑的平衡缓冲液和150mL含有500mM咪唑的平衡缓冲液洗涤/洗脱。HIS₆标记的蛋白在最后的洗涤中被洗脱。500mM咪唑洗涤物用Millipore/AmiconCentriconPlus-70离心过滤装置(MWCO10kDa)(Millipore,Billerica,MA)根据制造商的说明被浓缩到15-20mL。咪唑和氯化钠通过穿过预先用含有50μMPLP的100mM磷酸钾pH7.8平衡的一次性GEHealthcarePD10柱(GEHealthcare,Piscataway,NJ)(每柱2.5mL样品)而被除去。纯化的氨基转移酶用每柱3.5mL相同的缓冲液洗脱。

每一馏分的蛋白浓度使用PierceBCA测定试剂盒(Pierce,Rockford,IL)用BSA作为蛋白标准而确定。每一馏分的纯度和无细胞提取物中的表达水平使用Bio-RadExperion微毛细管芯片系统(Bio-Rad,Hercules,CA)或使用在Mini3细胞器中进行的Bio-Rad4-15％SDS-聚丙烯酰胺梯度凝胶(Bio-Rad,Hercules,CA)确定。蛋白使用Bio-RadBio-SafeG-250考马斯染色(Bio-Rad,Hercules,CA)，在聚丙烯酰胺凝胶中观察并用水脱色。典型地，该过程从200mL过夜培养物中产生约50mg的酶，其通过Experion软件或由SDS-PAGE凝胶分析判断具有85-95％的纯度。纯化酶的等分试样(1-5mL)被储存在-80℃直到使用。

SEQIDNO:276醛缩酶(在实施例22中被克隆)被作为HIS₆标记的蛋白按照实施例23所述被纯化。

SEQIDNO:276醛缩酶优选的金属辅助因子(cofactor)通过筛选多种二价金属确定。反应在10mL血清瓶中以7mL的终体积被厌氧地建立。制备含有100mM磷酸钾(pH7.8)，200mM丙酮酸钠，0.05mMPLP和0.01％(v/v)Tween80的原液(bulksolution)，终体积为48.8mL，并用氮气喷射(sparged)30分钟。D-色氨酸(143mg；终浓度100mM)被分配在7个10mL血清瓶中。向每个瓶中加入0.014mL由氯盐制备的二价金属阳离子的2M原液(终浓度4mM)。对于阴性对照，加入0.014mL的dH₂O。血清瓶用橡胶隔膜盖住，并通过16-18号(gauge)针用氮气喷射。在厌氧条件下，5.625mL厌氧的大体积溶液被加入到每个厌氧血清瓶中。随后，球形芽孢杆菌D-丙氨酸氨基转移酶和SEQIDNO:276醛缩酶分别以2mg/mL和0.05mg/mL的终浓度被厌氧地加入每个血清瓶。溶液在轻微混合的条件下室温温育18个小时。最终的monatin根据实施例1所述的方法，使用氨基酸的液相色谱-后柱荧光检测的方法分析(表27)。

表27

金属辅助因子	18h时最终Monatin(mM)
		无(阴性对照)	1.7
镁	10.6

锰	10.0
		钴	6.7
锌	4.9
		镍	1.5
钙	0.7

用于SEQIDNO:276醛缩酶的反应条件使用统计学软件DesignExpert7.0.0(Stat-Ease,Inc.；Minneapolis,MN)设计的两级分级因子实验(two-levelfractionalfactorialexperiment)进一步研究。筛选设计包括在带有四个中心点两级的5个因子的单一区段(共20个运行)。待优化的5个因子是金属辅助因子的浓度、反应pH、80浓度、丙酮酸与色氨酸比例、和醛缩酶浓度(表28)。

装有143mgD-色氨酸的圆锥形聚乙烯管(14mL)在厌氧手套箱(glovebox)(CoyLaboratoryProducts,Inc；GrassLake,MI)中被脱氧过夜。2MMgCl₂，pH值为7.0、7.75和8.5的1M磷酸钾，10％(v/v)80；2M丙酮酸钠和10mMPLP(5′-磷酸吡哆醛)的储备液在除气水中制备，并在厌氧手套箱中平衡过夜。纯化的球形芽孢杆菌D-丙氨酸氨基转移酶和SEQIDNO:276醛缩酶的储备液在冰上融化，并立即在厌氧手套箱中使用。储备液被加入装有D-色氨酸的14mL圆锥形管，以获得由统计学设计确定的浓度(表28)。除气水被加入每个管中以随着酶的加入，将终体积为7.0mL。所述管在厌氧手套箱中轻微混合条件下室温温育达24小时。Monatin浓度和异构体的纯度根据实施例1所述的方法分析，使用氨基酸的液相色谱-后柱荧光检测法和用于体外和体内反应中monatin立体异构体分布确定的LC/MS/MS多反应监控法(FDAA衍生法)。

表28

数据的统计分析表明，反应pH值、丙酮酸:色氨酸比例和醛缩酶浓度是影响monatin滴定、异构体纯度和碳产率的重要因素。理想曲线使用DesignExpert软件产生，其中所述因素被改变以便在丙酮酸过量的条件下，使最高monatin滴定和最高异构体纯度的目标最大化。显示为最优的反应条件为1mMMgCl₂，pH>8.0，0.01％(v/v)80和0.01mg/mLSEQIDNO:276的醛缩酶。这是丙酮酸的典型使用量的5倍减少，以及二价金属的典型使用量的4倍减少。

进行额外的实验以确定反应过程的最优pH范围。以在pH7.0和9.0之间0.2pH单位的增加幅度，制备1MEPPS缓冲液的储备液。这些溶液被除气并在厌氧手套箱中被平衡过夜。装有143mgD-色氨酸的聚乙烯管(14mL)在厌氧手套箱中被脱氧过夜。2MMgCl₂，10％(v/v)80，2M丙酮酸钠和10mMPLP的储备液在除气水中制备，并在厌氧手套箱中平衡。纯化的球形芽孢杆菌D-丙氨酸氨基转移酶和SEQIDNO:276醛缩酶的制备物在冰上融化并立即在厌氧手套箱中使用。储备液被加入14mL圆锥形管，以产生每管7mL总体积中100mMEPPS，200mM丙酮酸，100mM色氨酸，1mMMgCl₂，0.01％(v/v)80，0.05mMPLP，2mg/mL球形芽孢杆菌D-丙氨酸氨基转移酶和0.01mg/mLSEQIDNO:276醛缩酶的终浓度。所述反应在无菌手套箱中轻微摇动条件下室温温育22小时。移取样品，并按实施例1所述使用LC/MS/MS多反应监控法分析monatin(表29)。

表29

反应pH	22小时的Monatin(mM)
		7.0	5.8
7.2	9.9
		7.4	7.8
7.6	10.6
		7.8	14.0
8.0	14.2
		8.2	14.3

8.4	12.6
		8.6	12.3
8.8	10.8
		9.0	11.1

该结果表明，在7.0-8.0之间monatin的形成随pH值的升高而增加。Monatin形成在pH8.0-8.2的范围内达到最大，并在pH8.4以上下降。此外，monatin立体异构体的纯度在pH8.4以上降低。

进一步的反应优化使用SEQIDNO:276的醛缩酶(0.01mg/mL)，2mg/mLT243N4978DAT(无标记，来自实施例26)，1mMMgCl₂，200mM丙酮酸钠，0.05mMPLP，0.01％Tween-80和100mMD-色氨酸在pH8.5进行。用于产生醛缩酶和D-氨基转移酶的细胞在50mMEPPSpH8.4中使用Microfluidics均质器(Microfluidics,Newton,MA)(以20,000psi进行3次)打碎。细胞碎片通过离心(20,000×g，30分钟)除去，并且澄清的细胞提取物被用于酶反应。没有使用其它缓冲液，但是反应混合物使用氢氧化钠被调整到pH8.5并在加入酶之前用氮气冲洗。250mL反应在0.7LSixfor搅动发酵罐(InforsAG,Bottmingen,Switzerland)中在30℃进行，在顶部空间(headspace)使用氮气。磷酸钾以终浓度0、5、10、20和50mM被加入。5-10mM磷酸盐的加入被发现是最优的，产生3.5g/Lmonatin(由实施例1所述的LC/MS/MS定量)。

实施例25

新芽孢杆菌D-氨基酸氨基转移酶的克隆

芽孢杆菌D-氨基酸氨基转移酶(“DAAT”或“DAT”)(EC2.6.1.21，也被称为D-丙氨酸氨基转移酶或D-天冬氨酸氨基转移酶)被重组产生。该氨基转移酶被用于与醛缩酶偶联的测定以产生R,Rmonatin。该氨基转移酶与前述用于生产monatin的D-氨基转移酶同源(美国公开申请号20040063175和美国公开申请号20050282260)。生物体ATCC4978——开始作为旋转芽孢杆菌(Bacillusrotans)保藏的球形芽孢杆菌——从ATCC订购并被用于制备基因组DNA。简并引物在已知的芽孢杆菌D-氨基转移酶的蛋白序列保守区域被设计，并被用于对来自上述ATCC菌株的内部DAAT基因序列进行聚合酶链反应(“PCR”)扩增。基因组步移使用BDGenomeWalker^TM通用试剂盒(Clontech,MountainView,CA)进行。序列分析(AgencourtBioScienceCorporation,Beverly,MA)证实了来自ATCC4978的DAAT基因的全长编码序列。来自ATCC4978的DAAT基因的DNA序列是SEQIDNO:357并在下文显示。SEQIDNO:357的基因可以通过标准PCR方案被扩增，并使用标准重组DNA技术进行克隆。SEQIDNO:357的基因也可通过本领域普通技术人员已知的任何方法被重构，如本领域普通技术人员已知的装配PCR方法。

ATCC4978DAAT的DNA序列是：

(SEQIDNO:357)

由上述DNA序列编码的来自ATCC4978的DAAT基因的氨基酸序列是SEQIDNO:358，并显示如下：

MetSerTyrSerLeuTrpAsnAspGlnIleValAsnAspGluGluValValValAspLysGluAspArgGlyTyrGlnPheGlyAspGlyValTyrGluValValLysValTyrAsnGlyGluLeuPheThrAlaGluGluHisValAspArgPheTyrAlaSerAlaGluLysIleArgValThrIleProTyrThrLysAspLysLeuHisGlnLeuLeuHisGlnLeuValGluMetAsnLysValGlnThrGlyHisIleTyrPheGlnIleThrArgGlyAlaGlyProArgAsnHisIlePheProGlyAspGluValLysProValLeuThrGlyAsnThrLysGluAsnProArgProValAlaAsnPheGluLysGlyValLysAlaThrPheValGluAspIleArgTrpLeuArgCysAspIleLysSerLeuAsnLeuLeuGlyAlaValLeuAlaLysGlnGluAlaHisGluLysGlyCysTyrGluAlaValLeuHisArgAspGluIleValThrGluGlySerSerSerAsnIleTyrGlyIleLysAspGlyValLeuTyrThrHisProAlaAsnAsnPheIleLeuAsnGlyIleThrArgGlnValIleIleLysCysAlaAlaGluIleGlyLeuProValLysGluGluAlaMetThrLysThrGlnLeuLeuAlaMetAspGluValIleValSerSerThrThrSerGluValThrProIleIleAspIleAspGlyThrValIleGlyAlaGlyLysProGlyAspTrpThrArgLysLeuGlnAlaGlnPheAspThrLysIleProLysGlyIleArgAla

(SEQIDNO:358)

由菌株ATCC4987获得的新D-氨基转移酶具有这样的蛋白序列——当与球形芽孢杆菌ATCC10208公开的D-氨基转移酶序列比较时，其具有独特的氨基酸残基变化。来自ATCC4987的DAAT与来自球形芽孢杆菌(ATCC10208)的DAAT仅具有72％的同一性。尽管该菌株在ATCC目前被列为球形芽孢杆菌，但是它被当作旋转芽孢杆菌(B.rotans)保藏。基于序列对比和该新DAAT与来自球形芽孢杆菌的DAAT之间显著的差异，在这些以及其它DAAT序列中鉴定出许多候选残基，这些候选残基可以被评估其在提高对R,Rmonatin生物合成的DAAT活性中的作用(单独或组合)。

实施例26

来自ATCC4987的D-氨基转移酶的突变体的表征

实验概述

来自芽孢杆菌菌株ATCC4978的新D-氨基转移酶基因(在实施例25中描述)使用位点定向的方法被诱变。基因突变体被表达，并测试其对monatin生产途径的目标活性，特别是当与一种或多种醛缩酶偶联时。

除了实施例16所列的位点定向诱变靶位的想法，通过将R-MP实际泊入(docking)YM-1晶体结构的活性位点而开发出其它想法。伯氨基酸序列对比被用于确定4978氨基转移酶蛋白是否可能在该区域具有相似的结构特征。预期以下其它突变会是有益的(使用4978氨基转移酶的氨基酸编号)。被认为，丙氨酸153到精氨酸的诱变将稳定底物(R-MP)的仲羧基基团。该改变可能增大位阻，所以为了补偿，在181和182位的丝氨酸残基被变为丙氨酸或甘氨酸。也假定可以在180、181和182位引入精氨酸并将一个或多个其它丝氨酸残基转化为丙氨酸或甘氨酸，以便为精氨酸较大的侧链腾出空间。在氨基酸200位的苯丙氨酸与R-MP被预测泊入的活性位点的位置空间上接近，并且在相当好地催化monatin转氨基作用的D-氨基转移酶中的该残基处有大量变异。据认为，在该位置上的氨基酸修饰是有用的。亮氨酸151突变为苯丙氨酸被预期有效地改变与底物吲哚环的相互作用。

基于文献，假设苏氨酸243突变为天冬酰胺可提高R-MP对转氨基反应的选择性。相似地，据认为，天冬酰胺100诱变为丙氨酸可提高酶对monatin转氨基反应的比活性(Ro等，FEBSLett398:141-145,(1996)；Sugio,S等，Biochemistry34:9661-9669,(1995)；EP1580268)。

Lee等表征了141-144区域(环)的突变体，并发现带有EYcY而非LRcD(其对我们的蛋白是天然的)倾向于对二羧酸底物具有较低的K_m(LeeSG,HongSP,SongJJ,KimSJ,KwakMS,SungMH.FunctionalandstructuralcharacterizationofthermostableD-aminoacidaminotransferasesfromGeobacillusspp.，ApplEnvironMicrobiol.2006Feb；72(2):1588-94)。因为MP是二羧酸底物，与α-酮戊二酸类似，并且MP的浓度在典型的monatin生产反应混合物中相当低，降低的K_m会有效地帮助DAT突变体对monatin生产的活性。

下面，描述了产生4978D-氨基转移酶突变体的方法，以及使用这些突变体的测试结果。

诱变

按照StratageneMulti-Change试剂盒(Stratagene,LaJolla,CA)所列的建议设计用于诱变的引物。引物是5′-磷酸化的。使用StratageneMulti-Change试剂盒(Stratagene,LaJolla,CA)按照制造商的指导完成诱变。用于诱变的模板是实施例25中所述的pET30(无标记的)或pET28(标记的)4978DAT构建物。引物列于下面表30：

表30

大肠杆菌XL10-Gold细胞(Stratagene,LaJolla,CA)被转化，产生的纯化质粒制备物被测序，以证实整合入正确的突变。

表达和测定

含有正确突变体的质粒DNA制备物或野生型4978DAT被转化进大肠杆菌表达宿主BL21(DE3)(Novagen,Madison,WI)。培养物使用上述方案生长，使用Qiagen小量制备试剂盒(Qiagen,Valencia,CA)分离质粒，并通过限制性消化进行分析，如上文所述，以证实插入片段的存在。

DAAT基因的诱导通常在含有卡那霉素(50μg/mL)的LB培养基中进行。细胞在37℃被生长到0.4-0.8的OD_600nm，用0.1mMIPTG(异丙基巯基半乳糖)诱导，并在诱导后3-4小时取样。

细胞提取物使用BugBuster试剂和Benzonase核酸酶(Novagen,Madison,WI)制备。1ml测定物在30℃轻微摇动的条件下进行并含有10.2mgD-色氨酸，0.05mMPLP，4mMMgCl₂，100mM磷酸钾缓冲液pH7.5，约50μg醛缩酶，200mM丙酮酸和以细胞提取物提供的0.150-0.5mg/mLD-氨基转移酶。总蛋白测定使用Bio-Rad总蛋白试剂盒(考马斯)(Bio-Rad,Hercules,CA)或PierceBCA试剂盒(Pierce,Rockford,IL)进行，并且D-氨基转移酶的表达百分比通过SDS-PAGE或Bio-RadExperion自动电泳系统(Bio-Rad,Hercules,CA)估计。在3小时或过夜取样。

SEQIDNO:28的R-特异性醛缩酶与约0.150mg/mLD-氨基转移酶被用于测定。

第一个测定显示，以下突变体(无标记的)具有转氨基活性(从最高到最低的顺序)：T243N、T243S、T243N/N100A、N100A。也注意到T243N似乎提高了产生的R,Rmonatin的立体纯度(stereo-purity)。测定使用纯化的睾丸酮丛毛单胞菌ProA醛缩酶(100μg/ml)和0.50mg/ml的D-氨基转移酶突变体(无标记，以细胞提取物形式提供)重复。在2小时和过夜取样。活性蛋白的结果显示如下，一式两份的结果被平均。％R,Rmonatin通过反相HPLC的峰面积确定，并随后使用实施例1所述的FDAA衍生法测量。在表31的第3列，对一些反应进行如实施例1所述额外的FDAA-衍生LC/MS/MS分析，并且那些结果显示在括号中。从D-色氨酸仅产生了R,R和S,Rmonatin。T243R突变体在测试条件下似乎不产生monatin，并且T243A突变体产生非常低水平的monatin。

表31

无标记的酶(时间-小时或过夜)	总monatin(ppm)	％R,R
			4978野生型(2小时)	4.7	41.6
4978野生型(过夜)	43.2	35.1(30.9)
			T243S(2小时)	55.0	37.4(21.7)
T243S(过夜)	97.7	35.5(29.8)
			T243N(2小时)	73.2	86.7(88.3)
T243N过夜	120.9	86.3(86.1)
			N100A(2小时)	12.0	40.8
N100A(过夜)	22.3	41
			T243A(2小时)	0.8	～100
T243A(过夜)	1.3	～100

尽管测定方法使用Bio-RadExperion软件估计D-氨基转移酶的百分比进行，但是明显地是，T243S和T243N突变体与野生型酶相比具有提高的活性。T243N突变体也提供了显著提高形成的％R,R的额外好处。该酶在转氨基反应中对R-MP比对S-MP具有提高的优选性。N100A突变体单独或与T243N结合不提高活性，这与文献所述相反。无标记的4978DAT的V34A位点定向突变体也使用如上文所述的相似的方法产生。V34A位点定向突变体被发现在测试条件下，比野生型酶具有显著低的活性。

初始测定另一感兴趣的地方是当其以N端His标记产生时，野生型酶似乎具有更高的活性。后续诱变在标记形式的该基因上进行。此外，上文中大多数有希望的突变体被亚克隆进具有N-端His标记的pET28b。这些使用NovagenHIS-结合柱和制造商的方案及推荐的缓冲液(Novagen,Madison,WI)来纯化。使用GEHealthcarePD10柱(GEHealthcare,Piscataway,NJ)，洗脱物部分的缓冲液与测定中使用的缓冲液交换。

1ml使用纯化的D-氨基转移酶(0.5mg/ml)和纯化的R-特异性醛缩酶SEQIDNO:276(50μg/ml)的测定在30℃轻微摇动的条件下进行，并含有10.2mgD-色氨酸，0.05mMPLP，200mM丙酮酸，4mMMgCl₂，100mM磷酸钾缓冲液pH7.5。一式两份样品被温育2小时和过夜测定。作为阳性对照，球形芽孢杆菌DAT(实施例7中克隆)被用于相同的测试。结果显示于表32：

表32

上面的数据，显示T243N突变体在2小时时明显地产生最高量的monatin。随着时间增长，T243N突变体与球形芽孢杆菌DAT阳性对照的比例降低。这一结果表明，T243N突变体在monatin反应中不如球形芽孢杆菌DAT稳定。当在相似条件下测定时，T243S(纯化标记的)酶具有与T243N突变体相似水平的活性；但是，产生的R,Rmonatin的百分比较低(2小时和过夜均为97.2％)。T243N/N100A突变体具有比T243N突变体低的活性。然而，T243S和T243N/N100A都具有比野生型4978DAT高的活性。

进行转氨基测定以确定当使用T243N突变体代替球形芽孢杆菌DAT时哪些反应速率被提高。在30℃进行1.5mL测定，取样时间点1小时、2小时和5小时。该测定含有25mMmonatin或D-色氨酸，25mM丙酮酸，100mM磷酸钾pH7.5，50μMPLP和0.1mgD-氨基转移酶(标记的，纯化的)。在少于100μgDAT被使用的情况下，丙氨酸的量被标准化为100μgD-氨基转移酶。样品用甲酸处理并通过LC-OPA分析副产物丙氨酸的存在。结果显示于表33和34。

表33：用R,Rmonatin作为底物的转氨基活性

酶	D-丙氨酸(mM)
		野生型4978 DAT(2hr)	0.54
野生型4978 DAT(5hr)	1.11
		T243N/N100A(2hr)	1.32
T243N/N100A(5hr)	2.78

T243S(2hr)	1.5
		T243S(5hr)	2.61
T243N(2hr)	1.26
		T243N(5hr)	2.65
球形芽孢杆菌DAT(2hr)	0.97
		球形芽孢杆菌DAT(5hr)	2.2

表34：用D-色氨酸作为底物的转氨基活性

酶	D-丙氨酸(mM)
		野生型4978 DAT(1hr)	4.55
野生型4978 DAT(2hr)	8.47
		T243N/N100A(1hr)	8.52
T243N/N100A(2hr)	12.67
		T243S(1hr)	4.89
T243S(2hr)	8.1
		T243N(1hr)	7.19
T243N(2hr)	10.83
		球形芽孢杆菌DAT(1hr)	8.7
球形芽孢杆菌DAT(2hr)	12.54

对于D-色氨酸反应，该结果显示一些酶在2小时达到平衡。R,Rmonatin的反应明显是限速反应，并且对该活性的提高对从D-色氨酸产生monatin的速率具有更大影响。

进行进一步的测定以检测T243N4978DAT突变体的稳定性。野生型酶也随时间失去活性。实施例27描述了提高T243ND-氨基转移酶突变体稳定性的方法。当新制备的无标记和标记形式的T243N突变体被制备并比较活性时，发现无标记的形式具有更好的时间(暂时，temporol)稳定性，使其总体上成为用于monatin生产反应中的更好形式的酶。

4978DAT的其它突变体通过本领域普通技术人员公知的方法制备。然而，这些突变体都产生在其被制备的条件下不溶的蛋白，并因此不能测定活性。产生不溶性蛋白的突变是：

S180A/S181A/S182R；

L151F；

V34G

S181R

A153R/S181A/S182A；

A153R/S182A；

A153R/S182G；

S180R/S181A/S182G；

S180R/S181A/S182A；

S180R/S181G/S182G；

S180G/S181R/S182G；和

S180A/S181R/S182A。

其它诱变

为了产生F200M4978DAT突变体，来自实施例25(标记的)野生型4978DAT开放阅读框用引物73和80(下文)和PfuTurboDNA聚合酶(Stratagene,LaJolla,CA)扩增，并被克隆进pCRII-平端(Blunt)(Invitrogen,Carlsbad,CA)。其序列被证实(Agencourt,Beverly,MA)。5′和3′区域分别使用引物80和96以及99和103扩增。扩增的DNA随后使用QiagenQIAquick凝胶提取试剂盒(Qiagen,Valencia,CA)凝胶纯化。它们扩增的DNA使用引物80和99再次进行PCR。被扩增的DNA按上文所述被凝胶纯化，克隆进pCRII-平端(Blunt)，并证实其序列。DAT开放阅读框作为NdeI/XhoI限制性消化片段被亚克隆进pET28b。

表35

设计以下引物用于使用多位点定向诱变试剂盒(MultiSite-DirectedMutagenesisKit)(Stratagene,LaJolla,CA)进行其它位点定向诱变。诱变使用StratageneMulti-Change试剂盒(Stratagene,LaJolla,CA)按照制造商的说明完成。用于诱变的模板是实施例25中所述的pET28(标记的)4978DAT构建物。也使用F200Y突变体作为模板并使用T243N(上文所列)引物进行另一轮诱变产生双突变体。

表36

突变体编码区通过DNA测序(Agencourt)被证实。序列证实的质粒被转化进BL21(DE3)细胞(Novagen,Madison,WI)。

表达和测定

在500ml带挡板烧瓶(baffledflask)中含有带50μg/ml卡那霉素的100mlLB的培养物用1ml过夜培养物接种，并在37℃生长到约0.6的光密度(600nm)。蛋白的产生由最终浓度为1mM的IPTG诱导。细胞在加入IPTG后在30℃温育4.5小时。细胞被离心并在-80℃冷冻。细胞被破碎(使用含有1μL/mLbenzonase核酸酶，5μL/mL蛋白酶抑制剂混合物II和0.033μL/mLrLysozyme的NovagenBugBuster试剂(Novagen,Madison,WI)，按照Novagen推荐的方案制备)，并通过SDS-PAGE分析。突变体(141-LRcD-144→EYcY)和(243-TS-244→NR)在它们被制备的条件下产生不溶的蛋白。突变体243-TS-244→NK在测试的条件下不具有可量化的活性，并且与野生型比较可能是活性弱的酶，S244K突变体也是这样。

His标记的蛋白按如下被纯化。HIS结合柱(Novagen,Madison,WI)用含有200mMNaCl和50μMPLP的10mL100mM磷酸钾pH7.8平衡。无细胞提取物被加样到柱上。该柱用10mL平衡缓冲液，10mL含有25mM咪唑的平衡缓冲液和10mL含有50mM咪唑的平衡缓冲液洗涤。蛋白用5ml含有500mM咪唑的平衡缓冲液洗脱。蛋白使用PD10柱脱盐，PD10柱在含有50μMPLP的100mM磷酸钾pH7.8中平衡。浓缩纯化的蛋白，并使用BradfordAssay(Bio-Rad,Hercules,CA)定量。

D-氨基转移酶突变体使用500μg/mlD-氨基转移酶，50μg/mlSEQIDNO:276的醛缩酶，4mMMgCl₂，50mM磷酸钾pH8，200mM丙酮酸钠，0.05mMPLP和20.4mg/mlD-色氨酸作为测定条件被测定。终体积为1.25ml。样品(200μl)在0.5、1、2和14小时被取样，并冷冻直到实验完成。样品被过滤，1比10稀释，并如实施例1所述利用LC/MS/MS分析。

对于相对活性百分比，来自实施例25的野生型4978D-氨基转移酶被用作参考。表37显示了每种突变体在每个时间点的相对活性。

表37

D-氨基转移酶	时间(hr)	％活性
			4978野生型	0.5	100
T243N	0.5	270
			F200M	0.5	50
F200Y	0.5	70
			F200M/T243N	0.5	183
S244K	0.5	4
			4978野生型	1	100
T243N	1	289
			F200M	1	55
F200Y	1	81
			F200M/T243N	1	203
S244K	1	6
			4978野生型	2	100
T243N	2	266
			F200M	2	51
F200Y	2	79
			F200M/T243N	2	185
S244K	2	6
			4978野生型	14	100
T243N	14	254
			F200M	14	56
F200Y	14	80
			F200M/T243N	14	168
S244K	14	8

在测试R,Rmonatin产生活性的所有突变体中，T243N是最好的突变体。

实施例27

来自菌株ATCC4978的D-氨基转移酶的T243N突变体的稳定

如实施例25所示，T243N突变DAT的初始活性明显比球形芽孢杆菌DAT高，但是活性更迅速地降低。额外的实验——使用下文所述的厌氧程序，表明T243N突变DAT的初始活性比球形芽孢杆菌DAT高达8倍，但是甚至在厌氧条件下，活性迅速降低。进行以下研究以试图在延长的时间段中保持更高的活性。

来自菌株4978的D-氨基转移酶的T243N突变体(实施例25中描述)和苜蓿中华根瘤菌HMG醛缩酶作为HIS₆标记蛋白，按下文所述被纯化。SEQIDNO:276醛缩酶按实施例23所述被纯化。

来自ATCC4978的DAT(T243N突变体)的纯化

带有氨基端HIS₆-纯化标记的来自ATCC菌株4978的D-氨基转移酶的T243N突变体(实施例26中描述)在摇瓶中使用含有50μg/mL卡那霉素的EMDBiosciences过夜表达系统II(溶液1-6)(Novagen,Madison,WI)产生。该表达系统诱导IPTG可诱导的系统的表达，而不需要监测细胞生长。来自大肠杆菌BL21(DE3)宿主的液态培养物或平板的200mL培养基等分试样(在1L烧瓶中)接种后，培养物在30℃于225rpm摇动下温育过夜，所述大肠杆菌BL21(DE3)宿主在质粒pET28b上携带来自ATCC菌株4978的T243N突变体D-氨基转移酶的基因。当OD₆₀₀达到最小值6时，细胞通过离心收集并用缓冲液洗涤1次。

无细胞提取物使用含有1μL/mL核酸酶(Novagen,Madison,WI)，5μL/mL蛋白酶抑制剂混合物组II(Calbiochem-NovabiochemCorp.,SanDiego,CA)和0.033μL/mLrLysozyme^TM(Novagen,Madison,WI)的EMDBiosciences(不含伯胺)提取试剂(Novagen,Madison,WI)，按照制造商的方案制备。所有后续纯化步骤在4℃进行。细胞提取物在15,000×g被离心20-30分钟以除去细胞碎片。无细胞提取物的20-25mL等分试样被应用于45mL的GEHealthcareChelatingSepharose^TMFastFlow树脂(镍(II)型)柱(GEHealthcare,Piscataway,NJ)，该柱提前用含有200mM氯化钠和50μMPLP的100mM磷酸钾平衡。为了产生镍形式的树脂，该树脂用150mL的200mM六水合硫酸镍(II)洗涤并随后用150mL蒸馏水洗涤。加样后，该柱用150mL含有25mM咪唑的平衡缓冲液，150mL含有50mM咪唑的平衡缓冲液和150mL含有500mM咪唑的平衡缓冲液洗涤/洗脱。HIS₆标记蛋白在最后的洗涤步骤被洗脱。500mM咪唑洗涤物用Millipore/AmiconCentriconPlus-70离心过滤装置(MWCO10kDa)(Millipore,Billerica,MA)根据制造商的说明被浓缩到15-20mL。咪唑和氯化钠通过穿过预先用含有0.5μMPLP的100mM磷酸钾pH7.8平衡的一次性GEHealthcarePD10柱(GEHealthcare,Piscataway,NJ)(每柱2.5mL样品)而被除去。纯化的氨基转移酶用每柱3.5mL相同的缓冲液洗脱。每一馏分的蛋白浓度使用PierceBCA测定试剂盒(Pierce,Rockford,IL)确定，以BSA作为蛋白标准。

每一馏分的纯度和无细胞提取物馏分中的表达水平使用Bio-RadExperion微毛细管芯片系统(microcapillarychipsystem)(Bio-Rad,Hercules,CA)或使用在Mini3细胞器中进行的Bio-Rad4-15％SDS-聚丙烯酰胺梯度凝胶(Bio-Rad,Hercules,CA)确定。蛋白使用Bio-RadBio-SafeG-250考马斯染色(Bio-Rad,Hercules,CA)，在聚丙烯酰胺凝胶中观察，并用水脱色。典型地，该过程从200mL过夜培养物中产生约20mg的酶，其由Experion软件判断或通过SDS-PAGE凝胶分析具有85-90％纯度。纯化酶的等分试样(1-5mL)被储存在-80℃直到使用。

SEQIDNO:276醛缩酶的纯化如实施例23所述。

苜蓿中华根瘤菌HMG醛缩酶的纯化

带有氨基端HIS₆-纯化标记的苜蓿中华根瘤菌HMG醛缩酶(美国公开申请号20040063175和WO03091396A2所述克隆)通过用0.2mMIPTG诱导在含有50mg/L卡那霉素的Luria-Bertani培养液中生长的培养物而产生。在来自大肠杆菌BL21(DE3)宿主的液态培养物或平板的800mL培养基等分试样接种后，培养物在30℃于225rpm摇动下温育过夜，所述大肠杆菌BL21(DE3)宿主在质粒pET30(Xa/LIC)中携带苜蓿中华根瘤菌HMG醛缩酶的基因。当光密度达到OD_600nm为0.5-0.75时，IPTG被加入并且培养物在225rpm摇动的条件下在30℃温育4小时。细胞通过离心收集并用缓冲液洗涤一次。

为了制备含有苜蓿中华根瘤菌醛缩酶的无细胞提取物，细胞被悬浮在3-4体积含有100mMNaCl的50mMEPPS(N-(2-羟乙基)哌嗪-N’-(3-丙磺酸))pH8.2中，并随后使用Microfluidics均质器(Microfluidics,Newton,MA)(在18,000psi进行3次)破碎，保持悬浮液的温度低于15℃。细胞悬液在15,000-20,000×g被离心20-30分钟以除去细胞碎片。HIS₆标记的蛋白使用EMDBiosciences柱(Novagen,Madison,WI)按照制造商推荐的方案被纯化，一个例外是：该柱用1:1的结合缓冲液:洗涤缓冲液的溶液代替单独的洗涤缓冲液清洗。洗脱馏分用Millipore/Amicon15mL离心过滤装置(MWCO5kDa)(Millipore,Billerica,MA)根据制造商的说明被浓缩到7-10mL。咪唑和氯化钠通过穿过预先用含有100mM氯化钠的50mMEPPS，pH8.2的溶液平衡的一次性GEHealthcarePD10柱(GEHealthcare,Piscataway,NJ)(每柱2.5mL样品)而被除去。纯化的醛缩酶用每柱3.5mL相同的缓冲液洗脱。每一馏分的蛋白浓度使用PierceBCA测定试剂盒(Pierce,Rockford,IL)，用BSA作为蛋白标准而被确定。

每一馏分的纯度和无细胞提取物馏分中的表达水平使用在Mini3细胞器(Bio-Rad,Hercules,CA)中进行的Bio-Rad4-15％SDS-聚丙烯酰胺梯度凝胶确定。蛋白使用Bio-RadBio-SafeG-250考马斯染色(Bio-Rad,Hercules,CA)在聚丙烯酰胺凝胶中观察，并用水脱色。典型地，该过程从800mL培养物中产生约15-20mg的酶并且纯度为85-95％。纯化的酶的等分试样(1-5mL)被储存在-80℃直到使用。

Monatin生产测定

装有143mgD-色氨酸的圆锥形聚乙烯管(14mL)在厌氧手套箱中被脱氧过夜。1MEPPS缓冲液(pH8.2)，2MMgCl₂，2M丙酮酸钠和10mMPLP的储备液在除气水中被制备，并在厌氧手套箱中平衡过夜。10％(v/v)Tween80，1％(v/v)Tween20，1％(v/v)TritonX-100，100％丙酮，100％乙醇和50％(w/v)甘油储备液与在2mL微离心管中0.7g的海藻糖、肌醇、山梨糖醇和赤丁四醇中的每一种一起在厌氧手套箱中平衡。纯化的酶制备物在冰上融化并立即在厌氧手套箱中使用。储备液被加入14mL圆锥形管，以产生100mMEPPS，200mM丙酮酸，100mM色氨酸，1mMMgCl₂，0.05mMPLP，0.5mg/mLD-氨基转移酶和0.01mg/mL的SEQIDNO:276醛缩酶或0.05mg/mL的苜蓿中华根瘤菌HMG醛缩酶的终浓度。建议的酶稳定剂以各种终浓度被加入(表38和39)，以将最终反应体积达到每管7mL。所述反应在厌氧手套箱中轻微搅拌条件下室温温育达24小时。样品被定时地取出并按实施例1所述，使用LC/MS/MS多反应监测法分析Monatin。初始速率由加入酶之后0和3小时之间取样的样品计算。

表38

表39(SEQIDNO:276醛缩酶)

加入0.01％-0.1％(v/v)去污剂，如TritonX-100、Tween20或Tween80，或1％-10％(w/v)多元醇，如甘油、海藻糖、肌醇或山梨糖醇提高了T243ND-氨基转移酶在整个实验周期的稳定性。

实施例28

A：恶臭假单胞菌KT2440宽特异性氨基酸消旋酶(BAR)的克隆

BAR使用文献(Roise,D.,Soda,K.,Yagi,T.,Walsch,C.T.,Biochemistry23,5195-5201,(1984))中的信息从恶臭假单胞菌KT2440中被鉴定得到。恶臭假单胞菌中BAR酶的活性位点被测序并报告——LTAVLKADAYGXGIGL(SEQIDNO:375)。该序列被用于BLAST，搜索NCBI中可用的恶臭假单胞菌KT2440基因组序列。鉴定得到具有几乎相同的共有序列的蛋白。设计引物以从美国典型培养物保藏中心(ATCC,Manassas,VA)获得的基因组DNA中克隆该基因。

(5′-AGAAGACATATGCCCTTTCGCCGTAGGG-3′(SEQIDNO:376)和

5′-AGAAGAGGATCCTCAGTCGACGAGTATCTTCG-3′(SEQIDNO:377))。

PCR在标准条件下进行并且PCR产物被纯化(QIAquickPCR纯化试剂盒，Qiagen,Valencia,CA)。纯化的PCR产物用NdeI和BamHI消化。消化的PCR产物被凝胶纯化(QIAquick凝胶提取试剂盒，Qiagen,Valencia,CA)，并连接到已经以相似方式被消化和凝胶纯化的pET30和pET28中。带有插入片段的克隆被测序(Agencourt,Beverly,MA)，并且带有正确序列的分离物(pET30KT2440BAR和pET28KT2440BAR)被识别并被用于后续研究。

KT2440BARDNA序列为：

atgccctttcgccgtacccttctggctgcatccctggcacttctgatcaccggacaggcccccctgtatgcggcaccaccgttgtcgatggacaacggcaccaacaccctgaccgtgcaaaacagcaatgcctgggtcgaagtcagcgccagcgccctgcagcacaacatccgcacgctgcaggccgagctggccggcaagtccaagctgtgcgccgtgctcaaggccgatgcctatggccacggtatcggcctggtaatgccatcgatcatcgcccaaggcgtgccctgcgtggcggtggccagcaacgaggaggcccgcgtggtccgcgccagtggcttcaccgggcaactggtgcgggtacgcctggccagcctcagcgagctggaagatggcttgcagtacgacatggaagagctggtgggcagcgcggaatttgcccgccaggccgatgccatcgccgcgcgccatggcaagaccttgcgcattcacatggcgctcaactccagcggcatgagccgcaacggggtggagatggccacctggtccggccgtggcgaagcgctgcagatcaccgaccagaagcacctcaagctggtcgcgctgatgacccacttcgccgtggaagacaaggacgatgtacgcaagggcctggcggcattcaacgagcagaccgactggttgatcaagcacgccaggctggaccgcagcaagctcaccctgcacgccgccaactcgttcgctacgctggaagtgccggaagcgcgcctggacatggtacgaacgggtggcgcgctgttcggcgacaccgtgccggcgcgcaccgagtacaaacgtgcgatgcagttcaaatcgcacgtggcggcggtgcacagctatccggccggcaacaccgtgggctatgaccgcaccttcaccctggcccgtgattcgcggctggccaacattacggtcgggtactccgatggctaccgccgggtattcaccaacaagggccatgtgctgatcaacggccaccgtgtgccggtcgtgggcaaggtgtcgatgaacacgctgatggtcgatgtcaccgacttccctgatgtgaaggggggtaacgaagtggtgctgttcggcaagcaggccgggggcgaaatcacccaggccgagatggaagaaatcaacggcgcgttgctcgccgatttgtacaccgtatggggcaattccaacccgaagatactcgtcgactga

(SEQIDNO:378)。

KT2440BAR的氨基酸序列为：

Mpfrrtllaaslallitgqaplyaapplsmdngtntltvqnsnawvevsasalqhnirtlqaelagksklcavlkadayghgiglvmpsiiaqgvpcvavasneearvvrasgftgqlvrvrlaslseledglqydmeelvgsaefarqadaiaarhgktlrihmalnssgmsrngvematwsgrgealqitdqkhlklvalmthfavedkddvrkglaafneqtdwlikharldrskltlhaansfatlevpearldmvrtggalfgdtvparteykramqfkshvaavhsypagntvgydrtftlardsrlanitvgysdgyrrvftnkghvlinghrvpvvgkvsmntlmvdvtdfpdvkggnevvlfgkqaggeitqaemeeingalladlytvwgnsnpkilvd

(SEQIDNO:379)。

B)恶臭假单胞菌KT2440BAR的纯化

上述pET30KT2440BAR质粒被转化进BL21DE3pLysS(Invitrogen,Carlsbad,CA)。产生的菌株在LB或极好的(Terrific)培养液中在37℃通气条件下生长到OD_600nm为0.4-0.6，并用1mMIPTG诱导。在37℃通气条件下继续温育3-4小时。细胞通过离心收集并且细胞沉淀物被储存在-80℃直到使用。细胞沉淀物在冰上融化。细胞使用BugBuster(Novagen,Madison,WI)和Benzonase(Novagen,Madison,WI)裂解。细胞碎片通过离心除去，并且无细胞的提取物被立即使用或储存在-80℃。KT2440BAR基因也被克隆进pET28的NdeI-BamHI位点并被转化进BL21DE3pLysS。该构建物似乎不能非常有效地表达可溶性蛋白，所以未标记的形式(pET30KT2440BAR)被用于进一步研究。

提取物被应用到使用至少5柱体积的缓冲液A(25mM磷酸钾pH8.0，10μM-5′-磷酸吡哆醛(PLP))平衡的UnoQ柱(Bio-Rad,Hercules,CA)。该柱使用2柱体积的缓冲液A清洗。蛋白使用20柱体积由0-100％缓冲液B的缓冲液B(缓冲液A+1MNaCl)的线性梯度洗脱，并且从梯度开始的时间收集5ml的馏份。这些馏份使用实施例4-第7部分所述的AmplexRed法分析。简单地说，100μgD-氨基酸氧化酶(Sigma-Aldrich,St.Louis,MO)，0.05mMFAD，25mML-trp，和待测试的少量体积的馏份在50μLH₂O中结合，并被加入50μL按制造商的方案指导制备的AmplexRed反应缓冲液中。具有活性的馏份用PD-10柱(GEHealthcare,Piscataway,NJ)脱盐，并用Amicon离心浓缩器(Millipore,Billercia,MA)浓缩。纯化的蛋白被储存在-80℃。

C)带有色氨酸消旋酶活性的嗜热脂肪土芽孢杆菌(Geobacillusstearothermophilus)的丙氨酸消旋酶突变体Y354A的产生与测定

野生型嗜热脂肪土芽孢杆菌(Geobacillusstearothermophilus)丙氨酸消旋酶(SEQIDNO:380，显示如下，被克隆进pET30)被用作位点定向诱变以制备Y354A变化的模板。SEQIDNO:380的基因可以通过标准PCR方案被扩增，并使用标准重组DNA技术克隆。SEQIDNO:380的基因也可以通过本领域普通技术人员已知的任何方法，如本领域技术人员已知的装配PCR方法被重构建。

野生型嗜热脂肪土芽孢杆菌丙氨酸消旋酶DNA和氨基酸序列显示为下面的SEQIDNO:380：

(SEQIDNO:380).

丙氨酸消旋酶(嗜热脂肪土芽孢杆菌)编码的氨基酸序列显示为下面的SEQIDNO:381：

MetAspGluPheHisArgAspThrTrpAlaGluValAspLeuAspAlaIleTyrAspAsnValGluAsnLeuArgArgLeuLeuProAspAspThrHisIleMetAlaValValLysAlaAsnAlaTyrGlyHisGlyAspValGlnValAlaArgThrAlaLeuGluAlaGlyAlaSerArgLeuAlaValAlaPheLeuAspGluAlaLeuAlaLeuArgGluLysGlyIleGluAlaProIleLeuValLeuGlyAlaSerArgProAlaAspAlaAlaLeuAlaAlaGlnGlnArgIleAlaLeuThrValPheArgSerAspTrpLeuGluGluAlaSerAlaLeuTyrSerGlyProPheProIleHisPheHisLeuLysMetAspThrGlyMetGlyArgLeuGlyValLysAspGluGluGluThrLysArgIleValAlaLeuIleGluArgHisProHisPheValLeuGluGlyValTyrThrHisPheAlaThrAlaAspGluValAsnThrAspTyrPheSerTyrGlnTyrThrArgPheLeuHisMetLeuGluTrpLeuProSerArgProProLeuValHisCysAlaAsnSerAlaAlaSerLeuArgPheProAspArgThrPheAsnMetValArgPheGlyIleAlaMetTyrGlyLeuAlaProSerProGlyIleLysProLeuLeuProTyrProLeuLysGluAlaPheSerLeuHisSerArgLeuValHisValLysLysLeuGlnProGlyGluLysValSerTyrGlyAlaThrTyrThrAlaGlnThrGluGluTrpIleGlyThrIleProIleGlyTyrAlaAspGlyTrpLeuArgArgLeuGlnHisPheHisValLeuValAspGlyGlnLysAlaProIleValGlyArgIleCysMetAspGlnCysMetIleArgLeuProGlyProLeuProValGlyThrLysValThrLeuIleGlyArgGlnGlyAspGluValIleSerIleAspAspValAlaArgHisLeuGluThrIleAsnTyrGluValProCysThrIleSerTyrArgValProArgIlePhePheArgHisLysArgIleMetGluValArgAsnAlaValGlyArgGly

(SEQIDNO:381)

诱变使用QuickChange-Multi位点定向诱变试剂盒(Stratagene,LaJolla,CA)进行。以下诱变引物被用于产生Y354A变化，5′-gccatttggaaacgatcaacgcggaagtgccttgcacgatcag-3′(SEQIDNO:382)。位点定向诱变按制造商的方案所述完成。若干分离物被测序(Agencourt,Beverly,MA)，带有正确序列的分离物被选择并被用于进一步分析。

pET30Y354A单突变体被转化进大肠杆菌BL21(DE3)pLysS。纯化的蛋白用以下方式制备。菌株在LB或极好的(Terrific)培养液(在37℃通气)中生长到OD_600nm为0.4-0.6，并用1mMIPTG诱导。温育在37℃通气的条件下继续进行约3小时。细胞通过离心收集并且细胞沉淀物被储存在-80℃。

细胞沉淀物在冰上融解，并随后重悬浮在合适体积的BugBuster(Novagen,Madison,WI)加Benzonase核酸酶(Novagen,Madison,WI)中。细胞碎片通过离心除去，并且无细胞的提取物被应用到已经用结合缓冲液平衡的HIS结合柱(HIS-Bindcolumn)(Novagen,Madison,WI)。该柱用结合缓冲液和洗涤缓冲液清洗，并且蛋白用洗脱缓冲液洗脱(如照制造商方案所指导)。纯化的蛋白使用PD-10柱(GEHealthcare,Piscataway,NJ)脱盐。根据制造商的方案，蛋白在50mM磷酸钾pH8.0和10μM5′-磷酸吡哆醛中脱盐。蛋白使用Amicon离心浓缩器(Millipore,Billercia,MA)浓缩。纯化并浓缩的蛋白被分成小等分试样，并储存在-80℃直到使用。

纯化的Y354A与野生型消旋酶(以上述方式制备)在丙氨酸和色氨酸测定中比较。所述测定方法在50mM磷酸钾缓冲液pH8和10μMPLP中在37℃使用400μL浓缩的纯化蛋白(>1mg/ml)和50mM底物进行。D-丙氨酸和D-色氨酸的检测使用实施例1所述的手性氨基酸法进行。

表40

酶	底物	时间	产生的D异构体(ppm)
				野生型	L-色氨酸	0	nd*
		10	nd
						30	nd
		60	nd
						1080	nd
Y354A		0	nd
						10	198
		30	568
						60	1386
		1080	10080
				野生型	L-丙氨酸	0	5140
		10	5960
						30	6280

	60	6500
			1080	5040
Y354A	0	4760
			10	4980
	30	4980
			60	4200
	1080	5000

*nd＝未检测到

这些数据在没有使用内标的情况下被分析；因此，这些数据是半定量的并且应该被用于比较的目的。但是，这些结果显示Y354A单突变足以拓宽丙氨酸消旋酶的特异性，以便其能够催化使用可选底物的氨基酸消旋作用。

D)BAR酶的测定

BAR酶按如下进行测定。AmplexRed测定按照本实施例中所述建立。恶臭假单胞菌KT2440BAR以200μg(按本实施例所述纯化)的浓度被使用。野生型嗜热脂肪土芽孢杆菌丙氨酸消旋酶和Y354A按照本实施例所述被纯化，并以200μg/mL或1000μg/mL使用。CE是按本实施例所述制备的无细胞提取物。60分钟时间点的结果显示于下面的表41中。

表41

酶	荧光计读数(在60分钟时)
		BAR(200)	56943
Y354A(200)	7860
		Y354A(1000)	13587
WT丙氨酸消旋酶(200)	3646
		WT丙氨酸消旋酶(1000)	3639
BAR CE(5μl)	16228
		BAR CE(10μl)	26662
BAR CE(50μl)	>58000
		无酶	1510

也按照上文所述在50mM磷酸钾pH8，10μMPLP和30mML-色氨酸中，测定纯化的蛋白的色氨酸消旋酶活性。200μg/mL或1000μg/mL纯化的酶被用于该测定(表示在括号中)。使用实施例1所述用于检测的手性氨基酸法分析D-色氨酸。

表42

酶	时间	D-色氨酸(ppm)
			BAR(200)	0	0

	5	172
				10	410
	20	844
				30	1318
	60	2362
				120	2594
	240	2762
				1080	2294
Y354A(200)	0	0
				5	0
	10	0
				20	0
	30	12
				60	22
	120	44
				240	56
	1080	368
			Y354A(1000)	0	0
	5	0
				10	12
	20	18
				30	40
	60	80
				120	146
	240	218
				1080	1164

该测定表明，恶臭假单胞菌KT2440BAR酶比嗜热脂肪土芽孢杆菌衍生的酶及其Y354A突变体对色氨酸活性更大。

E)用恶臭假单胞菌KT2440BAR生产monatin

使用纯化的恶臭假单胞菌KT2440BAR(如上文纯化)(100μg)或纯化的Y354A(如上文纯化)(500μg)，D-氨基转移酶(BioCatalyticsAT-103(Pasadena,CA))(500μg)，和SEQIDNO:276的醛缩酶(实施例23中纯化)(50μg)进行Monatin生产测定。也进行了以L-色氨酸起始的monatin生产实验。除了上述酶，每1mL反应混合物中加入以下成分：4mMMgCl₂，50mML-色氨酸，100mM丙酮酸钠，100mM磷酸钾缓冲液pH7.5和0.05mMPLP。

作为对照，该实验在没有醛缩酶并且以D-色氨酸代替L-色氨酸起始的条件下按上文所述进行。结果的总结显示于下面的表43中。

表43

使用Y354A在本实验中没有检测到monatin。该消旋酶过去被用于产生monatin(数据未显示)，但是使用水平高得多的酶(至少2mg到10mg以见到较高水平的monatin)。恶臭假单胞菌KT2440BAR被用于从L-色氨酸产生monatin。该实验中使用的100μg在2小时后不足以看到monatin产生，但是在18小时后足以看到monatin产生。立体异构体分布表明产生的大部分monatin是R,R异构体。没有产生R,S异构体。该结果表明，KT2440BAR不能够可检测地消旋monatin的R,R异构体(R,R异构体的消旋会产生R,S异构体)。在本实验中有显著量的S,S异构体产生。这可能是由于这样的事实，本实验使用的AT-103不是高度纯化的并且可能含有来自细胞提取物的L-氨基转移酶，以及有大量L-色氨酸存在作为S-MP转氨基作用的氨基供体。

实施例29

腐臭假单胞菌(Pseudomonastaetrolens)精氨酸消旋酶的克隆与表达

实验概述

腐臭假单胞菌(Pseudomonastaetrolens)(也被称为P.graveolens)精氨酸消旋酶(Genbank登录号AB096176，核酸序列)及其I384M突变体被克隆、表达并测试其在L-色氨酸向D-色氨酸转化中的活性。该基因与来自KT2440的恶臭假单胞菌BAR基因72％一致，并与上述NBRC12996的恶臭假单胞菌BAR基因73％一致。氨基酸序列与两种恶臭假单胞菌BAR蛋白72％一致。

聚合酶链反应方案

腐臭假单胞菌(ATCC4683)在225rpm摇动的条件下在28℃营养培养液中生长。聚合酶链反应使用设计带有5′限制性酶切位点和用于克隆进pET28和pET30载体(Novagen,Madison,WI)的突出端的引物在全细胞上进行。

引物序列为：

N端：5′-ATAATACATATGCCCTTCTCCCGTACCC-3′(SEQIDNO:408)和

C端：5′-GCGGCGGGATCCTTACTGATCTTTCAGGATT-3′(SEQIDNO:409)。

由腐臭假单胞菌衍生的基因使用以下PCR方案扩增。25μL生长的细胞在96℃被裂解10分钟。细胞碎片通过离心除去并且上清液被用作PCR的模板。100μL反应含有5μL模板(裂解的细胞上清液)，1.6μM每种引物，0.3mM每种dNTP，10UrT^th聚合酶XL(AppliedBiosystems,FosterCity,CA)，1XXL缓冲液和1mMMg(OAc)₂。所用的热循环仪程序包括94℃热启动3分钟，以下步骤的8次重复：94℃30秒，52℃30秒和68℃2分钟，接着是以下步骤的22次重复：94℃30秒，58℃30秒和68℃2分钟。22次重复后，样品被保持在68℃7分钟，并随后储存在4℃。该PCR方案产生了1230bp的产物。

克隆

PCR产物使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％TAE-琼脂糖凝胶中被凝胶纯化。产物被TOPO克隆并根据制造商的方案(Invitrogen,Carlsbad,CA)被转化进TOP10细胞中。质粒DNA使用Qiagen离心小量制备试剂盒(Qiagen,Valencia,CA)从产生的转化体中纯化，并通过用NdeI和BamHI限制性消化筛选正确的插入片段。似乎具有正确插入片段的质粒的序列通过使用通用M13正向和M13反向引物的双脱氧链终止DNA测序证实。

正确的TOPO克隆使用限制性酶NdeI和BamHI根据制造商推荐的方案(NewEnglandBiolabs,Beverly,MA)被消化，并使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％TAE-琼脂糖凝胶中被凝胶纯化。质粒pET28和pET30通过用限制性酶NdeI和BamHI消化，接着用虾碱性磷酸酶(Roche,Indianapolis,IN)处理并使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％TAE-琼脂糖凝胶纯化而制备。被消化的载体和插入片段使用Rapid^TMDNA连接试剂盒(Roche,Indianapolis,IN)连接。约50ng处理的插入片段，100ng处理的载体(插入片段与载体摩尔比3:1)，5U的T4DNA连接酶和1X连接缓冲液在室温下温育5分钟。连接反应使用高纯PCR产物纯化试剂盒(Roche,Indianapolis,IN)脱盐，并被用于转化大肠杆菌DH10B电感受态细胞(Invitrogen,Carlsbad,CA)。10μL每种连接反应被加入到40μL的DH10B细胞中，其在以下条件下使用BioRadGenePulsarII通过电穿孔被转化：2.5kV，25μF，200ohm在0.2cm小槽中。细胞被允许在1mL室温SOC中在225rpm摇动于37℃下回收1小时。细胞在含有卡那霉素(50μg/mL)的LB平板上被铺平板。质粒DNA使用Qiagen离心小量制备试剂盒(Qiagen,Valencia,CA)从产生的转化体中纯化，并通过用NdeI和BamHI限制性消化筛选正确的插入片段。

基因表达和测定

质粒DNA被转化进大肠杆菌表达宿主BL21(DE3)pLysS(Novagen,Madison,WI)。培养物被生长，并且质粒使用Qiagen离心小量制备试剂盒(Qiagen,Valencia,CA)分离并通过限制性消化进行分析，以确定身份。

BL21DE3pLysS中的诱导初始在pET28(组氨酸标记)和pET30(无标记)载体中进行。使用在100mL含有卡那霉素(50mg/L)的LB中于37℃生长到OD₆₀₀值为0.5，并用100mMIPTG(异丙基巯基半乳糖)诱导的培养物，并在诱导后0和3小时取样，进行时程研究。来自0小时和3小时时间点的细胞被重悬浮在含有2-巯基乙醇的1X十二烷基磺酸钠缓冲液中，在95℃加热10分钟并冷却。这些总细胞蛋白样品的等分试样通过使用4-15％梯度凝胶的SDS-PAGE进行分析。

细胞提取物也从3小时的培养物中如下制备：在轻微摇动下，于室温下，将来自5mL培养物的细胞沉淀物悬浮在含有benzonase核酸酶和蛋白酶抑制剂混合物组#3(Calbiochem-NovabiochemCorp.,SanDiego,CA)的NovagenBugBuster^TM试剂中20分钟，并在16,000×g下离心除去细胞碎片。上清液(细胞提取物)被点样在4-15％梯度凝胶上以分析细胞可溶性蛋白。

来自克隆的腐臭假单胞菌精氨酸消旋酶的3小时样品显示出在pET30(无标记)载体中对应于正确大小(大约45kDa)的总蛋白条带。腐臭假单胞菌pET30基因产物以比腐臭假单胞菌pET28(组氨酸标记)基因产物更高的水平被过量表达，但是两种载体都不给出可观察到的可溶性蛋白的条带。

来自诱导的培养物(100mL)的细胞被离心并且用0.85％NaCl洗涤一次。细胞沉淀物以5mL/克湿细胞重量的比例被重悬浮在含有5μL/mL蛋白酶抑制剂混合物#3组(Calbiochem-NovabiochemCorp.,SanDiego,CA)和1μL/mLbenzonase核酸酶的BugBuster^TM(Novagen,Madison,WI)试剂中。样品在轨道式摇床(orbitalshaker)上室温下温育20分钟。不溶的细胞碎片通过在4℃于16,000×g离心20分钟除去。

使用以下方案测定细胞提取物的色氨酸消旋酶活性。在50mM磷酸钾(pH8.0)，0.05mMPLP和30mML-色氨酸中进行1mL的反应。该反应通过加入不含细胞的提取物起始并在30℃温育过夜。样品的等分试样在过夜温育后取出(0分钟样品作为对照反应)。浓甲酸(5μL)被加入每个250μL的样品等分试样中以停止反应，并且沉淀的蛋白通过离心除去。上清液被移出，并在-80℃冷冻直到它们由实施例1所述的手性氨基酸法分析D-色氨酸。

来自用100mMIPTG诱导(3小时)的pET28和pET30细胞提取物的测定结果显示，腐臭假单胞菌克隆对L-色氨酸显示出消旋酶活性。并且，与无标记的形式(pET28)相比，BAR的标记形式似乎活性较小，并且可能沉淀或溶解性较小。下面的表44，显示了初始的结果，尽管因为得到溶解性很差的蛋白而没有定量。

表44

处理

时间点

底物

消旋酶提取物

D-色氨酸浓度

			(200μg)	(μg/mL)
					pET28/腐臭假单胞菌	0	L-trp	500μL	nd
pET30/腐臭假单胞菌	0	L-trp	500μL	nd
					pET28/腐臭假单胞菌	过夜	L-trp	500μL	140
pET30/腐臭假单胞菌	过夜	L-trp	500μL	226

pET30(无标记的)构建物的诱导使用上述相同的条件被重复进行，并且可见的可溶性蛋白条带在SDS-PAGE上被观察到。该测定使用上述相同的条件重复并得到结果，如下面的表45所示。

表45

而且，注意到加倍体积并不成比例地提高活性。对于进一步的工作，决定在细胞提取物制备后从Bugbuster中尽快移除蛋白，并决定在含有0.01mMPLP的50mM磷酸盐缓冲液pH8中储存蛋白。Bugbuster中的去污剂可能抑制反应或可能在储存时引起活性的损失。

pET30构建物的诱导再次进行，并且细胞提取物用阴离子交换色谱处理(如实施例28中)以给出更纯的提取物。该测定用部分纯化的制备物重复进行。下文表46的消旋酶提取物一列中的括号内的数字表明测定中使用的部分纯化的消旋酶的大概数量。测试的结果显示于下面的表46中。

表46

在本例中过夜样品的非线性可能是由于反应达到平衡的原因。明显地，腐臭假单胞菌BAR对色氨酸的消旋作用具有显著的活性，12996BAR和KT2440BAR也一样。似乎KT2440BAR与腐臭假单胞菌BAR具有相似的活性，其比12996BAR稍高。

腐臭假单胞菌精氨酸消旋酶的DNA序列如下显示为SEQIDNO:410。PCR序列与公开的NCBI序列相比，产生了两个变化。特别地，PCR序列在902位上包含腺嘌呤而非鸟嘌呤，在921位上包含胞嘧啶而非鸟嘌呤。这些DNA变化导致一个静默突变以及一个在氨基酸301位的甘氨酸到天冬氨酸的变化。

ATGCCCTTCTCCCGTACCCTGCTCGCCCTTTCCCTTGGCATGGCATTGCTGCAAAACCCGGCCTTTGCTGCGCCACCCCTGTCGATGACCGACGGCGTAGCTCAAGTGAATACCCAGGACAGCAATGCCTGGGTCGAAATCAATAAAGCCGCGTTCGAGCACAACATACGGACTCTGCAAACCGCCCTCGCCGGCAAGTCGCAGATCTGCGCCGTACTCAAGGCGGATGCCTATGGCCACGGTATCGGCTTGTTGATGCCCTCGGTGATCGCCATGGGTGTTCCCTGTGTCGGTGTCGCCAGCAACGAAGAAGCCCGCGTCGTGCGCGAGAGCGGTTTCAAGGGTCAACTGATACGCGTGCGCACCGCTGCCCTGAGCGAACTGGAAGCTGCACTGCCGTACAACATGGAAGAGCTGGTGGGCAACCTGGACTTCGCGGTCAAGGCCAGCCTGATTGCCGAGGATCACGGTCGCCCGCTGGTGGTGCACCTGGGTCTGAATTCCAGCGGCATGAGCCGTAACGGAGTGGACATGACCACCGCTCAGGGCCGTCGTGATGCGGTAGCTATCACCAAGGTGCCAAACCTGGAAGTGCGGGCGATCATGACCCACTTCGCGGTCGAAGATGCTGCCGACGTGCGTGCCGGGCTCAAGGCCTTCAATCAGCAAGCCCAATGGCTGATGAACGTGGCCCAGCTTGATCGCAGCAAGATCACCCTGCACGCGGCCAACTCGTTCGCCACACTGGAGGTGCCCGAATCGCATCTGGACATGGTCCGCCCCGGCGGCGCGCTGTTCGGCGACACCGTACCGTCCCACACCGAGTACAAGCGGGTCATGCAGTTCAAGTCCCACGTGGCGTCGGTCAACAGCTACCCCAAGGGCAACACCGTCGGTTATGACCGCACGTACACCCTGGGCCGCGACTCGCGGCTGGCCAACATCACCGTCGGCTACTCTGACGGCTACCGCCGCGCGTTTACCAATAAAGGGATTGTGCTGATCAACGGCCATCGCGTGCCAGTGGTGGGCAAAGTCTCGATGAACACCCTGATGGTGGACGTCACTGACGCGCCGGATGTGAAAAGCGGCGATGAAGTGGTGCTGTTCGGGCACCAGGGCAAGGCCGAGATTACCCAGGCTGAGATCGAAGACATCAACGGTGCACTGCTTGCGGATCTGTATACCGTGTGGGGCAATTCCAACCCTAAAATCCTGAAAGATCAGTAA

(SEQIDNO:410).

由SEQIDNO:410基因编码的蛋白通过单肽预测程序SignalP3.0(www.cbs.dtu.dk/services/SignalP/)分析，并且预测了23个氨基酸的前导序列。

腐臭假单胞杆菌BAR的I384M诱变

诱变使用QuickChange-Multi位点定向诱变试剂盒(Stratagene,LaJolla,CA)，并使用产生无标记蛋白的在pET30中的腐臭假单胞菌BAR基因完成。以下诱变引物被用于产生I384M变化：5′-TACCCAGGCTGAGATGGAAGACATCAACG-3′(SEQIDNO:411)。

位点定向诱变按制造商的方案所述完成。若干分离物被测序(Agencourt,Beverly,MA)，选择带有正确序列的分离物并被用于进一步研究。

质粒被转化进BL21(DE3)细胞(Novagen,Madison,WI)。重组蛋白在含有50μg/mL卡那霉素的过夜表达II培养基(Novagen,Madison,WI)中根据制造商的方案产生。无细胞提取物使用BugBuster(Novagen,Madison,WI)根据制造商的方案制备，脱盐，并使用上述Experion方法分析目标蛋白的表达百分比。

总蛋白测定使用PierceBCA试剂盒(Pierce,Rockford,IL)完成。使用突变酶的色氨酸消旋酶测定使用以相同方式制备的野生型酶作为阳性对照进行。每1mL测定包含：30mML-色氨酸，50mM磷酸钾pH8，10μMPLP和以无细胞提取物形式的约100μg消旋酶蛋白。在没有使用100μg的情况下(基于Experion表达百分数和Pierce总蛋白数值)，结果被标准化。收集0、30分钟、2小时和过夜的样品，用2％甲酸处理，过滤，并1:10稀释以使用实施例1所述的手性氨基酸法分析。

野生型酶似乎在30分钟内产生49.1ppmD-色氨酸，而I384M突变体产生108ppm。2小时的时间点相似——野生型酶产生229.4ppmD-色氨酸，而I384M突变体产生541.7ppm。I384M突变体似乎具有大约双倍的腐臭假单胞菌BAR的活性。突变体的过夜时间点也较高，但是随着反应接近平衡，活性之间的差异降低。当如实施例28所述对monatin产生进行测定时，I384M没有表现提供优于野生型腐臭假单胞菌酶的任何好处。

实施例30

豚鼠气单胞菌(A.caviae)提取物测定

豚鼠气单胞菌(Aeromonascaviae)ATCC14486在营养培养液中37℃生长。来自培养物(200mL)的细胞被离心并且用0.85％NaCl洗涤一次。细胞沉淀物以5mL/克湿细胞重量的比例被悬浮在含有5μL/mL蛋白酶抑制剂混合物#3组(Calbiochem-NovabiochemCorp.,SanDiego,CA)和1μL/mLbenzonase核酸酶的BugBuster^TM(Novagen,Madison,WI)试剂中。样品在轨道式摇床上室温下温育20分钟。不溶的细胞碎片通过在4℃于16,000×g离心20分钟除去。无细胞的提取物在PD-10柱(GEHealthcare,Piscataway,NJ)上脱盐。

使用以下方案测定无细胞提取物的色氨酸消旋酶活性。在50mM磷酸钾(pH8.0)，0.05mMDTT和30mML-色氨酸中进行1mL的反应。该反应通过加入不含细胞的提取物(100μL或500μL)起始并在30℃温育过夜。样品等分试样在2小时和过夜温育后取出(0分钟样品作为对照反应)。浓甲酸(5μL)被加入每个250μL的样品等分试样中以停止反应，并且沉淀的蛋白通过离心除去。上清液被移出并在-80℃冷冻直到它们由实施例1所述的手性氨基酸法分析D-色氨酸。

如表47所示，豚鼠气单胞菌细胞提取物的测定结果显示对L-色氨酸的消旋酶活性。

表47

在豚鼠气单胞菌细胞提取物中发现活性之后，设计简并引物(基于已知BAR同系物的保守区)以获从该种中获得BAR基因。简并引物的序列如下所示：

AerdegF2：5′-GCCAGCAACGARGARGCMCGCGT-3′(SEQIDNO:412)；和

AerdegR1:5′-TGGCCSTKGATCAGCACA-3′(SEQIDNO:413)

其中K表示G或T，R表示A或G，S表示C或G，以及M表示A或C。

上述引物被用于从豚鼠气单胞菌(ATCC14486)基因组DNA中PCR扩增715bp的DNA片段。使用以下PCR方案：50μL反应含有0.5μL模板(约100ng豚鼠气单胞菌基因组DNA)，1.6μM每种引物，0.3mM每种dNTP，10UrT^th聚合酶XL(AppliedBiosystems,FosterCity,CA)，1XXL缓冲液，1mMMg(OAc)₂和2.5μL二甲基亚砜。所用的热循环仪程序包括：94℃热启动3分钟和以下步骤的30次重复：94℃30秒，53℃30秒和68℃2分钟。30次重复后，样品被保持在68℃7分钟并随后保存于4℃。该PCR方案产生715bp的产物。

克隆

PCR产物使用Qiagen凝胶提取试剂盒(Qiagen,Valencia,CA)从0.8％TAE-琼脂糖凝胶中被凝胶纯化。产物被TOPO克隆并根据制造商的方案(Invitrogen,Carlsbad,CA)被转化进TOP10细胞中。质粒DNA使用Qiagen离心小量制备试剂盒(Qiagen,Valencia,CA)从产生的转化体中被纯化，并通过用EcoRI限制性消化筛选正确的插入片段。似乎具有正确插入片段的质粒的序列通过使用通用M13正向和M13反向引物的双脱氧链终止DNA测序证实。

豚鼠气单胞菌PCR产物的DNA序列如下面SEQIDNO:414所示，简并引物序列区域被加下划线：

GCCAGCAACGARGARGCMCGCGTTGCCCGCGAGAAGGGCTTCGAAGGTCGCCTGATGCGGGTACGTGCCGCCACCCCGGATGAAGTGGAGCAGGCCCTGCCCTACAAGCTGGAGGAGCTCATCGGCAGCCTGGAGAGCGCCAAGGGGATCGCCGACATCGCCCAGCGCCATCACACCAACATCCCGGTGCACATCGGCCTGAACTCCGCCGGCATGAGCCGCAACGGCATCGATCTGCGCCAGGACGATGCCAAGGCCGATGCCCTGGCCATGCTCAAGCTCAAGGGGATCACCCCGGTCGGCATCATGACCCACTTCCCGGTGGAGGAGAAAGAGGACGTCAAGCTGGGGCTGGCCCAGTTCAAGCTGGACTACCAGTGGCTCATCGACGCCGGCAAGCTGGATCGCAGCAAGCTCACCATCCACGCCGCCAACTCCTTCGCCACCCTGGAAGTACCGGAAGCCTACTTTGACATGGTGCGCCCGGGCGGCATCATCTATGGCGACACCATTCCCTCCTACACCGAGTACAAGAAGGTGATGGCGTTCAAGACCCAGGTCGCCTCCGTCAACCACTACCCGGCGGGCAACACCGTCGGCTATGACCGCACCTTCACCCTCAAGCGCGACTCCCTGCTGGCCAACCTGCCGATGGGCTACTCCGACGGCTACCGCCGCGCCATGAGCAACAAGGCCTATGTGCTGATCMASGGCCA

(SEQIDNO:414)，其中R表示A或G，S表示C或G，以及M表示A或C。

部分豚鼠气单胞菌BAR酶的氨基酸序列如下面SEQIDNO:415所示

ASNEEARVAREKGFEGRLMRVRAATPDEVEQALPYKLEELIGSLESAKGIADIAQRHHTNIPVHIGLNSAGMSRNGIDLRQDDAKADALAMLKLKGITPVGIMTHFPVEEKEDVKLGLAQFKLDYQWLIDAGKLDRSKLTIHAANSFATLEVPEAYFDMVRPGGIIYGDTIPSYTEYKKVMAFKTQVASVNHYPAGNTVGYDRTFTLKRDSLLANLPMGYSDGYRRAMSNKAYVLIXG

其中X为H、Q、N或K(SEQIDNO:415)。

上述SEQIDNO:415的共有蛋白序列片段与公开的嗜水气单胞菌(A.hydrophila)TIGR序列在氨基酸水平上89％同源。预期因为高度相关的嗜水气单胞菌蛋白，以及豚鼠气单胞菌显示出宽特异性消旋酶活性，一旦获得豚鼠气单胞菌的全长编码区，将产生对色氨酸活性也具有宽特异性的消旋酶。基因组步移方法被用于获得如下文SEQIDNO:416所示的豚鼠气单胞菌BAR基因的全长基因序列。

(SEQIDNO:416)。

豚鼠气单胞菌天然BAR的对应氨基酸序列如下文SEQIDNO:417所示：

(SEQIDNO:417)。

SEQIDNO:417的前21个N端氨基酸残基使用SignalP3.0(www.cbs.dtu.dk/services/SignalP/)程序被预期是信号肽。实验证据证实表达产物被分泌进大肠杆菌的外周胞质，并且该信号肽如预期被剪切。当使用上述方法被克隆并表达时，全长基因被发现具有与腐臭假单胞菌BAR相当，但比其高的活性。

实施例31

SEQIDNO:276的醛缩酶在可选表达宿主中的产生

SEQIDNO:275的基因使用标准分子生物学步骤被克隆进pET23d载体(Novagen,Madison,WI)的衍生物中，其含有大肠杆菌metE基因并且启动子被插在NgoMIV限制性酶切位点和第二个psiI限制性位点的启动子，该限制性位点被加入以方便去除β内酰胺酶基因(bla)。含有myo-肌醇加氧酶基因插入片段的这种载体的构建在PCTWO2006066072的实施例2和20中描述。醛缩酶插入片段通过DNA测序(AgencourtBioscienceCorporation；Beverly,MA)证实，并且带有正确插入片段序列的质粒被转化进大肠杆菌表达宿主BW30384(DE3)ΔompTΔmetE。该表达宿主的构建和转化方案也在PCTWO2006066072(实施例21和22)中描述。醛缩酶基因使用含有100mg/L氨苄青霉素的NovagenOvernightExpress^TM自动诱导系统II(AutoinductionSystemII)(Novagen,Madison,WI)表达。该系统在用于球形芽孢杆菌(ATCC菌株10208)D-丙氨酸氨基转移酶表达的实施例24中描述。含有醛缩酶的无细胞提取物使用含有1μL/mLbenzonase核酸酶，0.033μL/mLr-Lysozyme和5μL/mL蛋白酶抑制剂混合物II组的NovagenBugBuster^TM提取试剂(不含伯胺)(Novagen,Madison,WI)，根据制造商推荐的用于细胞裂解的方案产生。无细胞提取物中的可溶性蛋白在Bio-RadLaboratoriesExperion^TM自动电泳系统(AutomatedElectrophoresisStation)(Bio-Rad,Hercules,CA)上分离，并使用实施例12所述的Experion软件1.1.98.0版分析可溶性蛋白表达的百分比。

为了尝试提高大肠杆菌中醛缩酶的表达，DNA编码序列的密码子2-7被突变为使用RocheProteoExpertRTS大肠杆菌HY算法(E.coliHYalgorithm)进行野生型序列分析所建议的改变。该改变如下进行：使用多位点定向诱变试剂盒或IIXL位点定向诱变试剂盒(Stratagene,LaJolla,CA)，根据制造商建议的方案，每25μL反应混合物用0.75μLQuik溶液，并转化进超感受态细胞。突变使用这样的引物(每个长度45个核苷酸)产生，该引物使用可在www.stratagene.com.qcprimerdesign在线获得的Stratagene基于网络的引物设计程序进行设计。

表48

带有上述密码子改变的醛缩酶基因序列被转化进大肠杆菌表达宿主BW30384(DE3)ΔompTΔmetE，并随后使用NovagenOvernightExpress^TM自动诱导系统II(AutoinductionSystemII)(Novagen,Madison,WI)表达。当与野生型序列比较时，这些序列突变中没有一个产生更高水平的基因表达。由Bio-RadExperionPro260软件1.1.98.0分析得到的无细胞提取物的典型结果显示于下表49中，其中标题为蛋白表达的列显示总可溶性蛋白的百分比值。

使用实施例7所述的方案，测定无细胞提取物(每个测定0.025mg/mL可溶性蛋白)从200mM丙酮酸钠和100mMD-色氨酸产生R,R-monatin的能力。该反应(7mL总体积)使用终浓度2mg/mL的纯化球形芽孢杆菌(ATCC10208)D-氨基转移酶在厌氧手套箱内的14mL聚乙烯管中进行。加入酶后，在1、4和20小时产生的monatin浓度显示于下表49中。表49显示了，由含有野生型醛缩酶序列的构建物产生的无细胞提取物在20小时比携带ProteoExpert突变的构建物的无细胞提取物产生稍高浓度的monatin。Monatin浓度由实施例1所述的LC/MS/MS方法确定。

表49

这些数据显示，SEQIDNO:276的醛缩酶可以不用IPTG诱导，在可选的表达宿主中产生。

bla基因从载体中除去并且产生醛缩酶的后续发酵在不使用PCTWO2006066072中描述的用于另一种酶的抗生素的情况下进行。根据Experion数据，在30℃补料分批发酵(fed-batchfermentation)中的表达水平在诱导后6-8小时达到最大值，以25-30％可溶性蛋白的水平产生SEQIDNO:276的醛缩酶。稳定性研究显示，细胞浓缩和破碎前，当发酵产物在15或30℃(在限制氧气的条件下以及通气的条件下)被放置6小时，没有明显的醛缩酶活性损失。当被储存在-80℃5天时，醛缩酶被发现与无细胞提取物或与细胞沉淀物一样稳定的储存。-80℃储存前不要求在缓冲液中清洗细胞沉淀物，并且清洗实际上引起活性的稍微降低。当在室温或4℃储存11天时，在蒸馏水、发酵上清液或100mM磷酸钾缓冲液(pH7.8)中重悬浮的细胞被发现没有活性或蛋白浓度(由SDS-PAGE判断)损失。当储存在4℃或室温5天时，磷酸钾缓冲液中产生的无细胞提取物没有显示醛缩酶活性损失。细胞可以在磷酸盐缓冲液，达25％的培养上清液或水中被破碎而具有相当的醛缩酶活性恢复；但是，向水中加入1mMMgCl₂被发现稍微提高醛缩酶的活性。这些数据显示，醛缩酶蛋白对商业用途来说足够稳定。

已经描述了本发明的多个实施方式。本发明的实施方式包括一个或多个上述方面。应该理解，可在不背离依据本发明的精神和范围的情况下做出各种修改。因此，其它实施方式在所附权利要求书的范围内。

Claims

1.分离的，合成的或重组的核酸，其编码具有醛缩酶活性的多肽，所述核酸为：

(a)SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:111、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163、SEQIDNO:165、SEQIDNO:167、SEQIDNO:169、SEQIDNO:171、SEQIDNO:173、SEQIDNO:175、SEQIDNO:177、SEQIDNO:179、SEQIDNO:181、SEQIDNO:183、SEQIDNO:185、SEQIDNO:187、SEQIDNO:189、SEQIDNO:191、SEQIDNO:193、SEQIDNO:195、SEQIDNO:197、SEQIDNO:199、SEQIDNO:201、SEQIDNO:203、SEQIDNO:205、SEQIDNO:207、SEQIDNO:209、SEQIDNO:211、SEQIDNO:213、SEQIDNO:215、SEQIDNO:217、SEQIDNO:219、SEQIDNO:221、SEQIDNO:223、SEQIDNO:225、SEQIDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO:237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245、SEQIDNO:247、SEQIDNO:249、SEQIDNO:251、SEQIDNO:253、SEQIDNO:255、SEQIDNO:257、SEQIDNO:259、SEQIDNO:261、SEQIDNO:263、SEQIDNO:265、SEQIDNO:267、SEQIDNO:269、SEQIDNO:271、SEQIDNO:273、SEQIDNO:277、SEQIDNO:279、SEQIDNO:281、SEQIDNO:283、SEQIDNO:285、SEQIDNO:287、SEQIDNO:289、SEQIDNO:291、SEQIDNO:293、SEQIDNO:295、SEQIDNO:297、SEQIDNO:299、SEQIDNO:301、SEQIDNO:303、SEQIDNO:305、SEQIDNO:307、SEQIDNO:309、SEQIDNO:311、SEQIDNO:313、SEQIDNO:315、SEQIDNO:317、SEQIDNO:319、SEQIDNO:321、SEQIDNO:323、SEQIDNO:325、SEQIDNO:327、SEQIDNO:329、SEQIDNO:331、SEQIDNO:333、SEQIDNO:335、SEQIDNO:336、SEQIDNO:337或SEQIDNO:338；

(b)编码SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334的序列的核酸；

(c)与(a)或(b)互补的核酸序列。

2.权利要求1所述的核酸，其中所述醛缩酶活性是丙酮酸醛缩酶活性。

3.权利要求1所述的核酸，其中所述醛缩酶活性是HMG醛缩酶活性。

4.权利要求1所述的核酸，其中所述醛缩酶活性是KHG醛缩酶活性。

5.表达盒，其包括权利要求1中所述的序列。

6.权利要求5所述的表达盒，其中所述表达盒是载体。

7.权利要求6所述的表达盒，其中所述载体是克隆载体。

8.权利要求7所述的表达盒，其中所述克隆载体是病毒载体、质粒或人工染色体。

9.权利要求8所述的表达盒，其中所述病毒载体是噬菌体。

10.权利要求9所述的表达盒，其中所述噬菌体是噬菌粒或细菌噬菌体。

11.权利要求8所述的表达盒，其中所述质粒是粘粒。

12.权利要求11所述的表达盒，其中所述粘粒是F粘粒。

13.权利要求8所述的表达盒，其中所述病毒载体选自腺病毒载体或反转录病毒载体，或所述人工染色体包括细菌人工染色体、细菌噬菌体P1-衍生的载体或哺乳动物人工染色体。

14.转化的细胞，其包括权利要求1中所述的核酸，或包括权利要求5-7中任一项所述的表达盒，其中所述细胞选自细菌细胞、哺乳动物细胞、真菌细胞、昆虫细胞或植物细胞。

15.分离的、合成的或重组的多肽，其具有醛缩酶活性，所述多肽为下列氨基酸序列中所述的多肽：

(a)氨基酸序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164、SEQIDNO:166、SEQIDNO:168、SEQIDNO:170、SEQIDNO:172、SEQIDNO:174、SEQIDNO:176、SEQIDNO:178、SEQIDNO:180、SEQIDNO:182、SEQIDNO:184、SEQIDNO:186、SEQIDNO:188、SEQIDNO:190、SEQIDNO:192、SEQIDNO:194、SEQIDNO:196、SEQIDNO:198、SEQIDNO:200、SEQIDNO:202、SEQIDNO:204、SEQIDNO:206、SEQIDNO:208、SEQIDNO:210、SEQIDNO:212、SEQIDNO:214、SEQIDNO:216、SEQIDNO:218、SEQIDNO:220、SEQIDNO:222、SEQIDNO:224、SEQIDNO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244、SEQIDNO:246、SEQIDNO:248、SEQIDNO:250、SEQIDNO:252、SEQIDNO:254、SEQIDNO:256、SEQIDNO:258、SEQIDNO:260、SEQIDNO:262、SEQIDNO:264、SEQIDNO:266、SEQIDNO:268、SEQIDNO:270、SEQIDNO:272、SEQIDNO:274、SEQIDNO:278、SEQIDNO:280、SEQIDNO:282、SEQIDNO:284、SEQIDNO:286、SEQIDNO:288、SEQIDNO:290、SEQIDNO:292、SEQIDNO:294、SEQIDNO:296、SEQIDNO:298、SEQIDNO:300、SEQIDNO:302、SEQIDNO:304、SEQIDNO:306、SEQIDNO:308、SEQIDNO:310、SEQIDNO:312、SEQIDNO:314、SEQIDNO:316、SEQIDNO:318、SEQIDNO:320、SEQIDNO:322、SEQIDNO:324、SEQIDNO:326、SEQIDNO:328、SEQIDNO:330、SEQIDNO:332或SEQIDNO:334；

(b)由权利要求1所述核酸编码的氨基酸序列。

16.权利要求15所述的分离的、合成的或重组的多肽，其中所述醛缩酶活性包括丙酮酸醛缩酶活性。

17.权利要求15所述的分离的、合成的或重组的多肽，其中所述醛缩酶活性包括HMG醛缩酶活性。

18.权利要求15所述的分离的、合成的或重组的多肽，其中所述醛缩酶活性包括KHG醛缩酶活性。

19.包含权利要求15中所述多肽的蛋白制剂，其中所述蛋白制剂是液体、固体或凝胶。

20.制备转基因植物的方法，包括：

(a)向所述细胞中引入权利要求1的异源核酸序列，由此产生转化的植物细胞；

(b)从所述转化的细胞产生转基因植物，

其中任选地，步骤(a)进一步包括通过植物细胞原生质体的电穿孔或显微注射导入所述异源核酸序列，

并且任选地，步骤(a)包括通过DNA微粒轰击或通过使用根瘤农杆菌宿主将所述异源核酸序列直接导入植物组织中。

21.在植物细胞中表达异源核酸序列的方法，包括：

(a)用可操作地连接到启动子的权利要求1中所述的异源核酸序列转化所述植物细胞；

(b)在所述植物细胞表达所述异源核酸序列的条件下培养所述植物。

22.在组合物中切割碳-碳键的方法，包括以下步骤：

(a)提供权利要求15到18中任一项所述具有醛缩酶活性的多肽，或由权利要求1到4中任一项所述核酸编码的多肽；

(b)提供包含碳-碳键的组合物；和

(c)在所述醛缩酶切割所述组合物中所述碳-碳键的条件下，使步骤(a)所述的多肽与步骤(b)所述的组合物接触，

其中任选地，所述多肽具有丙酮酸醛缩酶、HMG醛缩酶和/或KHG醛缩酶活性。

23.形成碳-碳键的方法，包括以下步骤：

(b)提供供体和受体化合物；和

(c)在所述醛缩酶形成所述碳-碳键的条件下，使步骤(a)所述的多肽与步骤(b)所述的化合物接触，

24.面团或面包产物，其包含权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽，其中任选地，所述多肽具有醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性。

25.面团处理的方法，包括在足以处理所述面团的条件下，使面团或面包产物与权利要求15到18中任一项所述的至少一种多肽，或由权利要求1到4中任一项所述核酸编码的多肽接触。

26.饮料，其含有权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽，其中任选地，所述多肽具有丙酮酸醛缩酶，HMG醛缩酶和/或KHG醛缩酶活性。

27.饮料生产的方法，包括在足以降低所述饮料粘度的条件下，给予饮料或饮料前体至少一种权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽，

其中任选地，所述饮料或饮料前体是麦芽汁或啤酒。

28.食品添加剂、饲料添加剂、饮料添加剂或营养补充剂，含有权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽，其中任选地，所述多肽具有醛缩酶，例如丙酮酸醛缩酶，例如HMG和/或KHG醛缩酶活性。

29.在动物膳食中利用醛缩酶作为营养补充剂的方法，所述方法包括：

制备包含醛缩酶的营养补充剂，所述醛缩酶包含权利要求15到18中任一项所述多肽，或由权利要求1到4中任一项所述核酸编码的多肽的至少30个连续氨基酸；和

给予动物所述营养补充剂，

其中任选地，所述动物是人类，或所述动物是反刍动物或单胃动物，

并且任选地，所述醛缩酶通过在选自细菌、酵母、植物、昆虫、真菌和动物的生物体中表达编码所述醛缩酶的多核苷酸而制备出来，以及任选地，所述生物体选自粟酒裂殖酵母、酿酒酵母、巴斯德毕赤酵母、大肠杆菌、链霉菌属某种、杆菌属某种和乳酸杆菌属某种。

30.可食用酶输送基质或小丸，其包含热稳定重组醛缩酶，所述醛缩酶包括权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽，其中任选地，所述多肽具有醛缩酶，例如丙酮酸醛缩酶，例如HMG和/或KHG醛缩酶活性。

31.向动物输送醛缩酶补充剂的方法，所述方法包括：制备含有颗粒状可食用载体和热稳定重组醛缩酶的可食用酶输送基质或小丸，其中所述的小丸容易将包含在其中的醛缩酶分散至含水介质中，并且所述重组醛缩酶包括权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽；和给予所述动物所述可食用的酶输送基质或小丸，

其中任选地，所述颗粒状可食用载体包括选自谷物胚芽、去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽粉和小麦粗粉的载体，

并且任选地，所述可食用载体包含去油的谷物胚芽，

并且任选地，所述醛缩酶被糖基化以在制丸的条件下提供热稳定性，

并且任选地，所述输送基质通过将含有谷物胚芽和醛缩酶的混合物制丸而形成，

并且任选地，所述制丸条件包括应用蒸汽，以及可选地，所述制丸条件包括应用超过大约80℃的温度大约5分钟，所述酶保留每毫克酶至少350至大约900单位的比活性。

32.食品或饲料，包含权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽，其中任选地，所述多肽具有包括醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的活性。

33.制备食品或饲料的方法，包括使组合物与权利要求15到18中任一项所述的多肽，或由权利要求1到4中任一项所述核酸编码的多肽接触，所述组合物包括含有碳-碳键的化合物，

其中任选地，所述多肽具有包括醛缩酶，如丙酮酸醛缩酶，如HMG和/或KHG醛缩酶活性的活性。

34.包含多肽的组合物，所述多肽如权利要求15到18中任一项所述，或所述多肽由包含权利要求1到4中任一项所述序列的核酸编码。

35.权利要求15所述的多肽，其没有信号序列。

36.权利要求15所述的多肽，其进一步包含异源序列。

37.权利要求15所述的多肽，其中所述多肽是具有醛缩酶活性的片段。