CN104651381A

CN104651381A - 转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法

Info

Publication number: CN104651381A
Application number: CN201510035759.8A
Authority: CN
Inventors: D·威纳; P·路金布厄; A·布埃诺; J·昆卡; E·马拉斯科
Original assignee: BASF Enzymes LLC
Current assignee: BASF Enzymes LLC
Priority date: 2008-01-03
Filing date: 2008-12-31
Publication date: 2015-05-27
Also published as: JP2011514141A; US20170009215A1; JP2014209913A; US8709772B2; EP2865750A3; DK2238242T5; EP2238242B9; AU2008347234A1; JP6165903B2; AU2008347234B2; PL2238242T3; US20140165221A1; EP2238242A4; CN101965397B; JP5563990B2; CN101965397A; US9399763B2; US20110033391A1; ES2531290T3; DK2238242T3

Abstract

本发明一般涉及酶、编码酶的多核苷酸、这些多核苷酸和多肽的应用，以及更具体而言，涉及这样的酶：所述酶具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，和/或催化化学基团的转移，催化转氨作用，催化下列反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化还原反应，催化氢原子的去除，和/或催化下列反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。因此，本发明提供用于产生包括根据本发明所述的多肽或多核苷酸的制药(药物)组合物、制药(药物)中间体、抗生素、甜味剂、肽酶、肽类激素、燃料、燃料添加剂组合物、食品和食品添加剂、饮料和饮料添加剂、饲料和饲料添加剂、药物和药物添加剂、食物补充物、纺织品、木材、纸、浆和清洁剂的酶、方法。

Description

转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法

本申请为分案申请，原申请的申请日为2008年12月31日，申请号为200880127771.X(PCT/US2008/088675)，发明名称为“转移酶和氧化还原酶、编码它们的核酸以及其制备和应用方法”。

参考通过EFS-WEB提交的序列表

本申请通过USPTO EFS-WEB服务器电子提交，如在MPEP§1730II.B.2.(a)(A)所批准并阐明的，并且该电子提交包括电子提交的序列(SEQ ID)表；该序列表的全部内容通过引用并入本文，用于所有目的。该序列表根据如下电子提交的.txt文件确定：

文件名	创建日期	大小
			564462016340SeqList.txt	2008年12月30日	3,566,371字节

相关申请

本申请要求2008年1月3日提交的美国临时专利申请号61/018,868在35U.S.C.§119(e)下的优先权权益。上述申请以其全部内容通过引用清楚地并入本文并且用于所有目的。

技术领域

本发明一般涉及酶、编码酶的多核苷酸、这些多核苷酸和多肽的应用，以及更具体而言，涉及这样的酶：所述酶具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，和/或催化化学基团的转移，催化转氨作用，催化下列反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化还原反应，催化氢原子的去除，和/或催化下列反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。因此，本发明提供用于产生包括根据本发明所述的多肽或多核苷酸的制药(药物)组合物、制药(药物)前体和/或中间体(包括抗生素)甜味剂、肽酶、肽类激素、燃料、燃料添加剂组合物、食品和食品添加剂、饮料和饮料添加剂、饲料和饲料添加剂、药物和药物添加剂、食物补充物、纺织品、木材、纸、浆和清洁剂的酶、组合物和/或方法。

背景技术

转移酶和/或氧化还原酶催化化学基团的转移，催化转氨作用，催化下列反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化还原反应，催化氢原子的去除，和/或催化下列反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。转移酶，例如转氨酶，例如d-氨基酸转移酶(也被称为“d-氨基转移酶”或“D-ATs”)，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶具有相当大的商业价值，被用于制药行业；食品、饲料和饮料工业，例如用于生产甜味剂；用于木材/纸工业；和用于燃料工业。

发明内容

本发明提供这样的酶，所述酶具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，和/或催化化学基团的转移，催化转氨作用，催化下列反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化还原反应，催化氢原子的去除，和/或催化下列反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。本发明进一步提供这样的酶，所述酶具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性；以及编码它们的核酸，包含它们的载体和细胞，用于扩增和鉴定编码这些转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸的探针，以及制备和应用这些多肽和肽的方法。

本发明提供用于产生包括根据本发明所述的多肽或多核苷酸的制药(药物)组合物、制药(药物)前体和/或中间体(包括抗生素)甜味剂、肽酶、肽类激素、燃料和燃料添加剂组合物、食品和食品添加剂、饮料和饮料添加剂、饲料和饲料添加剂、药物和药物添加剂、食物补充物、纺织品、木材、纸、浆和清洁剂的酶、组合物和/或方法。这些组合物可以各种形式诸如片剂、凝胶、丸剂、植入物、液体、喷剂、薄膜、微囊、粉末、食品、饲料小球或任何类型的胶囊形式配制。

在一些实施方式中，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，和/或其组合可在制药、工业和/或农业背景下使用。

在一些实施方式中，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或其组合可用于催化氨基酸和α-酮酸之间的反应。在一些实施方式中，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或其组合可用于催化转氨反应。在一些实施方式中，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或其组合可用于催化这样的反应，所述反应从氨基酸中去除去氨基，留下α-酮酸，并且将所述氨基转移到将其转化成氨基酸的反应物α-酮酸。在可选的实施方式中，转移酶，例如转氨酶，例如d-氨基酸转移酶和/或其组合可用于生产氨基酸。

在一些实施方式中，氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，和/或其组合可用于催化这样的反应，所述反应通过将一个或多个质子和一对电子转移到受体而氧化底物。

在一些实施方式中，氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，和/或其组合可用于催化这样的反应，所述反应将电子从一种分子转移至另一种。在一些实施方式中，氧化还原酶和/或其组合可用于催化这样的反应，所述反应将电子从还原剂转移至氧化剂。

在一些实施方式中，提供了促进吲哚-3-丙酮酸产生的转移酶，例如转氨酶，例如d-氨基酸转移酶。在一些实施方式中，提供了促进RR-Monatin产生的转移酶，例如转氨酶，例如d-氨基酸转移酶。

在可选的实施方式中，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，和/或其组合物可用于诊断和跟踪许多疾病，例如肝损伤/疾病或心肌梗塞。在可选的实施方式中，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，和/或其组合被用在用于诊断、跟踪或治疗任何病症和/或疾病例如肝损伤/疾病或心肌梗塞的制药(药物)组合物。

在可选的实施方式中，本发明提供这样的酶和方法，其用于将任何生物质生物转化成燃料，例如生物燃料，例如乙醇、丙醇、丁醇、甲醇和/或生物柴油或生物燃料诸如合成液体或气体，诸如合成气，以及产生其它发酵产物例如琥珀酸、乳酸或醋酸。

在可选的实施方式中，本发明提供这样的多肽(和编码它们的核酸)，其具有至少一个保守性氨基酸置换并且保留其转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性；或者，其中所述至少一个保守性氨基酸置换包括用另一类似特征的氨基酸置换氨基酸；或者，保守性置换包括：用另一脂肪族氨基酸替换脂肪族氨基酸；用苏氨酸替换丝氨酸或反之亦然；用另一酸性残基替换酸性残基；用另一含有酰胺基团的残基替换含有酰胺基团的残基；用另一碱性残基交换碱性残基；或用另一芳香族残基替换芳香族残基；

在可选的实施方式中，本发明提供这样的多肽(和编码它们的核酸)，其具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或奥米伽-(或ω-)转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性但缺少信号序列、前原结构域、结合结构域和/或其它结构域；并且在其它方面，结合结构域包括下列或由下列组成：NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域。

在可选的实施方式中，本发明提供这样的多肽(和编码它们的核酸)，其具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，进一步包括异源序列；并且在一个方面，异源序列包括编码下列的序列或由编码下列的序列组成：(i)，异源信号序列、异源结构域、异源结合结构域、异源锚定结构域、异源催化结构域(CD)或其组合；(ii)，(i)的序列，其中所述异源信号序列、结合结构域或催化结构域(CD)得自异源酶；或者(iii)，标记、表位、靶向肽、可切割序列、可检测部分或酶；并且在一个方面，所述异源结合结构域包括下列或由下列组成：NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域；并且在一个方面，所述异源信号序列将编码的蛋白靶向液泡、内质网、叶绿体或淀粉颗粒。

在可选的实施方式中，本发明提供这样的多肽(和编码它们的核酸)，其具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，所述转氨酶活性是催化将异丁胺转化为异丁醛的ω转氨酶活性；和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述多肽为辅因子依赖型或辅因子非依赖型。在一实施方式中，辅因子依赖型多肽的功能性要求非蛋白成分的存在。在一实施方式中，辅因子包括金属离子、辅酶、吡哆醛磷酸和或磷酸泛酰巯基乙胺。

本发明提供分离的、合成的或重组的核酸，其包括：

(a)编码至少一个多肽的核酸(多核苷酸)，其中所述核酸包括与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ IDNO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ IDNO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ IDNO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ IDNO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ IDNO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ IDNO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ IDNO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ IDNO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ IDNO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ IDNO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ IDNO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ IDNO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ IDNO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ IDNO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ IDNO:513、SEQ ID NO:515、SEQ ID NO:517、SEQ ID NO:519、SEQ ID NO:521、SEQID NO:523、SEQ ID NO:525、SEQ ID NO:527、SEQ ID NO:529、SEQ ID NO:531、SEQ ID NO:533、SEQ ID NO:535、SEQ ID NO:537、SEQ ID NO:539、SEQ IDNO:541、SEQ ID NO:543、SEQ ID NO:545、SEQ ID NO:547、SEQ ID NO:549、SEQID NO:551、SEQ ID NO:553、SEQ ID NO:555、SEQ ID NO:557、SEQ ID NO:559、SEQ ID NO:561、SEQ ID NO:563、SEQ ID NO:565、SEQ ID NO:567、SEQ IDNO:569、SEQ ID NO:571、SEQ ID NO:573、SEQ ID NO:575、SEQ ID NO:577、SEQID NO:579、SEQ ID NO:581、SEQ ID NO:583、SEQ ID NO:585、SEQ ID NO:587、SEQ ID NO:589、SEQ ID NO:591、SEQ ID NO:593、SEQ ID NO:595、SEQ IDNO:597、SEQ ID NO:599、SEQ ID NO:601、SEQ ID NO:603、SEQ ID NO:605、SEQID NO:607、SEQ ID NO:609、SEQ ID NO:611、SEQ ID NO:613、SEQ ID NO:615、SEQ ID NO:617、SEQ ID NO:619、SEQ ID NO:621、SEQ ID NO:623、SEQ IDNO:625、SEQ ID NO:627、SEQ ID NO:629、SEQ ID NO:631、SEQ ID NO:633、SEQID NO:635、SEQ ID NO:637、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:643、SEQ ID NO:645、SEQ ID NO:647、SEQ ID NO:649、SEQ ID NO:651、SEQ IDNO:653、SEQ ID NO:655、SEQ ID NO:657、SEQ ID NO:659、SEQ ID NO:661、SEQID NO:663、SEQ ID NO:665、SEQ ID NO:667、SEQ ID NO:669、SEQ ID NO:671、SEQ ID NO:673、SEQ ID NO:675、SEQ ID NO:677、SEQ ID NO:679、SEQ IDNO:681、SEQ ID NO:683、SEQ ID NO:685、SEQ ID NO:687、SEQ ID NO:689、SEQID NO:691、SEQ ID NO:693、SEQ ID NO:695、SEQ ID NO:697、SEQ ID NO:699,SEQID NO:701、SEQ ID NO:703、SEQ ID NO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:711、SEQ ID NO:713、SEQ ID NO:715、SEQ ID NO:717、SEQ IDNO:719、SEQ ID NO:721、SEQ ID NO:723、SEQ ID NO:725、SEQ ID NO:727、SEQID NO:729、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:737、SEQ ID NO:739、SEQ ID NO:741、SEQ ID NO:743、SEQ ID NO:745、SEQ IDNO:747、SEQ ID NO:749、SEQ ID NO:751、SEQ ID NO:753、SEQ ID NO:755、SEQID NO:757、SEQ ID NO:759、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:765、SEQ ID NO:767、SEQ ID NO:769、SEQ ID NO:771、SEQ ID NO:773、SEQ IDNO:775、SEQ ID NO:777、SEQ ID NO:779、SEQ ID NO:781、SEQ ID NO:783、SEQID NO:785、SEQ ID NO:787、SEQ ID NO:789、SEQ ID NO:791、SEQ ID NO:793、SEQ ID NO:795、SEQ ID NO:797、SEQ ID NO:799,SEQ ID NO:801、SEQ IDNO:803、SEQ ID NO:805、SEQ ID NO:807、SEQ ID NO:809、SEQ ID NO:811、SEQID NO:813、SEQ ID NO:815、SEQ ID NO:817、SEQ ID NO:819、SEQ ID NO:821、SEQ ID NO:823、SEQ ID NO:825、SEQ ID NO:827、SEQ ID NO:829、SEQ IDNO:831、SEQ ID NO:833、SEQ ID NO:835、SEQ ID NO:837、SEQ ID NO:839、SEQID NO:841、SEQ ID NO:843、SEQ ID NO:845、SEQ ID NO:847、SEQ ID NO:849、SEQ ID NO:851、SEQ ID NO:853、SEQ ID NO:855、SEQ ID NO:857、SEQ IDNO:859、SEQ ID NO:861、SEQ ID NO:863、SEQ ID NO:865、SEQ ID NO:867、SEQID NO:869、SEQ ID NO:871、SEQ ID NO:873、SEQ ID NO:875、SEQ ID NO:877、SEQ ID NO:879、SEQ ID NO:881、SEQ ID NO:883、SEQ ID NO:885、SEQ IDNO:887、SEQ ID NO:889、SEQ ID NO:891、SEQ ID NO:893、SEQ ID NO:895、SEQID NO:897、SEQ ID NO:899,SEQ ID NO:901、SEQ ID NO:903、SEQ ID NO:905、SEQ ID NO:907、SEQ ID NO:909、SEQ ID NO:911、SEQ ID NO:913、SEQ IDNO:915、SEQ ID NO:917、SEQ ID NO:919、SEQ ID NO:921、SEQ ID NO:923、SEQID NO:925、SEQ ID NO:927、SEQ ID NO:929、SEQ ID NO:931、SEQ ID NO:933、SEQ ID NO:935、SEQ ID NO:937、SEQ ID NO:939、SEQ ID NO:941、SEQ IDNO:943、SEQ ID NO:945、SEQ ID NO:947、SEQ ID NO:949、SEQ ID NO:951、SEQID NO:953、SEQ ID NO:955、SEQ ID NO:957、SEQ ID NO:959、SEQ ID NO:961、SEQ ID NO:963、SEQ ID NO:965、SEQ ID NO:967、SEQ ID NO:969、SEQ IDNO:971、SEQ ID NO:973和/或SEQ ID NO:975的核酸(多核苷酸)序列具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更大或完全(100％)序列同一性的序列；

其中所述核酸编码至少一个多肽，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，或编码能产生转移酶特异性抗体，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如，d-氨基酸脱氢酶特异性抗体的多肽或肽(充当表位或免疫原的多肽或肽)，

(b)，(a)的核酸(多核苷酸)，其中所述序列同一性如下测定：(A)通过用序列比较算法进行分析或通过视觉检测，或(B)在至少约20、30、40、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150或更多个残基的区域内，或在cDNA、转录物(mRNA)或基因的全长区域内；

(c)，(a)或(b)的核酸(多核苷酸)，其中所述序列比较算法是BLAST第2.2.2版算法，其中过滤设置被设置为blastall-p blastp-d"nr pataa"-F F，并且所有其它选项被设置为默认；

(d)，编码至少一个多肽或肽的核酸(多核苷酸)，其中所述核酸包括这样的序列，其在严格条件下杂交到包括SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ IDNO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ IDNO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ IDNO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ IDNO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ IDNO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ IDNO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ IDNO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ IDNO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ IDNO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ IDNO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ IDNO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ IDNO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ IDNO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ IDNO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ IDNO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ IDNO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ IDNO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ IDNO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ IDNO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、SEQ IDNO:517、SEQ ID NO:519、SEQ ID NO:521、SEQ ID NO:523、SEQ ID NO:525、SEQID NO:527、SEQ ID NO:529、SEQ ID NO:531、SEQ ID NO:533、SEQ ID NO:535、SEQ ID NO:537、SEQ ID NO:539、SEQ ID NO:541、SEQ ID NO:543、SEQ IDNO:545、SEQ ID NO:547、SEQ ID NO:549、SEQ ID NO:551、SEQ ID NO:553、SEQID NO:555、SEQ ID NO:557、SEQ ID NO:559、SEQ ID NO:561、SEQ ID NO:563、SEQ ID NO:565、SEQ ID NO:567、SEQ ID NO:569、SEQ ID NO:571、SEQ IDNO:573、SEQ ID NO:575、SEQ ID NO:577、SEQ ID NO:579、SEQ ID NO:581、SEQID NO:583、SEQ ID NO:585、SEQ ID NO:587、SEQ ID NO:589、SEQ ID NO:591、SEQ ID NO:593、SEQ ID NO:595、SEQ ID NO:597、SEQ ID NO:599、SEQ IDNO:601、SEQ ID NO:603、SEQ ID NO:605、SEQ ID NO:607、SEQ ID NO:609、SEQID NO:611、SEQ ID NO:613、SEQ ID NO:615、SEQ ID NO:617、SEQ ID NO:619、SEQ ID NO:621、SEQ ID NO:623、SEQ ID NO:625、SEQ ID NO:627、SEQ IDNO:629、SEQ ID NO:631、SEQ ID NO:633、SEQ ID NO:635、SEQ ID NO:637、SEQID NO:639、SEQ ID NO:641、SEQ ID NO:643、SEQ ID NO:645、SEQ ID NO:647、SEQ ID NO:649、SEQ ID NO:651、SEQ ID NO:653、SEQ ID NO:655、SEQ IDNO:657、SEQ ID NO:659、SEQ ID NO:661、SEQ ID NO:663、SEQ ID NO:665、SEQID NO:667、SEQ ID NO:669、SEQ ID NO:671、SEQ ID NO:673、SEQ ID NO:675、SEQ ID NO:677、SEQ ID NO:679、SEQ ID NO:681、SEQ ID NO:683、SEQ IDNO:685、SEQ ID NO:687、SEQ ID NO:689、SEQ ID NO:691、SEQ ID NO:693、SEQID NO:695、SEQ ID NO:697、SEQ ID NO:699、SEQ ID NO:701、SEQ ID NO:703、SEQ ID NO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:711、SEQ IDNO:713、SEQ ID NO:715、SEQ ID NO:717、SEQ ID NO:719、SEQ ID NO:721、SEQID NO:723、SEQ ID NO:725、SEQ ID NO:727、SEQ ID NO:729、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:737、SEQ ID NO:739、SEQ IDNO:741、SEQ ID NO:743、SEQ ID NO:745、SEQ ID NO:747、SEQ ID NO:749、SEQID NO:751、SEQ ID NO:753、SEQ ID NO:755、SEQ ID NO:757、SEQ ID NO:759、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:765、SEQ ID NO:767、SEQ IDNO:769、SEQ ID NO:771、SEQ ID NO:773、SEQ ID NO:775、SEQ ID NO:777、SEQID NO:779、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:785、SEQ ID NO:787、SEQ ID NO:789、SEQ ID NO:791、SEQ ID NO:793、SEQ ID NO:795、SEQ IDNO:797、SEQ ID NO:799,SEQ ID NO:801、SEQ ID NO:803、SEQ ID NO:805、SEQID NO:807、SEQ ID NO:809、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:815、SEQ ID NO:817、SEQ ID NO:819、SEQ ID NO:821、SEQ ID NO:823、SEQ IDNO:825、SEQ ID NO:827、SEQ ID NO:829、SEQ ID NO:831、SEQ ID NO:833、SEQID NO:835、SEQ ID NO:837、SEQ ID NO:839、SEQ ID NO:841、SEQ ID NO:843、SEQ ID NO:845、SEQ ID NO:847、SEQ ID NO:849、SEQ ID NO:851、SEQ IDNO:853、SEQ ID NO:855、SEQ ID NO:857、SEQ ID NO:859、SEQ ID NO:861、SEQID NO:863、SEQ ID NO:865、SEQ ID NO:867、SEQ ID NO:869、SEQ ID NO:871、SEQ ID NO:873、SEQ ID NO:875、SEQ ID NO:877、SEQ ID NO:879、SEQ IDNO:881、SEQ ID NO:883、SEQ ID NO:885、SEQ ID NO:887、SEQ ID NO:889、SEQID NO:891、SEQ ID NO:893、SEQ ID NO:895、SEQ ID NO:897、SEQ ID NO:899,SEQID NO:901、SEQ ID NO:903、SEQ ID NO:905、SEQ ID NO:907、SEQ ID NO:909、SEQ ID NO:911、SEQ ID NO:913、SEQ ID NO:915、SEQ ID NO:917、SEQ IDNO:919、SEQ ID NO:921、SEQ ID NO:923、SEQ ID NO:925、SEQ ID NO:927、SEQID NO:929、SEQ ID NO:931、SEQ ID NO:933、SEQ ID NO:935、SEQ ID NO:937、SEQ ID NO:939、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:945、SEQ IDNO:947、SEQ ID NO:949、SEQ ID NO:951、SEQ ID NO:953、SEQ ID NO:955、SEQID NO:957、SEQ ID NO:959、SEQ ID NO:961、SEQ ID NO:963、SEQ ID NO:965、SEQ ID NO:967、SEQ ID NO:969、SEQ ID NO:971、SEQ ID NO:973和/或SEQ IDNO:975的序列的核酸，

并且所述严格条件包括在约65℃的温度下在0.2×SSC中洗涤约15分钟的洗涤步骤；

(e)，(a)至(d)任一项的核酸(多核苷酸)，其具有至少约20、25、30、50、75、100、125、150、175、200、225、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150或更多个核苷酸残基的长度，或者基因或转录物的全长；

(f)，编码至少一个多肽的核酸(多核苷酸)，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述多肽包括SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ IDNO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ IDNO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ IDNO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ IDNO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQID NO:142、SEQ ID NO:143、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ IDNO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ IDNO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ IDNO:216、SEQ ID NO:218、SEQ ID NO:220、具有表46或表55的一个、几个或全部修饰的SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ IDNO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ IDNO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ IDNO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ IDNO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ IDNO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ IDNO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ IDNO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ IDNO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ IDNO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ IDNO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ IDNO:516、SEQ ID NO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ ID NO:524、SEQID NO:526、SEQ ID NO:528、SEQ ID NO:530、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:536、SEQ ID NO:538、SEQ ID NO:540、SEQ ID NO:542、SEQ IDNO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ ID NO:550、SEQ ID NO:552、SEQID NO:554、SEQ ID NO:556、SEQ ID NO:558、SEQ ID NO:560、SEQ ID NO:562、SEQ ID NO:564、SEQ ID NO:566、SEQ ID NO:568、SEQ ID NO:570、SEQ IDNO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ ID NO:578、SEQ ID NO:580、SEQID NO:582、SEQ ID NO:584、SEQ ID NO:586、SEQ ID NO:588、SEQ ID NO:590、SEQ ID NO:592、SEQ ID NO:594、SEQ ID NO:596、SEQ ID NO:598、SEQ IDNO:600、SEQ ID NO:602、SEQ ID NO:604、SEQ ID NO:606、SEQ ID NO:608、SEQID NO:610、SEQ ID NO:612、SEQ ID NO:614、SEQ ID NO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ ID NO:622、SEQ ID NO:624、SEQ ID NO:626、SEQ IDNO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:636、SEQID NO:638、SEQ ID NO:640、SEQ ID NO:642、SEQ ID NO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ ID NO:650、SEQ ID NO:652、SEQ ID NO:654、SEQ IDNO:656、SEQ ID NO:658、SEQ ID NO:660、SEQ ID NO:662、SEQ ID NO:664、SEQID NO:666、SEQ ID NO:668、SEQ ID NO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ ID NO:676、SEQ ID NO:678、SEQ ID NO:680、SEQ ID NO:682、SEQ IDNO:684、SEQ ID NO:686、SEQ ID NO:688、SEQ ID NO:690、SEQ ID NO:692、SEQID NO:694、SEQ ID NO:696、SEQ ID NO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ IDNO:712、SEQ ID NO:714、SEQ ID NO:716、SEQ ID NO:718、SEQ ID NO:720、SEQID NO:722、SEQ ID NO:724、SEQ ID NO:726、SEQ ID NO:728、SEQ ID NO:730、SEQ ID NO:732、SEQ ID NO:734、SEQ ID NO:736、SEQ ID NO:738、SEQ IDNO:740、SEQ ID NO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ ID NO:748、SEQID NO:750、SEQ ID NO:752、SEQ ID NO:754、SEQ ID NO:756、SEQ ID NO:758、SEQ ID NO:760、SEQ ID NO:762、SEQ ID NO:764、SEQ ID NO:766、SEQ IDNO:768、SEQ ID NO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ ID NO:776、SEQID NO:778、SEQ ID NO:780、SEQ ID NO:782、SEQ ID NO:784、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:790、SEQ ID NO:792、SEQ ID NO:794、SEQ IDNO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:804、SEQID NO:808、SEQ ID NO:808、SEQ ID NO:810、SEQ ID NO:812、SEQ ID NO:814、SEQ ID NO:816、SEQ ID NO:818、SEQ ID NO:820、SEQ ID NO:822、SEQ IDNO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ ID NO:830、SEQ ID NO:832、SEQID NO:834、SEQ ID NO:836、SEQ ID NO:838、SEQ ID NO:840、SEQ ID NO:842、SEQ ID NO:844、SEQ ID NO:846、SEQ ID NO:848、SEQ ID NO:850、SEQ IDNO:852、SEQ ID NO:854、SEQ ID NO:856、SEQ ID NO:858、SEQ ID NO:860、SEQID NO:862、SEQ ID NO:864、SEQ ID NO:866、SEQ ID NO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ ID NO:874、SEQ ID NO:876、SEQ ID NO:878、SEQ IDNO:880、SEQ ID NO:882、SEQ ID NO:884、SEQ ID NO:886、SEQ ID NO:888、SEQID NO:890、SEQ ID NO:892、SEQ ID NO:894、SEQ ID NO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ ID NO:902、SEQ ID NO:904、SEQ ID NO:906、SEQ IDNO:908、SEQ ID NO:910、SEQ ID NO:912、SEQ ID NO:914、SEQ ID NO:916、SEQID NO:918、SEQ ID NO:920、SEQ ID NO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ ID NO:928、SEQ ID NO:930、SEQ ID NO:932、SEQ ID NO:934、SEQ IDNO:936、SEQ ID NO:938、SEQ ID NO:940、SEQ ID NO:942、SEQ ID NO:944、SEQID NO:946、SEQ ID NO:948、SEQ ID NO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ ID NO:956、SEQ ID NO:958、SEQ ID NO:960、SEQ ID NO:962、SEQ IDNO:964、SEQ ID NO:966、SEQ ID NO:968、SEQ ID NO:970、SEQ ID NO:972、SEQID NO:974和/或SEQ ID NO:976的序列，或其酶促活性片段；

(g)，(a)至(f)任一项的并且编码多肽的核酸(多核苷酸)，所述多肽具有至少一个保守性氨基酸置换并且保留其转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述至少一个保守性氨基酸置换包括用另一类似特征的氨基酸置换氨基酸；或者，保守性置换包括：用另一脂肪族氨基酸替换脂肪族氨基酸；用苏氨酸替换丝氨酸或反之亦然；用另一酸性残基替换酸性残基；用另一含有酰胺基团的残基替换含有酰胺基团的残基；用另一碱性残基交换碱性残基；或用另一芳香族残基替换芳香族残基；

(h)，(a)至(g)任一项的、编码多肽的核酸(多核苷酸)，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性但缺少信号序列、前原结构域、结合结构域和/或其它结构域；

(i)，(h)的核酸(多核苷酸)，其中所述结合结构域包括下列或由下列组成：NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域；

(j)，(a)至(i)任一项的、编码多肽的核酸(多核苷酸)，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，进一步包括异源序列；

(k)，(j)的核酸(多核苷酸)，其中所述异源序列包括编码下列的序列或由编码下列的序列组成：(A)异源信号序列、异源结构域、异源结合结构域、异源锚定结构域、异源催化结构域(CD)或其组合；(B)(l)的序列，其中所述异源信号序列、结合结构域或催化结构域(CD)得自异源酶；或者(C)标记、表位、靶向肽、可切割序列、可检测部分或酶；

(l)，(k)的核酸(多核苷酸)，其中所述异源结合结构域包括下列或由下列组成：NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域；

(m)，(l)的核酸(多核苷酸)，其中所述异源信号序列将编码的蛋白靶向液泡、内质网、叶绿体或淀粉颗粒；或

(n)，核酸(多核苷酸)序列，其与(a)至(m)任一项的序列全部(完全)互补。

本发明提供分离的、合成的或重组的核酸，其包括编码至少一个多肽的核酸，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述多肽具有如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ IDNO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ IDNO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:143、SEQID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ IDNO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ IDNO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ IDNO:220、具有表46或表55的一个、几个或全部修饰的SEQ ID NO:220、SEQ IDNO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ IDNO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ IDNO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ IDNO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ IDNO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ IDNO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ IDNO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ IDNO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ IDNO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ IDNO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ IDNO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQID NO:512、SEQ ID NO:514、SEQ ID NO:516、SEQ ID NO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ ID NO:524、SEQ ID NO:526、SEQ ID NO:528、SEQ IDNO:530、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:536、SEQ ID NO:538、SEQID NO:540、SEQ ID NO:542、SEQ ID NO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ ID NO:550、SEQ ID NO:552、SEQ ID NO:554、SEQ ID NO:556、SEQ IDNO:558、SEQ ID NO:560、SEQ ID NO:562、SEQ ID NO:564、SEQ ID NO:566、SEQID NO:568、SEQ ID NO:570、SEQ ID NO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ ID NO:578、SEQ ID NO:580、SEQ ID NO:582、SEQ ID NO:584、SEQ IDNO:586、SEQ ID NO:588、SEQ ID NO:590、SEQ ID NO:592、SEQ ID NO:594、SEQID NO:596、SEQ ID NO:598、SEQ ID NO:600、SEQ ID NO:602、SEQ ID NO:604、SEQ ID NO:606、SEQ ID NO:608、SEQ ID NO:610、SEQ ID NO:612、SEQ IDNO:614、SEQ ID NO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ ID NO:622、SEQID NO:624、SEQ ID NO:626、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:636、SEQ ID NO:638、SEQ ID NO:640、SEQ IDNO:642、SEQ ID NO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ ID NO:650、SEQID NO:652、SEQ ID NO:654、SEQ ID NO:656、SEQ ID NO:658、SEQ ID NO:660、SEQ ID NO:662、SEQ ID NO:664、SEQ ID NO:666、SEQ ID NO:668、SEQ IDNO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ ID NO:676、SEQ ID NO:678、SEQID NO:680、SEQ ID NO:682、SEQ ID NO:684、SEQ ID NO:686、SEQ ID NO:688、SEQ ID NO:690、SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:696、SEQ IDNO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQID NO:708、SEQ ID NO:710、SEQ ID NO:712、SEQ ID NO:714、SEQ ID NO:716、SEQ ID NO:718、SEQ ID NO:720、SEQ ID NO:722、SEQ ID NO:724、SEQ IDNO:726、SEQ ID NO:728、SEQ ID NO:730、SEQ ID NO:732、SEQ ID NO:734、SEQID NO:736、SEQ ID NO:738、SEQ ID NO:740、SEQ ID NO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ ID NO:748、SEQ ID NO:750、SEQ ID NO:752、SEQ IDNO:754、SEQ ID NO:756、SEQ ID NO:758、SEQ ID NO:760、SEQ ID NO:762、SEQID NO:764、SEQ ID NO:766、SEQ ID NO:768、SEQ ID NO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ ID NO:776、SEQ ID NO:778、SEQ ID NO:780、SEQ IDNO:782、SEQ ID NO:784、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:790、SEQID NO:792、SEQ ID NO:794、SEQ ID NO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:804、SEQ ID NO:808、SEQ ID NO:808、SEQ IDNO:810、SEQ ID NO:812、SEQ ID NO:814、SEQ ID NO:816、SEQ ID NO:818、SEQID NO:820、SEQ ID NO:822、SEQ ID NO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ ID NO:830、SEQ ID NO:832、SEQ ID NO:834、SEQ ID NO:836、SEQ IDNO:838、SEQ ID NO:840、SEQ ID NO:842、SEQ ID NO:844、SEQ ID NO:846、SEQID NO:848、SEQ ID NO:850、SEQ ID NO:852、SEQ ID NO:854、SEQ ID NO:856、SEQ ID NO:858、SEQ ID NO:860、SEQ ID NO:862、SEQ ID NO:864、SEQ IDNO:866、SEQ ID NO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ ID NO:874、SEQID NO:876、SEQ ID NO:878、SEQ ID NO:880、SEQ ID NO:882、SEQ ID NO:884、SEQ ID NO:886、SEQ ID NO:888、SEQ ID NO:890、SEQ ID NO:892、SEQ IDNO:894、SEQ ID NO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ ID NO:902、SEQID NO:904、SEQ ID NO:906、SEQ ID NO:908、SEQ ID NO:910、SEQ ID NO:912、SEQ ID NO:914、SEQ ID NO:916、SEQ ID NO:918、SEQ ID NO:920、SEQ IDNO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ ID NO:928、SEQ ID NO:930、SEQID NO:932、SEQ ID NO:934、SEQ ID NO:936、SEQ ID NO:938、SEQ ID NO:940、SEQ ID NO:942、SEQ ID NO:944、SEQ ID NO:946、SEQ ID NO:948、SEQ IDNO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ ID NO:956、SEQ ID NO:958、SEQID NO:960、SEQ ID NO:962、SEQ ID NO:964、SEQ ID NO:966、SEQ ID NO:968、SEQ ID NO:970、SEQ ID NO:972、SEQ ID NO:974和/或SEQ ID NO:976中所示的序列或其酶促活性片段，包括本文及表1、2和3和序列表中所述的序列(所有这些序列是“本发明的示例性酶/多肽”)和其酶促活性子序列(片段)和/或其免疫活性子序列(诸如表位或免疫原)(所有“本发明的肽”)和其变体(包含本发明的多肽和肽序列的所有这些序列)(或者下文被称为本发明的示例性多肽序列)。

本发明提供分离的、合成的或重组的核酸，其包括与本发明的所有这些核酸序列完全互补的序列(互补(非编码)和编码序列，下文也被统称为本发明的核酸序列)。

在一方面，序列同一性为至少约51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％(完全)序列同一性(同源性)。在一方面，序列同一性是在至少约150、175、200、225、250、275、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150或更多个残基的区域内，或基因或转录物的全长区域内。例如，本发明提供分离的、合成的或重组的核酸，其包括SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ IDNO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ IDNO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ IDNO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ IDNO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ IDNO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ IDNO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ IDNO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ IDNO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ IDNO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ IDNO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ IDNO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ IDNO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ IDNO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ IDNO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ IDNO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、SEQ ID NO:517、SEQID NO:519、SEQ ID NO:521、SEQ ID NO:523、SEQ ID NO:525、SEQ ID NO:527、SEQ ID NO:529、SEQ ID NO:531、SEQ ID NO:533、SEQ ID NO:535、SEQ IDNO:537、SEQ ID NO:539、SEQ ID NO:541、SEQ ID NO:543、SEQ ID NO:545、SEQID NO:547、SEQ ID NO:549、SEQ ID NO:551、SEQ ID NO:553、SEQ ID NO:555、SEQ ID NO:557、SEQ ID NO:559、SEQ ID NO:561、SEQ ID NO:563、SEQ IDNO:565、SEQ ID NO:567、SEQ ID NO:569、SEQ ID NO:571、SEQ ID NO:573、SEQID NO:575、SEQ ID NO:577、SEQ ID NO:579、SEQ ID NO:581、SEQ ID NO:583、SEQ ID NO:585、SEQ ID NO:587、SEQ ID NO:589、SEQ ID NO:591、SEQ IDNO:593、SEQ ID NO:595、SEQ ID NO:597、SEQ ID NO:599、SEQ ID NO:601、SEQID NO:603、SEQ ID NO:605、SEQ ID NO:607、SEQ ID NO:609、SEQ ID NO:611、SEQ ID NO:613、SEQ ID NO:615、SEQ ID NO:617、SEQ ID NO:619、SEQ IDNO:621、SEQ ID NO:623、SEQ ID NO:625、SEQ ID NO:627、SEQ ID NO:629、SEQID NO:631、SEQ ID NO:633、SEQ ID NO:635、SEQ ID NO:637、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:643、SEQ ID NO:645、SEQ ID NO:647、SEQ IDNO:649、SEQ ID NO:651、SEQ ID NO:653、SEQ ID NO:655、SEQ ID NO:657、SEQID NO:659、SEQ ID NO:661、SEQ ID NO:663、SEQ ID NO:665、SEQ ID NO:667、SEQ ID NO:669、SEQ ID NO:671、SEQ ID NO:673、SEQ ID NO:675、SEQ IDNO:677、SEQ ID NO:679、SEQ ID NO:681、SEQ ID NO:683、SEQ ID NO:685、SEQID NO:687、SEQ ID NO:689、SEQ ID NO:691、SEQ ID NO:693、SEQ ID NO:695、SEQ ID NO:697、SEQ ID NO:699、SEQ ID NO:701、SEQ ID NO:703、SEQ IDNO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:711、SEQ ID NO:713、SEQID NO:715、SEQ ID NO:717、SEQ ID NO:719、SEQ ID NO:721、SEQ ID NO:723、SEQ ID NO:725、SEQ ID NO:727、SEQ ID NO:729、SEQ ID NO:731、SEQ IDNO:733、SEQ ID NO:735、SEQ ID NO:737、SEQ ID NO:739、SEQ ID NO:741、SEQID NO:743、SEQ ID NO:745、SEQ ID NO:747、SEQ ID NO:749、SEQ ID NO:751、SEQ ID NO:753、SEQ ID NO:755、SEQ ID NO:757、SEQ ID NO:759、SEQ IDNO:761、SEQ ID NO:763、SEQ ID NO:765、SEQ ID NO:767、SEQ ID NO:769、SEQID NO:771、SEQ ID NO:773、SEQ ID NO:775、SEQ ID NO:777、SEQ ID NO:779、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:785、SEQ ID NO:787、SEQ IDNO:789、SEQ ID NO:791、SEQ ID NO:793、SEQ ID NO:795、SEQ ID NO:797、SEQID NO:799,SEQ ID NO:801、SEQ ID NO:803、SEQ ID NO:805、SEQ ID NO:807、SEQ ID NO:809、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:815、SEQ IDNO:817、SEQ ID NO:819、SEQ ID NO:821、SEQ ID NO:823、SEQ ID NO:825、SEQID NO:827、SEQ ID NO:829、SEQ ID NO:831、SEQ ID NO:833、SEQ ID NO:835、SEQ ID NO:837、SEQ ID NO:839、SEQ ID NO:841、SEQ ID NO:843、SEQ IDNO:845、SEQ ID NO:847、SEQ ID NO:849、SEQ ID NO:851、SEQ ID NO:853、SEQID NO:855、SEQ ID NO:857、SEQ ID NO:859、SEQ ID NO:861、SEQ ID NO:863、SEQ ID NO:865、SEQ ID NO:867、SEQ ID NO:869、SEQ ID NO:871、SEQ IDNO:873、SEQ ID NO:875、SEQ ID NO:877、SEQ ID NO:879、SEQ ID NO:881、SEQID NO:883、SEQ ID NO:885、SEQ ID NO:887、SEQ ID NO:889、SEQ ID NO:891、SEQ ID NO:893、SEQ ID NO:895、SEQ ID NO:897、SEQ ID NO:899、SEQ IDNO:901、SEQ ID NO:903、SEQ ID NO:905、SEQ ID NO:907、SEQ ID NO:909、SEQID NO:911、SEQ ID NO:913、SEQ ID NO:915、SEQ ID NO:917、SEQ ID NO:919、SEQ ID NO:921、SEQ ID NO:923、SEQ ID NO:925、SEQ ID NO:927、SEQ IDNO:929、SEQ ID NO:931、SEQ ID NO:933、SEQ ID NO:935、SEQ ID NO:937、SEQID NO:939、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:945、SEQ ID NO:947、SEQ ID NO:949、SEQ ID NO:951、SEQ ID NO:953、SEQ ID NO:955、SEQ IDNO:957、SEQ ID NO:959、SEQ ID NO:961、SEQ ID NO:963、SEQ ID NO:965、SEQID NO:967、SEQ ID NO:969、SEQ ID NO:971、SEQ ID NO:973和/或SEQ IDNO:975的核酸序列，例如如表1、2和3及序列表中所述(所有这些序列是“本发明的示例性多核苷酸”)和其酶促活性子序列(片段)。

本发明提供分离的、合成的或重组的核酸，其编码多肽，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述核酸具有至少一个本发明的示例性序列或本发明的任意序列的序列修饰。

在一方面(任选地)，本发明的分离的、合成的或重组的核酸具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，例如其中所述活性包括催化化学基团的转移，催化转氨作用，催化下列反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化还原反应，催化氢原子的去除，和/或催化下列反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。

在一方面，所述转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性是热稳定的，例如其中所述多肽在包括约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃范围内或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度的条件下保持转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。在一些实施方式中，根据本发明的热稳定多肽在上述范围内的温度下在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、约pH 8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、约pH 10.5、约pH 11.0、约pH 11.5、约pH 12.0或更大的pH下保持活性，例如转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。

在一方面，所述转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性是耐热的，例如其中所述多肽在暴露于约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃范围内或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度后保持转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。根据本发明的耐热多肽能够在暴露于约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃范围内或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度后保持活性，例如转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。在一些实施方式中，根据本发明的耐热多肽在暴露于上述范围内的温度后在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、约pH 8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、约pH 10.5、约pH 11.0、约pH 11.5、约pH 12.0或更大的pH下保持活性，例如转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。

在一方面，由本发明的核酸编码的多肽的转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性在包括约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5、pH 4.0、pH 3.5、pH 3.0或更小的(酸性更大的)pH的酸性条件下保持活性，或者在暴露于包括约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5、pH 4.0、pH 3.5、pH 3.0或更小的(酸性更大的)pH的酸性条件后保持转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性；或在包括约pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11、pH 11.5、pH 12、pH 12.5或更大(碱性更大)pH的碱性条件下保持活性，或者在暴露于包括约pH 7、pH 7.5pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11、pH 11.5、pH 12、pH 12.5或更大(碱性更大)pH的碱性条件后保持转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。在一方面，由本发明的核酸编码的多肽的转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性在至少约80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、103.5℃、104℃、105℃、107℃、108℃、109℃或110℃或更高温度以及至少约pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11、pH 11.5、pH 12、pH 12.5或更大(碱性更大)pH的碱性pH下保持活性。

本发明提供表达盒(expression cassette)、克隆运载体或载体(例如表达载体)，其包含含有本发明序列的核酸。克隆运载体可包括病毒载体、质粒、噬菌体(phage)、噬菌粒、黏粒、F黏粒、噬菌体(bacteriophage)或人工染色体。病毒载体可包括腺病毒载体、逆转录病毒载体或腺伴随病毒载体。克隆运载体可包括人工染色体，所述人工染色体包括细菌人工染色体(BAC)、噬菌体P1衍生的载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。

本发明提供核酸探针，用于鉴定编码多肽的核酸，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述探针包含这样的核酸的至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、100、125、150、175、200、225、250、275、300个或更多个连续碱基，该核酸包含本发明的示例性序列或本发明的任意序列(如本文所限定)，其中在一方面(任选地)探针包含寡核苷酸，所述寡核苷酸包含至少约10至300、约25至250、约10至50、约20至60、约30至70、约40至80、约60至100或约50至150个或更多个连续碱基。

本发明提供扩增引物对，用于扩增编码多肽的核酸，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述引物对能够扩增包含本发明的示例性序列或本发明的任意序列(如本文所限定)或其子序列的核酸，其中任选地扩增引物序列对的成员包含寡核苷酸，所述寡核苷酸包含序列的至少约10至50个连续碱基，或序列的约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个更多个连续碱基。本发明提供扩增引物对，其中所述引物对包含第一成员和第二成员，第一成员具有本发明的示例性序列或本发明的任意序列(如本文所限定)的约前(5’)10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个或更多个残基所示的序列，以及第二成员含有第一成员互补链的约前(5’)10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35个或更多个残基所示的序列。

本发明提供编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸，其应用本发明的扩增引物对通过多核苷酸的扩增而产生，其中任选地扩增通过聚合酶链反应(PCR)进行。在一个方面，所述核酸通过基因文库的扩增而产生，其中在一方面(任选地)基因文库是环境文库。本发明提供分离的、合成的或重组的转移酶和/或氧化还原酶，其由编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸所编码，所述核酸应用本发明的扩增引物对通过多核苷酸的扩增而产生。本发明提供扩增编码多肽的核酸的方法，所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，所述方法包括用扩增引物序列对扩增模板核酸的步骤，所述扩增引物序列对能够扩增发明的示例性序列或本发明的任意序列(如本文所限定)或其子序列。

本发明提供表达盒、载体或克隆运载体，其含有包含本发明序列的核酸，其中任选地克隆运载体包括病毒载体、质粒、噬菌体、噬菌粒、黏粒、F黏粒、噬菌体或人工染色体。病毒载体可包括腺病毒载体、逆转录病毒载体或腺伴随病毒载体，或人工染色体包括细菌人工染色体(BAC)、噬菌体P1衍生的载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。

本发明提供转化细胞，其包含本发明的核酸或载体，或本发明的表达盒或克隆运载体。转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。

本发明提供包含本发明序列的转基因非人动物。转基因非人动物可以是小鼠、大鼠、兔、绵羊、猪、鸡、山羊、鱼、狗或牛。本发明提供包含本发明序列的转基因植物，例如其中植物是玉米植株、高粱植株、马铃薯植株、番茄植株、小麦植株、油料种子植株、油菜籽植株、大豆植株、稻植株、大麦植株、草类或烟草植株。本发明提供包含本发明序列的转基因种子，例如其中种子是玉米种子、小麦粒、油料种子、油菜籽、大豆种子、棕榈仁、向日葵种子、芝麻种子、稻、大麦、花生或烟草植物种子。

本发明提供反义寡核苷酸，其包含与本发明的序列(包括例如本发明的示例性序列)或其子序列互补的核酸序列，或能够与本发明的序列(包括例如本发明的示例性序列)或其子序列在严格条件下杂交的核酸序列，其中任选地反义寡核苷酸长度为约10至50、约20至60、约30至70、约40至80或约60至100个碱基，以及在一方面(任选地)严格条件包括这样的洗涤步骤，其包含在约65℃温度下于0.2×SSC中洗涤约15分钟。

本发明提供抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信息在细胞中翻译的方法，其包括给予细胞反义寡核苷酸或在细胞中表达反义寡核苷酸，所述反义寡核苷酸包含与本发明的序列(包括例如本发明的示例性序列)互补的核酸序列或能与本发明的序列(包括例如本发明的示例性序列)在严格条件下杂交的核酸序列。

本发明提供含有本发明序列(包括例如本发明示例性序列)的子序列的双链抑制RNA(RNAi)分子。双链抑制RNA(RNAi)分子长度为约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30或更多个双链核苷酸。本发明提供抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶在细胞中表达的方法，该方法包括给予细胞或在细胞中表达双链抑制RNA(iRNA)，其中所述RNA含有本发明序列(包括例如本发明示例性序列)的子序列。

本发明提供分离的、合成的或重组的多肽，其具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，或能产生对转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶特异的免疫应答的多肽(例如表位)；在可选方面，本发明的肽和多肽包括下列序列：

(a)，其包括与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ IDNO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ IDNO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:143、SEQID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ IDNO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ IDNO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ IDNO:220、具有表46或表55的一个、几个或全部修饰的SEQ ID NO:220、SEQ IDNO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ IDNO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ IDNO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ IDNO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ IDNO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ IDNO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ IDNO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ IDNO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ IDNO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ IDNO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ IDNO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQID NO:512、SEQ ID NO:514、SEQ ID NO:516、SEQ ID NO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ ID NO:524、SEQ ID NO:526、SEQ ID NO:528、SEQ IDNO:530、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:536、SEQ ID NO:538、SEQID NO:540、SEQ ID NO:542、SEQ ID NO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ ID NO:550、SEQ ID NO:552、SEQ ID NO:554、SEQ ID NO:556、SEQ IDNO:558、SEQ ID NO:560、SEQ ID NO:562、SEQ ID NO:564、SEQ ID NO:566、SEQID NO:568、SEQ ID NO:570、SEQ ID NO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ ID NO:578、SEQ ID NO:580、SEQ ID NO:582、SEQ ID NO:584、SEQ IDNO:586、SEQ ID NO:588、SEQ ID NO:590、SEQ ID NO:592、SEQ ID NO:594、SEQID NO:596、SEQ ID NO:598、SEQ ID NO:600、SEQ ID NO:602、SEQ ID NO:604、SEQ ID NO:606、SEQ ID NO:608、SEQ ID NO:610、SEQ ID NO:612、SEQ IDNO:614、SEQ ID NO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ ID NO:622、SEQID NO:624、SEQ ID NO:626、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:636、SEQ ID NO:638、SEQ ID NO:640、SEQ IDNO:642、SEQ ID NO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ ID NO:650、SEQID NO:652、SEQ ID NO:654、SEQ ID NO:656、SEQ ID NO:658、SEQ ID NO:660、SEQ ID NO:662、SEQ ID NO:664、SEQ ID NO:666、SEQ ID NO:668、SEQ IDNO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ ID NO:676、SEQ ID NO:678、SEQID NO:680、SEQ ID NO:682、SEQ ID NO:684、SEQ ID NO:686、SEQ ID NO:688、SEQ ID NO:690、SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:696、SEQ IDNO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQID NO:708、SEQ ID NO:710、SEQ ID NO:712、SEQ ID NO:714、SEQ ID NO:716、SEQ ID NO:718、SEQ ID NO:720、SEQ ID NO:722、SEQ ID NO:724、SEQ IDNO:726、SEQ ID NO:728、SEQ ID NO:730、SEQ ID NO:732、SEQ ID NO:734、SEQID NO:736、SEQ ID NO:738、SEQ ID NO:740、SEQ ID NO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ ID NO:748、SEQ ID NO:750、SEQ ID NO:752、SEQ IDNO:754、SEQ ID NO:756、SEQ ID NO:758、SEQ ID NO:760、SEQ ID NO:762、SEQID NO:764、SEQ ID NO:766、SEQ ID NO:768、SEQ ID NO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ ID NO:776、SEQ ID NO:778、SEQ ID NO:780、SEQ IDNO:782、SEQ ID NO:784、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:790、SEQID NO:792、SEQ ID NO:794、SEQ ID NO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:804、SEQ ID NO:808、SEQ ID NO:808、SEQ IDNO:810、SEQ ID NO:812、SEQ ID NO:814、SEQ ID NO:816、SEQ ID NO:818、SEQID NO:820、SEQ ID NO:822、SEQ ID NO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ ID NO:830、SEQ ID NO:832、SEQ ID NO:834、SEQ ID NO:836、SEQ IDNO:838、SEQ ID NO:840、SEQ ID NO:842、SEQ ID NO:844、SEQ ID NO:846、SEQID NO:848、SEQ ID NO:850、SEQ ID NO:852、SEQ ID NO:854、SEQ ID NO:856、SEQ ID NO:858、SEQ ID NO:860、SEQ ID NO:862、SEQ ID NO:864、SEQ IDNO:866、SEQ ID NO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ ID NO:874、SEQID NO:876、SEQ ID NO:878、SEQ ID NO:880、SEQ ID NO:882、SEQ ID NO:884、SEQ ID NO:886、SEQ ID NO:888、SEQ ID NO:890、SEQ ID NO:892、SEQ IDNO:894、SEQ ID NO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ ID NO:902、SEQID NO:904、SEQ ID NO:906、SEQ ID NO:908、SEQ ID NO:910、SEQ ID NO:912、SEQ ID NO:914、SEQ ID NO:916、SEQ ID NO:918、SEQ ID NO:920、SEQ IDNO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ ID NO:928、SEQ ID NO:930、SEQID NO:932、SEQ ID NO:934、SEQ ID NO:936、SEQ ID NO:938、SEQ ID NO:940、SEQ ID NO:942、SEQ ID NO:944、SEQ ID NO:946、SEQ ID NO:948、SEQ IDNO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ ID NO:956、SEQ ID NO:958、SEQID NO:960、SEQ ID NO:962、SEQ ID NO:964、SEQ ID NO:966、SEQ ID NO:968、SEQ ID NO:970、SEQ ID NO:972、SEQ ID NO:974和/或SEQ ID NO:976具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多或具有100％(完全)序列同一性的氨基酸序列，或其酶促活性片段，

其中(i)或(ii)的所述多肽或肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，或者所述多肽或肽能产生转移酶特异性抗体，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶特异性抗体(充当表位或免疫原的多肽或肽)，

(b)，(a)的多肽或肽和/或其酶促活性子序列(片段)，其中所述序列同一性如下测定：(A)通过用序列比较算法进行分析或通过视觉检测，或(B)在至少约20、25、30、35、40、45、50、55、60、75、100、150、200、250、300或更多个氨基酸残基的区域内，或者在所述多肽或肽或酶的全长内，

(c)，(a)或(b)的多肽或肽，其中所述序列同一性通过用序列比较算法进行分析或通过视觉检测而测定，并且任选地所述序列比较算法是BLAST第2.2.2版算法，其中过滤设置被设置为blastall-p blastp-d"nr pataa"-F F，并且所有其它选项被设置为默认；

(d)，由权利要求1的核酸编码的氨基酸序列和/或其酶促活性子序列(片段)，其中所述多肽具有(i)转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，或(ii)具有免疫原活性，原因在于它能产生与具有(a)的序列的多肽特异性结合的抗体；

(e)，(a)至(d)任一项的氨基酸序列，并且包括至少一个氨基酸残基保守性置换，并且所述多肽或肽保留转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性；

(e)，(d)的氨基酸序列，其中所述保守性置换包括用另一脂肪族氨基酸替换脂肪族氨基酸；用苏氨酸置换丝氨酸或反之亦然；用另一酸性残基替换酸性残基；用另一含有酰胺基团的残基替换含有酰胺基团的残基；用另一碱性残基交换碱性残基；或用另一芳香族残基替换芳香族残基，或其组合，

(f)，(e)的氨基酸序列，其中所述脂肪族残基包括丙氨酸、缬氨酸、亮氨酸、异亮氨酸或其合成等同物；所述酸性残基包括天冬氨酸、谷氨酸或其合成等同物；所述含有酰胺基团的残基包括天冬氨酸、谷氨酸或其合成等同物；所述碱性残基包括赖氨酸、精氨酸或其合成等同物；或者，所述芳香族残基包括苯丙氨酸、酪氨酸或其合成等同物；

(g)，(a)至(f)任一项的多肽，其具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性但缺少信号序列、前原结构域、结合结构域和/或其它结构域，

(h)，(g)的多肽，其中所述结合结构域包括下列或由下列组成：NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域；

(i)，(a)至(h)任一项的多肽，其具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，进一步包括异源序列；

(j)，(i)的多肽，其中所述异源序列包括下列或由下列组成：(A)异源信号序列、异源结构域、异源结合结构域、异源锚定结构域、异源催化结构域(CD)或其组合；(B)，(A)的序列，其中所述异源信号序列、结合结构域或催化结构域(CD)得自异源酶；和/或(C)标记、表位、靶向肽、可切割序列、可检测部分或酶；

(k)，(i)或(j)的多肽，其中所述异序列或所述异源结合结构域包括下列或由下列组成：NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域；

(l)，(i)的多肽，其中所述异源信号序列将编码的蛋白靶向液泡、内质网、叶绿体或淀粉颗粒；或

(m)，其包括由本发明的任何核酸序列编码的氨基酸序列。

在一方面，转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性包括催化化学基团的转移，催化转氨作用，催化下列反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化还原反应，催化氢原子的去除，和/或催化下列反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。

本发明提供分离的、合成的或重组的多肽，其包括本发明的多肽并且缺少信号序列或前原序列。本发明提供分离的、合成的或重组的多肽，其包括本发明的多肽并且具有异源信号序列或异源前原序列。

在一方面，本发明的多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其包括下列范围内的约37℃下的比活性：每毫克蛋白约100至约1000单位、每毫克蛋白约500至约750单位、每毫克蛋白约500至约1200单位或每毫克蛋白约750至约1000单位。在可选的方面，本发明的多肽具有下列范围内的转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性：每克约0.05至20单位，或每克0.05、0.10、0.20、0.30、0.40、0.50、0.60、0.70、0.80、0.90、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7、8、9、10、11、12、13、14、15、16、17、18、19或20或更多单位，其中1单位等于每mg酶每分钟释放1μmol的产物。在一实施方式中，对于转氨酶，1单位的活性等于每mg酶每分钟产生1umol的α-酮酸或酮(由各自的α-氨基酸或胺形成)。在可选的实施方式中，对于转氨酶，1单位的活性等于每mg酶每分钟产生1umol的α-氨基酸或胺(由各自的α-酮酸或酮形成)。

在一方面，本发明的多肽包含至少一个糖基化位点或进一步包含多糖。糖基化可以是N-连接的糖基化，例如其中多肽在巴斯德毕赤酵母(P.pastoris)或粟酒裂殖酵母(S.pombe)中被表达后被糖基化。

本发明提供包含本发明多肽的蛋白质制剂，其中蛋白质制剂包括液体、浆液、固体或凝胶。本发明提供包含本发明多肽和第二结构域的异源二聚体。第二结构域可以是多肽以及异源二聚体是融合蛋白。第二结构域可以是表位或标标记。

本发明提供包含本发明多肽的同源二聚体或异源二聚体。本发明提供固定化多肽，其中所述多肽包含本发明的序列、或其子序列、或由本发明核酸编码的多肽、或包含本发明多肽和第二结构域的多肽，例如其中多肽被固定化在细胞、小泡、脂质体、薄膜、膜、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、阵列、毛细管、晶体、片剂、丸剂、胶囊、粉末、凝块(agglomerate)、表面、多孔结构或材料如木屑、粗浆(brownstock)、浆、纸和衍生自其的材料之上或之内。

本发明的转移酶和/或氧化还原酶可以单独或作为转移酶和/或氧化还原酶和其它水解酶如纤维素酶、甘露聚糖酶、蛋白酶、脂肪酶、淀粉酶或氧化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶的混合物(“鸡尾酒”)来使用或配制。它们可以配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、丸、丸粒，或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、胶囊、或小泡或胶束悬浮液。本发明的制剂可以包括任何下述组分或它们的组合：多元醇如聚乙二醇、聚乙烯醇、丙三醇，糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、麦芽糖、甘露糖；胶凝剂如瓜尔树胶、鹿角菜胶、藻酸盐、葡聚糖、纤维素衍生物、果胶；盐如氯化钠、硫酸钠、硫酸铵、氯化钙、氯化镁、氯化锌、硫酸锌、脂肪酸及脂肪酸衍生物的盐；金属螯合剂如EDTA、EGTA、柠檬酸钠；抗微生物剂如脂肪酸或脂肪酸衍生物、对羟基苯甲酸酯、山梨酸酯、苯甲酸盐；抑制酶如蛋白酶作用的其它调节化合物、大体积蛋白质(bulk proteins)，诸如BSA、小麦水解产物、硼酸盐化合物、氨基酸或肽、适合的pH或温度调节化合物；乳化剂如非离子型和/或离子型洗涤剂；氧化还原剂如胱氨酸/半胱氨酸、谷胱甘肽、氧化谷胱甘肽；还原的或抗氧化的化合物如抗坏血酸；或分散剂。交联和蛋白质修饰如聚乙二醇化、脂肪酸修饰、糖基化也可以用于提高酶的稳定性。

本发明提供包含本发明固定化多肽(或多种)和/或核酸的阵列以及包含本发明固定的寡核苷酸的阵列。本发明的酶、其片段和编码酶的核酸、或探针和其片段可以附于固体支持物上；并且这些实施方式对于工业、医学、研究、药学、食品和饲料以及食品和饲料补充物加工和其它应用及过程中本发明酶和核酸的使用可以是经济的且有效的。例如，酶(或其活性片段)的聚生体或混合物——其用于特定的化学反应——可以附于固体支持物，并且浸于处理容器中。酶反应可以进行。随后，可以将固体支持物从容器中取出，同时取出的是固定在支持物上的酶，用于重复使用。在本发明的一个实施方式中，将分离的、合成的或重组的核酸附着于固体支持物。在本发明的另一个实施方式中，固体支持物选自凝胶、树脂、聚合物、陶瓷、玻璃、微电极以及它们的任意组合。

例如，用于本发明的固体支持物包括凝胶。凝胶的一些例子包括琼脂糖(Sepharose)、明胶、戊二醛、壳聚糖-处理的戊二醛、清蛋白-戊二醛、壳聚糖-黄原胶、toyopearl胶(聚合胶)、藻酸盐、藻酸盐-聚赖氨酸、角叉菜胶、琼脂糖、乙二醛琼脂糖(glyoxyl agarose)、磁性琼脂糖、葡聚糖-琼脂糖、聚(氨基甲酰磺酸盐)水凝胶、BSA-PEG水凝胶、磷酸化的聚乙烯醇(PVA)、单氨基乙基-N-氨基乙基(MANA)、氨基，或者它们的任何组合。用于本发明的另一固体支持物是树脂或者聚合物。树脂或者聚合物的一些例子包括纤维素、丙烯酰胺、尼龙、人造纤维、聚酯、阴离子交换树脂、AMBERLITE^TMXAD-7、AMBERLITE^TMXAD-8、AMBERLITE^TMIRA-94、AMBERLITE^TMIRC-50、聚乙烯、聚丙烯酸、聚甲基丙烯酸酯或者它们的任何组合。用于本发明的另一类固体支持物是陶瓷。一些例子包括无孔陶瓷、多孔陶瓷、SiO₂、Al₂O₃。可以使用的另一类固体支持物是玻璃。一些例子包括无孔玻璃、多孔玻璃、氨丙基玻璃或者它们的任何组合。可以应用的另一类型固体支持物是微电极。例子是聚乙烯亚胺涂覆的磁铁。石墨颗粒可以用作固体支持物。固体支持物的另一个实例是细胞，如红细胞。

有许多本领域技术人员已知的用于将酶或者其片段，或者核酸固定在固体支持物上的方法。这样的方法的一些例子包括：产生静电液滴的方法、电化学方法、通过吸收、通过共价结合、通过交联、通过化学反应或者化学方法、通过封装、通过捕集、通过藻酸钙或者通过聚(2-甲基丙烯酸羟基乙酯)。类似的方法在下述文献中描述：Methods in Enzymology,Immobilized Enzymes and Cells,Part C.1987.Academic Press.由S.P.Colowick和N.O.Kaplan编辑.Volume 136；和Immobilization of Enzymes and Cells.1997.Humana Press.由G.F.Bickerstaff编辑.Series:Methods in Biotechnology,由J.M.Walker编辑。

本发明提供分离的、合成的或重组的抗体，其与本发明的多肽特异性结合。所述抗体可以是单克隆或多克隆抗体、或是单链抗体。本发明提供包含抗体的杂交瘤，所述抗体与本发明的多肽特异性结合。

本发明提供分离或鉴定具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性或ω-转氨酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的方法，该方法包括如下步骤：(a)提供本发明的抗体；(b)提供包括多肽的样品；和(c)将步骤(b)的样品与步骤(a)的抗体在所述抗体能与所述多肽特异性结合的条件下接触，从而分离或鉴定具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽。本发明提供制备抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶抗体的方法，该方法包括以足以产生体液免疫应答的量给予非人动物本发明的核酸或其子序列，从而制备抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶抗体。本发明提供制备抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶抗体的方法，该方法包括以足以产生体液免疫应答的量给予非人动物本发明的多肽或其子序列，从而制备抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶抗体。

本发明提供产生重组多肽的方法，包括如下步骤：(a)提供与启动子可操作地连接的核酸，其中所述核酸包含本发明的序列；和(b)在允许多肽表达的条件下表达步骤(a)的核酸，从而产生重组多肽。该方法可进一步包括用步骤(a)的核酸转化宿主细胞，随后表达步骤(a)的核酸，从而在转化细胞中产生重组多肽。

本发明提供鉴定具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的方法，该方法包括：(a)提供本发明的多肽；(b)提供转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物；和(c)将所述多肽与步骤(b)的底物接触，并且检测底物量的减少或反应产物量的增加，其中底物量的减少或反应产物量的增加检测出具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽。

本发明提供鉴定转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物的方法，包括：(a)提供本发明的多肽；(b)提供测试底物；和(c)，将步骤(a)的多肽与步骤(b)的测试底物接触，并且检测底物量的减少或反应产物量的增加，其中底物量的减少或反应产物量的增加鉴定出作为转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物的测试底物。

本发明提供确定测试化合物是否与多肽特异性结合的方法，包括：(a)在允许核酸翻译为多肽的条件下表达核酸或包括核酸的载体，其中所述核酸具有本发明的序列；(b)提供测试化合物；(c)将多肽与测试化合物接触；和(d)，确定步骤(b)的测试化合物是否与多肽特异性结合。

本发明提供确定测试化合物是否与多肽特异性结合的方法，包括：(a)提供本发明的多肽；(b)提供测试化合物；(c)将多肽与测试化合物接触；和(d)，确定步骤(b)的测试化合物是否与多肽特异性结合。

本发明提供用于鉴定转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的调节剂的方法，包括：(a)提供本发明的多肽；(b)提供测试化合物；和(c)，将步骤(a)的多肽与步骤(b)的测试化合物接触，并测定转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的活性，其中在存在测试化合物的情况下测定的转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性与不存在测试化合物的情况下的活性相比的变化，确定了该测试化合物调节转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，可以通过提供转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物，并检测底物量的减少或反应产物量的增加，或底物量的增加或反应产物量的减少来测量。在一方面，与没有测试化合物时底物或反应产物的量相比，有测试化合物时底物量的减少或反应产物量的增加鉴定出作为转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的激活剂的测试化合物。在一方面，与没有测试化合物时底物或反应产物量相比，有测试化合物时底物量的增加或反应产物量的减少鉴定出作为转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的抑制剂的测试化合物。

本发明提供计算机系统，该系统包括处理器和数据存储设备，其中所述数据存储设备上已经存储了多肽序列或核酸序列，其中多肽序列包含本发明的序列、本发明的核酸编码的多肽。计算机系统可以进一步包括序列比对算法和数据存储设备，所述数据存储设备上已经存储了至少一个参考序列。另一方面，序列比对算法包括指出多态现象(多态性)的计算机程序。一方面，计算机系统可以进一步包括在所述序列中鉴定一个或多个特征的鉴定器(标识符，identifier)。本发明提供了计算机可读介质，其上已经存储了本发明的多肽序列或核酸序列。本发明提供了用于鉴定序列中的特征的方法，包括如下步骤：(a)使用鉴定序列中的一个或多个特征的计算机程序读取序列，其中所述序列包括本发明的多肽序列或核酸序列；和(b)用所述计算机程序鉴定序列中的一个或多个特征。本发明提供了将第一序列与第二序列进行比较的方法，包括如下步骤：(a)通过使用比较序列的计算机程序读取第一序列和第二序列，其中第一序列包括本发明的多肽序列或核酸序列；和(b)用所述计算机程序确定第一序列和第二序列之间的差异。确定第一序列和第二序列之间差异的步骤可以进一步包括鉴定多态性的步骤。一方面，该方法可以进一步包括鉴定序列中的一个或多个特征的鉴定器。另一方面，该方法可以包括使用计算机程序读取第一序列，并鉴定该序列中的一个或多个特征。

本发明提供从环境样品中分离或回收核酸的方法，所述核酸编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽，该方法包括如下步骤：(a)提供用于扩增编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸的扩增引物序列对，其中所述引物对能够扩增本发明的核酸；(b)从环境样品中分离核酸或处理环境样品，以便样品中的核酸可达到与扩增引物对杂交；和(c)将步骤(b)的核酸与步骤(a)的扩增引物对结合，并从环境样品中扩增核酸，从而从环境样品中分离或回收编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸。扩增引物序列对中一个或每一成员可以包含寡核苷酸，该寡核苷酸包含本发明序列的至少约10至50个连续碱基。在一个方面，所述扩增引物序列对是本发明的扩增对。

本发明提供从环境样品中分离或回收核酸的方法，所述核酸编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽，该方法包括如下步骤：(a)提供包含本发明核酸或其子序列的多核苷酸探针；(b)从环境样品中分离核酸或处理环境样品，以便样品中的核酸可达到与步骤(a)的多核苷酸探针杂交；(c)将步骤(b)分离的、合成的或重组的核酸或处理的环境样品与步骤(a)的多核苷酸探针结合；和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸，从而从环境样品中分离或回收编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸。环境样品可以包括水样品、液体样品、土壤样品、空气样品或生物样品。在一个方面，生物样品可以源自细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。

本发明提供产生编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸的变体的方法，包括以下步骤：(a)提供包含本发明核酸的模板核酸；和(b)在模板序列中修饰、缺失或者添加一个或者多个核苷酸，或其组合，以产生模板核酸的变体。在一个方面，该方法进一步包括表达变体核酸，以产生变体转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽。修饰、添加或者缺失由包括易错PCR(error-prone PCR)、重排(shuffling)、寡核苷酸定向诱变(oligonucleotide-directed mutagenesis)、装配PCR(assembly PCR)、有性PCR诱变(sexual PCR mutagenesis)、体内诱变(in vivo mutagenesis)、盒式诱变(cassettemutagenesis)、回归整体诱变(recursive ensemble mutagenesis)、指数整体诱变(exponential ensemble mutagenesis)、位点特异性诱变(site-specific mutagenesis)、基因重装配(gene reassembly，例如GeneReassembly，参见例如美国专利号6,537,776)、基因位点饱和诱变(Gene Site Saturation Mutagenesis,GSSM)、合成连接重装配(syntheticligation reassembly，SLR)或其组合的方法来引入。在另一个方面，修饰、添加或者缺失通过包括下述的方法引入：重组、回归序列重组(recursive序列recombination)、硫代磷酸酯-修饰的DNA诱变(phosphothioate-modified DNA mutagenesis)、含尿嘧啶的模板诱变(uracil-containing template mutagenesis)、缺口二重诱变(gapped duplexmutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复-缺陷型宿主株诱变(repair-deficient host strain mutagenesis)、化学诱变、放射诱变、缺失诱变、限制-选择诱变(restriction-selection mutagenesis)、限制-纯化诱变(restriction-purificationmutagenesis)、人工基因合成(artificial基因synthesis)、整体诱变(ensemble mutagenesis)、嵌合核酸多聚体生成(chimeric nucleic acid multimer creation)和其组合。

在一方面，该方法可以被反复重复，直到产生与模板核酸编码的多肽相比具有改变的或不同的活性或者改变的或不同的稳定性的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。在一方面，变体转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽是耐热的，在暴露于高温度之后仍保留一些活性。在另一方面，与模板核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶相比，变体转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽具有增加的糖基化。可选地，所述变体转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽，在高温下具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述由模板核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶在高温下没有活性。在一个方面，该方法可以被反复重复，直到产生具有与模板核酸的密码子使用有所改变的密码子使用的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶编码序列。在另一个方面，该方法可以被反复重复，直到产生具有比模板核酸的信息表达或稳定性更高或更低水平的信息表达或稳定性的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶基因。在另一个方面，最终的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶产品的制剂，能够增加或调节转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶在产品中的性能。

本发明提供在编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸中修饰密码子以增加其在宿主细胞中表达的方法，该方法包括：(a)提供编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的本发明的核酸；和(b)鉴定步骤(a)的核酸中非优选或较不优选的密码子，用优选的或中度使用(neutrally used)的密码子来代替之，所述优选或中度使用的密码子编码与被代替的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以增加其在宿主细胞中的表达。

本发明提供在编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸中修饰密码子的方法，该方法包括：(a)提供本发明的核酸；和(b)鉴定步骤(a)的核酸中的密码子，并用不同的密码子来代替，所述不同的密码子编码与被代替的密码子相同的氨基酸，从而修饰在编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸中的密码子。

本发明提供在编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸中修饰密码子以增加其在宿主细胞中表达的方法，该方法包括：(a)提供编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽的本发明的核酸；和(b)鉴定步骤(a)的核酸中非优选或较不优选的密码子，用优选的或中度使用(neutrally used)的密码子来代替之，所述优选或中度使用的密码子编码与被代替的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以增加其在宿主细胞中的表达。

本发明提供在编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的核酸中修饰密码子以降低其在宿主细胞中表达的方法，该方法包括：(a)提供本发明的核酸；和(b)鉴定步骤(a)的核酸中的至少一个优选密码子，并用非优选的或较不优选的密码子来代替，所述非优选或较不优选的密码子与被代替的密码子编码相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选的密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以降低其在宿主细胞中的表达。一方面，宿主细胞可以是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。

本发明提供用于产生核酸文库的方法，所述核酸文库编码多个被修饰的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性位点或底物结合位点，其中被修饰的活性位点或底物结合位点来源于第一核酸，所述第一核酸包含编码第一活性位点或第一底物结合位点的序列，该方法包括：(a)提供第一核酸，其编码第一活性位点或第一底物结合位点，其中所述第一核酸序列包含在严格条件下与本发明的序列或其子序列杂交的序列，以及所述核酸编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性位点或转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物结合位点；(b)提供一组诱变寡核苷酸，其在第一核酸的多个目标密码子处编码天然发生的氨基酸变体；和(c)使用该组诱变寡核苷酸，产生一组编码活性位点或编码底物结合位点的变体核酸，其在被诱变的每一氨基酸密码子处编码一定范围的氨基酸变异，从而产生编码多个被修饰的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性位点或底物结合位点的核酸文库。一方面，该方法包括通过包括如下方法的方法诱变步骤(a)的第一核酸：优化的定向进化系统、基因位点饱和诱变(GSSM)或合成连接重装配(SLR)。一方面，该方法包括通过包括如下方法的方法诱变步骤(a)的第一核酸或变体：易错PCR、重排、寡核苷酸定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、回归整体诱变、指数整体诱变、位点特异性诱变、基因再装配(GeneReassembly，美国专利号6,537,776)、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)及其组合。一方面，该方法包括通过包括如下方法的方法诱变步骤(a)的第一核酸或变体：重组、回归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶的模板诱变、缺口双重诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。

本发明提供产生小分子的方法，包括如下步骤：(a)提供多个能合成或修饰小分子的生物合成酶，其中这些酶中的一种酶包括由本发明的核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶；(b)为步骤(a)的至少一种酶提供底物；和(c)将步骤(b)的底物与这些酶在能促进多个生物催化反应的条件下通过一系列生物催化反应进行反应，以产生小分子。本发明提供了修饰小分子的方法，包括：(a)提供转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，其中该酶包含本发明的多肽，或由本发明的核酸或其子序列编码的多肽；(b)提供小分子；和(c)将步骤(a)的酶与步骤(b)的小分子在能促进转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶催化的酶促反应的条件下进行反应，从而通过转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶酶促反应修饰小分子。一方面，该方法可以包含步骤(a)的酶的多个小分子底物，从而产生通过由转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶催化的至少一种酶促反应产生的被修饰小分子的文库。一方面，该方法可以包含多种其它的酶，在有助于这些酶的多个生物催化反应的条件下使用，以形成由多个酶促反应产生的被修饰小分子的文库。另一方面，该方法可以进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的步骤可以进一步包括系统地去除所有但保留一个用于产生文库中多个被修饰小分子中的一部分的生物催化反应，方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子，并鉴定出产生具有期望活性的特定修饰小分子的至少一个特定生物催化反应。

本发明提供确定转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的功能片段的方法，包括如下步骤：(a)提供转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，其中该酶包含本发明的多肽或由本发明核酸或其子序列编码的多肽；和(b)从步骤(a)的序列删除多个氨基酸残基，并测试剩余子序列的转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，从而确定转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的功能片段。一方面，转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性通过提供转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物并检测底物量的减少或反应产物量的增加来测量。

本发明提供通过使用实时代谢流(real-time metabolic flux)分析进行新的或修饰的表型的全细胞工程改造的方法，该方法包括：(a)通过修饰细胞的遗传组成产生修饰的细胞，其中所述遗传组成通过将本发明的核酸加入到细胞来修饰；(b)培养修饰的细胞以产生多个修饰的细胞；(c)通过实时监控步骤(b)的细胞培养物来测量该细胞的至少一个代谢参数；和(d)分析步骤(c)的数据，以确定被测量的参数是否与在类似条件下未修饰细胞中的对照测量值不同，从而使用实时代谢流量分析鉴定细胞中的工程改造的表型。一方面，细胞的遗传组成可以通过包括在细胞中序列的删除或序列的修饰，或敲除基因的表达的方法来修饰。一方面，该方法可以进一步包括选择含有新工程改造的表型的细胞。另一方面，该方法可以包括培养被选择的细胞，从而产生包含新工程改造的表型的新细胞株。

本发明提供了分离的、合成的或重组的信号序列，其组成为或包含在本发明多肽的残基1至12、1至13、1至14、1至15、1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43或1至44中所述的序列，包括本发明的示例性多肽序列。

本发明提供包含至少第一结构域和至少第二结构域的嵌合多肽，第一结构域包含信号肽(SP)，第二结构域包含含有本发明序列或其子序列的异源多肽或肽，其中异源多肽或肽与信号肽(SP)之间没有天然的联系。一方面，信号肽(SP)的来源不是转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。异源多肽或者肽可以在信号肽(SP)或转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶催化结构域(CD)的氨基末端、羧基末端或者羧基和氨基末端。本发明提供编码嵌合多肽的分离的、合成的或者重组的核酸，其中嵌合多肽包括至少第一结构域和至少第二结构域，第一结构域含有信号肽(SP)，第二结构域包含含有本发明序列或其子序列的异源多肽或者肽，其中异源多肽或肽与信号肽(SP)之间没有天然的联系。

本发明提供增加转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽的耐热性或热稳定性的方法，该方法包括糖基化转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽，其中该多肽包含本发明多肽或由本发明核酸序列编码的多肽的至少30个连续氨基酸，从而增加转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽的耐热性或热稳定性。一方面，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶比活性可以在大于下列温度的温度范围内是热稳定的或耐热的：约0℃至约20℃、约20℃至约37℃、约37℃至约50℃、约50℃至约70℃、约70℃至约75℃、约75℃至约80℃、约80℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约110℃或更高温度。

本发明提供在细胞中过量表达重组的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽的方法，该方法包括表达含有核酸的载体，该核酸包含本发明的核酸或本发明的核酸序列，其中序列同一性通过使用序列比较算法的分析或通过视觉观察来确定，其中过量表达通过使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。

本发明提供制备转基因植物和种子的方法，该方法包括：(a)将异源核酸序列引入细胞中，其中异源核酸序列包括本发明的核酸序列，从而产生转化的植物或种子细胞；和(b)从转化的细胞或种子产生转基因植物。在一个方面，步骤(a)可以进一步包括通过植物细胞原生质体的电穿孔或微注射而引入异源核酸序列。在另一个方面中，步骤(a)可进一步包括通过DNA颗粒轰击而直接将异源核酸序列引入到植物组织。可选地，步骤(a)可进一步包括使用根癌农杆菌(Agrobacterium tumefaciens)宿主将异源核酸序列引入植物细胞DNA中。在一个方面，植物细胞可以是马铃薯、玉米、水稻、小麦、烟草或大麦细胞。

本发明提供在植物细胞中表达异源核酸序列的方法，该方法包括：(a)用与启动子可操作地连接的异源核酸序列转化植物细胞，其中异源核酸序列包括本发明的核酸；(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。本发明提供了在植物细胞中表达异源核酸序列的方法，该方法包括：(a)用与启动子可操作地连接的异源核酸序列转化植物细胞，其中异源核酸序列包括本发明的序列；(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。

本发明提供包含本发明多肽或本发明核酸编码的多肽的洗涤剂组合物，其中多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性。转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以是非表面活性的或表面活性的。转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可被配制成不含水的液体组合物、铸型固体、颗粒形式、微粒形式、压缩片剂、凝胶形式、糊剂或浆液的形式。本发明提供了洗涤物体的方法，该方法包括：(a)提供包含具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽或由本发明核酸编码的多肽的组合物；(b)提供物体；和(c)在组合物可洗涤物体的条件下，将步骤(a)的多肽与步骤(b)的物体接触。

本发明提供纺织品或织物，包括例如线，其包含本发明多肽或本发明核酸编码的多肽。本发明提供了处理纺织品或织物的方法(例如从组合物上去除污物)，该方法包括：(a)提供组合物，其包含具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的多肽；(b)提供纺织品或织物；和(c)在转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以处理纺织品或织物(例如去除污物)的条件下，将步骤(a)的多肽与步骤(b)的组合物接触。本发明提供了改进织物饰面(finish)的方法，该方法包括：(a)提供组合物，其包含具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的多肽；(b)提供织物；和(c)在多肽可以处理织物从而改进织物饰面的条件下，将步骤(a)的多肽与步骤(b)的织物接触。一方面，所述织物是毛料或丝绸。另一方面，织物是纤维素纤维或天然纤维和合成纤维的掺合物。

本发明提供饲料、食物、饲料补充物、食物补充物、食物组合物或食物助剂，其包含本发明多肽或本发明核酸编码的多肽。食物或饲料可以是例如谷类、谷物、玉米等等。

本发明提供面团、面包或烘焙产品和/或面团、面包或烘焙产品前体，其包含具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽，其中所述多肽包含本发明的序列，或所述多肽由包含本发明序列的核酸编码，或其酶活性片段。

本发明提供饮料和饮料前体，其包含多肽或其酶活性片段——具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述多肽包含本发明的序列，或所述多肽由包含本发明序列的核酸编码。本发明提供饮料生产的方法，包括将至少一个多肽——所述多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，其中所述多肽包含本发明的序列，或所述多肽由包含本发明序列的核酸编码——或其酶活性片段施用到饮料或饮料前体，其中一方面(任选地)，饮料或饮料前体是麦芽汁或啤酒。

本发明提供用于人或动物的食物、饲料或营养补充物，其包含本发明的多肽，例如本发明核酸编码的多肽。在一个方面，食物或营养补充物中的多肽可以被糖基化。本发明提供了可食用的酶输送基质，其含有本发明的多肽，例如，由本发明的核酸编码的多肽。一方面，该输送基质包括丸剂。一方面，多肽可被糖基化。一方面，转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性是耐热的。另一方面，转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性是热稳定的。

在一方面，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以通过在选自细菌、酵母、植物、昆虫、真菌和动物的生物体中表达编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的多核苷酸而制备。生物体可以选自粟酒裂殖酵母(S.pombe)、酿酒酵母(S.cerevisiae)、巴斯德毕赤酵母(Pichia pastoris)、假单胞菌属某种(Pseudomonas sp.)、大肠杆菌(E.coli.)、链霉菌属某种(Streptomycessp.)、杆菌属某种(Bacillus sp.)和乳酸杆菌属某种(Lactobacillus sp.)。

本发明提供可食用的酶输送基质，其包含热稳定的重组的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，例如本发明的多肽。本发明提供向动物输送转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶补充物的方法，所述方法包括：制备丸剂形式的可食用的酶输送基质，其包含粒状可食用载体以及热稳定的重组的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，其中所述丸剂容易将包含在其中的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶分散入含水介质中，以及给予所述动物该可食用酶输送基质。重组的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以包括本发明的多肽。颗粒状可食用载体可包括选自如下的载体：谷物胚芽，无油谷物胚芽、干草、紫花苜蓿、梯牧草、大豆壳、向日葵花籽粕和次粉(wheat midd)。可食用载体可包含无油谷物胚芽。转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可被糖基化，以在压丸条件下提供热稳定性。该输送基质可以通过对含有谷物胚芽和转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的混合物进行压丸而形成。压丸条件可包括蒸汽的应用。压丸条件可包括应用超过约80℃的温度约5分钟，而该酶保持每毫克酶至少大约350到大约900单位的比活性。

本发明提供处理例如改善乳制品质地和风味的方法，该方法包括：(a)提供具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶；(b)提供乳制品；和(c)将步骤(a)的多肽和步骤(b)的乳制品在其中所述转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以处理例如改善所述乳制品的质地和风味的条件下接触。一方面，乳制品包括奶酪或酸奶酪。本发明提供了包含本发明的或由本发明核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的乳制品。

本发明提供改善从富油植物原料提取油的方法，该方法包括：(a)提供具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶；(b)提供富油植物原料；和(c)将步骤(a)的多肽与富油植物原料接触。一方面，富油植物原料包括富油种子。所述油可以是大豆油、橄榄油、菜籽油(油菜)或葵花油。

本发明提供用于制备水果汁或蔬菜汁、糖浆、浓汤或提取物的方法，该方法包括：(a)提供具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶；(b)提供包含水果或蔬菜原料的组合物或液体；和(c)将步骤(a)的多肽与组合物接触，从而制备水果或蔬菜汁、糖浆、浓汤或提取物。

本发明提供用于处理木材、木制品、纸、纸制品、浆、浆制品、废纸或纸再生组合物的方法，该方法包括：(a)提供具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶；(b)提供包含木材、木制品、纸、纸制品、浆、浆制品、纸废物或纸再生组合物的组合物；和(c)将步骤(a)的多肽与步骤(b)的组合物接触，由此处理木材、木制品、纸、纸制品、浆、浆制品、纸废物或纸再生组合物。在本发明的一方面，处理包括减少或溶解木质素(去木质素作用)、漂白或脱色和/或脱墨。

本发明提供包含本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，或本发明的核酸编码的多肽的纸或纸制品或纸浆。本发明提供了用于处理纸或纸浆或木浆的方法，该方法包括：(a)提供具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明的多肽，或本发明的核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶；(b)提供包含纸或纸浆或木浆的组合物；和(c)在其中转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶能处理纸或纸浆或木浆的条件下，将步骤(a)的多肽与步骤(b)的组合物接触。

本发明提供漂白线、织物、纱、布料或纺织品的方法，包括使织物、纱、布料或纺织品与转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶在适于产生纺织品变白的条件下接触，其中转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶包括本发明的多肽或其酶促活性片段。线、织物、纱、布料或纺织品可以包括非棉纤维素线、织物、纱、布料或纺织品。本发明提供织物、纱、布料或纺织品，其包含具有本发明序列的多肽或由包含本发明序列的核酸编码的多肽或其酶促活性片段，其中一方面(任选地)，织物、纱、布料或纺织品包括非棉纤维素织物、纱、布料或纺织品。

本发明提供木材、木屑、木浆、木制品、纸浆、纸制品、报纸或废纸，其包含本发明的多肽或其酶促活性片段。本发明提供线、织物、纱、布料或纺织品，其包含本发明的多肽或其酶促活性片段。

本发明提供制造乙醇的方法，包括使有机原料例如生物质与具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽接触，其中所述多肽具有本发明的序列，或所述多肽由包含本发明序列的核酸编码，或其酶促活性片段。本发明提供包含乙醇和具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽的组合物，其中所述多肽具有本发明的序列，或所述多肽由包含本发明序列的核酸编码，或其酶促活性片段。本发明提供制造乙醇的方法，该方法包括：(a)提供具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的至少一种多肽，或其酶促活性片段；(b)提供有机组合物；以及(c)使步骤(b)的组合物与步骤(a)的多肽接触。

本发明提供药物组合物，其包含具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽，其中所述多肽具有本发明的序列，或所述多肽由包含本发明序列的核酸编码，或其酶促活性片段。在一个方面，该药物组合物充当消化助剂或者用于诊断、跟踪或治疗任何病症和/或疾病，例如肝损伤/疾病或心肌梗塞。在一方面，所述治疗是预防性的。

在一方面，本发明提供口腔护理产品，其包含具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。口腔护理产品可以包括牙膏、牙科用乳膏、凝胶或牙粉、牙产品(odontic)、漱口水、刷牙前或刷牙后的漱口制剂、口香糖、止咳糖或糖果。本发明提供隐形眼镜清洗组合物，其包含具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的本发明多肽，或本发明核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。

本发明提供嵌合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，其包括本发明的多肽序列和至少一个异源结合结构域，其中一方面(任选地)结合结构域包括下列或由下列组成：NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域。本发明提供设计具有新的结合特异性或提高的结合特异性的嵌合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的方法，其包括将异源或另外的内源结合结构域插入到转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶中，其中所述结合结构域包括本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列的结合子序列，或可选地，异源结合结构域或另外的内源结合结构域被插入到本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列中。

本发明提供酶混合物或“鸡尾酒(cocktails)”，其包含至少一种本发明的酶和一种或更多种其它酶——其可以是另一种转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或任意其它酶；例如，本发明的“鸡尾酒”除了至少一种本发明的酶之外还可以包含任意其它酶，诸如木聚糖酶、纤维素酶、脂肪酶、酯酶、蛋白酶或内糖苷酶、内-β-1,4-葡聚糖酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、过氧化氢酶、漆酶、淀粉酶、葡萄糖淀粉酶、果胶酶、消旋酶、异构酶、表异构酶、脱氢酶、氧化还原酶、还原酶、氧化酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯树胶酶(arabinanases)、半纤维素酶、甘露聚糖酶、木葡聚糖酶、果胶乙酰基酯酶、鼠李糖半乳糖醛酸聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李糖半乳糖醛酸聚糖酶、半乳聚糖酶、果胶裂解酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶等等，这些仅仅是少数例子。在可选的实施方式中，这些包含至少一种本发明的酶的酶混合物或“鸡尾酒”可以用于本发明的任意过程或方法，或本发明的组合物中，例如用于食物或饲料、食物或饲料补充物、纺织品、纸、加工的木材等及制造它们的方法中，以及用于处理纸、浆、木材、纸、浆或废木材或副产品等的组合物和方法中及用于其最终产品中。

本发明提供制备丙酮酸和/或D-谷氨酸的方法，其包括(a)提供D-丙氨酸和2-氧化戊二酸；(b)提供本发明的多肽；和(c)在其中所述多肽催化反应D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸的条件下将(b)的多肽与D-丙氨酸+2-氧化戊二酸接触。

本发明提供制备2-含氧酸的方法，其包括(i)，(a)提供D-氨基酸+H₂O+受体；(b)提供本发明的转氨酶多肽；和(c)在其中所述多肽催化反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体的条件下将(b)的多肽与D-氨基酸+H₂O+受体接触；或(ii)，(i)的方法，其中所述受体是苯醌；(iii)，(ii)的方法，其中所述苯醌是1,2-苯醌或1,4-苯醌或泛醌、泛癸利酮或辅酶Q。

本发明提供将氨基从氨基酸转移至α-酮酸的方法，其包括(i)，(a)提供氨基酸；(b)提供本发明的转氨酶多肽；和(c)在其中所述多肽催化将氨基酸转化成α-酮酸的条件下使(b)的多肽与氨基酸接触；或(ii)，(i)的方法，其中所述转氨酶活性包括催化将外消旋氨基酸混合物转化成基本光学纯的α-酮酸。

本发明提供从α-酮酸转移制备氨基酸的方法，其包括(i)，(a)提供α-酮酸；(b)提供本发明的转氨酶多肽；和(c)在其中所述多肽催化将α-酮酸转化成氨基酸的条件下使(b)的多肽与α-酮酸接触；(ii)，(i)的方法，其中所述转氨酶活性包括催化将外消旋α-酮类混合物转化成基本光学纯的D-或L-氨基酸；或(iii)，(i)或(ii)的方法，其中丁酮二酸被转化成天冬氨酸，或α-酮戊二酸被转化成戊二酸，或α-酮异戊酸被转化成L-缬氨酸；或转氨酶活性是ω转氨酶活性，其将异丁胺转化成异丁醛。

本发明提供催化将胺转化成酮的方法，其包括(i)，(a)提供胺；(b)提供本发明的转氨酶多肽；和(c)在其中所述多肽催化将胺转化成酮的条件下使(b)的多肽与胺接触，其中所述胺不在色氨酸中或来自色氨酸(假定第二氨基酸不是色氨酸，或者假定所述胺不在色氨酸中或来自色氨酸)；(ii)，(i)的方法，其中所述转氨酶活性包括催化将手性胺转化成酮；或(iii)，(i)或(ii)的方法，其中所述胺是ω-胺。

本发明提供催化氨基酸合成的方法，其包括(i)，(a)提供氨基酸和酮酸，其中所述氨基酸不是色氨酸；(b)提供本发明的转氨酶多肽；和(c)在其中产生第二氨基酸和丙酮酸的条件下将(b)的多肽与氨基酸和酮酸接触，其中所述第二氨基酸不是色氨酸(假定第二氨基酸不是色氨酸)；或(ii)，(i)的方法，其进一步包括在适于产生不与转氨酶反应的化合物的条件下使丙酮酸与乙酰乳酸合酶反应；(iii)，(ii)的方法，其中所述不与转氨酶反应的化合物是乙酰乳酸或3-羟基-2-丁酮；或者，第一氨基酸是丙氨酸或L-天冬氨酸；或者，酮酸是2-丁酮酸或三甲基丙酮酸；或者，第二氨基酸是2-氨基丁酸或叔亮氨酸。

本发明的一个或多个实施方式的细节如附图和下面的描述所示。本发明的其它特征、目标和优点将通过阅读说明书和附图以及权利要求而更加清楚。

此处引述的所有出版物、专利、专利申请、GenBank序列和ATCC保藏物均被特意地引入，以作为参考，用于所有目的。

附图说明

下列附图阐明了本发明的各个方面，并且没有意图限制权力要求书所包括的本发明的范围。

本专利或申请文件包含至少一个彩图。具有彩图(或多个)的本专利或专利申请的复印件将在请求且支付所需费用后由官方提供。

图1是一个计算机系统的框图。

图2是一个流程图，该图图解了用于将新核苷酸或蛋白序列与序列数据库进行比较以确定该新序列与数据库中序列之间的同源性水平的过程的一个方面。

图3是一个流程图，该图图解了在计算机中确定两个序列是否同源的过程的一个方面。

图4是一个流程图，该图图解了检测序列中特征的存在的鉴定过程300的一个方面。

图5图解本发明序列的比较，显示了如图中所突出的SEQ ID NO:894类似蛋白质(like protein)的共有序列区域，如图中所突出，如下面实施例9所详述。

图6图解本发明酶序列SEQ ID NO:910与其他公开的DATS的比较，并且如图中所突出，技术人员可看出使该酶独特且可解释其优异活性的残基，如下面实施例10所详述。

图7图解相关D-氨基转移酶的比较及它们共同具有的中心序列基序，如下面实施例14所详述。

图8是3DAA-D-氨基酸氨基转移酶的模型，其中编号的残基表明选择用于TMCA^SM进化的那些位点，如下面实施例29所详述。

在各附图中类似的参考符号表示类似的要素。

具体实施方式

本发明提供转移酶，例如转氨酶，例如d-氨基酸转移酶(也被称为“d-氨基转移酶”或“D-ATs”或“DATs”)，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，以及编码它们的多核苷酸和制备和应用它们的方法。本发明的多肽的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶包括具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的酶，和/或催化化学基团的转移，催化转氨作用，催化下列反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化还原反应，催化氢原子的去除，和/或催化下列反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。本发明的转移酶和/或氧化还原酶可用于制备和/或加工制药(药物)组合物、制药(药物)前体和/或中间体、抗生素、甜味剂、肽酶、肽类激素、燃料、燃料添加剂组合物、食品和食品添加剂、饮料和饮料添加剂、饲料和饲料添加剂、药物和药物添加剂、食物补充物、纺织品、木材、纸、浆和清洁剂和类似物。

在一方面，本发明的酶是耐热的和/或耐高和/或低pH条件的。例如，在一个方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶在包括至少约80℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、103.5℃、104℃、105℃、107℃、108℃、109℃或110℃或更高的温度和至少约pH 11或更大的碱性pH的条件下仍保持活性。

本发明提供分离的、合成的或重组的核酸，其包括编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，或本文所述的其它活性的至少一种多肽的核酸，其中所述核酸包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ IDNO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ IDNO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ IDNO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ IDNO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ IDNO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ IDNO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ IDNO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ IDNO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ IDNO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ IDNO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ IDNO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ IDNO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ IDNO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ IDNO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ IDNO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ IDNO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ IDNO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ IDNO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ IDNO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ IDNO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ IDNO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ IDNO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ IDNO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ IDNO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ IDNO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ IDNO:515、SEQ ID NO:517、SEQ ID NO:519、SEQ ID NO:521、SEQ ID NO:523、SEQ ID NO:525、SEQ ID NO:527、SEQ ID NO:529、SEQ ID NO:531、SEQ IDNO:533、SEQ ID NO:535、SEQ ID NO:537、SEQ ID NO:539、SEQ ID NO:541、SEQ ID NO:543、SEQ ID NO:545、SEQ ID NO:547、SEQ ID NO:549、SEQ IDNO:551、SEQ ID NO:553、SEQ ID NO:555、SEQ ID NO:557、SEQ ID NO:559、SEQ ID NO:561、SEQ ID NO:563、SEQ ID NO:565、SEQ ID NO:567、SEQ IDNO:569、SEQ ID NO:571、SEQ ID NO:573、SEQ ID NO:575、SEQ ID NO:577、SEQ ID NO:579、SEQ ID NO:581、SEQ ID NO:583、SEQ ID NO:585、SEQ IDNO:587、SEQ ID NO:589、SEQ ID NO:591、SEQ ID NO:593、SEQ ID NO:595、SEQ ID NO:597、SEQ ID NO:599、SEQ ID NO:601、SEQ ID NO:603、SEQ IDNO:605、SEQ ID NO:607、SEQ ID NO:609、SEQ ID NO:611、SEQ ID NO:613、SEQ ID NO:615、SEQ ID NO:617、SEQ ID NO:619、SEQ ID NO:621、SEQ IDNO:623、SEQ ID NO:625、SEQ ID NO:627、SEQ ID NO:629、SEQ ID NO:631、SEQ ID NO:633、SEQ ID NO:635、SEQ ID NO:637、SEQ ID NO:639、SEQ IDNO:641、SEQ ID NO:643、SEQ ID NO:645、SEQ ID NO:647、SEQ ID NO:649、SEQ ID NO:651、SEQ ID NO:653、SEQ ID NO:655、SEQ ID NO:657、SEQ IDNO:659、SEQ ID NO:661、SEQ ID NO:663、SEQ ID NO:665、SEQ ID NO:667、SEQ ID NO:669、SEQ ID NO:671、SEQ ID NO:673、SEQ ID NO:675、SEQ IDNO:677、SEQ ID NO:679、SEQ ID NO:681、SEQ ID NO:683、SEQ ID NO:685、SEQ ID NO:687、SEQ ID NO:689、SEQ ID NO:691、SEQ ID NO:693、SEQ IDNO:695、SEQ ID NO:697、SEQ ID NO:699,SEQ ID NO:701、SEQ ID NO:703、SEQ ID NO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:711、SEQ IDNO:713、SEQ ID NO:715、SEQ ID NO:717、SEQ ID NO:719、SEQ ID NO:721、SEQ ID NO:723、SEQ ID NO:725、SEQ ID NO:727、SEQ ID NO:729、SEQ IDNO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:737、SEQ ID NO:739、SEQ ID NO:741、SEQ ID NO:743、SEQ ID NO:745、SEQ ID NO:747、SEQ IDNO:749、SEQ ID NO:751、SEQ ID NO:753、SEQ ID NO:755、SEQ ID NO:757、SEQ ID NO:759、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:765、SEQ IDNO:767、SEQ ID NO:769、SEQ ID NO:771、SEQ ID NO:773、SEQ ID NO:775、SEQ ID NO:777、SEQ ID NO:779、SEQ ID NO:781、SEQ ID NO:783、SEQ IDNO:785、SEQ ID NO:787、SEQ ID NO:789、SEQ ID NO:791、SEQ ID NO:793、SEQ ID NO:795、SEQ ID NO:797、SEQ ID NO:799,SEQ ID NO:801、SEQ IDNO:803、SEQ ID NO:805、SEQ ID NO:807、SEQ ID NO:809、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:815、SEQ ID NO:817、SEQ ID NO:819、SEQ IDNO:821、SEQ ID NO:823、SEQ ID NO:825、SEQ ID NO:827、SEQ ID NO:829、SEQ ID NO:831、SEQ ID NO:833、SEQ ID NO:835、SEQ ID NO:837、SEQ IDNO:839、SEQ ID NO:841、SEQ ID NO:843、SEQ ID NO:845、SEQ ID NO:847、SEQ ID NO:849、SEQ ID NO:851、SEQ ID NO:853、SEQ ID NO:855、SEQ IDNO:857、SEQ ID NO:859、SEQ ID NO:861、SEQ ID NO:863、SEQ ID NO:865、SEQ ID NO:867、SEQ ID NO:869、SEQ ID NO:871、SEQ ID NO:873、SEQ IDNO:875、SEQ ID NO:877、SEQ ID NO:879、SEQ ID NO:881、SEQ ID NO:883、SEQ ID NO:885、SEQ ID NO:887、SEQ ID NO:889、SEQ ID NO:891、SEQ IDNO:893、SEQ ID NO:895、SEQ ID NO:897、SEQ ID NO:899,SEQ ID NO:901、SEQ ID NO:903、SEQ ID NO:905、SEQ ID NO:907、SEQ ID NO:909、SEQ IDNO:911、SEQ ID NO:913、SEQ ID NO:915、SEQ ID NO:917、SEQ ID NO:919、SEQ ID NO:921、SEQ ID NO:923、SEQ ID NO:925、SEQ ID NO:927、SEQ IDNO:929、SEQ ID NO:931、SEQ ID NO:933、SEQ ID NO:935、SEQ ID NO:937、SEQ ID NO:939、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:945、SEQ IDNO:947、SEQ ID NO:949、SEQ ID NO:951、SEQ ID NO:953、SEQ ID NO:955、SEQ ID NO:957、SEQ ID NO:959、SEQ ID NO:961、SEQ ID NO:963、SEQ IDNO:965、SEQ ID NO:967、SEQ ID NO:969、SEQ ID NO:971、SEQ ID NO:973和/或SEQ ID NO:975具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更大或完全(100％)序列同一性(同源性)的序列，并且如本文和表1、2和3和序列表所示(所有这些序列是“本发明的例证性多核苷酸”)，和其酶促活性子序列(片段)，在约10至2500个之间或更多残基的区域内，或全长cDNA、转录物(mRNA)或基因区域内。本发明的核酸包括编码本发明多肽的那些，所述本发明多肽具有与本发明的示例性多肽具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更大或100％(完全)的序列同一性，所述本发明的示例性多肽包括例如SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ IDNO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ IDNO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ IDNO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ IDNO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ IDNO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQID NO:218、SEQ ID NO:220、具有表46或表55的一个、几个或全部修饰的SEQ IDNO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ IDNO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ IDNO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ IDNO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ IDNO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ IDNO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ IDNO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ IDNO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ IDNO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ IDNO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ IDNO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ IDNO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ IDNO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ IDNO:514、SEQ ID NO:516、SEQ ID NO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ ID NO:524、SEQ ID NO:526、SEQ ID NO:528、SEQ ID NO:530、SEQ IDNO:532、SEQ ID NO:534、SEQ ID NO:536、SEQ ID NO:538、SEQ ID NO:540、SEQ ID NO:542、SEQ ID NO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ IDNO:550、SEQ ID NO:552、SEQ ID NO:554、SEQ ID NO:556、SEQ ID NO:558、SEQ ID NO:560、SEQ ID NO:562、SEQ ID NO:564、SEQ ID NO:566、SEQ IDNO:568、SEQ ID NO:570、SEQ ID NO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ ID NO:578、SEQ ID NO:580、SEQ ID NO:582、SEQ ID NO:584、SEQ IDNO:586、SEQ ID NO:588、SEQ ID NO:590、SEQ ID NO:592、SEQ ID NO:594、SEQ ID NO:596、SEQ ID NO:598、SEQ ID NO:600、SEQ ID NO:602、SEQ IDNO:604、SEQ ID NO:606、SEQ ID NO:608、SEQ ID NO:610、SEQ ID NO:612、SEQ ID NO:614、SEQ ID NO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ IDNO:622、SEQ ID NO:624、SEQ ID NO:626、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:636、SEQ ID NO:638、SEQ IDNO:640、SEQ ID NO:642、SEQ ID NO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ ID NO:650、SEQ ID NO:652、SEQ ID NO:654、SEQ ID NO:656、SEQ IDNO:658、SEQ ID NO:660、SEQ ID NO:662、SEQ ID NO:664、SEQ ID NO:666、SEQ ID NO:668、SEQ ID NO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ IDNO:676、SEQ ID NO:678、SEQ ID NO:680、SEQ ID NO:682、SEQ ID NO:684、SEQ ID NO:686、SEQ ID NO:688、SEQ ID NO:690、SEQ ID NO:692、SEQ IDNO:694、SEQ ID NO:696、SEQ ID NO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ IDNO:712、SEQ ID NO:714、SEQ ID NO:716、SEQ ID NO:718、SEQ ID NO:720、SEQ ID NO:722、SEQ ID NO:724、SEQ ID NO:726、SEQ ID NO:728、SEQ IDNO:730、SEQ ID NO:732、SEQ ID NO:734、SEQ ID NO:736、SEQ ID NO:738、SEQ ID NO:740、SEQ ID NO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ IDNO:748、SEQ ID NO:750、SEQ ID NO:752、SEQ ID NO:754、SEQ ID NO:756、SEQ ID NO:758、SEQ ID NO:760、SEQ ID NO:762、SEQ ID NO:764、SEQ IDNO:766、SEQ ID NO:768、SEQ ID NO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ ID NO:776、SEQ ID NO:778、SEQ ID NO:780、SEQ ID NO:782、SEQ IDNO:784、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:790、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ IDNO:802、SEQ ID NO:804、SEQ ID NO:808、SEQ ID NO:808、SEQ ID NO:810、SEQ ID NO:812、SEQ ID NO:814、SEQ ID NO:816、SEQ ID NO:818、SEQ IDNO:820、SEQ ID NO:822、SEQ ID NO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ ID NO:830、SEQ ID NO:832、SEQ ID NO:834、SEQ ID NO:836、SEQ IDNO:838、SEQ ID NO:840、SEQ ID NO:842、SEQ ID NO:844、SEQ ID NO:846、SEQ ID NO:848、SEQ ID NO:850、SEQ ID NO:852、SEQ ID NO:854、SEQ IDNO:856、SEQ ID NO:858、SEQ ID NO:860、SEQ ID NO:862、SEQ ID NO:864、SEQ ID NO:866、SEQ ID NO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ IDNO:874、SEQ ID NO:876、SEQ ID NO:878、SEQ ID NO:880、SEQ ID NO:882、SEQ ID NO:884、SEQ ID NO:886、SEQ ID NO:888、SEQ ID NO:890、SEQ IDNO:892、SEQ ID NO:894、SEQ ID NO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ ID NO:902、SEQ ID NO:904、SEQ ID NO:906、SEQ ID NO:908、SEQ IDNO:910、SEQ ID NO:912、SEQ ID NO:914、SEQ ID NO:916、SEQ ID NO:918、SEQ ID NO:920、SEQ ID NO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ IDNO:928、SEQ ID NO:930、SEQ ID NO:932、SEQ ID NO:934、SEQ ID NO:936、SEQ ID NO:938、SEQ ID NO:940、SEQ ID NO:942、SEQ ID NO:944、SEQ IDNO:946、SEQ ID NO:948、SEQ ID NO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ ID NO:956、SEQ ID NO:958、SEQ ID NO:960、SEQ ID NO:962、SEQ IDNO:964、SEQ ID NO:966、SEQ ID NO:968、SEQ ID NO:970、SEQ ID NO:972、SEQ ID NO:974和/或SEQ ID NO:976，其包括本文和下面表1、2和3以及序列表描述的序列(所有这些序列是“本发明的示例酶/多肽”)，和其酶促活性子序列(片段)。

下面表1、2和3是描述本发明示例性核酸和多肽所选特征的图表，其包括示例性序列与公共数据库的序列同一性比较。

下面表1描述指定的活性(如实验数据所测定，参见本发明的示例性多肽的实施例1至23(由示例性多核苷酸编码)。表1进一步显示，本发明的多核苷酸(编码多肽)是否是克隆(从原始来源分离的基因组序列，如表2所述)还是亚克隆(其中克隆通过例如去除天然的信号序列、添加起始甲硫氨酸、添加标记等操作)。表1还显示克隆和亚克隆关系，例如其亚克隆源自克隆。为了有助于阅读表1，例如，第1和4栏，第1和2行显示SEQ ID NO:32(由SEQ ID NO:31编码)是克隆，其中相应的亚克隆是SEQ ID NO:868(由SEQ ID NO:867编码)，表示为“克隆/亚克隆对1”。

下面表2显示本发明的示例性核酸和多肽所首次起源的来源。下面表2还显示示例性酶的信号序列(或“信号肽”，或SP)的“Signalp切割位点”，如范例Signalp所测定，如下面所讨论(参见Nielsen(1997)，下文)；“预测的信号序列”从氨基末端列到羧基末端，例如对于多肽SEQ ID NO:258，信号肽是“MKSAIVLGAGMVGIATAVHL”。

下面表3描述本发明的示例性核酸和多肽的所选特征，其包括示例性序列与公共数据库的序列同一性比较。为了进一步帮助阅读表3，例如，第一行——标记为“SEQ ID NO:”，数字“1,2”表示具有如SEQ ID NO:2所示的序列、由例如SEQID NO:1编码的本发明的示例性多肽。表2中所述的所有序列(所有本发明的示例性序列)已经经历相对于两组数据库的BLAST检索(如下面详细描述)。第一数据库获自NCBI(美国国家生物技术信息中心)。对这些数据库搜索所获得的所有结果参见名称为“NR描述(NR Description)”、“NR登录号(NR Accession Code)”、“NR E值(NR Evalue)”或“NR生物(NR Organism)”的各栏。“NR”指由NCBI维护的非-冗余(Non-Redundant)核苷酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的综合。栏“NR描述(NR Description)”中的条目指任何给定的NCBI记录中的定义行(definition line)，其包括了对序列的描述，诸如来源生物、基因名称/蛋白质名称，或对序列的一些功能描述。“NR登录号(NR AccessionCode)”一栏中的条目指给予序列记录的独特的标识符(identifier)。“NR E值(NREvalue)”一栏中的条目指期望值(评价)，其代表了这样的概率：同待询序列(querysequence)(本发明的序列)与数据库序列之间发现的比对分值一样良好的比对分值，被发现在随机序列之间具有相同的数量的比较，如在当前的BLAST搜索中所进行的。“NR生物(NR Organism)”一栏中的条目指被鉴定为关系最密切的BLAST命中(hit)的序列的来源生物。第二组数据库统称为Geneseq^TM数据库，其可从Thomson Derwent(Philadelphia，PA)获得。对该数据库所作搜索的所有结果参见名称为“Geneseq^TM蛋白质描述(Geneseq^TMProtein Description)”、“Geneseq^TM蛋白质登录号(Geneseq^TMProtein Accession Code)”、“评价”、“Geneseq^TMDNA描述(Geneseq^TMDNA Description)”、“Geneseq^TMDNA登录号(Geneseq^TMDNA Accession Code)”、或“评价”的各栏中。这些栏中发现的信息与上述NR各栏中发现的信息具有可比性，除了它来自对GENESEQ^TM数据库而不是对NCBI数据库进行的BLAST搜索。此外，该表包括栏“预测的EC编号(Predicted EC No.)”一栏。EC编号是根据标准化的酶命名法的方案赋予一类酶的编号，该命名法是由国际生物化学和分子生物学联合会(IUBMB)的命名委员会的酶分组(Enzyme Commission of theNomenclature Committee of International Union of Biochemistry and MolecularBiology)开发的。在“预测的EC编号”栏中的结果由对Kegg(Kyoto Encyclopediaofgenes and Genomes)数据库的BLAST搜索结果确定。如果最高BLAST匹配(topBLAST match)的评价值等于或小于e^-6，那么赋予最高匹配的EC编号进入表中。最高命中(top hit)的EC编号用作向导，用于指出本发明序列的EC编号可能是什么。“待询DNA长度(Query DNA Length)”和“待询蛋白质长度(Query proteinLength)”这两栏分别指本发明的序列中核苷酸的数目或氨基酸的数目，本发明的序列被用于对NCBI或GENESEQ^TM数据库进行搜索或查询。“对象DNA长度”和“对象蛋白质长度”这两栏分别指从BLAST搜索获得的最高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果来自搜索，其将或者来自NCBI数据库或者来自Geneseq数据库的较低的评价返回(return)。“％ID蛋白质”和“％IDDNA”栏指本发明序列与最高BLAST匹配的序列之间的序列同一性百分比。这些栏中给出的结果来自搜索，其将或者来自NCBI数据库或者来自GENESEQ^TM数据库的较低的评价返回。

表1

表2

[该页的其余部分为故意留下的空白]

本发明提供本发明多核苷酸或多肽的变体，其包含在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基处被(分别地)修饰的序列，然而它们仍然保持本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的生物学活性。变体可以通过许多种方法产生，包括的方法诸如，例如易错PCR、改组、寡核苷酸定向突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、回归整体诱变、指数整体诱变、位点特异性诱变、基因再装配(例如GeneReassembly，参见例如美国专利号6,537,776)、GSSM以及其任意组合。

术语“饱和诱变”或“基因位点饱和诱变”或“GSSM”包括使用简并寡核苷酸引物将点突变引入多核苷酸的方法，如在下面所详细描述的。

术语“优化的定向进化系统”或“优化的定向进化”包括用于重新装配相关的核酸序列的片段的方法，所述的相关核酸序列例如相关的基因，下面对其进行了详细解释。

术语“合成连接重装配”或“SLR”包括以非随机方式连接寡核苷酸片段的方法，下面进行了详细解释。

产生和操作核酸

本发明提供核酸(例如，这样的核酸，其编码具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的多肽；包括具有本发明的示例性核酸序列至少一个序列修饰(如上所定义)的酶，其中所述序列修饰包括一个或多个核苷酸残基变化(或其等同形式)，包括编码本发明多肽的表达盒如表达载体。

本发明还包括使用本发明的核酸发现新的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列的方法。本发明还包括使用本发明的核酸抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶基因、转录物和多肽表达的方法。还提供了修饰本发明的核酸的方法，通过例如合成连接重装配、优化的定向进化系统和/或饱和诱变进行。

本发明的核酸可以通过，例如cDNA文库的克隆和表达、通过PCR进行的信息或基因组DNA扩增以及类似的技术来制备、分离和/或操作。

在一方面，本发明还提供编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸，其共同新颖性在于它们源自环境来源，或细菌来源，或古细菌来源。

在实践本发明的方法中，同源基因可以如本文所述通过操作模板核酸来修饰。本发明可以结合在科技和专利文献中充分描述的、本领域已知的任意方法或方案或装置进行实践。

本发明的一个方面是分离的、合成的或重组的核酸，其包含下列序列之一：本发明的序列及与其基本上相同的序列、与其互补的序列、或包含本发明序列(或与其互补的序列)之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段。该分离的核酸可以包括DNA，包括cDNA、基因组DNA和合成DNA。DNA可以是双链或单链，并且如果是单链，可以是编码链或非编码(反义)链。可选地，本发明分离的、合成的或重组的核酸可包括RNA。

因此，本发明的另一个方面是分离的、合成的或重组的核酸，其编码本发明的多肽之一，或包含本发明多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段。这些核酸的编码序列可以与本发明核酸之一的编码序列之一或其片段相同或者可以是不同的编码序列，其编码下列之一：本发明的多肽、与其基本上相同的序列或具有本发明多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段，这是遗传密码子的冗余性或简并性的结果。遗传密码子对于本领域技术人员是熟知的，并可以例如在B.Lewin,Genes VI,Oxford University Press,1997的第214页上得到。

分离的、合成的或重组的核酸——其编码本发明多肽和与其基本上相同的序列之一——可以包括但不限于：仅本发明的核酸的编码序列和与其基本上相同的序列以及另外的编码序列，例如前导序列或蛋白原序列(proprotein sequences)，以及非编码序列，如内含子，或编码序列的5'和/或3'非编码序列。因此，如在本发明中所使用，术语“编码多肽的多核苷酸”包括多核苷酸，其包括仅多肽的编码序列以及包含另外的编码和/或非编码序列的多核苷酸。

可选地，使用常规技术，例如定点诱变或本领域技术人员熟悉的其它技术，本发明的核酸序列和与其基本上相同的序列可被诱变，以将沉默改变引入本发明的多核苷酸和与其基本上相同的序列。如本文所使用，“沉默改变(silent changes)”包括，例如不改变由所述多核苷酸编码的氨基酸序列的改变。这样的改变可能是期望的，以通过引入在宿主生物体中频繁发生的密码子或密码子对而增加由宿主产生多肽的水平，该宿主含有编码所述多肽的载体。

本发明还涉及具有核苷酸改变的多核苷酸，所述核苷酸改变在本发明的多肽和与其基本上相同的序列中导致氨基酸置换、添加、缺失、融合和截短。使用技术例如定点诱变、随机化学诱变、外切核酸酶III删除和其它重组DNA技术，可以导入这样的核苷酸改变。可选地，这样的核苷酸改变可以是天然存在的等位基因变体，其通过鉴定在本文所提供的高严格条件、中度严格条件或低严格条件下特异性杂交到这样的探针的核酸而分离出，所述探针包含本发明的序列和与其基本上相同的序列(或与其互补的序列)之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基。

一般技术

用于实践本发明的核酸，不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或其杂合体，都可以从多种来源分离、进行遗传工程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽(例如本发明的转氨酶和氧化还原酶)可以被单独地分离或克隆，并且可测试其期望活性。可以使用任何重组表达系统，包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。

可选地，这些核酸可以通过熟知的化学合成技术体外合成，正如例如在Adams(1983)J.Am.Chem.Soc.105:661；Belousov(1997)Nucleic Acids Res.25:3440-3444；Frenkel(1995)Free Radic.Biol.Med.19:373-380；Blommers(1994)Biochemistry 33:7886-7896；Narang(1979)Meth.Enzymol.68:90；Brown(1979)Meth.Enzymol.68:109；Beaucage(1981)Tetra.Lett.22:1859；美国专利4,458,066中所描述的。

用于操纵核酸的技术，例如亚克隆、标记探针(例如使用Klenow聚合酶的随机引物标记、切口平移、扩增)、测序、杂交以及类似的技术在科学和专利文献中有充分的描述，例如参见Sambrook编著，MOLECULAR CLONING:ALABORATORY MANUAL(2ND ED.),1-3卷,Cold Spring Harbor Laboratory,(1989)；CURRENT PROTocOLS IN MOLECULAR BIOLOGY,Ausubel编著，JohnWiley&Sons,Inc.,New York(1997)；LABORATORY TECHNIQUES INBIocHEMISTRY AND MOLECULAR BIOLOGY:HYBRIDIZATION WITHNUCLEIC ACID PROBES,Part I.Theory and Nucleic Acid Preparation,Tijssen,ed.Elsevier,N.Y.(1993)。

获得和操纵用于实践本发明的方法的核酸的另一个有用方法是从基因组样品中克隆，并且如果期望的话，筛选和再克隆插入物，插入物可以分离或扩增自例如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或cDNA文库，所述文库包含在例如哺乳动物人工染色体(MACs)，例如参见美国专利5,721,118；6,025,155；人类人工染色体，例如参见Rosenfeld(1997)Nat.Genet.15：333-335；酵母人工染色体(YAC)；细菌人工染色体(BAC)；P1人工染色体，例如参见Woon(1998)Genomics 50：306-316；P1来源的载体(PACs)，例如参见Kern(1997)Biotechniques 23：120-124；粘粒、重组病毒、噬菌体或质粒中。

一方面，编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。

本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以被融合到异源肽或多肽上，如N-末端鉴定肽，其给予了期望的特性，如增加的稳定性或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达，其中所述融合蛋白中连接有一个或多个额外的结构域，例如用于产生免疫原性更强的肽、以便更易于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞，等等。有利于检测和纯化的结构域包括，例如金属螯合肽，如多组氨酸标记和组氨酸-色氨酸模块，其允许在固定的金属上纯化，还包括蛋白A结构域，其允许在固定的免疫球蛋白上纯化，还包括在FLAGS延伸/亲和纯化系统中所使用的结构域(Immunex Corp，Seattle WA)。在纯化结构域和含有基序的肽或多肽之间包含可切裂的连接子序列有助于纯化，这样的连接子序列例如Xa因子或肠激酶(Invitrogen，San Diego CA)。例如，表达载体可以包括编码表位的核酸序列，其连接到六组氨酸残基上，还连接有硫氧还蛋白和肠激酶切割位点(例如参见Williams(1995)Biochemistry 34：1787-1797；Dobeli(1998)Protein Expr.Purif.12：404-414)。组氨酸残基有助于检测和纯化，而肠激酶切割位点提供了将表位从融合蛋白的剩余部分纯化的手段。关于编码融合蛋白的载体的技术以及融合蛋白的应用在科学和专利文献中进行了充分的描述，例如参见Kroll(1993)DNA Cell.Biol.，12:441-53。

如本文所用，短语“核酸”或“核酸序列”是指寡核苷酸、核苷酸、多核苷酸，或者指寡核苷酸、核苷酸、多核苷酸中任意一种的片段，或者指基因组的或合成来源的DNA或RNA，它们可以是单链或双链，并且可以代表正义链或反义链，还指肽核酸(PNA)或者指天然或合成来源的任何DNA样或RNA样的物质。短语“核酸”或“核酸序列”包括寡核苷酸、核苷酸、多核苷酸，或者寡核苷酸、核苷酸、多核苷酸中任意一种的片段，或者基因组的或合成来源的DNA或RNA(例如mRNA、rRNA、tRNA、iRNA)，它们可以是单链或双链，并且可以代表正义链或反义链，还包括肽核酸(PNA)或者天然或合成来源的任何DNA样或RNA样的物质，例如包括iRNA、核糖核蛋白(例如双链iRNA，例如iRNPs)。该术语包括含有天然核苷酸的已知类似物的核酸，例如寡核苷酸。该术语也包括具有合成骨架的核酸样结构，例如参见Mata(1997)Toxicol.Appl.Pharmacol.144:189-197；Strauss-Soukup(1997)Biochemistry 36:8692-8698；Samstag(1996)Antisense Nucleic Acid Drug Dev 6:153-156。“寡核苷酸”或者包括单链的多脱氧核苷酸，或者包括两个互补的多脱氧核苷酸链，它们可以是化学合成的。这样的合成的寡核苷酸没有5’磷酸，因此如果不在存在激酶的情况下采用ATP添加磷酸，该合成寡核苷酸便不会连接到另一个寡核苷酸上。合成的寡核苷酸可以连接到没有被去磷酸化的片段上。

特定多肽或蛋白的“编码序列”或编码特定多肽或蛋白质的“核苷酸序列”是这样的核酸序列，其当置于合适的调节序列的调控下时被转录和翻译成多肽或蛋白质。

在一方面，术语“基因”意指在产生多肽链中所涉及的DNA片段；其包括编码区之前的区域和之后的区域(前导区(leader)和尾区(trailer))，以及在适用的情况下，包括各个编码片段(外显子)之间的间插序列(内含子)。在一个方面，如本文所用，“可操作地连接”是指两个或更多个核酸(例如DNA)片段之间的功能关系。在一个方面，它是指转录调控序列与被转录序列的功能关系。例如，如果启动子刺激或调节编码序列例如本发明的核酸在适当的宿主细胞或其它表达系统中的转录，那么该启动子便是可操作地连接到编码序列。在一个方面，启动子转录调控序列被可操作地连接到被转录序列，并且与被转录序列是物理上相邻的，即它们是顺式作用。在一个方面，转录调控序列，如增强子可以与编码序列物理相邻或者位于与编码序列接近的位置，这些转录调控序列增强编码序列的转录。

在一方面，如本文所用，术语“表达盒(expression cassette)”是指在宿主中能够影响结构基因(即，编码蛋白质，如本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的序列)表达的核苷酸序列，所述宿主与所述序列相容。表达盒包括至少一个与编码多肽的序列可操作地连接的启动子；并且，一方面，与其它的序列例如转录终止信号可操作地连接。也可以应用进行表达所必要的或有帮助的额外的因子，例如增强子。因此，表达盒也包括质粒、表达载体、重组病毒、任何形式的重组的“裸露DNA”载体，和类似物。一方面，“载体”包括可以感染、转染、瞬间或者永久转导细胞的核酸。在可选方面，载体可以是裸露的核酸，或者与蛋白或者脂类复合的核酸。一方面，载体包括病毒或者细菌的核酸和/或蛋白，和/或膜(如，细胞膜，病毒的脂包膜，等等)。载体包括，但不限于复制子(如，RNA复制子，细菌噬菌体)，DNA片段可以与其连接，并被复制。载体因此包括，但不限于是RNA，自主复制的环状或者线性的DNA或者RNA(如质粒、病毒以及类似物，参见，如美国专利第5,217,879号)，并且也包括表达质粒和非表达质粒。当重组微生物或者细胞培养物被描述为容纳“表达载体”时，其包括染色体外的环状和线性DNA，其已经整合进入宿主染色体(或多个)。当载体由宿主细胞维持时，该载体可以在细胞有丝分裂期间作为自主结构由细胞稳定地复制，或者整合入宿主的基因组中。

在一方面，术语“启动子”包括能够驱动编码序列在细胞例如植物细胞中转录的所有序列。因此，在本发明的构建物中所用的启动子包括顺式作用转录控制元件和调节序列，它们涉及调节或调控基因转录的时间选择(定时)和/或速率。例如，启动子可以是顺式作用转录控制元件，包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5’和3’非翻译区或内含子序列，它们均涉及转录的调节。这些顺式作用序列通常与蛋白或其它生物分子互相作用来执行(打开/关闭、调节、调控等等)转录。“组成型”启动子是那些在大部分环境条件和发育状态或细胞分化状态下持续地驱动表达的启动子。“诱导型”或“可调控型”启动子在环境条件或发育条件的影响下指导本发明的核酸的表达。可以通过诱导型启动子影响转录的环境条件的实例包括无氧条件、增高的温度、干旱或光的存在。

在可选的实施方式中，“组织特异性”启动子是仅仅在特定细胞或组织或器官中有活性的转录控制元件，例如在植物或动物的特定细胞或组织或器官中有活性。组织特异性调节可以通过某些内在因子来实现，这些内在因子确保编码对给定组织特异的蛋白的基因被表达。这样的因子已知存在于哺乳动物和植物中，以便允许特定组织的发育。

在可选的实施方式中，术语“分离的”意指物质(例如核酸、多肽、细胞)从其原始环境(例如天然环境，如果该环境是天然存在的话)中去除出来。例如，在活的动物中存在的天然发生的多核苷酸或多肽不是分离的，但与该天然系统中的一些或所有的共存物质分离开的同一多核苷酸或多肽是分离的。这样的多核苷酸可以成为载体的一部分，和/或这样的多核苷酸或多肽可以是组合物的一部分，并且它们仍然是分离的，因为这样的载体或组合物不是其天然环境的组成部分。在可选实施方式中，术语“纯化的”并不要求绝对的纯度；相反，这意味着是一个相对定义。从文库获得的各个核酸可以被常规地纯化为电泳同质。从这些克隆获得的序列不能够从所述文库或从总人DNA直接获得。本发明的纯化的核酸已经以至少10⁴-10⁶倍从该生物体的基因组DNA的剩余物中纯化出来。但是，术语“纯化的”还包括核酸，这些核酸已经以至少一个数量级，通常以两个或三个，和更通常地四个或五个数量级的程度从基因组DNA的剩余物或从文库或其它环境中的其它序列中被纯化出来。

在可选的实施方式中，术语“重组的”是指核酸邻接于“骨架”核酸，而在天然环境下它们并不邻接。在可选的实施方式中，要“富集”的核酸代表了核酸骨架分子群体中5％或者更多数目的核酸插入物。根据本发明的骨架分子包括核酸，如表达载体、自主复制核酸、病毒、整合性核酸，和用于维持或者操作感兴趣的核酸插入物的其它的载体或者核酸。在可选实施方式中，富集的核酸代表了重组骨架分子群体中的15％或者更多数目的核酸插入物。在可选实施方式中，富集的核酸代表了重组骨架分子群体中的50％或者更多数目的核酸插入物。在一个方面中，富集的核酸代表了重组骨架分子群体中的90％或者更多数目的核酸插入物。

“质粒”命名为在大写字母和/或数字之前和/或之后加上小写字母“p”。本文的起始质粒(starting plasmid)可以通过商业渠道获得，在不受限制的基础上可以公开获得，或可以根据已公开的方法由可获得的质粒来构建。。此外，与本文描述的那些质粒等价的质粒是在本领域是已知的，并且对普通技术人员而言是显而易见的。“质粒”可以商购得到，在不受限制的基础上可以公开获得，或可以根据已公开的方法由可获得的质粒来构建。与本文描述的那些质粒等价的质粒在本技术领域是已知的，并且对于普通技术人员是显而易见的。

在可选的实施方式中，DNA的“消化”指用仅在DNA中某些序列处起作用的限制酶催化裂解DNA。本文中使用的各种限制酶可商业购得并且如普通技术人员所了解的使用它们的反应条件、辅助因子和其它要求。对分析目的而言，通常1μg质粒或DNA片段与在约20μl缓冲溶液中的约2单位的酶一起使用。对于分离DNA片段用于质粒构建而言，通常5至50μgDNA用在更大体积中的20至250单位的酶进行消化。具体限制酶的适合的缓冲液和底物量由制造商进行了说明。普遍使用的是37℃约1小时的温育时间，但可以根据供应商的说明而变化。在消化后，可以进行凝胶电泳以分离期望的片段。

在可选的实施方式中，“杂交”指这样一个过程，即，通过该过程，核酸链与互补链通过碱基配对而结合。杂交反应可以是灵敏的并且是选择性的，以便感兴趣的特定序列可以被鉴定，甚至在其以低浓度存在的样品中也可以被鉴定。适度的严格条件(stringent condition)可以通过，例如预杂交和杂交溶液中盐或甲酰胺的浓度来定义，或者通过杂交温度来定义，这些严格条件在本技术领域是已知的。在可选实施方式中，严格性可以通过降低盐的浓度、增加甲酰胺的浓度或升高杂交温度来增加。在可选择的方面，本发明的核酸通过它们在各种严格条件(例如高、中等和低严格条件)下杂交的能力来定义，正如本文所示。

例如，高严格性下的杂交在大约37℃到42℃、大约50％的甲酰胺下发生。杂交还可以在大约30℃到35℃、大约35％至25％甲酰胺的降低的严格性条件下发生。特别地，杂交可以在高度严格性条件下发生，所述条件为42℃、在50％甲酰胺、5×SSPE、0.3％SDS中，和200μg/ml的剪切和变性鲑精DNA。杂交可发生在如上所述的降低的严格性条件下，但在降低的温度35℃在35％甲酰胺中。相应于特定的严格性水平的温度范围可以通过计算目标核酸中的嘌呤与嘧啶比并相应调节温度而进一步缩小。上述范围和条件的变化在本领域中是熟知的。

转录和翻译控制序列

本发明提供了可操作地连接到一个或多个表达(例如转录或翻译)控制序列上的本发明的核酸(例如DNA)序列，所述控制序列例如启动子或增强子，它们指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。示例性的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR启动子以及鼠金属硫蛋白I启动子。当在启动子处启动转录的RNA聚合酶将编码序列转录成为mRNA时，启动子序列被“可操作地连接于”编码序列。

适合于在细菌中表达多肽的启动子包括大肠杆菌(E.coli)lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子和λPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子以及酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs、以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。适合于在细菌中表达多肽或其片段的启动子包括大肠杆菌lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λP_R启动子和λP_L启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子、以及酸性磷酸酶启动子。真菌启动子包括因子启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。

组织特异性植物启动子

本发明提供了可以以组织特异性方式表达的表达盒，例如可以以组织特异性方式表达本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。本发明也提供了以组织特异性方式表达本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的植物或种子。组织特异性可以是种子特异性、茎特异性、叶特异性、根特异性、果实特异性等。

一方面，组成型启动子如CaMV 35S启动子可以被用于在植物或种子的特定部分或在整个植物中的表达。例如，为了过量表达，可以使用植物启动子片段，其将指导核酸在植物例如再生植物的一些或所有组织中表达。此处，这样的启动子被称作“组成型”启动子，它们在大部分环境条件和发育或细胞分化状态下是有活性的。组成型启动子的实例包括花椰菜花叶病毒(CaMV)35S转录起始区、来自根瘤农杆菌的T-DNA的1’或2’启动子以及来自本技术领域已知的多种植物基因的其它转录起始区。这些基因包括，例如来自拟南芥(Arabidopsis)的ACT11(Huang(1996)Plant Mol.Biol.33:125-139)；来自拟南芥的Cat3(Genbank No.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203)；来自甘蓝型油菜(Brassica napus)的编码硬酯酰基-酰基载体蛋白去饱和酶的基因(Genbank No.X74782，Sol℃ombe(1994)Plant Physiol.104:1167-1176)；来自玉米的GPc1(Genbank No.X15596；Martinez(1989)J.Mol.Biol.208:551-565)；来自玉米的Gpc2(Genbank No.U45855，Manjunath(1997)Plant.Mol.Biol.33:97-112)；在美国专利4,962,028；5,633,440中描述的植物启动子。

本发明使用来自病毒的组织特异性或组成型启动子，它们可以包括，例如烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA 92:1679-1683；稻米东格鲁杆状病毒(RTBV)，该病毒仅在受感染稻米植物中的韧皮细胞中复制，它的启动子驱动强的韧皮特异性报道基因的表达；木薯脉带花叶病毒(CVMV)启动子，其在导管组分、叶中轴细胞和根尖中具有最高活性(Verdaguer(1996)Plant Mol.Biol.31:1129-1139)。

可选择地，植物启动子可以指导表达转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸在特定组织、器官或细胞类型中表达(即，组织特异性启动子)，或者可以另外在更加精确的环境或发育控制下或在诱导型启动子的控制下指导表达。可能影响转录的环境条件的实例包括厌氧条件、升高的温度、有光或喷撒化学品/激素。例如，本发明包括玉米的干旱诱导型启动子(Busk(1997)出处同上)，马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch(1997)Plant Mol.Biol.33:897909)。

组织特异性启动子可以只在该组织的发育阶段的某个时间段内促进转录。参见例如表征拟南芥LEAFY基因启动子的Blazquez(1998)Plant Cell 10:791-800。还参见描述转录因子SPL3的Cardon(1997)Plant J 12:367-77，SPL3识别拟南芥(A.thaliana)花分生组织特征基因(floral meristem identity gene)AP1的启动子区域中的保守序列基序；和描述分生组织启动子eIF4的Mandel(1995)PlantMolecular Biology,29卷,第995-1004页。可以使用在特定组织的整个生命周期都具有活性的组织特异性启动子。一方面，本发明的核酸与主要仅在棉纤维细胞中有活性的启动子可操作地连接。一方面，本发明的核酸与主要在棉纤维细胞伸长的阶段具有活性的启动子可操作地连接，例如，如Rinehart(1996)(出处同上)所述。核酸可以与Fbl2A基因启动子可操作地连接，这样它将偏好在棉纤维细胞(同前)中表达。也参见John(1997)Proc.Natl.Acad.Sci.USA 89:5769-5773；John等,美国专利5,608,148和5,602,321，描述了用于构建转基因棉花植物的棉纤维特异性启动子和方法。也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包括来自醇脱氢酶基因的启动子(DeLisle(1990)Int.Rey.Cytol.123:39-60)。可以用来表达本发明核酸的其它启动子包括，例如胚珠特异的、胚芽特异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的一些组合；叶特异的启动子(参见例如Busk(1997)Plant J.11:12851295，描述了玉米的叶特异的启动子)；发根农杆菌(Agrobacterium rhizogenes)的ORF13启动子(ORF13启动子在根部表现出高活性，见，例如Hansen(1997)如上)；玉米花粉特异性启动子(见，例如Guerrero(1990)Mol.Gen.Genet.224:161168)；番茄启动子，其在果实成熟、变老、叶子脱落的期间有活性，在花中具有低一些的活性(参见例如Blume(1997)Plant J.12:731746)；马铃薯SK2基因的雌蕊特异性启动子(见，例如Ficker(1997)Plant Mol.Biol.35:425431)；豌豆的Blec4基因，Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶中具有活性，这使它成为使外源基因靶向表达于活跃生长的芽或纤维的表皮层的有用工具；胚珠特异的BEL1基因(参见例如Reiser(1995)Cell 83:735-742,GenBank号：U39944)；和/或Klee，美国专利5,589,583中的启动子，该美国专利描述了一种植物启动子区域，其可导致在分生组织和/或快速分裂细胞中的高水平转录。

可选择地，使用暴露于植物激素例如植物生长素后可诱导的植物启动子来表达本发明的核酸。例如，本发明可以使用大豆(Glycine max L.)的植物生长素响应元件E1启动子片段(AuxREs)(Liu(1997)Plant Physiol.115:397-407)；植物生长素响应的拟南芥GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen(1996)Plant J.10:955-966)；烟草的植物生长素诱导的parC启动子(Sakai(1996)37:906-913)；植物生物素响应元件(Streit(1997)Mol.Plant Microbe Interact.10:933-937)；和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science 274:1900-1902)。

本发明的核酸也可以与植物启动子可操作地连接，所述植物启动子暴露于施用于植物的化学试剂例如除草剂或抗生素后可被诱导。例如，可以使用被苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(De Veylder(1997)Plant Cell Physiol.38:568-577)；不同的除草剂安全剂的应用诱导不同的基因表达模式，包括在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导的启动子的控制下，例如，针对含有燕麦(Avena sativa L.)(oat)精氨酸脱羧酶基因的转基因烟草植物所描述的(Masgrau(1997)Plant J.11:465-473)；或者处于水杨酸响应元件的控制之下(Stange(1997)Plant J.11:1315-1324)。使用化学(例如，激素或杀虫剂)诱导的启动子，即，对可施用于田间的转基因植物的化学剂产生响应的启动子，本发明的多肽的表达可以在植物发育的特定阶段被诱导。因此，本发明也提供转基因植物，其包括编码本发明多肽的诱导型基因，其宿主范围限于目标植物种类，如玉米、水稻、大麦、小麦、马铃薯或其它作物，在作物发育的任何阶段是可诱导的。

本领域技术人员应认识到，组织特异性的植物启动子可能驱动可操作地连接的序列在不是靶组织的组织中表达。因此，组织特异性启动子是优选在靶组织或细胞类型中驱动表达的启动子，但是也可以在其它组织中导致一些表达。

本发明的核酸也可以与在暴露于化学试剂后可诱导的植物启动子可操作地连接。这些试剂包括例如，除草剂、合成的植物生长激素或抗生素，它们可以通过例如喷雾施用于转基因植物。本发明的产生转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸的诱导型表达将允许种植者对具有最佳转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶表达和/或活性的植物进行选择。植物部分的发育也可以因此被控制。以这种方式，本发明提供了促进植物和植物部分的收获的方法。例如，在各种实施方式中，由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(De Veylder(1997)Plant Cell Physiol.38:568-577)；应用不同的除草剂安全剂诱导出不同的基因表达模式，包括在根中、排水器中、芽尖分生组织中的表达。本发明的编码序列也可以处于四环素诱导的启动子的控制之下，例如，对含有燕麦(oat)精氨酸脱羧酶基因的转基因烟草植物的描述(Masgrau(1997)Plant J.11:465-473)；或者在水杨酸响应元件控制下(Stange(1997)PlantJ.11:1315-1324)。

在一些方面，适当的多肽表达可能要求在该编码区域的3’端具有多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、各类其它植物(或者动物或其它)基因或者农杆菌T-DNA中的基因。

术语“植物”(例如，本发明的转基因植物或植物种子，或用于本发明载体的植物启动子)包括全植物、植物部分(例如叶、茎、花、根等等)、植物原生质体、种子和植物细胞以及它们的后代；可以用于实践本发明(包括组合物和方法)的植物的种类很广泛，广泛至包括能用转化技术进行处理的植物在内的高等植物，包括被子植物(单子叶植物和双子叶植物)，以及裸子植物；还包括各种倍数性水平的植物，包括多倍体、二倍体、单倍体和半合子状态的植物。如本文所用，术语“转基因植物”包括异源核酸序列已经被插入到其中的植物或植物细胞，所述异源核酸序列例如本发明的核酸和各种重组构建物(例如表达盒，如载体)。本发明的转基因植物在下面也进行了论述。

表达载体和克隆运载体

本发明提供表达载体和克隆运载体，其包含本发明的核酸，例如编码本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的序列。本发明的表达载体和克隆运载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒(phagemids)、粘粒、F粘粒、细菌人工染色体、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪狂犬病病毒和SV40的衍生物)、P1衍生的人工染色体、酵母质粒、酵母人工染色体和任何别的对感兴趣的特定宿主(例如杆菌、曲霉和酵母)有特异性的载体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大量的合适的载体对于本领域技术人员都是已知的，并且可以商业获得。示例性的载体包括：细菌：pQE载体(Qiagen)、pBluescript质粒、pNH载体、λ-ZAP载体(Stratagene)；ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia)；真核细胞载体：PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而，也可以使用任何其它质粒或其它载体，只要它们可以在宿主中复制和存活。可以在本发明中使用低拷贝数或高拷贝数的载体。

表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧翼非转录序列。在一些方面，衍生于SV40剪接子和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录遗传元件。

在一个方面，表达载体含有一个或多个选择性标记基因，使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因或使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。使用氯霉素转移酶(CAT)载体或具有选择标记的其它载体，启动子区域可以从任何期望的基因中选择出来。

用于在真核细胞中表达多肽或其片段的载体也可以含有增强子，以增加表达水平。增强子是DNA的顺式作用元件，一般长度为大约10到大约300bp，其作用于启动子，以增强其转录。例子包括在复制起点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子和腺病毒增强子。

核酸序列可以通过各种方法插入载体中。一般而言，将插入物和载体用合适的限制性内切酶消化后，序列可以连接到载体中的所希望的位置。可选择地，插入物和载体的平末端可以被连接。多种克隆技术在本领域已知，例如在Ausubel和Sambrook中描述的。这样的方法和其它方法被认为在本领域技术人员的范围内。

载体可以是质粒、病毒颗粒或噬菌体的形式。其它载体包括染色体的、非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。

可以使用的具体细菌载体包括商业上可获得的质粒，其包括以下熟知的克隆载体的遗传元件：pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden)、GEM1(Promega Biotec,Madison,WI,USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。具体的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而，可以使用任何其它载体，只要它可以在宿主细胞中复制和存活。

本发明的核酸可以在表达盒、载体或病毒中表达，在植物细胞和种子中短暂地或稳定地表达。一个示例性的短暂表达系统应用了附加型(episomal)表达系统，例如，通过含有超螺旋DNA的附加小染色体的转录而在核中产生的花椰菜花叶病毒(CaMV)病毒RNA，见，例如，Covey(1990)Proc.Natl.Acad.Sci.USA 87:1633-1637。可选地，编码序列，即本发明的序列的全部或子片段，可以插入到植物宿主细胞基因组中，而成为该宿主染色体DNA的整体部分。正义和反义转录子可以以这种方式被表达。包含本发明的核酸的序列(例如，启动子或编码区域)的载体可以包含赋予植物细胞或种子选择性表型的标记基因。例如，所述标记可以编码生物杀灭剂抗性，特别是抗生素抗性，例如对卡那霉素、G418、博来霉素、潮霉素或除草剂的抗性，例如对氯磺隆或Basta的抗性。

可以在植物中表达核酸和蛋白的表达载体在本领域中是熟知的，可以包括，例如，根瘤农杆菌某种的载体、马铃薯病毒X(见，例如，Angell(1997)EMBOJ.16:3675-3684)、烟草花叶病病毒(见，例如，Casper(1996)Gene 173:69-73)、番茄丛矮病毒(见，例如，Hillman(1989)Virology 169:42-50)、烟草蚀纹病毒(见，例如，Dolja(l 997)Virology 234:243-252)、菜豆金色花叶病毒(见，例如，Morinaga(1993)Microbiol inimunol.37:471-476)、花椰菜花叶病毒(见，例如，Cecchini(1997)Mol.Plant Microbe Interact.10:1094-110l)、玉米Ac/Ds转座元件(见，例如，Rubin(1997)Mol.Cell.Biol.17:6294-6302；Kunze(1996)Curr.Top.Microbiol.Inimunol.204:161-194)，和玉米抑制基因-突变基因(Spm)转座元件(见，例如Schlappi(1996)Plant Mol.Biol.32:717-725)；和它们的衍生物。

在一个方面，表达载体可以有两套复制系统，使其可以在两种生物中保持，例如在哺乳动物或昆虫细胞中表达，在原核宿主中克隆和扩增。进一步，对于整合表达载体，该表达载体可以包括至少一个与宿主细胞基因组同源的序列。它可以在该表达构建物的两侧包含两个同源序列。通过选择包含入载体的合适的同源序列，可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建物在本领域是已知的。

本发明的表达载体也可以包括选择性的标记基因，以便对已经被转化的细菌株进行选择，例如，使细菌对药物，例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素具有抗性的基因。选择性的标记也可以包括生物合成基因，例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。

表达载体中的DNA序列被可操纵连接到合适的表达控制序列(一种或多种)(启动子)，以指导RNA合成。具体命名的细菌启动子包括lacI、lacZ、T3、T7、gpt、λP_R、λP_L和trp。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs以及小鼠金属硫蛋白-I启动子。选择合适的载体和启动子完全在本领域技术人员的水平之内。表达载体还包含用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。启动子区域可以从任何期望的基因中选择出来，使用氯霉素转移酶(CAT)载体或具有选择标记的其它载体。此外，表达载体优选含有一个或多个选择性标记基因，以提供用于选择被转化的宿主细胞的表型特征，例如用于真核细胞培养的二氢叶酸还原酶或新霉素抗性，或例如大肠杆菌中的四环素或氨苄青霉素抗性。

哺乳动物表达载体还可以包括复制起点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5’侧翼非转录序列。在一些方面，衍生于SV40剪接子的DNA序列和聚腺苷酸化位点可以用于提供所需要的非转录遗传元件。

用于在真核细胞中表达多肽或其片段的载体也可以含有增强子，以增加表达水平。增强子是DNA的顺式作用元件，一般长度为大约10到大约300bp，其作用于启动子，增强其转录。例子包括在复制起点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子和腺病毒增强子。

此外，表达载体通常含有一个或多个选择性标记基因，使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。

在一些方面中，编码本发明的多肽和与其基本上相同的序列之一或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。该核酸可以编码融合多肽，其中本发明的多肽和与其基本上相同的序列之一或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段被融合到异源肽或多肽，例如N-末端鉴定肽，其给予了期望的特性，如增加的稳定性或简化的纯化。

合适的DNA序列可以通过各种方法插入载体中。一般而言，将插入物和载体用合适的限制性内切酶消化后，DNA序列可以连接到载体中的所希望的位置。可选择地，插入物和载体的平末端可以被连接。多种克隆技术被公开于Ausubel等Current Protocols in Molecular Biology,John Wiley 503Sons,Inc.1997和Sambrook等,Molecular Cloning:A Laboratory Manual 2nd Ed.,Cold Spring Harbor LaboratoryPress(1989)。这样的方法和其它方法被认为在本领域技术人员的范围内。

载体可以是例如质粒、病毒颗粒或噬菌体的形式。其它载体包括染色体的、非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒。在原核和真核宿主中使用的各种克隆和表达载体在Sambrook等,Molecular Cloning:A Laboratory Manual,2nd Ed.,Cold SpringHarbor,N.Y.,(1989)中描述。

宿主细胞和转化细胞

本发明也提供了包含本发明的核酸序列的转化细胞，所述核酸序列例如编码本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的序列，或本发明的载体。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞，包括原核细胞，真核细胞，例如，细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。示例性的细菌细胞包括大肠杆菌属、杆菌属、链霉菌属、沙门氏菌属(Salmonella)、假单胞菌属和葡萄球菌属内的任何种，包括埃希氏大肠杆菌、乳酸乳球菌(Lactococcus lactis)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)、鼠伤寒沙门氏菌(Salmonella typhimurium)、荧光假单胞菌(Pseudomonas fluorescens)。示例性的真菌细胞包括曲霉菌属(Aspergillus)的任何种。示例性酵母细胞包括毕赤酵母属、酵母属、裂殖酵母属(Schizosaccharomyces)或许旺酵母属(Schwanniomyces)内的任何种，包括巴斯德毕赤酵母(Pichia pastoris)、酿酒酵母(Saccharomyces cerevisiae)或粟酒裂殖酵母(Schizosaccharomyces pombe)。示例性的昆虫细胞包括草地夜蛾属(Spodoptera)或果蝇属(Drosophila)内的任何种，包括果蝇S2和草地夜蛾Sf9。示例性的动物细胞包括CHO、COS或黑色素瘤细胞或任何鼠或人的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是熟知的，并在技术和科学文献中有描述。参见，例如，Weising(1988)Ann.Rey.Genet.22:421-477；美国专利5,750,870。

载体可以使用各种技术导入宿主细胞中，包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethods in Molecular Biology,(1986))。

一方面，本发明的核酸或载体导入细胞是为了筛选，所以，所述核酸是以适合于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞类型决定。示例性的方法包括CaPO₄沉淀法、脂质体融合、脂转染法(例如，LIPOFECTIN^TM)、电穿孔法、病毒感染法，等等。候选的核酸可以稳定地整合到宿主细胞基因组中(例如，用反转录病毒导入)或者可以短暂地或稳定地存在于细胞质中(即，通过使用传统的质粒，利用标准的调控序列、选择标记，等等)。因为许多药学上重要的筛选要求人或模型哺乳动物靶细胞，所以可以使用能够转染这些靶标的反转录病毒载体。

在适当的情况下，工程改造的宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后，可用合适的方法(例如，温度变化或化学诱导)诱导被选择的启动子，细胞可再培养一段时期，使得它们产生所需的多肽或其片段。

细胞可以通过离心收获，通过物理或化学方法破碎，保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎，包括冷冻-解冻循环、超声波裂解法、机械破碎法或使用细胞裂解剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析在内的方法回收和纯化。假如必要的话，可以应用蛋白质重折叠步骤来完成多肽的构象。假如需要的话，在最终的纯化步骤中可以采用高效液相层析(HPLC)。

宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。取决于重组生产方法中所用的宿主，由含有载体的宿主细胞产生的多肽可以糖基化或者未糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。

也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA，所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些方面，该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育，产生所需的多肽或其片段。

表达载体可以含有一个或多个选择性标记基因，为选择转化的宿主细胞提供表型特征，例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性，或者例如大肠杆菌的四环素或氨苄青霉素抗性。

含有感兴趣多核苷酸如本发明的核酸的宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增基因。培养条件例如温度、pH和类似条件是先前选择宿主细胞用于表达所使用的培养条件，对于普通技术人员是明显的。然后，被鉴定为具有指定的酶活性的克隆可以被测序，以鉴定编码具有增强活性的酶的多核苷酸序列。

本发明提供了在细胞中过度表达重组转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的方法，该方法包括表达含有本发明的核酸的载体，本发明的核酸例如包含在至少约100个残基的区域上与本发明的序列具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的核酸序列的核酸，其中序列同一性通过用序列比对算法分析或通过视觉观察来测定，或在严格条件下与本发明的核酸序列或其子序列杂交的核酸。过度表达可通过任何方式例如使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。

本发明的核酸可以在任何体外或体内表达系统中被表达或过度表达。任何细胞培养系统可被用于表达或过度表达重组蛋白，包括细菌、昆虫、酵母、真菌或哺乳动物培养物。通过启动子、增强子、载体(例如，复制子载体、双顺反子载体的使用(见，例如Gurtu(1996)Biochem.Biophys.Res.Commun.229:295-8))、培养基、培养系统等等的合适选择，可以实现过度表达。一方面，使用选择标记如谷氨酰胺合酶(见，例如Sanders(1987)Dev.Biol.Stand.66:55-63)在细胞系统中进行的基因扩增被用于过度表达本发明的多肽。

关于该方法的另外详述在公开文献中和/或对本领域普通技术人员是已知的。在具体的非限制性例示中，所述公开可获得的文献包括Journal of Bacteriology.1998August.180(16):4319-4323；Applied Microbiology and Biotechnology.2003June.61(5-6):463-471；Gene.1996℃t.177(1):217-222；J Bacteriol.1994June；176(12):3552–3558；JBC.1997Sept.272(37):23303-23311——尽管这些参考文献没有教导本申请的创造性酶。

宿主细胞可以是本领域技术人员熟悉的任何宿主细胞，包括原核细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。作为合适宿主的代表性例子，可以被提及的有：细菌细胞，例如埃希氏大肠杆菌、链霉菌、枯草芽孢杆菌、蜡状芽孢杆菌、鼠伤寒沙门氏菌和假单胞菌属、链霉菌属和葡萄球菌属中的各个种；真菌细胞，例如曲霉菌属(Aspergillus)；酵母细胞，例如毕赤酵母属、酵母属、裂殖酵母属或许旺酵母属中的任何种，包括巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母；昆虫细胞，例如果蝇S2和草地夜蛾Sf9；动物细胞，例如CHO、COS或黑色素瘤细胞或腺病毒。合适的宿主的选择在本领域技术人员的能力范围内。

载体可以使用各种技术中任何技术导入宿主细胞中，包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法或电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。

在适当的情况下，工程化宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后，可用合适的方法(例如，温度变化或化学诱导)诱导被选择的启动子，细胞可再培养一段时期，使得它们产生所需的多肽或其片段。

细胞一般通过离心收获，通过物理或化学方法破碎，保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎，包括冷冻-解冻循环、超声波裂解法、机械破碎法或使用细胞裂解剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析在内的方法回收和纯化。假如必要的话，可以应用蛋白质重折叠来完成多肽的构象。假如需要的话，在最终的纯化步骤中可以采用高效液相层析(HPLC)。

各种哺乳动物细胞培养系统也可以被用于表达重组蛋白。哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系(由Gluzman,Cell,23:175,1981描述)，以及能从相容载体表达蛋白的其它细胞系，如C127、3T3、CHO、HeLa和BHK细胞系。

宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。根据重组产生方法中所用的宿主，由含有载体的宿主细胞产生的多肽可以糖基化或者未糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸氨基酸残基。

可选地，本发明氨基酸序列的多肽或包含至少5、10、15、20、25、30、35、40、50、75、100或150个其连续氨基酸的片段可以通过常规肽合成仪合成产生。在其它方面，通过肽合成，所述多肽的片段或部分可以被用于产生相应的全长多肽；因此，所述片段可用作产生全长多肽的中间体。

也可以采用无细胞的翻译系统来产生本发明氨基酸序列的多肽之一或包含至少5、10、15、20、25、30、35、40、50、75、100或150个其连续氨基酸的片段，其应用由DNA构建物转录得到的mRNA，所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些方面，该DNA构建物在进行体外转录反应之前可以被线性化。然后将转录得到的mRNA与合适的无细胞翻译提取物如兔网状细胞提取物温育，产生所需的多肽或其片段。

核酸的扩增

在本发明的实践中，本发明的核酸和编码本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸，或本发明的修饰的核酸，可以通过扩增来增殖。扩增也可以被用于克隆或修饰本发明的核酸。因此，本发明提供了用于扩增本发明核酸的扩增引物序列对。本技术领域技术人员能设计对于这些序列的任何部分或全长的扩增引物序列对。

一方面，本发明提供了通过本发明的引物对扩增的核酸，所述引物对例如本发明的核酸的大约前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或25个残基，或者互补链的大约前(5')15、16、17、18、19、20、21、22、23、24或25个残基所示的引物对。

本发明提供了用于扩增核酸的扩增引物序列对，所述核酸编码具有转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性的多肽，其中所述引物对能够扩增含有本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个成员或每一成员可以包含寡核苷酸，该寡核苷酸包含所述序列的至少约10至50个连续碱基，或所述序列的约12、13、14、15、16、17、18、19、20、21、22、23、24或25个连续残基。本发明提供了扩增引物对，其中所述引物对包括第一成员和第二成员，第一成员具有本发明核酸的大约前(5’)12、13、14、15、16、17、18、19、20、21、22、23、24或25个残基所示的序列，第二成员具有第一成员的互补链的大约前(5’)12、13、14、15、16、17、18、19、20、21、22、23、24或25个残基所示的序列。本发明提供了通过扩增产生的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，所述扩增例如聚合酶链反应(PCR)，其使用本发明的扩增引物对。本发明提供了通过扩增制备转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的方法，所述扩增例如聚合酶链反应(PCR)，其使用本发明的扩增引物对。一方面，所述扩增引物对从文库例如基因文库诸如环境文库扩增核酸。

扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸，或量化样品中特异性核酸的量。在本发明的一个方面，扩增从细胞或cDNA文库分离出的信息。

技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增方法在本技术领域也是熟知的，包括，例如聚合酶链式反应PCR(例如参见PCR PROT℃OLS,AGUIDE TO METHODS AND APPLICATIONS，ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGIES(1995),ed.Innis,Academic Press,Inc.N.Y.,连接酶链式反应(LCR)(例如参见Wu(1989)Genomics 4:560；Landegren(1988)Science 241:1077；Barringer(1990)Gene 89:117)；转录扩增(例如参见Kwoh(1989)Proc.Natl.Acad.Sci.USA 86:1173)；和自主维持序列复制(例如参见Guatelli(1990)Proc.Natl.Acad.Sci.USA 87:1874)；Qβ复制酶扩增(例如参见Smith(1997)J.Clin.Microbiol.35:1477-1491)，自动Q-β复制酶扩增测定法(例如参见Burg(1996)Mol.Cell.Probes 10:257-271)和其它的RNA聚合酶介导的技术(例如NASBA,Cangene,Mississauga,Ontario)；也参见Berger(1987)Methods Enzymol.152:307-316；Sambrook；Ausubel；美国专利4,683,195和4,683,202；Sooknanan(1995)Biotechnology 13:563-564。

确定序列同一性程度

本发明提供了分离的、重组的和/或合成的核酸，所述核酸包含与本发明的示例性核酸(如上所限定)，在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的序列。本发明提供了多肽，该多肽包含与本发明的示例性多肽具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的序列。序列同一性(同源性)的程度可以使用任何计算机程序和相关参数来确定，包括本文描述的那些，如BLAST 2.2.2或FASTA 3.0t78版本，参数为默认值。

在可选的实施方式中，术语“计算机”、“计算机程序”和“处理器”以它们在最广的普通语境中的含义被使用，包括了所有这样的设备，如下面所详细描述的。特定多肽或蛋白的“编码序列”或“编码特定多肽或蛋白的序列”是指当被置于适当的调控序列的控制下时可被转录和翻译成多肽或蛋白的核酸序列。

在可选的实施方式中，短语“基本上相同(substantially identical)”在用于两个核酸或多肽时，是指当两个或更多个序列被比较和比对以寻找最大对应性(maximun correspondence)时，它们具有例如至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的核苷酸或氨基酸残基(序列)同一性，所述同一性可以使用一种已知的序列比较算法或者通过视觉观察测量。一般地，在至少约100个残基的区域内存在基本同一性以及最普遍地，序列在至少约150-200个残基上是基本相同的。在一些方面，序列在编码区域的整个长度上是基本相同的。

在可选的实施方式中，“基本上相同的”氨基酸序列是通过一个或多个保守或非保守氨基酸的置换、缺失或插入而与参考序列有所不同的序列，特别是当这种置换发生在不是分子的活性位点的位点，并且前提是多肽必需保持它的功能特性。在可选的实施方式中，保守的氨基酸置换，例如用一个氨基酸置换另一个相同类别的氨基酸(例如用一个疏水氨基酸，如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸，置换另一个疏水氨基酸，或用一个极性氨基酸置换另一个极性氨基酸，例如用精氨酸置换赖氨酸、用谷氨酸置换天冬氨酸，或用谷氨酰胺置换天冬酰胺)。可以例如从转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽中删除一个或多个氨基酸，从而形成对多肽结构的修饰，而又不会显著地改变其生物活性。例如，对转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的生物活性来说不需要的氨基或羧基末端氨基酸可以被去除。可以通过任何方法测定本发明的修饰的多肽序列的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶生物活性，所述方法包括将所述修饰的多肽序列和转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物接触，确定所述修饰的多肽是否在该测定中减少特定底物的量或者增加功能性转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽与底物的酶促反应的生物产物。

本发明的核酸序列可以包含本发明的示例性序列和与其基本上相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续核苷酸。本发明的核酸序列可以包含同源序列以及核酸序列和与其基本上相同的序列的片段，是指与这些序列具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性(同源性)的序列。同源性可以使用本文所描述的任何计算机程序和参数来确定，包括FASTA 3.0t78版本，参数为默认值。同源序列还包括RNA序列，其中尿嘧啶替代本发明核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一种方法获得，或者从对测序错误的纠正中产生。应该意识到，本发明的核酸序列和与其基本上相同的序列可以以传统的单字母形式表示(例如参见Stryer,Lubert.Biochemistry,3rd Ed.,W.H Freeman&Co.,New York的内封底)，或以在序列中记录核苷酸的身份的任何其它形式表示。

在本专利说明书中别处表明的各种序列比对程序被特别考虑用于本发明的这方面。蛋白和/或核酸序列同源性可以使用本技术领域已知的任何各种序列比较算法或程序来评价。这样的算法和程序包括，但绝不限于，TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988；Altschul等,J.Mol.Biol.215(3):403-410,1990；Thompson等,Nucleic Acids Res.22(2):4673-4680,1994；Higgins等,Methods Enzymol.266:383-402,1996；Altschul等,J.Mol.Biol.215(3):403-410,1990；Altschul等,NatureGenetics 3:266-272,1993)。

同源性或同一性通常使用序列分析软件来测量(例如，位于1710UniversityAvenue，Madison,WI 53705的威斯康星大学生物技术中心遗传学计算机组(Genetics Computer Group)的序列分析软件包)。这样的软件通过对各种缺失、置换和其它的修饰指定同源性程度来匹配相似的序列。在两个或者更多个核酸或者多肽序列的上下文中，术语“同源性”和“同一性”是指这样的两个或者更多个序列或子序列，当两个或更多个序列或子序列在某一比较窗口(comparison window)或者指定区域内被比较和联配以确定最大对应性时，这些序列是相同的，或者具有特定百分比例的相同氨基酸残基或核苷酸，其可以应用各种序列比较算法或者通过人工联配和视觉观察来测定。

对于序列比较，通常将一个序列作为参考序列，而将测试序列与之进行比较。当使用序列比较算法时，将测试序列和参考序列输入到计算机中，指定子序列坐标，如果必要，也指定序列算法程序参数。可以使用默认的程序参数，或者可以指定别的参数。然后基于程序参数，序列比较算法计算出测试序列相对于参考序列的序列同一性百分比。

在可选的实施方式中，“比较窗口”包括参考具有任意数目的连续位置的片段，所述数目选自从20到600、通常大约50到大约200，更经常大约100到大约150，其中在序列和参考序列进行最优化联配后，序列可与具有相同数目的连续位置的参考序列作比较。用于比较的联配方法在本技术领域是熟知的。可以通过如下方法进行用于比较的序列的最优化联配：例如Smith和Waterman，Adv.Appl.Math.2：482,1981的局部同源性算法，Needleman和Wunsch,J.Mol.Biol.48:443,1970的同源性联配算法，person和Lipman,Proc.Nat'l.Acad.Sci.USA85：2444,1988的查询相似性的方法，这些算法的计算机化实施(Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA，Genetics Computer Group,575Science Dr.，Madison,WI)，或者手工联配和观察检验。除了BLAST程序(国家生物信息中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))外，用于确定同源性或者同一性的其它的算法包括，例如，ALIGN、AMAS(多重联配序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白多重序列联配(ProteinMultiple Sequence Alignment))、ASSET(联配片段统计评估工具(Aligned SegmentStatistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BL℃ksIMProved Searcher)、FASTA、Intervals&Points、BMB、CLUSTAL V、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸联配工具(Forced NucleotideAlignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(Global Alignment Program))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列联配(L℃al Sequence Alignment))、LCP(局部内容程序(L℃al Content Program))、MACAW(多重联配构建和分析工作台(Multiple AlignmentConstruction&Analysis Workbench))、MAP(多重联配程序(Multiple AlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多重序列联配(Pattern-InducedMulti-sequence Alignment))、SAGA(通过遗传算法的序列联配(Sequence Alignmentby Genetic Algorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库，以鉴定具有大体上相同的序列的多核苷酸序列。大量的基因组数据库是可利用的，例如，作为人类基因组测序工程的一部分的人类基因组的实质部分可以被利用。至少二十一个其它基因组已经被测序，包括如生殖器支原体(M.genitalium)(Fraser等,1995)、甲烷球菌(M.jannaschii)(Bult等,1996)、流行性感冒杆菌(H.influenzae)(Fleischmann等,1995)、大肠杆菌(E.coli)(Blattner等,1997)和酵母(酿酒酵母(S.cerevisiae))(Mewes等,1997)和黑腹果蝇(D.melanogaster)(Adams等,2000)。在模式生物的基因组序列的测序上已经取得了很大的进展，如小鼠、线虫(C.elegans)和拟南芥(Arabadopsis sp.)。含有基因组信息并且注释有一些功能性信息的一些数据库由不同组织维护，可以通过互联网访问。

可用算法的一个例子是BLAST和BLAST 2.0算法，其分别被描述于Altschul等，Nuc.Acids Res.25:3389-3402，1997和Altschul等，J.Mol.Biol.215:403-410，1990。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法涉及首先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对(high scoring sequence pairs，HSPs)，所述高分序列对在与数据库序列中同样长度的字串联配时，匹配或者满足某些正值的阈值分数T。T是指邻近字串(neighborhood word)的分数阈值(Altschul等，如上)。这些初始的邻近字串作为种子(seed)用来启动搜索以发现包含有它们的更长的HSPs。只要累积的联配分数能够被增加，所述字串沿着每一个序列向两个方向延伸。对于核苷酸序列，使用参数M(一对匹配的残基的奖励分数；总是大于0)来计算累积分数。对于氨基酸序列，使用记分矩阵来计算累计分数。出现下面情况时，字串在各个方向上的延伸便停止：累积的联配分数由达到的最大值下降了数量X；由于一个或者多个记分为负的残基联配的累积，累积分数达到0或者0以下；或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)使用的默认值的是：字串长度(W)为11，期望值(E)为10，M＝5，N＝-4，和对两条链进行比较。对于氨基酸序列，BLASTP程序使用的默认值的是：字串长度为3，期望值(E)为10，BLOSUM62记分矩阵(参见Henikoff和Henikoff，Proc.Natl.Acad.Sci.USA 89:10915，1989)联配(B)为50，期望值(E)为10，M＝5，N＝-4，和对两条链进行比较。

BLAST算法也进行两个序列之间的相似性的统计学分析(参见，例如，Karlin和Altschul，Proc.Natl.Acad.Sci.USA 90:5873，1993)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability，P(N))，其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如，在测试核酸和参考核酸的比较中，如果最小合计概率小于约0.2，更优选小于约0.01，最优选小于约0.001，就认为该核酸与参考序列相似。

一方面，应用基本局域联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。具体而言，五个特定的BLAST程序可以用来进行以下的任务：

(1)BLASTP和BLAST3将氨基酸待询序列与蛋白质序列数据库进行比较；

(2)BLASTN将核苷酸待询序列与核苷酸序列数据库进行比较；

(3)BLASTX将待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较；

(4)TBLASTN将待询蛋白序列与在所有六个阅读框(两条链)中翻译的核苷酸序列数据库进行比较；和

(5)TBLASTX将核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。

BLAST程序通过确定相似片段来确定同源序列，所述相似片段在此是指在待查询的氨基酸或核酸序列与测序列之间的“高分片段对(high-scoring segmentpairs)”，该测序列优选从蛋白或者核酸序列数据库得到。高分片段对优选利用记分矩阵来鉴定(即，联配)，很多的记分矩阵在本领域是已知的。优选地，应用的记分矩阵为BLOSUM62矩阵(Gonnet等,Science 256:1443-1445,1992)；Henikoff和Henikoff，Proteins 17:49-61,1993)。较不优选地，也可以应用PAM或者PAM250矩阵(参见如，Schwartz和Dayhoff,eds.,1978,Matrices for Detecting DistanceRelationships:Atlas of protein Sequence and Structure,Washingion:NationalBiomedical Research Foundation)。BLAST程序可从美国国家医学图书馆(U.S.National Library of Medicine)获得。

根据所研究的序列长度和同源性程度，上述算法使用的参数可以被调整。在一些方面，在无用户的指示的情况下，所述参数可以是所述算法所采用的默认参数。

计算机系统和计算机程序产品

为了确定和鉴定序列同一性、结构同源性、基序和在计算机芯片上的类似物，本发明的核酸或多肽序列可以在可被计算机读取和访问的任何介质上存储、记录和操作。

因此，本发明提供了计算机、计算机系统、计算机可读取的介质、计算机程序产品以及其上记录或存储了本发明的核酸和多肽序列的类似设备。如本文所用，词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练的技术人员能容易地采用任何已知方法，在计算机可读取的介质上存储信息，以产生包括本发明的一个或多个核酸和/或多肽序列的产品。

本发明的多肽包括本发明的示例性序列和与其基本上相同的序列及在前序列中任意一种的片段。基本上相同的、或同源的多肽序列是指与本发明的示例性序列，例如本发明的多肽序列具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的多肽序列。

同源性可以使用本文所描述的任何计算机程序和参数来确定，包括FASTA3.0t78版本，参数为默认值或使用任何改进的参数。同源序列可以使用本文描述的任意一种方法获得，或者从对测序错误的纠正中产生。多肽片段包括本发明多肽或与其基本上相同的序列的至少约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500或更多个连续的氨基酸。应该意识到，本发明氨基酸序列或与其基本上相同的序列的多肽代码可以以传统的单字母形式或三字母形式表示(参见上述Stryer,Lubert.Biochemistry,3rd Ed.)，或以在序列中描述多肽身份的任何其它形式表示。

本发明的核酸或多肽序列可以在可被计算机读取和访问的任何介质上存储、记录和操作。如本文所用，词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练的技术人员能容易地采用任何目前已知的方法，在计算机可读取的介质上存储信息，以产生包括本发明核酸序列和与其基本上相同的序列中的一个或多个、本发明多肽序列和与其基本上相同的序列中的一个或多个的产品。本发明的另一方面是其上记录有至少2、5、10、15或20或更多个本发明核酸序列和与其基本上相同的序列的计算机可读取介质。

本发明的另一方面是其上记录有本发明核酸序列和与其基本上相同的序列的一个或多个的计算机可读取介质。本发明的另一方面是其上记录有本发明多肽序列和与其基本上相同的序列的一个或多个的计算机可读取介质。本发明的另一方面是其上记录有至少2、5、10、15或20或更多个如上面所述的序列的计算机可读取介质。

计算机可读取介质包括磁性可读取介质、光学可读取介质、电子可读取介质和磁/光学介质。例如，计算机可读取的介质可以是硬盘、软盘、磁带、CD-ROM、数字化多功能光盘(DVD)、随机访问存储器(RAM)或只读存储器(ROM)以及本领域的技术人员已知的其它类型的其它介质。

本发明的方面包括系统(例如基于因特网的系统)，特别是计算机系统，它们存储和操纵本文描述的序列信息。计算机系统100的一个实例以框图形式示意性地描述在图1中。如本文所用，“计算机系统”指硬件部分、软件部分以及数据存储部分，它们用于分析本发明核酸序列和与其基本上相同的序列的核苷酸序列或本发明氨基酸序列中所阐述的多肽序列。计算机系统100通常包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何熟知类型的中央处理单元，如来自英特尔公司的奔腾III，或来自Sun、Motorola、Compag、AMD或国际商业机器(IBM)公司的类似处理器。

计算机系统100通常是一个通用的系统，该系统包括处理器105和用于存储数据的一个或多个内部数据存储部件110，以及用于检索数据存储部件上存储的数据的一个或多个数据检索设备。技术人员能容易地意识到，任何一种当前可获得的计算机系统都是合适的。

在一个特定的方面，计算机系统100包括连接到总线上的处理器105，总线连接到主存储器115(优选以RAM来实现)，和一个或多个内部数据存储设备110，例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。在一些方面，计算机系统100进一步包括一个或多个数据检索设备118，用于读取在内部数据存储设备110上存储的数据。

数据检索设备118可以是，例如软盘驱动器、压缩磁盘驱动器、磁带驱动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些方面中，内部数据存储设备110是可移动的计算机可读介质，例如含有其上记录的控制逻辑和/或数据的软盘、压缩磁盘、磁带等等。计算机系统100可以有利地包括适当的软件或用适当的软件编程，用于当数据存储部件被插入到数据检索设备中时从数据存储部件读取控制逻辑和/或数据。

计算机系统100包括显示器120，用于给计算机用户显示输出。也应当注意到，计算机系统100可以被连接到网络或广域网中的其它计算机系统125a-c，以便向计算机100提供集中访问。

用于访问和处理本发明核酸序列和与其基本上相同的序列的核苷酸序列或本发明多肽序列和与其基本上相同的序列的软件(例如，检索工具、比较工具和建模工具等等)在执行过程中可驻留于主存储器115中。

在一些方面，计算机系统100可以进一步包括序列比较算法，其用于比较存储于计算机可读介质上的本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列与存储于计算机可读介质上的参考核苷酸或多肽序列。“序列比较算法”指在计算机系统100上执行(本地或远程)的一种或多种程序，以比较核苷酸序列和数据存储设备中存储的其它核苷酸序列和/或化合物。例如，序列比较算法可以将计算机可读介质上存储的本发明核酸序列和与其基本上相同的序列的核苷酸序列或本发明多肽序列和与其基本上相同的序列与计算机可读介质上存储的参考序列进行比较，以鉴定同源性或结构基序。

图2是示意性说明过程200的一个方面的流程图，该过程用于将新的核苷酸或蛋白序列与序列数据库进行比较，以便确定新序列和数据库中的序列之间的同源性水平。序列数据库可以是存储于计算机系统100上的私人数据库，或可以通过因特网获得的公共数据库如GENBANK。

过程200在起始状态201开始，然后转到状态202，其中要被比较的新序列被存储于计算机系统100的存储器上。正如上面所讨论的，该存储器可以是任何类型的存储器，包括RAM或内部存储设备。

然后过程200转到状态204，其中打开序列数据库以进行分析和比较。然后过程200转到状态206，其中数据库中存储的第一个序列被读取到计算机的存储器中。然后在状态210进行比较，以确定第一个序列是否与第二个序列相同。重要的是应该注意到，该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用于比较两个核苷酸或蛋白序列的熟知的方法对于本技术领域的普通技术人员是已知的，即使所述两个核苷酸或蛋白序列不相同。例如，可以在一个序列中引入空位，以提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入到序列中的参数通常由计算机系统的用户输入。

一旦已经在状态210进行两个序列的比较，在决策状态210就要作出两个序列是否相同的判断。当然，术语“相同的”不限于绝对相同的序列。在过程200中，在由用户输入的同源性参数范围内的序列都将被标记为“相同的”。

如果作出两个序列相同的判断，过程200转到状态214，其中来自数据库的序列的名称被显示给用户。该状态通知用户，具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列的名称被显示给用户，过程200转到决策状态218，其中作出数据库中是否存在更多序列的判断。如果数据库中不存在更多的序列，那么过程200在结束状态220终止。然而，如果数据库中确实存在更多的序列，那么过程200转到状态224，其中指针被指向数据库中的下一个序列，以便与新序列进行比较。以这种方式，将新序列与数据库中的每一序列联配并进行比较。

应该注意到，如果已经在决策状态212已经作出了序列不同源的判断，那么过程200将立即转到决策状态218，以便确定用于比较的数据库中的任何其它序列是否可利用。

因此，本发明的一个方面是计算机系统，该系统包括处理器、其上已经存储了本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列的数据存储设备、其上以可检索方式存储了待与本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列比较的参考核苷酸序列或多肽序列的数据存储设备、以及用于进行比较的序列比较器。该序列比较器可以指出被比较的序列之间的同源性水平，或鉴定上述的本发明核酸序列和与其基本上相同的序列的核酸密码或者本发明多肽序列和与其基本上相同的序列中的结构基序，或者该比较器可以鉴定与这些核酸密码和多肽密码进行比较的序列中的结构基序。在一些方面中，数据存储设备可以在其上已经存储了至少2、5、10、15、20、25、30或40个或更多个本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列的序列。

本发明的另一方面是确定本发明核酸序列及与其基本上相同的序列或本发明多肽序列及与其基本上相同的序列和参考核苷酸序列之间的同源性水平的方法。所述方法包括通过使用确定同源性水平的计算机程序读取核酸代码或多肽代码以及参考核苷酸或多肽序列，以及用该计算机程序确定核酸代码或多肽代码与参考核苷酸或多肽序列之间的同源性。所述计算机程序可以是确定同源性水平的许多计算机程序的任何一种，包括本文中具体罗列的那些程序(例如，BLAST2N，具有默认参数或任何调整的参数)。所述方法可以使用上述的计算机系统执行。所述方法还可以如下进行：通过使用所述计算机程序读取至少2、5、10、15、20、25、30或40个或更多个上述的本发明的核酸序列或本发明的多肽序列，以及确定核酸代码或多肽代码与参考核苷酸序列或多肽序列之间的同源性。

图3是示意性说明计算机中的过程250的一个方面的流程图，该过程用于确定两个序列是否同源。过程250在起始状态252开始，然后转到状态254，其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态256被存储到存储器上。然后过程250转到状态260，其中读取第一个序列中的第一个字符，然后转到状态262，其中读取第二个序列的第一个字符。应该理解到，如果序列是核苷酸序列，那么字符将通常是A、T、C、G或U。如果序列是蛋白序列，那么字符优选是单字母氨基酸代码，以便第一个序列和第二个序列可以被容易地比较。

然后在决策状态264作出两个字符是否相同的判断。如果它们相同，那么过程250转到状态268，其中第一个和第二个序列中的下一个字符被读取。然后作出该下一个字符是否相同的判断。如果它们相同，那么过程250继续循环，直到两个字符不相同。如果作出的判断是这两个字母不相同，那么过程250转到决策状态274，以确定是否有更多的字符或者序列可以读取。

如果没有可读取的任何更多的字符，那么过程250转到状态276，其中第一个和第二个序列之间的同源性水平被显示给用户。同源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因此，如果前100个核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配，那么同源性水平将是100％。

可以选择地，计算机程序可以是这样的计算机程序，其将本发明所示的核酸序列的核苷酸序列与一个或多个参考核苷酸序列进行比较，以确定本发明核酸序列和与其基本上相同的序列的核酸代码是否在一个或多个位置上与参考核酸序列不同。在一个方面，这样的程序记录了，相对于参考多核苷酸序列或者本发明核酸序列和与其基本上相同的序列，被插入、删除或置换的核苷酸的长度和身份。一方面，计算机程序可以是确定本发明的核酸序列和与其基本上相同的序列是否相对于参考核苷酸序列含有单核苷酸多态性(SNP)的程序。

本发明的另一方面是确定本发明核酸序列和与其基本上相同的序列是否在一个或多个核苷酸处与参考核苷酸序列不同的方法，所述方法包括通过使用鉴定核酸序列之间的差异的计算机程序读取核酸代码和参考核苷酸序列，并用该计算机程序鉴定核酸代码和参考核苷酸序列之间的差异的步骤。在一些方面，计算机程序是鉴定单核苷酸多态性的程序。该方法可以通过上面描述的计算机系统和图3所示意性说明的方法执行。所述方法还可以如下进行：通过使用所述计算机程序读取至少2、5、10、15、20、25、30或40个或更多个本发明核酸序列及与其基本上相同的序列和参考核苷酸序列，以及用该计算机程序鉴定核酸代码与参考核苷酸序列之间的差异。

在其它方面，基于计算机的系统可以进一步包括鉴定器，其用于鉴定本发明核酸序列或本发明多肽序列和与其基本上相同的序列中的特征。

“鉴定器”指在本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列中鉴定某些特征的一个或多个程序。一方面，鉴定器可以包括在本发明核酸序列和与其基本上相同的序列中鉴定开放阅读框(ORF)的程序。

图4是示意性说明鉴定器过程300的一个方面的流程图，用于检测序列中特征的存在。过程300在起始状态302开始，然后转到状态304，其中将被检查特征的第一个序列存储在计算机系统100的存储器115上。然后过程300转到状态306，其中打开序列特征数据库。这样的数据库包括每一特征的属性以及该特征的名称的列表。例如，特征名称可以是“起始密码子”，属性将是“ATG”。另一个实例是特征名称“TAATAA序列盒”，特征属性是“TAATAA”。这样的数据库的实例由威斯康星大学遗传学计算机组(University of Wisconsin Genetics Computer Group)开发。可以选择地，这些特征可以是结构多肽基序如α螺旋、β折叠，或功能多肽基序如酶促活性位点、螺旋-转角-螺旋基序或本技术领域技术人员已知的其它基序。

一旦在状态306打开特征数据库，过程300就转到状态308，其中从数据库读取第一个特征。然后在状态310将第一个特征的属性与第一个序列进行比较。接着在决策状态316作出在第一个序列中是否发现该特征的属性的判断。如果发现了属性，那么过程300转到状态318，其中所发现的特征的名称被显示给用户。

然后，过程300转到决策状态320，其中作出数据库中是否存在更多特征的判断。如果不存在更多特征，那么过程300在结束状态324终止。然而，如果数据库中确实存在更多的特征，那么过程300在状态326读取下一个序列特征，循环回到状态310，其中将下一个特征的属性与第一个序列进行比较。应当注意，如果在决策状态316在第一个序列中没有发现特征属性，那么过程300直接转到决策状态320，以便确定数据库中是否存在更多特征。

因此，本发明的另一方面是鉴定本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列中的特征的方法，所述方法包括通过使用鉴定其中特征的计算机程序读取核酸代码或多肽代码，并用该计算机程序鉴定核酸代码中的特征。一方面，计算机程序包括鉴定开放阅读框的计算机程序。所述方法可以如下进行：通过使用所述计算机程序读取本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列中的单个序列或至少2、5、10、15、20、25、30或40个或更多个序列，以及用该计算机程序鉴定核酸代码或多肽代码中的特征。

本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列可以以多种形式在各种数据处理器程序中存储和操作。例如，本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列可以以文本文件存储在字处理文件中，如Microsoft WORD^TM或WORDPERFECT^TM，或以ASCII文件存储在本领域技术人员熟悉的各种数据库程序中，例如DB2^TM、SYBASE^TM或ORACLE^TM。此外，许多计算机程序和数据库可以被用作序列比较算法、鉴定器或与本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列进行比较的参考核苷酸序列或多肽序列的来源。下面的罗列不意图限制本发明，而是提供对本发明核酸序列和与其基本上相同的序列或本发明多肽序列和与其基本上相同的序列有用的程序和数据库的指导。

可以使用的程序和数据库，包括但不限于：MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(Molecular Applications Group)、Look(Molecular Applications Group)、MacLook(Molecular Applications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等.Comp.App.Biosci.6:237-245,1990)、Catalyst(Molecular SimulationsInc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、Cerius².DBAccess(MolecularSimulations Inc.)、HypoGen(Molecular Simulations Inc.)、Insight II(MolecularSimulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(MolecularSimulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular SimulationsInc.)、QuanteMM(Molecular Simulations Inc.)、Homology(Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(Molecular Simulations Inc.)、Quanta/ProteinDesign(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLabDiversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular SimulationsInc.)、SeqFold(Molecular Simulations Inc.)、MDL Available Chemicals Directory数据库、MDL Drug Data Report数据库、Comprehensive Medicinal Chemistry数据库、Derwents’s World Drug Index数据库、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。基于本发明的公开内容，许多其它程序和数据库对于本技术领域的技术人员是显而易见的。

可以用上述程序检测的基序包括：编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、α螺旋和β折叠、编码指导被编码的蛋白分泌的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性伸展物(acidicstretches)、酶促活性位点、底物结合位点和酶切割位点。

核酸的杂交

本发明提供了分离的、合成的或重组的核酸，所述核酸与本发明的示例性序列在严格条件下杂交。严格条件可以是高严格条件、中等严格条件和/或低严格条件，包括本文描述的高的和降低的严格性的条件。一方面，正如下面所讨论的，洗涤条件的严格性阐述了决定核酸是否在本发明范围内的条件。

在可以选择的方面中，本发明的核酸，正如通过它们在严格条件下杂交的能力所定义的，可以在本发明的核酸的大约五个残基到全长之间；例如它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多残基。也包括小于全长的核酸。这些核酸可以用作，例如杂交探针、标记探针、PCR寡核苷酸探针、iRNA(单链或双链)、反义或编码抗体结合肽(表位)、基序、活性位点的序列以及类似序列。

一方面，本发明的核酸通过它们在高度严格性下杂交的能力定义，高度严格性包括在大约37℃到42℃的温度下大约50％的甲酰胺的条件。一方面，本发明的核酸通过它们在降低的严格性下杂交的能力定义，降低的严格性包括在大约30℃到35℃在大约35％至25％的甲酰胺中的条件。

可以选择地，本发明的核酸通过它们在高度严格性下杂交的能力定义，高度严格性包括的条件为：在42℃、在50％甲酰胺、5×SSPE、0.3％SDS中，和封闭核酸的重复序列，如cot-1或鲑精DNA(例如200μg/ml的剪切和变性鲑精DNA)。一方面，本发明的核酸通过它们在降低的严格性条件下杂交的能力定义，降低的严格性条件包括在35℃的降低温度下的35％甲酰胺中。

在核酸杂交反应中，用于得到特定严格性水平的条件将根据杂交中的核酸的性质变化。例如，所述核酸的杂交区域的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)可以在选择杂交条件时加以考虑。另外的考虑因素是核酸之一是否被固定，例如固定在滤膜上。

杂交可以在低度严格性、中度严格性或高度严格性的条件下进行。作为核酸杂交的一个实例，含有固定化的变性核酸的聚合物膜首先在45℃在由如下成分组成的溶液中预杂交30分钟：0.9M NaCl、50mM NaH₂PO₄,pH 7.0、5.0mM Na₂EDTA、0.5％SDS、10×Denhardt’s和0.5mg/ml多核糖腺苷酸。然后在该溶液中加入大约2×10⁷cpm(比活性为4-9×10⁸cpm/ug)的³²P末端标记的寡核苷酸探针。在温育12-16小时后，在室温下在含有0.5％SDS的1×SET(150mM NaCl、20mM Tris盐酸，pH 7.8、1mM Na₂EDTA)中将膜洗涤30分钟，随后，在该寡核苷酸探针的T_m-10℃的温度，在新鲜的1×SET中洗涤30分钟。然后将膜暴露于放射自显影胶片，以检测杂交信号。

所有的前述杂交将被认为是在高严格条件下。

杂交后，洗涤滤膜以除去任何非特异性结合的可检测探针。用于洗涤滤膜的严格性也可以根据如下方面进行变化：被杂交的核酸的性质、被杂交的核酸的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如RNA和DNA)。逐步增高的严格性洗涤条件的实例如下：2×SSC，0.1％SDS，室温下洗涤15分钟(低度严格性)；0.1×SSC，0.5％SDS，室温下洗涤30分钟到1小时(中度严格性)；0.1×SSC，0.5％SDS，在杂交温度至68℃之间洗涤15到30分钟(高度严格性)；和0.15M NaCl，72℃洗涤15分钟(极高严格性)。最终的低严格性洗涤可以在0.1×SSC在室温下进行。上述的实例仅仅是可用于洗涤滤膜的一组条件的示例性说明。本领域技术人员将知道，对于不同严格性的洗涤，可以有多种方案。下面给出了一些其它实例。

通过放射自显影或其它常规技术，来鉴定已杂交至探针的核酸。

可以对上述方法进行修改，以鉴定与探针序列具有降低水平的同源性的核酸。例如，为了获得与可检测的探针具有降低的序列同源性的核酸，可以使用较低严格性的条件。例如，杂交温度可以以5℃的增量从68℃降低到42℃，杂交缓冲液的Na⁺浓度为大约1M。在杂交后，用2×SSC、0.5％SDS在杂交温度下洗涤滤膜。这些条件在高于50℃被认为是“中度”条件，在低于50℃被认为是“低度”条件。“中度”杂交条件的具体实例是上述杂交在55℃进行。“低度严格性”杂交条件的具体实例是上述杂交在45℃进行。

可以选择地，杂交可以在含有甲酰胺的缓冲液如6×SSC中在42℃的温度下进行。在这种情况下，杂交缓冲液中甲酰胺的浓度可以以5％的增量从50％降低到0％，以鉴定与探针具有降低水平的同源性的克隆。在杂交后，用6×SSC、0.5％SDS在50℃洗涤滤膜。这些条件在高于25％的甲酰胺被认为是“中度”条件，在低于25％甲酰胺被认为是“低度”条件。“中度”杂交条件的具体实例是上述杂交在30％甲酰胺中进行。“低度严格性”杂交条件的具体实例是上述杂交在10％甲酰胺中进行。

然而，杂交形式的选择不是关键性的——洗涤条件的严格性是决定核酸是否在本发明范围内的条件。用于鉴定本发明范围内的核酸的洗涤条件包括，例如：在pH 7大约0.02M的盐浓度，至少大约50℃或大约55℃到大约60℃的温度；或者在72℃大约0.15M NaCl的盐浓度下大约15分钟；或者在至少大约50℃或大约55℃到大约60℃的温度下大约0.2×SSC的盐浓度下大约15到大约20分钟；或者用溶液将杂交复合物洗涤两次，所述溶液的盐浓度为含有0.1％SDS的大约2×SSC，在室温下洗涤15分钟，然后用含有0.1％SDS的0.1×SSC在68℃洗涤15分钟，洗涤两次；或者等同的条件。参见Sambrook,Tijssen和Ausubel对于SSC缓冲液和等同条件的描述。

这些方法可以被用于分离本发明的核酸。例如，前述方法可用于分离核酸，所述核酸具有与选自本发明序列及与其基本上相同的序列或其含有至少大约10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段以及其互补序列之一的核酸序列具有至少约97％、至少95％、至少90％、至少85％、至少80％、至少75％、至少70％、至少65％、至少60％、至少55％或至少50％同源性的序列。同源性可以使用联配算法来测量。例如，同源多核苷酸可以具有编码序列，该编码序列是本文描述的编码序列之一的天然发生的等位基因变体。当与本发明核酸或其基本上互补的序列比较时，这样的等位基因变体可以具有一个或多个核苷酸的置换、删除或添加。

另外，上述的方法可用于分离编码多肽的核酸，所述多肽与具有本发明氨基酸序列之一的序列的多肽或者其包含至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有至少大约99％、至少95％、至少90％、至少85％、至少80％、至少75％、至少70％、至少65％、至少60％、至少55％或至少50％的同源性，正如使用序列联配算法(例如FASTA 3.0t78版本算法，参数为默认值)所测定的。

寡核苷酸探针及使用这些寡核苷酸探针的方法

本发明也提供了核酸探针，例如可以用于鉴定编码具有转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性的多肽的核酸或其片段，或用于鉴定转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的基因。一方面，该探针包括本发明核酸中的至少大约10个连续碱基。可以选择地，本发明的探针可以是如本发明核酸中所示序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或大约10到50、大约20到60或大约30到70个连续碱基。这些探针通过结合和/或杂交来鉴定核酸。这些探针可以在本发明的阵列中使用，参见下面的讨论，包括例如毛细管阵列。本发明的探针也可以用于分离其它核酸或多肽。

本发明的分离的、合成的或重组的核酸及与其基本上相同的序列、与其互补的序列、或含有本发明序列及与其基本上相同的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段、或与其互补的序列，也可用作探针，以确定生物样品如土壤样品是否含有具有本发明的核酸序列的生物体或从中可得到所述核酸的生物体。在这样的方法中，获得潜在地具有从中可分离出所述核酸的生物体的生物样品，并从样品中获得核酸。将这些核酸在允许探针与样品中存在的任何互补序列特异性杂交的条件下与探针接触。

在必要的时候，允许探针与互补序列特异性杂交的条件，可以通过将探针与来自样品的互补序列以及对照序列进行接触来确定，所述样品已知含有互补序列，所述对照序列不含有互补序列。杂交条件，如杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度或杂交温度，可以被改变以确定允许探针与互补核酸特异性杂交的条件。

如果该样品含有从中可分离出核酸的生物体，那么探针的特异性杂交被检测到。杂交可以通过用可检测的试剂标记探针来检测，所述可检测的试剂如放射性同位素、荧光染料或能催化可检测产物形成的酶。

使用标记探针来检测样品中互补核酸的存在的许多方法对于本领域技术人员是熟知的。这些方法包括DNA印迹法、RNA印迹法、集落杂交方法和斑点印迹法。这些方法中的每一种方法的方案在Ausubel等,Current Prot℃ols in Molecular Biology,John Wiley 503Sons,Inc.(1997)和Sambrook等,Molecular Cloning:A Laboratory Manual 2nd Ed.,Cold Spring Harbor Laboratory Press(1989)中提供。

可以选择地，一种以上的探针(其中至少一种探针能与核酸样品中存在的任何互补序列特异性杂交)可以在扩增反应中使用，以确定样品是否包含含有本发明的核酸序列的生物体(例如从中可分离出所述核酸的生物体)。这些探针通常包括寡核苷酸。一方面，扩增反应可以包括PCR反应。PCR实验方案在Ausubel和Sambrook,同上中有所描述。可选地，扩增可以包括连接酶链式反应、3SR或链置换反应(见Barany,F.,"The Ligase Chain Reaction in a PCR World",PCR Methods andApplications 1:5-16,1991；E.Fahy等,"Self-sustained Sequence Replication(3SR):AnIsothermal Transcription-based Amplification System Alternative to PCR",PCRMethods and Applications 1:25-33,1991；以及Walker G.T.等,"Strand DisplacementAmplification-an Isothermal in vitro DNA Amplification Technique",Nucleic AcidResearch 20:1691-1696,1992)。在这样的方法中，将样品中的核酸与探针接触，进行扩增反应，检测任何所得的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳并用嵌入剂如溴化乙锭对凝胶进行染色来检测。可以选择地，可以用放射性同位素标记一种或多种探针，放射性扩增产物的存在在凝胶电泳后通过放射自显影术来检测。

衍生自本发明核酸及与其基本上相同的序列的末端附近的序列的探针也可以在染色体步移(chromosome walking)方法中使用，以鉴定含有临近本发明序列及与其基本上相同的序列的基因组序列的克隆。这样的方法允许从宿主生物中分离编码额外蛋白的基因。

本发明的分离的、合成的或重组的核酸及与其基本上相同的序列、与其互补的序列、或含有本发明序列及与其基本上相同的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、250、300、400或500个连续碱基的片段、或与其互补的序列，可被用作探针，以鉴定和分离相关的核酸。在一些方面，该相关的核酸可以是来自生物体的cDNA或基因组DNA，这些生物体并不是从中分离出所述核酸的生物体。例如，其它生物体可以是相关生物体。在这样的方法中，核酸样品在允许探针与相关序列特异性杂交的条件下与探针接触。然后用上面描述的任意一种方法检测探针与来自相关生物体的核酸的杂交。

通过改变用于鉴定与可检测探针杂交的核酸例如cDNA或基因组DNA的杂交条件的严格性，可以鉴定并分离与探针具有不同同源性水平的核酸。严格性通过在低于探针的解链温度的变化温度下进行杂交来改变。解链温度T_m是50％的靶序列与完全互补的探针杂交时的温度(在确定的离子强度和pH下)。选择非常严格的条件，使其与特定探针的T_m相等，或比T_m低大约5℃。可以使用下述公式计算探针的解链温度：

对于长度在14到70个核苷酸的探针，使用如下公式计算解链温度(T_m)：T_m＝81.5+16.6(log[Na+])+0.41(G+C的比例分数)－(600/N)，其中N是探针的长度。

如果杂交在含有甲酰胺的溶液中进行，解链温度使用如下等式计算：T_m＝81.5+16.6(log[Na+])+0.41(G+C的比例分数)－(0.63％甲酰胺)－(600/N)，其中N是探针的长度。

预杂交可以在6×SSC、5×Denhardt’s试剂、0.5％SDS、100μg变性的片段化鲑精DNA或6×SSC、5X Denhardt’s试剂、0.5％SDS、100μg/ml变性的片段化鲑精DNA、50％甲酰胺中进行。SSC和Denhardt’s溶液的配方在Sambrook等，如上列出。

杂交通过将可检测探针加入到上面所列出的预杂交溶液中来进行。在探针包含双链DNA的情况下，在加入到杂交溶液之前对探针变性。将滤膜与杂交溶液接触充足的时间，以允许探针与含有与其互补的序列或与其同源的序列的cDNA或基因组DNA杂交。对于长度超过200个核苷酸的探针，杂交可以在比T_m低15至25℃的温度进行。对于更短的探针，如寡核苷酸探针，杂交在比T_m低5-10℃的温度进行。通常对于6×SSC中的杂交，杂交在大约68℃进行。经常是，对于在包含50％甲酰胺的溶液中的杂交，杂交是在大约42℃进行的。

抑制转氨酶和/或氧化还原酶的表达

本发明提供了与本发明的核酸例如编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸互补的核酸(例如本发明的核酸的反义序列)。在可选的实施方式中，本发明的反义序列能抑制编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的基因的转运、剪接或转录。抑制可通过将基因组DNA或信使RNA作为靶标来实现。作为靶标的核酸的转录或功能可以被抑制，例如通过杂交和/或切割。在可选的实施方式中，本发明提供的抑制剂包括寡核苷酸，这些寡核苷酸或者能结合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的基因或信息，在任一种情况下阻止或抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的产生或功能。结合可通过序列特异性杂交来完成。另一类有用的抑制剂包括引起转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的信息失活或切割的寡核苷酸。该寡核苷酸可具有引起此类切割的酶活性，如核酶。可以对寡核苷酸进行化学修饰，或与能切割互补核酸的酶或组分偶联。可以对许多不同的这样的寡核苷酸的库进行筛选来寻找那些具有期望活性的寡核苷酸。因此，本发明提供了在核酸和/或蛋白水平抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶表达的各种组合物，例如，包含本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列的反义序列、iRNA和核酶，以及本发明的抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶的抗体。

用于抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶表达的本发明的组分(例如，反义序列、iRNA、小RNA、核酶、抗体)可用作药物组合物。

反义寡核苷酸

本发明提供了能结合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的信息的反义寡核苷酸，其能通过以mRNA作为靶标来抑制例如转移酶和/或氧化还原酶活性。设计反义寡核苷酸的策略在科学和专利文献中有很好的描述，并且技术人员能使用本发明的新试剂设计这样的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶寡核苷酸。例如，筛选有效的反义寡核苷酸的基因步移/RNA作图方案在本技术领域是熟知的，例如参见Ho(2000)Methods Enzymol.314:168-183，该文献描述了RNA作图分析法，该分析法是基于标准的分子技术，以提供用于有效的反义序列选择的一种简单且可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。

自然存在的核酸被用作反义寡核苷酸。该反义寡核苷酸可以是任意长度；例如，在可选择的方面，该反义寡核苷酸在大约5到100之间，大约10到80之间，大约15到60之间，大约18到40之间。最适长度可以通过常规筛选来决定。这些反义寡核苷酸可以以任意浓度存在。最适浓度可通过常规筛选来决定。广泛种类的合成的、非天然存在的核苷酸和核酸类似物是已知的，它们可以解决这一潜在的问题。例如，可以使用含有非离子骨架的肽核酸(PNAs)，如含有N-(2-氨基乙基)甘氨酸单元。也可以使用具有硫代磷酸酯键的反义寡核苷酸，正如在如下文献中所描述的：WO 97/03211；WO 96/39154；Mata(1997)Toxicol Appl Pharmacol144:189-197；Antisense Therapeutics,ed.Agrawal(Humana Press,Totowa,N.J.,1996)。正如上面所描述的，本发明提供的具有合成DNA骨架类似物的反义寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3’-硫代乙缩醛、亚甲基(甲基亚氨)、3’-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸。

组合化学方法学可用于产生大量能被快速筛选特异性寡核苷酸的寡核苷酸，所述特异性寡核苷酸对任何靶标具有适当的结合亲和性和特异性，诸如本发明的有义和反义转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列(例如参见Gold(1995)J.,Biol.Chem.270:13581-13584)。

抑制性核酶

本发明提供了能结合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的信息的核酶。这些核酶能通过例如以mRNA作为靶标来抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的活性。设计核酶和选择用于靶向的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶特异性反义序列的策略在科学和专利文献中有很好的描述，并且熟练的技术人员能使用本发明的新试剂(例如核酸)来设计这样的核酶。核酶通过核酶的靶RNA结合部分来与靶RNA结合，从而发挥作用，核酶的靶RNA结合部分与该RNA上切割靶RNA的酶促部分非常接近。这样，通过互补的碱基配对，核酶识别和结合靶RNA，而且一旦结合于正确的位置，便以酶促活性作用来切割靶RNA和使其失活。如果切割发生在编码序列中，以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合和切割其RNA靶之后，它可以从该RNA上释放出来以重复结合和切割新的靶标。

在一些情况下，核酶的酶促性质会优于其它的技术，如反义技术(其中核酸分子仅结合于核酸靶标来阻止其转录、翻译或者与其它分子的结合)，因为实现治疗效果所必要的核酶有效浓度可能低于反义寡核苷酸的浓度。这一潜在的优点反映出核酶以酶促方式进行作用的能力。因此，单个核酶分子能够切割多个靶RNA的分子。另外，核酶通常是高度特异性的抑制物，其抑制作用的特异性不仅依赖于碱基配对的结合机制，也依赖于该分子抑制与其结合的RNA的表达的机制。即，所述抑制是由切割靶RNA引起的，因此特异性定义为靶RNA的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素，这种切割机制还依赖于另外的因素。这样，核酶作用的特异性比结合于同样的RNA位点的反义寡核苷酸高。

本发明的核酶，例如，具有酶活的核酶RNA分子，可以形成锤头状基序、发夹基序，如肝炎δ病毒基序、I类内含子基序和/或与RNA前导序列(guide sequence)相联系的RNaseP样RNA。锤头状基序的例子在如Rossi(1992)Aids Research andHuman Retroviruses 8:183中有描述；发夹基序在Hampel(1989)Biochemistry 28:4929和Hampel(1990)Nuc.Acids Res.18:299中有描述；肝炎δ病毒基序在Perrotta(1992)Biochemistry 31:16中有描述；RNaseP基序在Guetrier-Takada(1983)Cell35:849中有描述；I类内含子在Cech美国专利4,987,071中有描述。这些特定基序的引述并不是限制性的。本领域技术人员将认识到本发明的核酶，如，本发明的有酶活的RNA分子，可以具有与一个或者多个靶基因的RNA区域互补的特异性底物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。

RNA干扰(RNAi)

在一个方面，本发明提供了被称为“RNAi”分子的RNA抑制性分子，其含有本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列。RNAi分子可以包括双链RNA(dsRNA)分子，例如siRNA、微小RNA(miRNA)和/或短发夹RNA(shRNA)分子。RNAi分子，例如siRNA(小抑制RNA)可以抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶基因的表达，和/或miRNA(微小RNA)抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信息的翻译。在一个方面，RNAi分子例如siRNA和/或miRNA的长度为大约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或更多个双链体核苷酸。虽然本发明不限于任何特殊的作用机制，但RNAi可进入细胞中，引起具有相似或相同序列的单链RNA(ssRNA)的降解，包括内源性mRNA。当细胞暴露于双链RNA(dsRNA)时，来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为短的干扰RNA的短碎片，它可触发与其序列匹配的mRNA的降解。在一个方面，本发明的RNAi可用于基因沉默疗法中，参见，例如Shuey(2002)DrugDiscov.Today 7:1040-1046。在一个方面，本发明提供了使用本发明的RNAi分子例如siRNA和/或miRNA选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面，本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的突变。

在一个方面，RNAi的细胞内导入通过与RNA结合蛋白结合的靶细胞特异性配体的内化进行，包括吸收RNAi(例如微小RNA)。该配体对独特的靶细胞表面抗原是特异性的。该配体在与细胞表面抗原结合后可以自发地内化。如果独特的细胞表面抗原在与其配体结合后没有自然地被内化，则可以通过下列方法来促进内化：将富含精氨酸的肽或其它膜可渗透性肽并入配体的结构或RNA结合蛋白中，或将所述肽附着到配体或RNA结合蛋白。参见，例如美国专利申请公开号20060030003；20060025361；20060019286；20060019258。在一个方面，本发明提供基于脂质的制剂，用于将本发明的核酸作为包含RNAi分子的核酸-脂质颗粒输送，例如导入到细胞，参见，例如美国专利申请公开号20060008910。

制备和应用选择性降解RNA的RNAi分子，例如siRNA和/或miRNA的方法在本领域中是熟知的，见，例如美国专利6,506,559；6,511,824；6,515,109；6,489,127。

核酸的修饰

本发明提供了产生本发明的核酸的变体的方法，所述本发明的核酸例如那些编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸。这些方法可以被重复或者以多种组合使用，以产生具有与模板核酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶有所改变的或不同的活性或有所改变的或不同的稳定性的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。这些方法也可以被重复或以多种组合使用，从而例如在基因/信息表达、信息翻译或信息稳定性方面产生变化。另一方面，细胞的遗传组成可以被改变，例如通过同源基因的离体修饰，随后再将其插入到细胞中。

在可选实施方式中，本发明的核酸可以通过任何方法来改变。例如，随机(random或st℃hastic)方法、或者非随机、或者“定向进化”的方法，参见如，美国专利6,361,974。基因的随机突变方法在本领域是已知的，参见如，美国专利5,830,696。例如，可以应用突变剂来对基因进行随机突变。突变剂包括，如，紫外线或者γ辐射，或者化学诱变剂，如，丝裂霉素、亚硝酸、光活化的补骨脂内酯，它们单独使用或者组合使用来诱导DNA的断裂，其可以通过重组被修复。其它的化学诱变剂包括，如，亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物，如，亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体，从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。

可以应用分子生物学上的任何技术，如随机PCR诱变，参见，如，Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471；或者组合式多重盒式诱变，参见如，Crameri(1995)Biotechinques 18:194-196。可选择地，核酸，如基因，可以在随机片段化后重新装配，参见，如，美国专利6,291,242；6,287,862；6,287,861；5,955,358；5,830,721；5,824,514；5,811,238；5,605,793。在可选择的方面，修饰、增加或者删除可以通过易错PCR、改组、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因再装配(例如GeneReassembly，参见例如美国专利号6,537,776)、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、回归序列重组(recursive sequencerecombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口双重诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repairmutagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变(restriction-selection mutagenesis)、限制纯化诱变(restriction-purificationmutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成和/或者这些方法和其它方法的组合产生。

以下的出版物描述了可以并入到本发明的方法中的各种递归重组程序和/或方法：Stemmer(1999)“Molecular breeding of viruses for targeting and other clinicalproperties”Tumor Targeting 4:1-4；Ness(1999)Nature Biotechnology 17:893-896；Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology 17:793-797；Minshull(1999)“Protein evolution by molecularbreeding”Current Opinion in Chemical Biology 3:284-290；Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA familyshuffling”Nature Biotechnology 17:259-264；Crameri(1998)“DNA shuffling of afamily of genes from diverse species accelerates directed evolution”Nature391:288-291；Crameri(1997)“Molecular evolution of an arsenate detoxificationpathway by DNA shuffling”Nature Biotechnology 15:436-438；Zhang(1997)“Directed evolution of an effective fucosidase from a galactosidase by DNA shufflingand screening”Proc.Natl.Acad.Sci.USA 94:4504-4509；Patten等(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinionin Biotechnology 8:724-733；Crameri等(1996)“Construction and evolution ofantibody-phage libraries by DNA shuffling”Nature Medicine 2:100-103；Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through displayon a lac repressor'headpiece dimer'”Journal of Molecular Biology 255:373-386；Stemmer(1996)“Sexual PCR and Assembly PCR”，于The Encyclopedia of MolecularBiology中.VCH Publishers,New York.447-457页；Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutantand wildtype cassettes”BioTechniques 18:194-195；Stemmer等(1995)“Single-stepassembly of a gene and entire plasmid form large numbers ofoligodeoxyribonucleotides”Gene,164:49-53；Stemmer(1995)“The Evolution ofMolecular Computation”Science 270:1510；Stemmer(1995)“Searching SequenceSpace”Bio/Technology 13:549-553；Stemmer(1994)“Rapid evolution of a proteinin vitro by DNA shuffling”Nature 370:389-391；和Stemmer(1994)“DNA shufflingby random fragmentation and reassembly:In vitro recombination for molecularevolution”Proc.Natl.Acad.Sci.USA 91:10747-10751。

产生多样性的突变方法包括，例如，定点诱变(Ling等.(1997)“Approachesto DNA mutagenesis:an overview”Anal Biochem.254(2):157-178；Dale等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57:369-374；Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19:423-462；Botstein&Shortle(1985)“Strategies and applications of in vitromutagenesis”Science 229:1193-1201；Carter(1986)“Site-directed mutagenesis”Biochem.J.237:l-7；和Kunkel(1987)“The efficiency of oligonucleotide directedmutagenesis”在Nucleic Acids&Molecular Biology(Eckstein,F.和Lilley,D.M.J.eds.,Springer Verlag,Berlin))；使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA 82:488-492；Kunkel等(1987)“Rapid and efficient site-specificmutagenesis without phenotypic selection”Methods in Enzymol.154,367-382；和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science242:240-245)；寡核苷酸诱导的定点诱变(Methods in Enzymol.100:468-500(1983)；Methods in Enzymol.154:329-350(1987)；Zoller(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient andgeneral Procedure for the production of point mutations in any DNA fragment”NucleicAcids Res.10:6487-6500；Zoller&Smith(1983)“Oligonucleotide-directedmutagenesis of DNA fragments cloned into M13vectors”Methods in Enzymol.100:468-500；和Zoller(1987)Oligonucleotide-directed mutagenesis:a simple methodusing two oligonucleotide primers and a single-stranded DNA template”Methods inEnzymol.154:329-350)；硫代磷酸酯修饰的DNA诱变(Taylor(1985)“The use ofphosphorothioate-modified DNA in restriction enzyme reactions to prepare nickedDNA”Nucl.Acids Res.13:8749-8764；Taylor(1985)“The rapid generation ofoligonucleotide-directed mutations at high frequency using phosphorothioate-modifiedDNA”Nucl.Acids Res.13:8765-8787(1985)；Nakamaye(1986)“Inhibition ofrestriction endonuclease Nci I cleavage by phosphorothioate groups and its applicationto oligonucleotide-directed mutagenesis”Nucl.Acids Res.14:9679-9698；Sayers(1988)“Y-T Exonucleases in phosphorothioate-based oligonucleotide-directedmutagenesis”Nucl.Asids Res.16:791-802；和Sayers等(1988)“Strand specificcleavage of phosphorothioate-containing DNA by reaction with restrictionendonucleases in the presence of ethidium bromide”Nucl.Acids Res.16:803-814)；使用缺口双链体DNA的诱变(Kramer等(1984)“The gapped duplex DNA approachto oligonucleotide-directed mutation construction”Nucl.Acids Res.12:9441-9456；Kramer和Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction ofmutations via gapped duplex DNA”154:350-367；Kramer(1988)“Improvedenzymatic in vitro reactions in the gapped duplex DNA approach tooligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207；和Fritz(1988)“Oligonucleotide-directed construction of mutations:a gapped duplex DNAProcedure without enzymatic reactions in vitro”Nucl.Acids Res.16:6987-6999)。

可以用于实践本发明的另外的实验方案包括点错配修复(Kramer(1984)"PointMismatch Repair"Cell 38:879-887)、应用修复缺陷型宿主株的诱变(Carter et al.(1985)"Improved oligonucleotide site-directed mutagenesis using M13vectors"Nucl.Acids Res.13:4431-4443；以及Carter(1987)"Improved oligonucleotide-directedmutagenesis using M13vectors"Methods in Enzymol.154:382-403)、缺失诱变(Eghtedarzadeh(1986)"Use of oligonucleotides to generate large deletions"Nucl.Acids Res.14:5115)、限制-选择以及限制-选择和限制-纯化(Wells等(1986)"Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin"Phil.Trans.R.S℃.Lond.A 317:415-423)、通过全基因合成的诱变(Nambiar等(1984)"Total synthesis and cloning of a gene coding for the ribonuclease S protein"Science 223:1299-1301；Sakamar和Khorana(1988)"Total synthesis and expression ofa gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)"Nucl.Acids Res.14:6361-6372；Wells等.(1985)"Cassette mutagenesis:an efficient method for generation of multiple mutations at defined sites"Gene34:315-323；以及Grundstrom等(1985)"Oligonucleotide-directed mutagenesis bymicroscale`shot-gun`gene synthesis"Nucl.Acids Res.13:3305-3316)、双链断裂修复(Mandecki(1986)；Arnold(1993)"Protein engineering for unusual environments"Current Opinion in Biotechnology 4:450-455."Oligonucleotide-directed double-strandbreak repair in plasmids of Escherichia coli:a method for site-specific mutagenesis"Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节可在Methods in Enzymology第154卷中发现，其中也描述了用于解决各种诱变方法中所遇到的问题的有用策略。

在例如下列的文件中描述了可以用于实践本发明的实验方案，如Stemmer的美国专利5,605,793(1997.2.25)，“Methods for In Vitro Recombination”；Stemmer等的美国专利5,811,238(1998.9.22)“Methods for Generating Polynucleotides havingDesired Characteristics by Iterative Selection and Recombination”；Stemmer等的美国专利5,830,721(1998.11.3)，“DNA Mutagenesis by Random Fragmentation andReassembly”；Stemmer等的美国专利5,834,252(1998.11.10)，“End-ComplementaryPolymerase Reaction”；Minshull等的美国专利5,837,458(1998.11.17)“Methods andCompositions for Cellular and Metabolic Engineering”；WO 95/22625，Stemmer和Crameri，“Mutagenesis by Random Fragmentation and Reassembly”；WO 96/33207，Stemmer和Lipschutz，“End Complementary Polymerase Chain Reaction”；WO97/20078，Stemmer和Crameri的“Methods for Generating Polynucleotides havingDesired Characteristics by Iterative Selection and Recombination”；WO 97/35966，Minshull和Stemmer，“Methods and Compositions for Cellular and MetabolicEngineerin”；WO 99/41402，Punnonen等，“Targeting of Genetic Vaccine Vectors”；WO 99/41383，Punnonen等，“Antigen Library Immunization”；WO 99/41369，Punnonen等，“Genetic Vaccine Vector Engineering”；WO 99/41368，Punnonen等，“Optimization of Immunomodulatory Properties of Genetic Vaccines”；EP 752008，Stemmer和Crameri，“DNA Mutagenesis by Random Fragmentation andReassembly”；EP 0932670，Stemmer，“Evolving Cellular DNA Uptake by RecursiveSequence Recombination”；WO 99/23107，Stemmer等，“Modification of VirusTropism and Host Range by Viral Genome Shuffling”；WO 99/21979，Apt等，“HumanPapillomavirus Vectors”；WO 98/31837，del Cardayre等，“Evolution of Whole Cellsand Organisms by Recursive Sequence Recombination”；WO 98/27230，Patten和Stemmer，“Methods and Compositions for Polypeptide Engineering”；WO 98/27230，Stemmer等，“Methods for Optimization of Gene Therapy by Recursive SequenceShuffling and Selection”；WO 00/00632，“Methods for Generating Highly DiverseLibraries”；WO 00/09679，“Methods for Obtaining in Vitro RecombinedPolynucleotide Sequence Banks and Resulting Sequences”；WO 98/42832，Arnold等，“Recombination of Polynucleotide Sequences Using Random or Defined Primers”；WO 99/29902，Arnold等，“Method for Creating Polynucleotide and PolypeptideSequences”；WO 98/41653，Vind，“An in Vitro Method for Construction of a DNALibrary”；WO 98/41622，Borchert等，“Method for Constructing a Library Using DNAShuffling”；以及WO 98/42727，Pati和Zarling，“Sequence Alterations usingHomologous Recombination”。

在例如下列的文件中描述了可以用于实践本发明的方案(提供了关于产生不同多样性的方法的细节)，如美国专利申请系列号(USSN)09/407,800，Patten等的“SHUFFLING OF CODON ALTERED GENES”，于1999年9月28日提交；delCardayre等的“EVOLUTION OF WHOLE CELLS AND ORGANISMS BYRECURSIVE SEQUENCE RECOMBINATION”，美国专利6,379,964；Crameri等的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”，美国专利6,319,714；6,368,861；6,376,246；6,423,542；6,426,224和PCT/US00/01203；Welch等的“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FORSYNTHETIC SHUFFLING”，美国专利6,436,675；Selifonov等的“METHODS FORMAKING CHARACTER STRINGS,POLYNUCLEOTIDES&POLYPEPTIDESHAVING DESIRED CHARACTERISTICS”，2000年1月18日提交，(PCT/US00/01202)和，如Selifonov等的“METHODS FOR MAKINGCHARACTER STRINGS,POLYNUCLEOTIDES&POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS”，2000年7月18日提交，(美国系列号09/618,579)；Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”，2000年1月18日提交(PCT/US00/01138)，和Affholter的“SINGLE-STRANDED NUCLEIC ACIDTEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENTISOLATION”，2000年9月6日提交(美国系列号09/656,549)，和美国专利6,177,263；6,153,410。

非随机或“定向进化”方法包括，例如饱和诱变(GSSM)、合成连接重装配(SLR)或其组合，它们被用于修饰本发明的核酸，以产生具有新的或改变的特性(例如在高度酸性或碱性条件下的活性，在高温或低温的活性，等等)的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。由修饰的核酸编码的多肽可以被筛选活性。可以使用任何测试形式或实验方案，例如使用毛细管阵列平台。例如参见美国专利6,361,974；6,280,926；5,939,250。

基因位点饱和诱变或GSSM

本发明也提供了使用基因位点饱和诱变或GSSM制备酶的方法，如在本文中以及美国专利6,171,820和6,579,258所述的。一方面，含有简并N,N,G/T序列的密码子引物被用于将点突变引入多核苷酸中，例如本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或抗体，以便产生一组子代多肽，其中在每一氨基酸位置上可表现出全范围的单氨基酸置换，置换发生的位置例如酶活性位点中的氨基酸残基，或将要被修饰的配体结合位点。这些寡核苷酸可以包括相邻的第一同源序列，简并N,N,G/T序列，以及一方面可以包括第二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化，这是由于N,N,G/T序列的简并性包括了所有20个氨基酸的密码子。一方面，一个这样的简并寡核苷酸(例如包括一个简并N,N,G/T序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子置换。另一方面，使用至少两个简并序列盒，或在相同的寡核苷酸中或不同的寡核苷酸中，用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子置换。例如，一个寡核苷酸中可以包含一个以上N,N,G/T序列，以便在多于一个的位点上引入氨基酸突变。这些多个N,N,G/T序列可以直接相邻，或被一个或多个额外的核苷酸序列分隔开。另一方面，用于引入插入和删除的寡核苷酸可以单独使用，或者与含有N,N,G/T序列的密码子组合使用，以便引入氨基酸插入、删除和/或置换的任何组合和排列。

一方面，两个或更多个连续氨基酸位置的同时诱变是使用含有相邻N,N,G/T三联体的寡核苷酸进行的，即简并(N,N,G/T)n序列。另一方面，使用与N,N,G/T序列相比具有较低简并性的简并序列盒。例如，在一些情况下，可能期望(例如，在寡核苷酸中)使用仅包括一个N的简并三联体序列，其中所述的N可以在三联体的第一、第二或第三位置上。在该三联体的剩余两个位置上，可以使用包括任意排列组合的任何其它碱基。可以选择地，在一些情况下可能期望使用(例如在寡聚体中)简并N,N,N三联体序列。

一方面，使用简并三联体(例如N,N,G/T三联体)允许在多肽中的每一和每个氨基酸位置上系统且容易地产生完全范围的可能的天然氨基酸(总共20种氨基酸)(在可以选择的方面，这些方法也包括在每一氨基酸残基或密码子、位置产生少于全部的可能置换)。例如，对于100个氨基酸的多肽，可以产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)。通过使用含有简并N,N,G/T三联体的寡核苷酸或一组寡核苷酸，32种不同序列可编码所有20种可能的天然氨基酸。因此，在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的反应容器中，产生了编码20种不同多肽的32种不同的子代多核苷酸。相反，在定点诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。一方面，非简并寡核苷酸可以与所公开的简并引物组合使用；例如，非简并寡核苷酸可以被用于在工作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。

一方面，每一饱和诱变反应容器含有编码至少20种子代多肽(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)分子的多核苷酸，以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置(其它方面使用了少于20个天然的组合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的宿主中，例如大肠杆菌宿主中)，并进行表达筛选。当单个子代多肽通过筛选鉴定，显示出有利的特性变化时(当与亲本多肽相比时，如在碱性或酸性条件下增高的转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性或ω-转氨酶活性)，可以对其测序以鉴定其中所含的相应的有利氨基酸置换。

一方面，如本文所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后，可以在超过一个的氨基酸位置确定出有利的氨基酸变化。可以产生一个或多个新的子代分子，其含有所有或部分这些有利的氨基酸置换的组合。例如，如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化，那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性，以及两个有利变化中的每一个的可能性)和3个位置。因此，总共有3×3×3或27种可能性，其中包括了先前被检验的7种可能性，即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。

另一方面，位点饱和诱变可以与改组、嵌合、重组和其它诱变方法以及筛选一起使用。本发明提供了以反复的方式使用任何诱变方法，包括饱和诱变。在一个实例中，任何诱变方法的反复使用与筛选结合使用。

本发明还提供了使用专有密码子引物(含有简并N,N,N序列)将点突变引入多核苷酸中，以便产生一组子代多肽，其中在每一氨基酸位置上可表现出全范围的单氨基酸置换(基因位点饱和诱变(GSSM))。使用的这些寡聚体包括相邻的第一同源序列，简并N,N,N序列，以及优选不必须包括第二同源序列。由使用这些寡聚体而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化，这是由于N,N,N序列的简并性包括了所有20个氨基酸的密码子。

一方面，一个这样的简并寡聚体(包括一个简并N,N,N序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子置换。另一方面，使用至少两个简并N,N,N序列盒，或在相同的寡聚体中或不同的寡聚体中，用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子置换。因此，一个寡聚体中可以包含一个以上N,N,N序列，以便在多于一个的位点上引入氨基酸突变。这些多个N,N,N序列可以直接相邻，或由一个或多个额外的核苷酸序列分隔开。另一方面，用于引入插入和删除的寡聚体可以单独使用，或者与含有N,N,N序列的密码子组合使用，以便引入氨基酸插入、删除和/或置换的任何排列组合。

在一个具体的示例中，使用含有相邻N,N,N三联体的寡聚体，即简并(N,N,N)n序列，进行两个或更多个连续氨基酸位置的同时诱变是可能的。

另一方面，本发明提供了使用与N,N,N序列相比具有较低简并性的简并序列盒。例如，在一些情况下可能期望使用(例如在寡聚体中)仅包括一个N的简并三联体序列，其中所述的N可以在三联体的第一、第二或第三位置上。在三联体的剩余两个位置上，可以使用包括任意排列组合的任何其它碱基。可以选择地，在一些情况下可能期望使用(例如在寡聚体中)简并N,N,N三联体序列、N,N,G/T或N,N,G/C三联体序列。

但是，可以意识到的是由于若干个原因，使用如本发明公开的简并三联体(例如N,N,G/T或N,N,G/C三联体序列)是有利的。一方面，本发明提供了在多肽中的每一和每个氨基酸位置上系统且相对容易地产生完全范围的可能的氨基酸(总共20种氨基酸)的置换的方法。因此，对于100个氨基酸的多肽，本发明提供了系统且相对容易地产生产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)的方法。可以理解，通过使用含有简并N,N,G/T或N,N,G/C三联体序列的寡聚体，32种不同序列可编码所有20种可能的氨基酸。因此，在其中使用一种这样的寡聚体对亲本多核苷酸序列进行饱和诱变的反应容器中，产生了编码20种不同多肽的32种不同的子代多核苷酸。相反，在定点诱变中使用非简并寡聚体在每个反应容器中仅仅导致一种子代多肽产物。

本发明还提供了非简并寡聚体的使用，其一方面可以与所公开的简并引物组合使用。可以理解，在一些情况中，使用非简并寡聚体在工作多核苷酸中产生特异性点突变是有利的。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的点突变的手段。

因此，在本发明的一方面，每一饱和诱变反应容器含有编码至少20种子代多肽分子的多核苷酸，以便所有的20种氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的一个特定氨基酸位置。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的大肠杆菌宿主中)，并进行表达筛选。当单个子代多肽通过筛选鉴定，显示出有利的特性变化时(当与亲本多肽相比时)，可以对其测序以鉴定其中所含的相应的有利氨基酸置换。

应意识到的是，如本文所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后，可以在超过一个的氨基酸位置确定出有利的氨基酸变化。可以产生一个或多个新的子代分子，其含有所有或部分这些有利的氨基酸置换的组合。例如，如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化，那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性，以及两个有利变化中的每一个的可能性)和3个位置。因此，总共有3×3×3或27种可能性，其中包括了先前被检验的7种可能性，即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。

因此，在一个非限制性示例中，本发明提供了结合另外的诱变方法使用饱和诱变，例如其中两个或更多个相关多核苷酸被引入合适的宿主细胞的方法，以便通过重组和还原性重配产生杂合多核苷酸。

除了沿着基因的全序列进行诱变之外，本发明提供了：诱变可用于替代多核苷酸序列中任意数量的碱基的每一个，其中待被诱变的碱基的数量优选为从15至100,000中的每一个整数。因此，并不是沿着分子诱变每一个位置，可以对每一个或独立数目的碱基(优选为总共15至100,000的亚组)进行诱变。优选地，单独的核苷酸被用于沿着多核苷酸序列诱变每一个位置或一组位置。待被诱变的3个位置可以是密码子。优选使用诱变引物引入突变，该诱变引物含有异源序列盒，也称为诱变序列盒。示例性的序列盒可以具有1至500个碱基。在这样的异源序列盒中每一个核苷酸位置可以是N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E，其中E是非A、C、G或T的任何碱基(E可以被称为设计者寡聚体(designer oligo))。

一般意义上，饱和诱变由诱变有待诱变的限定多核苷酸序列(其中待诱变的序列长度优选为约15至100,000个碱基)中的一整组诱变序列盒(其中每一个序列盒的长度优选为约1-500个碱基)组成。因此，一组突变(范围从1至100个突变)被引入每一个待诱变的序列盒。在应用一轮饱和诱变的过程中，一组待被引入到一个序列盒的突变可以与第二组待被引入到第二个序列盒的突变不同或相同。这样的分组通过缺失、插入、特定密码子的分组以及特定核苷酸序列盒的分组加以例示。

待被诱变的限定序列包括全基因、通路、cDNA、整个开放阅读框(ORF)以及整个启动子、增强子、阻抑物/反式激活蛋白、复制起点、内含子、操纵子或任何多核苷酸功能组。通常，为了此目的，“限定序列(defined sequence)”可以是15碱基多核苷酸序列的任何多核苷酸以及长度在15个碱基至15,000个碱基之间的多核苷酸序列(本发明特别指出中间的每一个整数)。选择密码子分组时的考虑因素包括由简并诱变序列盒编码的氨基酸类型。

一方面，可被引入到诱变序列盒中的突变分组，本发明特别提供了在每一个位置编码2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20种氨基酸的简并密码子置换(使用简并寡聚体)以及由此编码的多肽文库。

合成连接重装配(SLR)

本发明提供了非随机的基因修饰系统，命名为“合成连接重装配”或简单地称作“SLR”，这是一种“定向进化方法”，产生具有新的或改变的特性的多肽，例如本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或本发明的抗体。

SLR是将寡核苷酸片段非随机地连接在一起的一种方法。该方法与随机寡核苷酸改组不同的地方在于，核酸构件(building bl℃ks)没有被随意地改组、连接或嵌合，而是被非随机地装配。例如参见美国专利6,773,900；6,740,506；6,713,282；6,635,449；6,605,449；6,537,776。一方面，SLR包括：(a)提供模板多核苷酸，其中模板多核苷酸包含编码同源基因的序列；(b)提供多个构件多核苷酸，其中这些构件多核苷酸被设计成可在预定的序列处与模板多核苷酸交换重装配(cross-over reassemble)，所述构件多核苷酸包含作为同源基因变体的序列和与变体序列两侧的模板多核苷酸同源的序列；(c)将构件多核苷酸与模板多核苷酸组合在一起，以便构件多核苷酸与模板多核苷酸交换重装配，以产生包含同源基因序列变异的多核苷酸。

SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此，该方法可以被用于非随机地产生包括超过10100个不同嵌合体的子代分子的文库(或集合)。SLR可以被用于产生包括超过101000个不同子代嵌合体的文库。因此，本发明的一些方面包括产生一组最终嵌合的核酸分子的非随机方法，所述最终嵌合的核酸分子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的步骤，以及装配这些核酸构件的步骤，这样可获得依设计而定的整个装配次序，所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。

将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”，如果它们能使这些构件以预定次序结合的话。因此，核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定的。如果使用多于一个的装配步骤，那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。一方面，用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段，以实现结构片段的共价结合。

一方面，寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得，所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷酸模板因此作为序列信息的来源，它们在将被诱变例如被嵌合或改组的核酸构件的设计中有用。在该方法的一个方面，多个亲本核酸模板的序列被联配，以便选择一个或多个分界点。这些分界点可以位于同源区域，由一个或多个核苷酸构成。这些分界点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界，以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可以选择地，分界点可以是由至少一半的亲本多核苷酸序列分享的同源区域，或者可以是由至少三分之二的亲本多核苷酸序列分享的同源区域。甚至更优选地，有用的分界点是由至少四分之三的亲本多核苷酸序列分享的同源区域，或者可以是由几乎所有的亲本多核苷酸序列分享的同源区域。一方面，分界点是由所有亲本多核苷酸序列共有的同源区域。

一方面，连接再装配过程被彻底地进行，以便产生含有尽量可能多的子代嵌合多核苷酸的文库。换句话说，核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时，另一方面，在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)遵循如上所述的设计(或非随机地)。由于本发明的非随机特性，大大地降低了不需要的副产品的可能性。

另一方面，连接再装配方法被系统地进行。例如，实施该方法，以便产生子代分子的系统区分化的文库，该文库分成能被系统地筛选的数个部分，例如可以逐个地筛选。换句话说，通过选择性的和审慎的应用特定的核酸构件，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种设计可以实现，即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检查和筛选步骤。因此，这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力，尤其是当祖先分子之间具有低水平的同源性时，这些方法可以产生包含大量子代分子的文库(或集合)。由于本发明的连接再装配的非随机特性，所产生的子代分子优选包含有最终嵌合核酸分子的文库，这些核酸分子具有按设计而选择的总装配次序。饱和诱变和优化的定向进化方法也可以被用于产生不同的子代分子种类。应该意识到，本发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择的自由度和可控制性。进一步，应该意识到，就本发明的可操作性而言，对分子间同源性的要求大大地放宽了。事实上，甚至可以在有很少的分子间同源性或没有分子间同源性的区域内选择分界点。例如，由于密码子的摆动，即密码子的简并性，可以将核苷酸取代引入核酸构件，同时又不会改变在相应的祖先模板中最初编码的氨基酸。可以选择地，可以改变密码子，从而改变对原始氨基酸的编码。在本发明中，这样的取代可以被引入到核酸构件中，以便增加分子间同源分界点的发生率，从而使得在构件之间可获得的偶联的数量增加，而这又允许产生更多数量的子代嵌合分子。

合成基因重装配

一方面，本发明提供了非随机的方法，命名为合成基因重装配(例如GeneReassembly，参见例如美国专利号6,537,776)，其与随机改组不同之处在于，核酸构件不随机改组、连接或嵌合，而是被非随机地装配。

合成基因重装配法不依赖于将被改组的多核苷酸之间存在高度同源性。本发明可以被用于非随机地产生包括超过10¹⁰⁰个不同嵌合体的子代分子的文库(或集合)。可以想象地，合成基因重装配可以被用于产生包括超过10¹⁰⁰⁰个不同子代嵌合体的文库。

因此，一方面，本发明提供了产生一组最终嵌合的核酸分子的非随机方法，所述最终嵌合的核酸分子具有按设计所选择的整个装配次序，该方法包括按设计产生多个特异性核酸构件的步骤，以及装配这些核酸构件的步骤，这样可获得依设计而定的整个装配次序，所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。

在一个方面，合成基因重装配包括下列方法：1)制备分子(包括含有多核苷酸序列的分子，例如含有多肽编码序列的分子)的子代产生分子，其被从一个或更多个祖先或亲代产生模板来实现至少一个点突变、增加、缺失和/或嵌合；2)例如使用高流通量方法筛选子代产生分子的至少一种感兴趣的(如酶活性提高)性质；3)一方面，获取和/或分类关于亲代和/或子代产生分子的结构和/或功能信息；以及4)一方面，重复步骤1)至3)中任意一个。在一个方面，在所谓的“密码子位点饱和诱变”中产生(例如从亲代多核苷酸模板)了多核苷酸的子代，每个均具有至少一组多至三个的连续点突变(即包含新密码子的不同碱基)，以便每个密码子(或每个编码相同氨基酸的简并密码子家族)表示在每个密码子位置处。相应于多核苷酸的所述子代和由多核苷酸的所述子代所编码，还产生了一系列子代多肽，每个均具有至少一个单氨基酸点突变。一方面，在所谓的“氨基酸位点饱和诱变”中，产生了一种这样的突变多肽，形成19种天然编码多肽的α-氨基酸置换代中的每一种均在沿着多肽的各个和所有氨基酸位置处。对于沿着亲代多肽的各个和所有氨基酸位置，这种方法得到包括原始氨基酸在内共计20种不同的子代多肽，或可能多于21种不同的子代多肽——如果使用的是另外的氨基酸，而不是20种天然编码氨基酸，或除20种天然编码氨基酸之外，还使用另外的氨基酸。

因此，另一个方面，该方法还用于产生突变体，其除20种形成天然编码多肽的α-氨基酸和/或与20种形成天然编码多肽的α-氨基酸结合外，还含有其它稀有的和/或非自然编码的氨基酸及氨基酸衍生物。另一方面，该方法还用于产生突变体，其除适合宿主的天然或未改变的密码子识别系统和/或与适合宿主的天然或未改变的密码子识别系统结合外，还使用改变的、诱变的和/或设计者密码子识别系统(如在具有一个或更多个改变tRNA分子的宿主细胞中)。

另一方面，本发明涉及重组，更具体而言涉及制备编码多肽的多核苷酸的方法，其通过含有部分同源性区域的多核苷酸序列的体内重配、装配多核苷酸以形成至少一种多核苷酸以及筛选多核苷酸以产生具有有用性质的多肽的方法进行。

另一方面，本发明用于针对任意分子性质(例如酶促活性)或现有技术所允许的性质组合对任意突变改变(具体包括饱和诱变)所达到的效果进行分析和分类。因此，提供综合性方法，以测定将亲代多肽中每一氨基酸改变成至少19种可能置换中每一种的效果。这允许亲代多肽中每一氨基酸根据其对多肽可测量性质的潜在效果的光谱进行表征和分类。

在一个方面，内含子可以经由核酸构件而导入嵌合子代分子中。内含子通常在两个末端具有共有序列，以便使得它们可以操作。除了能够使基因剪接外，内含子还可以通过向其它核酸提供同源位点使得能够同源重组而起到另外的目的。为了该目的以及其它潜在的目的，有时可以期望产生用于导入内含子的大核酸构件。如果大小非常大，容易通过两个单链寡聚体的直接化学合成而产生，则还可以通过两个以上单链寡聚体的直接化学合成或通过应用基于聚合酶的扩增反应来产生这种特定的核酸构件。

将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”，如果它们能使这些构件以预定次序结合的话。因此，在一方面，核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定的，如果使用多于一个的装配步骤，那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。在本发明的一方面，用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段，以实现结构片段的共价结合。

偶联可以以不使用参与突出端中每个核苷酸的方式发生。该偶联特别活跃地存活(例如在转化宿主中)，如果通过用连接酶处理来强化偶联以形成所谓的“间隙连接(gap ligation)”或“间隙的连接(gapped ligation)”的话。这种偶联可以有助于不需要的背景产物的产生，但其也可以有利地用于增加设计连接重装配所产生的子代文库的多样性。某些突出端能够进行自身偶联以形成回文偶联。如果通过用连接酶处理来强化偶联的话，偶联则会大大加强。这些突出端上缺乏5’磷酸可以有利地用于防止这种回文性自身连接。因此，本发明提供了缺乏5’磷酸基团的、可以化学制作(或定制)的核酸构件。可选择地，它们可以例如通过用磷酸酶如牛小肠碱性磷酸酶(CIAP)处理而被除去，以防止在连接重装配过程中回文自身连接。

另一方面，核酸构件的设计通过分析一组祖先核酸模板序列来获得，所述祖先核酸模板作为产生最终嵌合核酸分子的子代集合的基础。这些祖先核酸模板因此作为序列信息的来源，它们在将被诱变例如被嵌合或改组的核酸构件设计中有帮助。

在一个示例中，本发明提供了相关基因的家族和它们编码的相关产物的家族的嵌合。在具体的示例中，编码的产物是酶。根据本文描述的方法，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被诱变。

因此，根据本发明的一个方面，多个祖先核酸模板序列(例如本发明的多核苷酸)被联配，以便选择一个或多个分界点，这些分界点可以位于同源区域。这些分界点可以用于描绘将要产生的核酸构件的边界。因此，在祖先分子中鉴定和选择的分界点作为子代分子的装配中的潜在嵌合点。

有用的分界点通常是由至少两个祖先模板共享的同源区域(由至少一个同源核苷酸碱基组成)，但分界点可以是由至少一半的祖先模板、至少三分之二的祖先模板、至少四分之三的祖先模板以及优选几乎所有的祖先模板共分享的同源区域。甚至更优选地，有用的分界点是由所有祖先模板共享的同源区域。

一方面，基因再装配过程被彻底地进行，以便产生彻底的文库。换句话说，核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时，在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)是设计的(或非随机地)。由于本发明的非随机特性，大大地降低了不需要的副产品的可能性。

另一方面，基因再装配过程被系统地进行，以便例如产生子系统区分化的文库，该文库具有能被系统地筛选的数个部分，例如可以逐个地筛选。换句话说，通过选择性的和审慎的应用特定的核酸构件，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种实验设计可以实现，即在其中可以在各个反应容器中制备出特定的一组子代产物。这样的设计允许进行系统的检查和筛选步骤。因此，这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。

由于其具有以高度灵活而又彻底和系统的方式进行嵌合的能力，尤其是当祖先分子之间具有低水平的同源性时，本发明可以产生包含大量子代分子的文库(或集合)。由于本发明的基因再装配的非随机特性，所产生的子代分子优选包含有最终嵌合核酸分子的文库，这些核酸分子具有按设计而选择的总装配次序。在具体方面，这样的所产生的文库包括大于103至大于101000种不同的子代分子种类。

一方面，如所述产生的一组最终嵌合的核酸分子包括编码多肽的多核苷酸。根据一方面，该多核苷酸是基因，其可以是人造基因。根据另一方面，该多核苷酸可以是基因通路，其可以是人造基因通路。本发明产生的一种或更多种人造基因在本发明中可以整合入人造基因途径，例如在真核生物体(包括植物)中可操纵的途径。

在另一个示例中，产生构件的步骤的合成特性允许设计和引入核苷酸(例如一个或多个核苷酸，例如可以是密码子或内含子或调控序列)，这些核苷酸随后一方面在体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物体的基因剪接能力)被去除。应该意识到，在许多情况下，除了产生有用的分界点的潜在好处之外，还有许多其它原因也使得可能期望引入这些核苷酸。

因此，根据另一方面，本发明规定，核酸构件被用于引入内含子。这样，本发明规定，功能性内含子被引入到本发明的人造基因中。本发明还规定，功能性内含子可以被引入本发明的人造基因通路中。因此，本发明提供了嵌合多核苷酸的产生，该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因。

因此，本发明还提供了嵌合多核苷酸的产生，该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因通路。优选地，人工引入的内含子在一种或多种宿主细胞的基因剪接中发挥作用，其发挥作用的方式与天然发生的内含子在基因剪接中发挥作用的方式在很大程度上是相同的。本发明提供了产生含人造内含子的多核苷酸的方法，该多核苷酸将被引入宿主生物体中，用于重组和/或剪接。

使用本发明产生的人造基因也可作为底物发挥作用，用于与另一核酸重组。同样，使用本发明产生的人造基因途径也可作为底物发挥作用，用于与另一核酸重组。一方面，重组由人造的含内含子基因和作为重组伙伴的核酸之间的同源区域促进，或发生在人造的含内含子基因和作为重组伙伴的核酸之间的同源区域。一方面，重组伙伴也可以是本发明产生的核酸，包括人造基因或人造基因途径。重组可以由人造基中一个(或多个)人工引入的内含子上存在的同源区域促进，或发生在由人造基中一个(或多个)人工引入的内含子上存在的同源区域。

本发明的合成基因再装配方法使用多个核酸构件，其每一个优选具有两个可连接末端。在每一个核酸构件上的两个可连接末端可以是两个平端(即，每一个末端具有零个核苷酸的突出)，或者优选可以是一个平端和一个突出端，或者更优选可以依然是两个突出端。

用于该目的的一个有用的突出端可以是3'突出端或5'突出端。因此，核酸构件可以具有一个3'突出端或可选地具有一个5'突出端或可选地具有两个3'突出端或可选地具有两个5'突出端。核酸构件被装配来形成最终嵌合的核酸分子的整个装配次序通过有目的试验设计确定并且是非随机的。

一方面，通过化学合成两个单链核酸(也称为单链寡聚体)并使它们接触以便允许它们退火形成双链核酸构件来生成核酸构件。

双链核酸构件可以具有不同的大小。这些构件的大小可以是小的或大的。构件的示例性大小在1碱基对(不包括任何突出端)至100,000碱基对(不包括任何突出端)之间。还提供了其它示例性大小，其具有1bp至10,000bp(包括中间的每一个整数)的下限和2bp至100,000bp(包括中间的每一个整数)的上限。

存在许多方法，通过这些方法，可以产生可用于本发明的双链核酸构件；并且这些方法在本领域中是已知的，且普通技术人员容易进行。

根据一个方面，通过首先产生两个单链核酸并使它们退火形成双链核酸构件，从而产生双链核酸构件。双链核酸构件的两条链可以在每个核苷酸处互补，除了形成突出端的任何一个核苷酸；从而除了任何突出端外不含有错配。根据另一方面，双链核酸构件的两条链可以在比除了形成突出端的任何核苷酸外的每个核苷酸更少的核苷酸处互补。因此，根据一方面，双链核酸构件可用于引入密码子简并性。使用本文描述的位点饱和诱变，使用一个或多个N,N,G/T序列盒，或者可选地，使用一个或多个N,N,N序列盒，可以引入密码子简并性。

本发明的体内重组方法可以在未知杂合体或具体多核苷酸或序列的等位基因的库上进行盲试。然而，不必知道所述具体多核苷酸的实际DNA或RNA序列。

采用混合基因群内的重组的方法可用于产生任何有用的蛋白质，例如白细胞介素I、抗体、tPA和生长激素。该方法可用于产生具有改变的特异性或活性的蛋白质。该方法还可以用于产生杂合核酸序列，例如，基因的启动子区、内含子、外显子、增强子序列、3’未翻译区或5’未翻译区。因此，该方法可用于产生具有增加的表达速率的基因。该方法在研究重复DNA序列中也是有用的。最后，该方法可用于制备核酶或适体。

一方面，本文中描述的发明涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用，其使得可以通过重组实现高度复杂的线性序列例如DNA、RNA或蛋白质的定向分子进化。

优化的定向进化系统

本发明提供了一种非随机的基因修饰系统，命名为“优化的定向进化系统”，其用来产生具有新的或者改变的性质的多肽，如本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或者抗体。优化的定向进化涉及还原性重配、重组和选择的重复循环应用，其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。

遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合变体的更多控制。

此外，这一方法与其它系统相比，提供了一种用于探究大数量的可能蛋白变体空间的方便手段。以前，例如，如果在反应中产生了10¹³个嵌合分子，测试这样大数目的嵌合突变体的特定活性将会非常困难。此外，子代群体的相当部分将具有很高数目的遗传交换事件，其导致产生较不可能具有增高水平的特定活性的蛋白。通过应用这些方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此，尽管在反应中可以仍然产生10¹³嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定数目的遗传交换事件，所以嵌合分子之间的功能多样性的界限缩小了。当要计算在最初的亲本多核苷酸中的哪一个寡核苷酸可能影响到特定的性质时，这便提供了更加可控数目的变量。

产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。每一个寡核苷酸优选包括独特的重叠区域，这样把所述寡核苷酸混合在一起，得到具有以正确顺序装配的每个寡核苷酸片段的新的变体。另外的信息还可以例如在USSN09/332,835；美国专利6,361,974中找到。

对应于每一个亲本变体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如，为了发现如在高温下具有更高活性的嵌合变体，可以提供三个亲本核苷酸序列变体来进行连接反应。作为一个例子，对应于每一个亲本变体的每一部分可以产生总共50个寡核苷酸序列。相应地，在连接再装配过程中，在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中，有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接，而不导致遗传交换事件。如果在这一例子的任何连接步骤中，来自每一个亲本的每一种寡核苷酸的浓度都保持不变，那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变体的寡核苷酸将连接于嵌合序列内而不产生交换。

因此，可以确定概率密度函数(PDF)，预测在一个连接反应的每一步中可能发生的遗传交换事件群，其中给出了一套许多的亲本变体、对应于每种变体的许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法，可以计算这样的概率密度函数，而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外，可以预先确定遗传交换事件的目标数目，然后对该系统进行程序化，以计算在该连接反应的每一个步骤中，每种亲本寡核苷酸的起始量，从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用，使得能够通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般是在两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。

此外，这些方法与其它系统相比，提供了一种用于探究大数量的可能蛋白变体空间的方便手段。通过应用在这里描述的方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此，尽管在反应中可以仍然产生1013个嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件，所以有关嵌合分子之间的功能多样性的界限减少。当计算出在最初的亲本多核苷酸中的哪一个寡核苷酸可能影响到特定的性质时，这便提供了更加可控制数目的变量。

一方面，该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸，产生嵌合子代多核苷酸序列。每一个寡核苷酸优选包括独特的重叠区域，这样把所述寡核苷酸混合在一起，得到每一寡核苷酸片段以正确顺序装配的新的变体。也可参见USSN09/332,835。

确定交换事件

本发明的多个方面包括系统和软件，它们接收所需的遗传交换的概率密度函数(PDF)、待再装配的亲本基因的数目以及在再装配中的片段数目作为输入值。该程序输出是“片段PDF”，它可以用于确定用于产生重新装配的基因和那些基因的估计的遗传交换PDF的方案。在此描述的过程优选在MATLABTM(TheMathworks,Natick,Massachusetts)中进行，MATLABTM是一种用于技术计算的程序语言和开发环境。

迭代处理

在本发明的实践中，这些过程可以被迭代重复。例如，负责改变的或者新的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶表型的核酸(或，所述核酸)被鉴定、再分离、再修饰、再测试活性。这一过程可以重复直到工程化得到所需的表型。例如，完整的生物化学合成代谢或分解代谢途径可以被工程化到细胞中，例如包括转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性。

类似地，如果确定了某特定寡核苷酸对于所期望的特性(例如新的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶表型)根本不会造成影响，则可以通过合成包括待除去的序列的更大的亲本寡核苷酸，从而将这段序列作为变量除去。由于将这一序列合并到更大的序列中避免了任何遗传交换事件，所以在子代多核苷酸中，这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系，以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的可能提供特定性质或者活性的蛋白变体。

体内改组

分子的体内改组在本发明的方法中使用，提供本发明的多肽的变体，例如抗体、转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶以及类似物。体内改组可以利用重组多聚体的细胞的天然特性进行。尽管体内重组已经提供了分子多样性的主要天然途径，但遗传重组仍然是一种相对复杂的过程，该过程涉及1)同源性识别；2)链切割、链侵入和导致产生重组交叉(recombination chiasma)的代谢步骤；和最后3)交叉消除，得到分离的重组分子。交叉的形成需要同源序列的识别。另一方面，本发明包括一种方法，用于由至少第一多核苷酸和第二多核苷酸产生杂合多核苷酸。本发明可被用于产生杂合多核苷酸，这通过将至少第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中实现，所述至少第一多核苷酸和第二多核苷酸共享具有部分序列同源性的至少一个区域。部分序列同源的区域促进了导致产生杂合多核苷酸的序列再组织的过程。正如此处所用，术语“杂合多核苷酸”是从本发明的方法产生的任何核苷酸序列，其含有来自至少两个原始多核苷酸序列的序列。这样的杂合多核苷酸可以来自可促进DNA分子间序列整合的分子间重组事件。此外，这样的杂合多核苷酸可以来自分子内还原重配过程，该过程利用重复序列来改变DNA分子内的核苷酸序列。

体内重装配集中在“分子间”的过程上，统称为“重组”，在细菌中，它一般被视为是“RecA-依赖性”现象。本发明可以依赖于宿主细胞的重组过程来重组和重装配序列，或者依赖于细胞介导还原过程的能力，通过缺失来减少细胞中的准-重复序列的复杂性。该“还原性重配”过程通过“分子内的”、RecA-依赖过程而发生。

因此，在本发明的另一方面，通过还原性重装配过程，产生新型的多核苷酸。该方法包括产生含有连续序列(起始的编码序列)的构建物，它们插入到合适的载体中，并且然后将它们引入到合适的宿主细胞。单个分子同一性的重装配通过在构建物中具有同源性区域的连续序列间的组合过程，或者准-重复单位间的组合过程而发生。重装配过程重组和/或降低重复序列的复杂性和程度，并且导致产生新型的分子种类。可以应用各种处理来提高重装配速效率。这些处理包括用紫外光，或者损坏DNA的化学试剂处理，和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。因此，这样的重装配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。

重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。在本发明中，“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的阵列出现；以相似序列的连续单元出现。一旦连接，在连续序列之间的连接处变得基本上不可见，并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板库，在模板上可以发生滑移事件。含有准重复的构建物因此有效地提供了足够的分子弹性，缺失(和潜在的插入)事件实际上可以在准重复单元内的实际上任何地方发生。

当准重复序列全部以相同方向连接，例如，头对尾或者反之亦然，细胞就不能区别各个单元。因此，还原过程可以在整个序列中发生。相反地，例如，当所述单元以头对头存在，而不是头对尾，倒置勾画了相邻单元的末端，这样缺失的形成将有利于不连续单元的失去。因此，本方法优选的是序列处于相同的方向。准重复序列的随机定向将会导致重装配效率的损失，而序列的一致定向将提供最高的效率。然而，虽然具有较少的相同方向的连续序列降低效率，但是仍然可以为新型分子的有效回收提供足够的弹性。可以用相同定向以允许更高效率的准重复序列制备构建物。

应用各种方法中的任何一种，序列可以以头对尾的定向进行装配，包括以下方法：

a)可以使用包括poly-A头和poly-T尾的引物，当制成单链时，包括poly-A头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成，而且因此用RNAseH容易去除。

b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。

c)引物的内部少数碱基可以被硫醇化，并且用外切酶来产生合适的具有尾巴的分子。

重装配序列的回收依赖于具有减低的重复指数(RI)的克隆载体的确定。被重装配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有减低的RI的克隆载体的回收可以通过如下实现：

l)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。

2)通过物理方法对缩短的载体进行物理回收。在这一情况下，克隆载体将应用标准的质粒分离程序进行回收，或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。

3)插入物的大小下降时，对含有可以选择的断裂基因的载体进行回收。

4)应用表达载体以及适当的选择，使用定向选择技术。

相关的生物体的编码序列(例如，基因)可以表现出高度的同源性，并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明中。然而，尽管下面所描述的例子证明了几乎相同的起始编码序列(准-重复)的再装配，这一过程并不限于这种几乎相同的重复。

下面的例子说明了本发明的方法。描述了来自三个(3)独特种的编码性核酸序列(准-重复)。每一序列编码具有一套不同特征的蛋白质。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同被扩增并且被连接到随机的装配体中，以便所有可能的排列和组合可以在连接的分子群体中可获得。准-重复单位的数目可以通过装配条件来控制。在构建物中，准-重复单位的平均数目被定义为重复指数(RI)。

一旦形成，构建物可以，或可以不按照已公开的方法在琼脂糖凝胶上按大小分离，插入到克隆载体，并且转染到合适的宿主细胞中。然后细胞进行繁殖，并且进行“还原性重装配”。如果需要，还原性重装配过程的速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导，还是通过“分子间”的机制由类似重组的事件来介导是不重要的。最终的结果是分子被重装配，得到所有可能的组合。

一方面(任选地)，本方法包括一个额外的步骤，即对改组库的文库成员进行筛选，以确定个别的改组文库成员——其具有与一种预定的大分子如蛋白质受体、寡糖、病毒颗粒或者其它的预定的化合物或者结构结合或者另外地相互作用，或者催化特定的反应(如，酶的催化结构域)的能力。

从这样的文库所鉴定得到的多肽可以用于治疗、诊断、研究和相关目的(例如，催化剂，用于增加水溶液的渗透性的溶质等等)和/或可以进行改组和/或选择的一个或者多个另外的循环。

在另一方面，可以预见，在重组或重装配之前，或者在重组或重装配的过程中，通过本发明的方法产生的多核苷酸可以用试剂或方法处理，这些试剂或方法促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的所述试剂或方法可以包括，但不限于：(+)-CC-1065，或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley，(1992)；能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见，例如，vande Poll等(1992))；或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也见，van de Poll等(1992),751-758页)；三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物，如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑并[4,5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑并[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的示例性方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别包含的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA加合物的多核苷酸，在进一步的处理前，其可以通过包括加热含有所述多核苷酸的溶液的过程被释放或者去除。

另一方面，本发明涉及产生具有生物活性的重组蛋白的方法，其通过在根据本发明产生杂合或再装配多核苷酸的条件下处理含有编码野生型蛋白的双链模板多核苷酸的样品进行。

产生序列变体

本发明也提供了用于产生本发明核酸(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)序列的序列变体的其它方法。本发明也提供了使用本发明的核酸和多肽分离转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的其它方法。一方面，本发明提供了本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶编码序列(例如基因、cDNA或信息)的变体，其可以通过任何方法来改变，包括如上所述的例如随意或随机方法、或非随机或“定向进化”方法。

被分离的变体可以是天然发生的。变体也可以在体外产生。变体也可以应用遗传工程技术来产生，如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地，可以应用化学合成或者修饰方法来产生这样的变体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变体的其它方法。这些方法包括这样的程序，其中，从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的新核酸，所述的特征增加这些多肽在工业、医学、实验(研究)、药学、食物和饲料及食物和饲料补充物加工以及其它应用和加工中的价值。在这样的程序中，大量的变体序列被获得和表征，这些变体序列与从天然分离物中得到的序列相比，有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离物的核酸编码的多肽的氨基酸变化。

例如，变体可以通过使用易错PCR产生。在易错PCR中，PCR在DNA聚合酶的复制保真性较低的情况下进行，这样便在全长的PCR产物中得到较高的点突变率。易错PCR在例如，Leung,D.W.等,Technique,1：11～15，1989和Caldwell,R.C.和JoyceG.F.,PCR Methods Applic.,2:28-33,1992中描述。简要地说，在这样的程序中，待诱变的核酸与PCR引物、反应缓冲液、MgCl₂、MnCl₂、Taq聚合酶以及适当浓度的dNTP混合，从而在全长的PCR产物中得到高的点突变率。例如，反应可以使用20fmol待诱变的核酸进行，每种PCR引物30pmol，反应缓冲液包含50mM KCl、10mM TrisHCl(pH8.3)和0.01％明胶、7mM MgCl₂、0.5mM MnCl₂、5单位的Taq聚合酶、0.2mMdGTP、0.2mM dATP、1mM dCTP和1mM dTTP。PCR可以进行30个循环，每个循环为94℃1分钟；45℃1分钟；和72℃1分钟。然而，应该意识到，这些参数可以适当地变化。诱变的核酸被克隆到一个适当的载体，并评价由诱变核酸编码的多肽的活性。

变体也可以用寡核苷酸诱导的定向突变产生，在任何感兴趣的克隆DNA中产生位点特异性的突变。寡核苷酸诱变在，例如，Reidhaar-Olson(1988)Science 241:53-57中描述。简要地说，在这样的程序中，合成多个具有将要被导入被克隆的DNA中的一个或多个突变的双链寡核苷酸，将这些寡核苷酸插入到待诱变的克隆DNA中。回收含有诱变DNA的克隆，并评估它们编码的多肽的活性。

另一种产生变体的方法是装配PCR。装配PCR涉及由小DNA片段的混合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生，一个反应的产物引发另一个反应的产物。装配PCR已经被描述，例如在美国专利5,965,408中。

还有另一种产生变体的方法是有性PCR诱变。在有性PCR诱变中，由于基于序列同源性的DNA分子随机片段化，在不同的但是高度相关的DNA序列的DNA分子之间，在体外强行发生同源重组，然后通过PCR反应的引物延伸，交换得到固定。有性PCR诱变在，例如，Stemmer(1994)Proc.Natl.Asad.Sci.USA 91：10747-10751中描述。简要地说，在这样的程序中，多个待重组的核酸用DNase消化，产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段，并重悬于PCR混合物中。在有利于核酸片段之间发生重组的条件下进行PCR反应。例如，PCR可以这样进行：将纯化的片段以10-30ng/μl的浓度重悬于含有0.2mM的各种dNTP、2.2mM MgCl₂、50mM KCl、10mM的Tris-HCl，pH 9.0以及0.l％的Triton X-100的溶液中。每100：1的反应混合物加入2.5单位的Taq聚合酶，用以下的条件进行PCR：94℃60秒，94℃30秒，50-55℃30秒，72℃30秒(30-45次)，然后72℃进行5分钟。然而，可以意识到，这些参数可以进行适当的变化。在一些方面，寡核苷酸可以被包括在该PCR反应中。在其它方面，DNA聚合酶I的Klenow片段可以用于第一组PCR反应，而Taq聚合酶可以用于后续组的PCR反应。重组序列被分离，并评估它们编码的多肽的活性。

变体也可以通过体内诱变产生。在一些方面，感兴趣的序列中的随机突变通过在细菌菌株中增殖该感兴趣的序列而产生，所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖，最终可产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在，例如，PCT公开号WO 91/16427中有描述，其在1991年10月31日公开，题目为“Methods for Phenotype Creation from MultipleGene Populations”。

变体也可以通过应用盒式诱变产生。在盒式诱变中，双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“盒”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。

递归整体诱变也可以用于产生变体。递归整体诱变是一种用于蛋白质工程(蛋白诱变)的算法，它的开发是为了产生表型相关的突变体组成的多样性群体，其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin,A.P.和Youvan,D.C.,PNAS,USA 89:7811-7815,1992中有描述。

在一些方面，用指数整体诱变产生变体。指数整体诱变是一个用于产生具有高百分比的独特且具功能性的突变体的组合文库的过程，其中一小组的残基被平行随机化，以在每一个被改变的位置确认产生功能性蛋白的氨基酸。指数整体诱变在如Delegrave,S.和Youvan,D.C.,Biotechnology Research.11:1548-1552,1993中有描述。随机和定点诱变在如，Arnold,F.H.,Current Opinion in Biotechnology 4:450-455,1993中有描述。

在一些方面，变体利用改组方法产生，其中编码不同多肽的多个核酸的部分被融合在一起，产生编码嵌合多肽的嵌合核酸序列，如在美国专利5,965,408——其提交于1996年7月9日，题为“Method of DNA Reassembly by Interrupting Synthesis”；以及美国专利5,939,250——其提交于1996年5月22日，题为"Production of EnzymesHaving Desired Activities by Mutagenesis”中所描述的。

本发明的多肽的变体可以是这样的变体，其中本发明的多肽的一个或多个氨基酸残基被保守或非保守氨基酸残基(优选保守氨基酸残基)置换，这样置换的氨基酸残基可以是由遗传密码编码或不由其编码的氨基酸。

保守置换是那些在多肽中一个给定的氨基酸被另一个具有类似特性的氨基酸取代的置换。通常看来，保守置换为下列替代：脂肪族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸用另一个脂肪族氨基酸替代；丝氨酸用苏氨酸替代，或苏氨酸用丝氨酸替代；酸性残基如天冬氨酸和谷氨酸用另一个酸性残基替代；具有酰胺基团的残基，如天冬酰胺和谷氨酰胺用另一个具有酰胺基团的残基替代；碱性残基如赖氨酸和精氨酸用另一个碱性残基来交换；芳香族残基如苯丙氨酸、酪氨酸用另一个芳香族残基替代。

其它的变体是那些变体，其中本发明的多肽的一个或多个氨基酸残基包括取代基。

还有其它的变体是那些变体，其中多肽与另外的化合物连接，所述化合物例如增加多肽的半衰期的化合物(例如聚乙二醇)。

其它变体是那些变体，其中额外的氨基酸被融合到多肽上，例如前导序列、分泌序列、蛋白原序列或有助于多肽的纯化、富集或稳定的序列。

在一些方面，片段、衍生物和类似物保持了与本发明多肽及与其基本上相同的序列的相同的生物功能或活性。在其它方面，片段、衍生物或类似物包括蛋白原，这样，片段、衍生物或类似物可以通过蛋白原部分的切割来激活，以产生活性多肽。

优化密码子以便在宿主细胞中获得高水平的蛋白表达

本发明提供了修饰编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸来改变密码子使用的方法。一方面，本发明提供了修饰编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸中的密码子来增加或者降低其在宿主细胞中的表达的方法。本发明也提供了编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸，该核酸经过修饰从而增加其在宿主细胞中的表达；经过这样修饰的酶；以及制备修饰的酶的方法。该方法包括鉴定编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸中的“非优选的”或“较不优选的”密码子，并且用编码相同氨基酸的“优选密码子”作为替换密码子替换一个或者多个这些非优选或者较不优选的密码子，并且在所述核酸中至少一个非优选或较不优选的密码子被编码相同氨基酸的优选密码子替换。优选密码子是在宿主细胞基因的编码序列中被较多使用的密码子，而不优选的或者较不优选的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。

用于表达本发明的核酸、表达盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此，本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸，以及由所述的密码子被改变的核酸编码的多肽。示例性的宿主细胞包括革兰氏阴性细菌，如埃希氏大肠杆菌和荧光假单胞菌；革兰氏阳性细菌，如加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcus cremoris)、枯草芽胞杆菌(Bacillussubtilis)。示例性的宿主细胞也包括真核生物体，如，各种酵母，如酵母菌属某种(Saccharomyces sp.)，包括酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichia pastoris)和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉(Aspergillusniger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。其它示例性宿主细胞包括细菌细胞，例如埃希氏大肠杆菌、链霉菌、枯草芽孢杆菌、蜡状芽孢杆菌、鼠伤寒沙门氏菌和假单胞菌属、链霉菌属和葡萄球菌属中的各个种；真菌细胞，例如曲霉菌属(Aspergillus)；酵母细胞，例如毕赤酵母属、酵母属、裂殖酵母属或许旺酵母属中的任何种，包括巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母；昆虫细胞，例如果蝇S2和草地夜蛾Sf9；动物细胞，例如CHO、COS或黑色素瘤细胞或腺病毒。合适的宿主的选择在本领域技术人员的能力范围内。因此，本发明还包括被优化来在这些生物体和物种中表达的核酸和多肽。

例如，从细菌细胞中分离出的编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸密码子被修饰，以便该核酸在不同于获得转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的细菌的细菌细胞、酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中被优化地表达。优化密码子的方法在本领域是已知的，参见如，美国专利5,795,737；Baca(2000)Int.J.Parasitol.30:113-l18；Hale(1998)Protein Expr.Purif.12:185-188；Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253，描述了在小鼠系统中优化密码子；Outchkourov(2002)Protein Expr.Purif.24:18-24，描述了在酵母中优化密码子；Feng(2000)Biochemistry 39:15399-15409，描述了在大肠杆菌中优化密码子；Humphreys(2000)Protein Expr.Purif 20:252-264，描述了大肠杆菌中优化影响分泌的密码子使用。

转基因非人动物

本发明提供了转基因非人动物，其包含本发明的核酸、多肽(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)、表达盒或载体或转染细胞或转化细胞。本发明也提供了产生和应用这些转基因非人动物的方法。

转基因非人类动物可以是，例如包含本发明核酸的山羊、兔、绵羊、猪、牛、大鼠、马、狗、鱼和小鼠。这些动物可以用作例如体内模型来研究转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的活性，或者作为模型来在体内筛选改变转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性的试剂。要在转基因非人动物中表达的多肽的编码序列可以设计为组成型的，或者在组织特异性、发育特异性或者可诱导的转录调控因子的控制之下。转基因非人动物可以应用本领域任何已知的方法设计和产生；参见，如，美国专利6,211,428；6,187,992；6,156,952；6,118,044；6,111,166；6,107,541；5,959,171；5,922,854；5,892,070；5,880,327；5,891,698；5,639,940；5,573,933；5,387,742；5,087,571，它们描述了制造和应用转化的细胞和卵以及转基因小鼠、大鼠、兔、绵羊、猪、鸡、山羊、鱼和牛。也参见，如，Poll℃k(1999)J.Immunol.Methods 231:147-157，描述了在转基因产奶动物的乳汁中生产重组蛋白；Baguisi(1999)Nat.Biotechnol.17:456-461，描述了转基因山羊的产生。美国专利6,211,428，描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人哺乳动物。美国专利5,387,742，描述了把克隆的重组子或者合成的DNA序列注射至小鼠受精卵中，移植注射的卵至假孕的雌鼠中，并生长成为转基因鼠，它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992，描述了制备和应用转基因小鼠，它的基因组包括编码淀粉样前体蛋白(amyloid precursorprotein，APP)的基因的断裂。

“基因敲除动物”也可以被用于实践本发明的方法。例如，一方面，本发明的转基因或修饰动物包括“基因敲除动物”，例如“基因敲除小鼠”，其被工程改造以至于不表达内源基因，该基因被表达本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的基因或包含有本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的融合蛋白的基因代替。

转基因植物和种子

本发明提供了转基因植物和种子，其包含本发明的核酸、多肽(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)、表达盒或载体或转染或转化的细胞。本发明也提供了包含本发明核酸和/或多肽(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)的植物产品或副产品，包括任意植物部分在内，例如水果、油、种子、叶、提取物和类似物，例如其中本发明核酸或多肽与植物、植物部分、种子等是异源的。转基因植物(其包括植物部分、水果、种子等)可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如，美国专利6,309,872。

本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如，核酸或者表达构建物可以导入到所希望的植物宿主的基因组中，或者，核酸或表达构建物可以是附加体。可以导入到所希望的植物的基因组中，这样，宿主的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”，其中例如同源重组导致的基因序列插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是熟知的，参见例如，Strepp(1998)Proc Natl.Acad.Sci.USA 95:4368-4373；Miao(1995)Plant J 7:359-365。参见下面关于转基因植物的讨论。

本发明的核酸可以用来将所需的性质赋予基本上任何植物，例如产淀粉的植物，如马铃薯、小麦、大米、大麦以及类似的植物。本发明的核酸可以用于操纵植物的代谢途径，以优化或者改变宿主的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶表达。这可以改变植物中的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的活性。可选地，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以在转基因植物的生产中被应用，以产生该植物不能天然产生的化合物。这可以降低生产成本或者产生新的产物。

一方面，生产转基因植物的第一步涉及制备用于在植物细胞中表达的表达构建物。这些技术在本领域是熟知的。它们可以包括选择和克隆启动子、促进核糖体有效结合mRNA的编码序列，以及选择适当的基因终止子序列。一个示例性的组成型启动子是来自花椰菜花叶病毒的CaMV35S，它一般在植物中导致高水平的表达。其它的启动子是更特异的，并且对植物内部或者外部环境中的暗示有反应。一个示例性的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。

一方面，修饰核酸来实现在植物细胞中更大的表达。例如，本发明的序列很可能具有比在植物中见到的更高的A-T核苷酸对百分率，而一些植物优选G-C核苷酸对。因此，编码序列中的A-T核苷酸可以用G-C核苷酸取代，而不显著改变氨基酸序列，从而可以增加基因产物在植物细胞中的产生。

为了鉴定已经成功整合了转基因的植物细胞或者组织，可以将选择性标记基因加入到基因构建物中。这可能是必要的，因为在植物细胞中完成基因的整合和表达是一个小概率事件，仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白，所述试剂一般对植物有毒性，如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时，只有已经整合了选择性标记基因的植物细胞可以成活。至于其它的插入基因，为了有恰当的功能，标记基因也需要启动子和终止序列。

一方面，制备转基因植物或种子包括将本发明的序列以及一方面(任选地)标记基因整合到目标表达构建物(如，质粒)中，同时安置启动子和终止子序列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如，构建物可以应用如电穿孔和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中，或者构建物可以应用弹道方法(ballistic methods)，如，DNA微粒轰击(DNAparticle bombardment)的方法直接引入到植物组织中。例如，参见如，Christou(1997)Plant Mol.Biol.35:197-203；Pawlowski(1996)Mol.Biotechnol.6:17-30；Klein(1987)Nature 327:70-73；Talcumi(1997)Genes Genet.Syst.72：63-69，讨论了应用微粒轰击将转基因引入到小麦中；以及Adam(1997)如上，应用微粒轰击将YAC引入至植物细胞中。例如，Rinehart(1997)如上，用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明；而且，可以商购得到BioRad(Biolistics)PDS-2000微粒加速设备；也参见，John，美国专利5,608,148；和Ellis，美国专利5,681,730，描述了微粒介导的裸子植物的转化。

一方面，原生质体可以被固定，并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易，但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化，其中，DNA被包裹于钨微射弹(tungsten microprojectiles)上，射出物的大小为细胞大小的l/100，它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生，一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。

核酸，例如表达构建物，也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化，如，烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol.Biol.33:989-999)，参见Porta(1996)“Use of viral replicons for the expression of genesin plants”，Mol.Biotechnol.5:209-221。

可选地，核酸，如表达构建物，可以与合适的T-DNA侧翼区组合，并导入到传统的根瘤农杆菌宿主载体中。根瘤农杆菌宿主的毒力功能将在植物细胞受该细菌感染时，引导构建物和邻近的标记插入至植物细胞DNA中。根瘤农杆菌介导的转化技术，包括disarming和应用二元载体，在科学文献中有详细的说明。参见，如，Horsch(1984)Science 233:496-498；Fraley(1983)Proc.Natl.Acad.Sci.USA80:4803(1983)；Gene Transfer to Plants，Potrykus,ed.(Springer-Verlag,Berlin 1995)。根瘤农杆菌细胞的DNA被包含在细菌染色体中，也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(约20kb长)和一系列毒力(毒性)基因，T-DNA在感染过程中被转移到植物细胞中，毒力基因则引导所述感染过程。根瘤农杆菌仅可以通过伤口感染植物：当一种植物的根或者茎受伤时，它释放某种化学信号，作为对这种信号的响应，根瘤农杆菌的毒力基因被激活，并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录，然后将自身插入到暴露的植物DNA中。为了应用根瘤农杆菌作为转基因载体，必须去除T-DNA的肿瘤诱导部分，而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间，从这里转移到植物细胞并且整合到植物的染色体中。

本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化，参见Hiei(1997)Plant Mol.Biol.35:205-218。也参见如，Horsch,Science(1984)233:496；Fraley(1983)Proc.Natl Acad.Sci USA 80:4803；Thykjaer(1997)如上；Park(1996)Plant Mol.Biol.32:1135-1148，讨论了将T-DNA整合到基因组DNA中。也参见D'Halluin，美国专利5,712,135，描述了包含在谷类或者其它单子叶植物的细胞中的具有功能的基因的DNA的稳定整合过程。

一方面，第三步可以涉及完整植物的选择和再生，所述植物能够将整合的靶基因传递至下一代。这样的再生技术依赖在组织培养生长培养基中对某些植物激素的操作，并且可依赖杀虫剂和/或除草剂标记，其已同所期望的核苷酸序列一起引入。源自培养的原生质体的植物再生在以下文献中有说明，Evans等,ProtoplastsIsolation and Culture,Handbook of Plant Cell Culture,124-176页，MacMillilanPublishing Company,New York,1983；和Binding，Regeneration of Plants,PlantProtoplasts,21-73页，CRC Press,B℃a Raton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplant Phys.38:467-486中有概括性的说明。为了从转基因组织如未成熟的胚胎获得整个植物，它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下生长，即称为组织培养的过程。一旦整个植物再生并且产生种子，便开始评测其子代。

在表达盒稳定地整入到转基因植物之后，其可以通过有性交换(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术，这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化，包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此，本发明的种子可以来自本发明的两个转基因植物之间的杂交，或者来自本发明的植物和其它植物之间的杂交。当两个亲本植物都表达本发明的多肽(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)时，所需的效应(例如，表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应可通过标准的繁殖方法传到以后的植物世代中。

本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草，如牧草(蓝草，早熟禾属(Poa))，饲料草如羊茅属，黑麦草属，温带草，如翦股颖属(Agrostis)，和谷类，如小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(maize)(玉米(corn))。本发明的双子叶转基因植物的例子是烟草、豆类，如羽扇豆、马铃薯、甜菜、豌豆、蚕豆和大豆，以及十字花科植物(Brassicaceae科)，如花椰菜，油菜籽，和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样，本发明的转基因植物和种子包括宽范围的植物，包括，但不限于，以下属的种：腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、油菜属(Brassica)、柑桔属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、红花属(Carthamus)、椰子属(C℃os)、咖啡属(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、油棕属(Elaeis)、草莓属(Fragaria)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、萱草属(Heter℃allis)、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、马郁兰属(薄荷属，Majorana)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、稻属(Oryza)、黍属(Panieum)、狼尾草属(Pannisetum)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistachia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、白芥属(Sinapis)、茄属(Solanum)、高粱属(Sorghum)、可可属(Theobromus)、胡卢巴属(Trigonella)、小麦属(Triticum)、野豌豆属(Vicia)、葡萄属(Vitis)、豇豆属(Vigna)和黍属(Zea)。本发明的转基因植物和种子可以是任意单子叶或双子叶植物，例如单子叶玉米、甘蔗、大米、小麦、大麦、柳枝稷或芒属植物；或双子叶油籽作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、甜菜、花生、树、白杨或羽扇豆。

在可选择的实施方式中，本发明的核酸在含有纤维细胞的植物(和/或它们的种子)中表达，包括，如，棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、轻木(balsa)、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可选择的实施方式中，本发明的转基因植物可以是棉属(Gossypium)的成员，包括任何棉(Gossypium)种的成员，如，亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。

本发明也提供了用于产生大量本发明多肽(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或抗体)的转基因植物(和/或它们的种子)。例如，参见Palingren(1997)Trends Genet.13:348；Chong(1997)Transgenic Res.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1',2')启动子，应用根瘤农杆菌介导的叶盘(leaf disc)转化方法在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。

应用已知的程序，技术人员可以通过检测在转基因植物中转基因mRNA或蛋白的增加或减少来筛选本发明的植物(和/或它们的种子)。检测和定量mRNA或蛋白的方法在本领域是熟知的。

多肽和肽

在一方面，本发明提供具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性的分离的、合成的或重组的多肽和肽、或能够产生与转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶——包括本发明的酶——特异性结合的抗体的多肽和肽，其包括本发明的氨基酸序列，它们包括与本发明的示例性多肽具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或100％(完全)序列同一性的那些序列(本发明的示例性多肽如上所限定，包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ IDNO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ IDNO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ IDNO:143、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ IDNO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ IDNO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ IDNO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ IDNO:216、SEQ ID NO:218、SEQ ID NO:220、具有表46或表55的一个、几个或全部修饰的SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ IDNO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ IDNO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ IDNO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ IDNO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ IDNO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ IDNO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ IDNO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ IDNO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ IDNO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ IDNO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ IDNO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ IDNO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ IDNO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ IDNO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ IDNO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ IDNO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516、SEQ ID NO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ IDNO:524、SEQ ID NO:526、SEQ ID NO:528、SEQ ID NO:530、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:536、SEQ ID NO:538、SEQ ID NO:540、SEQ IDNO:542、SEQ ID NO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ ID NO:550、SEQ ID NO:552、SEQ ID NO:554、SEQ ID NO:556、SEQ ID NO:558、SEQ IDNO:560、SEQ ID NO:562、SEQ ID NO:564、SEQ ID NO:566、SEQ ID NO:568、SEQ ID NO:570、SEQ ID NO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ IDNO:578、SEQ ID NO:580、SEQ ID NO:582、SEQ ID NO:584、SEQ ID NO:586、SEQ ID NO:588、SEQ ID NO:590、SEQ ID NO:592、SEQ ID NO:594、SEQ IDNO:596、SEQ ID NO:598、SEQ ID NO:600、SEQ ID NO:602、SEQ ID NO:604、SEQ ID NO:606、SEQ ID NO:608、SEQ ID NO:610、SEQ ID NO:612、SEQ IDNO:614、SEQ ID NO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ ID NO:622、SEQ ID NO:624、SEQ ID NO:626、SEQ ID NO:628、SEQ ID NO:630、SEQ IDNO:632、SEQ ID NO:634、SEQ ID NO:636、SEQ ID NO:638、SEQ ID NO:640、SEQ ID NO:642、SEQ ID NO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ IDNO:650、SEQ ID NO:652、SEQ ID NO:654、SEQ ID NO:656、SEQ ID NO:658、SEQ ID NO:660、SEQ ID NO:662、SEQ ID NO:664、SEQ ID NO:666、SEQ IDNO:668、SEQ ID NO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ ID NO:676、SEQ ID NO:678、SEQ ID NO:680、SEQ ID NO:682、SEQ ID NO:684、SEQ IDNO:686、SEQ ID NO:688、SEQ ID NO:690、SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:696、SEQ ID NO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ IDNO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:712、SEQ ID NO:714、SEQ ID NO:716、SEQ ID NO:718、SEQ ID NO:720、SEQ IDNO:722、SEQ ID NO:724、SEQ ID NO:726、SEQ ID NO:728、SEQ ID NO:730、SEQ ID NO:732、SEQ ID NO:734、SEQ ID NO:736、SEQ ID NO:738、SEQ IDNO:740、SEQ ID NO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ ID NO:748、SEQ ID NO:750、SEQ ID NO:752、SEQ ID NO:754、SEQ ID NO:756、SEQ IDNO:758、SEQ ID NO:760、SEQ ID NO:762、SEQ ID NO:764、SEQ ID NO:766、SEQ ID NO:768、SEQ ID NO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ IDNO:776、SEQ ID NO:778、SEQ ID NO:780、SEQ ID NO:782、SEQ ID NO:784、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:790、SEQ ID NO:792、SEQ IDNO:794、SEQ ID NO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:804、SEQ ID NO:808、SEQ ID NO:808、SEQ ID NO:810、SEQ IDNO:812、SEQ ID NO:814、SEQ ID NO:816、SEQ ID NO:818、SEQ ID NO:820、SEQ ID NO:822、SEQ ID NO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ IDNO:830、SEQ ID NO:832、SEQ ID NO:834、SEQ ID NO:836、SEQ ID NO:838、SEQ ID NO:840、SEQ ID NO:842、SEQ ID NO:844、SEQ ID NO:846、SEQ IDNO:848、SEQ ID NO:850、SEQ ID NO:852、SEQ ID NO:854、SEQ ID NO:856、SEQ ID NO:858、SEQ ID NO:860、SEQ ID NO:862、SEQ ID NO:864、SEQ IDNO:866、SEQ ID NO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ ID NO:874、SEQ ID NO:876、SEQ ID NO:878、SEQ ID NO:880、SEQ ID NO:882、SEQ IDNO:884、SEQ ID NO:886、SEQ ID NO:888、SEQ ID NO:890、SEQ ID NO:892、SEQ ID NO:894、SEQ ID NO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ IDNO:902、SEQ ID NO:904、SEQ ID NO:906、SEQ ID NO:908、SEQ ID NO:910、SEQ ID NO:912、SEQ ID NO:914、SEQ ID NO:916、SEQ ID NO:918、SEQ IDNO:920、SEQ ID NO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ ID NO:928、SEQ ID NO:930、SEQ ID NO:932、SEQ ID NO:934、SEQ ID NO:936、SEQ IDNO:938、SEQ ID NO:940、SEQ ID NO:942、SEQ ID NO:944、SEQ ID NO:946、SEQ ID NO:948、SEQ ID NO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ IDNO:956、SEQ ID NO:958、SEQ ID NO:960、SEQ ID NO:962、SEQ ID NO:964、SEQ ID NO:966、SEQ ID NO:968、SEQ ID NO:970、SEQ ID NO:972、SEQ ID NO:974和/或SEQ ID NO:976)，包括本文所述的氨基酸序列，包括表1、2、3、46、47和53以及序列表中的序列(所有这些氨基酸序列是“本发明的示例性酶/多肽”)，及其酶促活性子序列(片段)；以及编码所有这些氨基酸序列的核酸是本发明的核酸(多核苷酸)序列。

在一方面，本发明提供具有异源结合结构域的嵌合酶，其包括转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，例如用于本发明的方法以及各种工业、医学、制药、研究、食物和饲料以及食物和饲料补充物加工和其它应用中。例如，在一方面本发明提供酶，例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，其包括本发明酶的一个或多个结合结构域。在另一方面，在本发明的不同酶之间的结合结构域可以被交换；或者可选地，本发明一种或多种酶的一个或多个结合结构域可以被剪接到酶中，例如，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。在本发明的一方面，结合结构域选自NAD、NAD(P)、钙、硫胺素、FAD、锌、DNA和/或硫辛酰结合结构域。

本发明进一步提供具有异源、非自然底物的嵌合酶；其包括按照其“剪接-进入”异源结合结构域具有多个底物的嵌合酶——因此给出嵌合酶新的特异性或增强的结合。本发明的嵌合酶的异源结合结构域可被设计为模块式的，即被添加到催化模块或催化结构域(例如活性位点)，其对于酶也可以是异源的或者可以是同源的。

仅仅转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶(例如本发明的酶)的催化模块的利用已经显示是有效的。因此，本发明提供肽和多肽，其由模块结合结构域/活性位点模块组成或包括模块结合结构域/活性位点模块，其可被同源成对或连接为嵌合(异源)活性位点-结合模块对。因此，本发明的这些嵌合多肽/肽可被用于提高或改变个体酶的性能，个体酶例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。本发明的嵌合催化模块(包括例如本发明的至少一个结合结构域)可被设计以将酶靶向底物的特定区域。例如，在一方面，这通过制备转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶和各种结合结构域(或者本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶与异源结合结构域，或者本发明的结合结构域与另一酶，例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)的融合物实现。

因此，本发明提供嵌合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，例如转氨酶和/或脱氢酶与不同(例如异源)结合结构域的融合。在一方面，嵌合转移酶，例如转氨酶，例如d-氨基酸转移酶和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶包括本发明的酶。在一方面，嵌合酶包括不同结合结构域的融合。本发明还提供方法，其包括：将不同的结合结构域与不同的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶(例如，本发明的结合结构域和/或本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)重组，以及筛选所得的嵌合体以发现对于特定应用或底物的最佳组合。

其它变异也在本发明的范围内，例如一个、两个、三个、四个或五个或更多个残基从本发明的任何多肽的羧基或氨基末端去除。另一变异包括改变任何残基以增加或减少多肽的pI，例如去除或改变(例如另一氨基酸)谷氨酸。该方法被用作提高酶的特性的一般方案，而没有产生调节问题，因为没有氨基酸发生突变，该一般方案可与本发明的任何多肽一起使用。

本发明提供分离的、合成的或重组的多肽，其具有转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性，其中所述多肽具有本发明的任何多肽的序列修饰，所述本发明的任何多肽包括本发明的任何示例性氨基酸序列，包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ IDNO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ IDNO:143、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ IDNO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ IDNO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ IDNO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ IDNO:216、SEQ ID NO:218、SEQ ID NO:220、具有表46或表55的一个、几个或全部修饰的SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ IDNO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ IDNO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ IDNO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ IDNO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ IDNO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ IDNO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ IDNO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ IDNO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ IDNO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ IDNO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ IDNO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ IDNO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ IDNO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ IDNO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ IDNO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ IDNO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516、SEQ ID NO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ IDNO:524、SEQ ID NO:526、SEQ ID NO:528、SEQ ID NO:530、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:536、SEQ ID NO:538、SEQ ID NO:540、SEQ IDNO:542、SEQ ID NO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ ID NO:550、SEQ ID NO:552、SEQ ID NO:554、SEQ ID NO:556、SEQ ID NO:558、SEQ IDNO:560、SEQ ID NO:562、SEQ ID NO:564、SEQ ID NO:566、SEQ ID NO:568、SEQ ID NO:570、SEQ ID NO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ IDNO:578、SEQ ID NO:580、SEQ ID NO:582、SEQ ID NO:584、SEQ ID NO:586、SEQ ID NO:588、SEQ ID NO:590、SEQ ID NO:592、SEQ ID NO:594、SEQ IDNO:596、SEQ ID NO:598、SEQ ID NO:600、SEQ ID NO:602、SEQ ID NO:604、SEQ ID NO:606、SEQ ID NO:608、SEQ ID NO:610、SEQ ID NO:612、SEQ IDNO:614、SEQ ID NO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ ID NO:622、SEQ ID NO:624、SEQ ID NO:626、SEQ ID NO:628、SEQ ID NO:630、SEQ IDNO:632、SEQ ID NO:634、SEQ ID NO:636、SEQ ID NO:638、SEQ ID NO:640、SEQ ID NO:642、SEQ ID NO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ IDNO:650、SEQ ID NO:652、SEQ ID NO:654、SEQ ID NO:656、SEQ ID NO:658、SEQ ID NO:660、SEQ ID NO:662、SEQ ID NO:664、SEQ ID NO:666、SEQ IDNO:668、SEQ ID NO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ ID NO:676、SEQ ID NO:678、SEQ ID NO:680、SEQ ID NO:682、SEQ ID NO:684、SEQ IDNO:686、SEQ ID NO:688、SEQ ID NO:690、SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:696、SEQ ID NO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ IDNO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:712、SEQ ID NO:714、SEQ ID NO:716、SEQ ID NO:718、SEQ ID NO:720、SEQ IDNO:722、SEQ ID NO:724、SEQ ID NO:726、SEQ ID NO:728、SEQ ID NO:730、SEQ ID NO:732、SEQ ID NO:734、SEQ ID NO:736、SEQ ID NO:738、SEQ IDNO:740、SEQ ID NO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ ID NO:748、SEQ ID NO:750、SEQ ID NO:752、SEQ ID NO:754、SEQ ID NO:756、SEQ IDNO:758、SEQ ID NO:760、SEQ ID NO:762、SEQ ID NO:764、SEQ ID NO:766、SEQ ID NO:768、SEQ ID NO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ IDNO:776、SEQ ID NO:778、SEQ ID NO:780、SEQ ID NO:782、SEQ ID NO:784、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:790、SEQ ID NO:792、SEQ IDNO:794、SEQ ID NO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:804、SEQ ID NO:808、SEQ ID NO:808、SEQ ID NO:810、SEQ IDNO:812、SEQ ID NO:814、SEQ ID NO:816、SEQ ID NO:818、SEQ ID NO:820、SEQ ID NO:822、SEQ ID NO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ IDNO:830、SEQ ID NO:832、SEQ ID NO:834、SEQ ID NO:836、SEQ ID NO:838、SEQ ID NO:840、SEQ ID NO:842、SEQ ID NO:844、SEQ ID NO:846、SEQ IDNO:848、SEQ ID NO:850、SEQ ID NO:852、SEQ ID NO:854、SEQ ID NO:856、SEQ ID NO:858、SEQ ID NO:860、SEQ ID NO:862、SEQ ID NO:864、SEQ IDNO:866、SEQ ID NO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ ID NO:874、SEQ ID NO:876、SEQ ID NO:878、SEQ ID NO:880、SEQ ID NO:882、SEQ IDNO:884、SEQ ID NO:886、SEQ ID NO:888、SEQ ID NO:890、SEQ ID NO:892、SEQ ID NO:894、SEQ ID NO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ IDNO:902、SEQ ID NO:904、SEQ ID NO:906、SEQ ID NO:908、SEQ ID NO:910、SEQ ID NO:912、SEQ ID NO:914、SEQ ID NO:916、SEQ ID NO:918、SEQ IDNO:920、SEQ ID NO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ ID NO:928、SEQ ID NO:930、SEQ ID NO:932、SEQ ID NO:934、SEQ ID NO:936、SEQ IDNO:938、SEQ ID NO:940、SEQ ID NO:942、SEQ ID NO:944、SEQ ID NO:946、SEQ ID NO:948、SEQ ID NO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ IDNO:956、SEQ ID NO:958、SEQ ID NO:960、SEQ ID NO:962、SEQ ID NO:964、SEQ ID NO:966、SEQ ID NO:968、SEQ ID NO:970、SEQ ID NO:972、SEQ ID NO:974和/或SEQ ID NO:976，包括本文和表1、2和3以及序列表中所述的序列(所有这些序列是本发明的“示例性酶/多肽”)，和其酶促活性子序列(片段)。序列改变(或多个)还可包括任何氨基酸修饰以改变多肽的pI，例如谷氨酸的缺失或修饰，或者从谷氨酸变成另一残基。

本发明进一步提供分离的、合成的或重组的多肽，其与本发明的示例性序列具有序列同一性(例如至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的或完全(100％)序列同一性)。

在一方面，多肽具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，和/或催化化学基团的转移，催化转氨作用，催化反应：D-丙氨酸+2-氧化戊二酸<＝>丙酮酸+D-谷氨酸，和/或催化氧化-还原反应，催化氢原子的去除，和/或催化反应：D-氨基酸+H₂O+受体<＝>2-含氧酸+NH₃+还原的受体。

本领域已知的任何转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶试验都可被用于测定多肽是否具有转移酶活性，例如转氨酶活性，例如d-氨基酸转移酶活性，和/或氧化还原酶活性，例如脱氢酶活性，例如d-氨基酸脱氢酶活性，并且在本发明的范围内。例如，Lee,et.al.(AEM.2006February.72(2):1588-1594)描述利用采用乳酸脱氢酶的偶联试验计算丙酮酸形成速度。在另一实例中，Mayer(Journal ofBiomolecular Screening,Vol.7,No.2,135-140(2002))描述比色试验，其在与由脱氢酶产生的NADPH反应中利用氮蓝四唑(NBT)和吩嗪硫酸甲酯(PMS)以产生不溶的蓝紫色甲。

本发明的多肽包括活性或非活性形式的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。例如，本发明的多肽包括前原序列“成熟”或加工之前的前蛋白，例如，通过前原蛋白加工酶，诸如前蛋白转变酶以产生“活性”成熟蛋白。本发明的多肽包括由于其它原因非活性的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，例如在通过翻译后加工事件“活化”之前，例如内或外肽酶或蛋白酶作用，磷酸化事件、酰胺化、糖基化或硫酸盐化、二聚化等等。本发明的多肽包括转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的所有活性形式，其包括活性子序列，例如催化结构域或活性位点。

鉴定“前原”结构域序列和信号序列的方法是本领域熟知的，参见例如Van de Ven(1993)Crit.Rev.Oncog.4(2):115-136。例如，为了鉴定前原序列，从细胞外空间纯化蛋白，并且测定N-末端蛋白序列并与未加工形式比对。

本发明包括具有或没有信号序列和/或前原序列的多肽。本发明包括具有异源信号序列和/或原前序列的多肽。前原序列(包括用作异源前原结构域的本发明序列)可以位于蛋白质的氨基末端或羧基末端。本发明还包括含有本发明序列的分离或重组的信号序列、前原序列和催化结构域(例如，“活性位点”)。

序列同一性百分比可以是多肽的全长，或者所述同一性可以是在至少约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多个残基的区域上。本发明的多肽还可短于示例性多肽的全长。在可选的方面，本发明提供大小范围在约5个残基至多肽全长之间的多肽(肽，片段)，所述多肽例如酶，如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶；示例性大小为约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700或更多个残基，例如本发明的示例性转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的连续残基。

本发明的肽(例如本发明示例性多肽的子序列)可以用作例如标记探针、抗原、耐受原(toleragen)、基序、活性位点(例如“催化结构域”)、信号序列和/或前原结构域。

本发明的多肽和肽可以分离自天然来源，可以是合成的，或者可以是重组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明的肽和多肽可以使用本技术领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本技术领域熟知的化学方法全部或部分合成。例如参见Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223；Horn(1980)Nucleic Acids Res.Symp.Ser.225-232；Banga，A.K.，Therapeutic Peptides and Proteins,Formulation,Processing and DeliverySystems(1995)Technomic Publishing Co.，Lancaster，PA。例如，肽合成可以使用各种固相技术进行(例如参见Roberge(1995)Science 269:202；Merrifield(1997)Methods Enzymol.289:3-13)，自动合成可以例如使用ABI 431A肽合成仪(PerkinElmer)，根据制造商提供的说明书来实施。

本发明的肽和多肽也可被是糖基化。所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上，其中后者包括应用已知的糖基化作用基序，所述糖基化作用基序可以对于所述序列是天然的，或者可以作为肽而被加入，或者是在核酸编码序列中加入。糖基化作用可以是O-联接的或者是N-联接的。

如本文所使用，“氨基酸”或“氨基酸序列”是指寡肽、肽、多肽或蛋白序列，或指寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基，以及指天然发生的或合成的分子。“氨基酸”或“氨基酸序列”包括寡肽、肽、多肽或蛋白序列，或寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基，以及指天然发生的或合成的分子。如本文所使用，术语“多肽”是指通过肽键或修饰的肽键即肽等排体(peptide isosteres)彼此结合在一起的氨基酸，可以含有除20个由基因编码的氨基酸之外的修饰的氨基酸。所述多肽可以通过天然过程，如，翻译后加工或者通过本领域所熟知的化学修饰技术进行修饰。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在给定的多肽中以相同的或者不同的程度在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接黄素、共价连接血红素部分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化作用、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。(参见，如，Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H.Freeman和Company,New York(1993)；PosttranslationalCovalent Modification of Proteins,B.C.Johnson，Ed.,Academic Press,New York,11-12页(1983))。本发明的肽和多肽也包括所有“模拟物”和“肽模拟物”形式，正如下面进一步详细描述的。

“重组的”多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白；即，由用编码期望多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。本发明的“合成的”核酸(包括寡核苷酸)、多肽或蛋白包括那些通过例如下面所述的任意化学合成制备的多肽或蛋白。固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.S℃.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页)，并且这些方法已经被用于商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearch Biochemicals)。这些商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的教导，并将肽合成在多个“杆(rods)”或者“钉(pins)”的顶端，而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时，一个板的杆或者钉被倒转并插入到第二个板的相应孔或者贮存器中，所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤，即是，反转和插入所述杆和钉的顶端至适当的溶液中，将氨基酸构建成所要的肽。此外，大量的可利用的FM℃肽合成系统是可利用的。例如，应用Applied Biosystems,Inc.的Model 431A自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得，或者通过直接的合成或者通过合成用其它已知的技术可以偶联起来的一系列片段。

如本文所用，“片段”是可以至少两种不同构象存在的天然发生的蛋白的一部分。片段可以具有与天然发生的蛋白质相同或基本上相同的氨基酸序列。“基本上相同(Substantially the same)”是指氨基酸序列大部分，但不是完全地相同，但保留至少一种与之相关序列的功能性活性。一般而言，如果两个氨基酸序列至少约85％相同，则它们是“基本上相同”或“基本上同源”。还包括具有与自然存在的蛋白不同三维结构的片段。这种片段的例子是“原形式(pro-form)”分子，例如低活性原蛋白，其可通过切割被修饰以产生具有显著更高活性的成熟酶。

本发明的肽和多肽，如以上所定义的，包括所有的“模拟物(mimetic)”和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成，或者是由部分天然的肽氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守置换，只要这样的置换本质上不改变该模拟物的结构和/或活性。对于作为保守性变体的本发明多肽，常规实验将可以确定一种模拟物是否在本发明的范围内，即，其结构和/或功能并没有实质上的改变。因此，一方面，如果一种模拟组合物具有转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性，那么它在本发明的范围内。

本发明的多肽模拟组合物可以包含非天然结构成分的任何组合。在可供选择的方面，本发明的模拟组合物包括以下三种结构基团中的一种或全部：a)不是天然酰胺键(“肽键”)连接的残基连接基团；b)替代天然发生的氨基酸残基的非天然残基；或者c)诱导二级结构拟态(mimicry)的残基，即，诱导或者稳定二级结构，如β转角、γ转角、β折叠、α螺旋构象，以及类似的结构。例如，当本发明的多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时，该多肽可以表征为模拟物。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接，如，通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N,N'-二环己基碳二亚胺(DCC)或者N,N'-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的连接基团包括，如，酮基亚甲基(如，-C(＝O)-CH₂-代替-C(＝O)-NH-)、氨基亚甲基(CH₂-NH)、次乙基、烯烃(CH＝CH)、醚(CH₂-O)、硫醚(CH₂-S)、四唑(CN₄-)、噻唑、逆酰胺(retroamide)、硫代酰胺或者酯(参见如，Spatola(1983)在Chemistry and Biochemistry of Amino Acids,Peptides andProteins,第7卷,267-357页，“Peptide Backbone Modifications”Marcell Dekker,NY)。

本发明的多肽也可以由于含有全部或者一些替代了天然发生的氨基酸残基的非天然氨基酸残基而被表征为模拟物。在科学和专利文献中充分描述了非天然的残基；用作为天然氨基酸残基的模拟物的一些示范性的非天然组合物及指导在下面有描述。芳香族氨基酸的模拟物可以通过用以下进行替代来产生，如，D-或L-萘基丙氨酸；D-或L-苯基甘氨基，D-或L-2thieneyl丙氨酸；D-或L-1、-2、3-或4-芘基丙氨酸；D-或L-3thieneyl丙氨酸；D-或L-(2-吡啶基)-丙氨酸；D-或L-(3-吡啶基)-丙氨酸；D-或L-(2-吡嗪基)-丙氨酸；D-或L-(4-异丙基)-苯基甘氨酸；D-(三氟甲基)-苯基甘氨酸；D-(三氟甲基)-苯基丙氨酸；D-p-氟-苯基丙氨酸；D-或L-p-二苯基苯基丙氨酸；D-或L-p-甲氧基-二苯基苯基丙氨酸；D-或L-2-吲哚(烷基)丙氨酸；和，D-或L-烷基丙氨酸，其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括，如噻唑基、噻吩基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。

酸性氨基酸的模拟物可以通过用以下的置换来产生，如，保持负电荷的非羧酸氨基酸；(膦酰基)丙氨酸；硫酸化的苏氨酸。羧基侧链基团(如，天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R'-N-C-N-R')反应进行选择性地修饰，所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮-4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基残基。碱性氨基酸的模拟物可以通过用如，(除了赖氨酸和精氨酸外)氨基酸鸟氨酸、瓜氨酸、或者(胍基)-乙酸，或者(胍基)烷基-乙酸置换产生，其中烷基如以上定义。腈衍生物(如，含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基残基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂优选在碱性的条件下反应而产生，所述的常规试剂包括如苯乙二醛、2,3-丁二酮、l,2-环-己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-乙酰基咪唑基和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰基物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生；得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-咪唑基)丙酸；氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物；甲基2-吡啶基二硫化物；p-氯汞苯甲酸盐；2-氯汞-4硝基苯酚，或者，氯-7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和可以改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应，和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括，例如，2-哌啶酸、噻唑烷羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸，或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括，例如，由脯氨酸和赖氨酸的羟基化作用产生的模拟物；由丝氨酰或者苏氨酰残基的羟基的磷酸化作用产生的模拟物；由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物；由N-末端胺的乙酰化作用而产生的模拟物；由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物；或者，由C-末端羧基的酰胺化而产生的模拟物。

本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此，天然发生的L-构型(也可以被称为R或者S，取决于化学实体的结构)的任何氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代，相反手性的氨基酸称为D-氨基酸，但也可以称R-或者S-型。

本发明也提供了通过天然过程，如，翻译后加工(如，磷酸化，酰化以及类似作用)或者通过化学修饰技术来修饰本发明的多肽的方法，以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在给定的多肽中在几个位点处以相同的或者不同的程度存在。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接黄素、共价连接血红素组分、共价连接核苷酸或核苷酸衍生物、共价连接脂质或脂质衍生物、共价连接磷脂酰肌醇、交联环化作用、二硫键形成、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。参见，如，Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H.Freemanand Company,New York(1993)；Posttranslational Covalent Modification of Proteins,B.C.Johnson，Ed.,Academic Press,New York,11-12页(1983)。

固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.S℃.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid Phase PeptideSynthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页)，并且这些方法近来已经可以用于商业上可获得的实验室肽设计和合成试剂盒(Cambridge ResearchBiochemicals)。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的教导，它们将肽合成在多个“杆(rods)”或者“钉(pins)”的顶端，而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时，一个板的杆或者钉被倒转并插入到第二个板的相应孔或者贮存器中，所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤，即是，反转和插入所述杆和钉的顶端至适当的溶液中，将氨基酸构建成所要的肽。此外，大量的可利用的FM℃肽合成系统是可利用的。例如，应用Applied Biosystems,Inc.的Model 431A^TM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得，或者通过直接的合成或者通过合成用其它已知的技术可以偶联起来的一系列片段。

本发明包括带有或不带有信号的本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。包括本发明的信号序列的多肽可以是本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或另一转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或另一酶或其它多肽。

本发明包括固定化的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶抗体及其片段。本发明提供了抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性的方法，例如使用本发明的显性负突变体或抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶抗体。本发明包括含有本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的异源复合物，例如融合蛋白、异二聚体等等。

本发明的多肽可以在多种条件下具有转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性，例如在极端pH和/或温度、氧化剂以及类似的条件下。本发明提供了产生可供选择的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶制剂的方法，所述制剂具有不同的催化效率和例如对温度、氧化剂和改变洗涤条件的稳定性。一方面，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶变体可以使用定点诱变和/或随机诱变的技术来产生。一方面，定向进化可以用于产生大量不同的具有可供选择的特异性和稳定性的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶变体。

本发明的蛋白也可用作研究试剂，以鉴定转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶调节剂，例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性激活剂或抑制剂。简单的说，将测试样品(化合物、培养液、提取物和类似物)加入到转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶试验中，以确定它们抑制底物切割的能力。用该方式鉴定的抑制剂可用于工业和研究中，以减少或阻止不期望的蛋白水解。抑制剂可以被组合以增加活性谱。

本发明的酶也可用作消化蛋白质的研究试剂或用在蛋白测序中。例如，可以使用转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶将多肽破碎成更小的片段，以便使用例如自动测序仪进行测序。

本发明也提供了应用本发明的核酸、多肽和抗体来发现新转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的方法。一方面，筛选噬菌粒文库，以便基于表达来发现转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。另一方面，筛选λ噬菌体文库，以便基于表达来发现转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。通过筛选噬菌体或噬菌粒文库，可以检测到毒性克隆；更方便地利用底物；减少工程改造宿主的需要，绕过由文库中大的切除带来任何偏差的可能性；以及获得在低克隆密度下更快的生长速率。噬菌体或噬粒文库的筛选可以是在液相中或者固相中进行。一方面，本发明提供了在液相中的筛选。与固相筛选相比，这给予了分析条件上的更大灵活性；额外底物的灵活性；对于弱的克隆的更高灵敏性；和更容易实现的自动化。

本发明提供了使用本发明的蛋白和核酸以及机器人自动化来进行筛选的方法，机器人自动化使得在例如一天的短时间内能进行数千个生物催化反应和筛选分析，并且保证了高水平的精确度和可重复性(参见下面关于阵列的讨论)。结果，衍生化合物的文库可以在数周内产生。对于包括小分子在内的分子的修饰的进一步教导，参见PCT/US94/09174。

本发明的另一方面是分离的或纯化的多肽，其包含本发明之一的序列及与其基本上相同的序列或包含其至少约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段。如上所讨论，这些多肽可通过如下获得：将编码多肽的核酸插入至载体以使该编码序列可操作地连接至能够驱动编码的多肽在合适的宿主细胞中表达的序列。例如，表达载体可包括启动子，用于翻译起始的核糖体结合位点和转录终止子。载体还可包含用于扩增表达的适合序列。

本发明的另一方面是多肽或其片段，其具有与本发明的多肽之一及与其基本上相同的序列或包含其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％或大于约95％同源性。同源性可使用上文所述的任何程序测定，所述程序比对进行比较的多肽或片段并测定它们之间的氨基酸同一性或相似性程度。应意识到的是，氨基酸“同源性”包括例如那些如上所述的保守氨基酸置换。

与本发明的多肽之一或包含其至少约5、10、15、20、25、30、35、40、50、75、100、或150连续的氨基酸的片段具有同源性的多肽或片段，可通过使用如上所述的技术分离编码它们的核酸来获得。

可选地，同源的多肽或片段可通过生物化学富集或纯化方法来获得。可能的同源多肽或片段的序列可通过凝胶电泳和/或微测序来测定。预期的同源多肽或片段的序列可以使用如上所述的任何程序，与本发明的多肽之一或包含其至少约5、10、15、20、25、30、35、40、50、75、100或150连续的氨基酸的片段比较。

本发明的另一方面是用于鉴定本发明的片段或变体的试验，所述片段或变体保持本发明多肽的酶功能。例如，所述多肽的片段或变体可用于催化生物化学反应，其显示片段或变体保留本发明多肽的活性。

用于测定变体的片段是否保持本发明多肽的酶活性的试验包括以下步骤：在使得多肽片段或变体发挥功能的条件下将多肽片段或变体与底物分子接触，以及检测底物水平的降低或多肽和底物之间的反应的具体反应产物水平的增加。

本发明开发了酶的独特的催化性质。鉴于生物催化剂(即，纯化的或者粗制的酶，非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂，本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物如小分子中的官能团具有特异性的。每种生物催化剂对于一种官能团或者几种相关的官能团是特异的，并且可以与含有这一官能团的许多起始化合物反应。

生物催化反应可以从单一的起始化合物产生一个衍生物的群体。这些衍生物可以进行另一轮的生物催化反应来产生第二个衍生化合物的群体。通过生物催化的衍生作用的每一次迭代，可以产生起始小分子或化合物的数千种变化。

酶可以在起始化合物的特定位点发生反应而不影响分子的其它部分，该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于在文库中鉴定单个活性化合物的手段。该文库是通过用于产生该文库的一系列生物催化反应来表征的，这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序，并确定合成出的化合物的结构。这种确认方式，不同于其它的合成和筛选方法，并不需要固定化技术，并且化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。重要的是，注意到酶反应在官能团上的高度特异性允许“追踪”特定的酶促反应，由所述酶促反应构成了生物催化产生的文库。

许多程序化的步骤可使用机器人自动化来实施，这使得每天可执行数千个生物催化反应和筛选分析，并保证高水平的准确性和可重复性。结果，一方面，在几周内便产生了衍生化合物的文库，而采用现有的化学方法则需要几年的时间。

在一个特定的方面，本发明提供了修饰小分子的方法，包括将在此所述的由多核苷酸编码的多肽或其酶活性片段与小分子接触，产生修饰的小分子。检测被修饰的小分子的文库以确定显示出所需活性的修饰小分子是否存在于文库内。产生具有所需活性的修饰小分子的特异性生物催化反应的鉴定可通过系统性地去除用来产生一部分文库的每个生物催化反应，然后检测在这一部分文库中产生的小分子是否存在或不存在具有所需活性的修饰小分子。产生具有所需活性的修饰小分子的特异生物催化反应可一方面(任选地)被重复。生物催化反应可用一组生物催化剂来进行，它们可与在小分子的结构中发现的各种不同结构部分反应，每个生物催化剂对一个结构部分或一组相关的结构部分是特异的；每个生物催化剂可与含有各种不同的结构部分的许多不同的小分子反应。

转氨酶和/或氧化还原酶信号序列、前原结构域和催化结构域

本发明提供转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信号序列(例如，信号肽(SPs))，前原结构域和催化结构域(CDs)。本发明的SPs，前原结构域和/或CDs可以是分离的、合成的或重组的肽或者可以是融合蛋白的部分，例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CDs)、前原结构域和信号序列(SPs，例如具有包括本发明的多肽的氨基末端残基或由本发明的多肽的氨基末端残基组成的序列的肽)的核酸。一方面，本发明提供了包括肽的信号序列，该肽包括下列序列或由下列序列组成，所述序列如本发明的多肽的残基1到12、1到13、1到14、1到15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、1到34、1到35、1到36、1到37、1到38、1到39、1到40、1到41、1到42、1到43、1到44、1到45、1到46、1到47、1到48、1到49、1到50所示的序列。

本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信号序列(SPs)和/或前原序列可以是分离的肽、或与另一转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或者非转移酶，例如非转氨酶，例如非d-氨基酸转移酶，和/或非氧化还原酶，例如非脱氢酶，例如非d-氨基酸脱氢酶多肽连接的序列，例如作为融合(嵌合)蛋白。在一方面，本发明提供包括本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信号序列的多肽。在一方面，包括本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信号序列SPs和/或前原序列的多肽包括与本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶异源的序列(例如，包括本发明的SP和/或前原序列和来自另一转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或者非转移酶，例如非转氨酶，例如非d-氨基酸转移酶，和/或非氧化还原酶，例如非脱氢酶，例如非d-氨基酸脱氢酶多肽蛋白的序列的融合蛋白)。在一方面，本发明提供具有异源SP和/或前原序列如具有酵母信号序列的序列的本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可包括在载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中含有异源SP和/或前原序列。

在一个方面，本发明的SP和/或前原序列在鉴定新的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶多肽之后被鉴定出来。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路(protein targeting pathways)。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短氨基酸序列，称为信号序列。这种信号序列指引蛋白至其在细胞中的适合位置，并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列，这些信号序列标示着它们将转位至内质网腔内。已测定出这组中的蛋白的100多个信号序列。信号序列的长度可以从约10至50个氨基酸残基之间变化。识别信号序列的各种方法对于本领域技术人员是已知的。例如，在一个方面，新的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信号肽通过称为SignalP的方法来鉴定。SignalP应用了既可识别信号肽，又可识别其裂解位点的组合神经网络。参见，例如Nielsen(1997)"Identification of prokaryotic and eukaryoticsignal peptides and prediction of their cleavage sites."Protein Engineering 10:1-6。

可以理解的是，在一些方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以没有SP和/或前原序列，或“结构域”。一方面，本发明提供了缺少所有或部分的SP和/或前原结构域的本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。在一个方面，本发明提供了编码来自一种转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的信号序列(SP)和/或前原序列的核酸序列，其可操作地连接于不同的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的核酸序列，或者一方面(任选地)，可以期望来自非转移酶，例如非转氨酶，例如非d-氨基酸转移酶，和/或非氧化还原酶，例如非脱氢酶，例如非d-氨基酸脱氢酶蛋白的信号序列(SP)和/或前原结构域。

本发明也提供了分离的、合成的或重组的多肽，其包含本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)以及异源序列。所述异源序列是与SP、前原结构域和/或CD天然不相关的序列(例如与转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶天然不相关的序列)。与SP、前原结构域和/或CD天然不相关的序列可以在SP、前原结构域和/或CD的氨基末端、羧基末端，和/或SP和/或CD的两个末端上。在一个方面，本发明提供了分离的、合成的或重组的多肽，其包含(或组成为)含有本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)的多肽，条件是它不连接与其天然相关的任何序列(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列)。类似地，在一个方面，本发明提供了编码这些多肽的分离的、合成的或重组的核酸。因此，在一个方面，本发明的分离的、合成的或重组的核酸包括本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)的编码序列以及异源序列(即，与本发明信号序列(SP)、前原结构域和/或催化结构域(CD)天然不相关的序列)。异源序列可在SP、前原结构域和/或CD编码序列的3’末端、5’末端和/或两个末端上。

杂合(嵌合)转移酶和/或氧化还原酶以及肽库

在一方面，本发明提供杂合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶和融合蛋白，包括肽库，其包含本发明的序列。本发明的肽库可以被用于分离靶的肽调节剂(例如，激活剂或抑制剂)，所述靶诸如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶底物、受体、酶。本发明的肽库可以被用于鉴别靶的形式结合伴侣，如配体，例如细胞因子、激素及类似物。在一方面，本发明提供嵌合蛋白，所述嵌合蛋白包含本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)或其组合以及异源序列(见上述)。

在一方面，本发明的融合蛋白(如肽部分)被构象稳定化(相对于线性肽)，从而允许其对靶具有较高的结合亲和力。本发明提供了本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶和其它肽的融合物，所述其它肽包括已知的和随机的肽。它们可以以这样的方式融合：转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的结构没有被显著地干扰，并且所述肽在代谢上或结构构象上是稳定的。这使得能够产生这样的肽文库，即该肽文库在细胞内的存在和其数量可容易被监测。

本发明的氨基酸序列变体可以通过预先确定的变异的性质来表征，所述预先确定的变异的性质是使它们与天然存在的形式区分开的特征，例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶序列的等位基因的或种间的变异。在一方面，本发明的变体显示出与天然存在的类似物相同性质的生物活性。可选地，可以选择具有改良特性的变体。在一方面，尽管引入氨基酸变异的位点或区域是预先确定的，但该突变本身不需要被预先确定。例如，为了最优化在给定位点的突变性能，可以在靶密码子或区域进行随机诱变并且筛选表达的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶变体，以寻求期望活性的最佳组合。在具有已知序列的DNA中的预定位点进行置换突变的技术是熟知的，如本文描述的，例如M13引物诱变和PCR诱变。可以使用例如转氨酶和/或氧化还原酶活性分析方法来进行突变体的筛选。在可选的方面，氨基酸置换可以是单个残基；插入可以是大约1到20个氨基酸的水平，尽管可以进行大得多的插入。缺失的范围可以在大约1到大约20、30、40、50、60、70个残基或更多残基。为了获得具有最佳特性的最终衍生物，置换、缺失、插入或其任何组合可以被使用。一般地，这些改变在少数氨基酸上进行，以使分子的改变最小化。然而，在某些情况下可以容忍较大的改变。

本发明提供了转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，其中多肽骨架结构、二级或三级结构，如α-螺旋或β-折叠结构，已经被修饰。在一方面，电荷或疏水性已经被修饰。在一方面，侧链大小已经被修饰。通过选择较不保守的置换来产生功能或免疫特性的实质变化。例如，可以进行这样的置换，它们将更加显著地影响：发生变化的区域的多肽骨架的结构，例如α螺旋或β折叠结构；分子的电荷或疏水位点，其可以是活性位点；或侧链。本发明提供了在本发明的多肽中的置换，其中(a)亲水残基，例如丝氨酰或苏氨酰，被疏水残基例如亮氨酰、异亮氨酰、苯丙氨酰、缬氨酰或丙氨酰置换(或者相反)；(b)半胱氨酸或脯氨酸被任何别的残基置换(或者相反)；(c)具有正电性侧链的残基，例如赖氨酰、精氨酰或组氨酰被带负电的残基，例如谷氨酰或天冬氨酰置换(或者相反)；或者(d)具有大体积侧链的残基，例如苯丙氨酸，被不具侧链的氨基酸例如甘氨酸置换(或者相反)。所述变体可以表现出相同性质的生物学活性(即，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性)，尽管变体可被选择以根据需要改变转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的特征。

在一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶包括表位或纯化标记、信号序列或其它的融合序列等。在一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以与随机的肽融合，形成融合多肽。“融合”或者“可操作地连接”在此是指随机肽和转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶连接在一起，其连接方式对结构稳定性的破坏最小，例如，其仍保持转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性。所述的融合多肽(或者编码该融合多肽的融合多核苷酸)也可以包含进一步的成分，包括在多个环处的多个肽。

在一方面，肽和编码它们的核酸被随机化，或者是被完全随机化，或者在它们的随机化中有偏向，例如，在核苷酸/残基的总的频率或者每个位置的频率方面有偏向。“随机化”是指每一核酸和肽分别由基本上随机的核苷酸和氨基酸组成。在一方面，产生肽的核酸可以化学合成，并且因此可以在任何位置整合任何核苷酸。因此，当核酸被表达而形成肽时，任何氨基酸残基可以被整合在任何位置。可以设计合成过程来产生随机化的核酸，从而允许在核酸的长度范围内形成所有的或大多数的可能组合，由此形成随机核酸文库。该文库可以提供结构上充分多样的随机化表达产物群体，从而影响概率上充分的细胞响应范围，以提供一种或多种表现出期望响应的细胞。因此，本发明提供了一个足够大的相互作用文库，以使其成员中的至少一个将具有使其对一些分子、蛋白或者其他因子有亲和性的结构。

转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶是一方面(任选地)由信号肽、结合结构域、催化结构域、连接体和/或另一催化结构域组成的多结构域酶。

本发明提供了产生可以编码生物学活性杂合多肽(例如，杂合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)的嵌合多肽的方法。在一方面，原始的多核苷酸编码生物学活性多肽。本发明的方法通过利用细胞加工产生新的杂合多肽，所述细胞加工整合原始多核苷酸序列，使得得到的杂合多核苷酸编码显示源自原始生物学活性多肽的活性的多肽。例如，原始的多核苷酸可以编码来自不同微生物的特定酶。由来自一个生物体的第一多核苷酸编码的酶、或变体可以例如在特定的环境条件下，例如高盐条件下，有效地发挥功能。由来自不同生物体的第二多核苷酸编码的酶、或变体可在不同的环境条件下，如超高温条件下有效地发挥功能。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸可以编码这样的酶，所述酶显示出由原始多核苷酸编码的两种酶的特性。因此，由杂合多核苷酸编码的酶可在第一和第二多核苷酸编码的每一种酶所共有的环境条件下，例如高盐和极端温度下有效地发挥功能。

由本发明的方法得到的杂合多肽可显示出在原始酶中不具有的特异酶活性。例如，在编码转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性的多核苷酸重组和/或还原性重配后，从由杂合多核苷酸编码的所得杂合多肽中可筛选由每个原始酶获得的特异转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性，即，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶作用的键的类型以及转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶发挥作用的温度。因此，例如所述转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被筛选以确定那些可区分杂合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶与原始转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的化学官能度，如：在不同的温度、pH或盐浓度下活性差别。

原始多核苷酸的来源可以分离自个体生物体(“分离物”)、已经在确定的培养基中生长的生物体收集物(“富集培养物”)、或者未经培养的生物体(“环境样品”)。应用不依赖于培养物的方法从环境样品获得编码新的生物活性的多核苷酸是最优选的，因为其使得能够接近具有生物多样性的未被利用的来源。

“环境文库”可以从环境样品产生，其代表天然存在的生物体的基因组集合，其存储于可以在适合的原核宿主中繁殖的克隆载体中。因为被克隆的DNA起初是直接从环境样品提取的，所以所述文库并不限于可以在纯培养物中生长的小部分原核生物。另外，存在于这些样品中的环境DNA的标准化使其可以更加公正地代表来自存在于原始样品的所有物种的DNA。这可以大大增加从所述样品的次要组成中发现令人感兴趣的基因的效率，所述次要组成与优势种相比，其所代表的可能小几个数量级。

例如，从一个或者多个未经培养的微生物中获得的基因文库被筛选以发现感兴趣的活性。编码感兴趣的生物活性分子的潜在途径首先在原核细胞中以基因表达文库的形式捕获。编码令人感兴趣的活性的多核苷酸从这样的文库中分离出来并导入到宿主细胞中。该宿主细胞在促进重组和/或还原性重配的条件下生长，产生潜在的具有新的或者增强活性的活性生物分子。

此外，可进行亚克隆以进一步分离感兴趣的序列。在亚克隆中，DNA的一部分被扩增、消化——通常是通过限制性酶——以切割所需的序列，所需的序列被连接进接受载体中，并被扩增。在亚克隆的每个步骤中，该部分被检测感兴趣的活性，以保证编码结构蛋白的DNA不被排除。插入物可在亚克隆的任何步骤中被纯化，例如，在连接入载体之前通过凝胶电泳，或在含有接受载体的细胞和不含有接受载体的细胞被置于选择性培养基中时，所述培养基含有例如抗生素，其可杀死不含有接受载体的细胞。将cDNA插入物亚克隆进载体中的具体方法在本领域中是熟知的(Sambrook等人，Molecular Cloning:A Laboratory Mannual，第二版，Cold Spring Harbor Laboratory Press(1989))。在另一方面，本发明的酶是亚克隆。这种亚克隆与亲代克隆的差别在于，例如，长度、突变、标志物(tag)或标记(label)。

可以从其制备多核苷酸的微生物包括原核微生物，如真细菌(Eubacteria)和古细菌(Archaebacteria)以及低等真核微生物如真菌、一些藻类和原生动物。多核苷酸可以分离自环境样品，在这种情况下，核酸可以被回收而不需培养某一种生物体，或者是从一种或者多种培养的生物中回收。在一方面，这样的微生物可以是适于极端环境的，如，嗜高温的、嗜冷的、兼性嗜冷菌(psychrotroph)、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的酶的多核苷酸可以被应用。这样的酶可以在地表温泉和深海的热火山口中在超过100℃的温度发挥作用，在北极的水域中在低于0℃的温度起作用，在死海的饱和的盐环境下起作用，在煤层沉积物和地热富硫矿泉中在pH值在0附近起作用，或者在污水污泥中在pH值超过11下起作用。例如，从极端微生物中克隆和表达的几种酯酶和脂肪酶在很宽的温度和pH范围内表现出高活性。

如上所述选择和分离的多核苷酸被导入进合适的宿主细胞中。合适的宿主细胞是能够促进重组和/或还原性重配的任何细胞。被选择的多核苷酸优选已经在包括有合适的控制序列的载体中。宿主细胞可以是高等的真核细胞，如哺乳动物细胞，或低等真核细胞，如酵母细胞，或优选地，宿主细胞可以是原核细胞，如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染，或电穿孔来实现(Davis等人，1986)。

作为合适宿主的代表性例子，可能被提及的有：细菌细胞，如大肠杆菌、链霉菌(Streptomyces)、鼠伤寒沙门氏菌(Salmonella typhimurium)；真菌细胞，如酵母；昆虫细胞如果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)；动物细胞如CHO、COS或者黑色素瘤细胞；腺病毒和植物细胞。通过本文的教导，适合宿主的选择被认为是在本领域技术人员的范围内。

特别提及可以用于表达重组蛋白的各种哺乳动物细胞培养系统，哺乳动物表达系统的例子包括猴肾成纤维细胞的COS-7系，其在“SV40-transformed simian cellssupport the replication of early SV40mutants”(Gluzman,1981)中有说明，和其它的能够表达相容性载体的细胞系，例如，C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子，以及任何必要的核糖体结合位点、多聚腺苷酸化位点、剪接供体和受体位点、转录终止序列，以及5’侧翼的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以被用于提供所需的非转录的遗传学元件。

在另一方面，预见本发明的方法可以被用于产生编码来自一个或者多个操纵子或者基因簇或者其部分的生物化学途径的新的多核苷酸。例如，细菌和许多真核生物具有用于调控基因的协作机制，所述基因的产物参与相关的过程。基因成簇排列在单一染色体上，在结构上称为“基因簇”，并且它们在单个调控序列的控制下一起转录，所述调控序列包括起始整个簇的转录的单个启动子。因此，基因簇是一组或者相同或者相关的相邻基因，一般是指功能上相同或相关。通过基因簇编码的生物化学途径的一个例子是聚酮化合物(polyketides)。

基因簇DNA可以从不同的生物体中分离出来并且连接到载体中，尤其是含有表达调控序列的载体，所述表达控制序列可以控制和调控可检测蛋白或者来自所连接的基因簇的蛋白相关系列活性的产生。对于外源DNA引入具有非常大的容量的载体的应用特别适合用于这样的基因簇，在这里通过包括大肠杆菌的f-因子(或者致育因子)的例子加以描述。该大肠杆菌的f-因子是一种质粒，在接合过程中它能实现自身的高频率转移，f-因子对于获得和稳定扩增大的DNA片段，如来自混合的微生物样品的基因簇是理想的。本发明的一个方面是使用被称作“F-质粒(Fosmid)”的克隆载体，或者细菌人工染色体(BAC)载体。它们源于大肠杆菌f因子，能够稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时，这就有可能得到稳定的“环境DNA文库”形式的大的基因组片段。用于本发明的另一类型的载体是黏粒载体。黏粒载体最初是设计用来克隆和扩增基因组DNA的大片段。进入黏粒载体的克隆在Sambrook等,MolecularCloning:A Laboratory Mannual，第二版，Cold Spring Harbor Laboratory Press(1989)中有详细说明。一旦连接到适当的载体，含有不同的聚酮化合物合成酶基因簇的两个或者更多个载体可以被引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选，以寻找在起初的基因簇中没有发现的增强的活性。

因此，在一方面，本发明涉及用于产生具有生物活性的杂合多肽以及筛选具有增强活性的这样的多肽的方法，通过：

1)以可操纵的连接导入至少第一多核苷酸和以可操纵的连接导入第二多核苷酸到合适的宿主细胞中，所述的至少第一多核苷酸和第二多核苷酸共有具有部分序列同源性的至少一个区域；

2)在促进序列再组织的条件下培养宿主细胞，得到可操纵连接的杂合多核苷酸；

3)表达由所述杂合多核苷酸编码的杂合多肽；

4)在有利于鉴定增强的生物活性的条件下筛选所述的杂合多肽；和

5)分离编码该杂合多肽的多核苷酸。

筛选各种酶活性的方法对于本领域技术人员是已知的并且在整个本说明书中被讨论。当分离本发明的多肽和多核苷酸时，可以采用这些方法。

筛选方法和“在线”监控设备

在实践本发明的方法中，多种仪器和方法可以与本发明的多肽和核酸一起使用，例如，用来筛选多肽的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性，用来筛选作为转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性的潜在调节剂的化合物，诸如激活剂或抑制剂，用来筛选与本发明的多肽结合的抗体、与本发明的核酸杂交的核酸，用来筛选表达本发明的多肽的细胞，等等。除了下面详细描述的用于筛选样品的阵列形式以外，也可使用可选形式来实施本发明的方法。这样的形式包括，例如质谱仪、色谱仪，例如，高通量HPLC和其它形式的液相色谱，和更小的形式，如1536-孔板、384-孔板等等。高通量筛选仪器可被改装并用来实施本发明的方法，见美国专利申请20020001809。

毛细管阵列

本发明的核酸或多肽可被固定或应用于阵列上。阵列可用来筛选或监测组合物(例如，小分子、抗体、核酸等)的文库，以发现它们结合本发明的核酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列，如GIGAMATRIX^TM,戴弗萨公司(Diversa Corporation),San Diego,CA；和描述在例如美国专利申请20020080350Al；WO 0231203A；WO 0244336A中的阵列，提供了容纳和筛选样品的可供选择的装置。在一方面，毛细管阵列包括多个毛细管，它们形成相互邻接的毛细管的阵列，其中每个毛细管含有至少一个壁，其限定了一个用以保留样品的腔。这个腔可以是圆柱形的、正方形的、六边形的或其它任何几何形状，只要其壁能够形成腔以保留液体或样品。毛细管阵列的毛细管可相互靠近联合在一起形成平面结构。毛细管可通过融合(例如，当毛细管由玻璃制成时)、粘合、键合或面对面的夹合而结合在一起。此外，毛细管阵列可以包括在阵列中相邻毛细管之间放置的间质材料(interstitial material)，从而形成含有多个穿通孔(through-holes)的固体平面装置。

毛细管阵列可由任何数量的单个毛细管形成，例如，100至4,000,000个毛细管。进一步，具有大约100,000或更多个单个毛细管的毛细管阵列可形成标准大小和形状的板，其适合于标准的实验室设备。通过利用毛细作用或使用细针的微注射，人工或自动地将腔充满。随后可以从单个毛细管中移出感兴趣的样品用于进行进一步的分析或表征。例如，安置细的针状探头，使其与选择的毛细管流体连通，从而可以向腔内加入材料或从腔中撤回材料。

在单区筛选分析(single-pot screening assay)中，分析组分在插入到毛细管阵列中之前被混合在一起，产生目的溶液。当至少一部分阵列被浸入感兴趣的溶液中时，通过毛细作用充满腔。在每个毛细管中的化学或生物学反应和/或活性被监测，以发现可检测事件。可检测事件常常被称为“命中事件(hit)”，其常常可以通过光学检测与产生“非命中事件(non-hit)”的毛细管区分开来。因此，毛细管阵列可大量地并行检测“命中事件”。

在多区筛选分析(multi-pot screening assay)中，多肽或核酸，例如，配体可被导入进第一组分中，该组分被导入进毛细管阵列的至少一部分毛细管中。然后可将气泡引入进第一组分后面的毛细管中。然后将第二组分导入进毛细管内，其中所述的第二组分与第一组分通过气泡相隔。然后可通过在毛细管阵列的两侧施加静水压挤破气泡将第一和第二组分混合在一起。然后监测毛细管阵列中由两个组分的反应或非反应而导致的可检测事件。

在结合筛选分析(binding screening assay)中，目标样品可作为用可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中，其中为了使可检测颗粒与腔结合，毛细管的腔涂覆了结合材料。然后第一液体可从毛细管中移去，其中结合的可检测颗粒仍保留在毛细管内，可以将第二液体导入进毛细管内。然后监测毛细管中由颗粒与第二液体的反应或非反应而导致的可检测事件。

阵列或“生物芯片”

本发明的核酸和/或者多肽可以固定于或者应用于阵列，例如“生物芯片”。可以应用阵列来筛选或者监测组合物(例如，小分子、抗体、核酸等等)的文库，所述筛选或者监测是针对它们结合本发明的核酸或多肽或者调控本发明的核酸或多肽的活性的能力。例如，在本发明的一个方面，一个被监测的参数是转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶基因的转录体表达。细胞的一种或多种或所有的转录体可以通过包含细胞转录体、或代表细胞转录体的核酸、或与细胞转录体互补的核酸的样品的杂交，通过与阵列或“生物芯片”上的固定化核酸的杂交来测定。通过在微型芯片上应用核酸“阵列”，细胞的一些或所有的转录体可以同时被定量。可选择地，包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。本发明可以用任何已知的“阵列”进行实践，所述“阵列”也被称为“微阵列”或“核酸阵列”或“多肽阵列”或“抗体阵列”或“生物芯片”，或者它们的变型。阵列一般是多个“点”或者“靶元素”，每一个靶元素包括确定数量的一种或多种生物分子，例如，固定于基材表面的确定区域、用于特异结合样品分子如mRNA转录体的寡核苷酸。

如本文所用，术语“阵列”或“微阵列”或“生物芯片”或“芯片”是多个靶元素，每个靶元素包括固定在基材表面限定区域上的限定量的一种或多种多肽(包括抗体)或核酸，如下面进一步详细论述的那样。

在实践本发明的方法中，任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地并入，或者引入它们的变型，例如在下列文献中描述的：美国专利6,277,628、6,277,489、6,261,776、6,258,606、6,054,270、6,048,695、6,045,996、6,022,963、6,013,440、5,965,452、5,959,098、5,856,174、5,830,645、5,770,456、5,632,957、5,556,752、5,143,854、5,807,522、5,800,992、5,744,305、5,700,637、5,556,752、5,434,049；也参见，例如WO 99/51773、WO 99/09217、WO 97/46313、WO 96/17958；也参见，例如Johnston(1998)Curr.Biol.8:R171-R174；Schummer(1997)Biotechniques 23:1087-1092；Kern(1997)Biotechniques 23:120-124；Solinas-Toldo(1997)Genes,Chromosomes&Cancer 20:399-407；Bowtell(1999)Nature Genetics Supp.21:25-32。也参见公开的美国专利申请号20010018642、20010019827、20010016322、20010014449、20010014448、20010012537、20010008765。

抗体和基于抗体的筛选方法

本发明提供了分离的、合成的或重组的抗体，其特异地结合本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。这些抗体可以用于分离、鉴定或量化本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶或相关的多肽。这些抗体可以用于分离本发明范围内的其它多肽，或其它相关的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。抗体可以被设计成结合转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的活性位点。因此，本发明提供了使用本发明的抗体抑制转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的方法(参见上文关于本发明的抗转移酶，例如抗转氨酶，例如抗d-氨基酸转移酶，和/或抗氧化还原酶，例如抗脱氢酶，例如抗d-氨基酸脱氢酶组合物的应用的论述)。

本发明提供本发明的酶片段，包括本发明多肽的免疫原性片段。本发明提供包含本发明多肽或肽和佐剂或载体以及类似物的组合物。

所述抗体可以在免疫沉淀、染色、免疫亲合柱等等中被应用。如果需要的话，编码特异抗原的核酸序列可以通过免疫产生，随后分离多肽或核酸，进行扩增或克隆，并且将多肽固定在本发明的阵列上。可选择地，本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构，如，抗体的亲和性可以被增加或降低。而且，制备或修饰抗体的能力可以是通过本发明方法改造到细胞中的表型。

术语“抗体”包括由一个免疫球蛋白基因或多个免疫球蛋白基因衍生(derived)、仿造(modeled after)或基本上由之编码的肽或多肽或者其片段，它们能特异地结合抗原或表位，见例如，Fundamental Immunology，第三版，W.E.Paul,ed.,RavenPress,N.Y.(1993)；Wilson(1994)J.Immunol.Methods 175:267-273；Yarmush(1992)J.Biochem.Biophys.Methods 25:85-97。术语抗体包括结合抗原的部分，即，保留与抗原结合的能力的“抗原结合位点”(例如，片段、子序列、互补决定区(CDRs))，包括(i)Fab片段，由VL、VH、CL和CH1结构域组成的单价片段；(ii)F(ab’)2片段，包括在铰链区由二硫键连接的两个Fab片段的二价片段；(iii)由VH和CH1结构域组成的Fd片段；(iv)由抗体单臂的VL和VH结构域组成的Fv片段；(v)由VH结构域组成的dAb片段(Ward等,(1989)Nature 341:544-546)；和(vi)分离的互补决定区(CDR)。单链抗体也被包括在术语“抗体”中。

免疫、产生和分离抗体(多克隆抗体和单克隆抗体)的方法是本领域技术人员已知的，并且在科学和专利文献中有描述，参见，如Coligan,CURRENT PROT℃OLS IN IMMUNOLOGY,Wiley/Greene,NY(199l)；Stites(eds.)BASIC ANDCLINICAL IMMUNOLOGY(第7版)Lange Medical Publications,Los Altos,CA(“Stites”)；Goding，MON℃LONAL ANTIBODIES：PRINCIPLES AND PRACTICE(第2版)Academic Press,New York,NY(1986)；Kohler(1975)Nature 256:495；Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold Spring HarborPublications,New York。除了使用动物的传统的体内方法外，抗体也可以在体外产生，例如，应用表达重组抗体结合位点的噬菌体展示文库。参见如，Hoogenboom(1997)Trends Biotechnol.15：62-70；Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26：27-45。

本发明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段，也可以被用于产生与所述多肽或片段特异结合的抗体。得到的抗体可应用于免疫亲和层析方法，以分离或纯化多肽，或确定多肽是否存在于生物样品中。在这样的方法中，蛋白质制备物，如提取物，或生物样品与能够同本发明的多肽之一或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段特异结合的抗体接触。

在免疫亲和步骤中，抗体被连接到固态支持物，如珠子或其它柱基质。在抗体特异性结合本发明的一种多肽或其片段的条件下，蛋白质制备物被置于与抗体接触。经清洗去除非特异性结合的蛋白质之后，特异性结合的多肽被洗脱。

在生物样品中蛋白质结合抗体的能力可以通过使用本领域技术人员所熟悉的各种方法中的任何一种来确定。例如，结合可以通过用可检测标记物，例如荧光试剂、酶标记或放射性同位素标记抗体来确定。可选择地，抗体与样品的结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分析、放射免疫分析以及蛋白质印迹法。

针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个或更多个连续氨基酸的片段产生的多克隆抗体可通过直接将多肽注射进动物中或通过将多肽给予动物，例如非人动物而获得。这样获得的抗体然后可结合多肽本身。以这种方式，甚至仅编码多肽的片段的序列也可用来产生可与整个天然多肽结合的抗体。这种抗体然后可用来从表达多肽的细胞中分离多肽。

为了制备单克隆抗体，可使用提供通过连续细胞系培养产生的抗体的任何技术。实例包括杂交瘤技术(Kohler和Milstein,Nature,256:495-497,1975)、三体瘤技术、人B-细胞杂交瘤技术(Kozbor等人，Immunology Today 4:72,1983)和EBV-杂交瘤技术(Cole等人,1985,Mon℃lonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,pp.77-96)。

描述用于产生单链抗体的技术(美国专利4,946,778)可被改动，以使之适于产生本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的单链抗体。可选择地，转基因小鼠可用来表达这些多肽或其片段的人源化抗体。

产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的抗体可被用于筛选来自其它生物体和样品的类似多肽。在这样的技术中，来自生物体的多肽与抗体接触，并且检测可与抗体特异性结合的那些多肽。上述的任何方法可用来检测抗体的结合。一种这样的筛选试验在“Methods for Measuring Cellulase Activities”,Methods in Enzymology,Vol160,pp.87-116中描述。

试剂盒

本发明提供了包含组合物，如本发明的核酸、表达盒、载体、细胞、转基因种子或植物或植物部分、多肽(如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)和/或抗体的试剂盒。试剂盒还可以含有教导本发明的方法学以及工业、研究、医学、药学、食物及饲料和食物及饲料补充物加工以及其它应用及加工的说明性材料，如在此所述的。

全细胞工程改造和测定代谢参数

本发明的方法提供了细胞的全细胞进化或全细胞工程改造，以通过修饰细胞的遗传组成开发出具有新表型，如新的或修饰的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性的新细胞株。可以通过将本发明的核酸，如本发明的酶的编码序列加入到细胞而修饰遗传组成。如参见WO0229032；WO0196551。

为了检测新的表型，在“实时”或者“在线”的时间范围内在细胞中监测被修饰的细胞的至少一种代谢参数。在一方面，多个细胞，如细胞培养物被“实时”或者“在线”监测。在一方面，“实时”或者“在线”监测多个代谢参数。代谢参数可以应用本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶进行监测。

代谢流分析(MFA)是以已知的生物化学框架为基础。以质量守恒定律和关于细胞内代谢的假稳态假说(PSSH)为基础，构建线性独立代谢矩阵。在实践本发明的方法时，建立代谢网络，包括：

·所有途径底物、产物和中间代谢物的特性；

·使途径代谢物互变的所有化学反应的特性，途径反应的化学计量学；

·催化反应的所有酶的特性，酶反应动力学；

·途径组分之间的调控性相互作用，如变构效应相互作用，酶-酶相互作用等；

·酶或者酶的任何其它超大分子组织在细胞内的区室化，以及

·任何浓度梯度的代谢物、酶或者效应分子的存在，或者它们运动的扩散障碍。

一旦针对给定的细胞株建立了代谢网络，如果在线代谢数据可用，通过矩阵概念的数学显示可以被引入以评估细胞内的代谢流。代谢表型取决于细胞内整个代谢网络的变化。代谢表型取决于途径利用相对于环境条件、遗传调控、发育状态和基因型等等的变化。在本发明方法的一些方面，在在线MFA计算之后，通过研究途径利用来分析细胞的动力学行为、它们的表型和其它性质。例如，在酵母发酵中，如果葡萄糖供应增加，氧气减少，呼吸途径的利用将会被降低和/或者停止，而发酵途径的利用将占优势。在途径分析之后，细胞培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导物的使用等来控制细胞的生理状态沿着所需的方向进行，本发明的方法可以帮助确定如何操纵发酵。在实践本发明的方法时，MFA结果也可以与转录体组(transcriptome)和蛋白质组(proteome)的数据比较，以设计用于代谢工程改造或基因重排等等的实验和方案。

在实践本发明的方法时，可以产生和检测任何经修饰的或者新的表型，包括在细胞中新的或者改进的特征。可以监测代谢或生长的任何方面。

监测mRNA转录体的表达

在本发明的一个方面，工程化的表型包括增加或者降低mRNA转录体(如，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶信息)的表达或者在细胞中产生新的(如，转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)转录体。这一增加或减少的表达可以通过测定本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的存在，或者通过转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性分析来追踪。mRNA转录体或信息也可以通过本领域已知的任何方法来检测或者定量，包括，例如Northern印迹、定量扩增反应、杂交至阵列以及类似的方法。定量扩增反应包括如定量PCR，包括如定量反转录聚合酶链式反应或RT-PCR；定量实时RT-PCR，或“实时动力学RT-PCR”(参见Kreuzer(2001)Br.J.Haematol.114:313-318；Xia(2001)Transplantation 72：907-914)。

在本发明的一个方面，工程化的表型通过敲除同源基因的表达来产生。可以敲除所述基因的编码序列或者一个或多个转录控制元件，如启动子或增强子。这样，转录体的表达可以完全去除或者仅被降低。

在本发明的一个方面，工程化的表型包括增加同源基因的表达。这可以通过敲除负调控元件或者诱变正调控元件而实现，负调控元件包括以顺式或者反式起作用的转录调控元件。细胞的一种或多种或所有的转录体可以通过包含细胞转录体、或代表细胞转录体的核酸、或与细胞转录体互补的核酸的样品的杂交，通过与阵列上的固定化核酸的杂交来测定。

监测多肽、肽和氨基酸的表达

在本发明的一个方面，工程化的表型包括增加或者降低多肽(如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)的表达或者在细胞内产生新的多肽。这一增加或者减少的表达可以通过确定存在的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的量，或者通过转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性分析来追踪。也可以通过本领域任何已知的方法来检测并定量多肽、肽和氨基酸，所述方法包括如核磁共振(NMR)、分光光度法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)、超扩散色谱，各种免疫学方法，如免疫沉淀、免疫扩散、免疫电泳、放射性免疫分析(RIAs)、酶联免疫吸附分析(ELISAs)、免疫荧光分析，凝胶电泳(如，SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热解质谱、傅立叶变换红外光谱、拉曼光谱、GC-MS和LC-电喷以及cap-LC-串联-电喷质谱，以及类似的方法。应用这些方法或者它们的变化也可以筛选新的生物活性，在美国专利6,057,103中有描述。而且，如下面详细论述的那样，可以应用蛋白阵列测定细胞的一种或者多种或者所有的多肽。

工业、能源、药学、医学、食品加工和其它应用

本发明的多肽可以用于任何工业、农业、食物及饲料和食物及饲料补充物加工、药物(pharmaceutical)(药品(drug))、医学、研究(实验室)或其它过程。本发明提供了应用本发明的酶的工业过程，例如在药物或营养(饮食)补充物工业、能源工业(例如，制造“清洁”生物燃料)中，在食品和饲料工业中，例如在制造食品和饲料产品和食品和饲料添加剂的方法中。在一方面，本发明提供了在医疗工业中应用本发明的酶，例如制造药物(药品)、药物(药品)前体或中间体或饮食辅助剂或补充物，或食物补充物和添加剂的过程。此外，本发明提供了应用本发明的酶生产生物燃料的方法，所述生物燃料包括例如生物醇，如生物乙醇、生物甲醇、生物丁醇或生物丙醇，因而包含“清洁的”燃料生产。

本发明的转移酶，其可具有任何转氨酶活性，例如d-氨基酸转移酶或ω-转氨酶活性，例如催化将ω-胺转化成酮。本发明的转移酶还可具有氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶活性。本发明的酶可以是高度选择性催化剂。它们能够以灵敏的立体选择性、区域选择性和化学选择性催化反应，这些是传统合成化学无法比拟的。例如，本发明的酶可具有ω-转氨酶活性，其可包括催化将手性ω-胺转化成酮。

本发明的酶可以是非常多用的。例如，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被“修改”(例如序列修饰或以其它方式修饰，例如糖基化)以在有机溶剂中发挥作用，在极端pH(例如，高pH和低pH)、极端温度(例如，高温和低温)、极端盐度水平(例如高盐度和低盐度)中作业，并且催化与结构上和其天然的、生理学底物无关的化合物的反应。

在一方面，本发明的转氨酶和/或氨基转移酶被用在药物、杀虫剂或其中间体的制造中的有机合成反应的过程中。在一实施方式中，本发明的转氨酶和/或氨基转移酶被用作检测响应于病理或生物学过程例如肝损伤/疾病或心肌梗塞的蛋白转换的靶。在采用本发明的酶的一示例性转氨反应中，α-氨基基团被转移到产生氨基酸的相应α-酮酸类似物的α-酮戊二酸的α-碳原子。

天然和非天然氨基酸合成

本发明的酶可被用于产生所有天然和各种非天然氨基酸，包括L-和/或D-氨基酸，其可被用于例如工业或药物(药品)产品和/或药物(药品)前体和/或中间体，诸如甜味剂、抗生素、肽酶和肽激素。例如，阿力甜(alitame)(例如ACLAME^TM)、短杆菌酪肽A、放线菌素D、青霉素N和头孢菌素C，以及环孢菌素A分别包括D-丙氨酸和D-苯丙氨酸、D-缬氨酸、D-α氨基戊酸、D-α氨基戊酸(aminoavalerate)和D-丙氨酸，采用本发明的酶制备。在一方面，本发明的酶被用在头孢菌素C向戊二酰基-7-氨基头孢烷酸(GL-7ACA)的转化中，其对于头孢烯抗生素合成来说是有高价值的药物化学品。在通过利用本发明的氨基转移酶从头孢菌素C生产戊二酰基-7-氨基头孢烷酸的一个示例性方法中，本发明的酶被加入到包括头孢菌素C和D-氨基受体例如丙酮酸或α-酮戊二酸的底物混合物中以分别形成酮基-GL-7ACA和D-丙氨酸或D-谷氨酸。然后该混合物与过氧化氢反应，并且戊二酰基-7-氨基头孢烷酸作为产物被分离。参见例如美国专利号6,337,190。

本发明提供用于制备天然和非天然氨基酸的酶和方法。本发明的酶可与本领域已知的任何天然或非天然氨基酸合成方法一起使用；例如，在可选的实施方式中，利用本发明的酶的本发明的方法采用美国专利号(USPNs)6,197,558；6,180,374；4,518,692；和4,826,766中描述的方法合成天然或非天然氨基酸。例如，在一方面本发明提供这样的方法，其包括：在适合于产生第二氨基酸和丙酮酸的条件下使第一氨基酸、酮酸和本发明的转氨酶反应；在适合于产生不与转氨酶反应的化合物的条件下使丙酮酸与乙酰乳酸合酶反应，以及分离第二氨基酸。

在一方面，本发明的酶和方法被用于制备叔亮氨酸，其反过来可被用于药品/药物合成方法，例如，L-叔亮氨酸-2-吡啶基酰胺是制备基质金属蛋白酶抑制剂化合物的有用中间体，参见例如EP专利EP0822186。

本发明的酶和方法可被用于制备“非天然”氨基酸，诸如：

·β-氨基酸(β3和β2)

·同型-氨基酸

·环状氨基酸

·芳族氨基酸

·N-甲基氨基酸

·Pro和Pyr衍生物

·3-取代的丙氨酸衍生物

·甘氨酸衍生物

·环取代的Phe和Tyr衍生物

·线性核心氨基酸

·二氨基酸(二胺)

·鸟氨酸

·正亮氨酸

·苯基硒代半胱氨酸(参见美国专利申请公开号20070238152)

·取代的氨基酸(例如邻-、间-或对-取代的丙氨酸、苯丙氨酸、酪氨酸等)

·DAB(2,4-二氨基丁酸)

本发明的脂环族氨基酸(例如(顺式)-3-氨基双环[2.2.1]庚烷-2-羧酸；1-氨基-1-环丁烷羧酸；纯净(purum)1-氨基环己烷羧酸；顺式-2-氨基-1-环戊烷羧酸和类似物)酶和方法可与用于体内结合非天然氨基酸的方法联合使用，例如如美国专利申请公开号20070117184；20060234339；20060233744；20050272121；20050250183；20030082575中所述。

洗涤剂、消毒剂和清洁组合物

本发明提供用于例如清洁织物、洗盘碗、洗衣服、口腔清洁、假牙清洁和隐形眼镜的包含本发明一种或更多种多肽(例如转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)的清洁组合物诸如洗涤剂、消毒剂或清洁剂(清洁/清洗)组合物以及制备和应用这些组合物的方法。本发明中并入了制备和应用洗涤剂、消毒剂或清洁剂组合物的所有方法，参见例如美国专利6,413,928；6,399,561；6,365,561；6,380,147。洗涤剂、消毒剂或清洁剂组合物可以是一部分和两部分水性组合物、非水液体组合物、注塑固体、颗粒形式、微粒形式、压缩片剂、凝胶和/糊剂和浆液形式。本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶也可以被用作固体或液体形式的洗涤剂、消毒剂或清洁剂添加剂产品。这种添加剂产品意图补充或促进传统洗涤剂组合物的性能，并且可以在清洁过程的任何阶段被加入。

假定洗涤剂溶液具有期望的酶活性，那么实际的活性酶含量取决于洗涤剂、消毒剂或清洁剂组合物的制造方法并且该含量不是关键的。在一方面，在最终溶液中存在的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的量在每克所述洗涤剂组合物大约0.001毫克至0.5毫克的范围内。选择用于本发明的方法和产品中的具体的酶取决于最终应用的条件，包括产物的物理形式、使用pH、使用温度、以及待降解或改变的污物类型。酶可以被选择以提供用于任何给定的一组应用条件的最佳活性和稳定性。在一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶在大约4至大约12的pH范围内以及在大约20℃至大约95℃的温度范围内是有活性的。本发明的洗涤剂可以包括阳离子、半极性非离子或两性离子表面活性剂；或它们的混合物。

本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被配制成粉末状的和液体洗涤剂、消毒剂或清洁剂，其在按重量计大约0.01至大约5％(优选0.1％至0.5％)的水平具有4.0至12.0之间的pH。这些洗涤剂、消毒剂或清洁剂组合物也可以包括其它的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶和/或其它的酶，如木聚糖酶、纤维素酶、脂肪酶、酯酶、蛋白酶、或内切糖苷酶、内切-β-1,4-葡聚糖酶、β-葡聚糖酶、内切-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、过氧化氢酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、氧化还原酶、还原酶、氧化酶、差向异构酶、异构酶、消旋酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木葡聚糖酶、果胶乙酰酯酶、鼠李糖半乳糖醛酸聚糖乙酰酯酶、多聚半乳糖醛酸酶、鼠李糖半乳糖醛酸聚糖酶、半乳糖酶、果胶酸裂合酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。这些涤剂、消毒剂或清洁剂组合物也可以包括染料、着色剂、香味剂、漂白剂、缓冲剂、助洗剂、酶“促进剂”(参见例如美国专利申请20030096394)和稳定剂。

在一方面，本发明提供用于清洁或洗涤物体的访法，其包括在足以清洁或洗涤的条件下将物体与本发明的多肽接触。本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可被包括作为洗涤剂、消毒剂或清洁剂添加剂。织物柔软剂组合物可包括本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。

处理食品和食品加工

本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶在食品加工工业中具有大量的应用。例如，在一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶被用于改进从富油植物原料例如富油种子中提取油，例如，从大豆中提取豆油，从橄榄中提取橄榄油，从油菜籽提取油菜籽油和/或从葵花籽中提取葵花油。在另一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被用于分离植物细胞材料中的成分。

本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被用于制备水果或蔬菜汁、糖浆、提取物和类似物，以增加产率。本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被用于各种植物细胞壁来源的材料或废料，例如来自谷物、谷类、葡萄酒或果汁生产，或农业残余物如蔬菜皮、豆荚、甜菜浆、橄榄浆、马铃薯浆和类似物的酶促处理。本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被用于改变处理的水果或蔬菜的稠度和外观。本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被用于处理植物材料，从而促进包括食品的植物材料的加工，促进植物成分的纯化或提取。

在一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶被用于烘焙应用，例如饼干、面包和薄脆饼干。在一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶作为添加剂用在面团加工中。在本发明的另一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶还可以用于任何食品或饮料处理或者食品或饮料生产过程。在本发明的另一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被包含在任何食品或饮料组合物中。

饲料和食品或饲料或食品添加剂

本发明提供了应用本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶，处理饲料、食品、食品或饲料添加剂、食品或饲料补充物、或食物助剂的方法，动物包括哺乳动物(例如，人)、鸟类、鱼类等等。本发明提供了包含本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的饲料、食品、食品或饲料添加剂、食品或饲料补充物、或食物助剂。一方面，应用本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶处理饲料、食品、食品或饲料添加剂、食品或饲料补充物、或食物助剂，可以有助于饲料、食品、食品或饲料添加剂、食品或饲料补充物、或食物助剂中营养物，例如淀粉、蛋白质、糖等的利用。

本发明的饲料、食品、食品或饲料添加剂、食品或饲料补充物、或食物助剂可以是颗粒状的、丸状的或微粒形式，其可被包覆或未包覆。可选地，本发明的饲料、食品、食品或饲料添加剂、食品或饲料补充物、或食物助剂可以是稳定的液体组合物。这可以是水性的或基于油的浆液。参见例如美国专利6,245,546。

在另一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以通过在转基因饲料作物(如，例如，转基因植物、种子和类似物)，如谷类、谷物、玉米、大豆、油菜籽、羽扇豆和类似物中直接表达所述酶来供应。如上所论述，本发明提供了包含编码本发明多肽的核酸序列的转基因植物、植物部分和植物细胞。在一方面，所述核酸被表达，以使本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶以可回收的量产生。转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以从任何植物或植物部分回收。可选地，包含重组多肽的植物或植物部分可以被这样使用，用于提高食品或饲料的质量，例如，提高营养价值、适口性和流变特性，或者用来破坏抗营养因子。

出于许多不同的目的，可以对本发明的酶颗粒、丸粒、微粒施加涂层，如为了添加调味剂或营养补充物，为了在胃内条件下延缓营养和酶的释放，以及类似的目的。或者，可施加涂层来实现功能性的目的，例如在需要延缓酶从基质微粒的释放或控制酶将被释放的条件时。涂层材料的组分可以是这样的，其可选择性地被其敏感的试剂(如热、酸或碱、酶或其它化学物质)分解。可选择地是，对不同的这样的分解剂敏感的两种或更多种涂层可被连续地施加于基质颗粒。

本发明也涉及制备酶释放基质的方法。根据本发明，该方法包括提供基于谷类的基材的多个分散颗粒，其颗粒大小适合用作酶释放基质，其中所述颗粒包括由本发明的氨基酸序列或其至少30个连续氨基酸编码的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶。优选地，该方法包括将酶释放基质的颗粒压制或压缩成小粒，其可以通过造粒方法来完成。霉菌抑制剂和粘结剂，当被使用时，可在任何合适的时间被加入，并且可以以所需的比例与基于谷类的基材在将基于谷类的基材造粒之前混合。造粒机进料中的含水量可以在上面关于最终产物含水量所述的范围中，并且可以是大约14-15％。一方面，水分以酶的含水制剂的形式加入至原料中，使该原料达到此含水量。在造粒机中的温度可以用蒸汽达到大约82℃。造粒机可在任何条件下进行操作，使得对原料进行足够的操作以提供丸粒。对于从含酶组合物中去除水分来说，造粒方法本身是一个成本上有效的方法。

在一方面，造粒机在100磅/分钟的压力下，在82℃用1/8英寸×2英寸的模进行操作，以提供丸粒，然后其在造粒机的粉碎部件中被粉碎以提供多个分散颗粒，所述分散颗粒具有能够通过8目筛但是保留在20目筛上的颗粒大小。

本发明热稳定的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以用于本发明的丸粒。它们可以具有高的最适温度和高的耐热性，以使酶反应可以在迄今未进行的温度下完成。编码根据本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的基因(例如，如在本发明任何序列中示出的)可以被用于制备具有与本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的那些性质不同的性质(在最适pH、最适温度、耐热性、溶剂稳定性、比活性、对底物的亲和力、分泌能力、翻译速率、转录控制等方面)的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶(例如，应用如本文所述的GSSSM)。

废物处理

本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以用于各种其它工业应用，例如，用于废物处理。例如，在一方面，本发明提供了应用本发明转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的固体废物消化方法。该方法可以包括减少基本上未处理的固体废物的质量和体积。固体废物可在酶溶液(包括本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶)存在的情况下在控制的温度下用酶促消化方法进行处理。这导致没有因添加微生物引起的明显细菌发酵的反应。固体废物被转变为液化的废物和任何残余的固体废物。得到的液化废物可与所述的任何残余的固化废物分离。参见，例如美国专利5,709,796。

在本发明的另一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶也可以用于任何废物处理过程中。在本发明的另一方面，本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶可以被包含在任何废物处理组合物中。

口腔护理产品

本发明提供了包含本发明的转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶——包括本发明的酶混合物或“鸡尾酒”——的口腔护理产品。示例性的口腔护理产品包括牙膏、牙用乳膏(dentalcream)、凝胶或牙粉、洁齿剂(odontics)、漱口水、刷牙之前或之后的漱口制剂、口香糖、含片或糖果。参见，例如，美国专利6,264,925。

生物质转化和生物燃料生产

本发明提供应用本发明的酶——包括本发明的酶混合物或“鸡尾酒”在内，生物转化或任何有机原料向燃料，例如燃料，例如生物燃料如生物乙醇、生物甲醇、生物丙醇和/或生物丁醇以及类似物转化的方法和过程。因此，本发明提供燃料，例如生物燃料，如生物乙醇，其包含本发明的多肽——包括本发明的酶混合物或“鸡尾酒”在内，或本发明核酸编码的多肽。在可选的方面，所述燃料源自植物材料，其任选地包括马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗，以及任选地所述燃料包括生物乙醇或汽油-乙醇的混合。

本发明提供制造燃料的方法，其包括使生物质组合物或任何有机原料与本发明的多肽，或本发明核酸编码的多肽，或本发明制造的混合物或“鸡尾酒”或产品中任意一种接触。在可选的实施方式中，生物质组合物包括植物、植物产品或植物衍生物，以及植物或植物产品可以包括蔗糖植物或植物产品、甜菜(beets/sugarbeets)、小麦、玉米、大豆、马铃薯、大米或大麦。在一个方面，所述燃料包括生物乙醇或汽油-乙醇的混合物，或生物丙醇或汽油-丙醇的混合物，或生物丁醇或汽油-丁醇的混合物，或生物甲醇或汽油-甲醇的混合物，或生物柴油或汽油-生物柴油的混合物或其任意组合。

本发明提供制造生物乙醇、生物丁醇、生物甲醇和/或生物丙醇的方法，其包括使生物质组合物或任何有机原料与本发明的多肽，或本发明核酸编码的多肽，或本发明制造的混合物或“鸡尾酒”或产品中任意一种接触。在可选的实施方式中，生物质组合物包括植物、植物产品或植物衍生物，以及植物或植物产品可以包括蔗糖植物或植物产品、甜菜(beets/sugarbeets)、小麦、玉米、大豆、马铃薯、大米或大麦。在可选的实施方式中，有机原料或生物质源自农作物(例如小麦、大麦、马铃薯、柳枝稷、白杨木)，是食品或饲料生产的副产物，是木素纤维素废产物，或是植物残余物或废纸或废纸产品，并且任选地植物残余物包括茎、叶、壳、皮、玉米或玉米穗、玉米秸秆、玉米纤维、草、稻草(例如，稻草或麦秆)、甘蔗渣、甜菜浆、柑橘肉和柑橘皮；木材、木材碎屑、木片、木浆、废浆、废木材、木材刨花和锯屑、建筑和爆破废物和残片(例如木材、木材碎屑和锯屑)；并且任选地废纸包括废弃的或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸、报纸、杂志、纸板和基于纸的包装材料以及再利用纸原料。此外，可以使用城市废物，例如市政固体废物的纸部分、市政废木材以及市政绿色废物。

本发明提供组合物(包括制造的产品、酶整体(enzyme ensemble)或“鸡尾酒”)，其包含转移酶，例如转氨酶，例如d-氨基酸转移酶，和/或氧化还原酶，例如脱氢酶，例如d-氨基酸脱氢酶的混合物(或“鸡尾酒”)。

本发明提供了表达本发明的酶的细胞和/或生物(例如，其中所述细胞或生物包含作为异源核酸的本发明的序列)，用于参与涉及天然生物质(例如，植物)转化的化学循环。可选地，本发明的多肽可以在生物质植物材料或原料本身中表达。

本发明的方法也包括获得转化的生物质(例如，木质素纤维素)材料(由本发明的酶处理)并且通过发酵和/或通过化学合成使其成为燃料(例如，生物燃料，如生物乙醇、生物丁醇、生物甲醇、生物丙醇或生物柴油)。在一方面，所产生的糖类进行发酵和/或不可发酵的产物被气化。

本发明的方法也包括应用本发明的酶转化藻类、初级植物油(virgin vegetableoil)、废植物油、动物脂肪和软脂(例如，牛脂、猪油和黄色软脂)或污水，并且通过发酵和/或通过化学合成或转化使其成为燃料(例如生物醇类，例如生物乙醇、生物甲醇、生物丁醇或生物丙醇或生物柴油)。

本发明的酶(包括例如生物体，如微生物，例如真菌、酵母或细菌，以及植物和植物细胞及植物部分，例如种子，其产生并且在一些方面分泌本发明的重组酶)可以被用于或被包括/并入在任何有机物质/生物质转化过程的任何阶段，例如，在任何一个步骤、几个步骤，或者被包括在所有的步骤中，或所有下列生物质转化过程的方法中，或所有这些生物燃料替代品中：

直接燃烧：材料通过直接加热燃烧并且是最简单的生物质技术；如果生物质来源在附近，可能是非常经济的。

1热解：是在没有氧存在的情况下通过加热对生物质进行热降解。在一方面，生物质被加热至大约800到1400华氏度之间的温度，但是没有氧被引入以支持燃烧，导致气体、燃料油和炭的产生。

2气化：生物质可以被用于通过加热或厌氧消化产生甲烷。合成气，一氧化碳和氢的混合物，可以源自生物质。

掩埋气：通过填埋物中掩埋的垃圾腐败(厌氧消化)产生。有机废物在分解时，产生气体，所述气体由大约50％的甲烷组成，甲烷是天然气的主要成分。

厌氧消化：将有机物质转化为甲烷和二氧化碳的混合物，甲烷是天然气的主要成分。在一方面，生物质如废水(污水)、肥料或食品加工废物与水混合且在没有空气的情况下进料到消化罐中。

发酵

醇类发酵：燃料醇通过将纤维素物质和/或淀粉转化为糖，将糖发酵成醇类，然后通过蒸馏分离醇水混合物来产生。原料可以被转化为糖并且然后通过用酵母发酵转化为醇，所述原料如专用作物(例如，小麦、大麦、马铃薯、柳枝稷、白杨木)、农业残余物和废物(例如，水稻杆、玉米秸秆、小麦杆、甘蔗渣、稻壳、玉米纤维、甜菜浆、柑橘浆、柑橘皮)、林业废物(例如，硬木和软木屑、来自木材加工的硬木和软木残余物、木材刨花和锯屑)、城市废物(例如，城市固体废物的纸质部分、城市木材废物以及城市绿色废物)、木材废物(例如，锯木厂废物、纸浆厂废物、建筑废物、爆破废物、木材刨花和锯屑)、和废纸或包含糖、淀粉和/或纤维素的其它材料。可选地，包含糖的材料可以通过发酵被直接转化为醇类。

酯交换作用：将油转化为生物柴油的示例性反应称为酯交换作用。酯交换过程使醇(如甲醇)与包含在植物油、动物脂肪或再循环油脂中的甘油三酯油反应，形成脂肪酸烷基酯(生物柴油)和甘油。该反应需要热和强碱催化剂，如氢氧化钠或氢氧化钾。

生物柴油：生物柴油是由植物油、动物脂肪或再循环油脂制造的脂肪酸烷基酯的混合物。生物柴油可以以纯的形式用作交通工具的燃料，但是其通常被用作石油柴油添加剂，以降低来自柴油动力交通工具的微粒、一氧化碳、碳氢化合物和空气有毒物质的水平。

水解：包括应用本发明的酶催化的化合物的水解，所述化合物例如生物质，如木质素纤维素材料。

热点联产(Cogeneration)：是采用单一的燃料和设备，同时生产一种以上形式的能量。在一方面，生物质热点联产比单独的生物质生产具有更具潜力的增长，因为热点联产产生热和电。

本发明的酶也可以被用在甘油精炼中。甘油副产品含有未反应的催化剂和用酸中和的肥皂。水和醇被除去以产生50％到80％的粗甘油。残留的污染物包括未反应的脂肪和油，其可以使用本发明的多肽处理。在本发明大型生物柴油工厂中，甘油可以被进一步纯化到例如99％或更高的纯度，用于制药和化妆品工业。

作为液体或气体汽油的生物燃料

本发明提供了气体、或汽油，如合成气形式的生物燃料和合成燃料。在一方面，本发明的方法包括使用本发明的酶用于天然生物质转化的化学循环——例如，用于生物质的水解——以制造生物燃料，例如生物乙醇、生物丙醇、生物丁醇或生物甲醇，或合成燃料，其形式为液体或作为气体，如合成气。

例如，本发明提供了制造生物燃料气体和合成气体燃料(“合成气”)的方法，所述生物燃料气体和合成气体燃料包括采用本发明的多肽或应用本发明的方法制造的生物乙醇、生物丙醇、生物丁醇和/或生物甲醇；在一方面，本发明的这种生物燃料气体与天然气体(也可以从生物质生产)一起混合，例如基于氢或烃的气体燃料。

在一方面，本发明提供了将生物质加工成合成燃料，如合成气的方法，合成气如通过气化从生物质生产的合成气。在一方面，本发明提供了从甘蔗，例如甘蔗渣制造乙醇、丙醇、丁醇和/或甲醇气体的方法。在一方面，这种燃料或气体被用作发动机燃料，例如汽车发动机、卡车发动机、飞机发动机、船发动机、小发动机等的燃料。在一方面，本发明提供了从植物，例如玉米，或植物产物如干草或秸秆(例如，水稻秸秆或小麦秸秆，或任何谷类植物的任何干秆)或农业废物制造乙醇、丙醇、丁醇和/或甲醇的方法。

在一方面，应用本发明的方法和组合物制造的乙醇、丙醇、丁醇和/或甲醇可以用作燃料(例如，汽油)添加剂(例如充氧剂)或直接用作燃料。例如，通过本发明的方法制造的乙醇、丙醇、丁醇和/或甲醇——包括燃料——可以与乙基叔丁基醚(ETBE)，或ETBE混合物如含有47％乙醇作为生物燃料的ETBE，或与MTBE(甲基叔丁基醚)一起混合。在另一方面，通过本发明的方法制造的乙醇、丙醇、丁醇和/或甲醇——包括燃料——可以与下列物质混合：

IUPAC名	通用名
		丁-1-烯	α-丁烯
顺-丁-2-烯	顺-β-丁烯
		反-丁-2-烯	反-β-丁烯
2-甲基丙烯	异丁烯

可以应用“A.B.E”(丙酮、丁醇、乙醇)发酵，进一步加工通过本发明的方法(例如，使用本发明的酶)制造的丁醇和/或乙醇；在一方面，丁醇是唯一的液体产物。在一方面，这种丁醇和/或乙醇在现有的汽油发动机(没有对发动机或汽车进行改进)中“直接”燃烧，产生比乙醇更多的能量和较少腐蚀性及较小的水可溶性，而且能够通过现有的结构分配。

在一方面，一种、几种或所有的醇通过使用本发明的酶的本发明的过程来制备，并且所述过程可以进一步包括生物质-到-液体的技术，例如，汽化过程来生产合成气，随后进行催化合成，或进行生物质到混合醇燃料的生物转化。

本发明也提供了这样的过程，所述过程包括使用本发明的酶结合(或被结合到)“天然气到液体”或GTL、或“煤到液体”或CTL、或“生物质到液体”或BTL、或“油砂到液体”或OTL的过程；并且在一方面，本发明的这些过程被用于制造合成燃料。在一方面，本发明的这些过程之一包括：应用例如所谓的“Fischer Tropsch”过程(一种催化的化学反应，其中一氧化碳和氢被转化为各种形式的液体烃；使用的典型催化剂基于铁和钴；本过程的主要目的是生产作为合成润滑油或作为合成燃料使用的合成石油替代品)，从生物质中生产生物燃料(例如，合成燃料)。在一方面，本发明的这种合成生物燃料可以包含氧，并且可以作为高质量柴油和汽油的添加剂使用。

在可选的方面，本发明的过程使用各种预处理，其可以被分为三类：物理的、化学的和复合的(物理的+化学的)。任何化学品都可以被用作预处理剂，例如酸、碱、气体、纤维素溶剂、醇、氧化剂和还原剂。在这些化学品中，碱是最普遍的预处理剂，因为它相对便宜并且产生较少的纤维素降解。普通的碱氢氧化钠和石灰也可以用作预处理剂。虽然氢氧化钠显著增加了生物质的可消化性，但是其难以再循环，相对昂贵，并且处理起来有危险。相反地，石灰具有许多优点：其是安全的并且非常便宜，能够通过用二氧化碳对洗涤水进行碳酸盐化处理而回收。

在一方面，本发明提供了由厌氧微生物厌氧消化有机材料过程产生的生物燃料，例如生物气，其中所述过程包括使用本发明的酶或本发明的方法。这种生物燃料，例如生物气，可以从生物可降解废物材料产生，或者通过应用被喂给厌氧蒸煮器以补充气体产量的能源作物来产生。固体产品——消化物——也可以被用作生物燃料。

本发明提供了制造生物方法产生的油——包括原油——和可以用于柴油发动机的气体的方法，其中所述方法包括使用本发明的酶和本发明的方法。在一方面，这些方法可以将石油，例如原油精炼成煤油、石油、柴油和其它馏分。

本发明提供了从下列物质制造生物产生的油的方法(使用本发明的酶或本发明的方法)：

·直链植物油(SVO)

·废弃植物油(WVO)——在数量上主要由商业厨房产生的废弃烹饪油和油脂。

·生物柴油，从动物脂肪和植物油的酯交换获得，在石油柴油发动机中直接可用。

·生物衍生的原油，和通过包括非油基材料在内的复合有机材料例如，废物如旧轮胎、废料、木材和塑料的热解聚作用制备的生物气和碳固体。

·高温分解油，其可以在闪速热解过程(flash pyrolysis Process)中只采用加热从生物质、木材废物等生产(所述油在用于传统的燃料系统或内部燃烧发动机中之前必须被处理)。

·木材、木炭和干粪。

本发明将关于下列实施例进行进一步描述；然而，应理解，本发明不限于这样的实施例。

实施例

本文所述的氨基转移酶和氧化还原酶采用选择策略获得。在该选择策略中，环境DNA文库被构建在呈现L-色氨酸营养缺陷的细菌宿主菌株中。文库克隆被接种到包含D-色氨酸(但缺少L-色氨酸)的培养基上。唯一可以生长的克隆是在不连续环境DNA片段之一上表达编码对D-色氨酸具有酶活性的基因的那些克隆。例如，鉴定表达活性色氨酸消旋酶并且能将D-色氨酸转化成L-色氨酸的克隆。此外，鉴定这样的克隆，其表达能将D-色氨酸转化成中间体的氧化还原酶(诸如氨基酸氧化酶或脱氢酶)，宿主细胞进而能将中间体转化成L-色氨酸。在氧化还原酶诸如氨基酸氧化酶和脱氢酶的情况下，一种这样的中间体是吲哚-3-丙酮酸。

A部分中的实施例描述了用于初步表征候选DAT和氧化还原酶核酸以及编码的多肽的方法。特定核酸和多肽的进一步表征被描述在B部分中。

A部分

实施例1—生长和试验方法#1

酶制备

甘油原料被用于接种包含50mL具有合适抗生素的LB培养基的烧瓶。初始培养物在37℃下230rpm的摇动下生长过夜，并且检查OD_600nm。初始培养物被用于接种400mL至0.05的OD_600nm。培养物在37℃下230rpm的摇动下温育。

当OD_600nm在0.5至0.8之间时，培养物用1mM IPTG进行诱导，并且在30℃和230rpm下温育过夜。通过在4000rpm下离心细胞15分钟使细胞沉淀来收获培养物。倾到掉上清液，并且沉淀物或者被冷冻以后使用或者再次悬浮在20mL补充有26U/mL DNAse的50mM的磷酸钠缓冲液(pH 7.5)中，并且根据制造商的指导，采用微型流化床(Microfluidics Corporation,Newton,MA)进行裂解(溶胞)。澄清的裂解物被收集并且在11,000rpm下离心30分钟。上清液被收集在干净试管中并且通过0.2μm过滤器进行过滤。根据制造商的指导，5mL等份的澄清裂解物被置于小瓶中并且采用冷冻干燥机(Virtis Company,Gardinier,NY)进行冷冻干燥。大约1mL澄清的裂解物被保留用于采用Bio-Rad蛋白测定试剂(Bio-Rad,Hercules,CA)以及SDS-PAGE分析进行蛋白量化。然后，计算各个冻干样品中蛋白的量。

活性试验

用于活性试验的酶在50mM pH 7.5磷酸钠中进行制备。DAT试验通常用大约1mg/mL总蛋白进行。

采用RR-monatin底物的DAT试验

将25mM RR-monatin、25mM丙酮酸钠盐、0.08mM PLP、90mM pH 8.0磷酸钠以及如上(在“酶制备”部分)制备的0.8mg/mL DAT(总蛋白)()合并并且在30℃下300rpm下进行温育。在不同时间点(一般地，0、2、4和24小时)，50μL反应产物被转移到150μL冰冷的乙腈中，并且将样品涡动30秒。样品在4℃下13,200rpm下离心10分钟，并且将上清液通过0.45μm过滤器。滤液在甲醇中稀释10倍，并且样品采用液相层析/质谱/质谱(LC-MS/MS)进行分析以监测所形成的D-丙氨酸(在下面实施例“用于检测D-丙氨酸或R,R-monatin的LC/MS/MS方法”的部分中描述)。

采用色氨酸底物的DAT试验

将10mM D-色氨酸、25mM丙酮酸钠盐、0.08mM PLP、90mM pH 8.0磷酸钠以及如上(在“酶制备”部分)制备的0.8mg/mL DAT(总蛋白)()合并并且在30℃下300rpm下进行温育。在不同时间点(一般地，0、2、4和24小时)，50μL反应产物被转移到150μL冰冷的乙腈中，涡动30秒，并且在4℃下13,200rpm下离心10分钟。上清液通过0.45μm过滤器，并且滤液在甲醇中稀释10倍。样品采用LC-MS/MS进行分析以监测所形成的D-丙氨酸(在下面实施例“用于检测D-丙氨酸或R,R-monatin的LC/MS/MS方法”的部分中描述)。

用于检测D-丙氨酸或R,R-monatin的LC/MS/MS方法

如下进行液相层析/质谱/质谱(LC-MS/MS)筛选：通过采用CTCPal自动取样器(LEAP Technologies,Carrboro,NC)将96-孔板的样品注射到由LC-10ADvp泵(Shimadzu,Kyoto,Japan)以1.0mL/min提供的30/70H₂O/Acn(0.1％甲酸)混合物中，穿过Zorbax ECLIPSE XDB-C8^TM(2.1×50mm)柱并且进入API4000TURBOION-SPRAY^TM三重四极杆质谱仪(triple-quad mass spectrometer)(AppliedBiosystems,Foster City,CA)中。

对于目标分析物以正离子模式进行离子喷射和多反应监测(MRM)。丙氨酸：母/子离子：90.12/44.25monatin：母/子离子：293.11/130.15。

实施例2—利用试验方法#1的DATs活性

载体pSE420-cHis是pSE420(Invitrogen,Carlsbad,CA)的衍生物。对于pSE420-cHis，载体用NcoI和Hind III切割，并且与C-His连接。

C-His：5’-CCA TGG GAG GAT CCA GAT CTC ATC ACC ATC ACC ATC ACTAAG CTT(SEQ ID NO:977)。His-标记在该载体中的表达取决于宿主和终止密码子的选择。也就是说，如果使用TAG终止密码子和supE宿主，His-标记被表达；如果使用TAG终止密码子和非supE宿主，His-标记不被表达。除非另外指明，His-标记在这些实验中没有被表达。

DAT亚克隆在pSE420-cHis载体/E.coli HMS174宿主(Novagen,San Diego,CA)中，除了下列亚克隆：SEQ ID NO:930、932、936在pET101D-Topo载体/BL21Star(DE3)宿主(Invitrogen,Carlsbad,CA)中；SEQ ID NO:934在pET101D-Topo载体/BL21CODON PLUSRIL^TM宿主(Stratagene,La Jolla,CA)中；SEQ IDNO:938、942、944、946在pSE420载体/XL1BLUE^TM宿主(Stratagene,La Jolla,CA)中；SEQ ID NO:940、948、950、962和966在pSE420-c-His载体/XL1BLUE^TM宿主(Stratagene,La Jolla,CA)中；以及SEQ ID NO:928在pQET1载体/M15pREP4宿主(pQET1被描述在美国专利号5,814,473和6,074,860；M15pREP4来自Qiagen；Valencia,CA)中。

亚克隆按照实施例1中描述的方法生长、裂解和冻干。测试样品对R,R-monatin以及D-色氨酸的活性(如实施例1中所述)。对于monatin DAT试验，DATs在30℃下与25mM R,R-monatin、25mM丙酮酸钠盐和0.08mM PLP(pH 8)一起温育。对于D-色氨酸DAT试验，DATs在30℃下与10mM D-色氨酸、25mM丙酮酸钠盐和0.08mM PLP(pH 8)一起温育。所有DATs在两个测试中被加载在0.8mg/mL总蛋白中。

在所示时间点，将50μL反应产物加入到150μL冰冷的乙腈中。样品被涡动30秒并且上清液然后在甲醇中稀释10倍。样品然后通过LC/MS/MS进行分析(如实施例1中所述)以监测所形成的D-丙氨酸。下面的表显示了对两种底物的D-氨基转移酶活性。

表4：D-氨基转移酶亚克隆对R,R-monatin和D-色氨酸的活性

NT，没有进行测试；ND；在所用条件下没有检测到；+，低表达，++，中等表达，+++，高表达

表4：D-氨基转移酶亚克隆对R,R-monatin和D-色氨酸的活性(续)

NT，没有进行测试；ND；没有检测到；+，低表达，++，中等表达，+++，高表达

表4：D-氨基转移酶亚克隆对R,R-monatin和D-色氨酸的活性(续)

应当注意，在上述所列的亚克隆和其也在序列表中的天然序列之间仅有非常保守性的差别。例如，起始和终止密码子常常被修饰以在大肠杆菌中更有效地表达。可预期，就DAT活性而言，野生型序列的克隆将产生相似的结果。

B部分

实施例3—Monatin、MP、色氨酸、丙氨酸和HMG的检测

该实施例描述了与所选的D-氨基转移酶(DAT)的进一步表征有关的分析方法。monatin和色氨酸的LC/MS/MS多反应监测(MRM)分析

由生化反应得到的monatin和色氨酸的混合物的分析采用液相色谱-串联质谱(LC/MS/MS)仪器进行，该仪器包括Waters 2795^TM液相色谱，具有在色谱和三重四极质谱仪之间串联放置的Waters 996光敏二极管阵列(PDA)吸光度监测器。LC分离40℃下采用2.1mm×250mm的Xterra MS C8反相层析柱进行。LC流动相由A)包含0.3％甲酸和10mM甲酸铵的水以及B)包含0.3％甲酸和10mM甲酸铵的甲醇组成。

梯度洗脱从5％B至45％B是线性的，0-8.5min，从45％B至90％B是线性的，8.5-9min，从90％B至90％B是等度的，9-12.5min，从90％B至5％B是线性的，12.5-13min，其中每次运行之间进行4min再平衡。流速是0.27mL/min，并且PDA吸光度从210nm到400nm监测。，基于目标分析物的质子化分子离子([M+H]+)的产生和特征碎片离子的产生优化和选择所有ESI-MS的参数。下列仪器参数被用于monatin和色氨酸的LC/MS/MS多反应监控(MRM)分析：毛细管电压：3.5kV；椎孔电压：40V；Hex 1:20V；孔：0V；Hex 2:0V；源温：100℃；脱溶剂温度：350℃；脱溶剂气体：500L/h；椎孔气体：50L/h；低质量分辨率(Q1)：12.0；高质量分辨率(Q1)：12.0；离子能量：0.2；入口电压：-5V；碰撞能量：8；出口电压：1V；低质量分辨率(Q2)：15；高质量分辨率(Q2)：15；离子能量(Q2)：3.5；倍增器：650。四种monatin-特异性母/子MRM转变和一种色氨酸特异性母/子转变被用于特异性地检测体外和体内反应中的monatin和色氨酸。所监测的转变为293.08/157.94、293.08/167.94、293.08/130.01以及293.08/256.77。色氨酸被监测具有205.0/146.0的MRM转变。对于monatin和色氨酸的内标量化，对包含四种不同的各个分析物与d₅-色氨酸和d₅-monatin的比的四种校准标准品进行分析。这些数据进行线性最小二乘法分析以形成monatin和色氨酸的校准曲线。向各个样品中加入固定量的d₅-色氨酸和d₅-monatin(d₅-monatin按照来自WO 2003/091396 A2的方法由d₅-色氨酸合成)，并且响应比例与(monatin/d₅-monatin；色氨酸/d₅-色氨酸)与上述校准曲线一起被用于计算混合物中各个分析物的量。对于d₅-色氨酸和d₅-monatin所监测的母/子质量转变分别为210.0/150.0，298.1/172.0以及298.1/162.00。

Monatin的手性LC/MS/MS(MRM)测量

生化反应中monatin的立体异构体分布的测定通过用1-氟-2-4-二硝基苯-5-L-丙氨酸酰胺(FDAA)衍生，接着反相LC/MS/MS MRM测量而实现。

用FDAA衍生Monatin

向50μL样品或标准品以及10μL内标中加入100μL 1％FDAA的丙酮溶液。加入20μL 1.0M碳酸氢钠，并且混合物在40℃下温育1h并伴有偶尔的混合。样品被取出并且冷却，并且用20μL 2.0M HCl中和(可能需要更多的HCl来实施缓冲生物混合物的中和)。脱气完成后，样品准备通过LC/MS/MS分析。

用于测定的Monatin的立体异构体分布的LC/MS/MS多反应监测

采用前述部分描述的LC/MS/MS仪器进行分析。能分离monatin(尤其FDAA-monatin)的所有四种立体异构体的LC分离在40℃下Phenomenex2.0×250mm(3μm)C18反相层析柱上进行。LC流动相由A)包含0.05％(质量/体积)醋酸铵的水以及B)乙腈组成。洗脱在13％B下是等度的，0-2min，从13％B至30％B是线性的，2-15min，从30％B至80％B是线性的，15-16min，在80％B下是等度的，16-21min，并且从80％B至13％B是线性的，21-22min，其中在每次运行之间进行8min再平衡。流速是0.23mL/min，并且PDA吸光度从200nm至400nm监测。基于FDAA-monatin的质子化分子离子([M-H]^-)的产生和特征碎片离子的产生优化选择所有的ESI-MS参数。

下列仪器参数被用于负离子ESI/MS模式下monatin的LC/MS分析：毛细管电压：3.0kV；椎孔电压：40V；Hex 1:15V；孔：0.1V；Hex 2:0.1V；源温：120℃；脱溶剂温度：350℃；脱溶剂气体：662L/h；椎孔气体：42L/h；低质量分辨率(Q1)：14.0；高质量分辨率(Q1)：15.0；离子能量：0.5；入口电压：0V；碰撞能量：20；出口电压：0V；低质量分辨率(Q2)：15；高质量分辨率(Q2)：14；离子能量(Q2)：2.0；倍增器：650。三种FDAA-monatin-特异性母/子转变被用于特异性地检测体外和体内反应中的FDAA-monatin。对Monatin监测到的转变为542.97/267.94、542.97/499.07，以及542.97/525.04。所监测到的Monatin内标衍生物质量转变为548.2/530.2。FDAA-monatin立体异构体的鉴定基于相比纯化的monatin立体异构体的层析保留时间以及质谱数据。内标被用于监测反应的进程以及确认S,S立体异构体的保留时间。

包括色氨酸、Monatin、丙氨酸和HMG在内的氨基酸的液相层析-柱后荧光检测对于色氨酸、Monatin、丙氨酸的方法

用于测定生化反应中氨基酸的液相层析与柱后荧光检测在结合有Waters 474扫描荧光检测器和Waters柱后反应模块(LC/OPA方法)的Waters 2690LC系统或等同物上进行。LC分离在60℃下装载有交互作用-钠(Interaction-Sodium)的离子交换柱上进行。流动相A是Pickering Na 328缓冲液(Pickering Laboratories,Inc.；Mountain View,CA)。流动相B是Pickering Na 740缓冲液。梯度洗脱为0％B至100％B，0-20min，在100％B下等度的，20-30min，并且从100％B至0％B线性的，30-31min，其中每次运行之间进行20min的再平衡。流动相的流速为0.5mL/min。OPA柱后衍生溶液的流速为0.5mL/min。荧光检测器设置为EX 338nm和Em 425nm。正亮氨酸被用作分析用内标。氨基酸的鉴定基于纯化的标准品的层析保留时间数据。

对于HMG的方法

来自生化反应的样品通过包含作为填料的C18和作为洗脱液的0.6％乙酸的固相提取(SPE)筒进行清洁。从SPE收集的馏分配制至已知体积并且采用带有荧光检测器的HPLC柱后邻苯二醛(OPA)衍生进行分析。采用Waters 2695液相层析系统和两个串联的Phenomenex AquaC18柱：具有5μm颗粒的2.1mm×250mm柱和具有3μm颗粒的2.1mm×150mm柱使得层析分离成为可能。柱的温度为40℃以及柱等度流速为0.18mL/min。流动相是0.6％乙酸。OPA柱后衍生和检测系统由Waters试剂管理器(RMA)、反应旋管室、反应旋管室的温度控制模块以及Waters2847荧光检测器组成。OPA流速设定在0.16mL/min，并且反应旋管室被设定到80℃。荧光检测器设置为348nm的激发波长和450nm的发射波长。控制检测器灵敏度的其它参数诸如信号增加和衰减被设置为实验所需。HMG的量化基于谷氨酸的摩尔响应。

通过LC/MS检测MP

采用Waters 2690液相层析系统和2.1mm×50mm Agilent Eclipse XDB-C181.8μm反相层析柱进行液相层析分离，其中流速为0.25mL/min和梯度条件如下：

时间(min)	A％	B％
			0.00	95	5
0.2	95	5
			1.2	5	95
4.5	5	95
			5.0	95	5
10	95	5

流动相A是具有10mM甲酸铵的0.3％(v/v)甲酸，流动相B是50:50甲醇/乙腈中的0.3％甲酸w/10mM甲酸铵。柱温度是40℃。

在负电喷雾离子化模式(-ESI)下运行的Micromass ZQ四极质谱仪的参数如下设置：毛细管电压：2.2kV；椎孔电压：35V；提取器电压：4V；RF透镜电压：1V；源温：120℃；脱溶剂温度：380℃；脱溶剂气体：600L/h；椎孔气体：关；低质量分辨率(Q1)：15.0；高质量分辨率(Q1)：15.0；离子能量：0.2；倍增器：650。单一离子监测MS实验被设定以选择性检测m/z 290.3、210.3、184.3和208.4。m/z208.4是内标d₅-色氨酸的质子化分子[M-H]^-离子。

通过LC/MS/MS检测MP

采用Waters HPLC液相层析系统和2.1mm×50mm Agilent Eclipse XDB-C181.8μm反相层析柱进行液相层析分离，其中流速为0.25mL/min和梯度条件如下：

时间(min)	A％	B％
			0.00	95	5
0.7	95	5
			3.0	5	95

时间(min)	A％	B％
			4.0	5	95
4.3	95	5
			6.0	95	5

流动相A是具有10mM甲酸铵的0.3％(v/v)甲酸，并且B是50:50甲醇/乙腈中的具有10mM甲酸铵的0.3％甲酸。柱温度是40℃。

在负电喷雾离子化模式(-ESI)下运行的用于LC/MS/MS多反应检测(MRM)实验的Waters Premier XE三重四极质谱仪上的参数如下设置：毛细管电压：3.0kV；椎孔电压：25V；提取器电压：3V；RF透镜电压：0V；源温：120℃；脱溶剂温度：350℃；脱溶剂气体：650L/h；椎孔气体：47L/hr；低质量分辨率(Q1)：13.5；高质量分辨率(Q1)：13.5；离子能量：0.5V；入口电压：1V；碰撞能量：18V；出口1电压：19；低质量分辨率(Q1)：15；高质量分辨率(Q1)：15；离子能量：2.0；倍增器：650。四种母/子MRM转变被监测以选择性检测Monatin前体(MP)和d₅-Monatin前体(d₅-MP)；d₅-MP被用作内标(I.S.)。四种MRM转变为290.1/184.1、290.1/210.1、290.1/228.1以及295.1/189.1。这些转变中的两种——对于MP的290.1/184.1和对于d₅-MP的295.1/189.1——被用于产生校准曲线和量化目的。290.1/210.1和290.1/228.1的转变被用作MP的量化二次确认。

用于标准品和试验的Monatin和MP的生产

Monatin的生产

R,R和S,S monatin的外消旋混合物如美国专利号5,128,482中所述合成生产。R,R和S,S monatin通过衍生和水解步骤分离。简单地说，monatin外消旋混合物被酯化，游离的氨基用卡马西平(CBZ)封闭，形成内酯，并且S,S内酯用固定的蛋白酶选择性地水解。Monatin还可以如Bassoli等,Eur.J.Org.Chem.,8:1652-1658,(2005)中所述进行分离。

MP生产

R-MP利用丙酮酸钠作为氨基受体采用0.1M磷酸钾缓冲液中的AT-103宽范围D-氨基转移酶(Biocatalytics,Pasadena,CA)通过R,R monatin的转氨作用进行生产。S-MP利用丙酮酸钠作为氨基受体采用0.1M磷酸钾缓冲液中的AT-102L-氨基转移酶(Biocatalytics)通过R,R monatin的转氨作用进行生产。两个反应都是在30℃下和pH大约8.0-8.3下进行大约20小时。两种化合物采用具有Rohm和Haas(Philadelphia,PA)疏水性树脂(XAD^TM1600)的制备级HPLC，在水中洗脱进行纯化。包含纯度大于90％的monatin前体的样品被收集并且冷冻干燥。

实施例4—蛋白制备方法

该实施例描述用于所选DATs二次表征的克隆、表达、细胞提取制备、蛋白纯化和蛋白量化的方法。

本领域技术人员将了解，由亚克隆(例如片段)或另外修饰的(例如标记的)核酸编码的多肽中活性的存在被认为预期了由全长或野生型核酸编码的相应多肽中活性的存在。

用于克隆到Topo质粒中的编码DAT的基因的扩增

用于Topo克隆的PCR反应(利用Stratagene的Pfu Turbo或克隆的Pfu)如下：1×用于聚合酶的推荐缓冲液、0.2mM dNTPs、0.5μM每种引物和每50μl反应1μl聚合酶(2.5单位)。每个反应，包含大约5-100ng的模板DNA。对于PCR采用94℃热启动2分钟，并且熔化温度为94℃。退火温度取决于引物的Tm，并且为30或60秒。延伸时间(72℃下)为每kb至少2min。反应产物通常在1×TAE 1％琼脂糖凝胶上进行分离，并且合适大小的带用制造商所推荐的QIA快速凝胶提取试剂盒进行纯化，除了采用的是10至50μl的洗脱体积。体积为1至4μl的纯化PCR产物被用于与制造商所推荐的pCRII-Topo Blunt质粒(Invitrogen,Carlsbad,CA)连接。

对于未标记的表达DATs在pET30a中的克隆

具有SEQ ID NO:945、947、949、891、893、869、873、877、881、883和895中所示序列的DATs(编码具有SEQ ID NO:946、948、950、892、894、870、874、878、882、884和896的序列的多肽)从质粒或PCR产物用Pfu Turbo(Stratagene,LaJolla,CA)以及在5’端添加Nde I且在3’端添加Not I或BamH I限制性位点的引物扩增。PCR片段被克隆到制造商所推荐的pCR-Blunt II-Topo(Invitrogen,Carlsbad,CA)中。序列通过测序(Agencourt,Beverly,MA)进行核实，并且具有正确序列的插入物然后采用合适的限制酶从载体释放并且被连接入pET30a的Nde I和Not I(或BamH I)限制性位点。对于具体的引物请参见表5。

具有SEQ ID NO:155的序列的DAT核酸(编码具有SEQ ID NO:156的多肽)用Pfu Turbo(Stratagene)以及分别在5’和3’端添加Nde I和Hind III限制性位点的引物进行扩增。PCR片段采用Nde I和Hind III限制酶进行消化并且被连接入pET30a的Nde I和Hind III限制性位点。对于具体的引物请参见表5。应当注意，具有SEQID NO:156的序列的多肽似乎包含下列前导序列，其概率为0.991(如通过SignalP所测定，如Nielsen,1997,Protein Engineering,10:1-6中所讨论)：KNSPIIAAYRAATPGSAAA(SEQ ID NO:1084)。编码该DAT多肽的核酸用表观前导序列克隆。

表5.用于扩增的引物

定点诱变

利用QuikChange Multi定点诱变试剂盒(Stratagene,La Jolla,CA)根据制造商的指导进行定点诱变。为了产生SEQ ID NO:870T242N突变体，实施例10中描述的pET30a未标记的构建物被用作模板。为了产生SEQ ID NO:220G240N和SEQ IDNO:220T241N突变体，实施例10中描述的具有C-端his标记的pET30a构建物被用作模板。所用的诱变引物列在下面表6中。所有期望的诱变通过DNA测序证实。

表6.引物序列

DAT PCR产物在pET30a中的克隆，以作为未标记的蛋白表达

具有SEQ ID NO:177、179、153、165、181、217、187、189、207、219、215、195、199、197、209、201、221、235、203、237、239、223、225、227、229、231、245、213、155、169、171、167、173和175中所示序列的DAT核酸(编码具有SEQ ID NO:178、180、154、166、182、218、188、190、208、220、216、196、200、198、210、202、222、236、204、238、240、224、226、228、230、232、246、214、156、170、172、168、174和176中所示序列的DAT多肽)作为PCR产物而接受，其具有Nde I和Not I相容的末端以及外源核苷酸以提高剪切效率。

DAT PCR产物在5’端包含NdeI限制酶位点并且在3’端包含NotI位点。PCR片段首先被克隆到pCR4TOPO或pCR-Blunt II-TOPO载体(Invitrogen)中。DNA序列通过测序被证实后，DAT基因通过NdeI和NotI的消化从TOPO质粒中释放并且连接到采用相同限制酶切割的pET30a载体中。内部包含NdeI或NotI位点的DAT基因采用具有相容性限制酶位点的引物进行扩增并且被克隆到pET30a中。例如，具有SEQ ID NO:155的DAT核酸(编码具有SEQ ID NO:156的序列的多肽)采用NdeI和HindIII限制性位点从原始PCR产物再扩增，以克隆到pET30a中。

DATs在pET30a中的克隆，以作为C-His-标记的融合蛋白表达

编码DAT 4978和DAT 4978T243N(如实施例6中所述)、SEQ ID NO:870(由质粒pSE420-cHis表达)、和SEQ ID NO:870T242N、SEQ ID NO:176和SEQ IDNO:220(由pET30表达的未标记形式)的核酸用Pfu Turbo(Stratagene)和将XhoI位点放在紧接终止密码子上游的引物进行再扩增。PCR片段被克隆到制造商所推荐的pCR-Blunt II-Topo(Invitrogen,Carlsbad,CA)中或者直接克隆到pET30a的Nde I和Xho I限制性位点中。序列通过测序(Agencourt,Beverly,MA)核实，具有正确序列的插入物然后利用Nde I和Xho I限制酶从载体中释放，并且该插入物被连接到pET30a的Nde I和Xho I限制性位点。对于具体的引物和质粒名称参见表7。

表7.引物序列

CbDAT和CaDAT的克隆

拜氏梭菌D-氨基-转移酶利用Pfu Turbo(Stratagene)和拜氏梭菌基因组DNA与包含5’NdeI和3’NotI限制性位点的PCR引物进行PCR扩增。根据制造商的指导，利用Purrgene基因组DNA纯化试剂盒(Gentra Systems,Minneapolis,MN)从拜氏梭菌(ATCC 51743)中提取基因组DNA。

824bp PCR产物采用Qiagen凝胶提取试剂盒进行凝胶提取并且被TOPO克隆到pCR-Blunt II-Topo(Invitrogen)。核实序列后，采用快速连接试剂盒(Rapid Ligationkit)(Roche)将基因连接到Nde I/Not I切割的pET28b和pET30a载体。

丙酮丁醇梭菌(C.acetobutylicum)DAT利用基因组DNA(ATCC 824)和Stratagene Optiprime PCR试剂盒与包含5’NdeI和3’NotI限制性位点的PCR引物进行扩增。成功的PCR反应被克隆到pCR4TOPO载体中，并且TOPO克隆被测序。阳性TOPO克隆用限制酶NdeI和NotI消化，并且连接到pET30a载体的DAT片段用相同的限制酶消化。

表8.引物序列

LsDAT的体外合成

唾液乳杆菌(Lactobacillus salivarius)DAT利用基于Stemmer等,1995,Gene,164:49-53的修正方法进行装配。简单地说，43个寡核苷酸(主要是40聚体)基于基因序列及其互补的DNA序列从IDT排序，其中20个碱基对在正义和反义链之间重叠。对于引物表参见表9。引物在水中被稀释至250μM，并且5μL各个引物在微量离心管中混合在一起。PCR如下进行：每100μL反应，加入1.5μL引物库、4μL dNTPs、1×XL PCR缓冲液、1mM醋酸镁、2μL rTth聚合酶(Roche,Indianapolis,IN)和0.25μL Pfu聚合酶(Stratagene,La Jolla,CA)。在94℃下进行3分钟热启动，然后15个循环的94℃下30秒，42℃下30秒，以及68℃下15秒。进行10多个循环的30秒延伸时间(68℃下)。进行10多个循环的75秒延伸时间。最后，在68℃下进行链延伸步骤7分钟。

表9.用于合成LsDAT的寡核苷酸

名称	序列(5’→3’)	SEQ ID NO:
			F1:	ATGAAGCAAG TTGGATACTA CAATGGTACT ATCGCTGATT	1017
F2:	TAAATGAACT TAAGGTGCCT GCTACTGATC GTGCACTTTA	1018
			F3:	TTTTGGTGAT GGTTGCTACG ATGCAACTAC ATTTAAGAAC	1019
F4:	AATGTTGCAT TTGCCTTAGA AGATCATCTT GATCGTTTTT	1020
			F5:	ATAATAGTTG TCGCCTACTA GAGATCGATT TCCCTTTAAA	1021
F6:	TCGCGATGAA CTTAAAGAAA AGCTTTACGC TGTTATTGAT	1022
			F7:	GCTAACGAAG TTGATACTGG TATCCTTTAT TGGCAAACTT	1023
F8:	CACGTGGTTC TGGTTTACGT AACCATATTT TCCCAGAAGA	1024
			F9:	TAGCCAACCT AATTTATTAA TTTTTACTGC TCCTTATGGT	1025
F10:	TTAGTTCCAT TTGATACTGA ATATAAACTT ATATCTCGCG	1026
			F11:	AAGACACTCG CTTCTTACAT TGCAATATTA AAACTTTGAA	1027
F12:	TTTACTTCCA AACGTTATTG CAAGTCAAAA GGCTAATGAA	1028
			F13:	AGTCATTGCC AAGAAGTGGT CTTCCATCGC GGTGACAGAG	1029
F14:	TTACAGAATG TGCACACTCT AACATCTTAA TTCTAAAAGA	1030
			F15:	TGGCGTTCTT TGCTCCCCAC CTAGAGATAA TTTAATCTTG	1031
F16:	CCAGGAATTA CTTTGAAACA TCTCTTGCAA TTAGCAAAAG	1032
			F17:	AAAATAATAT TCCTACTTCC GAAGCACCAT TCACTATGGA	1033
F18:	TGATCTTAGA AATGCTGATG AAGTTATTGT TAGTTCTTCA	1034
			F19:	GCTTGTCTAG GTATTCGCGC AGTCGAGCTT GATGGTCAGC	1035
F20:	CTGTTGGTGG AAAAGATGGA AAGACTTTAA AGATCTTGCA	1036
			F21:	AGATGCTTAT GCTAAGAAAT ATAATGCTGA AACTGTAAGT CGTTAA	1037
R1:	TAGTATCCAA CTTGCTTCAT	1038
			R2:	AGGCACCTTA AGTTCATTTA AATCAGCGAT AGTACCATTG	1039
R3:	CGTAGCAACC ATCACCAAAA TAAAGTGCAC GATCAGTAGC	1040
			R4:	TCTAAGGCAA ATGCAACATT GTTCTTAAAT GTAGTTGCAT	1041
R5:	TAGTAGGCGA CAACTATTAT AAAAACGATC AAGATGATCT	1042
			R6:	TTTCTTTAAG TTCATCGCGA TTTAAAGGGA AATCGATCTC	1043
R7:	CCAGTATCAA CTTCGTTAGC ATCAATAACA GCGTAAAGCT	1044
			R8:	ACGTAAACCA GAACCACGTG AAGTTTGCCA ATAAAGGATA	1045
R9:	TTAATAAATT AGGTTGGCTA TCTTCTGGGA AAATATGGTT	1046
			R10:	TCAGTATCAA ATGGAACTAA ACCATAAGGA GCAGTAAAAA	1047
R11:	ATGTAAGAAG CGAGTGTCTT CGCGAGATAT AAGTTTATAT	1048
			R12:	CAATAACGTT TGGAAGTAAA TTCAAAGTTT TAATATTGCA	1049
R13:	ACCACTTCTT GGCAATGACT TTCATTAGCC TTTTGACTTG	1050
			R14:	AGAGTGTGCA CATTCTGTAA CTCTGTCACC GCGATGGAAG	1051
R15:	GTGGGGAGCA AAGAACGCCA TCTTTTAGAA TTAAGATGTT	1052
			R16:	TGTTTCAAAG TAATTCCTGG CAAGATTAAA TTATCTCTAG	1053
R17:	GGAAGTAGGA ATATTATTTT CTTTTGCTAA TTGCAAGAGA	1054
			R18:	CATCAGCATT TCTAAGATCA TCCATAGTGA ATGGTGCTTC	1055
R19:	GCGCGAATAC CTAGACAAGC TGAAGAACTA ACAATAACTT	1056
			R20:	TCCATCTTTT CCACCAACAG GCTGACCATC AAGCTCGACT	1057
R21:	ATTTCTTAGC ATAAGCATCT TGCAAGATCT TTAAAGTCTT	1058
			R22:	TTAACGACTT ACAGTTTCAG CATTAT	1059

用引物L.sal DAT R Not I和L.sal DAT F Nde I(下面)的第二次扩增产生正确分子量的段。对于这些第二次扩增引物序列参见表10。

表10.引物序列

名称	序列(5’→3’)	SEQ ID NO:
			L.sal DAT R NotI	TTGGCCAAGCGGCCGCTTAACGACTTACAGTTT	1060
L.sal DAT F NdeI	GGTTCCAAGGCATATGAAGCAAGTTGGATACTA	1061

如上相同地进行第二次PCR反应，除了仅仅加入2个引物外。对于PCR模板，采用的是2.5μl第一次PCR反应。在94℃下进行3分钟热启动，接着10个循环的94℃下30秒，42℃下30秒，以及68℃下15秒。10多个循环在增加的退火温度48℃下进行30秒，延伸时间30秒(68℃下)。最后，链延伸步骤在68℃下进行7分钟。

片段被克隆到pCR-BluntII-TOPO载体中，并且TOPO克隆被测序。阳性TOPO克隆用NdeI和NotI切割并且连接到pET30a载体的DAT片段用相同的限制酶消化。

酶制备

大肠杆菌菌株BL21(DE3)被用作从pET-衍生质粒表达DATs的宿主菌株。大肠杆菌菌株TOP10被用在所有其它DAT构建物中。期望构建物的单个菌落一般被接种到包含适量抗生素的Overnight Express II培养基(Novagen)。30℃下培养过夜后，当OD₆₀₀大于10时，通过离心收获细胞。可选地，过夜培养物被用于在包含合适的抗生素的LB培养基中接种培养物。培养物在30℃下生长至0.5至0.9的OD₆₀₀，并且蛋白表达在相同的温度下用1mM IPTG诱导4h。

细胞提取物通过向细胞中加入每g细胞沉淀5mL或每50mL过夜培养物5mL的(没有伯胺)提取剂(EMD Biosciences/Novagen目录号#70923)与5μL/mL蛋白酶抑制剂混合物II(EMD Bioscience/CalBiochem目录号#539132)、1μl/ml核酸酶(EMD Biosciences/Novagen目录号#70746)和0.033μl/mlr-Lysozyme ^TM溶液(EMD Biosciences/Novagen目录号#71110)而制备。细胞再悬浮液在室温下轻轻摇动下温育15min。4℃下16,100rcf离心20min后，上清液作为无细胞提取物去除。

在使用酶制剂进行monatin反应之前，清洁剂和低分子量化合物通过穿过事先用包含0.05mM PLP的磷酸钾缓冲液(100mM,pH 7.8)或EPPS缓冲液(100mM,pH8.2)平衡的PD-10柱(GE Healthcare,Piscataway,NJ)而从无细胞提取物中去除。蛋白用平衡缓冲液进行洗脱。蛋白浓度一般采用BSA(Pierce)作为标准的BioRadCoomassie板测定(也被称为Bradford测定)进行测定。有时在注明的情况下，BCA(Pierce)微量滴定板测定被用于蛋白测定。为了估测D-氨基转移酶在无细胞提取物中的浓度，1mg/mL样品被加在Experion(Bio-Rad,Hercules,Ca)电泳系统中，并且Experion Software(Version 2.0.132.0)被用于计算可溶性DAT蛋白在无细胞提取物中的百分数。可选地，进行SDS-PAGE分析并且视觉估测被用于估测表达的百分数。

His-标记的融合蛋白利用GE Healthcare螯合琼脂糖快速流动树脂或NovagenHis-结合柱进行纯化。利用琼脂糖树脂的纯化涉及将无细胞提取物加载到事先用包含200mM氯化钠和0.050mM PLP的磷酸钾缓冲液(100mM,pH 7.8)平衡的柱上。该柱然后用3-5柱体积的平衡缓冲液、3-5柱体积的包含25mM咪唑的平衡缓冲液和3-5柱体积的包含50-100mM咪唑的平衡缓冲液连续进行洗涤。His-标记的蛋白用3-5柱体积的包含500mM咪唑的平衡缓冲液洗脱出柱。洗出液利用Amicon(Billerica,MA)Centricon-70进行浓缩。浓缩蛋白溶液中的咪唑和氯化钠盐通过穿过事先用包含50μM PLP的磷酸钾缓冲液(100mM,pH 7.8)(对于DAT4978和DAT4978T243N)或EPPS缓冲液(100mM,pH 8.2)(对于SEQ ID NO:870和SEQID NO:870T242N)平衡的PD-10脱盐柱而去除。蛋白浓度利用Bio-Rad蛋白测定Bio-Rad)和作为标准的白蛋白(Pierce)进行测定。等份(0.5-1mL)纯化酶在-80℃下储存直至使用。采用His-结合柱纯化His-标记蛋白按照制造商的指导进行。来自柱中的洗出液采用上述的PD10柱进行脱盐。

实施例5—D-氨基转移酶活性的测试方法#2

Monatin生产测定(标准)

将下列成分组合：100mM EPPS，pH 8.2；200mM丙酮酸钠；100mM D-色氨酸；50μM PLP；1mM MgCl₂；0.01％吐温-80；50μg/mL实施例6中描述的醛缩酶(无细胞提取物被使用；醛缩酶浓度根据来自Experion芯片的百分数读数进行估测)和适量的DAT(一般0.1-1mg/mL)。

除了PLP储存液和蛋白溶液，所有其它试剂利用无氧去离子水制备并储藏在厌氧室中。反应被设置在厌氧室中室温下并持续地轻轻搅拌。为了取时间点，向等份的反应混合物中加入甲酸至终浓度2％(v/v)。采用台式微量离心机在16,100RCF下离心5min后，上清液通过0.2μm尼龙膜过滤器进行过滤。在通过LC/MS/MS分析之前样品然后用水稀释20-至100-倍。

D-色氨酸转氨测定

为了比较某种D-氨基转移酶的D-色氨酸转氨活性，进行下列测定。测定混合物包含：0.5mg/mL包含的D-AT细胞提取蛋白；40mM pH 8.0的磷酸钾；20mMD-色氨酸；100mM丙酮酸钠；和50μM PLP。测试在37℃下温育30分钟并且然后放置在冰上。

反应程度通过利用下列试验测量所形成的吲哚-3-丙酮酸的量进行监视：向5μl、10μl和20μl反应混合物中加入200μl下列溶液：0.5mM砷酸钠；0.5mMEDTA；和50mM四硼酸钠(pH 8.5)。将吲哚-3-丙酮酸烯醇-硼酸盐复合物在325nm下的吸光度与在相同溶液中制备的吲哚-3-丙酮酸的标准曲线进行比较。

丙氨酸形成也可用于监视D-色氨酸转氨反应的程度。丙氨酸浓度如实施例3中所述进行测定。

R,R Monatin转氨测定

测定条件包括(终体积2mL)包括：0.01％吐温；100mM EPPS pH 8.2；100mM丙酮酸钠；大约3mM R,R monatin；0.5mg/mL DAT；和50μM PLP。反应程度通过采用实施例3中描述的方案检测所形成的丙氨酸或R-MP进行监测。

实施例6—获得DATs和醛缩酶的方法

该方法描述了在monatin形成反应中使用的醛缩酶的克隆，该形成反应利用D-氨基转移酶以及为了比较目的使用的之前分离的D-氨基转移酶。

醛缩酶

从D-色氨酸的monatin生产测定中使用的醛缩酶被分离并且被亚克隆到如WO 2007/103389中所述的pET载体中(在那个申请中被称为由SEQ ID NO:275的核酸编码的SEQ ID NO:276的醛缩酶)。

DAT和DAT4978T243N

来自ATCC#4978的D-氨基转移酶(DAT 4978)如美国公开号2006/0252135中所述被克隆。T243N突变体采用pET30(未标记的)DAT 4978构建物进行制备。

用于诱变的引物按照Stratagene Multi-Change试剂盒(La Jolla,CA)中所列的建议进行设计。引物被5'-磷酸化。按照制造商的指导采用Stratagene Multi-Change试剂盒进行诱变。诱变的寡核苷酸序列被显示在表11中。

表11.诱变的寡核苷酸序列

突变体名称	氨基酸变化	引物	SEQ ID NO:
				DAT4978T243N	T243N	5'-GTGATTGTTTCATCAACGAATTCAGAAGTAACGCC-3'	1062

大肠杆菌XL10-Gold细胞(Stratagene)被转化并且所得纯化的质粒制备物被测序以证实正确的突变被并入。包含DAT 4978T243N的质粒然后被转化入大肠杆菌BL21(DE3)表达宿主。

球形芽孢杆菌(B.sphaericus)DAT

来自球形芽孢杆菌的D-氨基转移酶(ATCC编号10208)如US 2006/0252135所述被克隆。蛋白如相同参考文献中所述进行制备。

实施例7—DATs的分析

具有SEQ ID NO:928、930、932、934、936、938、940、942、944、946、948和950所示序列的DAT多肽通过在载体和实施例2中所述的相容性大肠杆菌表达宿主中表达相应的核酸进行生产。本领域技术人员可以采用装配PCR技术诸如实施例4中所述的那些技术合成编码这些D-氨基转移酶的基因。在包含羧苄青霉素(100μg/mL)的LB培养基中的过夜培养物在100mL相同培养基中稀释100×并且在500mL挡板瓶中生长。培养物在30℃下生长至0.5至0.9的OD₆₀₀，并且蛋白表达在相同温度下用1mM IPTG诱导4h。用于总蛋白的样品在收获之前立即取样。细胞通过离心收获并且用10mL pH 7.8的磷酸钾缓冲液洗涤一次。细胞立刻在–80℃下冷冻直至制备细胞提取物。

细胞提取物如实施例4所述制备并脱盐，其用100mM磷酸钾作为缓冲液以洗脱并平衡PD10柱。总蛋白和DAT浓度如所述进行测定。

除了使用10mM R,R monatin外，用丙酮酸作为氨基受体的R,R monatin的转氨如实施例5中所述进行。丙氨酸、monatin和monatin前体水平的初步分析相互不一致并且结果被认为是定性的。具有SEQ ID NO:948的序列的DAT多肽显示出monatin前体形成。

为了进一步证实活性，monatin形成试验如方法中所述进行，其中DAT浓度为大约0.2mg/mL。作为对照，对浓度0.2mg/mL的纯化球形芽孢杆菌DAT进行评价。2和21hr后，获取等分试样，并且加入甲酸至2％的最终浓度，并且将样品冷冻。样品然后被解冻、旋转并过滤。对于monatin利用LC/MS/MS方法分析样品，并且对于色氨酸和丙氨酸采用实施例3中所述的LC/OPA柱后荧光方法分析样品。具有SEQ ID NO:946和950的序列的DAT多肽能在测试的条件下形成R,Rmonatin。具有SEQ ID NO:948的序列的DAT多肽显示出色氨酸的减少和丙氨酸形成的增加，这证明其作为D-色氨酸转氨酶的活性。具有SEQ ID NO:946的序列的DAT多肽如总蛋白的量所测定表达很好但是不完全可溶，其解释了某些不一致的结果。具有SEQ ID NO:930、932、940、942和944中所示序列的DAT多肽在用SDS-PAGE的分析上没有产生可视带，并且因此如果在不同条件下生产的话，可能是活性的。结果请参见表12。

表12.DATs的活性

nd＝在测试条件下没有检测到

pET30a中DAT多肽的分析

具有SEQ ID NO:946、948和950的序列的DAT多肽如实施例4中所述被亚克隆入pET30a中。在pET30a中包含DATs的大肠杆菌菌株BL21DE3的复制培养物在25和30℃下在Overnight Express II(Solution 1-6,Novagen)中生长过夜。作为对照，包含没有插入物的pET30a质粒的菌株也进行生长。在5-10的OD₆₀₀下收集细胞。通过离心收集细胞并且用10mL 100mM磷酸钾缓冲液pH 7.8洗涤一次。细胞在-80℃下冷冻直至进一步处理。

细胞提取物如实施例4所述制备，其用100mM磷酸钾作为缓冲液以洗脱并平衡PD10柱。总蛋白和DAT浓度如所述进行测定。具有SEQ ID NO:946的序列的DAT多肽30℃下在总蛋白馏分中表达良好，但是通过SDS-PAGE观察不可溶。具有SEQ ID NO:948和950的序列的DAT多肽也在较高的温度下表达，但是可溶。

除了对于SEQ ID NO:946的多肽来说DAT浓度为0.1mg/mL外(对于所有其它，0.5mg/mL)，monatin形成试验如实施例5中所述进行。作为阳性对照，也测定了0.5mg/mL浓度下的纯化球形芽孢杆菌DAT。2和21hr后，获取等分试样，并且加入甲酸至2％的最终浓度，并且将样品冷冻直到进一步加工。样品然后被解冻、旋转并过滤。对于monatin利用LC/MS/MS方法分析样品，并且对于色氨酸和丙氨酸采用实施例3中所述的LC/OPA柱后荧光方法分析样品。结果显示在表13中。对于所有测试的D-氨基转移酶，都显示出D-色氨酸消耗和丙氨酸形成，这表明它们对D-色氨酸都具有活性。在这些条件下，仅仅具有SEQ ID NO:946和948的序列的DAT多肽呈现出对monatin形成具有活性。可能的是，两种宿主系统之间的表达或稳定性差别是在某些情况下看到活性但在其它情况下看不到活性的原因。

表13

Nd，在测试条件下没有检测到

实施例8—DATs在pSE420-cHis中的分析

具有SEQ ID NOs:886、888、890、892和894中所示序列的DAT多肽DATs从大肠杆菌HMS174中的pSE420-cHis载体中生产。本领域技术人员可以采用装配PCR技术诸如实施例4中所述的那些技术合成编码这些D-氨基转移酶的基因。各种DAT构建物的过夜培养物在30℃下在包含氨苄青霉素(100μg/mL)的LB培养基中生长。50mL相同的培养基在第二天用1mL过夜培养物接种。培养物在30℃下生长直至OD_600nm达到大约0.5，然后用1mM IPTG诱导。培养物在30℃下进一步温育4h，然后通过在3800rcf下离心15min收获。细胞用1.5mL 50mM磷酸钾pH 7.0洗涤，并且再次离心。上清液被轻轻倒出并且将细胞沉淀进行称重。

细胞提取物如方法中所述制备，其利用100mM磷酸钾作为缓冲液以洗脱并平衡该柱。总浓度和DAT浓度如所述测定，除了对于总蛋白测定来说是用的是BCA(Pierce)而不是Bradford外。两种仅仅载体不同的培养物在相同的大肠杆菌宿主中生长为克隆的DATs。所有蛋白在SDS-PAGE凝胶上都产生可视带，但是溶解程度不一致。具有SEQ ID NO:892的序列的多肽不完全可溶。

为了比较每一种酶的D-色氨酸转氨活性，进行实施例5中所述的D-色氨酸转氨测定和R,R monatin转氨测定。D-色氨酸氨基转移酶被靶向，其利用终浓度0.5mg/mL包含D-氨基转移酶的细胞提取物以及0.1mg/mL纯化的球形芽孢杆菌DAT作为参照。由于低水平的可溶性多肽，DATs在细胞提取物中的量化是困难的。具有SEQ ID NO:888、892和894中所示序列的DAT多肽在30分钟反应期间显示出良好的活性，其中D-色氨酸作为底物。具有SEQ ID NO:886和890中所示序列的DAT多肽相对于无酶的对照具有可测量的活性，但在测试条件下呈现出很少的活性。

Monatin转氨实验在室温下进行，靶向0.5mg/mL各个DAT——其包括来自球形芽孢杆菌的纯化阳性对照——0.5、1和2小时后取样。然后对R,R monatin转氨样品进行monatin和丙氨酸分析。剩余monatin的量通过LC/MS/MS量化；丙氨酸形成采用实施例3中的柱后衍生方法进行测量。在测试条件下，具有SEQ IDNOs:892和894中所示序列的DAT多肽是活性的。对于R,R monatin向R-MP的转化，具有SEQ ID NOs:894的序列的DAT多肽表现出具有最高的活性。当测试丙氨酸形成时趋势是一致的。各个时间点的丙氨酸生成数(mM)被显示在表14中。

表14.从R,R monatin转氨反应形成丙氨酸(mM)

DAT多肽(SEQ ID NO:)	0.5hr	1hr	2hr
				载体对照1	0.139	0.185	0.215
载体对照2	0.179	0.242	0.301
				886	0.128	0.203	0.242
888	0.13	0.203	0.275
				890	0.112	0.153	0.176
892	1.034	1.587	2.167
				894	2.2	2.52	2.663
BsphDAT(纯化的)	0.287	0.519	0.894
				无酶	0.043	0.035	0.037

具有SEQ ID NO:891和893中所示序列的DAT核酸如实施例4中所述被亚克隆到pET30中。这些构建物被转化到携带用于从T7启动子表达的DE3溶原体的各种大肠杆菌宿主；包括大肠杆菌的K-12和B菌株以及携带pLysS质粒的菌株。克隆如实施例4中所述被表达在OvernightExpress System II中，其中添加和不添加0.5mM吡哆素，并且通过SDS-PAGE或Experion分析表达。从这些试验中变得明显的是，蛋白大部分在不可溶馏分中表达。吡哆素有助于使溶解度提高至将温度从37降至30℃进行诱导所能提高的小程度。在所设计的克隆系统上作进一步的工作以使可溶性表达最大化(参见实施例16-22)。

实施例9—pET30a中CaDAT、CbDAT和LsDAT的分析

SEQ ID NO:894中所示的氨基酸序列被用于搜寻公共数据库中可利用的相似蛋白。三种DATs被发现与SEQ ID NO:894具有相似性。它们来自唾液乳杆菌(Lactobacillus salivarus)(蛋白水平上47％的同一性)、拜氏梭菌(蛋白水平上57％的同一性)和丙酮丁醇梭菌(蛋白水平上60％的同一性)。基因和蛋白序列及其登录号显示在该实施例末尾。图5是显示本发明的这些SEQ ID NO:894-样蛋白共有序列区域的比对(序列比较)。如图中重点突出的，技术人员可以看到高程度的共有序列区域，这表示结构相似性。

这些核酸被克隆到pET30a中，并且相应的多肽如本文所述被表达并且测试活性。

CbDAT

来自拜氏梭菌的D-氨基转移酶(CbDAT)被克隆到pET30a(未标记的)BL21(DE3)中并且采用OVERNIGHT EXPRESS II^TM(Novagen)进行表达。在600nm大约9的光密度时收集细胞并且细胞在4000rcf下离心15min。细胞用100mM磷酸钾pH7.8(冷的)洗涤一次并且再一次旋转。

细胞提取物如本文所述制备，其采用100mM EPPS pH 8.2作为缓冲液以洗脱和平衡该柱。总蛋白和DAT蛋白浓度如所述进行测定，除了采用的是BCA方法(Pierce)而不是Bradford(Coomassie)测试。CbDAT表达很好但是仅仅部分可溶。

Monatin形成测定如实施例5中所述进行，但是CbDAT的活性(0.5mg/mL)也在pH 7.4下进行研究(其中磷酸钾作为缓冲液)。作为对照，纯化的球形芽孢杆菌DAT(1mg/mL)在pH 8.2下进行测定。1、2、4、8和23小时后，获取等分试样并且加入甲酸至最终浓度2％。样品在–80℃下冷冻直至分析。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。结果显示在表15中。对于在pH 8.2下进行的测定，所产生的monatin的量稍高。对从具有N-末端His-标记的pET28表达的多肽进行相似的实验。标记形式的活性表现出稍微小于未标记的活性，但仍然是可检测的。

表15.随时间的活性

CaDAT和LsDAT

来自唾液乳杆菌(LsDAT)和丙酮丁醇梭菌(CaDAT)的D-氨基转移酶被克隆到pET30a(未标记的)BL21(DE3)中并且采用Overnight Express II(Novagen)进行表达。当培养物600nm下的光密度达到大约9时通过在4000rcf下离心15分钟收集细胞。

细胞提取物如本文所述制备，其采用100mM EPPS pH 8.2作为缓冲液以洗脱和平衡该柱。总蛋白和DAT蛋白浓度采用BCA(Pierce)方案进行测定。两种酶表达很好并且可溶。

在厌氧条件下室温下进行测试。作为对照，测定纯化的球形芽孢杆菌D-氨基转移酶。使用的是大约0.5mg/mL各种DAT。0.5、1、2、4、6、8和22hr后，获取等分试样并且加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。结果显示在表16中。

表16.

具有SEQ ID NO:894中所示序列的DAT的同源物具有活性。因为显示上述保守性序列的同源物在monatin形成测定中都具有活性，预期包含本文所述的共有序列的任何D-氨基转移酶也将具有活性，尽管其一级序列同一性低至47％。在该工作之前没有证据表明，这些独特的D-氨基转移酶——其与更多表征的芽胞杆菌D-氨基转移酶具有低的同源性——将对monatin具有活性或者将是宽特异性酶。

DNA序列CaDAT(ACCESSION AE001437AE007513-AE007868；VERSIONAE001437.1GI:25168256；核苷酸914049..914891)

蛋白序列CaDAT(ACCESSION NP_347428；VERSION NP_347428.1GI:15894079)

DNA序列CbDAT(ACCESSION CP000721AALO01000000AALO01000001-AALO01000089VERSION CP000721.1GI:149901357；核苷酸3213484..3212636)

蛋白序列CbDAT(ACCESSION YP_001309869VERSION YP_001309869.1GI:150017615)

DNA序列LsDAT(ACCESSION CP000233VERSION CP000233.1GI:90820184；核苷酸1750082..1750927)

蛋白序列LsDAT(ACCESSION YP_536555VERSION YP_536555.1GI:90962639)

实施例10—DATs的分析

在载体pSE420-cHis中包含具有SEQ ID NO:865、867、869、871、873、875和877的序列的DAT核酸的HMS174大肠杆菌被得到并在含有具有氨苄青霉素的LB培养基的琼脂板上划线培养。本领域技术人员可以采用装配PCR技术诸如实施例4中所描述的那些技术合成编码这些D-氨基转移酶的基因。单一集落被用于接种3mL包含氨苄青霉素的LB培养基(100μg/mL)。500μl过夜培养物被用于接种250mL挡板瓶中的50mL相同培养基。细胞在30^℃下生长至大约0.5的OD_600nm。加入IPTG至最终浓度1mM。细胞在30℃下诱导4小时并且通过离心收集。

细胞提取物如实施例4中所述制备。总蛋白和DAT浓度如实施例4中所述进行测定。DATs都显得表达很好，并且它们大部分显示出高度可溶性。

Monatin形成测定如实施例5中所述进行，除了DAT浓度为0.1mg/mL并且醛缩酶浓度为10μg/mL之外。作为对照，0.1mg/mL纯化的球形芽孢杆菌DAT被测定。6和22小时后，获取等分试样并且加入甲酸至最终浓度2％，并且将样品冷冻。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。在测试条件下，SEQ ID NO:870、874和878在3-步monatin形成测定中表现出都具有高活性。在测试条件下，具有SEQ ID NO:866、872和876中所示序列的DAT多肽在monatin形成途径中也具有活性但是没有达到具有SEQ IDNO:870、874和878中所示序列的多肽所具有活性的相同程度。表17显示monatin形成的结果(ppm)。

表17.Monatin形成测定

DAT多肽(SEQ ID NO:)	6hr	22hr
			866	17.4	76
868	nd	nd
			870	132	836
872	13.8	50
			874	281.6	798
876	2.4	12
			878	223.4	576
球形芽孢杆菌DAT	175.6	616

nd，在测试条件下没有检测到

pET30a中具有SEQ ID NO:870、874和878的序列的多肽的进一步分析

用包含编码上面显示的DATs的核酸的pET30a质粒转化的大肠杆菌BL21DE3的培养物在30℃下在50mL Overnight Express II(Solution 1-6,Novagen)中生长过夜。作为阳性对照，在pET30a中包含来自ATCC#4978的DAT的菌株也进行生长并诱导(实施例6中所述)。细胞在5-10的OD_600nm时收集，通过离心收获并且在-80℃下冷冻直至进一步加工。

细胞提取物如实施例4中所述制备。总蛋白和DAT浓度如实施例4中所述进行测定。

Monatin形成测定如实施例5中所述进行，除了对于SEQ ID NO:870，DAT多肽浓度为0.5mg/mL以及对于SEQ ID NO:874和878a中每一个，浓度为0.275mg/mL之外。作为对照，DAT4978和纯化的球形芽孢杆菌DAT在0.5mg/mL浓度下进行测定。0.5、1、2、4、6.5、9、24和22hr后，获取等分试样并且加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。结果显示在表18中(所形成的monatin以ppm表示)。

表18

DAT多肽(SEQ ID NO:)	0.5hr	1hr	2hr	4hr	6.5hr	9hr	24hr
								4978DAT	18	85.6	283.4	673.2	890	1226	2020
870	14.4	71	279.4	736	1340	1680	3362
								874	63.8	182.6	415.6	674	888	938	1154
878	97.8	244.4	607	912.2	1068	1174	1356
								球形芽孢杆菌	44.6	142.8	375.2	813	1294	1382	2746

所有三种亚克隆的DATs(编码具有SEQ ID NO:870、874和878的序列的多肽)在pET系统中表达良好并且产生可溶的蛋白。相比具有SEQ ID NO:874和878的序列的DAT多肽，具有SEQ ID NO:870中所示序列的多肽在可溶馏分中产生最高量的表达并且呈现出高活性，其随着时间的推移表现出没有减少。

野生型和突变体DAT多肽之间的比较

突变体多肽——其中SEQ ID NO:870的残基从T变至N(SEQ ID NO:870T242N)——如实施例4中所述构建和表达并且与DAT4978、DAT4978T243N(实施例6中所述)、球形芽孢杆菌和野生型SEQ ID NO:870比较。

BL21DE3的培养物——其中具有SEQ ID NO:870、870T242N、DAT4978和DAT4978T243N的序列的野生型和突变体多肽从pET30a载体表达——在30℃和250rpm下250mL挡板瓶中的50mL Overnight Express(Novagen)中生长过夜。细胞在它们达到10以上的600nm光密度时通过离心收集。细胞提取物如实施例4中所述制备，并且总蛋白和DAT浓度如实施例4中所述进行测定。所有测试的DATs被高度表达并且可溶，如利用Experion软件测定都接近30％。具有SEQ ID NO:870T242N的序列的多肽具有最高的表达，其被预期为总可溶蛋白的36.3％。

Monatin形成测定在DAT多肽浓度0.5mg/mL下如实施例5中所述进行。作为对照，对0.5mg/mL纯化的球形芽孢杆菌DAT进行测定。0.5、1、2、4、6.5、9和23.25hr后，获取等分试样，向等分试样中加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤。如实施例3中所述分析样品的monatin、色氨酸、丙氨酸和4-羟基-4-甲基谷氨酸(HMG)。

在最后的时间点，获取另外的等分试样以通过实施例3中所述的FDAA-衍生方法测定％R,R monatin。

Monatin形成数(ppm)呈现在下面的表19中。对于23.25hr时间点，在右手栏中给出了％R,R。

表19

SEQ ID NO:870多肽的T242N突变体的活性很高，比阳性对照好且比DAT多肽的野生型高。由该突变体形成的R,R monatin的百分数也比任何其它的基准酶高。所形成的HMG(副产物)量的分析是定性的，但表现出在9小时和23.25小时时间点，相似量的HMG由DAT 4978T243N多肽和SEQ ID NO:870T242N多肽形成。

具有SEQ ID NO:870中所示序列的本发明的示例性DAT多肽是新蛋白，其呈现出与最接近的已知D-氨基转移酶(杆菌YM-1D-氨基转移酶)的76％序列同一性以及与实施例6中所述的球形芽孢杆菌DAT的69％氨基酸序列同一性。图6显示本发明的这种新酶与其他公布的DATS的比对，并且技术人员可以看出该残基是使该酶独特的一个特性并且可解释其优异的活性。

具有SEQ ID NO:910中所示序列的高活性DAT多肽(更类似于球形芽孢杆菌型DATs；参见实施例12)也显示在比对中。作为SEQ ID NO:870多肽独特性的实例，在图6的比对中氨基酸残基54-55(球形芽孢杆菌编号)周围的区域中，清楚的是杆菌-样DATs具有高度的保守性，而SEQ ID NO:870具有残基EC而不是AS。作伪另一实例，在图6中所示的比对的残基135周围的高保守性区域中，SEQ IDNO:870多肽相比主要是缬氨酸残基具有更大亲水性的残基(T)。核心序列——其代表SEQ ID NO:870酶但排除了之前已知的宽特异性D-氨基转移酶和高度相关的同源物——被显示为共有序列A和B。包含这些共有序列之一的任何多肽预期将呈现DAT活性并且在monatin形成途径步骤中具有活性。

共有序列A

Y.*LWND.*IV.*EDRGYQFGDG.*YEV.*KVY.*G.*FT.*EH.*DR.*YECAEKI.*PYTK.*H.*LLH.*L.*E.*N.*TG.*YFQ.*TRGVA.*RVHNFPAGN.*Q.*V.*SGT.*K.*F.*R.*N.*KGVKAT.*TED.*RWLRCDIKSLNLLGAVLAKQEAIEKGCYEA.*LHR.*G.*TE.*SS.*N.*GIK.*GTLYTHPA.*N.*ILRGITR.*V.*TCAKEIE.*PV.*Q.*T.*K.*LEMDE.*V.*S.*SE.*TP.*I.*DG.*KI.*NG.*G.*WTR.*LQ.*F.*K.*P(SEQ ID NO：1069).

共有序列B

Y[ST]LWND[QK]IV.[DE].{2}[VI].[IV].{2}EDRGYQFGDG[IV]YEV[IV]KVY[ND]G.[ML]FT.{2}EH[IV]DR.YECAEKI[RK][LIV].[IV]PYTK.{3}H[QK]LLH.L[VI]E.N.[LV].TG[HN][IVL]YFQ[IV]TRGVA.RVHNFPAGN[VI]Q.V[LI]SGT.K.F.R.{3}N.[EQ]KGVKAT.TED[IV]RWLRCDIKSLNLLGAVLAKQEAIEKGCYEA[IV]LHR.G.[VI]TE.SS.N[VI][FY]GIK[DN]GTLYTHPA[ND]N.ILRGITR.V[IV][LI]TCAKEIE[LMI]PV.[EQ]Q.{2}T.K.{2}LEMDE[LIVM].V[ST]S.[TS]SE[IV]TP[VI]I[DE][IVL]DG.KI.NG.{2}G[ED]WTR[KQ]LQ.{2}F.{2}K[IL]P.(SEQ ID NO：1070).

与PERL规则表达常规语言类似，“.*”表明任何数目的来自20个蛋白氨基酸的氨基酸残基可以存在；[]表明括号中的任何一个氨基酸可以存在；“.{#}”表明任何20个蛋白氨基酸可以存在，只要残基数与括号中所示的数{#}匹配。

关于“.*”在共有序列A中的使用，任何“.*”位置上的氨基酸数可以例如从0至约20个残基变化(参见例如共有序列B(SEQ ID NO：1070))，或者从约20个残基变至高达约100个残基，或者氨基酸数可以更大，例如高达1000或更多个残基。没有限制地，在一个或多个“.*”位置的插入物可对应于例如结构域诸如(但不限于)几丁质酶结合结构域(例如，来自激烈热球菌(Pyrococcus furiosus)(登录号2CZN_A)或类鼻疽伯克氏菌(P.burkholderia)(登录号YP_331531)或纤维素结合结构域(例如，来自粪纤维单胞菌(Cellulomonas fimi)(登录号1EXH_A)或粪堆梭菌(Clostridiumstercorarium)(登录号1UY1_A)。在一些实施方式中(没有限制)，五个或更少指定的位置“.*”每个都包含例如约20个以上残基的插入物(例如约100个以上的残基)。在其它实施方式中(没有限制)，五个或更少指定的位置“.*”每个都包含约100个以下的残基的插入物(例如约20个以下的残基，例如3、5、10、20、25、30、40、50、60、70、75、80、90或95个残基))。多肽——其具有与本文公开的一个或多个共有序列对应的序列并包含在一个或多个“.*”位置插入的任何数目的残基——的活性可采用本文所述的方法进行评价。

包含SEQ ID NO：1069中所示共有序列的非限制性代表性多肽包括具有SEQID NO：870中所示序列和共有序列B(SEQ ID NO：1070)的多肽。

标记和未标记的SEQ ID NO：870、870T242N、DAT 4978和DAT 4978T243N 之间的比较

表达具有SEQ ID NO:870、870T242N、DAT 4978和DAT 4978T243N的序列的多肽的大肠杆菌BL21DE3细胞在30℃和250rpm下250mL挡板瓶中的50mLOvernight Express(Novagen)中生长过夜。细胞在600nm光密度为10以上时通过离心收集。细胞提取物如实施例4中所述制备。总蛋白和DAT浓度如实施例4中所述进行测定。

表达C-末端标记的SEQ ID NO:870、870T242N、DAT 4978和DAT 4978T243N多肽的大肠杆菌BL21DE3培养物在30℃和250rpm下1000mL挡板瓶中的200mL Overnight Express(Novagen)中生长过夜。各个克隆的两种培养物进行生长。细胞在600nm光密度为10以上时通过离心混合并收集。细胞提取物通过加入50mLBug Buster Primary Amine Free(Novagen)与50μl Benzonase核酸酶(Novagen),0.75μl重组溶菌酶(Novagen)和250μl蛋白酶抑制剂混合物II(CalBiochem)而产生。细胞在室温下在轻轻的摇动下温育15分钟。提取物在45,000×g下离心10分钟。

His-标记的蛋白利用GE Healthcare(Piscataway,NJ)Chelating Sepharose^TM FastFlow树脂如该方法中所述进行纯化。纯化的蛋白采用PD10柱脱盐到100mM磷酸钾，pH 7.8(对于DAT 4978和DAT 4978T243N多肽)或100mM EPPS pH 8.2(对于SEQ ID NO:870和870T242N多肽)中，两种缓冲液都包含50μM PLP。

R,R monatin形成试验如实施例5中所述进行，其中DAT浓度为0.5mg/mL。在2.25、4.5、9和24小时获取等分试样，用甲酸调节pH并且进行冷冻。在最终的时间点获取额外的等分试样，而没有加入甲酸，用于采用实施例3所述FDAA衍生方法测定立体异构体分布。样品被解冻并且离心5分钟，并且上清液用0.2μm尼龙膜过滤器进行过滤。让样品进行采用实施例3中所述的LC/MS/MS方法进行monatin分析。结果显示在表20中，以ppm表示所形成的monatin。最右边一栏是在试验结束时形成的％R,R monatin。

表20.

DAT多肽(SEQ ID NO:)	2.25hr	4.5hr	9hr	24hr	％R,R
						DAT 4978	330	676	1470	2384	92.3
DAT 4978T243N	1392	2856	4068	3688	98.2
						870	395	952	1896	2998	97.8
870T242N	1416	2936	3868	3976	99.3
						DAT 49786×His标记的	362	887	1664	2818	96.5
DAT 4978T243N 6×His标记的	1364	2298	3464	4440	98.9
						8706×His标记的	228	688	1508	3138	98.1
870T242N 6×His标记的	746	2020	3962	4552	99.5

C-末端标记和未标记酶的整体活性和立体特异性非常相似。此外可预期，由亚克隆核酸编码的多肽中活性的存在预示着由全长或野生型核酸编码的相应多肽中活性的存在。

实施例11—DATs的分析

在载体pSE420-cHis中包含编码具有SEQ ID NO:880、882和884的序列的多肽的DAT核酸的大肠杆菌HMS174在包含具有氨苄青霉素的LB培养基的琼脂板上划线培养。本领域技术人员可以采用装配PCR技术诸如实施例4中所描述的那些技术合成编码这些D-氨基转移酶的基因。单一集落被用于接种3mL包含氨苄青霉素(100μg/mL)的LB培养基。500μl被用于接种250mL挡板瓶中的50mL相同培养基。细胞在30℃下生长至大约0.4的OD_600nm，并且加入IPTG至最终浓度1mM。细胞在30℃下生长4小时并且通过离心收集。

细胞提取物如实施例4中所述制备。总蛋白和DAT多肽浓度如实施例4中所述进行测定。SEQ ID NO:882和884表达良好并且在可溶部分高水平地存在。

R,R monatin形成测定采用大约0.5mg/mL各个DAT多肽如实施例5中所述进行(除了使用的是0.35mg/mL的SEQ ID NO:880多肽外)。2、8和23小时后，获取等分试样，向等分试样中加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。结果显示在表21中。

在最后的时间点，获取另外的等分试样(没有pH调节)以通过实施例3中所述的FDAA-衍生方法测定所产生的monatin的立体异构体分布。所产生的R,R的百分数显示在下面表18的右手栏中，平衡主要是S,R monatin。

表21

具有SEQ ID NO:882和884中所示序列的多肽在从D-色氨酸的monatin形成反应中呈现出良好的活性。

相比球形芽孢杆菌对照酶，当采用这些DATs时所产生的monatin的立体纯度较高。编码具有SEQ ID NO:882和884的序列的DAT多肽的DAT核酸如实施例4中所述被亚克隆到pET30a载体中。

从pET30a载体中表达的具有SEQ ID NO:882和884的序列的DAT多肽的分析

在pET30a载体中包含编码具有SEQ ID NO:882和884的序列的DAT多肽的核酸的大肠杆菌BL21DE3培养物在30℃和250rpm下250mL挡板瓶中的50mLOvernight Express(Novagen)中生长过夜。细胞在600nm光密度为10以上时通过离心收集。

细胞提取物如实施例4中所述制备。总蛋白和DAT多肽浓度如所述进行测定。总蛋白和可溶蛋白样品采用4–15％梯度的丙烯酰胺凝胶以及通过Experion系统进行分析。通过Experion软件预期表达为大约30％。对于总蛋白和可溶蛋白(无细胞提取物)馏分都看到可视带。

monatin形成测定采用0.5和2mg/mLDAT多肽浓度如实施例5中所述进行。纯化的球形芽孢杆菌DAT被用作对照。2、4.5、9、24、368和48小时后，获取等分试样，加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。对样品定量分析HMG水平。获取另外的等分试样(没有pH调节)用于采用实施例3中所述的FDAA-衍生方法进行立体异构体分析。结果显示在表22和23中。

表22

表23.在选定时间点所产生的monatin的立体纯度

具有SEQ ID NO:882和884中所示序列的多肽呈现出良好的monatin形成活性和立体特异性，并且在初始时间点表现出产生比球形芽孢杆菌对照更少的HMG。具有SEQ ID NO:882的序列的多肽呈现出类似的monatin形成速度但在较低的monatin浓度滴定时在该试验中表现出具有稳定水平。

实施例12—pSE420-cHis中DATs以及pET30a中DAT的分析

对编码具有SEQ ID NO:898、900、902、904、906、910和896的序列的DAT多肽的开放阅读框进行评价。本领域技术人员可以采用装配PCR技术诸如实施例4中所描述的那些技术合成编码这些D-氨基转移酶的基因。

在pET30a载体中包含编码具有SEQ ID NO:896中所示序列的DAT多肽的核酸的大肠杆菌BL21DE3培养物(如实施例4中所述被亚克隆)在30℃和250rpm下250mL挡板瓶中的50mL Overnight Express(Novagen)中生长过夜。细胞在600nm光密度为10以上时通过离心收集。

Top10(Invitrogen,Carlsbad,CA)大肠杆菌细胞用包含具有SEQ ID NO:897、899、901、903、905和909中所示序列的DAT核酸的pSE420-cHis质粒进行转化，并且在包含氨苄青霉素(100μg/mL)的LB培养基上铺板。500μl过夜培养物被用于接种250mL挡板瓶中的50mL相同培养基。细胞在30℃下生长至大约0.4的OD_600nm，并且加入IPTG至最终浓度1mM。细胞在30℃下生长4小时并且通过离心收集。

细胞提取物如实施例4中所述制备。可溶蛋白和估计的DAT浓度如实施例4中所述进行测定。

R,R monatin形成测定用0.5mg/mL的DAT多肽浓度如实施例5中所述进行，除了0.3mg/mL具有SEQ ID NO:896的序列的多肽被使用；0.06mg/mL具有SEQID NO:898的序列的多肽被使用；0.4mg/mL具有SEQ ID NO:900的序列的多肽被使用；0.1mg/mL具有SEQ ID NO:902的序列的多肽被使用；以及0.12mg/mL具有SEQ ID NO:904的序列的多肽被使用之外。作为阳性对照，SEQ ID NO:870、870T242N和纯化的球形芽孢杆菌在DAT多肽浓度0.5mg/mL下进行测试。2、6和24小时后，获取等分试样，加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。获取另外的等分试样用于立体异构体分布分析并且没有用甲酸处理。24小时时间点的结果显示在表24中。编码具有SEQ ID NO:908中所示序列的DAT多肽的DAT核酸没有被亚克隆并且不可进行测定。

表24

nd＝在测试条件下不能被检测到

具有SEQ ID NO:910和902中所示序列的DAT多肽对于monatin形成反应具有高的活性水平，并且产生相当高水平的R,R monatin。结果表明具有SEQ IDNO:870中所示序列的DAT多肽在测试条件下呈现出与具有SEQ ID NO:910中所示序列的野生型多肽可比拟的活性；然而，SEQ ID NO:870多肽中T242N突变使得在酶的活性和立体特异性上具有大的提高。

实施例13—DATs的分析

获得包含编码SEQ ID NO:912、914、916、918、920、922、924和926DATs的核酸序列的质粒(pSE420-cHis)。技术人员可以采用任何数目的基因装配方案诸如实施例4中所述的方法克隆基因。

大肠杆菌Top10(Invitrogen)细胞用包含具有SEQ ID NO:912、914、916、918、920、922、924和926的序列的DAT多肽的pSE420-cHis质粒进行转化并且在包含氨苄青霉素(100μg/mL)的LB培养基上铺板。500μl过夜培养物被用于接种250mL挡板瓶中的50mL相同培养基。培养物在30℃下生长至大约0.4的OD_600nm。加入IPTG至最终浓度1mM。细胞在30℃下生长4小时并且通过离心收集。

细胞提取物如实施例4中所述制备。总可溶蛋白和DAT蛋白浓度如实施例4中所述进行测定。大部分被表达的DAT多肽是可溶的，除了SEQ ID NO:916多肽——其仅仅部分可溶——之外。

R,R monatin形成测定如实施例5中所述进行，其中DAT多肽浓度目标为约0.25mg/mL；除了0.1mg/mL SEQ ID NO:922多肽被使用以及0.2mg/mL SEQ IDNO:926多肽被使用外。作为阳性对照，纯化的球形芽孢杆菌DAT在0.25mg/mL浓度下进行测试。2、8和24小时后，获取等分试样，加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤。采用实施例3中所述的LC/MS/MS方法分析样品的monatin。结果显示在表25中。

表25

nd＝在测试条件下没有被检测到

具有SEQ ID NO:169、171、167、173和175中所示序列的DAT核酸(编码具有SEQ ID NO:170、172、168、174和176中所示序列的DAT多肽)作为PCR产物被得到并且如实施例4中所述被亚克隆在pET30a中。本领域技术人员可以采用任何数目的基因装配方法诸如实施例4中所述的方法重构基因。

在pET30a载体中包含编码具有SEQ ID NO:169、171、167、173和175的序列的DAT核酸的大肠杆菌BL21DE3培养物在30℃和250rpm下250mL挡板瓶中的50mL Overnight Express(Novagen)中生长过夜。细胞在600nm光密度为10以上时通过离心收集。

细胞提取物如实施例4中所述制备。总可溶蛋白和DAT蛋白浓度如实施例4中所述进行测定。具有SEQ ID NO:170的序列的多肽(由具有SEQ ID NO:169的序列的DAT核酸编码)未表现出可溶，其可能具有受阻的活性测定。

R,R monatin形成测定如实施例5中所述使用0.5mg/mL的DAT多肽浓度进行；除了0.25mg/mL SEQ ID NO:170多肽被使用。作为阳性对照，纯化的球形芽孢杆菌DAT在0.5mg/mL浓度下进行测试。2、8和24小时后，获取等分试样，加入甲酸至最终浓度2％并且将样品冷冻。样品然后被解冻、旋转和过滤，并且采用实施例3中所述的LC/MS/MS方法分析monatin。结果显示在表26中。

表26

对样品(没有pH调节)进行分析以采用实施例3中所述的FDAA衍生方案测定％R,R。由具有SEQ ID NO:176中所示序列的DAT多肽生产的monatin在24小时后为99.6％R,R，相比由球形芽孢杆菌生产的monatin，其在相同的时间点为95.2％R,R。由具有SEQ ID NO:176的序列的DAT多肽得到的活性和立体纯度都十分高，并且相应的核酸如实施例4中所述被作为C-末端标记的蛋白亚克隆，用于更多的定量研究。

SEQ ID NO:176C-His-标记蛋白的表征

具有SEQ ID NO:175的核酸——其编码具有SEQ ID NO:176的序列的多肽，被克隆到没有终止密码子的pET30a中，以便它能作为在C-末端具有6×His-标记的融合蛋白被表达。蛋白采用实施例4中所述的His-结合树脂进行纯化。当融合蛋白从PD-10脱盐柱中洗脱时，在溶液中形成了黄色沉淀。黄色残余物也在柱中观察到。黄色通常表明PLP-结合蛋白的存在。为了防止PLP-结合蛋白在脱盐步骤中沉淀，使用的是两个pH值(7.8和8.2)下不同的缓冲液(有和没有10％甘油的100mM磷酸盐和100mM EPPS)。试验的缓冲液没有一个表现出完全防止沉淀。

Monatin测定采用充分混合的异源蛋白溶液和0.5mg/mL的DAT多肽浓度进行。结果显示在表27中。纯化的SEQ ID NO:176DAT多肽(C-标记的)显示出与来自球形芽孢杆菌的阳性对照DAT多肽可比拟的活性；然而，活性表现出比具有SEQID NO:870T242N或SEQ ID NO:870T242N的序列的突变体多肽所呈现出的活性低。

表27.Monatin产生(ppm)

多肽(SEQ ID NO:)	2hr	4hr	8hr	24hr
					球形芽孢杆菌	262	676	1044	2150
870	332	678	1346	2826
					870T242N	942	1938	2834	4004
176	208	392	732	1806

实施例14—DATs的评价

编码29DATs的开放阅读框作为PCR产物被得到。应当注意，本领域技术人员可以采用装配技术诸如实施例4中所描述的那些技术合成编码DATs的基因。DAT核酸被亚克隆到pET30a载体并且如实施例4中所述作为未标记的蛋白被表达。脱盐的无细胞提取物(如实施例4中所述制备)被用在monatin形成测定中。0.5mg/mL的DAT多肽浓度被用于monatin测定，除了下列多肽(圆括号中的用量)外：SEQ ID NO:156多肽(0.4mg/mL)、SEQ ID NO:182多肽(0.45mg/mL)、SEQ IDNO:240多肽(0.47mg/mL)和SEQ ID NO:204多肽(0.42mg/mL)。

相比阳性对照酶，大部分DAT多肽在测定条件下显示出不可检测到低的monatin产生。大部分被表达的DAT多肽如Experion所测定是可溶的；然而，具有SEQ ID NO:204和240的多肽以非常低的水平表达并且可能不完全可溶。另一方面，具有SEQ ID NO:220的多肽如通过Experion软件鉴定预期为总可溶蛋白的68％。

Monatin产生结果被显示在表28和29中。在24h，相比阳性对照酶——来自球形芽孢杆菌的DAT，具有SEQ ID NO:156和214的DAT多肽产生40-50％的monatin。最大活性的DAT多肽是SEQ ID NO:220多肽。反应开始大约4h后，monatin浓度达到最大。可以预期，SEQ ID NO:156的成熟蛋白(没有预期的引导序列)是DAT多肽的活性成分，并且因此，蛋白可以在引导序列不存在下重组产生。

表28.所形成的Monatin(ppm)

多肽(SEQ ID NO:)	2hr	4hr	8hr	24hr
					178	11	24	62	194
180	nd	nd	nd	nd
					154	52	103	166	178
182	nd	nd	nd	nd
					218	1.6	2.8	274	12
188	2.4	5.2	10	22
					190	3.8	9.4	22	42
208	1	1.2	nd	nd
					220	2418	3563	3812	3882
196	1	1.8	nd	8
					156	64.8	156	296	796
球形芽孢杆菌	422	791	1302	2124

nd＝在测定条件下不可检测

表29.所形成的Monatin(ppm)

多肽(SEQ ID NO:)	2	4	8	24
					166	nd	nd	1	nd
216	69	91	109	134
					200	nd	nd	1	1
198	nd	nd	nd	nd
					210	1.6	3.8	6.2	15.2
202	3.4	6.2	12.2	29.8
					222	3.6	7	12.8	25.8
236	nd	nd	nd	nd
					204	nd	nd	nd	3.6
238	10.4	21.8	46.4	115.6
					240	3	6	12.4	32.2
224	39.8	85	171.8	268.8
					226	2.6	5.8	12.4	30.6
228	4.2	9.8	21.4	66.8
					230	9.2	21.8	42.2	94.4
232	3.6	9.4	21.6	57
					246	nd	nd	nd	nd
214	160	327	694	1346
					球形芽孢杆菌	393	986	1624	2597

nd＝在测定条件下不可检测

SEQ ID NO:220多肽的高活性在另一monatin形成测定中被证实，其中SEQ IDNO:220多肽与SEQ ID NO:870、870T242N和球形芽孢杆菌DAT多肽进行比较。浓度0.1mg/mL和0.5mg的DAT多肽被用于所测定的DAT多肽的每一个。结果显示在表30中。由于所测定的DAT多肽的高度活性，monatin样品必须被稀释100-倍以在所用仪器的定量范围内(与典型的10-或20-倍稀释相反)。

表30.所形成的Monatin(ppm)

DAT多肽(SEQ ID NO:)	2hr	4hr	8hr	24hr
					球形芽孢杆菌(0.1mg/mL)	74	170	309	728
球形芽孢杆菌(0.5mg/mL)	510	921	1068	2704
					870(0.1mg/mL)	28	81	179	706
870(0.5mg/mL)	399	847	1466	2916
					870T242N(0.1mg/mL)	93.2	245.8	582.4	1270
870T242N(0.5mg/mL)	1158.8	2026	3202	4126
					220(0.1mg/mL)	965.8	1512	2330	3788

220(0.5mg/mL)

2950

4302

4618

4488

在上述实验中由具有SEQ ID NO：220的DAT多肽形成的R，R的百分数采用实施例3中所述的FDAA衍生方法测定。具有SEQ ID NO：220的序列的DAT多肽具有高的立体特异性，相比球形芽孢杆菌的92.9％R，R，其在24小时产生99.3％R，Rmonatin。在另一测定中，SEQ ID NO：220多肽产生99.8％R，R-monatin。

具有SEQ ID NO：220的序列的本发明示例性DAT多肽是新颖的蛋白，其在蛋白水平上与实施例9中所示的拜氏梭菌DAT多肽具有62％的同一性。SEQ IDNO：220多肽与其它高活性DAT多肽(例如，具有SEQ ID NO：892和894(实施例8)、946(实施例7)和176(实施例13)中所示序列的那些多肽)具有86％-90％一级序列同源性(序列同一性)。这些高活性且新颖的DAT多肽在该工作之前没有被表征；并且这些酶对R，R monatin产生反应呈现出比任何公开的杆菌样D-氨基转移酶更高的活性和立体特异性。图7显示这些相关D-氨基转移酶的比对，并且它们共有的共有序列基序被描述在下面。

共有序列C

M.*GYYNG.*P.*DR.*FGDG.*YDAT.*N.*FAL.*H.*RF.*NS.*LL.*I.*K.*YWQ.*RG.*G.*R.*H.*F.*N.*I.*P.*KLI.*DTRF.*HCNIKTLNL.*P.*VIA.*Q.*E.*C.*E.*VFHRG.*VTECAHSN.*I.*NLIL.*G.*HL.*P.*E.*F.*L.*ADE.*V.*SS.*DG.*GGK.*K.*Q.*T(SEQID NO：1071)

共有序列D

M.{3}GYYNG.{10}P.{2}DR.{3}FGDG.YDAT.{3}N.{3}FAL.{2}H.{2}RF.NS.{2}LL.I.{9}K.{17}YWQ.{2}RG.G.R.H.F.{5，7}N.{2}I.{3}P.{10}KLI.{3}DTRF.HCNIKTLNL.P.VIA.Q.{3}E.{2}C.E.VFHRG.{2}VTECAHSN.{2}I.{11}DNLIL.G.{4}HL.{9}P.{2}E.{2}F.{4}L.{2}ADE.{2}V.SS.{10}DG.{3}GGK.{5}K.{2}Q.{10}T(SEQ ID NO：1072)

共有序列E

M.*[LV]GYYNG.*[LI].*[ML].*[VI]P.*DR.*[YF]FGDG.*YDAT.*N.*FAL[DE][ED]H[IL][DE]RF.*NS.*LL.*I.*[KR].*[EQ][LMV]K[KE].*[MV].*[DE].*[VL]YWQ.*[TS]RG[TS]G.*R[NS]H.*F.*N[LI].*I.*P.*[IVL].*[KE].*KLI[TS].*[ED]DTRF.*HCNIKTLNL[IL]P[NS]VIA[SA]Q[RK].*E.*C.*E.*VFHRG[ED].*VTECAHSN[VI].*I[IL][KR][ND].*[TS].*DNLIL.*G.*HL[LI][QK].*[IV]P.*E.*F[TS][LM].*[ED]L.*ADE[VI][LI]V[ST]SS.*[LMI].*[IL]DG.*GGK.*[LVI]K.*[IL]Q.*[EK][F Y].*T(SEQ ID NO：1073)

与PERL规则表达常规语言(perld℃.perl.org)类似，“.*”表明任何数目的来自任意20个蛋白氨基酸的氨基酸残基可以存在；[]表明括号中的任何一个氨基酸可以存在；“.{#}”表明20个蛋白氨基酸中的任何氨基酸可以存在，只要残基数与括号中所示的数{#}匹配。

关于“.*”在共有序列C中的使用，任何“.*”位置上的氨基酸数可以例如从约0至约20个残基变化(参见例如共有序列D(SEQ ID NO:1072)和E(SEQ IDNO:1073))，或者从约20个残基变至高达约100个残基，或者氨基酸数可以更大，例如高达1000或更多个残基。没有限制地，在一个或多个“.*”位置的插入物可对应于例如结构域诸如(但不限于)几丁质酶结合结构域(例如，来自激烈热球菌(Pyrococcus furiosus)(登录号2CZN_A)或类鼻疽伯克氏菌(P.burkholderia)(登录号YP_331531)或纤维素结合结构域(例如，来自粪纤维单胞菌(Cellulomonas fimi)(登录号1EXH_A)或粪堆梭菌(Clostridium stercorarium)(登录号1UY1_A)。在一些实施方式中(没有限制)，五个或更少指定的“.*”位置每个都包含例如约20个以上残基的插入(例如约100个以上的残基)。在其它实施方式中(没有限制)，五个或更少指定的“.*”位置每个都包含例如约100个以下残基的插入(例如约20个以下的残基，例如3、5、10、20、25、30、40、50、60、70、75、80、90或95个残基))。多肽——其具有与本文公开的一个或多个共有序列对应的序列并包含在一个或多个“.*”位置插入的任何数目的残基——的活性可采用本文所述的方法进行评价。

包含SEQ ID NO:1071中所示共有序列的非限制性代表性多肽包括SEQ IDNO:220、892、894、176和946以及共有序列D(SEQ ID NO:1072)和E(SEQ IDNO:1073))。可以预期，呈现共有序列C、D或E中任一个的任何D-氨基转移酶将在monatin形成途径步骤中具有活性。

具有SEQ ID NO:220的序列的c-His-标记多肽的表征

具有SEQ ID NO:219的序列的DAT核酸(编码SEQ ID NO:220的多肽)被克隆到没有终止密码子的pET30a中，所以它能作为在C-末端具有6×His-标记的融合蛋白被表达(如实施例4中所述)。融合蛋白采用实施例4中所述的His-结合柱(Novagen)进行纯化。来自PD-10脱盐柱的洗出液形成了黄色沉淀。黄色残余物也在柱中观察到。Monatin测定采用充分混合的异源蛋白溶液进行。所用的DAT多肽的量被显示在最左栏的圆括号中。符号w/Trp表示酶在冰上与10mM D-色氨酸温育过夜。结果显示在表31中。

表31.所形成的Monatin(ppm)

多肽(SEQ ID NO:)	2hr	4hr	8hr	24hr
					球形芽孢杆菌(0.5mg/mL)	382	660	1021	1986
870T242N(0.1mg/mL)	69	205	412	1074
					870T242Nw/Trp(0.1mg/mL)	63	163	383	978
870T242N(0.5mg/mL)	919	1698	2356	3130

870T242N w/Trp(0.5mg/mL)	772	1519	2294	3023
					220(0.1mg/mL)	847	1462	2202	3004
220(0.1mg/mL)	811	1522	2202	2887
					220w/Trp(0.1mg/mL)	537	1080	1590	2401
220(0.5mg/mL)	2885	3446	3813	4066
					220w/Trp(0.5mg/mL)	1933	3223	3939	3911

包含0.1mg/mL SEQ ID NO:220的多肽的反应显示出与包含0.5mg/mL SEQID NO:870T242N多肽的反应相似的形成时间进程。向包含纯化蛋白的溶液中加入D-色氨酸(10mM)消除了沉淀。对于样品——其中SEQ ID NO:220在冰上与D-色氨酸(10mM)温育过夜——观察到活性丧失，但是当SEQ ID NO:870T242N多肽用D-色氨酸(10mM)处理时没有观察到负作用。对于由SEQ ID NO:220多肽催化的反应，通过比较峰面积也定量分析HMG的存在。当两种DAT多肽以浓度0.5mg/mL使用时，相比包含SEQ ID NO:870T242N多肽的反应，由SEQ ID NO:220多肽催化的反应形成大约40％的HMG。较早的时间点在两种酶之间显示出甚至更显著的差别。

为了防止在SEQ ID NO:220多肽纯化期间蛋白沉淀，DTT(5mM)被包括在所有包含Bugbuster试剂的缓冲液、His结合柱的缓冲液以及PD-10柱的缓冲液中。脱盐柱后没有观察到沉淀，并且当DTT被包括在纯化期间或者以浓度2mM加入到纯化蛋白溶液中时观察到对SEQ ID NO:220多肽的活性没有负作用。monatin形成测定的数据显示在表32中。所用的DAT多肽的量显示在左栏的括号中。“加入的DTT”表示2mM DTT被加入以在纯化后再溶解蛋白；并且“纯化的w/DTT”表示在整个纯化中存在5mM DTT。

表32.所形成的Monatin(ppm)

多肽(SEQ ID NO:)	2hr	4hr	24hr
				球形芽孢杆菌(0.5mg/mL)	426	965	2638
870T242N(0.5mg/mL)	977	1916	4227
				220(0.1mg/mL)	1214	2163	3964
220(0.5mg/mL)	3534	4246	4415
				220加入的DTT(0.1mg/mL)	1287	2202	3566
220加入的DTT(0.4mg/mL)	3495	4833	5082
				220纯化的w/DTT(0.1mg/mL)	1204	2169	3997
220纯化的w/DTT(0.5mg/mL)	3562	4110	4353

SEQ ID NO:220多肽高度期望的特性使得它是用于进一步诱变或定向进化实验的优异候选者。

SEQ ID NO:220多肽的定点诱变

与芽胞杆菌DAT多肽相关的DAT多肽的环状区域被鉴定为对酶的底物特异性和立体特异性重要(Ro et al.,1996,FEBS Lett,398:141-145；Sugio et al.,1995,Biochemistry 34:9661-9669；和EP 1580268)。该区域中一个关键的残基是残基242上的T(在来自ATCC#4978的DAT多肽中，该位置对应于残基243上的T)。SEQID NO:870多肽的T242N突变体如DAT 4978的T243N突变体(参见实施例10)一样显示出活性和立体特异性的提高。SEQ ID NO:220多肽与SEQ ID NO:870多肽的一级序列比对仅显示出35％氨基酸序列同一性和65％同源性。SEQ ID NO:870中的T242残基与SEQ ID NO:220中的G240残基进行比对，其接下来是T241残基。对两种蛋白采用Accelrys DS Modeler软件(其中杆菌YM-1结构作为模板)，将SEQ ID NO:870多肽与SEQ ID NO:220多肽的环状区域重叠是困难的。因此，两种氨基酸被选定为定点诱变的目标。

命名为SEQ ID NO:220G240N和SEQ ID NO:220T241N的突变体多肽如实施例4中所述通过相应核酸(SEQ ID NO:219)的定点诱变产生。两种突变体多肽作为6×His-标记的融合蛋白被表达并且被纯化，该6×His-标记的融合蛋白被用在monatin形成测定中。对于两种突变体SEQ ID NO:220多肽在脱盐步骤观察到黄色沉淀。对于monatin形成测定，结果显示在表33和34中。所用的D-氨基转移酶的量被显示在左手栏中的括号中。SEQ ID NO:220多肽的不同制备物被用在测定中。“ferm”表明所用的SEQ ID NO:220多肽是在如实施例15中所述的发酵罐中生产。

表33.所生产的Monatin(ppm)

多肽(SEQ ID NO:)	2hrs	4hrs	8hrs	24hrs
					球形芽孢杆菌(0.5mg/mL)	440	777	1510	2621
870T242N(0.5mg/mL)	961	1913	2793	3904
					ferm 220(0.1mg/mL)	1396	2379	3217	3770
ferm 220(0.2mg/mL)	2301	3277	3789	4328
					ferm 220w/DTT(0.1mg/mL)	1434	2384	3109	3730
ferm 220w/DTT(0.2mg/mL)	2423	3568	3859	4755
					220(0.1mg/mL)	1109	1912	2809	3713
220T241N(0.1mg/mL)	554	856	1084	1986

表34.所形成的Monatin(ppm)

多肽(SEQ ID NO:)	2hr	4hr	8hr	24hr
					球形芽孢杆菌(0.5mg/mL)	634	938	1651	2754
870T242N(0.5mg/mL)	1422	1922	3211	3793
					ferm 220(0.1mg/mL)	1976	2505	3442	4211

ferm 220(0.2mg/mL)	3198	3430	4452	4639
					220G240N(0.1mg/mL)	3	5	14	42
220G240N(0.2mg/mL)	9	17	46	94

在由突变体SEQ ID NO:220G240N多肽催化的反应中非常少量的monatin(95.7％R,R monatin)形成。突变体SEQ ID NO:220T241N多肽损失了约50％的活性，但仍保持立体特异性(产生了99.7％R,R monatin)。这些结果与同源性(序列同一性)模拟和比对一起表明，在残基242-243周围(以及潜在地之外的)的区域，SEQ ID NO:220多肽的结构与文献中SEQ ID NO:870多肽的结构或杆菌样DAT多肽的结构不相似。因为没有x-射线晶体结构，所以SEQ ID NO:220多肽和相关DAT多肽的随机诱变、组合方法或其它定向进化方法被期望高度有效地进一步提高酶的活性。

实施例15—DAT在发酵罐中的生产

细菌生长培养基成分来自Difco,Fisher Scientific或VWR；其它试剂是商业上可购得的分析级或更高等级的。发酵在New Brunswick Scientific(Edison,NJ)BioFlo发酵罐中进行。采用带有JLA-16.250或JA-25.50转子的Beckman(Fullerton,CA)J-25I离心机进行离心。

编码具有SEQ ID NO:220中的序列并具有C-末端His-标记的多肽的DAT核酸用Nde I/Xho I限制性位点克隆到实施例16中所述的pMet1a载体。抗生素标记(bla基因)可以采用Psi I限制酶消化、载体带的凝胶纯化、载体末端的自连接、转化到大肠杆菌宿主以及在不包含甲硫氨酸的最小培养基板上选择而进一步去除。一般地，使用的是具有15个氨基酸Neidhardt’s培养基。克隆位点是NdeI/XhoI，以将SEQ ID NO:220核酸序列插入到pMET1a(参见实施例16)。

携带C-末端His-纯化标记的SEQ ID NO:220DAT多肽以补料分批方法在2.5-L规模的发酵罐中生产，其达到高的细胞密度和高水平的期望蛋白表达。用于生长大肠杆菌菌株B834(DE3)::SEQ ID NO:220cHIS pMET1的方案和结果描述如下：从新鲜培养板(Neidhardt’s+15种氨基酸，没有甲硫氨酸)开始，细胞在30℃和225rpm下在5mL补充有15种氨基酸的Neidhardt’s培养基中生长6-8h。1mL培养物被转移到2份125-mL补充有5g/L葡萄糖的生产培养基的等分试样的每一份中。瓶在30℃和225rpm下生长过夜(16-18h)。发酵罐装有2.5L包含下列的生产培养基(每L)：2.0g/L(NH₄)₂SO₄；8.0g/L K₂HPO₄；2.0g/L NaCl；1.0g/L Na₃柠檬酸盐·2H₂O；1.0g/L MgSO4·7H₂O；0.025g/L CaCl₂·2H₂O；0.05g/L FeSO₄·7H₂O；0.4mL/LNeidhardt微量营养素；和2.0g/L葡萄糖。发酵罐用10％v/v过夜培养物接种。接种3小时后，用60％w/v葡萄糖溶液进行指数型葡萄糖补料。以所需的速度供给喂料，以支持微生物以0.15h^-1的指数型速度生长。当二氧化碳释放速度(CER)已经达到100mmoles/L/h(接种后大约21小时；与15-16g DCW/L的细胞生物质相对应)的值时，基因表达通过弹丸(bolus)加入2g/L乳糖(作为20％溶液进料)进行诱导。喂料从60％w/v葡萄糖变成50％w/v葡萄糖+10％w/v乳糖，而进料速度被固定到诱导时的速度。“50％w/v葡萄糖+10％w/v乳糖”喂料被保持6小时。在发酵结束时，细胞通过在5000-7000×g下离心10min收获并且在-80℃下被冷冻为湿的细胞团。细胞团(318克)从2.8L细胞培养液中收获。

为了制备包含SEQ ID NO:220多肽的无细胞提取物，50g湿的细胞团被悬浮在150mL包含50μM磷酸吡哆醛(PLP)的50mM EPPS缓冲液(pH 8.4)中，然后采用Microfluidics均质器(Microfluidics,Newton,MA)(在18,000psi 3次通过)进行破碎，保持悬浮液的温度在15℃以下。细胞碎片通过离心去除(20,000×g，30分钟)。2mM DTT被加入到澄清的细胞提取物。

为了制备纯化的SEQ ID NO:220，2×25mL澄清细胞提取物的等分试样每个被加载到45mL Chelating Sepharose^TM Fast Flow树脂(镍(II)形式)柱中，其已经事先用包含0.05mM PLP和200mM氯化钠的50mM EPPS(pH 8.4)平衡。加载样品后，柱用3-5体积的平衡缓冲液、3-5体积的包含25mM咪唑的平衡缓冲液、3-5体积包含100mM咪唑的平衡缓冲液和3-5体积包含500mM咪唑的平衡缓冲液连续洗涤/洗脱。500mM咪唑洗脱液用Amicon(Billerica,MA)Centricon-70离心过滤设备(MWCO 10kDa)浓缩10倍。咪唑和氯化钠通过穿过用50mM包含0.05mM PLP的EPPS(pH 8.4)事先平衡的一次性GE Healthcare PD10脱盐柱而去除。脱盐溶液的蛋白浓度采用Pierce BCA测定试剂盒(Rockford,IL)进行测定。无细胞提取物馏分中每个馏分的纯度以及表达水平通过具有4-15％梯度凝胶的SDS-PAGE进行测定。大约450mg纯度～90％的蛋白从50mL澄清的细胞提取物中被回收。向10mL纯化的蛋白中加入2mM DTT。纯化的蛋白被分成等分试样(0.5-5mL)并且储存在-80℃下。

实验室规模的反应(250mL)在氮静态气提(headspace)下在0.7L Sixfors搅拌的发酵罐(Infors AG,Bottmingen,Switzerland)中进行。反应混合物包含10mM磷酸钾、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠和100mM D-色氨酸。反应混合物被调节至合适的温度，并且用氢氧化钾调节至合适的pH。实施例6中描述的醛缩酶以0.02mg/mL目标蛋白作为澄清的细胞提取物加入。SEQ ID NO:220DAT多肽以0.25mg/mL目标蛋白加入(或者作为纯化的酶或者作为澄清的细胞提取物)。

反应进程通过采用实施例3中描述的LC/MS/MS方法测量monatin浓度进行跟踪。

以D-色氨酸开始并且在测试条件下，利用SEQ ID NO:220多肽的monatin形成反应的pH最优值被发现为大约pH 8.0，并且利用SEQ ID NO:220多肽的monatin形成反应的温度最优值被发现为大约25℃。这些反应具有复杂的动力学，并且全部monatin产生反应的最佳反应条件可能与由DAT多肽催化的单个反应的最佳条件不相同。

实施例16—蛋白伴侣的共表达，以增加DAT多肽的可溶性表达

因为SEQ ID NO:894DAT多肽的可溶性表达采用标准的表达方案是低的(或者LB中1mM IPTG或者Novagen Overnight Express Autoinduction System 2，参见实施例8)，所以检测了SEQ ID NO:894多肽和各种商业上可购得的蛋白伴侣的共表达。

蛋白伴侣：

TaKaRa Chaperone Set(TAKARA BIO目录号#3340)由HSP Research Institute,Inc.开发的五组不同的蛋白伴侣组成。它们被设计成能有效地表达多分子蛋白伴侣，其已知能在折叠过程中协作工作。该组包括下列；

质粒	蛋白伴侣	启动子	诱导物	抗性标记
					pG-KJE8	dnaK-dnaJ-grpE；groES-groEL	araB；Pzt1	L-阿拉伯糖；四环素	氯霉素
pGro7	groES-groEL	araB	L-阿拉伯糖	氯霉素
					pKJE7	dnaK-dnaJ-grpE	araB	L-阿拉伯糖	氯霉素
pG-Tf2	groES-groEL-tig	Pzt1	四环素	氯霉素
					pTf16	tig	araB	L-阿拉伯糖	氯霉素

转化方案

化学感受态BL21(DE3)细胞(EMD Biosciences/Novagen目录号#69450)用20ng的一种TaKaRa蛋白伴侣和20ng SEQ ID NO:893/pET30a(编码SEQ ID NO:894多肽；对于质粒构建参见实施例C2)通过在42℃下热击30秒进行转化。转化的细胞在37℃下在0.5mL SOC培养基中回收1hr并且在包含50mg/L卡那霉素和25mg/L氯霉素的LB板上进行铺板。板在37℃下温育过夜。集落从过夜板上挑取并且被用于接种5mL包含50mg/L卡那霉素和25mg/L氯霉素的2×YT培养基。在37℃下温育过夜后，质粒采用QUIAprep Spin Miniprep试剂盒(Qiagen目录号#27104)与细胞沉淀分离。对于蛋白伴侣质粒和SEQ ID NO:893/pET30a质粒，质粒按照制造商推荐的方案通过用来自New England Biolabs(Beverly,MA)的单切割酶(one-cutter enzyme)限制性消化进行分析。

质粒	限制酶
		pG-KJE8	XhoI
pGro7	XbaI
		pKJE7	NheI
pG-Tf2	XhoI
		pTf16	XbaI

包含SEQ ID NO:893/pET30a和pKJE7的分离的DNA用NheI和XbaI消化。

表达研究

包含溶液1-6、50mg/L卡那霉素和25mg/L氯霉素的Novagen OvernightExpress^TMAutoinductionSystem 2(EMD Biosciences/Novagen目录号#71366)的瓶(每瓶中25mL)从用蛋白伴侣质粒和SEQ ID NO:893/pET30共同转化的细胞的新鲜板接种。在接种时还加入了蛋白伴侣质粒所需的诱导物。

质粒	诱导物浓度
		pG-KJE8	2mg/mL L-阿拉伯糖；10ng/mL四环素
pGro7	2mg/mL L-阿拉伯糖
		pKJE7	2mg/mL L-阿拉伯糖
pG-Tf2	10ng/mL四环素
		pTf16	2mg/mL L-阿拉伯糖

细胞在30℃下温育过夜并且当600nm下OD达到6或以上时通过离心收获。细胞用冷的50mM EPPS缓冲液(pH 8.4)洗涤，再次离心，并且立即使用或者在-80℃下冷冻。

细胞提取物通过向细胞中加入每g细胞沉淀5mL具有5μL/mL蛋白酶抑制剂混合物II(EMD Bioscience/CalBiochem目录号#539132)、1μl/mL核酸酶(EMD Biosciences/Novagen目录号#70746)和0.033μl/mL重组溶菌酶溶液(EMD Biosciences/Novagen目录号#71110)的(无伯胺)提取剂(EMDBiosciences/Novagen目录号#70923)而制备。细胞悬浮液在室温下轻轻混合下温育15min；在14,000rpm下旋转20min(4℃)并且小心地去除上清液。总蛋白浓度采用牛血清白蛋白作为标准品和微量滴定板形式使用Pierce BCA蛋白测定试剂盒(Pierce目录号#23225)进行测定。D-氨基转移酶的表达通过利用Bio-Rad Ready预浇制的4-15％聚丙烯酰胺梯度凝胶的SDS-PAGE(Bio-Rad Laboratories目录号#161-1104)进行分析。在各个凝胶上运行BioRad SDS-PAGE低范围标准品(目录号#161-0304)作为标准品。细胞提取物的等分试样(15μg蛋白)与包含2％SDS、10％甘油、12.5％2-巯基乙醇、0.1％溴酚蓝和62.5mM Tris-HCl(pH 8)的蛋白加载缓冲液进行混合，在95℃下温育5min，冷却并且然后加载在凝胶上。此外，对于各个转化体，分析组合的可溶和不可溶的蛋白表达(总蛋白)。10μl各个细胞离心前悬浮液的等分试样在90μL蛋白加载缓冲液中进行稀释，在95℃下温育10min，并且冷却。10μL各个冷却的溶液被加载在凝胶上。

可溶的蛋白凝胶显示，当蛋白伴侣GroEL-GroES(pGro7)被共表达时具有SEQID NO:894的序列的多肽的最佳可溶表达发生。

在GroEL-GroES蛋白伴侣存在下利用可选质粒的SEQ ID NO:894多肽表达也进行了检测。SEQ ID NO:893核酸利用来自New England Biolabs的限制酶NdeI和XhoI被亚克隆到pMET1a质粒中。该质粒是pET23a(EMD Biosciences/Novagen目录号#69745-3)的衍生物并且携带metE基因(在质粒的NgoMIV位点插入)并可补充大肠杆菌菌株B834(DE3)和大肠杆菌BW30384(DE3)ompTmetE(“EE2D”)的甲硫氨酸营养缺陷型。“EE2D”菌株的构建被描述在WO 2006/066072中。与pMET1a类似的质粒——其是pET23d的衍生物——的构建被描述在相同的PCT申请中。

SEQ ID NO:893/pMET1a质粒(25ng)被单独地转化到“EE2D”电感受态细胞或者用Bio-Rad Gene Pulser II系统(目录号#165-2111)采用针对大肠杆菌细胞的标准Bio-Rad电穿孔方案与pGro7(20ng)共同转化。转化的细胞在37℃下在0.5mLSOC培养基中回收1h，并且在包含100mg/L氨苄青霉素的LB板或者在包含100mg/L氨苄青霉素和25mg/L氯霉素(双质粒转化体)的板上铺板。板在37℃下温育过夜。来自每个板组的一个集落被用于接种50mL包含溶液1-6、100mg/L氨苄青霉素和2mg/mL L-阿拉伯糖的Novagen Overnight Express^TMAutoinductionSystem2。用包含pGro7质粒的细胞接种的培养物也包含25mg/L氯霉素。细胞在30℃下温育过夜并且当OD₆₀₀达到6或更大时通过离心收获。细胞沉淀用冷的50mMEPPS缓冲液(pH 8.4)洗涤，再次离心，并且立即使用或者在-80℃下冷冻。细胞提取物如上所述利用Novagen(无伯胺)提取剂进行制备。可溶和总的D-氨基转移酶的表达通过如上所述的SDS-PAGE进行分析。

凝胶显示，当GroEL-GroES蛋白被共表达时可溶SEQ ID NO:894多肽的表达更大。然而，可溶表达不如上述的pET30a构建物那么高。

在表达期间温育温度的影响也进行了检测。5mL包含100mg/L氨苄青霉素和25mg/L氯霉素的LB培养物从EE2D::SEQ ID NO:894PMET1a+pGro7的新鲜板上接种。培养物在30℃下温育过夜并且然后用于接种3个烧瓶，每个烧瓶都包含50mL包含溶液1-6、100mg/mL氨苄青霉素、25mg/L氯霉素和2mg/mL L-阿拉伯糖的Novagen Overnight Express^TMAutoinduction System 2。一个烧瓶在20℃下温育，第二个在25℃下并且第三个在30℃下。当OD₆₀₀达到6或更大时收获细胞。细胞被收获并且细胞提取物如上所述进行制备。总蛋白浓度采用牛血清白蛋白作为标准品和微量滴定板形式使用Pierce BCA蛋白测定试剂盒(Pierce目录号#23225)进行测定。D-氨基转移酶的表达按照制造商的方案利用Bio-Rad Experion Pro260Automated Electrophoresis Station进行分析，其中细胞提取物溶液被稀释至1mg/mL。结果显示在表35中。表现出最低温度给出SEQ ID NO:894多肽的最大量表达。

表35.

活性测定方案

与GroEL-GroES蛋白伴侣共表达的SEQ ID NO:894DAT的酶活性按照标准monatin反应方案进行测试。简单地说，各个测定管包含下列(总计2mL)：0.050mg/mL细胞提取物中的醛缩酶(假定20％可溶表达)；1.0mg/mL细胞提取物中的D-氨基转移酶(假定对包含SEQ ID NO:894多肽的提取物20％可溶表达)或纯化的球形芽孢杆菌D-氨基转移酶；0.01％吐温-80；200mM丙酮酸钠；100mM D-色氨酸；100mM EPPS(pH 8.2)；1mM MgCl₂；0.05mM PLP；和10mM磷酸钾。

反应在室温下Coy Laboratory Products,Inc.厌氧室中温育，以使氧气暴露最小化。除了酶之外的所有成分被混合在一起(色氨酸直到加入酶后至少1h才完全溶解)。通过加入酶启动反应。在1、4、8和22h时取样。也进行利用1mg/mL纯化的球形芽孢杆菌DAT的对照反应。该DAT的构建、表达和纯化被描述在实施例6中。底物和产物的浓度如实施例3中所述进行测量。

结果显示在表36中。在22h，当SEQ ID NO:894多肽存在时monatin浓度为9.2mM并且当使用球形芽孢杆菌酶时为12.4mM。当SEQ ID NO:894多肽在测定混合物中时共产物HMG的浓度显著更少(当与包含球形芽孢杆菌酶的测定样品相比较时<1/3浓度)。HMG浓度通过比较OPA衍生样品的峰面积进行评价。

表36.Monatin形成(mM)

多肽(SEQ ID NO:)	1h	4h	8h	22h
					894DAT+GroEL-ES	1.3	4.5	6.8	9.2
球形芽孢杆菌DAT	1.6	5.7	8.3	12.4

实施例17—ArcticExpress ^TM 系统用于增加可溶DAT多肽表达

因为SEQ ID NO:894多肽的可溶表达采用标准表达方法是低的(或者LB中1mM IPTG或者Novagen Overnight Express^TM AutoinductionSystem 2—参见实施例8)，所以对Stratagene ArcticExpress^TM系统中SEQ ID NO:893/pMET1a质粒的表达进行检测。

Stratagene ArcticExpress^TM系统包含携带嗜冷蛋白伴侣Cpn10和Cpn60的大肠杆菌感受态细胞。这些是从嗜冷生物体Oleispira antarctica中分离的蛋白伴侣。Cpn10和Cpn60分别与大肠杆菌蛋白伴侣GroEL和GroES显示出高的序列相似性；并且在4-12℃下具有高的蛋白折叠活性。ArcticExpress^TM宿主细胞源自大肠杆菌BL21菌株。不但这些细胞缺乏Lon蛋白酶，而且它们已经被工程改造得同样缺乏OmpT蛋白酶。

转化方案

质粒SEQ ID NO:893/pMET1a(被描述在实施例16中)按照制造商的方法被转化到化学感受态的ArcticExpress^TM(DE3)细胞(目录号#230192)。转化的细胞在37℃下在0.5mL SOC培养基中回收1hr并且在包含100mg/L氨苄青霉素的LB板上进行铺板。板在37℃下温育过夜，然后储藏在4℃下。

表达方案

来自转化板的集落被用于接种5mL包含100mg/L氨苄青霉素和10mg/L庆大霉素的2xYT培养基并且在30℃下温育过夜。包含溶液1-6、100mg/L氨苄青霉素和12mg/L庆大霉素的Novagen Overnight Express^TMAutoinductionSystem 2(EMDBiosciences/Novagen目录号#71366)的烧瓶用过夜培养物进行接种。在30℃下温育6h后，Overnight Express^TM培养物被移至15℃或20℃或25℃温育器中。温育继续直至培养物600nm下的OD达到6或更大。细胞通过离心收获，用冷的50mMEPPS,pH 8.4洗涤，并且细胞沉淀在-80℃下被冷冻。

细胞提取物通过向细胞中加入每g细胞沉淀5mL具有5μL/mL蛋白酶抑制剂混合物II(EMD Bioscience/CalBiochem目录号#539132)、1μl/mL Benzonase核酸酶(EMD Biosciences/Novagen目录号#70746)和0.033μl/mL r-Lysozyme^TM溶液(EMDBiosciences/Novagen目录号#71110)的BugBuster^R(无伯胺)提取剂(EMDBiosciences/Novagen目录号#70923)而制备。细胞悬浮液在室温下轻轻混合下温育15min；在14,000rpm下旋转20min(4℃)并且小心地去除上清液。总蛋白浓度采用牛血清白蛋白作为标准品和微量滴定板形式使用Pierce BCA蛋白测定试剂盒(Pierce目录号#23225)进行测定。D-氨基转移酶的表达按照制造商的方法利用Bio-Rad Experion Pro260Automated Electrophoresis Station进行分析，其中细胞提取物溶液被稀释至1mg/mL。

电泳结果表明，当与没有蛋白伴侣的表达比较时或者当与实施例16中所述的与大肠杆菌GroEL-GroES蛋白伴侣共表达时ArcticExpress^TM系统显著增加了SEQID NO:894多肽的可溶性表达。可溶性表达在较低温度时较高，但在25℃仍非常高。

活性测定方案：

在ArcticExpress^TM系统中表达的SEQ ID NO:894多肽的酶活性通过如在实施例6中描述的在醛缩酶的存在下跟踪monatin形成进行测试。各个测定管包含下列(总计2mL)：0.010mg/mL细胞提取物中的醛缩酶(假定20％可溶表达)；1.0或2.0mg/mL细胞提取物中的SEQ ID NO:894多肽(假定对包含SEQ ID NO:894多肽的提取物20％可溶表达)或纯化的球形芽孢杆菌D-氨基转移酶；0.01％吐温-80；200mM丙酮酸钠；100mM D-色氨酸；100mM EPPS(pH 8.2)；1mM MgCl₂；0.05mMPLP；和10mM磷酸钾。

反应在室温下Coy Laboratory Products,Inc.厌氧室中温育，以使氧气暴露最小化。除了酶之外的所有成分被混合在一起(色氨酸直到加入酶后至少1h才完全溶解)。通过加入酶启动反应。在1、4、7和22h时取样。也进行利用1或2mg/mL纯化的球形芽孢杆菌D-氨基转移酶的对照反应。底物和产物的浓度如实施例3中所述进行测量。结果显示在表37中。在22h，monatin浓度当SEQ ID NO:894多肽以1mg/mL存在时为8.2mM并且在2mg/mL DAT多肽时10.5mM。当球形芽孢杆菌酶以1mg/mL加入时，22h时monatin的浓度为10.7mg/mL；在2mg/mL时，monatin浓度为14.5mM。在两种酶和酶浓度下，产物的立体纯度(如实施例3中的FDAA衍生方案测定)为>98％R,R。当使用SEQ ID NO:894多肽时共产物HMG的浓度显著更少(当与包含任意酶浓度的球形芽孢杆菌酶的测定样品相比较时～1/3浓度)。HMG浓度通过比较OPA衍生样品的峰面积进行评价。

表37.Monatin形成(mM)

多肽(SEQ ID NO:)	1h	4h	7h	22h
					894DAT(1mg/mL)	0.9	2.3	3.6	8.3
894DAT(2mg/mL)	1.4	3.7	6.3	10.5
					球形芽孢杆菌DAT(1mg/lmL)	1.0	4.2	6.1	10.7
球形芽孢杆菌DAT(2mg/lmL)	1.5	6.7	8.2	14.5

实施例18—Stratagene ArcticExpress ^TM 系统增加可溶性DAT表达的应用转化方案：

pET30a中质粒SEQ ID NO:891/pET30a(编码SEQ ID NO:892多肽)、SEQ IDNO:873/pET30a(编码SEQ ID NO:874多肽)和拜氏梭菌DAT(CbDAT)按照制造商的方案被转化到化学感受态Stratagene ArcticExpress^TM(DE3)细胞(目录号#230192)中。这些基因的克隆被描述在实施例4中并且测定结果在实施例9中。转化的细胞在37℃下在0.5mL SOC培养基中回收1h并且在包含100mg/L氨苄青霉素和13mg/L庆大霉素的LB板上进行铺板。板在室温下温育2天，然后储藏在4℃下。

表达方案：

来自转化回收板的集落被用于接种5mL包含500mg/L卡那霉素和13mg/L庆大霉素的2xYT培养基；液体培养物在30℃下温育6h。包含溶液1-6与100mg/L氨苄青霉素和13mg/L庆大霉素的Novagen Overnight Express^TMAutoinductionSystem 2(EMD Biosciences/Novagen目录号#71366)的烧瓶从5mL培养物接种。在30℃下温育5-6h后，培养物被移至15℃温育器中。15℃温育继续直至培养物的OD₆₀₀达到6或更大。细胞通过离心收获，用冷的50mM EPPS,pH 8.4洗涤，然后细胞沉淀在-80℃下被冷冻。

细胞提取物通过向细胞中加入每g细胞沉淀5mL具有5μL/mL蛋白酶抑制剂混合物II(EMD Bioscience/CalBiochem目录号#539132)、1μl/mL Benzonase核酸酶(EMD Biosciences/Novagen目录号#70746)和0.033μl/mL r-Lysozyme^TM溶液(EMD Biosciences/Novagen目录号#71110)的(无伯胺)提取剂(EMDBiosciences/Novagen目录号#70923)而制备。细胞悬浮液在室温下轻轻混合下温育15min；在14,000rpm下旋转20min(4℃)并且小心地去除上清液。总蛋白浓度采用牛血清白蛋白作为标准品和微量滴定板形式使用Pierce BCA蛋白测定试剂盒(Pierce目录号#23225)进行测定。DAT的表达按照制造商的方案利用Bio-RadExperion Pro260Automated Electrophoresis Station进行分析，其中细胞提取物溶液被稀释至1mg/mL。结果显示在表38和39中。

电泳结果表明，以可溶形式表达的SEQ ID NO:874多肽比利用ArcticExpress^TM系统的SEQ ID NO:892多肽形成得稍好。Cb DAT的可溶表达根据转化板中拣出的集落而变化。利用ArcticExpress^TM系统以可溶形式表达的这些DAT多肽以及实施例16中描述的SEQ ID NO:894多肽没有一个被表达。

表38.

表39

活性测试方案

在ArcticExpress^TM系统中表达的DAT多肽的酶活性通过如在实施例6中描述的在醛缩酶的存在下跟踪monatin形成进行测试。各个测定管包含下列(总计3mL)：0.050mg/mL细胞提取物中的醛缩酶(估计20％可溶表达)；0.5mg/mL细胞提取物中的DAT多肽(由Expersion数据估计可溶表达)或纯化的球形芽孢杆菌DAT；0.01％吐温-80；200mM丙酮酸钠；100mM D-色氨酸；50mM EPPS(pH 8.2)；1mM MgCl₂；0.05mM PLP；和10mM磷酸钾。

反应在室温下Coy Laboratory Products,Inc.厌氧室中温育，以使氧气暴露最小化。除了酶之外的所有成分被混合在一起(色氨酸直到加入酶后至少1h才完全溶解)。通过加入酶启动反应。在2、4.5、9和24h时取样。也进行利用纯化的球形芽孢杆菌D-氨基转移酶的对照反应。底物和产物的浓度如实施例3中所述进行测量。在24h，包含SEQ ID NO:892或894多肽的测定已经产生与对照球形芽孢杆菌DAT反应大约相同的monatin滴定度。拜氏梭菌DAT反应产生小于1/8的monatin产物，而SEQ ID NO:874多肽产生约一半。对于SEQ ID NO:892多肽，24h时产物的立体纯度(如实施例3中FDAA衍生方案)为96％R,R monatin或者更大。对于利用SEQ ID NO:892、SEQ ID NO:894和球形芽孢杆菌DAT多肽的反应，测量副产物HMG(4-羟基-4-甲基谷氨酸)的浓度。利用具有SEQ ID NO:894中所示序列的多肽的测定比其它两种(由包含球形芽孢杆菌DAT的测定所产生的副产物的约20％以及由具有SEQ ID NO:892多肽的测定所产生的副产物的约40％)产生少得多的HMG副产物。HMG浓度通过比较OPA柱后衍生样品的峰面积进行估测。

表40.Monatin形成(mM)

多肽(SEQ ID NO:)	2h	4.5h	9h	24h
					拜氏梭菌DAT	0.3	0.7	0.8	0.9
874DAT	1.8	3.2	4.1	4.4
					892DAT	1.6	3.7	5.4	8.4
894DAT	1.4	2.8	4.5	8.4
					球形芽孢杆菌DAT	1.2	2.9	4.3	8.1

这些结果表明，当在合适的条件下表达时，具有SEQ ID NO:892和894的序列的多肽可在反应中利用从而以与阳性对照酶一样高的滴定度产生高纯度的R,Rmonatin。

实施例19—可选表达宿主增加DAT可溶表达的评价

因为当核酸在BL21(DE3)中表达时SEQ ID NO:894多肽的可溶表达低(参见实施例8)，所以对用于提高可溶表达的可选表达宿主进行评价。OverExpress^TMC41(DE3)和C43(DE3)宿主包含遗传突变，其被表型选择用于赋予抗毒性，并且在比其它大肠杆菌宿主高的滴定度下表达一些有毒蛋白。

转化方案

质粒SEQ ID NO:893/pET30a按照制造商的方案利用Bio-Rad Gene Pulsar II系统转化到OverExpress^TM C41(DE3)和C43(DE3)(Lucigen目录号分别为#60341和60345)的电感受态细胞中。转化混合物在37℃下在1mL SOC培养基中回收1hr并且在包含50mg/L卡那霉素的LB板上铺板。板在37℃下温育过夜。多个集落被补充到新鲜板上并且采用集落PCR分析合适的插入物大小。小的细胞等分试样被悬浮在0.025mL H₂O中并且在95℃下温育10min。冷却后，2μL各个悬浮液被用作0.025mL反应中的模板，每个还包含0.5μL T7启动引物(0.1mM)、0.5μL T7终止引物(0.1mM)、0.5μL PCR核苷酸混合物(Roche#12526720；10mM各种核苷酸)、2.5μL Roche Expand DNA聚合酶缓冲液#2和0.5μL Expand DNA聚合酶(Roche Expand High Fidelity PCR System目录号#1732650)。3-步热循环程序运行25-30个循环：94℃下1min；54℃下1min；72℃下1.3min，最终的补齐步骤在72℃下7min。

表达研究

包含溶液1-6和50mg/L卡那霉素的Novagen Overnight Express^TMAutoinductionSystem 2(EMD Biosciences/Novagen目录号#71366的烧瓶(每个烧瓶中40mL)由转化的C41(DE3)和C43(DE3)细胞补丁板(对于每个转化2个补丁)接种。细胞在30℃下温育过夜并且当OD₆₀₀达到6或以上时通过离心收获。细胞用冷的缓冲液洗涤，再次离心并且立即使用或者在–80℃下冷冻。

细胞提取物通过向细胞中加入每g细胞沉淀5mL具有5μL/mL蛋白酶抑制剂混合物II(EMD Bioscience/CalBiochem目录号#539132)、1μl/mL Benzonase^R核酸酶(EMD Biosciences/Novagen目录号#70746)和0.033μl/Ml r-Lysozyme^TM溶液(EMD Biosciences/Novagen目录号#71110)的BugBuster^R(无伯胺)提取剂(EMDBiosciences/Novagen目录号#70923)而制备。细胞悬浮液在室温中轻轻混合下温育15min；在14,000rpm下旋转20min(4℃)并且小心地去除上清液。总蛋白浓度采用牛血清白蛋白作为标准品和微量滴定板形式使用Pierce BCA蛋白测定试剂盒(Pierce目录号#23225)进行测定。DAT多肽的表达通过利用Bio-Rad Ready Gel^R预浇制的4-15％聚丙烯酰胺梯度凝胶(Bio-Rad Laboratories目录号#161-1104)的SDS-PAGE进行分析。在每个凝胶上运行BioRad SDS-PAGE低范围标准品(目录号#161-0304)作为标准品。细胞提取物的等分试样(15μg蛋白)与包含2％SDS、10％甘油、12.5％2-巯基乙醇、0.1％溴酚蓝和62.5mM Tris-HCl(pH 8)的蛋白加载缓冲液进行混合，在95℃下温育5min，冷却并且然后加载在凝胶上。此外，对于各个转化体，分析合并的可溶和不可溶的蛋白表达(总蛋白)。10μl每个细胞悬浮液的等分试样在离心前在90μL蛋白加载缓冲液中进行稀释，在95℃下温育10min，并且冷却。10μL每个冷却的溶液被加载在凝胶上。

电泳凝胶显示，蛋白在C41(DE3)宿主中比在C43(DE3)宿主中表达得好，然而表观可溶表达不高于使用BL21(DE3)细胞之时。

实施例20—为增加DAT可溶表达的低温表达的评价

因为当基因在大肠杆菌菌株BL21(DE3)中表达时SEQ ID NO:894D-氨基转移酶的可溶表达低(参见实施例8)，基因被插入在具有冷激蛋白A启动子的载体中以评价低温表达。

Takara pCold表达载体是四种不同的载体，其利用冷激蛋白A(cspA)启动子，用于在大肠杆菌中表达高纯、高产率的重组蛋白。这些载体选择性地诱导低温(15℃)下目标蛋白合成，其中其它蛋白的合成被抑制并且蛋白酶活性降低。除了cspA启动子外，所有四种载体都包含lac操纵子(用于控制表达)、氨苄青霉素抗性基因(amp^r)、ColE1复制起点、M13IG片段和多克隆位点(MCS)。其中三种载体也包含翻译增强元件(TEE)、His-标记序列和/或因子Xa切割位点。

克隆方案

来自质粒SEQ ID NO:894pET30a的SEQ ID NO:894DAT核酸在pCOLDII(包含TEE和His-标记序列)、pCOLDIII(包含TEE)和pCOLDIV载体的NdeI和XhoI位点被亚克隆到Takara pCold载体中。消化的载体和插入物带按照制造商的方法采用QIAquick凝胶提取试剂盒(Qiagen目录号#28704)进行凝胶纯化并且采用Roche快速DNA连接试剂盒(目录号#1635379)进行连接。连接混合物通过在42℃下热激被转化到Invitrogen OneShot TOP10化学感受态细胞(目录号#C404003)中。37℃下在500μL SOC培养基中回收1h后，转化混合物在包含100mg/L氨苄青霉素的LB板上铺板并且在37℃下温育过夜。集落从转化板上拣出并且被用于接种5mL包含100mg/mL氨苄青霉素的LB的培养物，其在37℃下温育过夜。质粒DNA利用QIAprep^R Spin Miniprep试剂盒(Qiagen目录号#27104)从5mL培养物中纯化。插入物通过测序证实用NdeI和XhoI的限制性消化(Agencourt Bioscience Corp,Beverly,MA)。

SEQ ID NO:894dat pCOLD质粒按照制造商的方案被转化到化学感受态的Stratagene ArcticExpress^TM(DE3)细胞和Novagen BL21(DE3)细胞。转化混合物在37℃下在0.5-1mL SOC培养基中回收1h并且在包含100mg/mL氨苄青霉素和13mg/L庆大霉素(ArcticExpress^TM(DE3))或者100mg/mL氨苄青霉素(BL21(DE3))的LB板上铺板。板在37℃下温育过夜。

表达研究

包含溶液1-6和100mg/mL氨苄青霉素和13mg/L庆大霉素(ArcticExpress^TM(DE3))或者100mg/mL氨苄青霉素(BL21(DE3))的NovagenOvernight Express^TM AutoinductionSystem 2(EMD Biosciences/Novagen目录号#71366)的烧瓶由转化细胞的补丁板接种(对于SEQ ID NO:893/pCOLDII、SEQ IDNO:893/pCOLDIII和SEQ ID NO:893/pCOLDIV转化中每一种2个补丁)。

在30℃下温育5-6h后，培养物被移至15℃温育器中。15℃温育继续直至培养物的600nm下OD达到6或更大。细胞通过离心收获，用冷的缓冲液洗涤，然后细胞沉淀在-80℃下被冷冻。

细胞提取物通过向细胞中加入每g细胞沉淀5mL具有5μL/mL蛋白酶抑制剂混合物II(EMD Bioscience/CalBiochem目录号#539132)、1μl/mL Benzonase^R核酸酶(EMDBiosciences/Novagen目录号#70746)和0.033μl/mL r-Lysozyme^TM溶液(EMDBiosciences/Novagen目录号#71110)的BugBuster^R(无伯胺)提取剂(EMDBiosciences/Novagen目录号#70923)而制备。细胞悬浮液在室温中轻轻混合下温育15min；在14,000rpm下旋转20min(4℃)并且小心地去除上清液。总蛋白浓度采用牛血清白蛋白作为标准品和微量滴定板形式使用Pierce BCA蛋白测定试剂盒(Pierce目录号#23225)进行测定。D-氨基转移酶的表达按照制造商的方案利用Bio-Rad Experion Pro260Automated Electrophoresis Station进行分析，其中细胞提取物溶液被稀释至1mg/mL。结果显示在表41和42中。

表41

泳道	样品	估计的％DAT表达
			L	Pro260梯度
1	BL21(DE3)::SEQ ID NO:893/pCOLDII#1	8.7
			2	BL21(DE3)::SEQ ID NO:893/pCOLDII#2	8.5
3	ArcticExpress^TM(DE3)::SEQ ID NO:893/pCOLDII#1	9.8
			4	ArcticExpress^TM(DE3)::SEQ ID NO:893/pCOLDII#2	6.4

表42

泳道	样品	估计的％DAT表达
			L	Pro260梯度
1	BL21(DE3)::SEQ ID NO:893/pCOLDIII#1	4.3
			2	BL21(DE3)::SEQ ID NO:893/pCOLDIII#2	2.3
3	BL21(DE3)::SEQ ID NO:893/pCOLDIV#1	14.6
			4	BL21(DE3)::SEQ ID NO:893/pCOLDIV#2	14.2
5	BL21(DE3)::SEQ ID NO:893/pCOLDIII#1	4.4
			6	BL21(DE3)::SEQ ID NO:893/pCOLDIII#2	5.2
7	BL21(DE3)::SEQ ID NO:893/pCOLDIV#1	13.8
			8	BL21(DE3)::SEQ ID NO:893/pCOLDIV#2	16.1
9	BL21(DE3)::SEQ ID NO:893/pCOLDIV#1	16.2
			10	BL21(DE3)::SEQ ID NO:893/pCOLDIV#2	16.8

Experion Pro260结果显示，SEQ ID NO:894DAT蛋白当核酸被整合在pCOLDIV载体中时比在pCOLDII或pCOLDIII载体中表达得好。从上面所示的实验中，SEQ ID NO:893/pCOLDII的平均表达水平为约8％，不论所使用的表达宿主是什么；SEQ ID NO:893/pCOLDIII的平均表达水平为约4％，而SEQ IDNO:893/pCOLDIV的平均表达水平为～15％。这些表达水平明显比当SEQ IDNO:893核酸与GroEL-GroES蛋白伴侣共同表达时的实施例16以及当核酸在Stratagene ArcticExpress^TM系统中被表达时的实施例17中所述的表达水平低。

实施例21—DAT的密码子修饰

假定减慢大肠杆菌中的翻译速度将允许SEQ ID NO:894多肽有更多的时间以正确折叠由此产生可溶蛋白的更高表达，尝试了提高大肠杆菌中表达的SEQ IDNO:894多肽的溶解度。SEQ ID NO:894多肽序列的BLAST检索(NCBI)表明，一些最近紧密相关的公开序列来自梭菌属的种，尤其拜氏梭菌。实施例9描述了克隆、表达和测定CbDAT及其在monatin形成反应中应用的结果。具体地，总蛋白部分中的表达高但可溶蛋白部分中的表达非常低。

比较了拜氏梭菌和大肠杆菌K12的密码子使用表。拜氏梭菌中几个很少使用的密码子发现在大肠杆菌K12中非常丰富(表43)。可能这些罕见密码子在拜氏梭菌中引起翻译中止，而在大肠杆菌K12宿主中可能没有中止。在SEQ ID NO：894序列中，鉴定了4个双联体，其中拜氏梭菌的串联罕见密码子在大肠杆菌K12中已经变得“不罕见”(即丰富)。目标是利用大肠杆菌K12密码子使用表将这些密码子变成罕见密码子，用于在大肠杆菌K12宿主中表达。对引物进行设计以改变这些双联体。SEQ ID NO：893/pET30a(被描述在实施例4中)被用作模板并且根据Stratagene QuickChange试剂盒说明进行突变。用于修饰SEQ ID NO：893核酸序列的引物与天然基因一起被显示在下面(目标双联体序列被加以下划线)。

表43.

＞SEQ ID NO：893天然序列

ATGGACGCACTGGGATATTACAACGGAAAATGGGGGCCTCTGGACGAGATGACCGTGCCGATGAACGACAGGGGTTGTTTCTTTGGGGACGGAGTGTACGACGCTACCATCGCCGCTAACGGAGTGATCTTTGCCCTGGACGAGCACATTGACCGGTTTTTAAACAGCGCAAAGCTCCTGGAAATAGAAATCGGTTTTACAAAAGAGGAATTAAAAAAAACTTTTTTTGAAATGCACTCCAAAGTGGATAAAGGGGTGTACATGGTTTATTGGCAGGCGACTCGCGGAACAGGCCGTCGAAGCCATGTATTTCCGGCAGGTCCCTCAAATCTCTGGATTATGATTAAGCCCAATCACGTCGACGATCTTTATAGAAAAATCAAGCTCATTACCATGGAAGATACCCGCTTCCTCCACTGCAACATCAAGACCCTTAACCTTATTCCCAATGTCATTGCCTCCCAGCGGGCGCTGGAAGCGGGCTGCCACGAGGCGGTCTTTCACCGGGGTGAAACAGTAACCGAGTGCGCCCACAGCAATGTCCACATCATTAAAAACGGCAGGTTTATCACCCACCAGGCGGACAACCTAATCCTTCGGGGCATAGCCCGTAGCCATTTATTGCAAGCCTGTATCAGGCTGAACATTCCATTTGACGAACGGGAATTTACCCTTTCGGAATTATTTGACGCGGATGAGATTCTTGTGTCCAGCAGCGGCACACTCGGCCTTAGCGCCAATACAATTGATGGAAAAAACGTGGGGGGAAAAGCGCCGGAACTGCTAAAAAAAATTCAGGGCGAAGTGTTGAGGGAATTTATCGAAGCGACAGGCTACACGCCTGAGTGGAGCACAGTATAG

用于双联体1突变体的引物

用于双联体2突变体的引物

用于双联体3突变体的引物

用于双联体4突变体的引物

具有正确改变的序列的克隆被转化入BL21(DE3)宿主，以进行酶表达测定。酶表达通过在Overnight Express II中生长细胞过夜并且用BugBuster试剂裂解细胞接着对粗制细胞提取物和可溶蛋白进行SDS PAGE分析而进行测定。

呈现出，双联体1、2和3具有密码子变化的可溶蛋白表达有轻微的提高。双联体4上的密码子变化对可溶蛋白表达不利。双联体1、2和3的密码子变化利用Stratagene QuickChange试剂盒成对组合，并且引物被设计用于初始密码子变化。具有正确改变的序列的克隆被转化入BL21(DE3)宿主，以进行酶表达测定。酶表达通过在Overnight Express II中生长细胞过夜并且用BugBuster试剂裂解细胞接着对粗制细胞提取物和可溶蛋白进行SDS PAGE分析而进行测定。双联体1和2、2和3以及1和3的突变的组合在SDS-PAGE凝胶上产生可视的可溶蛋白带。然而，在总蛋白部分中仍呈现出具有更多的蛋白。

实施例22—DAT多肽的周质表达的评价

因为当基因产物在大肠杆菌宿主BL21(DE3)中作为细胞质蛋白被表达时SEQID NO:894多肽的可溶表达低(参见实施例8)，所以基因被克隆到载体中以产生融合蛋白，其应当被输出到周质空间。周质提供促进正确折叠和二硫键形成并且可提高某些目标蛋白的溶解度和活性的条件。

克隆入EMD Biosciences/Novagen pET26b中允许产生具有周质信号序列的目标蛋白。信号序列通过伴有出口的信号肽酶切割。EMD Biosciences/NovagenpET39b和pET40b被设计用于融合有208氨基酸DsbA-Tag^TM或236氨基酸DsbC-Tag^TM的目标蛋白的克隆和表达。DsbA和DsbC是分别催化二硫键的形成和异构化的周质酶。融合蛋白通常位于周质中。

克隆方案

来自质粒SEQ ID NO:893/pET30a的SEQ ID NO:893核酸(被描述在实施例4中)在载体的EcoRI和NotI位点被克隆到EMD Biosciences/Novagen pET26b(目录号#69862-3)、pET39b(目录号#70090-3)和pET40b(目录号#70091-3)载体。具有5’EcoRI位点和3’NotI位点的DATs核酸利用实施例4中所述的扩增方案和下列引物产生：

限制性位点在引物序列中是以斜体字形式。所得DNA产物和pET26b、pET39b和pET40b载体按照建议的制造商的方案用EcoR1和Not I(New England Biolabs)进行消化。载体反应混合物随后用Shrimp碱性磷酸酶(Roche目录号#1758250)进行处理。消化的载体和插入物带利用Qiagen QIAquick^R凝胶提取试剂盒(目录号#28704)从1％琼脂糖凝胶中进行凝胶纯化并且利用Roche快速连接试剂盒(目录号#1635379)按照制造商的方案进行连接。连接混合物通过在42℃下热激转化入Invitrogen OneShot^RTOP10化学感受态细胞(目录号#C404003)中。在37℃下在500μL SOC培养基中回收1h后，转化混合物在包含50mg/L卡那霉素的LB板上铺板并且在37℃下温育过夜。集落从转化板上拣出并且被用于接种5mL包含50mg/mL卡那霉素的LB的培养物，其在37℃下温育过夜。质粒DNA利用QiagenQIAprep Spin Miniprep试剂盒(Qiagen目录号#27104)从5mL培养物中纯化。核酸序列通过测序(Agencourt Bioscience Corp,Beverly,MA)证实。具有正确插入序列的质粒如上所述通过热激转化到EMD Biosciences/Novagen BL21(DE3)化学感受态细胞(目录号#69450)中。

表达研究

包含溶液1-6和50mg/L卡那霉素的Novagen Overnight Express^TMAutoinductionSystem 2(EMD Biosciences/Novagen目录号#71366)的烧瓶(每个烧瓶中50mL)由在pET26b、pET39b或pET40b中包含SEQ ID NO:893DAT核酸(编码SEQ ID NO:894的多肽)的BL21(DE3)细胞的新鲜板接种。细胞在30℃下温育过夜并且当OD₆₀₀达到6或以上时通过离心收获。细胞用冷的缓冲液洗涤，再次离心并且立即使用或者细胞沉淀在–80℃下冷冻。在收获之前，2mL培养物等分试样从各个烧瓶中获取，用于可溶和总蛋白(可溶和不可溶)表达分析。细胞提取物如实施例16中所述制备。总蛋白样品通过将少量细胞沉淀悬浮在包含2％SDS、10％甘油、12.5％2-巯基乙醇、0.1％溴酚蓝和62.5mM Tris-HCl pH 8的蛋白加载缓冲液中，并且在95℃下温育10min而制备。

按照EMD Biosciences/Novagen pET System手册中描述的方案，周质细胞部分从每个培养物的细胞剩余物制备。所得部分利用Amicon Ultracel 10k离心过滤设备(Millipore目录号#UFC901024)浓缩30倍。细胞提取物和周质部分的总蛋白浓度采用牛血清白蛋白作为标准品和微量滴定板形式使用Pierce BCA蛋白测定试剂盒(Pierce目录号#23225)进行测定。50μg细胞提取物的蛋白样品和10μg周质部分的蛋白样品利用Bio-Rad Ready Gel^R预浇制的4-15％聚丙烯酰胺梯度凝胶(Bio-RadLaboratories目录号#161-1104)通过SDS-PAGE进行分析。此外，总蛋白样品通过SDS-PAGE进行分析。在各个凝胶上运行作为标准品的BioRad SDS-PAGE低范围标准品(目录号#161-0304)。

总蛋白SDS-PAGE凝胶的分析显示，具有预测分子量的蛋白利用OvernightExpress^TM AutoinductionSystem 2进行表达。然而，加载有细胞提取物部分或周质部分的SDS-PAGE凝胶的分析显示这些蛋白不可溶地表达，它们也没有被输出到周质。

实施例23—从吲哚-3-丙酮酸产生monatin

当D-色氨酸和丙酮酸是实施例5中描述的monatin形成测定中的起始原料时获得的monatin的最大浓度受到色氨酸溶解度的限制。为了研究利用醛缩酶和SEQID NO:220DAT多肽(被描述在实施例14)在达到较高monatin浓度方面的潜能，对以吲哚-3-丙酮酸盐(I3P)和丙酮酸作为原料起始的反应进行分析。在该情况下，提供氨基供体诸如D-丙氨酸或者D-丙氨酸和D-色氨酸两者也是必需的。

利用纯化的SEQ ID NO:220DAT多肽(生产和纯化被描述在实施例15)和醛缩酶(被描述在实施例6)进行测试。反应如下建立(总计1mL)：200mM吲哚-3-丙酮酸盐(I3P)；200mM丙酮酸钠；400mM D-丙氨酸；100mM EPPS,pH 8.0；1mMMgCl₂；0.05mM PLP；和10mM磷酸钾。

过量地加入两种酶以促进向monatin转化，以最小化与非酶促降解反应的竞争。反应在室温下Coy Laboratory Products,Inc.厌氧室中温育，以使氧气暴露最小化。除了酶之外的所有成分被混合在一起并且将pH调节至8.0。反应通过加入酶(0.04mg/mL作为细胞提取物的醛缩酶(假设20％表达)和0.40mg/mL纯化的SEQID NO:220DAT多肽)启动。

在如下表中所示的一些测试中，除了D-丙氨酸之外，还加入50或100mM的D-色氨酸以作为氨基供体并且还限制了在D-色氨酸形成中消耗的吲哚-3-丙酮酸盐的量。利用实施例3中所述的方法在18小时后测量Monatin形成，并且结果显示在下面的表44中。

表44.从I3P形成Monatin(mM)

反应物起始浓度(mM)	Monatin浓度(mM)
		200I3P；200pyr:400D-ala	44.9
200I3P；200pyr:400D-ala,50D-trp	47.8
		200I3P；200pyr:400D-ala,100D-trp	61.0

如上所示，氨基转移酶和醛缩酶在较高的反应物浓度下具有活性并且达到了更高的monatin浓度。

在18h，当使用200mM吲哚-3-丙酮酸盐、200mM丙酮酸钠和100mM D-色氨酸时，monatin的浓度为61mM。相比使用仅400mM D-丙氨酸，对于加入50mM D-色氨酸，在测定条件下观察到monatin生产的少量增加(47.8mM)。

实施例24—同源性表

表45显示了来自公开的数据库或文献的一些最具活性的DAT多肽及其相应的最接近的同源物。

表45

如实施例9中所示，具有SEQ ID NO:866、946、220和176中所示序列的多肽的同源物被克隆并且在R,R monatin的生产中也具有活性，尽管那些多肽之间的序列同一性在49％和63％之间。类似地，来自海洋杆菌属的预期D-丙氨酸转氨酶以及Robinginitalea biformata氨基转移酶被预期具有如具有SEQ ID NO:882和918的序列的DAT多肽一样宽的D-氨基酸氨基转移酶活性。

实施例25—GSSM ^SM 突变体的构建和测试

该实施例描述了示例性核酸和多肽的构建，并且描述了它们的酶促活性。核苷酸序列(SEQ ID NO:219)被亚克隆到pSE420-C-His载体并且在大肠杆菌XL1-BLUE宿主(Stratagene,La Jolla,CA)中表达以生产具有SEQ ID NO:220中所示氨基酸序列的示例性D-氨基转移酶(DAT)。pSE420-C-His载体通过向来自Invitrogen(Carlsbad,CA)的pSE420载体加入C-末端His-标记而产生。构建物SEQID NO:220(在大肠杆菌XL1-BLUE中)被用作起始序列，其中引入了修饰并且其在本文中被称为野生型(WT)序列。第一轮修饰(即单残基突变)采用基因位点饱和诱变^SM(GSSM^SM)技术进行(参见例如美国专利号6,171,820)。采用GSSM^SM技术制备的突变体被表达在大肠杆菌宿主XL1-BLUE中的pSE420-C-His载体中，被排列到384-孔板中并且在37℃下生长过夜。样品在30℃下亚培养和生长两晚(36-48小时)。培养物在-20℃下冷冻直至可以制备细胞裂解物。

细胞通过向各个细胞中加入10μL BPER II(Thermo Scientific,Rockford,IL)进行裂解。样品被混合三次并且在冰上裂解1小时。粗制裂解物然后在初级筛选中进行测定。25μL粗制裂解物在室温下用50mM磷酸钠(pH 8)中的1mMR,R-monatin、25mM丙酮酸钠盐、0.08mM PLP进行测试。三个小时后，取等分试样并且加入甲酸至最终浓度2％。样品用水稀释至标准曲线范围内。采用实施例1中描述的LC/MS/MS方法(用于检测D-丙氨酸或R,R-monatin的LC/MS/MS方法)分析样品的monatin消耗和丙氨酸形成。将样品性能与野生型对照(即SEQ IDNO:220)的性能进行比较。

比野生型对照好的突变体被选作GSSM^SM初级筛选的命中(hit)。初级命中的甘油储存液被用于接种新的384-孔板。命中被测定四次，生长并且如初级筛选所示进行裂解。初级命中然后在二次筛选中进行测试。二次筛选方法与初级筛选相同，除了突变体用1mM和15mM R,R-monatin底物进行测试外。采用LC/MS/MS分析样品的monatin消耗和丙氨酸形成。将样品性能与野生型对照的性能进行比较。

样品性能采用基于丙氨酸产生和monatin消耗的评分系统进行评价。单个样品的最大得分是6。对于丙氨酸产生，赋予三分的最大值，并且对monatin消耗，赋予三分的最大值。评分标准如下：1分赋予阳性对照的平均值和一个标准偏差之间的值；2分赋予阳性对照的一个和两个标准偏差之间的值；以及3分赋予超过阳性对照的两个标准偏差的值。

突变体最高可能的总分是48(因为样品在1和15mM monatin下被筛选四次)。一般地，评分有20或更多分的突变体被选定为二次命中。然而，评分小于20分的样品有一些例外。丙氨酸形成和monatin消耗值在阈值要求边缘上的样品也被选择为命中。这防止命中太早的排除并且允许进一步测试和在三次筛选中表征。

采用上述标准鉴定为二次筛选命中的样品被列在表46中。二次命中从甘油储存液被划线培养到包含的100μg/mL羧苄青霉素的LB琼脂板上并且在37℃下生长过夜。单一集落被用于接种1mL包含羧苄青霉素(100μg/mL)的LB。培养物在37℃下生长过夜。DNA与培养物分离，然后制备并且采用3730XL自动测序仪(Applied Biosystems,Foster City,CA)进行测序。

二次命中的突变和突变的氨基酸位置被列在下面表46中。氨基酸位置的编号以N-末端甲硫氨酸开始。例如，所列的第一突变“Y6L”是指将野生型酶(SEQ IDNO:220)的氨基酸位置6上的酪氨酸变成亮氨酸。在核酸水平上，可以使用编码期望(突变的)氨基酸的任何密码子。

下面表46、47和53中描述的所有氨基酸序列是示例性的多肽；还提供了编码这些多肽的核酸序列。

实施例26—GSSM ^SM 突变表

表46：鉴定为二次筛选命中的GSSM^SM突变体

*突变体182是利用定点诱变，利用突变体136DNA作为模板并且然后引入V236T突变而产生的。本领域技术人员可以利用定点诱变技术合成该基因。

然后制备表46中所列的样品，用于三次筛选。甘油储存液被用于接种5mL包含100μg/mL羧苄青霉素的LB。培养物在37℃下生长过夜。过夜培养物然后被用于接种在250mL挡板瓶中50mL包含100μg/mL羧苄青霉素的LB培养物至0.05的OD_600nm。当OD_600nm达到0.4-0.8时加入IPTG至最终浓度1mM。培养物在30℃下诱导过夜。细胞沉淀通过在6,000rpm下离心20分钟收集。细胞沉淀在-20℃下被冷冻直至可以制备细胞裂解物。细胞在冰上用BPER II(Thermo Scientific,Rockford,IL)裂解1小时。澄清的裂解物通过在12,000rpm下离心30分钟制备。

蛋白经制造商的指导通过Bio-Rad Bradford蛋白测定(Bio-Rad,Hercules,CA)量化。SDS-PAGE分析和光密度测定法被用于测定表达的D-氨基转移酶的量。对于表达的D-氨基转移酶将样品标准化。0.02mg/mL D-氨基转移酶在三次筛选中进行测试。三次筛选方法与二次筛选方法相同，除了在0、5、10、15、30、60、120和210分钟取样以形成时间过程。丙氨酸产生和monatin消耗值通过LC/MS/MS分析进行测量，并且与标准曲线比较。将样品与野生型对照进行比较。

具有比野生型对照高的最终滴定度或快的起始速度的样品被鉴定为命中并且被称为高表达突变体(upmutant)。在三次筛选中鉴定的GSSM^SM高表达突变体被列在表47中。这些高表达突变体被进一步描述在下面的实施例27中。

实施例27—多肽高表达突变体的酶促活性

该实施例描述了证明本文公开的示例性高表达突变体多肽例如具有表47中所述的氨基酸序列的多肽的酶促活性的数据。表47显示了在利用1mM和15mMR,R-Monatin底物的反应中在15分钟时间点时高表达突变体相对于野生型对照的活性。相对活性是样品所产生的丙氨酸的量除以野生型对照所产生的丙氨酸的量。

表47：三次筛选中GSSM高表达突变体的活性

几个样品被鉴定为在测试条件下比野生型对照好。可能的K_m和V_max高表达突变体被鉴定。这些结果表明野生型对照(SEQ ID NO:220)可进一步进化，以获得对monatin增加的特异性D-氨基转移酶活性。

实施例28—Monatin方法中GSSM ^SM 突变体的活性

在pSE420-C-His中GSSM DATs的分析

该实施例描述了证明本文公开的示例性多肽的酶促活性的数据。突变体27、突变体44、突变体58、突变体119、突变体135、突变体136、突变体152、突变体154和野生型对照(大肠杆菌XL1-Blue中的载体pSE420-C-His中，如实施例25和26中所述)被划线培养到包含具有氨苄青霉素(100μg/mL)的LB培养基的琼脂板上。单个集落被用于接种5mL包含氨苄青霉素(100μg/mL)的LB培养基。500μl被用于接种250mL挡板瓶中50mL相同的培养基。细胞在30℃下生长至大约0.4的OD_600nm。加入IPTG直至最终浓度1mM。细胞在30℃下生长4小时并且通过离心收集。细胞立即在–80℃下冷冻直至制备细胞提取物。

细胞提取物如实施例4中所述制备。蛋白浓度根据制造商的指导以BSA(PierceRockford,IL)作为标准品用BCA(Pierce,Rockford,IL)微量滴定板进行测定。为了估计D-氨基转移酶在无细胞提取物中的浓度，进行SDS-PAGE分析并且视觉估测被用于估测表达的百分数。DAT蛋白在总蛋白百分数的10-25％表达范围中是可溶的并且这被用于计算测定的剂量。

在室温下进行R,R monatin形成测定，其在4mL反应中包含100mM EPPS缓冲液pH 7.8、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠、10mM磷酸钾、0.01％吐温-80与0.1mg/mL醛缩酶和0.2mg/mL DAT。突变体27使用0.15mg/mL的DAT酶，而不是0.2mg/mL。0.5、1、2、4和23小时后，取等分试样，加入甲酸至最终浓度2％，并且样品被旋转并过滤。采用实施例36中描述的LC/MS/MS方法分析样品的monatin。结果显示在表48中。

表48：DATs(被克隆到pSE420-C-His中)的活性

从表48中所示的数据中可以看出，在测试条件下，通过GSSM^SM进化获得的DAT突变体数表明相比野生型对照显示出提高的monatin初始形成速度。

在pMet1a中GSSM ^SM DATs的分析

该实施例描述了证明本文公开的示例性多肽的酶促活性的数据。突变体2、突变体6、突变体11、突变体27、突变体40、突变体44、突变体45、突变体58、突变体110、突变体135和突变体136根据制造商的指导利用QuikChange MultiSite-Directed Mutagenesis Kit(Stratagene,La Jolla,CA)通过定点诱变重建。为了产生突变体，实施例16中描述的pMET1a标记的构建物(pMET1a:SEQ ID NO:220(WT))被用做模板。所用的诱变引物被列在下面表49中。PCR片段用Dpn1(Invitrogen,Carlsbad,CA)消化1小时并且被转化入大肠杆菌Top10细胞(Invitrogen,Carlsbad,CA)。所得的纯化质粒制备物被测序(Agencourt,Beverly,MA)以证实并入了正确的突变。质粒然后被转化入大肠杆菌B834(DE3)表达宿主(Novagen,San Diego,CA)中。

表49：用于突变的引物

突变体2、突变体6、突变体27、突变体40、突变体45、突变体58、突变体110、突变体119、突变体131、突变体135、突变体136、突变体152、突变体154被产生在pMET1a载体中并且被转化到实施例2中描述的相容性大肠杆菌表达宿主B834(DE3)(Novagen,San Diego,Ca)中。包含羧苄青霉素(100μg/mL)的LB培养基中的过夜培养物在100mL相同的培养基中以1:100被稀释并生长在500mL挡板瓶中。培养物在Overnight Express II培养基(溶液1-6，Novagen)中30℃下生长过夜至10的OD_600nm。在收获前立刻取总蛋白的样品。细胞通过离心进行收获并且用10mL磷酸钾缓冲液pH 7.8洗涤一次。细胞立刻在–80℃下冷冻直至制备细胞提取物。应当注意，除了定点诱变外，本领域技术人员可以采用多改变诱变PCR技术诸如实施例25中所述的那些技术合成编码这些D-氨基转移酶的基因。

细胞提取物如实施例4中所述制备并脱盐，其用100mM磷酸钾作为缓冲液以洗脱并平衡PD10柱。总蛋白和DAT浓度如所述进行测定。

丙酮酸盐作为氨基受体的R,R monatin的转氨作用如实施例5中所述进行，除了使用15mM R,R monatin外。丙氨酸、monatin和monatin前体水平的初步分析鉴定出突变体40、突变体135和突变体136为优异的突变体，产生了如表50中所示的最高水平的丙氨酸产生。DAT突变体136表现出对R,R monatin向R-MP的转化具有最高的活性。各个时间点的丙氨酸产生数(以mM)被显示在表50中。

表50：由克隆入pMET1a中的DATs的R,R monatin转氨反应的丙氨酸形成(mM)

--：在目前条件下没有测定到

为了进一步估测活性，monatin形成测定如实施例1中所述进行，其中DAT浓度为约0.2mg/mL。作为参照，对0.2mg/mL浓度的纯化野生型DAT进行评价。0.5、1、2和4小时后，取等分试样，加入甲酸至最终浓度2％，并且样品被旋转并过滤。采用本文所述的LC/MS/MS方法分析样品的monatin，并且对于色氨酸和丙氨酸采用实施例36中所述的LC/OPA柱后荧光方法进行分析。

表51：pMET1a中DATs的活性

表51中显示的所有DATs产生monatin。DAT突变体——突变体58、突变体135和突变体136具有比野生型对照更快的初始速度。突变体136对于反应一(D-Trp向I3P的转化)来说较慢，但具有比野生型对照更好的总monatin产生。

对于最终的时间点，取另外的等分试样(没有加入甲酸)，以采用实施例36中所述的FDAA衍生方法测定所产生的monatin的立体异构体分布。对于所测定的选择突变体，对立体纯度具有很小影响到没有影响。在所有情况下，突变体在测试的测定条件下产生98.8％以上的R,R。这些结果显示在表52中。

表52：在4小时时选择突变体产生的Monatin的立体纯度

DAT多肽	％SS	％RS	％RR	％SR
					野生型(pMet1a)对照	0.00	0.40	99.30	0.20
突变体6	0.00	0.40	99.50	0.10
					突变体27	0.00	0.80	98.80	0.30
突变体40	0.00	0.20	99.80	0.00
					突变体45	0.00	0.50	99.40	0.10
突变体110	0.10	0.40	99.30	0.10

突变体135	0.00	0.40	99.50	0.10
					突变体136	0.02	1.00	99.00	0.03

实施例29—改良的多位点组合装配(TMCA ^SM )突变体的构建和测定

该实施例描述了示例性核酸和多肽的构建，并且描述了它们的酶促活性。选择GSSM突变亚组，以采用改良的多位点组合装配(TMCA^SM)技术进行组合。在1或15mM monatin反应中的GSSM进化中前10名表现者被选择以进行TMCA^SM进化。野生型序列(SEQ ID NO:220)被装入(thread)到3DAA-D-氨基酸氨基转移酶(图8)模型中。图8中的模型显示具有pyridoxyl-5’-磷酸D-丙氨酸，其中编号的残基表明选择用于TMCA^SM进化的那些位点。表53也列出选择被包括在TMCA文库中的突变。采用PCT申请号PCT/US08/071771中描述的方法对野生型(SEQ IDNO:220)和突变体45进行TMCA进化。

TMCA进化被描述在PCT申请号PCT/US08/071771中并且包括产生许多在多个位点具有各种突变的不同组合的子代多核苷酸的方法。该方法可以部分通过至少一个或多个下列步骤的组合进行：

获得(“第一”或“模板”)多核苷酸的序列信息。例如，第一或模板序列可以是野生型(例如SEQ ID NO:220)或突变的(例如突变体45)序列。序列信息可以是完整的多核苷酸(例如基因或开放阅读框)或者部分目标区域，诸如编码负责结合、结合特异性、催化或底物特异性的位点的序列。

沿着第一或模板多核苷酸序列鉴定三个或多个目标突变。例如，突变可以在第一或模板序列内的3、4、5、6、8、10、12、20或更多个位置上。位置可以通过绝对位置或周围残基或同源性的背景预先确定。对于DAT多肽的TMCA，导致提高的酶性能的前10个密码子变化被作为目标突变包括在内。在突变位置两翼或任一侧的序列可能是已知的。各个突变位置可包含两个或多个突变，诸如对于不同的氨基酸。这样的突变可以通过利用基因位点饱和诱变^SM(GSSM^SM)技术进行鉴定，如本文和美国专利号6,171,820；6,562,594；和6,764,835中所述。

提供包括目标突变的引物(例如合成的寡核苷酸)。在一实施方式中，对每个目标突变提供引物。因此，具有3个目标突变的第一或模板多核苷酸可在那个位置采用3个引物。引物也可作为包含简并位置的引物库被提供，以便目标突变是任何核苷酸或天然发生的氨基酸的范围，或者那个范围的子集。例如，可以提供有利于脂肪族氨基酸残基突变的引物库。

引物可以被制备为正向或反向引物，或者引物可以被制备为至少一个正向引物和至少一个反向引物。当突变紧密地定位在一起时，可以方便地利用包含一个以上位置的突变或多个位置上突变的不同组合的引物。

提供包含模板序列的多核苷酸。第一或模板多核苷酸可以是环形的，或者可以超螺旋的，诸如用于克隆、测序或表达的质粒或载体。多核苷酸可以是单链的(“ssDNA”)，或者可以是双链的(“dsDNA”)。例如，TCMA方法使超螺旋的(“sc”)dsDNA模板经历在95℃下加热步骤1min(参见Levy,Nucleic Acid Res.,28(12):e57(i-vii)(2000))。

在反应混合物中加入引物或模板多核苷酸。引物和模板多核苷酸在允许引物与多核苷酸退火的条件下进行组合。在TMCA方法的一实施方式中，引物在单个反应混合物中加入到多核苷酸，但是可以在多个反应中被加入。

进行聚合酶延伸反应。延伸产物(例如作为“子代”或“修饰的延伸多核苷酸”)可以通过常规手段扩增。产物可以分析其长度、序列、期望核酸特性、或被表达为多肽。其它分析方法包括原位杂化、序列筛选或表达筛选。分析可以包括一轮或多轮期望特性的筛选或选择。

产物还可被转化到细胞或其它表达系统，诸如无细胞系统。无细胞系统可包含与DNA复制、修复、重组、转录相关的或用于翻译的酶。示例性宿主包括细菌、酵母、植物和动物细胞以及细胞系，并且包括大肠杆菌、荧光假单胞菌、巴斯德毕赤酵母(Pichia pastoris)和黑曲霉(Aspergillus nige)r。例如，大肠杆菌的XL1-Blu或Stb12菌株可被用作宿主。

本发明的方法可在不同的反应条件下与相同或不同的引物一起使用以促进具有不同组合或突变数量的产物。

通过进行上述示例性方法，该方案还提供由该TMCA进化方法产生的一种或多种多核苷酸，其然后可以筛选或选择期望特性。一种或多种子代多核苷酸可被表达为多肽，并且任选地进行期望特性的筛选或选择。因此，TMCA进化方法的这个实施方式提供多核苷酸和编码的多肽，以及编码这种多肽的这种多核苷酸的文库。TMCA进化方案的这个实施方式进一步提供筛选文库，这通过筛选或选择文库以获得编码具有期望活性的一种或多种多肽的一种或多种多核苷酸而进行。

PCT/US08/071771中描述的TMCA进化方案的另一实施方式包括产生多个修饰的多核苷酸的方法。这种方法一般包括(a)在单个反应混合物中向双链多核苷酸模板中加入至少三个引物，其中所述至少三个引物不重叠，并且其中所述至少三个引物中每一个包括至少一个不同于其它引物的突变，其中至少一个引物是可与模板的负链退火的正向引物，并且至少一个引物是可与模板的正链退火的反向引物，和(b)使反应混合物经历聚合酶延伸反应以从所述至少三个引物产生多个延伸的修饰的多核苷酸。

PCT/US08/071771中所述的TMCA进化方案的另一实施方式包括一种方法，其中细胞用多个没有用连接酶处理的延伸产物进行转化。在本发明的另一实施方式中，多个延伸的修饰的多核苷酸从细胞中回收。在另一实施方式中，回收的多个延伸的修饰的多核苷酸例如通过表达多个延伸的修饰的多核苷酸中至少一个并且分析从中表达的多肽进行分析。在另一实施方式中，包括目标突变的多个延伸的修饰的多核苷酸被选择。

在TMCA进化方案的另一实施方式中，获得关于模板多核苷酸的序列信息，并且沿着模板多核苷酸的三个或更多个目标突变可以被鉴定。在另一实施方式中，通过聚合物延伸得到的产物可以在将多个延伸的修饰产物转化到细胞中之前进行分析。

在TMCA进化方案的一实施方式中，通过聚合酶延伸得到的产物用酶例如限制酶诸如DpnI限制酶进行处理，从而破坏模板多核苷酸序列。处理的产物可以被转化到细胞例如大肠杆菌细胞中。

在TMCA进化方案的一实施方式中，可以使用至少2个、或至少3个、或至少4个、或至少5个、或至少6个、或至少7个、或至少8个、或至少9个、或至少10个或至少11个、或至少12个或更多个引物。在一实施方式中，各个引物包括单点突变。在另一实施方式中，两个正向或两个反向引物包括在模板多核苷酸上相同位置中的不同改变。在另一实施方式中，至少一个引物包括在模板多核苷酸上不同位置中的至少两个改变。在又一实施方式中，至少一个引物包括在模板多核苷酸上不同位置中的至少两个改变，并且至少两个正向或两个反向引物包括在模板多核苷酸上相同位置中的不同改变。

在TMCA进化方案的一实施方式中，正向引物被归到正向组中并且反向引物被归到反向组中，并且正向组中的引物和反向组中的引物，相互独立地，被标准化成相应组中相等的浓度，不论在模板多核苷酸中的位置如何，并且其中标准化后向反应中加入相等量的正向和反向引物。在该标准化方法中，一些位置的组合可能有所偏向。偏向可能是由于例如相比包含多个引物的位置在包含单个引物的一个位置上相对低的引物浓度。“位置偏向(Positional bias)”是指这样的所得多核苷酸，其显示出相比其正向或反向引物组中的其它位置，强烈偏好于在单一位置并入引物。这产生这样修饰的多核苷酸的组合，其可在其正向或反向引物组中的单一引物位置具有高的突变百分数但在另一位置具有低的突变百分数。当TMCA的目标是产生包含对模板所有可能变化组合的子代多核苷酸时，这种偏向是不利的。偏向可以例如通过在各个位置上将作为库的引物标准化成相同而进行校正。

在TMCA进化方案的一实施方式中，引物标准化通过根据其在模板多核苷酸中的位置将引物组织成多个组而进行，其中覆盖模板上同一所选区域的引物在一个组中；将各个组内成组的引物标准化成相同的浓度；将一个组内的正向引物合并成正向组并且将各个正向引物组之间的浓度标准化成相同的；将一个组内的反向引物合并成反向组并且将各个反向引物组之间的浓度标准化成相同的；和将相等量的合并的正向和反向引物加入到反应中。对于位置组合没有观察到偏向。

在TMCA进化方案的一实施方式中，提供了简并引物组，每一个包含简并位置，其中所述目标突变是简并位置上的不同核苷酸范围。在另一实施方式中，提供了简并引物组，其包含与模板多核苷酸的至少一个密码子相应的至少一个简并密码子，以及至少一个相邻序列，其与相邻于模板多核苷酸序列的密码子的序列同源。在另一实施方式中，简并的密码子是N,N,N并且编码20个天然发生的氨基酸中任何一个。在另一实施方式中，简并的密码子编码20个以下的天然发生的氨基酸。

PCT/US08/071771中描述的TMCA进化方案的另一实施方式包括生产多个包含目标突变的修饰多核苷酸的方法。这种方法一般包括(a)向单一反应混合物中的双链模板多核苷酸中加入至少两个引物，其中所述至少两个引物不重叠，并且其中所述至少两个引物中每一个包括与其它引物(或多个)不同的至少一个突变，其中至少一个引物是可与模板的负链退火的正向引物并且至少一个引物是可与模板的正链退火的反向引物，(b)使反应混合物经历聚合酶延伸反应以从所述至少两个引物产生多个延伸的修饰的多核苷酸，(c)用酶处理多个延伸的修饰的多核苷酸，从而破坏模板多核苷酸，(d)将处理的延伸的修饰的多核苷酸——其没有用连接酶处理——转化到细胞中，(e)从细胞中回收多个延伸的修饰的多核苷酸，和(f)选择包含目标突变的多个延伸的修饰的多核苷酸。

表53：TMCA进化的位点表

突变	新密码子
		P20S	AGT
K73L	TTG
		T74V	GTG
V93G	GGT
		N110A	GCT
P117W	TGG
		N118G	GGG
N118A	GCG
		V236T	ACT
T241R	CGG
		L270W	TGG

TMCA突变体采用与实施例25中所述相同的GSSM进化方法进行生长、排列、测定并测序。采用如实施例25中所述的相同评分系统将样品性能与GSSM进化的最优候选者–突变体135–的性能进行比较。表55列出了具有独特DNA序列的TMCA二次筛选命中(TMCA突变体用字母进行命名以将它们与GSSM突变体——其是用数字命名——区分)。

表55：鉴定为二次筛选命中的TMCA突变体

表55中鉴定的样品采用如实施例26中所述用于GSSM进化的相同方法进行生长、标准化并且在三次筛选中测定。Monatin和丙氨酸值通过LC/MS/MS测定并且与标准曲线进行比较。将样品性能与突变体135(来自GSSM进化的表现最优者)的活性进行比较。在三次筛选中鉴定的TMCA高表达突变体被列在表56中。

实施例31—TMCA命中的活性

该实施例描述了证明示例性多肽的酶促活性的数据。下面表56显示了在利用1mM和15mM R,R-monatin底物的反应中15分钟时间点时高表达突变体相对于突变体135的活性。相对活性是由样品所产生的丙氨酸量除以由突变体135所生产的丙氨酸量。

表56：三次筛选中TMCA高表达突变体的活性

鉴定出在测试条件下胜过突变体135的几个样品。潜在的K_m和V_max高表达突变体被鉴定处。GSSM和TMCA进化的结果表明野生型SEQ ID NO:220可进一步进化以对monatin具有增加的比活性。

实施例32—pMET1a中TMCA突变体DATs的评价

该实施例描述了证明本文公开的示例性多肽的酶促活性的数据。突变体E、突变体G、突变体I、突变体M、突变体O、突变体P、突变体BB、突变体PP、突变体WW和突变体AAA(DATs采用TMCA技术生产，参见实施例29和30)根据制造商的指导利用QuikChange多定点诱变试剂盒(Stratagene,La Jolla,CA)通过定点诱变产生。为了产生突变体，实施例16和实施例28中描述的pMET1a标记构建物被用作模板。所用的突变引物被列在下面表57中。PCR片段用Dpn1(Invitrogen,Carlsbad,CA)消化1小时并且被转化到大肠杆菌XL10-Gold细胞(Stratagene,LaJolla,CA)中。所得纯化的质粒制备物被测序(Agencourt,Beverly,MA)以证实并入了正确的突变。质粒然后被转化到大肠杆菌B834(DE3)表达宿主(Novagen,San Diego,CA)中。

表57：pMET1a载体中突变体的引物

表达羧基末端His-标记的突变体110、突变体135、突变体136、突变体E、突变体G、突变体I、突变体M、突变体O、突变体P、突变体BB、突变体PP、突变体WW、突变体AAA和野生型(SEQ ID NO:220)蛋白的大肠杆菌B834(DE3)(Novagen,San Diego,CA)培养物在30℃下500mL挡板瓶中200mLOvernight Express II培养基(溶液1-6,Novagen)中生长过夜至10的OD₆₀₀。在收获前立即取总蛋白的样品。细胞通过离心制备并且在–80℃下立即冷冻直至如实施例4中所述制备细胞提取物。

细胞提取物通过加入50mL具有50μl/mL Benzonase核酸酶(Novagen,SanDiego,CA)、0.75μl/mL rLysozyme(Novagen,San Diego,CA)和250μL/mL蛋白酶抑制剂混合物II(CalBiochem,San Diego,CA)的Bug Buster Primary AmineFree(Novagen,San Diego,CA)而制备。细胞在室温中轻轻混合下温育15分钟。提取物在45,000×g下离心10分钟。

His-标记的蛋白利用GE Healthcare(Piscataway,NJ)Chelating Sepharose^TM FastFlow树脂如实施例4中所述进行纯化。例外是突变体182，其如实施例4中所述被分析为CFE。纯化的蛋白利用PD10柱脱盐到具有0.050mM PLP的100mM磷酸钾,pH 7.8。总蛋白和DAT浓度如实施例4中所述进行测定。

3-步monatin形成测定如实施例5中所述进行，其中DAT浓度为约0.2mg/mL并且醛缩酶浓度为0.1mg/mL。作为对照，对0.2mg/mL浓度的纯化野生型DAT(SEQ ID NO:220)进行评价。0.5、1、2、4和24小时后，获取等分试样，加入甲酸至最终浓度2％并且将样品旋转和过滤。采用实施例36中所述的LC/MS/MS方法分析样品的monatin并且采用LC/OPA柱后荧光方法分析色氨酸和丙氨酸。在最后的时间点，获取另外的等分试样(没有pH调节)以通过实施例36中所述的FDAA-衍生方法测定％R,R monatin。各个时间点产生的monatin量(mM)可见于表58。还测定了立体纯度并且R,R立体异构体的百分数可见于最右手栏中。立体异构体R,S构成该平衡的大部分。

表58：所选DAT突变体的活性

--＝在测试条件下没有测定到

测试条件下monatin产生的相对速度表明，突变体135、突变体136、突变体E、突变体G、突变体M、突变体O、突变体BB和突变体AAA的初始活性有最大的提高，如通过比较突变体和野生型对照(SEQ ID NO:220)DAT之间第一个小时内具有纯化的蛋白的monatin形成速度所测定。DATs突变体E和突变体AAA具有高活性，但是不充分表达(总蛋白的5％以下)，在测试条件下也不十分可溶。

如实施例36中所述还分析了测定样品的中间体诸如monatin前体I3P和副产物4-羟基-4-甲基谷氨酸(HMG)。对于突变体——突变体E、突变体G、突变体I、突变体M、突变体O、突变体BB、突变体PP、突变体AAA和突变体110、突变体135和突变体136，测定所形成的HMG量的分析。表现出在4小时时间点，更多的HMG由突变体135、突变体G、突变体I、突变体M和突变体BB形成。这些突变体都包含改变V236T。可能由于残基中的变化P20S，对于突变体——突变体E、突变体G、突变体M和突变体AAA，HMG也以高于野生型对照(SEQ IDNO:220)的水平存在。

表59：4小时后由DAT突变体形成HMG

nd＝没有检测到

DAT测定监测I3P形成

在340nm波长下检测和监控从色氨酸形成I3P。反应在1mL反应体积中进行，其包含混合有如上制备的100μL DAT稀释液(总蛋白)的900μL 25mM D-色氨酸、25mM丙酮酸钠盐、0.05mM PLP、100mM磷酸钾(pH 7.8)溶液。酶在加入到测定中之前用冷的50mM磷酸钾(pH 7.8)和50μM PLP以1:100和1:200进行稀释。酶以1:100加入到反应混合物中并且以15秒的增量监控3分钟。吲哚-3丙酮酸盐(I3P)的形成在BioRad分光光度计(GE Healthscience,Piscataway,NJ)上340nm的波长下监控3分钟并且在标准曲线的动态范围内测量速度。标准曲线用纯化的野生型(SEQ ID NO:220)DAT蛋白产生，并且DAT在细胞提取物中的浓度根据标准曲线的直线方程确定。对于第一反应，与野生型相关的DAT的有效浓度被报告在表60中。

表60：DAT的活性(色氨酸向I3P的转化)

野生型DAT(SEQ ID NO:220)和突变体136、E、G、M、O、BB和AAA能够帮助色氨酸向I3P以及monatin前体向monatin的转化。表60表明，相对于野生型DAT(SEQ ID NO:220)，这些突变体具有较低的色氨酸向I3P转化的活性。但是，根据表58，相同的突变体从色氨酸中产生比野生型DAT(SEQ ID NO:220)更多的总monatin。因此，在本文所述的测定条件下，通过控制monatin生物合成途径中色氨酸向I3P的转化，表现出对monatin的产生具有有利的作用。例如，尽管突变体E显示出最低的色氨酸向I3P转化的相对活性(参见表60)，但是它在4小时时也产生最高量的monatin(参见表58)。不受理论约束，但是控制反应中第一步骤的有利作用可归因于I3P堆积的减少以及随后潜在的I3P降解为不是monatin的产物。一般地，也表现出，通过例如利用一个或多个突变体DATs控制涉及从色氨酸产生monatin的一个或多个反应的速度，可能对所产生的monatin总量具有有利的作用。

实施例33—35℃下突变体DATs的评价

该实施例描述了证实本文公开的示例性多肽的酶促活性的数据。起始培养物在37℃下250rpm下摇动下生长过夜直至OD_600nm达到0.05。200mL OvernightExpress II培养基(Novagen,San Diego,CA)如实施例3中所述接种并生长。培养物生长一式两份并且将细胞沉淀合并。按照制造商的指导，沉淀物被再悬浮于40mL具有0.05mM PLP的50mM磷酸钠缓冲液(pH 7.8)并且利用French Press(SimAminco,Rochester,NY)裂解。上清液被收集在干净的试管中并且在-80℃下储存直至使用。

3-步monatin形成测定在玻璃瓶中如方法中所述进行，其中DAT浓度为约0.2mg/mL并且醛缩酶浓度为0.1mg/mL。两份样品在25℃或35℃下进行温育，并且1、3和4小时后，获取等分试样，加入甲酸至最终浓度2％并且将样品旋转和过滤。采用实施例36中所述的LC/MS/MS方法分析样品的monatin并且采用LC/OPA柱后荧光方法分析色氨酸和丙氨酸。如实施例36中所述，还分析了样品的中间体诸如monatin前体、I3P和4-羟基-4-甲基谷氨酸(HMG)。各个时间点产生的monatin量(mM)被显示在表61中。

对于野生型对照(SEQ ID NO:220)、突变体135和突变体M，在相似的条件下重复monatin形成测定，除了反应在塑料瓶中进行外。各个时间点下Monatin的产生可见于表61。

表61：25℃和35℃下的Monatin形成

在测定条件下35℃中采用本文所述的DAT酶观察到较低的monatin滴定度。然而，在测定条件下35℃中所选突变体——突变体135、突变体136、突变体M、突变体O和突变体BB显示出比野生型对照(SEQ ID NO:220)增加的初始monatin产生速度和更大的4小时monatin滴定度。

实施例34—生物反应器中突变体DATs的评价

该实施例描述了证实生物反应器中本文公开的示例性多肽的酶促活性的数据。野生型对照(SEQ ID NO:220)、突变体135、突变体136、突变体M、突变体O和突变体BB的甘油储存液被用于单一集落划板培养。单一集落被用于接种包含5mL具有适量抗生素的LB培养基的烧瓶。起始培养物在37℃下在250rpm下轻轻摇动下生长过夜并且检测OD_600nm。当OD_600nm达到0.05时，5mL培养物被接种到200mL Overnight Express II培养基(Novagen,San Diego,CA)，然后在30℃下在250rpm下摇动下进行温育。每种培养物生长两份并且细胞沉淀被合并。培养物通过在4000rpm下离心15分钟将细胞沉淀而收获。按照制造商的指导，上清液被倒出，并且沉淀物或者被冷冻以用于后来使用或者再悬浮于40mL 50mM磷酸钠缓冲液(pH 7.8)中并采用French Press(Sim Aminco,Rochester,NY)或微观流化床(Microfluidics Corporation,Newton,MA)裂解。上清液被收集在干净的管中并且在-80℃下储存直至使用。大约1mL澄清的裂解物被保留用于采用BCA测定(Pierce,Rockford,IL)和SDS-PAGE分析进行蛋白量化。

实验室规模的反应(250mL)如实施例15中所述在氮静态气提下在0.7L Sixfors搅拌的发酵罐中(Infors AG,Bottmingen,Switzerland)进行。反应混合物包含10mM磷酸钾、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠和130mM D-色氨酸。反应混合物被调节至25℃并且用氢氧化钾调节至pH 7.8。实施例6中所述的醛缩酶以0.02mg/mL目标蛋白作为澄清的细胞提取物加入。野生型对照(SEQ IDNO:220)、突变体135、突变体136、突变体M、突变体O和突变体BB DATs基于视觉观察具有15-35％的可溶蛋白表达范围。澄清的细胞提取物以0.20mg/mL目标蛋白加入。

反应进程通过利用实施例36中所述的LC/MS/MS方法在1、2、4和24小时测量monatin产生而进行跟踪。结果显示在表62中。

表62：发酵罐中的Monatin生产

对突变体——突变体136、突变体M、突变体O和突变体BB所观察到的monatin产生的初始速度比野生型对照(SEQ ID NO:220)的速度快。所有突变体显示在测试条件下在2小时提高的monatin形成。对于突变体135在1小时比预期低的monatin滴定度归因于在第1小时期间无意地暴露于氧气。4小时后，在测试条件下monatin滴定度在突变体和对照之间是相当的。

实施例35—温度对生物反应器中突变体DATs的影响的评价

该实施例描述了证实在不同温度条件下本文所公开的示例性多肽的酶促活性的数据。野生型对照(SEQ ID NO:220)、突变体135和突变体M如实施例15中所述在2.5L规模的发酵罐中产生。在发酵结束时，细胞通过在5000-7000×g下离心10分钟收获并且在-80℃下作为湿的细胞团冷冻。

为了制备包含野生型对照、突变体135和突变体MD-氨基转移酶的无细胞提取物，50g湿的细胞团被悬浮在150mL包含0.05mM磷酸吡哆醛(PLP)的50mM磷酸钾缓冲液(pH 7.8)中，然后利用Microfluidics均化器(Microfluidics,Newton,MA)(在18,000psi下3次通过)破碎，保持悬浮液的温度在15℃以下。细胞碎片通过离心去除(20,000×g进行30分钟)。

I3P从色氨酸形成的速度如实施例32中所述在340nm下监控三分钟。基于用纯化的DAT野生型对照产生的标准曲线，野生型对照的浓度被测定为6.8mg/mL，突变体135的浓度被测定为7.0mg/mL并且突变体M的浓度被测定为5.6mg/mL。由I3P形成所测定的DAT浓度被用于将Infors的剂量定为0.2mg/mL DAT。醛缩酶以0.02mg/mL醛缩酶作为无细胞提取物加入。在氮静态气提下反应混合物包含10mM磷酸钾、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠和130mM D-色氨酸。对每个DATs评价在35℃和25℃下生物反应器中的monatin产生。

在0.5、1、3、4和24小时下取样并且采用实施例36中所述的LC/MS/MS方法进行分析。结果显示在表63中。

表63：25℃和35℃下的发酵罐

如实施例34中可见，相比野生型对照DAT(SEQ ID NO:220)，所选突变体DATs在35℃下产生较高的monatin滴定度。野生型对照DAT在测试条件下25℃下具有较慢的monatin初始产生速度但具有较高的最终滴定度。两种突变体——突变体135和突变体M在25℃和35℃下都显示出比野生型对照提高的活性。在测试条件下相比对照，突变体——突变体135和突变体M 35℃下都具有较高的monatin初始产生速度和较高的最终滴定度。在较高温度下所选突变体比野生型对照更稳定。这表明GSSM和TMCA技术在产生突变体方面的优点，该突变体具有比野生型对照更大的热稳定性。本领域技术人员能够筛选这些GSSM或TMCA文库以获得具有例如增加的耐温性的突变体。

实施例36—Monatin、MP、色氨酸、丙氨酸和HMG的检测

该实施例描述了与本文公开的示例性D-氨基转移酶(DAT)的进一步表征相关的分析方法。

monatin和色氨酸的UPLC/UV分析

采用包括Waters Acquity光敏二极管阵列(PDA)吸光度监控仪的Waters AcquityUPLC装置分析混合物中从生化反应得到的monatin和色氨酸。在23℃下利用AgilentXDB C81.8μm 2.1×100mm柱(零件#928700-906)(Milford,MA)进行UPLC分离。UPLC流动相由A)包含0.1％甲酸的水B)包含0.1％甲酸的乙腈组成。

梯度洗脱从5％B至40％B是线性的，0-4分钟，从40％B至90％B是线性的，4-4.2分钟，从90％B到90％B是等度的，4.2-5.2分钟，从90％B到5％B是线性的，5.2-5.3分钟，其中在运行之间进行1.2分钟再平衡。流速是0.5mL/min，并且在280nm下监控PDA吸光度。

样品浓度通过对280nm下峰面积相对已知浓度进行线性最小二乘法校准而计算，其中最小测定系数为99.9％。

用O-(4-硝基苄基)羟胺盐酸盐(NBHA)衍生Monatin中间体(吲哚-3-丙酮酸 (I3P)、羟甲基氧化戊二酸、Monatin前体和丙酮酸盐)

在monatin产生过程中，各种中间体化合物被形成并且利用。这些化合物包括：吲哚-3-丙酮酸(I3P)、羟甲基氧化戊二酸、Monatin前体和丙酮酸盐。这些化合物上的酮官能团可以用O-(4-硝基苄基)羟胺盐酸盐(NBHA)衍生。

在琥珀色瓶中向20μL样品或标准品中加入140μL NBHA(吡啶中40mg/mL)。样品在热的存在下偶尔混合下声波处理15min。在水中在35％乙腈中进行1:3稀释。

Monatin中间体(吲哚-3-丙酮酸(I3P)、羟甲基氧化戊二酸、Monatin前体和丙酮酸盐)的UPLC/UV分析

包括Waters Acquity光敏二极管阵列(PDA)吸光度监控仪(Waters,Milford,MA)的Waters Acquity UPLC装置被用于分析中间体化合物。利用Waters Acquity HSST31.8mm×150mm柱(Waters,Milford,MA)在50℃下进行UPLC分离。UPLC流动相由A)包含0.3％甲酸和10mM甲酸铵的水B)包含0.3％甲酸和10mM甲酸铵的50/50乙腈/甲醇组成。

梯度洗脱从5％B至40％B是线性的，0-1.5分钟，从40％B至50％B是线性的，1.5-4.5分钟，从50％B至90％B是线性的，4.5-7.5分钟，从90％B至95％B是线性的，7.5-10.5分钟，其中运行之间进行3分钟再平衡。流速0-7.5分钟是0.15mL/min，7.5-10.5分钟是0.18mL/min，10.5-11分钟是0.19mL/min并且11-13.5分钟是0.15mL/min。PDA吸光度在270nm下进行监控。

样品浓度通过对270nm下峰面积相对已知浓度进行线性最小二乘法校准而计算，其中最小测定系数为99.9％。

Monatin的手性LC/MS/MS(MRM)测量

生化反应中monatin的立体异构体分布的测定通过用1-氟-2-4-二硝基苯基-5-L-丙氨酸酰胺30(FDAA)进行衍生接着反相LC/MS/MS MRM测量而完成。

Monatin用FDAA进行衍生

向50μL样品或标准品中加入100μL 1％FDAA丙酮溶液。加入20μL 1.0M碳酸氢钠，并且混合物在40℃下温育1小时并且时不时地混合。样品被移去并且冷却，用20μL 2.0M HCl(可能需要更多的HCl以实现缓冲生物学混合物的中和)进行中和。样品通过LC/MS/MS进行分析。

用于测定立体异构体的LC/MS/MS多反应监测

Monatin的分布

利用包括Waters 2795液相层析的Waters/液相层析-串联质谱(LC/MS/MS)设备进行分析，其中Waters 996光二极管阵列(PDA)吸光度监控仪(Waters,Milford,MA)串联置于层析和Quattro三重四极质谱仪之间。能分离所有四种monatin立体异构体(尤其FDAA-monatin)的LC分离在40℃下Phenomenex2.0×250mm(3μm)C18反相层析柱上进行。LC流动相由A)包含0.05％(质量/体积)醋酸铵的水和B)乙腈组成。洗脱在13％B下是等度的，0-2分钟，从13％B至30％B是线性的，2-15分钟，从30％B至80％B是线性的，15-16分钟，在80％B下是等度的，16-21分钟，以及从80％B至13％B是线性的，21-22分钟，其中运行之间进行8分钟的再平衡。流速是0.23mL/min，并且PDA吸光度从200nm监控到400nm。ESI-MS的所有参数被最优化并且基于FDAA-monatin质子化的20个分子离子([M-H]-)的产生以及特征碎片离子的产生进行选择。下列仪器参数被用于在负离子ESI/MS模式下monatin的LC/MS分析：毛细管电压：3.0kV；椎孔电压：40V；Hex 1:15V；孔：0.1V；Hex 2:0.1V；源温：120℃；脱溶剂温度：350℃；脱溶剂气体：662L/h；椎孔气体：42L/h；低质量分辨率(Q1)：14.0；高质量分辨率(Q1)：15.0；离子能量：0.5；入口电压：0V；碰撞能量：20；出口电压：0V；低质量分辨率(Q2)：15；高质量分辨率(Q2)：14；离子能量(Q2)：2.0；倍增器：650。三种FDAA-monatin-特异性母/子转变被用于特异性地检测体外和体内反应中的FDAA-monatin。monatin所监测的转变为542.97/267.94，542.97/499.07以及542.97/525.04。FDAA-monatin立体异构体的鉴定基于与纯化monatin立体异构体相比的层析保留时间，以及质谱数据。

液相层析-用OPA柱后衍生、包括羟甲基谷氨酸(HMG)和丙氨酸的氨基酸荧光检测

从生化反应中得到的混合物的HMG和丙氨酸分析利用以Waters 2487双波长吸光度检测仪和Waters 2475荧光检测仪作为检测系统的Waters Alliance 2695和Waters 600配置设备(Waters,Milford,MA)进行。HPLC分离采用两个串联的Phenomenex Aqua C18125A,150mm×2.1mm,3μ,目录号#00F-4311B0柱作为分析柱以及Phenomenex Aqua C18125A,30mm×2.1mm,3μ,目录号#00A-4311B0作为在线固相提取(SPE)柱而进行。两个分析柱的温度设在55℃，并且在线SPE柱在室温下。HPLC流动相由A)0.6％乙酸与1％甲醇组成。流速(100％A)在0-3.5分钟为0.2mL/min，在3.5-6.5分钟为0.24mL/min，在6.5-10.4分钟为0.26mL/min并且在10.4-11分钟为0.2mL/min。UV-VIS吸光度检测仪被设定在336nm波长下监控。荧光检测仪被设定在348nm和450nm下以分别监控激发波长和发射波长。

其它实施方式

应当理解，尽管本发明已经结合其详述部分进行了描述，但是前述描述意欲阐明而不限制本发明的范围，本发明的范围是由所附权利要求的范围限定。其它方面、优点和改变在所附权利要求的范围内。

Claims

1.分离的、合成的或重组的核酸，其编码为转移酶活性、转氨酶活性、d-氨基酸转移酶、ω-转氨酶活性、氧化还原酶活性、脱氢酶活性、d-氨基酸脱氢酶活性的多肽，由下列组成：

(a)，SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ IDNO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ IDNO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ IDNO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ IDNO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ IDNO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ IDNO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ IDNO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ IDNO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ IDNO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ IDNO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ IDNO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ IDNO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ IDNO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ IDNO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ IDNO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ IDNO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ IDNO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ IDNO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ IDNO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ IDNO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ IDNO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、SEQ ID NO:517、SEQID NO:519、SEQ ID NO:521、SEQ ID NO:523、SEQ ID NO:525、SEQ ID NO:527、SEQ ID NO:529、SEQ ID NO:531、SEQ ID NO:533、SEQ ID NO:535、SEQ IDNO:537、SEQ ID NO:539、SEQ ID NO:541、SEQ ID NO:543、SEQ ID NO:545、SEQ ID NO:547、SEQ ID NO:549、SEQ ID NO:551、SEQ ID NO:553、SEQ IDNO:555、SEQ ID NO:557、SEQ ID NO:559、SEQ ID NO:561、SEQ ID NO:563、SEQ ID NO:565、SEQ ID NO:567、SEQ ID NO:569、SEQ ID NO:571、SEQ IDNO:573、SEQ ID NO:575、SEQ ID NO:577、SEQ ID NO:579、SEQ ID NO:581、SEQ ID NO:583、SEQ ID NO:585、SEQ ID NO:587、SEQ ID NO:589、SEQ IDNO:591、SEQ ID NO:593、SEQ ID NO:595、SEQ ID NO:597、SEQ ID NO:599、SEQ ID NO:601、SEQ ID NO:603、SEQ ID NO:605、SEQ ID NO:607、SEQ IDNO:609、SEQ ID NO:611、SEQ ID NO:613、SEQ ID NO:615、SEQ ID NO:617、SEQID NO:619、SEQ ID NO:621、SEQ ID NO:623、SEQ ID NO:625、SEQ ID NO:627、SEQ ID NO:629、SEQ ID NO:631、SEQ ID NO:633、SEQ ID NO:635、SEQ IDNO:637、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:643、SEQ ID NO:645、SEQ ID NO:647、SEQ ID NO:649、SEQ ID NO:651、SEQ ID NO:653、SEQ IDNO:655、SEQ ID NO:657、SEQ ID NO:659、SEQ ID NO:661、SEQ ID NO:663、SEQ ID NO:665、SEQ ID NO:667、SEQ ID NO:669、SEQ ID NO:671、SEQ IDNO:673、SEQ ID NO:675、SEQ ID NO:677、SEQ ID NO:679、SEQ ID NO:681、SEQ ID NO:683、SEQ ID NO:685、SEQ ID NO:687、SEQ ID NO:689、SEQ IDNO:691、SEQ ID NO:693、SEQ ID NO:695、SEQ ID NO:697、SEQ ID NO:699,SEQID NO:701、SEQ ID NO:703、SEQ ID NO:705、SEQ ID NO:707、SEQ ID NO:709、SEQ ID NO:711、SEQ ID NO:713、SEQ ID NO:715、SEQ ID NO:717、SEQ IDNO:719、SEQ ID NO:721、SEQ ID NO:723、SEQ ID NO:725、SEQ ID NO:727、SEQ ID NO:729、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ IDNO:737、SEQ ID NO:739、SEQ ID NO:741、SEQ ID NO:743、SEQ ID NO:745、SEQ ID NO:747、SEQ ID NO:749、SEQ ID NO:751、SEQ ID NO:753、SEQ IDNO:755、SEQ ID NO:757、SEQ ID NO:759、SEQ ID NO:761、SEQ ID NO:763、SEQ ID NO:765、SEQ ID NO:767、SEQ ID NO:769、SEQ ID NO:771、SEQ IDNO:773、SEQ ID NO:775、SEQ ID NO:777、SEQ ID NO:779、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:785、SEQ ID NO:787、SEQ ID NO:789、SEQ IDNO:791、SEQ ID NO:793、SEQ ID NO:795、SEQ ID NO:797、SEQ ID NO:799,SEQID NO:801、SEQ ID NO:803、SEQ ID NO:805、SEQ ID NO:807、SEQ ID NO:809、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:815、SEQ ID NO:817、SEQ IDNO:819、SEQ ID NO:821、SEQ ID NO:823、SEQ ID NO:825、SEQ ID NO:827、SEQ ID NO:829、SEQ ID NO:831、SEQ ID NO:833、SEQ ID NO:835、SEQ IDNO:837、SEQ ID NO:839、SEQ ID NO:841、SEQ ID NO:843、SEQ ID NO:845、SEQ ID NO:847、SEQ ID NO:849、SEQ ID NO:851、SEQ ID NO:853、SEQ IDNO:855、SEQ ID NO:857、SEQ ID NO:859、SEQ ID NO:861、SEQ ID NO:863、SEQ ID NO:865、SEQ ID NO:867、SEQ ID NO:869、SEQ ID NO:871、SEQ IDNO:873、SEQ ID NO:875、SEQ ID NO:877、SEQ ID NO:879、SEQ ID NO:881、SEQ ID NO:883、SEQ ID NO:885、SEQ ID NO:887、SEQ ID NO:889、SEQ IDNO:891、SEQ ID NO:893、SEQ ID NO:895、SEQ ID NO:897、SEQ ID NO:899,SEQID NO:901、SEQ ID NO:903、SEQ ID NO:905、SEQ ID NO:907、SEQ ID NO:909、SEQ ID NO:911、SEQ ID NO:913、SEQ ID NO:915、SEQ ID NO:917、SEQ IDNO:919、SEQ ID NO:921、SEQ ID NO:923、SEQ ID NO:925、SEQ ID NO:927、SEQ ID NO:929、SEQ ID NO:931、SEQ ID NO:933、SEQ ID NO:935、SEQ IDNO:937、SEQ ID NO:939、SEQ ID NO:941、SEQ ID NO:943、SEQ ID NO:945、SEQ ID NO:947、SEQ ID NO:949、SEQ ID NO:951、SEQ ID NO:953、SEQ IDNO:955、SEQ ID NO:957、SEQ ID NO:959、SEQ ID NO:961、SEQ ID NO:963、SEQ ID NO:965、SEQ ID NO:967、SEQ ID NO:969、SEQ ID NO:971、SEQ ID NO:973和/或SEQ ID NO:975的核酸序列；或

(b)，编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ IDNO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ IDNO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:143、SEQ IDNO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ IDNO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ IDNO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ IDNO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ IDNO:218、SEQ ID NO:220、具有表46或表55的一个、几个或全部修饰的SEQ IDNO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ IDNO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ IDNO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ IDNO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ IDNO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ IDNO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ IDNO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ IDNO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ IDNO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ IDNO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ IDNO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ IDNO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ IDNO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ IDNO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ IDNO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ IDNO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ IDNO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516、SEQ ID NO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ ID NO:524、SEQ IDNO:526、SEQ ID NO:528、SEQ ID NO:530、SEQ ID NO:532、SEQ ID NO:534、SEQ ID NO:536、SEQ ID NO:538、SEQ ID NO:540、SEQ ID NO:542、SEQ IDNO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ ID NO:550、SEQ ID NO:552、SEQ ID NO:554、SEQ ID NO:556、SEQ ID NO:558、SEQ ID NO:560、SEQ IDNO:562、SEQ ID NO:564、SEQ ID NO:566、SEQ ID NO:568、SEQ ID NO:570、SEQ ID NO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ ID NO:578、SEQ IDNO:580、SEQ ID NO:582、SEQ ID NO:584、SEQ ID NO:586、SEQ ID NO:588、SEQ ID NO:590、SEQ ID NO:592、SEQ ID NO:594、SEQ ID NO:596、SEQ IDNO:598、SEQ ID NO:600、SEQ ID NO:602、SEQ ID NO:604、SEQ ID NO:606、SEQ ID NO:608、SEQ ID NO:610、SEQ ID NO:612、SEQ ID NO:614、SEQ IDNO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ ID NO:622、SEQ ID NO:624、SEQ ID NO:626、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ IDNO:634、SEQ ID NO:636、SEQ ID NO:638、SEQ ID NO:640、SEQ ID NO:642、SEQ ID NO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ ID NO:650、SEQ IDNO:652、SEQ ID NO:654、SEQ ID NO:656、SEQ ID NO:658、SEQ ID NO:660、SEQ ID NO:662、SEQ ID NO:664、SEQ ID NO:666、SEQ ID NO:668、SEQ IDNO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ ID NO:676、SEQ ID NO:678、SEQ ID NO:680、SEQ ID NO:682、SEQ ID NO:684、SEQ ID NO:686、SEQ IDNO:688、SEQ ID NO:690、SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:696、SEQ ID NO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ IDNO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:712、SEQ ID NO:714、SEQ ID NO:716、SEQ ID NO:718、SEQ ID NO:720、SEQ ID NO:722、SEQ IDNO:724、SEQ ID NO:726、SEQ ID NO:728、SEQ ID NO:730、SEQ ID NO:732、SEQ ID NO:734、SEQ ID NO:736、SEQ ID NO:738、SEQ ID NO:740、SEQ IDNO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ ID NO:748、SEQ ID NO:750、SEQ ID NO:752、SEQ ID NO:754、SEQ ID NO:756、SEQ ID NO:758、SEQ IDNO:760、SEQ ID NO:762、SEQ ID NO:764、SEQ ID NO:766、SEQ ID NO:768、SEQ ID NO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ ID NO:776、SEQ IDNO:778、SEQ ID NO:780、SEQ ID NO:782、SEQ ID NO:784、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:790、SEQ ID NO:792、SEQ ID NO:794、SEQ IDNO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:804、SEQ ID NO:808、SEQ ID NO:808、SEQ ID NO:810、SEQ ID NO:812、SEQ IDNO:814、SEQ ID NO:816、SEQ ID NO:818、SEQ ID NO:820、SEQ ID NO:822、SEQ ID NO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ ID NO:830、SEQ IDNO:832、SEQ ID NO:834、SEQ ID NO:836、SEQ ID NO:838、SEQ ID NO:840、SEQ ID NO:842、SEQ ID NO:844、SEQ ID NO:846、SEQ ID NO:848、SEQ IDNO:850、SEQ ID NO:852、SEQ ID NO:854、SEQ ID NO:856、SEQ ID NO:858、SEQ ID NO:860、SEQ ID NO:862、SEQ ID NO:864、SEQ ID NO:866、SEQ IDNO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ ID NO:874、SEQ ID NO:876、SEQ ID NO:878、SEQ ID NO:880、SEQ ID NO:882、SEQ ID NO:884、SEQ IDNO:886、SEQ ID NO:888、SEQ ID NO:890、SEQ ID NO:892、SEQ ID NO:894、SEQ ID NO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ ID NO:902、SEQ IDNO:904、SEQ ID NO:906、SEQ ID NO:908、SEQ ID NO:910、SEQ ID NO:912、SEQ ID NO:914、SEQ ID NO:916、SEQ ID NO:918、SEQ ID NO:920、SEQ IDNO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ ID NO:928、SEQ ID NO:930、SEQ ID NO:932、SEQ ID NO:934、SEQ ID NO:936、SEQ ID NO:938、SEQ IDNO:940、SEQ ID NO:942、SEQ ID NO:944、SEQ ID NO:946、SEQ ID NO:948、SEQ ID NO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ ID NO:956、SEQ IDNO:958、SEQ ID NO:960、SEQ ID NO:962、SEQ ID NO:964、SEQ ID NO:966、SEQ ID NO:968、SEQ ID NO:970、SEQ ID NO:972、SEQ ID NO:974和/或SEQ IDNO:976的多肽序列的核酸。

2.表达盒，其包含权利要求1所述的核酸序列。

3.转化细胞，其包含权利要求1所述的核酸序列。

4.分离的、合成的或重组的多肽，其为转移酶活性、转氨酶活性、d-氨基酸转移酶、ω-转氨酶活性、氧化还原酶活性、脱氢酶活性、d-氨基酸脱氢酶活性，由下列组成：

(a)，SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ IDNO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ IDNO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:143、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ IDNO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ IDNO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ IDNO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ IDNO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、具有表46或表55的一个、几个或全部修饰的SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ IDNO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ IDNO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ IDNO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ IDNO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ IDNO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ IDNO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ IDNO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ IDNO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ IDNO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ IDNO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ IDNO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ IDNO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ IDNO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ IDNO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ IDNO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ IDNO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516、SEQ IDNO:518、SEQ ID NO:520、SEQ ID NO:522、SEQ ID NO:524、SEQ ID NO:526、SEQ ID NO:528、SEQ ID NO:530、SEQ ID NO:532、SEQ ID NO:534、SEQ IDNO:536、SEQ ID NO:538、SEQ ID NO:540、SEQ ID NO:542、SEQ ID NO:544、SEQ ID NO:546、SEQ ID NO:548、SEQ ID NO:550、SEQ ID NO:552、SEQ IDNO:554、SEQ ID NO:556、SEQ ID NO:558、SEQ ID NO:560、SEQ ID NO:562、SEQ ID NO:564、SEQ ID NO:566、SEQ ID NO:568、SEQ ID NO:570、SEQ IDNO:572、SEQ ID NO:574、SEQ ID NO:576、SEQ ID NO:578、SEQ ID NO:580、SEQ ID NO:582、SEQ ID NO:584、SEQ ID NO:586、SEQ ID NO:588、SEQ IDNO:590、SEQ ID NO:592、SEQ ID NO:594、SEQ ID NO:596、SEQ ID NO:598、SEQ ID NO:600、SEQ ID NO:602、SEQ ID NO:604、SEQ ID NO:606、SEQ IDNO:608、SEQ ID NO:610、SEQ ID NO:612、SEQ ID NO:614、SEQ ID NO:616、SEQ ID NO:618、SEQ ID NO:620、SEQ ID NO:622、SEQ ID NO:624、SEQ IDNO:626、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:636、SEQ ID NO:638、SEQ ID NO:640、SEQ ID NO:642、SEQ IDNO:644、SEQ ID NO:646、SEQ ID NO:648、SEQ ID NO:650、SEQ ID NO:652、SEQ ID NO:654、SEQ ID NO:656、SEQ ID NO:658、SEQ ID NO:660、SEQ IDNO:662、SEQ ID NO:664、SEQ ID NO:666、SEQ ID NO:668、SEQ ID NO:670、SEQ ID NO:672、SEQ ID NO:674、SEQ ID NO:676、SEQ ID NO:678、SEQ IDNO:680、SEQ ID NO:682、SEQ ID NO:684、SEQ ID NO:686、SEQ ID NO:688、SEQ ID NO:690、SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:696、SEQ IDNO:698、SEQ ID NO:700、SEQ ID NO:702、SEQ ID NO:704、SEQ ID NO:706、SEQ ID NO:708、SEQ ID NO:710、SEQ ID NO:712、SEQ ID NO:714、SEQ IDNO:716、SEQ ID NO:718、SEQ ID NO:720、SEQ ID NO:722、SEQ ID NO:724、SEQ ID NO:726、SEQ ID NO:728、SEQ ID NO:730、SEQ ID NO:732、SEQ IDNO:734、SEQ ID NO:736、SEQ ID NO:738、SEQ ID NO:740、SEQ ID NO:742、SEQ ID NO:744、SEQ ID NO:746、SEQ ID NO:748、SEQ ID NO:750、SEQ IDNO:752、SEQ ID NO:754、SEQ ID NO:756、SEQ ID NO:758、SEQ ID NO:760、SEQ ID NO:762、SEQ ID NO:764、SEQ ID NO:766、SEQ ID NO:768、SEQ IDNO:770、SEQ ID NO:772、SEQ ID NO:774、SEQ ID NO:776、SEQ ID NO:778、SEQ ID NO:780、SEQ ID NO:782、SEQ ID NO:784、SEQ ID NO:786、SEQ IDNO:788、SEQ ID NO:790、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:796、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:804、SEQ IDNO:808、SEQ ID NO:808、SEQ ID NO:810、SEQ ID NO:812、SEQ ID NO:814、SEQ ID NO:816、SEQ ID NO:818、SEQ ID NO:820、SEQ ID NO:822、SEQ IDNO:824、SEQ ID NO:826、SEQ ID NO:828、SEQ ID NO:830、SEQ ID NO:832、SEQ ID NO:834、SEQ ID NO:836、SEQ ID NO:838、SEQ ID NO:840、SEQ IDNO:842、SEQ ID NO:844、SEQ ID NO:846、SEQ ID NO:848、SEQ ID NO:850、SEQ ID NO:852、SEQ ID NO:854、SEQ ID NO:856、SEQ ID NO:858、SEQ IDNO:860、SEQ ID NO:862、SEQ ID NO:864、SEQ ID NO:866、SEQ ID NO:868、SEQ ID NO:870、SEQ ID NO:872、SEQ ID NO:874、SEQ ID NO:876、SEQ IDNO:878、SEQ ID NO:880、SEQ ID NO:882、SEQ ID NO:884、SEQ ID NO:886、SEQ ID NO:888、SEQ ID NO:890、SEQ ID NO:892、SEQ ID NO:894、SEQ IDNO:896、SEQ ID NO:898、SEQ ID NO:900、SEQ ID NO:902、SEQ ID NO:904、SEQ ID NO:906、SEQ ID NO:908、SEQ ID NO:910、SEQ ID NO:912、SEQ IDNO:914、SEQ ID NO:916、SEQ ID NO:918、SEQ ID NO:920、SEQ ID NO:922、SEQ ID NO:924、SEQ ID NO:926、SEQ ID NO:928、SEQ ID NO:930、SEQ IDNO:932、SEQ ID NO:934、SEQ ID NO:936、SEQ ID NO:938、SEQ ID NO:940、SEQ ID NO:942、SEQ ID NO:944、SEQ ID NO:946、SEQ ID NO:948、SEQ IDNO:950、SEQ ID NO:952、SEQ ID NO:954、SEQ ID NO:956、SEQ ID NO:958、SEQ ID NO:960、SEQ ID NO:962、SEQ ID NO:964、SEQ ID NO:966、SEQ IDNO:968、SEQ ID NO:970、SEQ ID NO:972、SEQ ID NO:974和/或SEQ ID NO:976的氨基酸序列；或

(b)，由权利要求1所述的核酸编码的氨基酸序列。

5.权利要求4所述的多肽，其中所述多肽为液体、固体或凝胶。

6.固定化多肽，其中权利要求4的多肽被固定化在木屑、纸、细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、阵列或毛细管上。

7.酶混合物，其为：权利要求4所述的多肽和一种或更多种其它酶，所述一种或更多种其它酶选自转移酶，氧化还原酶，甘露聚糖酶、葡聚糖酶、纤维素酶、脂肪酶、酯酶、蛋白酶、内糖苷酶、角质酶、过氧化物酶、过氧化氢酶、漆酶、淀粉酶、果胶酶、消旋酶、表异构酶、异构酶、还原酶、氧化酶、木质素酶、支链淀粉酶、阿拉伯树胶酶、半纤维素酶、木葡聚糖酶、木聚糖酶、果胶乙酰基酯酶、鼠李糖半乳糖醛酸聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李糖半乳糖醛酸聚糖酶、半乳聚糖酶、果胶裂解酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。

8.权利要求4所述的多肽，其中所述多肽是选自下列的SEQ ID NO:220的突变：Y6L Y6C；在AA31的沉默突变(GGC至GGT)Y6F；Y6L；Y6H；Y6L；Y6M；N10S；N10W；N10T；N10R；N10T；L14V；L14L；G41G；T18W；N40N；V19T；V42V；I62C；V82A；A57M；V42M；G41Y；A45L；V93Y；V93G；L46A；L46H；G98A；P20S；V93A；V103T；P108F；V93L；S101S；A106G；S101Q；P108T；N118G；P108C；I120L；A106W；N118R；N110A；N118G；N118A；N118R；P117W；N118K；D133N；K126Q；K126R；K128S；I127M；T131T；D133L；M132A；D133E；L129V；K126K；I130M；M132Y；K128R；M132R；L129I；K128L；D2D(GAC to GAT)；F137W；I152V；N55L；N150S；L138L；P149P；G161G；A165T；H163R；H163K；H168A；E171S；E171R；E171R；T172I；C176G；A177S；A177S；S80L；R156W；H182G；N186S；K185R；K185T；D2H；D2T；E260G；D2Y；D2G；D2Q；D2F；D2A；D2T；D2N；D2R；D2I；D2V；G9A；G12A；D47W；S56S；I64H；L66L；I64C；L66G；E69Y；T74L；K73L；T74V；T74M；T74R；T74A；N76C；E77R；R156A；K72M；S205A；Q209S；V212E；R213W；I216T；P217H；P217V；D219F；E220V；R221E；F223C；S226P；L228F；V234A；S238S；V236T；V236T；T241R；L242F；T241R；T241C；E248F；D250E；K257V；G256K；E260G；L262R；K263M；D267G；D267R；I265L；E268S；L270S；L270G；L270W；R271S；I274W；G278S；Y279C；S284R；E282G；T280N；V286G；R285F；V286R；G240G；E61R；E61D；E61Y；G85G；G85D；S80R；Y79R；Y79V；W283V；W283E；W283A；W283S；W283G；W283A；W283R；W283T；P281W；V236T；和T241R。

9.权利要求4所述的多肽，其中所述多肽是选自下列的SEQ ID NO:220的突变：

。

10.载体，其包含权利要求1所述的核酸序列。

11.克隆载体，其包含权利要求1所述的核酸序列。