CN101970679A

CN101970679A - 氨基转移酶和氧化还原酶核酸和多肽和使用方法

Info

Publication number: CN101970679A
Application number: CN2008801275767A
Authority: CN
Inventors: M·L.·德苏扎; P·M.·希克斯; S·R.·科尔曼; J·M.·拉普拉萨; J·M.·伦多尔夫; S·C.·麦克法伦; E·马拉斯科; 牛伟; F·A.·桑切斯-列拉; C·索尔海德; D·P.·魏纳; P·卢京比尔; A·布埃诺; J·昆卡
Original assignee: Cargill Inc
Current assignee: Cargill Inc
Priority date: 2008-01-03
Filing date: 2008-12-31
Publication date: 2011-02-09
Anticipated expiration: 2028-12-31
Also published as: WO2009088482A1; CA2726928A1; AU2008347048B2; AU2008347048A1; BRPI0822219A2; JP5683962B2; CN101970679B; US20110020882A1; JP2015091231A; EP2225390A4; JP2011508602A; US8785162B2; EP2225390A1

Abstract

本发明提供了氨基转移酶和氧化还原酶多肽以及编码这种多肽的核酸。还提供了使用这种氨基转移酶和氧化还原酶核酸和多肽的方法。

Description

氨基转移酶和氧化还原酶核酸和多肽和使用方法

援引加入

序列表根据PCT AI§801(a)在提交本申请时同时提交。附随的序列表，标示为07_0245WO01seq.txt，援引加入本文。

附录I根据PCT AI§801(a)在提交本申请时同时提交。附随的附录，标示为07_0245wo01app.txt，是与序列表相关的表格，援引加入本文。

相关申请的交叉引用

本申请根据35 U.S.C.119(e)要求2008年1月3日提交的美国申请NO.61/018,814的优先权，所述申请以其全文援引加入本文。

技术领域

本发明涉及核酸和多肽，更具体地涉及编码氨基转移酶和氧化还原酶的核酸和多肽，以及使用这些氨基转移酶和氧化还原酶的方法。

背景

氨基转移酶催化氨基酸和α-酮酸之间的反应。α-氨基转移酶催化从氨基酸上除去氨基基团的反应，形成α-酮酸，将所述氨基基团转移到反应物α-酮酸，将所述酮酸转化成氨基酸。因而，氨基转移酶在氨基酸的生产中是有用的。

氧化还原酶例如脱氢酶催化通过转移一个或多个质子和一对电子到接受体来氧化底物(例如从还原剂转移电子到氧化剂)的反应。因此，氧化还原酶在催化氨基酸到酮酸的氧化脱氨基或酮酸到氨基酸的还原性氨基化是有用的。

本公开提供了许多不同的氨基转移酶和氧化还原酶多肽，以及编码这些氨基转移酶和氧化还原酶多肽的核酸。本公开还提供了使用这些氨基转移酶和氧化还原酶核酸和多肽的方法。

在一个方面，本发明提供了将色氨酸转化成吲哚-3-丙酮酸(或，作为选择，吲哚-3-丙酮酸到色氨酸)的方法。这种方法包括组合色氨酸(或吲哚-3-丙酮酸)和a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、 895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975组成的组中的一种或多种核酸分子，其中所述一种或多种核酸分子编码具有氨基转移酶(AT)或氧化还原酶活性的多肽；b)a)的变体，其中所述变体编码具有AT或氧化还原酶活性的多肽；c)a)或b)的片段，其中所述片段编码具有AT或氧化还原酶活性的多肽；d)选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、870 T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974、976、1069、1070、1071、1072和1073组成的组中的一种或多种多肽，其中所述一种或多种多肽具有AT或氧化还原酶活性；e)d)的变体，其中所述变体具有AT或氧化还原酶活性；或f)d)或e)的片段，其中所述片段具有AT或氧化还原酶活性。

在另一个方面，本发明提供了将MP转化为monatin(或，做为选择，转化monatin为MP)的方法。这种方法一般包括组合MP(或monatin)和a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587 589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975组成的组中的一种或多种核酸分子，其中所述一种或多种核酸分子编码具有氨基转移酶(AT)或氧化还原酶活性的多肽；b)a)的变体，其中所述变体编码具有AT或氧化还原酶活性的多肽；c)a)或b)的片段，其中所述片段编码具有AT或氧化还原酶活性的多肽；d)选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220T241N、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974、976、1069、1070、1071、1072和1073组成的组中的一种或多种多肽，其中所述一种或多种多肽具有AT或氧化还原酶活性；e)d)的变体，其中所述变体具有AT或氧化还原酶活性；或f)d)或e)的片段，其中所述片段具有AT或氧化还原酶活性。

在一个实施方案中，所述一种或多种核酸分子选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973和975组成的组中。在另一个实施方案中，所述一种或多种多肽选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220G240N、220T241N、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974和976组成的组中。

在某些实施方案中，所述核酸分子具有选自由SEQ ID NO：945、891、893、219、175、1063、1065和1067组成的组中的序列。在某些实施方案中，所述多肽具有选自由SEQ ID NO：946、892、894、220、176、1064、1066和1068组成的组中的序列。在某些实施方案中，所述多肽具有相应于SEQ ID NO：1069或1070中所示的共有序列的序列。在某些实施方案中，所述多肽具有相应于在SEQ ID NO：1071、1072和1073中所示的共有序列的序列。

在某些实施方案中，所述变体是与SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973和975具有至少80％(例如，至少85％、至少90％、至少95％或至少99％)序列相同性的核酸分子。

在某些实施方案中，所述变体是与SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870 T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974和976具有至少80％(例如，至少85％、至少90％、至少95％或至少99％)序列相同性的多肽。

在一个实施方案中，所述变体是与SEQ ID NO：220具有至少65％(例如，至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％)序列相同性的多肽。在另一个实施方案中，所述变体是与SEQ ID NO：870具有至少80％(例如，至少85％、至少90％、至少95％或至少99％)序列相同性的多肽。在又一个实施方案中，所述变体是与SEQ ID NO：894具有至少65％(例如，至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％)序列相同性的多肽。

在某些实施方案中，所述变体是突变体。代表性的突变体包括但不限于在与DAT 4978的残基243对准的残基处具有突变的突变体(例如，SEQ ID NO：870 T242N、SEQ ID NO：220 G240N或SEQ ID NO：220 T241N)。在一个实施方案中，所述变体是密码子优化了的核酸分子。在某些实施方案中，所述变体多肽是嵌合多肽。

在某些实施方案中，核酸分子包含在表达载体内，可以被例如过表达。在某些实施方案中，所述氨基转移酶或氧化还原酶多肽被固定在固相支持物上。在某些实施方案中，所述色氨酸或MP是取代的色氨酸或取代的MP。代表性的色氨酸是6-氯-D-色氨酸。

在另一个方面，本发明提供了将色氨酸转化到吲哚-3-丙酮酸(或，做为选择，将吲哚-3-丙酮酸转化为色氨酸)的方法。这种方法典型包括组合色氨酸(或吲哚-3-丙酮酸)和a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973、和975组成的组中的一种或多种核酸分子，其中所述一种或多种核酸分子编码具有D-氨基转移酶(DAT)活性的多肽；b)a)的变体，其中所述变体编码具有DAT活性的多肽；c)a)或b)的片段，其中所述片段编码具有DAT活性的多肽；d)选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974、976、1069、1070、1071、1072和1073组成的组中的一种或多种多肽，其中所述一种或多种多肽具有DAT活性；e)d)的变体，其中所述变体具有DAT活性；或f)d)或e)的片段，其中所述片段具有DAT活性。

在再另一个方面，本发明提供了将MP转化到monatin(或，做为选择，将monatin转化为MP)的方法。这种方法典型包括组合MP(或monatin)和a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973和975组成的组中的一种或多种核酸分子，其中所述一种或多种核酸分子编码具有DAT活性的多肽；b)a)的变体，其中所述变体编码具有DAT活性的多肽；c)a)或b)的片段，其中所述片段编码具有DAT活性的多肽；d)选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974、976、1069、1070、1071、1072和1073组成的组中的一种或多种多肽，其中所述一种或多种多肽具有DAT活性；e)d)的变体，其中所述变体具有DAT活性；或f)d)或e)的片段，其中所述片段具有DAT活性。

在某些实施方案中，所述核酸分子或多肽具有选自由SEQ ID NO：945、891、893、219、175、1063、1065和1067组成的组中的序列。在某些实施方案中，所述多肽具有相应于在SEQ ID NO：1069、1070、1071、1072或1073中所示的共有序列的序列。在某些实施方案中，所述色氨酸或MP是取代的色氨酸或取代的MP。代表性的取代的色氨酸是6-氯-D-色氨酸。

在再另一个方面，本发明提供了制备monatin的方法。一般地，这种方法包括在产生monatin的条件下使色氨酸与C3碳源和以下接触：a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973和975组成的组中的一种或多种核酸分子，其中所述一种或多种核酸分子编码具有D-氨基转移酶(DAT)活性的多肽；b)a)的变体，其中所述变体编码具有DAT活性的多肽；c)a)或b)的片段，其中所述片段编码具有DAT活性的多肽；d)选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870 T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974、976、1069、1070、1071、1072和1073组成的组中的一种或多种多肽，其中所述一种或多种多肽具有DAT活性；e)d)的变体，其中所述变体具有DAT活性；或f)d)或e)的片段，其中所述片段具有DAT活性。

在某些实施方案中，所述核酸分子选自由SEQ ID NO：945、891、893、219、175、1063、1065和1067组成的组中。在某些实施方案中，所述C3碳源选自由丙酮酸、草酰乙酸和丝氨酸组成的组中。在某些实施方案中，所述方法进一步包括添加或包括合酶/裂合酶(EC 4.1.2.-或4.1.3.-)多肽。代表性的合酶/裂合酶(EC 4.1.2.-或4.1.3.-)多肽包括醛缩酶，例如KHG醛缩酶(EC 4.1.3.16)或HMG醛缩酶(EC 4.1.3.16)。

上文表明的方法的某些实施方案中，所述生产的monatin是R，R monatin。在某些实施方案中，所述生产的monatin是S，R monatin。在某些实施方案中，所述色氨酸是取代的色氨酸，例如6-氯-D-色氨酸。

除非另外定义，本文使用的所有技术和科学术语具有本发明所属技术领域的普通技术人员通常所理解的相同含义。虽然类似于或等同于本文描述的那些的方法和材料可以被用于本发明的实践和测试，以下描述了适合的方法和材料。此外，所述材料、方法和实施例仅是说明性的，而不意图是限制性的。本文提及的所有出版物、专利申请、专利和其他参考文献以其全文援引加入本文。在冲突的情况下，当前的说明书，包括定义，是支配性的。

在以下附随的附图和说明中将阐述本发明的一个或多个实施方案的细节。根据附图和详细说明，以及根据权利要求书，本发明的其他特征、目的和益处将是明显的。

附图简述

图1是SEQ ID NO：894、1066、1064和1068的比对。

图2是SEQ ID NO：870、910和几个芽孢杆菌(Bacillus)序列的比对。从这种比对中发展了针对SEQ ID NO：870的新部分的共有序列A和B(分别是SEQ ID NO：1069和1070)。

图3是SEQ ID NO：946、894、892、220、176、1064、1066和1068的比对。从这种比对发展了共有序列C、D和E(分别是SEQ ID NO：1071、1072和1073)。

图4是3DAA-D-氨基酸氨基转移酶的模型，编号的残基表明被选择用于TMCA^SM进化的那些位点，如下文详细描述的。

同样的参考符号在各个附图中表示同样的元素。

详细说明

在此公开的是编码具有氨基转移酶(AT)活性(例如转氨酶活性)的多肽的许多不同的核酸分子。特别地公开的是许多D-氨基转移酶(DAT)。DAT催化转氨基反应(例如D-丙氨酸+2-酮戊二酸<＝>丙酮酸+D-谷氨酸)。还提供的是编码具有氧化还原酶活性(例如脱氢酶活性)的多肽的许多不同的核酸分子。氧化还原酶如脱氢酶催化氧化还原反应(例如D-氨基酸+H₂O+接受体<＝>2-含氧酸(2-oxo acid)+NH₃+还原的接受体)。在此公开的核酸或多肽可以用于转化色氨酸为吲哚-3-丙酮酸和/或将2-羟基2-(吲哚-3基甲基)-4-酮戊二酸(“monatin前体”或“MP”)转化为monatin。

分离的核酸分子和纯化的多肽

本发明部分地基于编码具有氨基转移酶(AT)活性的多肽的核酸分子的鉴定，在此在合适的时候称为“AT”核酸分子或多肽。本发明还部分地基于编码具有氧化还原酶活性的多肽的核酸分子的鉴定，在此在合适的时候称为“氧化还原酶”核酸分子或多肽。

此处描述的具体的核酸分子包括在SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587 589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975中显示的序列。如在此使用的，术语“核酸分子”可以包括DNA分子和RNA分子，利用核苷酸类似物产生的DNA或RNA的类似物。本发明的核酸分子可以是单链的或双链的，取决于它预期的用途。本发明的核酸分子包括与SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975的任一个具有至少75％序列相同性(例如至少80％、85％、90％、95％或99％序列相同性)并且具有功能性AT或氧化还原酶活性的分子。

在计算序列相同性百分比时，两个序列被比对，确定两个序列之间核苷酸或氨基酸残基的相同的匹配的数目。相同的匹配的数目除以比对的区域的长度(即比对的核苷酸或氨基酸残基的数目)，乘以100，得到序列相同性百分比值。要理解的是，比对的区域的长度可以是一个或两个序列的一部分，直到最短的序列的全长大小。要理解的是，单个序列可以与其他序列不同地比对，由此可以在每个比对的区域上具有不同的序列相同性百分比值。注意的是，相同性百分比值通常舍入到最接近的整数。例如，78.1％、78.2％、78.3％和78.4％向下舍入78％，而78.5％、78.6％、78.7％、78.8％和78.9％向上舍入到79％。还注意的是，比对的区域的长度总是整数。

使用Altschul等(1997，Nucleic Acids Res.，25：3389-3402)描述的、在互联网http://ncbi.nlm.nih.gov可获得的整合到BLAST(基础局部比对检索工具)程序中的算法进行两种或更多种序列的比对来确定序列相同性百分比。可以进行BLAST检索来确定此处描述的AT核酸分子和利用Altschul et al算法比对的任何其他序列或其部分之间的序列相同性百分比。BLASTN是用于比对和比较核酸序列之间相同性的程序，而BLASTP是用于比对和比较氨基酸序列之间相同性的程序。当利用BLAST程序来计算本发明的序列与另一个序列之间的相同性百分比时，使用相应的程序的默认参数。

本发明的核酸分子例如长度在约10和约50个核苷酸之间的那些可以在标准扩增条件下使用来扩增AT或氧化还原酶核酸分子。AT或氧化还原酶核酸的扩增可以用于检测AT或氧化还原酶核酸分子的存在与否的目的或用于获得(例如克隆)AT或氧化还原酶核酸分子的目的。如在此使用的，标准扩增条件是指扩增反应混合物的基本成分和循环条件，所述循环条件包括多个循环的变性模板核酸、将寡核苷酸引物与模板核酸退火以及通过聚合酶延伸引物来产生扩增产物(参见例如美国专利NO.4,683,195；4,683,202；4,800,159；和4,965,188)。扩增反应混合物的基本成分一般包括例如四种脱氧核苷三磷酸盐(例如dATP、dCTP、dTTP和dGTP或其类似物)的每一种、寡核苷酸引物、模板核酸和聚合酶。模板核酸典型在至少约90℃的温度下变性，来自引物的延伸典型在至少约72℃的温度下进行。此外，对原始PCR方法的改变(例如锚式PCR、RACE PCR或连接链式反应(LCR))已经被开发，并且是本领域已知的。参见例如Landegran et al.，1988，Science，241：1077-1080；和Nakazawa et al，1994，Proc.Natl.Acad.Sci.USA，91：360-364)。

退火温度可以用于控制扩增的特异性。引物与目标模板核酸退火的温度必须低于每种引物的Tm，但是足够高以避免引物与模板核酸的非特异性退火。Tm是一半的DNA双链体分离成单链的温度，可以利用Sambrook et al.(1989，Molecular Cloning：A Laboratory Manual，2nd Ed.，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，New York)的11.46节中提供的公式从寡核苷酸引物预测。非特异性扩增产物在凝胶上被检测为不是正确扩增产物的预期大小的条带。

本发明的核酸分子例如长度在约10到几百核苷酸(长度多达数千核苷酸)之间的那些可以在标准杂交条件下使用来与AT或氧化还原酶核酸分子杂交。与AT或氧化还原酶核酸分子的杂交可以用于检测或获得AT或氧化还原酶核酸分子的目的。如在此使用的，核酸分子之间的标准杂交条件在Sambrook et al.(1989，Molecular Cloning：A Laboratory Manual，2″Ed.，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY；小节7.37-7.57，9.47-9.57，11.7-11.8和11.45-11.57)中详细讨论。对于小于约100个核苷酸的寡核苷酸探针，Sambrook et al在小节11.45-11.46中公开了适合的Southern印迹条件。长度低于100核苷酸的序列和第二序列之间的Tm可以利用小节11.46中提供的化学式来计算。Sambrook et al.另外公开了用于Southern印迹的预杂交和杂交条件，其利用大于约100个核苷酸的寡核苷酸探针(参见小节9.47-9.52)。与大于100个核苷酸的寡核苷酸的杂交一般在低于Tm 15-25℃下进行。长度大于100个核苷酸的序列与第二序列之间的Tm可以利用Sambrook et al的小节9.50-9.51中提供的公式来计算。另外，Sambrook et al.建议在小节9.54中表明的条件用于洗涤Southern印迹，所述Southern印迹已用大于约100个核苷酸的寡核苷酸探测。

含有核酸的膜预杂交和杂交的条件以及洗涤含有核酸的膜来除去过量和非特异性结合的探针的条件可能在杂交的严格性方面起重要作用。例如，杂交和洗涤可以在低严格、中严格或高严格条件下进行。例如在Sambrook et al.小节11.45-11.46中描述了这样的条件。用于实现特定水平的严格性的条件将根据要杂交的核酸的性质而变化。例如，核酸的杂交区域的长度、互补性程度、核苷酸序列组成(例如G/C对比A/T核苷酸含量)和核酸类型(例如RNA、DNA)可以在选择杂交条件时考虑。例如，洗涤条件可以通过降低洗涤溶液中的盐浓度和/或通过提高进行洗涤的温度来变得更为严格。

杂交的量可以在膜上直接或根据利用例如感光成像仪或光密度计(Molecular Dynamics，Sunnyvale，CA)的放射自显影来量化。本领域技术人员理解的是，杂交的量的解释可以通过例如标记的寡核苷酸探针的比活性、靶核酸上探针结合位点的数量以及放射自显影或其他检测介质的暴光量来进行。容易理解的是，虽然任意杂交、洗涤和检测条件可以用于检查探针核酸分子与固定的靶核酸的杂交，更重要的是在相同的杂交、洗涤和检测条件下检查探针与靶核酸的杂交。优选靶核酸处在相同的膜上。技术人员可以理解的是，合适的阳性和阴性对照应与每组扩增或杂交反应一起进行以避免与污染和/或寡核苷酸引物或探针的非特异性退火相关的不确定性。

寡核苷酸引物或探针特异性与一或多种AT或氧化还原酶核酸退火或杂交。对于扩增，一对寡核苷酸引物一般与模板核酸的相反链退火，并且应当相互间隔合适的距离，从而聚合酶可以有效地跨区域聚合，这样扩增产物可以利用例如电泳容易地检测。寡核苷酸引物或探针可以利用例如帮助设计寡核苷酸的如OLIGO(Molecular Biology Insights Inc.，Cascade，CO)的计算机程序来设计。典型地，寡核苷酸引物长度是10到30或40到50个核苷酸(例如长度10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸)，但是如果使用合适的扩增条件可以更长或更短。

用于扩增D-氨基转移酶(DAT)核酸分子的非限制性代表性的寡核苷酸引物对在表2-8(SEQ ID NO：978-1062和1074-1083)、表46(SEQ ID NO：1084-1103)和表54(SEQ ID NO：1104-1125)中示出。SEQ ID NO：978-1062和1074-1083中显示的序列是可以用于扩增AT核酸分子的寡核苷酸引物的非限制性实例。根据本发明的寡核苷酸可以通过AT或氧化还原酶核酸分子的限制性酶消化获得或可以通过标准化学合成和其他已知技术来制备。

如在此使用的，“分离的”核酸分子是与通常与所述分离的核酸分子相关的其他核酸分子分开的核酸分子。因而，“分离的”核酸分子包括但不限于不含有在衍生所述分离的核酸的生物体的基因组中天然地位于所述核酸的一或两个末端侧翼的序列的核酸分子(例如通过PCR或限制性内切酶消化产生的cDNA或基因组DNA片段)。这样的分离的核酸分子通常被导入载体(例如克隆载体或表达载体)以方便操作或产生融合核酸分子。此外，分离的核酸分子可以包括工程化的核酸分子，例如重组或合成的核酸分子。在例如含有限制性消化的基因组DNA的核酸文库(例如cDNA或基因组文库)或一部分凝胶(例如琼脂糖或聚丙烯酰胺)之内数百到数百万其他核酸分子之中存在的核酸分子不被认为是分离的核酸。

此处描述的具有AT或氧化还原酶活性的分离的核酸分子可以利用本领域常规技术获得，所述技术的许多在本文实施例中描述。例如，本发明范围内的分离的核酸可以利用任何方法获得，包括但不限于重组核酸技术、聚合酶链反应(例如PCR，例如直接扩增或定点诱变)和/或核酸杂交技术(例如Southern印迹)。例如，在PCR Primer：A Laboratory Manual，Dieffenbach & Dveksler，Eds.，Cold Spring Harbor Laboratory Press，1995中描述了一般PCR技术。重组核酸技术包括例如限制性酶消化和连接，其可以用于分离此处描述的AT或氧化还原酶核酸分子。本发明的分离的核酸还可以作为单个核酸分子或作为一系列寡核苷酸来化学合成。

用于操纵核酸的技术例如亚克隆、标记探针(例如利用Klenow聚合酶的随机-引物标记、切口平移、扩增)、测序、杂交、扩增等在科学和专利文献中充分描述，参见例如Sambrook et al.，Eds.，1989，Molecular Cloning：A Laboratory Manual(2nd Ed.)，Vols 1-3，Cold Spring Harbor Laboratory；Current Protocols in Molecular Biology，1997，Ausubel，Ed.John Wiley & Sons，Inc.，New York；Laboratory Techniques in Biochemistry and Molecular Biology：Hybridization with Nucleic Acid Probes，Part I.Theory and Nucleic Acid Preparation，Tijssen，Ed.Elsevier，N.Y.(1993)。

纯化的AT或氧化还原酶多肽以及具有AT或氧化还原酶活性的多肽片段均在本发明的范围之内。AT多肽是指催化氨基基团和酮酸之间反应的多肽。具体地，DAT的转氨基反应涉及从氨基酸上除去氨基基团留下α-酮酸，将所述氨基基团转移到反应物α-酮酸上，从而将所述α-酮酸转化为氨基酸。AT多肽的预测的氨基酸序列在SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974和976中示出。氧化还原酶多肽是指催化氧化还原反应的多肽，氧化还原酶多肽的预测的氨基酸序列在SEQ ID NO：252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、962、964、966和968中示出。

在此使用的术语“纯化的”多肽是指已经与其天然相伴的细胞成分分开的多肽。典型地，当多肽至少部分地没有与之天然相关的蛋白质和天然发生的分子时就被认为所述多肽是“纯化的”。AT或氧化还原酶多肽的富集程度或纯度可以利用任何合适的方法例如柱层析、聚丙烯酰胺凝胶电泳或HPLC分析来测量。

本发明还提供了AT和氧化还原酶多肽，其在序列上不同于SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974和976。例如，本领域技术人员将理解变化可以被导入AT或氧化还原酶多肽(例如SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66：68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974和976)或AT或氧化还原酶核酸分子(例如SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975)，从而在编码的多肽中产生氨基酸序列的改变。在序列上不同于SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974和976并分别保持了氨基转移酶和氧化还原酶活性的AT和氧化还原酶多肽可以通过本领域中常规地使用的筛选方法容易地鉴定。

例如，改变可以导入AT或氧化还原酶核酸编码序列，引起在所述编码的AT或氧化还原酶多肽中一个或多个氨基酸残基处的保守性和/或非保守性氨基酸取代。核酸序列中的改变可以通过标准技术产生，例如编码这种多肽的核酸的定点诱变、PCR介导的诱变，或定向进化。此外，多肽序列中的变化可以通过沿着AT或氧化还原酶多肽的全部或部分随机导入，例如通过相应核酸的饱和诱变。或者，变化可以通过化学合成具有这种变化的核酸分子或多肽来导入核酸或多肽序列。

“保守性氨基酸取代”是在其中一个氨基酸残基被置换为具有相似侧链的不同氨基酸残基的一种取代。本领域评估了氨基酸残基之间的相似性。例如，Dayhoff et al.(1978，in Atlas of Protein Sequence and Structure，5(Suppl.3)：345-352)提供了氨基酸取代频率表，可以用作氨基酸相似性的度量。保守性取代的实例包括例如脂肪族氨基酸用另一个脂肪族氨基酸的置换；丝氨酸用苏氨酸的置换，反之亦然；酸性残基用另一个酸性残基的置换；带有酰胺基团的残基用另一个带有酰胺基团的残基的置换；碱性残基与另一个碱性残基的交换；或芳香族残基用另一个芳香族残基的置换。非保守性取代是其中氨基酸残基被置换为不具有相似侧链的氨基酸残基的一种取代。

核酸中的改变可以利用一或多种诱变剂引入。诱变剂包括但不限于紫外光、γ辐射或化学诱变剂(例如丝裂霉素、亚硝酸、光活化补骨脂素、亚硫酸氢钠、亚硝酸、羟胺、肼或甲酸)。其他诱变剂是核苷酸前体的类似物，例如亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或吖啶。也可以使用嵌入剂例如原黄素、吖啶黄素、奎纳克林等等。

还可以通过方法例如易错PCR、改组、寡核苷酸指导的诱变、组装PCR、有性PCR诱变、体内诱变、盒诱变、循环全体诱变(recursive ensemble mutagenesis)、指数全体诱变、基因再装配(例如GeneReassembly，参见例如美国专利No.6,537,776)、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)或其组合将改变导入AT或氧化还原酶核酸和/或多肽中。还可以通过方法例如重组、循环序列重组、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶的模板诱变、有缺口的双链体诱变、点错配修复诱变、修复缺陷的宿主菌株诱变、化学诱变、产放射性诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、全体诱变、嵌合核酸多聚体创造或任何其组合来将变化导入多肽中。

如果希望，AT或氧化还原酶核酸可以是密码子优化的。例如，可以鉴定非优选的或较低优选的密码子，并与编码相同氨基酸、作为置换密码子的优选的或中性使用的密码子置换。优选的密码子是在宿主细胞基因的编码序列中过量呈现的密码子，非优选的或较低优选的密码子是在宿主细胞基因的编码序列中不足呈现的密码子，从而修饰所述核酸来提高它在宿主细胞中的表达。AT或氧化还原酶核酸可以根据任何宿主细胞的特定密码子利用率来优化(例如，在此描述的任何宿主细胞)。关于密码子优化的代表性的描述参见例如美国专利No.5,795,737。除了密码子优化之外，核酸可以经历定向进化。参见例如美国专利No.6,361,974。

其他改变也在本公开的范围之内。例如，一个、两个、三个、四个或更多个氨基酸可以从氨基转移酶或氧化还原酶多肽的羧基和/或氨基末端除去而不显著改变生物学活性。此外，可以改变一个或多个氨基酸来提高或降低多肽的pI。在某些实施方案中，残基可以改变为例如谷氨酸。还提供了嵌合氨基转移酶或氧化还原酶多肽。例如，嵌合AT或氧化还原酶多肽可以包括不同的结合或催化结构域的部分。重新组合来自不同多肽的不同结构域和筛选产生的嵌合体来找到对于特定应用或底物的最佳组合的方法在本领域中是常规的。

在此例示的序列中的一个特定改变涉及相应于来自ATCC登记号No.4978(DAT 4978)的DAT中残基243的残基。在一种情况下，SEQ ID NO：870 DAT的多肽序列与DAT 4978比对，鉴定与DAT 4978中位置243对准的SEQ ID NO：870中的残基(残基242)，并从Thr改变为Asn(SEQ ID NO：870 T242N)。在另一种情况中，SEQ ID NO：220 DAT的多肽序列与DAT4978比对，鉴定与DAT 4978中位置243对准的SEQ ID NO：220中的残基(残基240或241)分别从Gly改变为Asn或从Thr改变为Asn(SEQ ID NO：220 G240N和SEQ ID NO：220 T241N)。本领域技术人员可以容易地鉴定在此处公开的任何DAT中相应于DAT 4978的残基243的残基，并向多肽序列中在该特定残基处引入改变。构建了许多其他的DAT突变体，在表43和52中列出。

注意的是，SEQ ID NO：894是新的DAT，在公众数据库中它的最接近序列展现了与SEQ ID NO：894多肽仅60％的序列相同性。因而，本发明的多肽包括与SEQ ID NO：894具有至少例如65％序列相同性(例如至少70％、75％、80％、85％、90％、95％或99％序列相同性)并且具有功能性DAT活性的序列。此外，SEQ ID NO：870也是新的DAT，与芽孢杆菌DAT多肽具有76％的序列相同性，与球形芽孢杆菌(B.sphaericus)DAT多肽具有69％的序列相同性。因而，本发明的多肽包括与SEQ ID NO：870具有至少80％序列相同性(例如至少85％、90％、95％或99％序列相同性)并具有DAT活性的序列。而且，SEQ ID NO：220是新的DAT，其与来自拜氏梭状芽孢杆菌(C.beijerinckii)的DAT多肽具有62％的序列相同性。因而，本发明的多肽包括与SEQ ID NO：220具有至少65％序列相同性(例如至少70％、75％、80％、85％、90％、95％或99％序列相同性)的序列。

在一种情况下，SEQ ID NO：870和910与公开的DAT比对，确定共有序列。使得多肽与芽孢杆菌样DAT多肽的组的其余部分与众不同的、SEQID NO：870样DAT多肽的共有序列示于SEQ ID NO：1069中(共有序列A)。在另一种情况下，SEQ ID NO：176、220、892、894和946被比对，确定了共有序列。这组DAT的共有序列在SEQ ID NO：1071中示出(共有序列C)。SEQ ID NO：1070(共有序列B)代表了相对于SEQ ID NO：1069(共有序列A)稍微更保守的共有序列，而SEQ ID NO：1072(共有序列D)和SEQ ID NO：1073(共有序列E)相应于相对SEQ ID NO：1071(共有序列C)稍微更保守的共有序列。预期具有相应于在此公开的共有序列A、B、C、D或E的共有序列的多肽将展现DAT活性。

氨基转移酶和氧化还原酶核酸或多肽的片段是指全长氨基转移酶和氧化还原酶核酸或多肽的一部分。如在此使用的，“功能性片段”是保持了相应酶活性的、氨基转移酶或氧化还原酶多肽的那些片段。“功能性片段”还指编码保持了相应酶活性的多肽的、氨基转移酶或氧化还原酶核酸的片段。例如，功能性片段可以用于体外或体内反应来分别催化转氨酶或氧化还原反应。

AT或氧化还原酶多肽可以通过已知方法例如DEAE离子交换、凝胶过滤和羟磷灰石层析获得(例如纯化的)自天然来源(例如生物学样品)。天然来源包括但不限于微生物例如细菌和酵母。纯化的AT或氧化还原酶多肽还可以通过例如克隆和表达AT或氧化还原酶核酸(例如SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587 589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975)以及纯化产生的多肽来获得，利用例如任何已知的表达系统，包括但不限于谷胱甘肽S-转移酶(GST)、pGEX(Pharmacia Biotech Inc)、pMAL(New England Biolabs，Beverly，MA)或pRIT5(Pharmacia，Piscataway，NJ))。此外，纯化的AT或氧化还原酶多肽可以利用例如固相合成技术(参见例如Roberge，1995，Science，269：202；Merrifield，1997，Methods Enzymoi，289：3-13)通过化学合成来获得。

纯化的AT或氧化还原酶多肽或其片段可以用作免疫原来产生多克隆或单克隆抗体，所述抗体具有对一或多种AT或氧化还原酶多肽的特异性结合亲和力。这种抗体可以利用本领域中常规使用的标准技术产生。全长AT或氧化还原酶多肽或做为选择AT或氧化还原酶多肽的抗原性片段可以用作免疫原。AT或氧化还原酶多肽的抗原性片段通常包括AT或氧化还原酶多肽(例如具有SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、具有表43或表52中所示的一个或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974和976中所示的序列)的至少8个(例如10、15、20或30个氨基酸残基并包含AT或氧化还原酶多肽的表位，从而针对所述抗原性片段产生的抗体(例如多克隆或单克隆的；嵌合的或人源化的)具有对一或多种AT或氧化还原酶多肽的特异性结合亲和力。

多肽可以通过本领域已知的任何方法检测和定量，包括但不限于核磁共振(NMR)、分光光度测定法、射线照相(蛋白质放射性标记)、电泳、毛细管电泳、高效液相层析法(HPLC)、薄层层析(TLC)、超扩散层析、各种免疫学方法，例如免疫沉淀、免疫扩散、免疫电泳、放射免疫分析(RIA)、酶联免疫吸附分析(ELISA)、免疫荧光分析、凝胶电泳(例如SDS-PAGE)、用抗体染色、荧光活化细胞分选(FACS)、热解质谱测量、傅里叶变换红外光谱法、Raman光谱、GC-MS和LC-电喷射和cap-LC-串联-电喷射质谱法等等。新的生物活性也可以利用美国专利No.6,057,103中描述的方法或其变体来筛选。此外，细胞的一或多种或所有多肽可使用蛋白阵列测量。

使用DAT或氧化还原酶核酸和多肽的方法

AT或氧化还原酶多肽或编码这样的AT和氧化还原酶多肽的AT或氧化还原酶核酸分别可以用于促使色氨酸转化成吲哚-3-丙酮酸和/或促使MP转化为monatin(或逆反应)。注意的是此处描述的反应不限于任何特定的方法，除非另有说明。例如，在此公开的反应可以在体内、体外或其组合地发生。

提供了含有AT或氧化还原酶核酸分子的构建体。适合于表达AT或氧化还原酶多肽的构建体包括表达载体是商业上可获得的和/或通过本领域常规的重组DNA技术方法容易地产生。代表性的构建体或载体包括但不限于复制子(例如RNA复制子、噬菌体)，自主自我复制性环形或线性DNA或RNA，病毒载体(例如腺病毒载体、逆转录病毒载体或腺相关病毒载体)，质粒，噬菌体，噬菌粒，粘粒，fosmid，细菌噬菌体或人工染色体。克隆载体可以包括人工染色体，包括细菌人工染色体(BAC)，噬菌体P1衍生的载体(PAC)、酵母人工染色体(YAC)，或哺乳动物人工染色体(MAC)。示范性的载体包括但不限于pBR322(ATCC 37017)、pKK223-3、pSVK3、pBPV、pMSG和pSVL(Pharmacia Fine Chemicals，Uppsala，Sweden)、GEM1(Promega Biotec，Madison，WI，USA)pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174 pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A、pSV2CAT、pOG44、pXT1、pSG(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。对于代表性的质粒、病毒等等的描述还参见美国专利No.5,217,879。

含有AT或氧化还原酶核酸分子的载体或构建体可以具有与AT或氧化还原酶核酸可操纵连接的、表达所必需的元件。表达必需的元件包括指导和调节核酸编码序列表达的核酸序列。表达所必需的元件的一个实例是启动子序列。启动子序列是能够驱动编码序列转录的序列。启动子序列可以是例如AT或氧化还原酶启动子序列，或非AT或非氧化还原酶启动子序列。非AT和非氧化还原酶启动子包括例如细菌启动子如lacl、lacZ、T3、T7、gpt、lambda PR、lambdaPL和trp以及真核启动子如CMV立即早期、HSV胸苷激酶、早期和晚期SV40、来自逆转录病毒的LTR和小鼠金属硫蛋白I。启动子还可以是例如组成型、可诱导和/或组织特异性的。代表性的组成型启动子是CaMV 35S；代表性的可诱导启动子包括例如阿拉伯糖、四环素可诱导的和水杨酸应答性启动子。

表达所必需的其他元件可以包括调节核酸的表达的内含子、增强子序列(例如SV40增强子)、应答元件或可诱导元件。表达所必需的元件可以包括前导区或信号序列。参见例如SEQ ID NO：156，其是具有前导序列的DAT多肽。表达所必需的元件还可以包括例如用于翻译起始的核糖体结合位点、剪接供体和受体位点和转录终止子。表达所必需的元件可以是细菌、酵母、昆虫、哺乳动物或病毒来源，载体或构建体可以含有来自不同来源的元件的组合。例如在Goeddel，1990，Gene Expression Technology：Methods in Enzymology，185，Academic Press，San Diego，CA中描述了表达所必需的元件。

此处描述的载体或构建体可以进一步包括序列例如编码可选择标记的那些(例如编码二氢叶酸还原酶的基因或为真核细胞赋予新霉素抗性的基因；为大肠杆菌(E.coli)赋予四环素或氨苄青霉素抗性的基因；以及编码啤酒糖酵母(S.cerevisiae)的TRP1的基因)，可以用于AT或氧化还原酶多肽的纯化的序列(例如6×His标签)和涉及载体或构建体的复制的一或多种序列(例如复制起点)。此外，载体或构建体可以含有例如用于整合载体或构建体的具有序列同源性的一或两个区域。用于基因组整合的载体和构建体是本领域公知的。

如在此使用的，可操纵连接的是指启动子和/或其他调节元件在载体或构建体中相对于AT或氧化还原酶核酸以一种指导或调节所述AT或氧化还原酶核酸表达的方式放置。通常，与转录的序列可操纵连接的、表达所必需的启动子和其他元件与所述转录的序列是物理上连续的，即它们是顺式作用的。然而，某些转录调节序列例如增强子不必是物理连续的或紧密接近表达被它们增强的编码序列。

还提供的是宿主细胞。宿主细胞一般含有本发明的核酸序列例如编码AT或氧化还原酶的序列，或此处描述的载体或构建体。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞，例如原核细胞或真核细胞，包括细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。示范性的细菌细胞包括埃希杆菌属(Escherichia)、芽孢杆菌属(Bacillus)、链霉菌属(Streptomyces)、沙门氏菌属(Salmonella)、假单胞菌属(Pseudomonas)和葡萄球菌属(Staphylococcus)的任何物种，包括例如大肠杆菌、乳酸乳芽孢杆菌(L.lactis)、枯草芽孢杆菌(B.subtilis)、蜡状芽孢杆菌(B.cereus)、鼠伤寒沙门氏菌(S.typhimurium)、荧光假单胞菌(P.fluorescens)。示范性的真菌细胞包括曲霉属(Aspergillus)的任何物种，示范性的酵母细胞包括毕赤氏酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖糖酵母属(Schizosaccharomyces)或许旺氏酵母属(Schwanniomyces)的任何物种，包括巴斯德毕赤氏酵母(P.pastoris)、啤酒糖酵母或粟酒裂殖糖酵母(S.pombe)。示范性的昆虫细胞包括Spodoptera或果蝇(Drosophila)的任何物种，包括果蝇S2和Spodoptera Sf9。示范性的动物细胞包括CHO、COS、Bowes黑素瘤、C127、3T3、HeLa和BHK细胞系。参见例如Gluzman，1981，Cell，23：175。合适的宿主的选择在本领域技术人员的能力之内。

向各种细胞中导入核酸的技术是公知的，在技术和科学文献中描述。载体或构建体可以利用多种技术的任一种导入宿主细胞，包括转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移。特定的方法包括磷酸钙转染、DEAE-葡聚糖介导的转染、脂染或电穿孔(Davis et al.，1986，Basic Methods in Molecular Biology)。示范性的方法包括CaPO₄沉淀、脂质体融合、脂染(例如LIPOFECTIN^TM)、电穿孔、病毒感染等等。AT或氧化还原酶核酸可以稳定整合到宿主细胞的基因组中(例如用逆转录病毒导入)或可以在细胞质中瞬时或稳定存在(即通过使用传统的质粒，利用标准调节序列、选择标记等等)。

宿主细胞的内含物通过离心收获，通过物理或化学手段破坏，产生的粗提取物保持用于进一步纯化。为蛋白质的表达所采用的微生物细胞可以通过任何方便的方法来破坏，包括冻融循环、超声处理、机械破碎或使用细胞裂解剂。这些方法是本领域技术人员公知的。表达的多肽或其片段可以通过一些方法从细胞培养物回收和纯化，所述方法包括但不限于沉淀(例如硫酸铵或乙醇)、酸提取、层析(例如阴离子或阳离子交换、磷酸纤维素、疏水性相互作用、亲和力、羟磷灰石和凝集素)。如果希望，可以采用高效液相层析法(HPLC)用于最后的纯化步骤。

也可以采用无细胞翻译系统产生本发明的多肽。无细胞翻译系统可以使用从DNA构建体转录的mRNA，所述DNA构建体包含与编码多肽或其片段的核酸可操纵连接的启动子。在某些方面，DNA构建体可以在进行体外转录反应之前线性化。转录的mRNA然后与合适的无细胞翻译提取物例如兔网织红细胞提取物保温来产生期望的多肽或其片段。

AT或氧化还原酶多肽、其片段或变体可以通过许多方法分析活性。检测或测量酶多肽的活性的方法一般包括组合多肽、其片段或变体与合适的底物，测定底物的量是否降低和/或产物或副产物的数量是否提高。用于评估在此公开的DAT的活性的底物典型是色氨酸和/或R-MP，产物是吲哚-3-丙酮酸和/或R，R-monatin。除了色氨酸或MP底物之外，预期在此公开多肽还将利用取代的色氨酸和/或MP底物例如但不限于氯化的色氨酸或5-羟色氨酸。此外，可以监测或测量MP向monatin转化的副产物(例如4-羟基-4-甲基谷氨酸(HMG))。

例如Sugio et al.，1995，Biochemistry，34：9661-9669；Ro et al.，1996，FEBS Lett.，398：141-145；or Gutierrez et al.，2000，Eur.J.Biochem.，267，7218-7223描述了评估AT活性的方法。此外，例如Lee et al.，2006，AEM，72(2)：1588-1594；和Mayer，2002，J.Biomolecular Screening，7(2)：135-140描述了评估脱氢酶活性的方法。此外，在本文实施例章节的A部分和B部分中描述了评估候选多肽的DAT活性的方法。为了确定多肽是否属于本发明的范围，采用实施例章节中B部分描述的方法。

典型地，AT或氧化还原酶多肽展现了在约0.05到20单位(例如约0.05、0.10、0.20、0.30、0.40、0.50、0.60、0.70、0.80、0.90、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7、8、9、10、11、12、13、14、15、16、17、18、19或19.5或更多个单位)的范围内的活性。如在此使用的，一个单位等于每mg酶每分钟释放的1μmol的产物。在一个实施方案中，AT多肽的一个活性单位是每mg酶每分钟产生的1μmol α-酮酸或酮(从相应的α-氨基酸或胺形成)。在可选择的实施方案中，氨基转移酶多肽的一个活性单位是每mg酶每分钟产生1μmol的α-氨基酸或胺(从相应的α-酮酸或酮形成)。

利用在此公开一或多种AT或氧化还原酶核酸或多肽，色氨酸向吲哚-3-丙酮酸的转化或MP向monatin的转化可以在体外或体内、在溶液中或在宿主细胞中连续或平行进行。当一或多种反应在体外进行时，反应的期望成分可以通过在水性反应介质或溶液中混合来组合，并维持足够产生期望的产物的时间。做为选择，一或多种此处描述的反应中使用的一或多种AT或氧化还原酶多肽可以固定在固相支持物上。固相支持物的实例包括含有环氧、醛、螯合剂或伯胺基团的那些。适合的固相支持物的具体实例包括但不限于EupergitC(Rohm and Haas Company，Philadelphia，PA)树脂珠和SEPABEADS

EC-EP(Resindion)。

为了在体内从色氨酸产生吲哚-3-丙酮酸或从MP产生monatin，AT或氧化还原酶核酸(例如表达载体)可以导入此处描述的任何宿主细胞中。取决于宿主细胞，发生转化反应所必需的许多或所有辅因子(例如金属离子、辅酶、吡哆醛磷酸或磷酸泛酰巯基乙胺)和/或底物可以在培养基中提供。在容许体外或体内反应进行时，转化的效力可以通过确定底物的量是否降低或产物的量是否提高来评估。

在某些实施方案中，在此公开一或多种AT或氧化还原酶多肽的活性可以利用技术人员已知的许多策略来改善或优化。例如，进行一或多种反应的体内或体外条件例如pH值或温度可以被调节来改善或优化多肽的活性。此外，多肽的活性可以通过重新克隆AT或氧化还原酶核酸到不同的载体或构建体中和/或使用不同的宿主细胞来改善或优化。例如，可以使用被遗传地工程化或选择来展现提高的摄取或生产色氨酸的宿主细胞(参见例如美国专利No.5,728,555)。而且，AT或氧化还原酶多肽的活性可以通过确保或帮助多肽的适当折叠(例如通过使用蛋白伴侣多肽)或适当的翻译后修饰例如但不限于乙酰化、酰化、ADP-核糖基化、酰胺化、糖基化、羟基化、碘化、甲基化、豆蔻酰化、氧化、PEG化、磷酸化、异戊二烯化、硒化、硫酸化、二硫键形成和脱甲基以及共价附着分子如黄素、血红素部分、核苷酸或核苷酸衍生物、脂质或脂质衍生物和/或磷脂酰肌醇来改善或优化。此外，多肽的溶解度可以利用本领域已知的许多方法来提高，例如但不限于低温表达或周质表达。

在此利用色氨酸和/或MP作为底物鉴定了展现DAT活性的许多多肽。具体地，SEQ ID NO：950、946、948、892、894、866、870、870T242N、872、874、878、880、882、884、902、910、918、176、178、154、220、156、216、238、224、230、232、214、CbDAT、CaDAT和LsDAT展现了DAT活性。注意到SEQ ID NO：946、892、894、220、176、1064、1066和1068在实施例B部分中描述的条件下展现了非常高的活性。注意SEQ ID NO：220和894在MP向monatin的转化期间产生了低水平的HMG副产物。

氨基转移酶或氧化还原酶核酸或多肽在生产Monatin中的用途

在此公开的一或多种DAT多肽可以用于生产monatin。Monatin是具有以下化学式的高强度甜味剂：

Monatin包括两个手性中心，产生四种可能的立体异构体构型。R，R构型(“R，R立体异构体”或“R，R monatin”)；S，S构型(“S，S立体异构体”或“S，S monatin”)；R，S构型(“R，S立体异构体”或“R，S monatin”)和S，R构型(“S，R立体异构体”或“S，R monatin”)。如在此使用的，除非另有说明，术语“monatin”用于指包括monatin的所有四种立体异构体的组合物、包括monatin立体异构体的任何组合的组合物(例如仅包含monatin的R，R和S，S立体异构体的组合物)以及单一同分异构形式(或其任何盐)。由于monatin的各种编号系统，monatin已知有许多可选的化学名称，包括：2-羟基-2-(吲哚-3-基甲基)-4-氨基戊二酸；4-氨基-2-羟基-2-(IH-吲哚-3-基甲基)-戊二酸；4-羟基-4-(3-吲哚基甲基)谷氨酸；和3-(1-氨基-1，3-二羧基-3-羟基-丁-4-基)吲哚。

产生monatin的各种立体异构体(例如R，R monatin)的方法在例如WO 07/133183和WO 07/103389中揭示。在存在色氨酸的情况下，在此公开的一或多种DAT多肽可以用于技术人员已知的方法来产生monatin组合物。如在WO 07/133183和WO 07/103389中公开的，吲哚-3-丙酮酸(或其衍生物，参见例如WO 07/103389)向2-羟基2-(吲哚-3基甲基))-4-酮戊二酸(“monatin前体”或“MP”)的转化指示了monatin的第一手性中心，而MP向monatin的转化指示了第二手性中心。在一个实施方案中，生产monatin所需要的一或多种转化由超过一种的酶例如酶的混合物催化，从而产生的组合物或制品含有期望的百分比的(例如最小和/或最大)一或多种所述monatin立体异构体(例如R，Rmonatin)。做为选择，根据本发明的方法由两个独立的工程化的途径产生的monatin被组合来产生含有这种期望百分比的每种monatin立体异构体的组合物或制品。

利用在此公开的一或多种AT多肽产生的monatin按产生的总monatin的重量计算可以是至少约0.5-30％的R，R-monatin。在其他实施方案中，利用在此公开的一或多种多肽或生物合成途径产生的monatin按产生的总monatin的重量计算是大于30％的R，R-monatin；例如R，R-monatin是产生的总monatin的40％、50％、60％、65％、70％、75％、80％、85％、90％、95％或99％。做为选择，不同量的两种或更多种monatin制品可以被组合以产生有期望的R，R-monatin百分比的制品。例如，30％ R，R-monatin的monatin制品可以与90％ R，R-monatin的monatin制品组合；如果组合等量的30％和90％ R，R-monatin制品，产生的monatin制品将是60％ R，R-monatin。

利用在此公开的一或多种DAT多肽产生的monatin可以是例如衍生物。“monatin衍生物”具有以下结构：

其中，R_a、R_b、R_c、R_d和R_e各自独立地代表任何取代基，所述取代基选自氢原子、羟基基团、C₁-C₃烷基基团、C₁-C₃烷氧基基团、氨基基团、或卤素原子，例如碘原子、溴原子、氯原子或氟原子。然而，R_a、R_b、R_c、R_d和R_e不能同时都是氢。做为选择，R_b和R_c，和/或R_d和R_e可以分别一起形成C₁-C₄亚烷基基团。“取代的monatin”是指例如卤化或氯化的monatin或monatin衍生物。参见例如美国公开NO.2005/0118317。

Monatin衍生物也可以用作甜味剂。例如，氯化的D-色氨酸，特别是6-氯-D-色氨酸，其与R，R monatin具有结构相似性，已经被鉴定为非营养性甜味剂。类似地，monatin的卤化和羟基取代形式已经被发现是甜味的。参见例如美国公开NO.2005/0118317。取代的吲哚已经在文献中显示了是PLP酶的合适底物，并产生了取代的色氨酸。参见例如Fukuda et al.，1971，Appl.Environ.Microbiol，21：841-43。卤素看起来不会空间上阻碍酶的催化机制或对映异构特异性。因而，卤素和羟基基团应是可取代氢的，特别是在色氨酸的吲哚中的苯环的1-4位上，而不影响随后向D-或L-色氨酸、吲哚-3-丙酮酸、MP或monatin的转化。

在此公开的一或多种DAT多肽与或不与一或多种另外的多肽一起可以用于生产monatin。DAT多肽(或编码这样的DAT多肽的核酸分子)可以用于色氨酸向吲哚-3-丙酮酸(在存在氨基接受体的情况下)的转化和MP向monatin的转化。这两个反应之间的中间步骤是吲哚-3-丙酮酸向MP的转化，其需要存在C3碳源，例如丙酮酸、草酰乙酸或丝氨酸。在从MP到monatin的转化步骤中DAT多肽的使用在第二手性中心处产生了R构型。注意SEQ ID NO：946、950、220和948产生高量的R，R monatin。

吲哚-3-丙酮酸盐/酯(或吲哚-3-丙酮酸)向MP的转化可以在不存在酶的情况下发生(即醛醇缩合)，但也可以通过多肽来促进。在第一手性中心处的手性由转化吲哚-3-丙酮酸盐/酯为MP的反应的对映异构特异性来决定。如果MP形成反应不由酶来促成，R-MP和S-MP的外消旋混合物一般在没有手性辅助剂的情况下形成。促成吲哚-3-丙酮酸盐/酯向MP的转化的酶包括例如合酶/裂合酶(EC 4.1.3.-和4.1.2.-)，特别是在EC 4.1.3.16和EC 4.1.3.17类别中的那些。这些类别包括碳-碳合酶/裂合酶，例如催化两个羧酸底物缩合的醛缩酶。酶类别EC 4.1.3.-是利用含氧酸底物(例如吲哚-3-丙酮酸)作为亲电子物质形成碳-碳键的那些合酶/裂合酶，而EC 4.1.2.-是利用醛底物(例如苯甲醛)作为亲电子物质形成碳-碳键的合酶/裂合酶。例如，KHG醛缩酶(EC 4.1.3.16)和HMG醛缩酶(EC 4.1.3.17)已知转化吲哚-3-丙酮酸和丙酮酸为MP。在此，术语HMG醛缩酶用于指具有4-羟基-4-甲基-2-酮戊二酸醛缩酶活性的任何多肽。HMG醛缩酶的适合的合适实例包括睾丸酮丛毛单胞菌(Comamonas testosteroni)ProA和苜蓿中华根瘤菌(Sinorhizobium meliloti)ProA(NCBI登记号No.CAC46344)。

当产生monatin的途径中的一或多种转化反应在体内进行时，本领域普通技术人员可以通过各种常规方法优化在微生物中monatin的产生，包括R，R monatin。这样的微生物可以是在一或多种以下特征方面比其他微生物天然地更好的微生物，或已经被修饰以展现一或多种以下特征的微生物，其典型导致monatin的改善生产(与这种修饰之前的微生物相比)。这样的特征包括但不限于微生物摄取色氨酸(例如D-色氨酸)的能力提高；微生物摄取吲哚-3-丙酮酸的能力提高；微生物分泌吲哚-3-丙酮酸的能力降低；微生物中吲哚-3-丙酮酸降解的量降低；和/或D-色氨酸对微生物的毒性降低。这些特征和用于获得展现了一或多种这样特征的微生物的策略在例如WO 07/133183和WO 07/103389中描述。

使用在此公开的一或多种AT或氧化还原酶多肽产生的monatin，或色氨酸到monatin生物合成途径的中间物(包括吲哚-3-丙酮酸和MP)可以从反应成分中纯化。在一个实施方案中，所述monatin或中间物可以简单地通过取出所述物质来纯化，所述物质将从合成它的酶制剂中纯化。在其他实施方案中，monatin或中间物从合成它的制剂中纯化，从而产生的“纯化的”组合物或制品是总有机化合物重量的至少约5-60％ monatin。在另一个实施方案中，monatin或中间物可以被纯化到按总有机化合物的重量至少约70％、80％、90％、95％或99％的纯度。利用在此公开一或多种多肽或生物合成途径产生的monatin可以通过本领域普通技术人员已知的任何方法(例如重复重结晶)从反应成分中纯化。

根据本发明，可以采用本领域技术人员能力之内的常规分子生物学、微生物学、生物化学和化学技术。这些技术已经在文献中完整地说明。将在以下实施例中进一步描述本发明，但其不限制权利要求书中描述的本发明的范围。

实施例

此处描述的氨基转移酶和氧化还原酶利用选择策略获得。在这种选择策略中，在展现了L-色氨酸营养缺陷的细菌宿主菌株中构建环境DNA文库。文库克隆在含有D-色氨酸(但是缺乏L-色氨酸)的培养基上接种。可以生长的仅有克隆是表达在不连续的环境DNA片段之一上的基因的克隆，所述基因编码对D-色氨酸有活性的酶。例如，鉴定了表达活性色氨酸消旋酶和能够将D-色氨酸转化成L-色氨酸的克隆。另外，鉴定了表达氧化还原酶(例如氨基酸氧化酶或脱氢酶)的克隆，所述氧化还原酶能够将D-色氨酸转化成可被宿主细胞随后转化成L-色氨酸的中间物。对于氧化还原酶例如氨基酸氧化酶和脱氢酶来说，一种这样的中间物是吲哚-3-丙酮酸。

A部分的实施例描述了用于候选DAT和氧化还原酶核酸和编码的多肽的初步表征的方法学。特定核酸和多肽的进一步表征在B部分中描述。

A部分

实施例1——生长和分析方法#1

酶制备

甘油原液被用于接种具有合适抗生素的、含有50mL LB培养基的烧瓶。起始培养物在37℃、在230rpm摇动生长过夜，检查OD_600nm。起始培养物用于接种400mL，到OD_600nm为0.05。培养物在37℃、230rpm下摇动保温。

当OD_600nm在0.5和0.8之间时，用1mM IPTG诱导培养物，并在30℃和230rpm孵育过夜。通过在4000rpm离心15分钟沉淀细胞来收获培养物。倒出上清液，沉淀冷冻用于以后使用或重悬在补充有26U/mL DNAse的20mL的50mM磷酸钠缓冲液(pH 7.5)中，根据厂家说明书利用microfluidizer(Microfluidics Corporation，Newton，MA)裂解。收集澄清的裂解物，在11,000rpm离心30分钟。将上清收集在清洁的试管中，用0.2μm滤器过滤。澄清的裂解物的5mL等份置于小瓶中，利用冷冻干燥器(Company，Gardinier，NY)根据厂家说明书冻干。保留大约1mL澄清的裂解物用于利用Bio-Rad蛋白质分析试剂(BIO-RAD，Hercules，CA)和SDS-PAGE分析的蛋白质定量。然后，计算每个冻干样品中的蛋白量。

活性分析

用于活性分析的酶在50mM磷酸钠pH 7.5中制备。通常使用大约1mg/mL总蛋白进行DAT分析。

利用RR-monatin底物的DAT分析

25mM RR-monatin，25mM丙酮酸钠盐，0.08mM PLP，90mM磷酸钠pH 8.0和如上所述(在“酶制备”章节)制备的0.8mg/mL DAT(总蛋白)被组合，并在300rpm在30℃孵育。在各个时点(一般0、2、4和24小时)，将50μL的反应产物转移到150μL冰冷的乙腈中，样品涡旋30秒。样品在13,200rpm在4℃离心10分钟，上清通过0.45μm滤器。滤液在甲醇中稀释10倍，通过LC/MS/MS分析样品来监视形成的D-丙氨酸(在以下的这个实施例中“鉴定D-丙氨酸或R，R-monatin的LC/MS/MS方法”章节中描述)。

利用色氨酸底物的DAT分析

10mM D-色氨酸、25mM丙酮酸钠盐、0.08mM PLP、90mM磷酸钠pH 8.0和如上所述(在“酶制备”章节)制备的0.8mg/mL DAT(总蛋白)被组合，在30℃和300rpm孵育。在时点(一般0、2、4和24小时)将50μL的反应产物转移到150μL冰冷的乙腈中，样品涡旋30秒，在4℃在13,200rpm离心10分钟。上清通过0.45μm滤器，滤液在甲醇中稀释10倍。样品通过LC/MS/MS分析来监测形成的D-丙氨酸(在以下这个实施例中“检测D-丙氨酸或R，R monatin的LC/MS/MS方法”章节中描述)。

用于检测D-丙氨酸或R，R-monatin的LC/MS/MS方法

LC/MS/MS筛选通过利用CTCPal自动采样器(LEAP Technologies，Carrboro，NC)将样品从96孔平板通过Zorbax Eclipse XDB-C8(2.1×50mm)柱以1.0mL/分钟注射到LC-10ADvp泵(Shimadzu，Kyoto，Japan)提供的30/70 H₂O/Acn(0.1％甲酸)混合物中，然后注射到API4000 Turbolon-Spray三重四极质谱仪(Applied Biosystems，Foster City，CA)中。

以阳离子模式对感兴趣的分析物进行离子喷雾和多反应监视(MRM)，丙氨酸：亲本/子离子：90.12/44.25，monatin：亲本/子离子：293.11/130.15。

实施例2 利用分析程序#1的DAT活性

载体pSE420-cHis是pSE420(Invitrogen，Carlsbad，CA)的衍生物。对于pSE420-cHis，载体用NcoI和HindIII切割，与C-His连接。C-His：5′-CCATGG GAG GAT CCA GAT CTC ATC ACC ATC ACC ATC ACT AAG CTT(SEQ ID NO：977)。His标签在这个载体中的表达取决于宿主和终止密码子的选择。也就是说，如果使用TAG终止密码子和supE宿主，表达His标签；如果使用TAG终止密码子和非supE宿主，His标签则不表达。除非另外表明，His标签在这些实验中不表达。

DAT亚克隆在pSE420-cHis载体/大肠杆菌HMS 174宿主(Novagen，San Diego，CA)中，以下亚克隆除外：SEQ ID NO：930、932、936处在pET101 D-Topo载体/BL21Star(DE3)宿主(Invitrogen，Carlsbad，CA)中；SEQ ID NO：934处在pET101 D-Topo载体/BL21 Codon PlusRIL宿主(Stratagene，La Jolla，CA)中；SEQ ID NO：938、942、944、946处在pSE420载体/XL1Blue宿主(Stratagene，La Jolla，CA)中；SEQ ID NO：940，948，950，962和966处在pSE420-c-His载体/XL1Blue宿主(Stratagene，La Jolla，CA)中；以及SEQ ID NO：928处在pQET1载体/M15pREP4宿主中(pQET1在美国专利No.5,814,473和6,074,860中描述；M15pREP4来自Qiagen；Valencia，CA)。

根据实施例1中描述的方法生长、裂解和冻干亚克隆。测试样品对R，R-monatin和D-色氨酸的活性(如实施例1所述)。对于monatin DAT分析，DAT与25mM R，R-monatin、25mM丙酮酸钠盐和0.08mM PLP(pH 8)在30℃孵育。对于D-色氨酸DAT分析，DAT与10mMD-色氨酸、25mM丙酮酸钠盐和0.08mM PLP(pH 8)在30℃孵育。所有DAT在两种分析中以0.8mg/mL总蛋白加载。

在标明的时点，将50μL反应产物添加到150μL冰冷的乙腈中。样品涡旋30秒，上清在甲醇中稀释10倍。然后样品通过LC/MS/MS分析(如实施例1所述)来监测形成的D-丙氨酸。下表显示了对两种底物的D-氨基转移酶活性。

表1：D-氨基转移酶亚克隆对R，R-monatin和D-色氨酸的活性

NT，未测试；ND，在使用的条件下未测出；+，低表达，++中度表达，+++高表达

表1：D-氨基转移酶亚克隆对R，R-monatin和D-色氨酸的活性(续)

872	62.3@24hr	NT	+++
				874	46.5@24hr	NT	+++
876	44@24hr	NT	++
				878	37@24hr	NT	+++
972	＜5@24hr	NT	+
				880	72.4@24hr	79.6@24hr	+
882	158.8@24hr	344@2hr	+++
				884	290@24hr	363@2hr	++
896	54@24hr	450@2hr	+++

898	466@24hr	300@24hr	+
				900	135@24hr	154@24hr	+
902	280@24hr	130@24hr	++
				904	170@24hr	140@24hr	+
906	700@24hr	500@24hr	+++
				908	55@24hr	45@24hr	+不可溶的

NT，未测试；ND，未检出；+，低表达；++，中度表达；+++，高表达

表1.D-氨基转移酶亚克隆对R，R-monatin和D-色氨酸的活性(续)

要注意的是，在上文列出的亚克隆和在序列表中也列出的它们的天然序列之间仅有非常保守的差异。例如，经常地，启动或终止密码子被修饰以在大肠杆菌中更有效的表达。预计野生型序列的克隆将就DAT活性而言得到相似的结果。为了清楚的目的，下表显示了此处描述的许多克隆和亚克隆之间的关系。

B部分

实施例3-Monatin、MP、色氨酸、丙氨酸和HMG的检测

这个实施例描述了与选定的D-氨基转移酶(DAT)的进一步表征相关的分析方法学。

monatin和色氨酸的LC/MS/MS多反应监测(MRM)分析

来自生化反应的monatin和色氨酸的混合物的分析利用Waters/Micromass液相层析串联质谱法(LC/MS/MS)仪器来进行，所述仪器包括串联置于色谱仪和Micromass

Quattro Ultima

三重四极质谱仪之间的、具有Waters 996 Photo-Diode Array(PDA)吸光度监测器的Waters 2795液相色谱仪。LC分离利用Xterra MS C8反相层析柱，2.1mm×250mm在40℃进行。LC流动相由A)含有0.3％甲酸和10mM甲酸铵的水和B)含有0.3％甲酸和10mM甲酸铵的甲醇组成。

梯度洗脱是从5％B到45％B、0-8.5分钟线性，从45％B到90％B、8.5-9分钟线性，90％B到90％B、9-12.5分钟无梯度，90％B到5％B、12.5-13分钟线性，运行之间4分钟的再平衡时间。流动速度是0.27mL/分钟，PDA吸光度从210nm到400nm监测。根据感兴趣分析物的质子化分子离子([M+H]+)的生成和特征性片段离子的产生来优化和选择ESI-MS的所有参数。对monatin和色氨酸的LC/MS/MS多反应监测(MRM)分析使用以下仪器参数：Capillary：3.5kV；Cone：40V；Hex 1：20V；Aperture：0V；Hex 2：0V；源温度：100℃；去溶剂化温度：350℃；去溶剂化气体：500L/h；Cone气体：50L/h；低质量分辨率(Q1)：12.0；高质量分辨率(Q1)：12.0；离子能量：0.2；Entrance：-5V；碰撞能量：8；Exit：1V；低质量分辨率(Q2)：15；高质量分辨率(Q2)：15；离子能量(Q2)：3.5；倍增器：650。四种monatin特异性亲本向子MRM转变和一种色氨酸特异性亲本向子代转变被用于特异性检测体外和体内反应的monatin和色氨酸。监测的转变是293.08到157.94，293.08到167.94，293.08到130.01和293.08到256.77。色氨酸监测的MRM转变205.0到146.0。对于monatin和色氨酸的内标准定量，分析含有四种不同比例的每种分析物比d₅-色氨酸和d₅-monatin的四种校准标准物。这些数据进行线性最小平方分析来形成monatin和色氨酸的校准曲线。向每种样品添加固定量的d₅-色氨酸和d₅-monatin(d₅-monatin根据WO 2003/091396 A2的方法从d₅-色氨酸合成)，与上述标定曲线结合的反应比例(monatin/d₅-monatin；色氨酸/d₅-色氨酸)用于计算混合物中每种分析物的量。对d₅-色氨酸和d₅-monatin监测的亲本到子代的质量转变分别是210.0到150.0，298.1到172.0和298.1到162.00。

monatin的手性LC/MS/MS(MRM)测量

在生化反应中monatin的立体异构体分布的测定通过用1-氟-2-4-二硝基苯基-5-L-丙氨酸酰胺(FDAA)和随后的反相LC/MS/MS MRM测量来进行。

用FDAA衍生化Monatin

向50μL的样品或标准物以及10μL内标准物中添加100μL的FDAA在丙酮中的1％溶液。添加20μL的1.0M碳酸氢钠，混合物在40℃偶尔混合地孵育1小时。除去样品并冷却，用20μL的2.0M HCl中和(可能需要更多的HCl来实现缓冲的生物学混合物的中和)。在除气完成之后，样品准备用于LC/MS/MS分析。

用于monatin的立体异构体分布的测定的LC/MS/MS多反应监测

利用之前章节中描述的LC/MS/MS设备进行分析。能够分离monatin(具体是FDAA-monatin)的所有四种立体异构体的LC分离在40℃在Phenomenex Luna

2.0×250mm(3μm)C18反相层析柱上进行。LC流动相由A)含有0.05％(质量/体积)乙酸铵的水和B)乙腈组成。洗脱是在13％B下0-2分钟无梯度，从13％B到30％B、2-15分钟线性，从30％B到80％B、15-16分钟线性，80％B 16-21分钟无梯度，和80％B到13％B、21-22分钟线性，运行之间是8分钟的再平衡时间。流动速度是0.23mL/分钟，PDA吸光度从200nm到400nm监测。根据FDAA-monatin的去质子化的分子离子([M-H]-)的产生和特征性片段离子的产生来优化和选择ESI-MS的所有参数。

以下仪器参数用于负离子ESI/MS模式中monatin的LC/MS分析：Capillary：3.0kV；Cone：40V；Hex 1：15V；Aperture：0.1V；Hex 2：0.1V；源温度：120℃；去溶剂化温度：350℃；去溶剂化气体：662L/h；Cone气体：42L/h；低质量分辨率(Q1)：14.0；高质量分辨率(Q1)：15.0；离子能量：0.5；Entrance：0V；碰撞能量：20；Exit：0V；低质量分辨率(Q2)：15；高质量分辨率(Q2)：14；离子能量(Q2)：2.0；倍增器：650。三种FDAA-monatin特异性亲本到子代转变被用于特异性检测体外和体内反应中的FDAA-monatin。对monatin监测的转变是542.97到267.94、542.97到499.07和542.97到525.04。监测的monatin内标准衍生物质量转变是548.2到530.2。FDAA-monatin立体异构体的鉴定基于与纯化的monatin立体异构体和质谱数据相比较的色谱滞留时间。内标准物用于监测反应的进展和用于S，S立体异构体的滞留时间的确认。

氨基酸包括色氨酸、monatin、丙氨酸和HMG的液相层析-柱后荧光检测

用于色氨酸、monatin和丙氨酸的方法

用于生化反应中氨基酸鉴定的具有柱后荧光检测的液相层析在与Waters 474扫描荧光检测器和Waters柱后反应模块(LC/OPA方法)组合的Waters 2690 LC系统或等效物上进行。LC分离在相互作用-钠加载的离子交换柱上在60℃进行。流动相A是Pickering Na 328缓冲液(Pickering Laboratories，Inc.；Mountain View，CA)。流动相B是Pickering Na 740缓冲液。梯度洗脱是从0％B到100％B、0-20分钟，100％B、20-30分钟无梯度，和从100％B到0％B、30-31分钟线性，运行之间20分钟的再平衡时间。流动相的流动速度是0.5mL/分钟。OPA柱后衍生化溶液的流动速度是0.5mL/分钟。荧光检测器设置是EX 338nm和Em 425nm。用正亮氨酸作为分析的内标准物。氨基酸的鉴定基于纯化的标准物的色谱滞留时间数据。

用于HMG的方法

来自生化反应的样品通过含有C18作为填充材料和0.6％乙酸作为洗脱液的固相提取(SPE)柱来净化。来自SPE的收集的级分然后调整到已知的体积，利用具有荧光检测器的HPLC柱后邻苯二醛(OPA)衍生化来分析。利用Waters 2695液相层析系统和两个Phenomenex AquaC18柱串联，2.1mm×250mm柱与5μm颗粒；2.1mm×150mm柱与3μm颗粒使层析分离成为可能。柱的温度是40℃，柱无梯度流动速度是0.18mL/分钟。流动相是0.6％乙酸。OPA柱后衍生化和检测系统由Waters Reagent Manager(RMA)、反应盘绕室(reaction coil chamber)、反应盘绕室的温度控制模块和Waters 2847荧光检测器组成。OPA流动速度设置在0.16mL/分钟，反应盘绕室设置在80℃。荧光检测器设置在348nm的激发波长，450nm的发射波长。控制检测器灵敏度的其他参数例如信号增益和衰竭设置到实验的需求。HMG的定量基于谷氨酸的摩尔应答。

通过LC/MS的MP的检测

液相层析分离利用Waters 2690液相层析系统和2.1mm×50mmAgilent Eclipse XDB-C181.8μm反相层析柱、流动速度0.25mL/分钟和如下的梯度条件来进行：

时间(分钟)	A％	B％
			0.00	95	5
0.2	95	5
			1.2	5	95
4.5	5	95
			5.0	95	5

10

95

5

流动相A是0.3％(v/v)甲酸和10mM甲酸铵，流动相B是50∶50甲醇/乙腈中的0.3％甲酸w/10mM甲酸铵。柱温度是40℃。

以负电喷电离方式(-ESI)运行的Micromass ZQ四极质谱仪的参数设置如下：Capillary：2.2kV；Cone：35V；Extractor：4V；RF透镜：1V；源温度：120℃；去溶剂化温度：380℃；去溶剂化气体：600L/h；Cone气体：Off；低质量分辨率：15.0；高质量分辨率：15.0；离子能量：0.2；倍增器：650。设置单离子监测MS实验来容许选择性地检测m/z 290.3、210.3、184.3和208.4。m/z 208.4是内标准物d₅-色氨酸的去质子化分子[M-H]^-离子。

通过LC/MS/MS的MP的检测

LC分离利用Waters HPLC液相层析系统和2.1mm×50mm Agilent Eclipse XDB-C18 1.8μm反相层析柱、流动速度0.25mL/分钟和如下的梯度条件来进行：

时间(分钟)	A％	B％
			0.00	95	5
0.7	95	5
			3.0	5	95
4.0	5	95
			4.3	95	5
6.0	95	5

流动相A是0.3％(v/v)甲酸和10mM甲酸铵，流动相B是50∶50甲醇/乙腈中的0.3％甲酸和10mM甲酸铵。所述柱温度是40℃。

以负电喷电离方式(-ESI)运行的用于LC/MS/MS多反应监测(MRM)实验的Waters Premier XE三重四极质谱仪的参数如下设置：Capillary：3.0kV；Cone：25V；Extractor：3V；RF透镜：0V；源温度：120℃；去溶剂化温度：350℃；去溶剂化气体：650L/hr；Cone气体：47L/hr；低质量分辨率(Q1)：13.5；高质量分辨率(Q1)：13.5；离子能量(Q1)：0.5V；Entrance：1V；碰撞能量：18V；Exit 1：19；低质量分辨率(Q2)：15；高质量分辨率(Q2)：15；离子能量(Q2)：2.0；倍增器：650。监测四种亲本到子MRM转变来选择性地检测monatin前体(MP)和d₅-monatin前体(d₅-MP)；d₅-MP用作内标准物(I.S.)。四种MRM转变是290.1到184.1、290.1到210.1、290.1到228.1和295.1到189.1。这些转变的两种，MP的290.1到184.1和d₅-MP的295.1到189.1，被用于产生校准曲线和用于定量目的。290.1到210.1以及290.1到228.1的转变用作MP的定性次级确认。

用于标准物和用于分析的monatin和MP的产生

monatin的产生

R，R和S，S monatin的外消旋混合物如美国专利No.5,128,482所述合成产生。R，R和S，S monatin通过衍生化和水解步骤分离。简要地，monatin外消旋混合物被酯化，游离氨基用卡马西平(carbamazepine)(CBZ)封闭，形成内酯，S，S内酯利用固定的蛋白酶选择性水解。monatin也可以如Bassoli et al.，Eur.J，Org.Chem.，8：1652-1658(2005)所述分离。

MP产生

R-MP可以通过R，R monatin在0.1M磷酸钾缓冲液中用丙酮酸钠作为氨基接受体使用AT-103宽范围D-氨基转移酶(BioCatalytics，Pasadena，CA)的转氨基来产生。S-MP通过S，S monatin在0.1M磷酸钾缓冲液中利用丙酮酸钠作为氨基接受体使用AT-102 L-氨基转移酶(BioCatalytics)的转氨基来产生。两种反应都在30℃、大约8.0-8.3的pH值下进行大约20小时。两种化合物使用制备级别的HPLC用Rohm和Haas(Philadelphia，PA)疏水性树脂(XAD^TM1600)来纯化，在水中洗脱。收集含有大于90％纯度的monatin前体的样品并冻干。

实施例4——蛋白质制备方法

这个实施例描述了用于克隆、表达、细胞提取物制备、蛋白质纯化和蛋白质定量的方法学，用于选定的DAT的二级表征。

本领域技术人员将认识到在亚克隆的(例如片段)或另外修饰的(例如标签化的)核酸编码的多肽中活性的存在被认为是由全长或野生型核酸编码的相应多肽中活性存在的预示。

用于克隆到Topo质粒的DAT编码基因的扩增

用于Topo克隆(利用来自Stratagene的Pfu Turbo或Cloned Pfu)的PCR反应如下：1×建议的聚合酶缓冲液，0.2mM dNTP，0.5μM每种引物，和每50μl反应1μl聚合酶(2.5单位)。反应含有每个反应大约5-100ng模板DNA。2分钟的94℃热起始被用于PCR，94℃解链温度。退火温度取决于引物的Tm，30或60秒。延伸时间(在72℃)是每kb至少2分钟。反应产物通常在1×TAE 1％琼脂糖凝胶上分离，合适大小的条带用厂家建议的QIAquick Gel提取试剂盒纯化，只是使用10到50μl的洗脱体积。根据厂家建议，1到4μl纯化的PCR产物的体积用于与pCRII-Topo Blunt质粒(Invitrogen，Carlsbad，CA)连接。

DAT在pET30a中的克隆用于非标签化的表达

具有SEQ ID NO：945、947、949、891、893、869、873、877、881、883和895所示序列的DAT(编码具有SEQ ID NO：946、948、950、892、894、870、874、878、882、884和896序列的多肽)使用Pfu Turbo(Stratagene，La Jolla，CA)和引物从质粒或PCR产物扩增，在5′末端添加Nde I以及在3′末端添加Not I或BamH I限制位点。根据厂家建议，PCR片段克隆到pCR-Blunt II-Topo(Invitrogen，Carlsbad，CA)中。序列通过测序(Agencourt，Beverly，MA)来验证，具有正确序列的插入序列然后利用合适的限制性内切酶从载体上释放，连接到pET30a的Nde I和Not I(或BamH I)限制位点。具体的引物参见表2。

具有SEQ ID NO：155序列(编码具有SEQ ID NO：156的多肽)的DAT核酸用Pfu Turbo(Stratagene)和引物扩增，在5′和3′末端分别添加Nde I和Hind III限制性位点。PCR片段用Nde I和Hind III限制性内切酶消化并连接到pET30a的Nde I和Hind III限制性位点中。具体的引物参见表2。要注意具有SEQ ID NO：156序列的多肽有0.991的概率(由SignalP测定，如在Nielsen，1997，Protein Engineering，10：1-6中讨论的)似乎含有以下前导序列：KNSPIIAAYRAATPGSAAA(SEQ ID NO：1084)。编码这种DAT多肽的核酸与明显的前导序列一起克隆。

表2.用于扩增的引物

定点诱变

根据厂家说明利用QuikChange多定点诱变试剂盒(Stratagene，La Jolla，CA)进行定点诱变。为了产生SEQ ID NO：870 T242N突变体，实施例10中描述的pET30a非标签化的构建体用作模板。为了产生SEQ ID NO：220 G240N和SEQ ID NO：220 T241N突变体，实施例10中描述的具有C-末端his标签的pET30a构建体用作模板。使用的诱变引物在下表3中列出。所有期望的突变通过DNA测序来确认。

表3.引物序列

pET30a中DAT PCR产物的克隆，用于非标签化的蛋白质的表达

具有SEQ ID NO：177、179、153、165、181、217、187、189、207、219、215、195、199、197、209、201、221、235、203、237、239、223、225、227、229，231，245，213、155、169、171、167、173和175所示序列的DAT核酸(编码具有SEQ ID NO：178、180、154、166、182、218、188、190、208、220、216、196、200、198、210、202、222、236、204、238、240、224、226、228、230、232、246、214、156、170、172、168、174和176所示序列的DAT多肽)作为具有Nde I和Not I相容末端的PCR产物、以及外来核酸被接受以改善切割效力。

DAT PCR产物含有5′末端的NdeI限制性内切酶位点和3′末端的NotI位点。PCR片段首先克隆到pCR4 TOPO或pCR-Blunt II-TOPO载体(Invitrogen)中。在DNA序列通过测序验证之后，DAT基因通过NdeI和NotI的消化从TOPO质粒上释放，连接到用相同限制性内切酶切割的pET30a载体中。内部含有NdeI或NotI位点的DAT基因利用具有相容限制性内切酶位点的引物扩增，并克隆到pET30a中。例如，具有SEQ ID NO：155的DNA核酸(编码具有SEQ ID NO：156序列的多肽)利用NdeI和HindIII限制性位点从原始PCR产物重新扩增，用于克隆到pET30a中。

DAT在pET30a中的克隆，用于作为C-His标签化的融合蛋白的表达

编码DAT 4978和DAT 4978 T243N(实施例6所述)、SEQ ID NO：870(从质粒pSE420-cHis表达的)和SEQ ID NO：870 T242N、SEQ ID NO：176和SEQ ID NO：220(从pET30表达的非标签化版本)的核酸用Pfu Turbo(Stratagene)和引物重新扩增，所述引物将XhoI位点置于终止密码子的立即上游。根据厂家建议PCR片段克隆到pCR-Blunt II-Topo(Invitrogen，Carlsbad，CA)中或直接克隆到pET30a的Nde I和Xho I限制性位点中。序列通过测序(Agencourt，Beverly，MA)来验证，具有正确序列的插入序列然后利用Nde I和Xho I限制性内切酶从载体上释放，插入序列连接到pET30a的Nde I和XhoI限制性位点中。特定引物和质粒名称参见表4。

表4.引物序列

CbDAT和CaDAT的克隆

拜氏梭状芽孢杆菌(Clostridium beijerinckii)D-氨基-转移酶利用PfuTurbo(Stratagene)、拜氏梭状芽孢杆菌基因组DNA和含有5′NdeI和3′NotI限制性位点的PCR引物PCR扩增。基因组DNA利用Purrgene基因组DNA纯化试剂盒(Gentra Systems，Minneapolis，MN)根据厂家说明从拜氏梭状芽孢杆菌(ATCC 51743)提取。

824 bp PCR产物利用Qiagen Gel提取试剂盒凝胶提取，TOPO克隆到pCR-Blunt II-Topo(Invitrogen)中。在验证序列后，利用Rapid Ligation试剂盒(Roche)将基因连接到Nde I/Not I切割的pET28b和pET30a载体中。

丙酮丁醇梭菌(C.acetobutylicum)DAT利用基因组DNA(ATCC 824)和Stratagene Optiprime PCR试剂盒使用含有5′NdeI和3′NotI限制性位点的PCR引物通过PCR扩增。成功的PCR反应物克隆到pCR4 TOPO载体中，对TOPO克隆测序。阳性TOPO克隆用限制性内切酶NdeI和NotI消化，DAT片段连接到用相同的限制性内切酶消化的pET30a载体中。

表5.引物序列

LsDAT的体外合成

唾液乳杆菌(Lactobacillus salivarius)DAT根据Stemmer et al.，1995，Gene，164：49-53的修正方法来组装。简要地，43种寡核苷酸(主要是40聚体)购自IDT，根据基因序列和它的互补DNA序列，在有义和反义链之间20个碱基对重叠。引物列表参见表6。引物在水中稀释到250μM，5μL每种引物在微量离心机试管中混合在一起。如下进行PCR：每100μL反应，添加1.5μL引物库，4μL dNTP，1×XL PCR缓冲液，1mM乙酸镁，2μL rTth 聚合酶(Roche，Indianapolis，IN)和0.25μL Pfu聚合酶(Stratagene，La Jolla，CA)。3分钟的热起始在94℃进行，最后是94℃ 30秒、42℃ 30秒、68℃ 15秒的15个循环。用30秒的延伸时间(在68℃)再进行10个循环。用75秒的延伸时间再进行10个循环。最后，链延伸步骤在68℃进行七分钟。

表6.用于合成LsDAT的寡聚物

使用引物L.sal DAT R Not I和L.sal DAT F Nde I(以下)的二级扩增产生了正确分子量的条带。这些二级扩增引物序列参见表7。

表7.引物序列

二级PCR反应如上相同地设置，只是仅添加2种引物。对于PCR模板，使用2.5μl的初级PCR反应物。3分钟的热起始在94℃进行，之后是94℃ 30秒、42℃ 30秒和68℃ 15秒的10个循环。用48℃的提高的退火温度30秒，和30秒的延长时间(在68℃)再进行10个循环。最后，链延伸步骤在68℃进行七分钟。

片段克隆到pCR-BluntII-TOPO载体中，对TOPO克隆测序。阳性TOPO克隆用NdeI和NotI切割，DAT片段连接到用相同的限制性内切酶消化的pET30a载体中。

酶制备

大肠杆菌菌株BL21(DE3)用作DAT从pET衍生质粒表达的宿主菌株。大肠杆菌菌株TOP10用于所有其他DAT构建体。所需构建体的单个菌落一般接种到含有适量抗生素的Overnight Express II培养基(Novagen)中。在30℃培养过夜之后，当OD₆₀₀大于10时通过离心收获细胞。做为选择，利用过夜培养物来接种含有合适抗生素的LB培养基中的培养物。培养物在30℃生长到OD₆₀₀ 0.5到0.9，用1mM IPTG在相同温度下诱导蛋白质表达4小时。

细胞提取物通过每g细胞沉淀或每50mL过夜培养物添加5mL的BugBuster

(无伯胺)提取试剂(EMD Biosciences/Novagen目录#70923)和5μl/mL蛋白酶抑制物混合物II(EMD Bioscience/Calbiochem目录#539132)、1μl/mL的Benzonase

核酸酶(EMD Biosciences/Novagen目录#70746)和0.033μL/mL r-LysozymeTM溶液(EMD Biosciences/Novagen目录#71110)来制备。细胞重悬物在室温下柔和摇动孵育15分钟。在16,100rcf在4℃离心20分钟之后，取出上清作为无细胞提取物。

在为monatin反应使用酶制剂之前，通过预先用磷酸钾缓冲液(100mM，pH 7.8)或含有0.05mM PLP的EPPS缓冲液(100mM，pH 8.2)平衡的PD-10柱(GE Healthcare，Piscataway，NJ)从无细胞提取物中除去洗涤剂和低分子量化合物。蛋白质使用平衡缓冲液洗脱。蛋白质浓度一般利用BioRadCoomassie平板分析(也称为Bradford分析)平板分析用BSA(Pierce)作为标准物来测定。偶尔地，在注释的地方，BCA(Pierce)微量滴定板分析用于蛋白质测定。为了估计无细胞提取物中D-氨基转移酶的浓度，1mg/mL样品加载到Experion(Bio-Rad，Hercules，Ca)电泳系统上，Experion软件(版本2.0.132.0)用于计算无细胞提取物中可溶DAT蛋白的百分比。做为选择，进行SDS-PAGE分析，使用目测来估计表达的百分比。

His标签的融合蛋白利用GE Healthcare Chelating Sepharose Fast Flow树脂或Novagen His-Bind柱纯化。利用Sepharose树脂的纯化涉及将无细胞提取物加载到预先用含有200mM氯化钠和0.050mM PLP的磷酸钾缓冲液(100mM，pH 7.8)平衡的柱上。然后柱使用3-5倍柱体积的平衡缓冲液、含有25mM咪唑的3-5倍柱体积的平衡缓冲液和含有50-100mM咪唑的3-5倍柱体积的平衡缓冲液连续洗涤。His标签的蛋白质利用含有500mM咪唑的3-5倍柱体积的平衡缓冲液洗脱下来。洗脱物利用Amicon(Billerica，MA)Centricon-70浓缩。浓缩的蛋白质溶液中的咪唑和氯化钠盐经通过预先用磷酸钾缓冲液(100mM，pH 7.8)(用于DAT4978和DAT4978 T243N)或含有50μM PLP的EPPS缓冲液(100mM，pH 8.2)(用于SEQ ID NO：870和SEQ ID NO：870 T242N)平衡的PD-10脱盐柱来除去。使用Bio-Rad蛋白质分析(Bio-Rad)和白蛋白(Pierce)作为标准物来测定蛋白质浓度。纯化的酶的等份(0.5-1mL)保存在-80℃待用。根据厂家说明使用His-Bind柱纯化His标签的蛋白质。来自柱的洗脱物如上所述利用PD10柱脱盐。

实施例5——D-氨基转移酶活性的分析方法#2

Monatin产生分析(标准)

组合以下成分：100mM EPPS，pH 8.2；200mM丙酮酸钠；100mM的D-色氨酸；50μM PLP；1mM MgCl₂；0.01％ Tween-80；50μg/mL实施例6所述的醛缩酶(使用无细胞提取物；根据Experion芯片读取的百分比估计醛缩酶浓度)和适量的DAT(一般地0.1-1mg/mL)。

除了PLP原液和蛋白质溶液外，所有其他试剂使用不含氧的去离子水制备，保存在厌氧室中。反应在室温下在厌氧室中恒定柔和混合开始。在某一时点，甲酸添加到反应混合物的等份中至2％(v/v)的终浓度。使用工作台微离心机在16,100RCF离心5分钟之后上清通过0.2μm尼龙膜滤器过滤。然后在通过LC/MS/MS分析之前用水将样品稀释20到100倍。

D-色氨酸转氨基分析

为了比较某些D-氨基转移酶的D-色氨酸转氨基活性，进行了以下分析。分析混合物含有：含有D-AT的0.5mg/mL细胞提取物蛋白质；40mM磷酸钾pH 8.0；20mM的D-色氨酸；100mM丙酮酸钠；和50μM PLP。分析在37℃孵育30分钟，然后置于冰上。

反应程度通过使用以下分析测量形成的吲哚-3-丙酮酸的量来跟踪：向5μl、10μl和20μl的反应混合物中，添加200μl以下溶液：0.5mM砷酸钠；0.5mM EDTA；和50mM四硼酸钠(pH 8.5)。吲哚-3-丙酮酸烯醇硼酸酯(indole-3-pyruvate enol-borate)复合物在325nm处的吸光度与相同溶液中制备的吲哚-3-丙酮酸的标准曲线比较。

丙氨酸形成也可以用于跟踪D-色氨酸转氨基反应的程度。如实施例3所述测定丙氨酸浓度。

R，R monatin转氨基分析

分析条件(终体积2mL)包括：0.01％ Tween；100mM EPPS pH 8.2；100mM丙酮酸钠；大约3mM的R，R monatin；0.5mg/mL DAT；和50μM PLP。反应程度通过用实施例3所述方案检测形成的丙氨酸或R-MP监测。

实施例6——获得DAT和醛缩酶的方法

这种方法描述了在用D-氨基转移酶的monatin形成反应中使用的醛缩酶与用于比较目的的预先分离的D-氨基转移酶的克隆。

醛缩酶

如WO2007/103389所述(在该申请中是指由SEQ ID NO：275的核酸编码的SEQ ID NO：276的醛缩酶)，在从D-色氨酸的monatin生产分析中使用的醛缩酶被分离并亚克隆到pET载体中。

DAT和DAT4978 T243N

来自ATCC #4978(DAT 4978)的D-氨基转移酶如美国公开No.2006/0252135所述克隆。利用pET30(未加标签的)DAT 4978构建体制备T243N突变体。

根据Stratagene Multi-Change试剂盒(La Jolla，CA)中列出的建议设计用于诱变的引物。引物被5′-磷酸化。根据厂家说明利用Stratagene Multi-Change试剂盒进行诱变。诱变寡核苷酸序列示于表8中。

表8.诱变寡核苷酸序列

转化大肠杆菌XL10-Gold细胞(Stratagene)，产生的纯化的质粒制品进行测序来证实掺入了正确突变。含有DAT 4978 T243N的质粒然后转化到大肠杆菌BL21(DE3)表达宿主中。

球形芽孢杆菌DAT

来自球形芽孢杆菌(ATCC编号10208)的D-氨基转移酶如US 2006/0252135所述克隆。如同一参考文献所述制备蛋白质。

实施例7——DAT的分析

具有SEQ ID NO：928、930、932、934、936、938、940、942、944、946、948和950所示序列的DAT多肽通过在实施例2中描述的载体中和相容的大肠杆菌表达宿主中表达相应的核酸来产生。本领域技术人员可以利用例如实施例4中描述的组装PCR技术来合成编码这些D-氨基转移酶的基因。含有羧苄青霉素(100μg/mL)的LB培养基中的过夜培养物在100mL相同培养基中稀释100×，在500mL挡板烧瓶中培养。培养物在30℃生长到OD₆₀₀ 0.5到0.9，在相同温度下用1mM IPTG诱导蛋白表达4小时。总蛋白的样品在即将收获之前采集。细胞通过离心来收获，用10mL磷酸钾缓冲液pH 7.8洗涤一次。细胞立即冷冻在-80℃直到制备细胞提取物。

如实施例4所述利用100mM磷酸钾作为缓冲液来洗脱和平衡PD10柱，制备细胞提取物并脱盐。如所述测定总蛋白和DAT浓度。

用丙酮酸作为氨基接受体的R，R monatin转氨基如实施例5所述进行，只是使用10mM R，R monatin。丙氨酸、monatin和monatin前体水平的初步分析相互不一致，结果被认为是定性的。具有SEQ ID NO：948序列的DAT多肽看起来显示了monatin前体形成。

为了进一步确认活性，如所述方法所述用大约0.2mg/mL的DAT浓度进行monatin形成分析。作为对照，评估了纯化的球形芽孢杆菌DAT的0.2mg/mL浓度。在2和21小时之后，采集等份，添加甲酸到2％终浓度，样品冷冻。样品然后解冻、旋转并过滤。利用LC/MS/MS方法分析样品的monatin，利用实施例3所述的LC/OPA柱后荧光方法分析样品的色氨酸和丙氨酸。具有SEQ ID NO：946和950序列的DAT多肽能够在测试条件下形成R，R monatin。具有SEQ ID NO：948序列的DAT多肽显示了色氨酸损失和丙氨酸形成提高，展现了它作为D-色氨酸转氨酶的活性。通过总蛋白量测定的具有SEQ ID NO：946序列的DAT多肽表达良好，但不是非常易溶的，这解释了某些不一致的结果。具有SEQ ID NO：930、932、940、942和944所示序列的DAT多肽在SDS-PAGE分析上不产生可见条带，因而如果在不同的条件下生产可能是有活性的。结果参见表9。

表9.DAT的活性

942	nd	nd
			944	nd	nd
946	0.1	0.6
			948	nd	nd
950	0.4	3.1
			球形芽孢杆菌对照DAT	0.8	4.4

nd＝在测试的条件下未测出

pET30a中DAT多肽的分析

具有SEQ ID NO：946、948和950序列的DAT多肽如实施例4描所述亚克隆到pET30a中。含有pET30a中DAT的大肠杆菌菌株BL21 DE3的双份培养物在25和30℃下在Overnight Express II(溶液1-6，Novagen)中过夜生长。作为对照，也生长含有无插入序列的pET30a质粒的菌株。细胞在OD₆₀₀为5-10时收集。细胞通过离心收获，用10mL的100mM磷酸钾缓冲液pH 7.8洗涤一次。细胞冷冻在-80℃直到进一步加工。

如实施例4所述利用100mM磷酸钾作为缓冲液来洗脱和平衡PD10柱制备细胞提取物。如所述测定总蛋白和DAT蛋白浓度。具有SEQ ID NO：946序列的DAT多肽在30℃在总蛋白级分中表达良好，但是根据SDS-PAGE观察不是可溶的。具有SEQ ID NO：948和950序列的DAT多肽也在更高温度下表达，但是可溶的。

如实施例5所述进行monatin形成分析，除了0.1mg/mL的DAT浓度用于SEQ ID NO：946的多肽(0.5mg/mL用于所有其他的)。作为阳性对照，还分析了0.5mg/mL浓度的纯化的球形芽孢杆菌DAT。在2和21小时之后，采集等份，添加甲酸到2％的终浓度，样品冷冻直到进一步处理。样品然后解冻、旋转并过滤。利用LC/MS/MS检测分析样品的monatin，利用实施例3所述LC/OPA柱后荧光检测方法分析色氨酸和丙氨酸。结果在表10中示出。所有测试的D-氨基转移酶显示了D-色氨酸消耗和丙氨酸形成，表明它们全都具有对D-色氨酸的活性。在这些条件下，仅具有SEQ ID NO：946和948序列的DAT多肽看起来具有monatin形成的活性。可能是两种宿主系统之间表达或稳定性差异是为什么活性在某些情况下可见、在其他情况下不可见的原因。

表10

948	nd	0.2
			950	nd	nd
球形芽孢杆菌阳性对照	1.8	8.6

nd，在测试的条件下未测出

实施例8——pSE420-cHis中DAT的分析

具有SEQ ID NOs：886、888、890、892和894所示序列的DAT多肽在大肠杆菌HMS174中从pSE420-cHis载体产生。本领域技术人员可以利用例如实施例4所述的组装PCR技术合成编码这些D-氨基转移酶的基因。各种DAT构建体的过夜培养物在含有氨苄青霉素(100μg/mL)的LB培养基中在30℃生长。50mL相同培养基第二天用1mL的过夜培养物接种。培养物在30℃生长直到OD_600nm达到大约0.5，然后用1mM IPTG诱导。培养物在30℃进一步孵育4小时，然后通过在3800rcf离心15分钟收获。细胞用1.5mL 50mM磷酸钾pH7.0洗涤，再次离心。倒出上清，称重细胞沉淀。

如所述方法所述利用100mM磷酸钾作为缓冲液洗脱和平衡PD10柱制备细胞提取物。如所述测定总蛋白和DAT浓度，只是使用BCA(Pierce)代替Bradford用于总蛋白测定。仅两种不同载体培养物在相同大肠杆菌宿主中生长作为克隆的DAT。所有蛋白质在SDS-PAGE凝胶上产生可见条带，但是溶解程度不同。具有SEQ ID NO：892序列的多肽不是极易溶的。

为了比较每种酶的D-色氨酸转氨基活性，进行实施例5所述的D-色氨酸转氨基分析和R，R monatin转氨基分析。利用含有D-氨基转移酶的终浓度0.5mg/mL的细胞提取物和0.1mg/mL纯化的球形芽孢杆菌DAT作为对照靶向D-色氨酸氨基转移酶。细胞提取物中DAT的定量由于低水平的可溶多肽而是困难的。具有SEQ ID NO：888、892和894所示序列的DAT多肽显示了在30分钟反应期间用D-色氨酸作为底物的良好活性。具有SEQ ID NO：886和890所示序列的DAT多肽具有高于无酶对照的可测量活性，但是在测试的条件下展现了几乎无活性。

monatin转氨基实验在室温下进行，在0.5、1和2小时靶向每种DAT 0.5mg/mL采集样品，包括来自球形芽孢杆菌的纯化的阳性对照。然后分析R，Rmonatin转氨基样品的monatin和丙氨酸。剩余的monatin量通过LC/MS/MS定量；丙氨酸形成利用实施例3的柱后衍生方法测量。在测试的条件下，具有SEQ ID NO：892和894所示序列的DAT多肽是有活性的。具有SEQ ID NO：894序列的DAT多肽看起来具有转化R，R monatin到R-MP的最高活性。当分析丙氨酸形成时，趋势是一致的。各个时点的丙氨酸生产数量(按mM)在表11中示出。

表11.来自R，R monatin转氨基反应的丙氨酸形成(mM)

DAT多肽(SEQ ID NO)	0.5hr	1hr	2hr
				载体对照1	0.139	0.185	0.215
载体对照2	0.179	0.242	0.301
				886	0.128	0.203	0.242
888	0.13	0.203	0.275
				890	0.112	0.153	0.176
892	1.034	1.587	2.167
				894	2.2	2.52	2.663
BsphDAT(纯化的)	0.287	0.519	0.894
				无酶	0.043	0.035	0.037

具有SEQ ID NO：891和893所示序列的DAT核酸如实施例4所述亚克隆到pET30中。这些构建体被转化到带有DE3溶源体的多种大肠杆菌宿主中用于从T7启动子表达，包括大肠杆菌的K-12和B菌株，和一种带有pLysS质粒的菌株。克隆如实施例4所述在OvernightExpress System II中表达，有和没有0.5mM吡哆醇的添加，通过SDS-PAGE或Experion分析表达。根据这些实验，明显的是蛋白质主要在不溶级分中表达。用于诱导的温度从37℃降低到30℃一样，吡哆醇很小程度地帮助改善溶解度。在设计以最大化可溶表达的克隆系统中进行进一步的工作(参见实施例16-22)。

实施例9——pET30a中CaDAT、CbDAT和LsDAT的分析

SEQ ID NO：894所示的氨基酸序列用于搜索公众数据库中可获得的相似蛋白质。发现三种DAT与SEQ ID NO：894具有相似性。它们来自唾液乳杆菌(蛋白质水平上47％相同)、拜氏梭状芽孢杆菌(蛋白质水平上57％相同)和丙酮丁醇梭菌(蛋白质水平上60％相同)。基因和蛋白质序列和它们的登记号在这个实施例的结束处显示。附图1是显示这些SEQ ID NO：894样蛋白质共有区域的比对。人们可以看出高程度的共有区域表明了结构相似性。

这些核酸克隆到pET30a中，如此处所述表达相应多肽和测试活性。

CbDAT

来自拜氏梭状芽孢杆菌的D-氨基转移酶(CbDAT)克隆到pET30a(未加标签的)BL21(DE3)中，利用Overnight Express II(Novagen)表达。在大约9的600nm光密度下收集细胞，在4000rcf离心15分钟。细胞用100mM磷酸钾pH 7.8(冷的)洗涤一次，再次旋转。

如在此所述利用100mM EPPS pH 8.2作为缓冲液洗脱和平衡柱制备细胞提取物。如所述测定总蛋白和DAT蛋白浓度，只是使用BCA方法(Pierce)代替Bradford(Coomassie)分析。CbDAT表达良好，但仅是部分可溶的。

monatin形成分析如实施例5所述进行，但是CbDAT(0.5mg/mL)的活性也在pH 7.4研究(磷酸钾作为缓冲液)。作为对照，纯化的球形芽孢杆菌DAT(1mg/mL)在pH 8.2分析。在1、2、4、8和23小时之后，采集等份，甲酸添加到2％的终浓度。样品冷冻在-80℃直到分析。样品然后解冻、旋转并过滤。样品利用实施例3所述的LC/MS/MS方法分析monatin。结果在表12中示出。在pH 8.2下进行的分析产生稍高的monatin量。用从pET28表达的具有N-末端His标签的多肽进行类似的实验。标签的版本的活性看起来稍微低于未加标签的，但仍是易于检测的。

表12.随时间的活性

CaDAT和LsDAT

来自唾液乳杆菌(LsDAT)和丙酮丁醇梭菌(CaDAT)的D-氨基转移酶克隆到pET30a(未加标签的)BL21(DE3)中，使用Overnight Express II(Novagen)表达。当培养物达到大约9的600nm光密度时通过在4000rcf离心15分钟收集细胞。

如在此所述利用100mM EPPS pH 8.2作为缓冲液洗脱和平衡柱制备细胞提取物。总蛋白和DAT蛋白浓度使用BCA(Pierce)方案测定。两种酶都表达良好且是可溶的。

分析在厌氧条件下在室温下进行。作为对照，分析纯化的球形芽孢杆菌D-氨基转移酶。使用大约0.5mg/mL的每种DAT。在0.5、1、2、4、6、8和22小时之后，采集等份，甲酸添加到2％的终浓度，冷冻样品。样品然后解冻、旋转并过滤。样品用实施例3所述的LC/MS/MS方法分析monatin。结果在表13中示出。

表13

具有SEQ ID NO：894所示序列的DAT的同源物是有活性的。由于上述显示了保守序列的同源物在monatin形成分析中都是有活性的，预期含有此处描述的共有序列的任何D-氨基转移酶也将是有活性的，虽然它们的一级序列相同性低达47％。在这项工作之前没有证据表明与更多表征的芽孢杆菌D-氨基转移酶具有低同源性的这些独特的D-氨基转移酶将具有monatin的活性或将是广泛特异性酶。

DNA序列CaDAT(ACCESSION AE001437 AE007513-AE007868；VERSION AE001437.1 GI：25168256；核苷酸914049..914891)

1 atgaaagatt taggatatta caatggagaa tacgacttaa ttgaaaatat gaaaatacca

61 atgaatgatc gtgtatgcta ttttggtgat ggtgtttatg atgctactta tagtagaaac

121 cataatatat ttgcactaga tgagcatatt gaccgatttt ataatagtgc cgagctttta

181 agaattaaaa ttccatatac aaagaaggaa atgaaagagc ttttaaagga tatggttaaa

241 aaggttgata gcggagaaca atttgtatat tggcaggtta ctagaggtac tggcatgcgt

301 aatcatgctt ttttgagtga ggatgttaag gctaatattt ggattgtttt aaagccacta

361 aaggtaaaag atatgtcaaa aaaattaaaa ctaataacat tagaggatac tagattttta

421 cattgtaaca taaaaacctt aaatttgctt cctagtgtaa ttgcagcaca aaaaactgaa

481 gaagcaggct gccaggaagc agtatttcat agaggagata gagttactga atgtgctcat

541 agtaatgttt caattataaa ggatgagatt ttaaaaactg cgccaacaga taatcttatt

601 ttgccgggaa tagcaagggc gcatcttata aaaatgtgca aaaaatttga gatacctgta

661 gatgaaactc catttacatt aaaggagtta attaatgcgg atgaagttat agttacaagt

721 tcagggcaat tttgtatgac tgcttgtgag atagatggaa gacctgtagg cggaaaagcg

781 ccagatatta ttaaaaagct tcagactgcc ttacttaatg aatttttgga agaaacaaat

841 taa(SEQ ID NO：1063)

蛋白序列CaDAT(ACCESSION NP_347428；VERSION NP_347428.1GI：15894079)

1 MKDLGYYNGE YDLIENMKIP MNDRVCYFGD GVYDATYSRN HNIFALDEHI DRFYNSAELL

61 RIKIPYTKKE MKELLKDMVK KVDSGEQFVY WQVTRGTGMR NHAFLSEDVK ANIWIVLKPL

121 KVKDMSKKLK LITLEDTRFL HCNIKTLNLL PSVIAAQKTE EAGCQEAVFH RGDRVTECAH

181 SNVSIIKDEI LKTAPTDNLI LPGIARAHLI KMCKKFEIPV DETPFTLKEL INADEVIVTS

241 SGQFCMTACE IDGRPVGGKA PDIIKKLQTA LLNEFLEETN (SEQ ID NO：1064)

DNA序列CbDAT(ACCES SION CP000721 AALO01000000AALO01000001-AALO01000089 VERSION CP000721.1 GI：149901357；核苷酸3213484..3212636)

1 atggagaatt taggttatta taatggaaag tttggattat tagaggaaat gacagtacca

61 atgcttgatc gtgtttgcta ttttggagat ggagtttatg atgctactta tagcagaaat

121 cacaagattt ttgcattgga ggagcatatt gaaagatttt acaacagcgc tggtttatta

181 ggaattaaaa ttccttattc aaaggagcaa gtaaaagaaa tccttaagga gatggtatta

241 aaggttgatt caggagaaca atttgtatat tggcaaatta ctagaggaac tggaatgaga

301 aatcatgctt ttcctggaga tgaggtccct gcaaatctat ggattatgtt aaagccttta

361 aatattaagg atatgtcaca aaaattaaag ttaatcactt tagaagacac tagattttta

421 cactgtaata tcaaaacctt aaatttatta ccaagtgtaa ttgcatctca aaaaactgaa

481 gaggcaggat gtcaggaagc tgtatttcat agaggggata gagtaactga atgtgcacat

541 agcaatgtat caattattaa ggatggtata ttaaaaactg ctccaacaga caatttaatt

601 ttaccaggta tagcaagagc tcaccttatt aaaatgtgta aatcctttaa tattcctgta

661 gatgaaacag catttacctt gaaggaatta atggaggcag atgaagttat agttactagt

721 tcaggtcaat tttgtatggc aaccagtgaa atagatggaa tacctgtagg gggaaaagca

781 ccagagcttg taaagaaatt acaagatgca ttgttaaatg agttcttaga agaaacaaaa

841 acagaatag (SEQ ID NO：1065)

蛋白序列CbDAT(ACCESSION YP_001309869 VERSIONYP_001309869.1 GI：150017615)

1 MENLGYYNGK FGLLEEMTVP MLDRVCYFGD GVYDATYSRN HKIFALEEHI ERFYNSAGLL

61 GIKIPYSKEQ VKEILKEMVL KVDSGEQFVY WQITRGTGMR NHAFPGDEVP ANLWIMLKPL

121 NIKDMSQKLK LITLEDTRFL HCNIKTLNLL PSVIASQKTE EAGCQEAVFH RGDRVTECAH

181 SNVSIIKDGI LKTAPTDNLI LPGIARAHLI KMCKSFNIPV DETAFTLKEL MEADEVIVTS

241 SGQFCMATSE IDGIPVGGKA PELVKKLQDA LLNEFLEETK TE(SEQ ID NO：1066)

DNA序列LsDAT(ACCESSION CP000233 VERSION CP000233.1 GI：90820184；核苷酸1750082..1750927)

1 atgaagcaag ttggatacta caatggtact atcgctgatt taaatgaact taaggtgcct

61 gctactgatc gtgcacttta ttttggtgat ggttgctacg atgcaactac atttaagaac

121 aatgttgcat ttgccttaga agatcatctt gatcgttttt ataatagttg tcgcctacta

181 gagatcgatt tccctttaaa tcgcgatgaa cttaaagaaa agctttacgc tgttattgat

241 gctaacgaag ttgatactgg tatcctttat tggcaaactt cacgtggttc tggtttacgt

301 aaccatattt tcccagaaga tagccaacct aatttattaa tttttactgc tccttatggt

361 ttagttccat ttgatactga atataaactt atatctcgcg aagacactcg cttcttacat

421 tgcaatatta aaactttgaa tttacttcca aacgttattg caagtcaaaa ggctaatgaa

481 agtcattgcc aagaagtggt cttccatcgc ggtgacagag ttacagaatg tgcacactct

541 aacatcttaa ttctaaaaga tggcgttctt tgctccccac ctagagataa tttaatcttg

601 ccaggaatta ctttgaaaca tctcttgcaa ttagcaaaag aaaataatat tcctacttcc

661 gaagcaccat tcactatgga tgatcttaga aatgctgatg aagttattgt tagttcttca

721 gcttgtctag gtattcgcgc agtcgagctt gatggtcagc ctgttggtgg aaaagatgga

781 aagactttaa agatcttgca agatgcttat gctaagaaat ataatgctga aactgtaagt

841 cgttaa (SEQ ID NO：1067)

蛋白序列LsDAT(ACCESSION YP_536555 VERSION YP_536555.1 GI：90962639)

1 MKQVGYYNGT IADLNELKVP ATDRALYFGD GCYDATTFKN NVAFALEDHL DRFYNSCRLL

61 EIDFPLNRDE LKEKLYAVID ANEVDTGILY WQTSRGSGLR NHIFPEDSQP NLLIFTAPYG

121 LVPFDTEYKL ISREDTRFLH CNIKTLNLLP NVIASQKANE SHCQEVVFHR GDRVTECAHS

181 NILILKDGVL CSPPRDNLIL PGITLKHLLQ LAKENNIPTS EAPFTMDDLR NADEVIVSSS

241 ACLGIRAVEL DGQPVGGKDG KTLKILQDAY AKKYNAETVS R (SEQ ID NO：1068)

实施例10——DAT的分析

获得在载体pSE420-cHis中含有具有SEQ ID NO：865、867、869、871、873、875和877序列的DAT核酸的HMS174大肠杆菌，在含有氨苄青霉素的LB培养基的琼脂平板上划线。本领域技术人员可以利用例如实施例4所述的组装PCR技术来合成编码这些D-氨基转移酶的基因。单个菌落用于接种含有氨苄青霉素(100μg/mL)的3mL LB培养基。500μl过夜培养物用于接种250mL挡板烧瓶中的50mL相同培养基。在30℃生长细胞到大约0.5的OD_600nm。IPTG添加到1mM的终浓度。在30℃诱导细胞4小时，通过离心收集。

如实施例4所述制备细胞提取物。如实施例4所述测定总蛋白和DAT浓度。DAT看起来全部表达良好，它们的大多数显示了高度的溶解度。

monatin形成分析如实施例5所述进行，除了DAT浓度为0.1mg/mL和醛缩酶浓度是10μg/mL。作为对照，分析0.1mg/mL纯化的球形芽孢杆菌DAT。在6和22小时之后，采集等份，添加甲酸到6％的终浓度，样品冷冻。样品然后解冻、旋转并过滤。样品用实施例3所述的LC/MS/MS方法分析monatin浓度。在测试的条件下，SEQ ID NO：870、874和878全部看起来在3步monatin形成分析中具有高活性。具有SEQ ID NO：866、872和876所示序列的DAT多肽也在monatin形成途径中具有活性，但是在测试的条件下没有达到具有SEQ ID NO：870、874和878所示序列的多肽的相同程度。表14显示了monatin形成的结果(按ppm)。

表14.monatin形成分析

DAT多肽(SEQ ID NO)	6小时	22小时
			866	17.4	76
868	nd	nd
			870	132	836
872	13.8	50
			874	281.6	798
876	2.4	12
			878	223.4	576
球形芽孢杆菌DAT	175.6	616

nd，在测试的条件下未测出

在pET30a中具有SEQ ID NO：870、874和878序列的多肽的进一步分析

用含有编码上面标明的DAT的核酸的pET30a质粒转化的大肠杆菌BL21DE3的培养物在50mL Overnight Express II(溶液1-6，Novagen)中在30℃生长过夜。作为阳性对照，在pET30a中含有来自ATCC#4978的DAT的菌株也生长和诱导(如实施例6所述)。细胞在5-10的OD_600nm时收集，通过离心收获，冷冻在-80℃直到进一步加工。

细胞提取物如实施例4所述制备。如实施例4所述测定总蛋白和DAT浓度。

monatin形成分析如实施例5所述进行，只是SEQ ID NO：870的DAT多肽浓度为0.5mg/mL，SEQ ID NO：874和878各自是0.275mg/mL的浓度。作为对照，还分析了0.5mg/mL浓度的DAT4978和纯化的球形芽孢杆菌DAT。在0.5、1、2、4、6.5、9、24和22小时之后，采集等份，甲酸添加到2％的终浓度，冷冻样品。样品然后解冻、旋转并过滤。样品利用实施例3所述的LC/MS/MS方法分析monatin。结果在表15中示出(按照形成的monatin的ppm)。

表15

DAT多肽(SEQ ID NO)	0.5hr	1hr	2hr	4hr	6.5hr	9hr	24hr
								4978 DAT	18	85.6	283.4	673.2	890	1226	2020
870	14.4	71	279.4	736	1340	1680	3362
								874	63.8	182.6	415.6	674	888	938	1154
878	97.8	244.4	607	912.2	1068	1174	1356
								球形芽孢杆菌	44.6	142.8	375.2	813	1294	1382	2746

所有三种亚克隆的DAT(编码具有SEQ ID NO：870、874和878序列的多肽)在pET系统中表达良好并产生可溶蛋白。具有SEQ ID NO：870所示序列的多肽得到可溶级分中最高量的表达，展现了高活性，与具有SEQ ID NO：874和878序列的DAT多肽相比所述活性看起来不随时间而减少。

野生型和突变DAT多肽之间的比较

SEQ ID NO：870的残基从T改变为N(SEQ ID NO：870 T242N)的突变多肽如实施例4所述构建并表达并与DAT4978、DAT4978 T243N(实施例6所述)、球形芽孢杆菌和野生型SEQIDNO：870比较。

其中野生型和具有SEQ ID NO：870、870 T242N、DAT4978和DAT4978T243N序列的突变多肽从pET30a载体表达的BL21DE3的培养物在250mL挡板烧瓶中在30℃和250rpm下在50mL Overnight Express(Novagen)中过夜生长。当细胞达到超过10的600nm光密度时通过离心收集细胞。如实施例4所述制备细胞提取物，如实施例4所述测定总蛋白和DAT浓度。所有测试的DAT是高度表达和可溶的，利用Experion软件测定所有都接近30％。具有SEQ ID NO：870 T242N序列的多肽具有最高的表达，预计其是总可溶蛋白质的36.3％。

如实施例5所述在0.5mg/mL的DAT多肽浓度下进行monatin形成分析。作为对照，分析0.5mg/mL纯化的球形芽孢杆菌DAT。在0.5、1、2、4、6.5、9和23.25小时之后采集等份，甲酸添加等份中到2％的终浓度，冷冻样品。样品然后解冻、旋转并过滤。如实施例3所述分析样品的monatin、色氨酸、丙氨酸和4-羟基-4-甲基谷氨酸(HMG)。

在最后的时点，采集其他等份来通过实施例3所述的FDAA衍生方法测定％R，R monatin。

monatin形成数量(ppm)在以下表16中呈现。R，R百分比在右侧列给出，为23.25小时时点的。

表16

DAT多肽(SEQ ID NO)	0.5hr	1hr	2hr	4hr	6.5hr	9hr	23.25hr	％R，R
									野生型DAT 4978	11	57	216	472	694	942	1616	95.0
4978 T243N	74	237	542.6	1106	1396	1784	2202	99.0
									870	15.6	74.4	269.6	702	1250	1522	2788	97.8
870 T242N	49.4	194	655.2	1496	2212	2666	3670	99.5
									球形芽孢杆菌	40.6	144	372	800	1090	1458	2434	97.2

SEQ ID NO：870多肽的T242N突变体的活性是非常高的，好于阳性对照，高于DAT多肽的野生型形式。这个突变体形成的R，R monatin的百分比也高于任何其他基准酶。形成的HMG(副产物)量的分析是定性的，但是看起来在9小时和23.25小时时点，DAT 4978 T243N多肽和SEQ ID NO：870 T242N多肽形成了相似量的HMG。

具有SEQ ID NO：870所示序列的DAT多肽是新的蛋白质，展现了与最接近的已知D-氨基转移酶(芽孢杆菌YM-1 D-氨基转移酶)76％的序列相同性和与实施例6所述的球形芽孢杆菌DAT 69％的氨基酸序列相同性。图2显示了这种新酶与其他公开的DAT的比对，人们可以看出使得该酶独特和可以解释它的优越活性的残基。

具有SEQ ID NO：910所示序列的高活性DAT多肽(更类似于球形芽孢杆菌型DAT；参见实施例12)也在比对中显示。作为SEQ ID NO：870多肽的独特性的举例，在图2的比对中在环绕氨基酸残基54-55(球形芽孢杆菌编号)的区域中，明显芽孢杆菌样DAT具有高度保守性，而SEQ ID NO：870具有残基EC而不是AS。作为另一个例子，在图2显示的比对中在围绕残基135的高度保守区域中，SEQ ID NO：870多肽具有相比主要的缬氨酸残基更为亲水性的残基(T)。代表SEQ ID NO：870酶、但是排除了早先已知的广泛特异性D-氨基转移酶和高度相关同源物的核心序列显示为共有序列A和B。预计含有这些共有序列之一的任何多肽将展现DAT活性，并且在monatin形成途径步骤中是有活性的。

共有序列A

Y.*LWND.*IV.*EDRGYQFGDG.*YEV.*KVY.*G.*FT.*EH.*DR.*YECAEKI.*PYTK.*H.*LLH.*L.*E.*N.*TG.*YFQ.*TRGVA.*RVHNFPAGN.*Q.*V.*SGT.*K.*F.*R.*N.*KGVKAT.*TED.*RWLRCDIKSLNLLGAVLAKQEAIEKGCYEA.*LHR.*G.*TE.*SS.*N.*GIK.*GTLYTHPA.*N.*ILRGITR.*V.*TCAKEIE.*PV.*Q.*T.*K.*LEMDE.*V.*S.*SE.*TP.*I.*DG.*KI.*NG.*G.*WTR.*LQ.*F.*K.*P(SEQ ID NO：1069).

共有序列B

Y[ST]LWND[QK]IV.[DE].{2}[VI].[IV].{2}EDRGYQFGDG[IV]YEV[IV]KVY[ND]G.[ML]FT.{2}EH[IV]DR.YECAEKI[RK][LIV].[IV]PYTK.{3}H[QK]LLH.L[VI]E.N.[LV].TG[HN][IVL]YFQ[IV]TRGVA.RVHNFPAGN[VI]Q.V[LI]SGT.K.F.R.{3}N.[EQ]KGVKAT.TED[IV]RWLRCDIKSLNLLGAVLAKQEAIEKGCYEA[IV]LHR.G.[VI]TE.SS.N[VI][FY]GIK[DN]GTLYTHPA[ND]N.ILRGITR.V[IV][LI]TCAKEIE[LMI]PV.[EQ]Q.{2}T.K.{2}LEMDE[LIVM].V[ST]S.[TS]SE[IV]TP[VI]I[DE][IVL]DG.KI.NG.{2}G[ED]WTR[KQ]LQ.{2}F.{2}K[IL]P.(SEQ ID NO：1070).

类似于PERL正规表达惯例用语，“.*”表示可以来自20种蛋白质氨基酸的任何数量的氨基酸残基；[]表明括号中的任何一个氨基酸可以存在；“{#}”表示可以存在20种蛋白质氨基酸的任一种，只要残基的数量与括号中标明的数字#匹配。

对于共有序列A中“.*”的使用，在任何“.*”位置的氨基酸数目可以变化，例如从0到约20个残基(参见例如共有序列B(SEQ ID NO：1070)，或从约20个残基直到约100个残基，或氨基酸的数量可以更大得多，例如高达1000或更多个残基。无限制地，在一或多个“.*”位置处的插入序列可以相应于例如结构域例如(但不限于)几丁质酶结合结构域(例如来自激烈火球菌(Pyrococcus furiosus)(登记号No.2CZN_A)或P.burkholderia(登记号No.YP_331531)或纤维素结合结构域(例如来自粪肥纤维单胞菌(Cellulomonas fimi)(登记号No.1EXH_A)或粪堆梭菌(Clostridium stercorarium)(登记号No.1UY1_A)。在某些实施方案中(无限制地)，指定为“.*”的五或更少的位置均含有例如大于约20个残基(例如大于约100个残基)的插入序列。在其他实施方案中(无限制地)，指定为“.*”的五个或更多个位置均含有低于约100个残基(例如低于约20个残基，例如3、5、10、20、25、30、40、50、60、70、75、80、90或95个残基))的插入序列。具有相应于在此公开的一或多种共有序列的序列、并在一或多个“.*”位置处含有任何数量的插入的残基的多肽的活性可以利用此处描述的方法来评估。

含有SEQ ID NO：1069所示共有序列的非限制性代表性多肽包括具有SEQ ID NO：870所示序列和共有序列B(SEQ ID NO：1070)的多肽。SEQ ID NO：870、870 T242N、DAT 4978和DAT 4978 T243N标签的和未加标签的之间的比较

表达具有SEQ ID NO：870、870 T242N、DAT 4978和DAT 4978 T243N的序列的多肽的大肠杆菌BL21 DE3细胞在250mL挡板烧瓶中在30℃和250rpm下在50mL Overnight Express(Novagen)中过夜生长。当600nm的光密度大于10时通过离心收集细胞。如实施例4所述制备细胞提取物。如实施例4所述测定总蛋白和DAT浓度。

表达C-末端标签的SEQ ID NO：870、870 T242N、DAT 4978和DAT 4978T243N多肽的大肠杆菌BL21 DE3培养物在1000mL挡板烧瓶中在30℃和250rpm下在200mL Overnight Express(Novagen)中过夜生长。每个克隆生长两份培养物。当细胞达到超过10的600nm光密度时，集中并通过离心收集细胞。通过添加50mL的Bug Buster Primary Amine Free(Novagen)和50μl Benzonase Nuclease(Novagen)、0.75μl rLysozyme(Novagen)和250μl Protease Inhibitor Cocktail II(Calbiochem)来产生细胞提取物。细胞在室温下柔和摇摆孵育15分钟。提取物在45,000×g离心10分钟。

His标签的蛋白质如使用GE Healthcare(Piscataway，NJ)Chelating Sepharose^TM Fast Flow树脂的方法小节所述纯化。纯化的蛋白质使用PD10柱在100mM磷酸钾、pH 7.8(用于DAT 4978和DAT 4978 T243N多肽)或100mM EPPS pH 8.2(用于SEQ ID NO：870和870 T242N多肽)中脱盐，两种缓冲液都含有50μM的PLP。

R，R monatin形成分析如实施例5所述用0.5mg/mL的DAT浓度进行。在2.25、4.5、9和24小时收集等份，用甲酸调整pH值，冷冻。另外的等份在最终时点采集，不添加甲酸，用于使用实施例3所述FDAA衍生方法的立体异构分布的鉴定。解冻样品，离心5分钟，用0.2μm尼龙膜滤器过滤上清。提交样品用于利用实施例3所述LC/MS/MS方法的monatin分析。结果在表17中示出，按照形成的monatin的ppm。最右列是在实验结束时形成的％ R，R monatin。

表17

DAT多肽(SEQ ID NO)	2.25hr	4.5hr	9hr	24hr	％R，R
						DAT 4978	330	676	1470	2384	92.3
DAT 4978 T243N	1392	2856	4068	3688	98.2
						870	395	952	1896	2998	97.8

C-末端标签的和未标签的酶的总体活性和立体特异性是非常相似的。此外，预计在亚克隆的核酸编码的多肽中活性的存在是在由全长或野生型核酸编码的相应多肽中活性存在的预示。

实施例11——DAT的分析

含有pSE420-cHis载体中编码具有SEQ ID NO：880、882和884序列的多肽的DAT核酸的大肠杆菌HMS174在含有氨苄青霉素的LB培养基的琼脂平板上划线。本领域技术人员可以利用例如实施例4所述的组装PCR技术来合成编码这些D-氨基转移酶的基因。单个菌落用于接种3mL含有氨苄青霉素(100μg/mL)的LB培养基。500μl用于接种250挡板烧瓶中的50mL相同培养基。细胞在30℃生长到大约0.4的OD_600nm，添加IPTG到1mM的终浓度。细胞在30℃生长4小时，通过离心收集。

如实施例4所述制备细胞提取物。如实施例4所述测定总蛋白和DAT多肽浓度。SEQ ID NO：882和884表达良好，以高水平存在于可溶级分中。

如实施例5所述利用大约0.5mg/mL的每种DAT多肽(除了利用0.35mg/mL的SEQ ID NO：880多肽以外)进行R，R monatin形成分析。在2、8和23小时之后，采集等份，添加甲酸到2％的终浓度，冷冻样品。样品然后解冻、旋转并过滤。样品利用实施例3所述LC/MS/MS方法分析monatin。结果在表18中示出。

在最后的时点，采集另外的等份(没有pH值调整)来利用实施例3所述的FDAA衍生方法测定产生的monatin的立体异构分布。产生的R，R的百分比在下表18的右侧列显示，平衡主要是S，R monatin。

表18

球形芽孢杆菌

337

1518

2538

96.7

具有SEQ ID NO：882和884所示序列的多肽在自D-色氨酸的monatin形成反应中展现了良好活性。

与球形芽孢杆菌对照酶相比，使用这些DAT时产生的monatin的立体纯度更高。编码具有SEQ ID NO：882和884序列的DAT多肽的DAT核酸如实施例4所述亚克隆到pET30a载体中。

从pET30a载体表达的具有SEQ ID NO：882和884序列的DAT多肽的分析

含有pET30a载体中编码具有SEQ ID NO：882和884序列的DAT多肽的核酸的大肠杆菌BL21 DE3的培养物在250mL挡板烧瓶中在50mL的Overnight Express(Novagen)中在30℃和250rpm生长过夜。当600nm的光密度大于10时通过离心收集细胞。

如实施例4所述制备细胞提取物。如所述测定总蛋白和DAT多肽浓度。总的和可溶蛋白样品利用4-15％梯度丙烯酰胺凝胶和通过Experion系统分析。通过Experion软件预测表达是大约30％。对于总蛋白和可溶蛋白(无细胞提取物)级分都见到了可见条带。

如实施例5所述用0.5和2mg/mL DAT多肽浓度进行monatin形成分析。纯化的球形芽孢杆菌DAT用作对照。在2、4.5、9、24、36和48小时后，采集等份，添加甲酸到2％的终浓度，冷冻样品。样品然后解冻、旋转并过滤。样品利用实施例3所述的LC/MS/MS方法分析monatin。定性分析样品的HMG水平。采集另外的等份(没有pH值调整)用于利用实施例3所述的FDAA衍生化方法的立体异构分析。结果在表19和20中示出。

表19

表20.在选定的时点产生的monatin的立体纯度

具有SEQ ID NO：882和884所示序列的多肽展现了良好的monatin形成活性和立体特异性，在起始时点期间看起来比球形芽孢杆菌对照产生更少的HMG。具有SEQ ID NO：882序列的多肽展现了类似的起始monatin形成率，但是看起来在这个实验中在更低的monatin效价下有平台期。

实施例12 pSE420-cHis中DATs和pET30a中DAT的分析

评估了编码具有SEQ ID NO：898、900、902、904、906、910和896序列的DAT多肽的开放读框。本领域普通技术人员可以利用例如实施例4所述的组装PCR技术来合成编码这些D-氨基转移酶的基因。

在pET30a载体中(如实施例4所述亚克隆的)含有编码具有SEQ ID NO：896所示序列的DAT多肽的核酸的大肠杆菌BL21 DE3的培养物在50mL Overnight Express(Novagen)中在250mL挡板烧瓶中在30℃和250rpm下生长过夜。当600nm的光密度大于10时通过离心收集细胞。

Top10(Invitrogen，Carlsbad，CA)大肠杆菌细胞用含有具有SEQ ID NO：897、899、901、903、905和909所示序列的DAT核酸的pSE420-cHis质粒转化，并铺板在含有氨苄青霉素(100μg/mL)的LB培养基上。500μl过夜培养物用于接种250挡板烧瓶中的50mL相同培养基。细胞在30℃生长到大约0.4的OD_600nm，添加IPTG到1mM的终浓度。细胞在30℃生长4小时，通过离心收集。

如实施例4所述制备细胞提取物。如实施例4所述测定可溶的蛋白和估计的DAT浓度。

如实施例5所述用0.5mg/mL的DAT多肽浓度进行R，R monatin形成分析，只是使用0.3mg/mL具有SEQ ID NO：896序列的多肽；使用0.06mg/mL具有SEQ ID NO：898序列的多肽；使用0.4mg/mL具有SEQ ID NO：900所示序列的多肽；使用0.1mg/mL具有SEQ ID NO：902所示序列的多肽；和使用0.12mg/mL具有SEQ ID NO：904所示序列的多肽。作为阳性对照，SEQ ID NO：870、870 T242N和纯化的球形芽孢杆菌在0.5mg/mL的DAT多肽浓度下测试。在2、6和24小时之后，采集等份，添加甲酸到2％的终浓度，冷冻样品。样品然后解冻、旋转并过滤。样品利用实施例3所述的LC/MS/MS方法分析monatin。采集另外的等份用于立体异构分布分析，并且不用甲酸处理。24小时时点的结果在表21中示出。编码具有SEQ ID NO：908所示序列的DAT多肽的DAT核酸未被亚克隆，不能被分析。

表21

nd＝在测试的条件下未测出

具有SEQ ID NO：910和902所示序列的DAT多肽具有monatin形成反应的高水平活性，产生十分高水平的R，R monatin。结果表明具有SEQ ID NO：870所示序列的DAT多肽展现了在测试的条件下与具有SEQ ID NO：910所示序列的野生型多肽的可比较的活性；然而，SEQ ID NO：870多肽中的T242N突变在酶的活性和立体特异性方面产生了大的改善。

实施例13——DAT的分析

获得含有编码SEQ ID NO：912、914、916、918、920、922、924和926 DAT的核酸序列的质粒(pSE420-cHis)。本领域技术人员可以利用多种基因组装方案如实施例4所述来克隆基因。

大肠杆菌Top10(Invitrogen)细胞用含有具有SEQ ID NO：912、914、916、918、920、922、924和926序列的DAT多肽的pSE420-cHis质粒转化并铺板在含有氨苄青霉素(100μg/mL)的LB培养基上。500μl过夜培养物用于接种250mL挡板烧瓶中的50mL相同培养基。培养物在30℃生长到大约0.4的OD_600nm。IPTG添加到1mM的终浓度。细胞在30℃生长4小时，通过离心收集。

如实施例4所述制备细胞提取物。如实施例4所述测定总的可溶蛋白和DAT蛋白浓度。表达的大多数DAT多肽是可溶的，除了SEQ ID NO：916多肽之外，其仅是部分可溶的。

如实施例5所述用靶向约0.25mg/mL的DAT多肽浓度进行R，R monatin形成分析；只是使用0.1mg/mL的SEQ ID NO：922多肽和使用0.2mg/mL的SEQ ID NO：926多肽。作为阳性对照，在0.25mg/mL浓度下测试纯化的球形芽孢杆菌DAT。在2、8和24小时之后，采集等份，添加甲酸到2％的终浓度，冷冻样品。样品然后解冻、旋转并过滤。样品利用实施例3所述的LC/MS/MS方法分析monatin。结果在表22中示出。

表22

nd＝在分析的条件下未测出

具有SEQ ID NO：169、171、167、173和175所示序列的DAT核酸(编码具有SEQ ID NO：170、172、168、174和176所示序列的多肽)作为PCR产物获得，如实施例4所述亚克隆到pET30a中。本领域普通技术人员可以利用许多基因组装方法例如实施例4所述的一种来重构建基因。

在pET30a载体中含有具有SEQ ID NO：169、171、167、173和175序列的DAT核酸的大肠杆菌BL21 DE3细胞在250mL挡板烧瓶中在30℃和250rpm下在50mL Overnight Express(Novagen)中生长过夜。当600nm的光密度大于10时通过离心收集细胞。

如实施例4所述制备细胞提取物。如实施例4所述测定总可溶蛋白和DAT蛋白浓度。具有SEQ ID NO：170序列的多肽(有具有SEQ ID NO：169序列的DAT核酸编码)看起来不是可溶的，其可能阻碍了活性分析。

如实施例5所述使用0.5mg/mL的DAT多肽浓度进行R，R monatin形成分析，只是使用0.25mg/mL的SEQ ID NO：170多肽。作为阳性对照，在0.5mg/mL浓度下测试纯化的球形芽孢杆菌DAT。在2、8和24小时之后，采集等份，添加甲酸到2％的终浓度，冷冻样品。然后解冻样品，旋转并过滤，利用实施例3所述的LC/MS/MS方法分析monatin。结果在表23中示出。

表23

利用实施例3所述FDAA衍生方案分析样品(没有pH值调整)来测定R，R％。与在相同时点为95.2％ R，R的球形芽孢杆菌所产生的相比，具有SEQ ID NO：176所示序列的DAT多肽产生的monatin在24小时之后是99.6％ R，R。来自具有SEQ ID NO：176序列的DAT多肽的活性和立体纯度都是十分高的，相应的核酸如实施例4所述亚克隆为C-末端标签的蛋白质用于进一步的定量研究。

SEQ ID NO：176 C-His标签的蛋白质的表征

具有SEQ ID NO：175的核酸，其编码具有SEQ ID NO：176序列的多肽，克隆到没有终止密码子的pET30a中，从而它可以作为在C-末端带有6×His标签的融合蛋白来表达。利用实施例4所述的His结合树脂纯化蛋白质。当融合蛋白从PD-10脱盐柱上洗脱时，在溶液中形成黄色沉淀。黄色残余物也在柱中观察到。黄色通常是PLP结合蛋白存在的表现。为了在脱盐步骤防止PLP结合蛋白的沉淀，利用了在两种pH值(7.8和8.2)下不同的缓冲液(有或者没有10％甘油的100mM磷酸盐和100mM EPPS)。测试的缓冲液都没有显示完全阻止沉淀。

利用良好混合的异质蛋白质溶液和0.5mg/mL的DAT多肽浓度进行monatin分析。结果在表24中示出。纯化的SEQ ID NO：176 DAT多肽(C-标签的)显示了与来自球形芽孢杆菌的阳性对照DAT多肽可比较的活性；然而，所述活性看起来低于具有SEQ ID NO：870 T242N或SEQ ID NO：870 T242N序列的突变多肽所展现的活性。

表24.monatin产生(ppm)

多肽(SEQ ID NO)

2hr

4hr

8hr

24hr

球形芽孢杆菌	262	676	1044	2150
					870	332	678	1346	2826
870 T242N	942	1938	2834	4004
					176	208	392	732	1806

实施例14——DAT的评估

作为PCR产物获得编码29种DAT的开放读框。注意，本领域普通技术人员可以利用组装技术例如实施例4所述来合成编码DAT的基因。如实施例4所述，DAT核酸亚克隆到pET30a载体中并表达为非标签化的蛋白质。脱盐的无细胞提取物(如实施例4所述制备的)用于monatin形成分析。0.5mg/mL的DAT多肽浓度用于monatin分析，除了以下多肽之外(使用的量在括号中)：SEQ ID NO：156多肽(0.4mg/mL)、SEQ ID NO：182多肽(0.45mg/mL)、SEQ ID NO：240多肽(0.47mg/mL)和SEQ ID NO：204多肽(0.42mg/mL)。

与阳性对照酶相比，大多数DAT多肽显示了在分析的条件下是不可检测的到低monatin生产。根据Experion所测定的，大多数表达的DAT多肽是可溶的；然而，具有SEQ ID NO：204和240的多肽以极低水平表达，不是非常可溶的。另一方面，具有SEQ ID NO：220的多肽预测是总可溶蛋白的68％，根据Experion软件判断。

monatin生产结果在表25和26中示出。在24小时，与阳性对照酶、来自球形芽孢杆菌的DAT相比，具有SEQ ID NO：156和214的DAT多肽产生了40-50％的monatin。最有活性的DAT多肽是SEQ ID NO：220多肽。在反应开始后大约4小时，monatin浓度达到最大值。预计SEQ ID NO：156的成熟蛋白质(没有预测的前导序列)是DAT多肽的活性成分，因而蛋白质可以没有前导序列地重组产生。

表25.形成的monatin(ppm)

多肽(SEQ ID NO)	2hr	4hr	8hr	24hr
					178	11	24	62	194
180	nd	nd	nd	nd
					154	52	103	166	178
182	nd	nd	nd	nd
					218	1.6	2.8	274	12
188	2.4	5.2	10	22
					190	3.8	9.4	22	42

208	1	1.2	nd	nd
					220	2418	3563	3812	3882
196	1	1.8	nd	8
					156	64.8	156	296	796
球形芽孢杆菌	422	791	1302	2124

nd＝在分析的条件下不可检测

表26.形成的monatin(ppm)

多肽(SEQ ID NO)	2	4	8	24
					166	nd	nd	1	nd
216	69	91	109	134
					200	nd	nd	1	1
198	nd	nd	nd	nd
					210	1.6	3.8	6.2	15.2
202	3.4	6.2	12.2	29.8
					222	3.6	7	12.8	25.8
236	nd	nd	nd	nd
					204	nd	nd	nd	3.6
238	10.4	21.8	46.4	115.6
					240	3	6	12.4	32.2
224	39.8	85	171.8	268.8
					226	2.6	5.8	12.4	30.6
228	4.2	9.8	21.4	66.8
					230	9.2	21.8	42.2	94.4

232	3.6	9.4	21.6	57
					246	nd	nd	nd	nd
214	160	327	694	1346
					球形芽孢杆菌	393	986	1624	2597

nd＝在分析的条件下不可检测

SEQ ID NO：220多肽的高活性在另一个monatin形成分析中确认，其中SEQ ID NO：220多肽与SEQ ID NO：870、870T242N和球形芽孢杆菌DAT多肽相比较。0.1mg/mL和0.5mg的DAT多肽浓度被用于分析的每种DAT多肽。结果在表27中示出。由于所分析的DAT多肽的高度活性，monatin样品必需被稀释100倍来处于使用的设备的定量范围之内(与典型的10倍或20倍稀释相对)。

表27.形成的monatin(ppm)

DAT多肽(SEQ ID NO)	2hr	4hr	8hr	24hr
					球形芽孢杆菌(0.1mg/mL)	74	170	309	728
球形芽孢杆菌(0.5mg/mL)	510	921	1068	2704
					870(0.1mg/mL)	28	81	179	706
870(0.5mg/mL)	399	847	1466	2916
					870T242N(0.1mg/mL)	93.2	245.8	582.4	1270
870T242N(0.5mg/mL)	1158.8	2026	3202	4126
					220(0.1mg/mL)	965.8	1512	2330	3788
220(0.5mg/mL)	2950	4302	4618	4488

上述实验中具有SEQ ID NO：220的DAT多肽形成的R，R的百分比利用实施例3所述的FDAA衍生化方法测定。具有SEQ ID NO：220序列的DAT多肽是高度立体特异性的，与球形芽孢杆菌的92.9％ R，R相比，在24小时产生99.3％的R，R monatin。在另一个分析中，SEQ ID NO：220多肽产生99.8％的R，R-monatin。

具有SEQ ID NO：220序列的DAT多肽是新的蛋白质，其在蛋白质水平上与实施例9所示的拜氏梭状芽孢杆菌DAT多肽是62％相同的。SEQ ID NO：220多肽与其他高活性DAT多肽(例如具有SEQ ID NO：892和894(实施例8)、946(实施例7)和176(实施例13)所示序列的那些)具有86％-90％一级序列同源性。这些高活性和新的DAT多肽在这项工作之前未被表征，与任何公开的芽孢杆菌样D-氨基转移酶相比，这些酶对于R，Rmonatin产生反应展现了的更高活性和立体特异性。图3显示了这些相关D-氨基转移酶的比对，它们共有的共有序列基序在下文描述。

共有序列C

M.*GYYNG.*P.*DR.*FGDG.*YDAT.*N.*FAL.*H.*RF.*NS.*LL.*I.*K.*YWQ.*RG.*G.*R.*H.*F.*N.*I.*P.*KLI.*DTRF.*HCNIKTLNL.*P.*VIA.*Q.*E.*C.*E.*VFHRG.*VTECAHSN.*I.*NLIL.*G.*HL.*P.*E.*F.*L.*ADE.*V.*SS.*DG.*GGK.*K.*Q.*T(SEQ ID NO：1071)

共有序列D

M.{3}GYYNG.{10}P.{2}DR.{3}FGDG.YDAT.{3}N.{3}FAL.{2}H.{2}RF.NS.{2}LL.I.{9}K.{17}YWQ.{2}RG.G.R.H.F.{5，7}N.{2}I.{3}P.{10}KLI.{3}DTRF.HCNIKTLNL.P.VIA.Q.{3}E.{2}C.E.VFHRG.{2}VTECAHSN.{2}I.{11}DNLIL.G.{4}HL.{9}P.{2}E.{2}F.{4}L.{2}ADE.{2}V.SS.{10}DG.{3}GGK.{5}K.{2}Q.{10}T(SEQ ID NO：1072)

共有序列E

M.*[LV]GYYNG.*[LI].*[ML].*[VI]P.*DR.*[YF]FGDG.*YDAT.*N.*FAL[DE][ED]H[IL][DE]RF.*NS.*LL.*I.*[KR].*[EQ][LMV]K[KE].*[MV].*[DE].*[VL]YWQ.*[TS]RG[TS]G.*R[NS]H.*F.*N[LI].*I.*P.*[IVL].*[KE].*KLI[TS].*[ED]DTRF.*HCNIKTLNL[IL]P[NS]VIA[SA]Q[K].*E.*C.*E.*VFHRG[ED].*VTECAHSN[VI].*I[IL][KR][ND].*[TS].*DNLIL.*G.*HL[LI][QK].*[IV]P.*E.*F[TS][LM].*[ED]L.*ADE[VI][LI]V[ST]SS.*[LMI].*[IL]DG.*GGK.*[LVI]K.*IL]Q.*[EK][FY].*T(SEQ ID NO：1073)

类似于PERL正规表达惯例用语(perldoc.perl.org)，“.*”表示可以来自20种蛋白质氨基酸的任何数量的氨基酸残基；[]表明括号中的任何一个氨基酸可以存在；“{#}”表示可以存在20种蛋白质氨基酸的任一种，只要残基的数量与括号中标明的数量(#)匹配。

对于共有序列C中“.*”的使用，在任何“.*”位置的氨基酸的数目可以变化，例如从0到约20个残基(参见例如共有序列D(SEQ ID NO：1072)和E(SEQ ID NO：1073))，或从约20个残基直到约100个残基，或氨基酸的数量可以更大得多，例如高达1000或更多个残基。无限制地，在一或多个“.*”位置处的插入序列可以相应于例如结构域例如(但不限于)几丁质酶结合结构域(例如来自激烈火球菌(登记号No.2CZN_A)或P.burkholderia(登记号No.YP_331531)或纤维素结合结构域(例如来自粪肥纤维单胞菌(登记号No.1EXH_A)或粪堆梭菌(登记号No.1UY1_A)。在某些实施方案中(无限制地)，指定为“.*”的五或更少的位置均含有例如大于约20个残基(例如大于约100个残基)的插入序列。在其他实施方案中(无限制地)，指定为“.*”的五个或更多个位置均含有低于约100个残基(例如低于约20个残基，例如3、5、10、20、25、30、40、50、60、70、75、80、90或95个残基)的插入序列。具有相应于在此公开的一或多种共有序列的序列、并在一或多个“.*”位置处含有任何数量插入残基的多肽的活性可以利用此处描述的方法来评估。

含有SEQ ID NO：1071所示共有序列的非限制性代表性多肽包括SEQ ID NO：220、892、894、176和946和共有序列D(SEQ ID NO：1072)和E(SEQ ID NO：1073))。预计展现了共有序列C、D或E任一的任何D-氨基转移酶将在monatin形成途径步骤中是有活性的。

具有SEQ ID NO：220序列的c-His标签的多肽的表征

具有SEQ ID NO：219序列的DAT核酸(编码SEQ ID NO：220的多肽)克隆到没有终止密码子的pET30a中，从而它被表达为在C-末端具有6×His标签的融合蛋白(如实施例4所述)。利用实施例4所述的His结合柱(Novagen)纯化融合蛋白。来自PD-10脱盐柱的洗脱物形成黄色沉淀。黄色残余物也在柱中观察到。使用良好混合的异质蛋白质溶液进行monatin分析。使用的DAT多肽的量在最左侧列中在括号中标明。符号w/Tip表示酶与10mM D-色氨酸在冰上孵育过夜。结果在表28中示出。

表28.形成的monatin(ppm)

多肽(SEQ ID NO)	2hr	4hr	8hr	24hr
					球形芽孢杆菌(0.5mg/mL)	382	660	1021	1986
870T242N(0.1mg/mL)	69	205	412	1074
					870T242N w/Trp(0.1mg/mL)	63	163	383	978
870T242N(0.5mg/mL)	919	1698	2356	3130
					870T242N w/Trp(0.5mg/mL)	772	1519	2294	3023
220(0.1mg/mL)	847	1462	2202	3004
					220(0.1mg/mL)	811	1522	2202	2887
220w/Trp(0.1mg/mL)	537	1080	1590	2401
					220(0.5mg/mL)	2885	3446	3813	4066
220w/Trp(0.5mg/mL)	1933	3223	3939	3911

含有0.1mg/mL SEQ ID NO：220多肽的反应显示了与含有0.5mg/mLSEQ ID NO：870 T242N多肽的反应相似的monatin形成时间过程。向含有纯化蛋白质的溶液中添加D-色氨酸(10mM)消除了沉淀。在SEQ ID NO：220在冰上与D-色氨酸(10mM)孵育的样品中观察到活性损失，但是当SEQ ID NO：870 T242N多肽用D-色氨酸(10mM)处理时没有观察到负面影响。还通过比较峰面积对SEQ ID NO：220多肽催化的反应定性地分析了HMG的存在。当两种DAT多肽都在0.5mg/mL浓度下使用时，与含有SEQ ID NO：870 T242N多肽的反应相比，SEQ ID NO：220多肽催化的反应形成了约40％的HMG。更早的时点显示了两种酶之间更为显著的差异。

为了试图阻止SEQ ID NO：220多肽纯化期间的蛋白质沉淀，DTT(5mM)被包括在所有缓冲液中，包括Bugbuster试剂、His结合柱的缓冲液和PD-10柱的缓冲液。当DTT以2mM的浓度在纯化期间被包括或添加到纯化的蛋白质溶液中时，在脱盐柱之后没有观察到沉淀，没有观察到对SEQ ID NO：220多肽活性的负面影响。monatin形成分析的数据在表29中示出。使用的DAT多肽的量在左侧列中在括号中标出。“添加的DTT”表明2mM DTT被添加以在纯化之后再溶解蛋白质；“纯化的w/DTT”表明5mM DTT在整个纯化过程中存在。

表29.形成的monatin(ppm)

多肽(SEQ ID NO)	2hr	4hr	24hr
				球形芽孢杆菌(0.5mg/mL)	426	965	2638
870 T242N(0.5mg/mL)	977	1916	4227
				220(0.1mg/mL)	1214	2163	3964
220(0.5mg/mL)	3534	4246	4415
				220添加的DTT(0.1mg/mL)	1287	2202	3566
220添加的DTT(0.4mg/mL)	3495	4833	5082
				220纯化的w/DTT(0.1mg/mL)	1204	2169	3997
220纯化的w/DTT(0.5mg/mL)	3562	4110	4353

SEQ ID NO：220多肽的高度期望的性质使得它成为进一步诱变或定向进化实验的极好候选物。

SEQ ID NO：220多肽的定点诱变

与芽孢杆菌DAT多肽相关的DAT多肽的环区域被鉴定为对于酶的底物特异性和立体特异性是重要的(Ro et al.，1996，FEBS Lett，398：141-145；Sugio et al.，1995，Biochemistry 34：9661-9669；和EP 1 580 268)。这个区域中的一个关键残基是残基242处的T(在来自ATCC #4978的DAT多肽中，这个位置相应于残基243的T)。SEQ ID NO：870多肽的T242N突变体显示了在活性和立体特异性方面的改善，DAT 4978的T243N突变体也一样(参见实施例10)。SEQ ID NO：220多肽与SEQ ID NO：870多肽的一级序列比对仅显示了35％的氨基酸序列相同性和65％的同源性。SEQ ID NO：870中的T242残基与SEQ ID NO：220中G240残基对准，其之后是T241残基。对两种蛋白质使用Accelrys DS Modeler软件(用芽孢杆菌YM-1结构作为模板)难以将SEQ ID NO：870多肽的环区域与SEQ ID NO：220多肽重叠。因而，这两个氨基酸被选择作为定点诱变的靶。

称为SEQ ID NO：220 G240N和SEQ ID NO：220 T241N的突变多肽通过如实施例4所述的相应核酸(SEQ ID NO：219)的定点诱变产生。两种突变多肽作为6×His标签化的融合蛋白被表达和纯化，用于monatin形成分析中。对于两种突变体SEQ ID NO：220多肽，在脱盐步骤中都观察到黄色沉淀。monatin形成分析的结果在表30和31中显示。使用的D-氨基转移酶的量在左侧列中在括号中标明。在分析中利用SEQ ID NO：220多肽的不同制品，“ferm”表明使用的SEQ ID NO：220多肽如实施例15所述在发酵器中产生。

表30.产生的monatin(ppm)

多肽(SEQ ID NO)	2hrs	4hrs	8hrs	24hrs
					球形芽孢杆菌(0.5mg/mL)	440	777	1510	2621
870 T242N(0.5mg/mL)	961	1913	2793	3904
					ferm220(0.1mg/mL)	1396	2379	3217	3770
ferm 220(0.2mg/mL)	2301	3277	3789	4328
					ferm 220w/DTT(0.1mg/mL)	1434	2384	3109	3730
ferm 220w/DTT(0.2mg/mL)	2423	3568	3859	4755
					220(0.1mg/mL)	1109	1912	2809	3713
220T241N(0.1mg/mL)	554	856	1084	1986

表31.形成的monatin(ppm)

多肽(SEQ ID NO)	2hr	4hr	8hr	24hr
					球形芽孢杆菌(0.5mg/mL)	634	938	1651	2754
870 T242N(0.5mg/mL)	1422	1922	3211	3793
					ferm 220(0.1mg/mL)	1976	2505	3442	4211
ferm 220(0.2mg/mL)	3198	3430	4452	4639
					220G240N(0.1mg/mL)	3	5	14	42
220 G240N(0.2mg/mL)	9	17	46	94

非常小量的monatin(95.7％ R，R monatin)在突变体SEQ ID NO：220 G240N多肽催化的反应中形成。突变体SEQ ID NO：220 T241N多肽失去了约50％的活性，但是仍然维持了立体特异性(产生99.7％ R，R monatin)。这些结果与同源性建模和比对一起表明在围绕残基242-243(和潜在地远处)的区域中，SEQ ID NO：220多肽的结构与SEQ ID NO：870多肽的结构或文献中芽孢杆菌样DAT多肽的结构不相似。由于没有X射线晶体结构，SEQ ID NO：220多肽和相关DAT多肽的随机诱变、组合方法和其他定向进化方法预计在改善酶活性方面是高产的。

实施例15——发酵器中DAT的产生

细菌生长培养基成分来自Difco，Fisher Scientific或VWR；其他试剂是商业上可获得的分析级或最高级别的。发酵在New Brunswick Scientific (Edison，NJ)BioFlo 3000发酵器中进行。离心使用具有JLA-16.250或JA-25.50转子的Beckman(Fullerton，CA)Avanti

J-25I离心机进行。

编码具有SEQ ID NO：220序列、具有C-末端His标签的多肽的DAT核酸利用NdeI/XhoI限制性位点克隆到实施例16所述的pMet1a载体中。抗生素标记(bla基因)可以利用Psi I限制性内切酶消化进一步除去，载体条带的凝胶纯化、载体末端的自我连接、转化到大肠杆菌宿主中和在不含甲硫氨酸的最小培养基平板上选择。典型地，使用具有15种氨基酸的Neidhardt′s培养基。克隆位点是NdeI/XhoI以将SEQ ID NO：220核酸序列插入到pMET1a中(参见实施例16)。

带有C-末端His纯化标签的SEQ ID NO：220 DAT多肽在2.5L级别的发酵器中以实现高细胞密度和期望蛋白质高水平表达的补料-分批过程来生产。大肠杆菌菌株B834(DE3)：：SEQ ID NO：220cHIS pMET1的生长的方案和结果描述如下：从新鲜的培养平板开始(Neidhardt′s+15种氨基酸，无甲硫氨酸)，细胞在补充有15种氨基酸的5mL Neidhardt′s培养基中在30℃和225rpm下生长6-8小时。1mL的培养物转移到补充有5g/L葡萄糖的生产培养基的2个125mL等份中的每一个中。烧瓶在30℃和225rpm下生长过夜(16-18h)。发酵器填充2.5升的生产培养基，含有(每升)：2.0g/L(NH₄)₂SO₄；8.0g/L K₂HPO₄；2.0g/L NaCl；1.0g/L Na₃Citrate·2H₂O；1.0g/LMgSO₄·7H₂O；0.025g/L CaCl₂·2H₂O；0.05g/L FeSO₄·7H₂O；0.4mL/LNeidhardt微量元素和2.0g/L葡萄糖。发酵器用10％ v/v的过夜培养物接种。在接种后三小时，利用60％ w/v葡萄糖溶液建立指数性葡萄糖给料。以需要的速率提供给料来将微生物生长维持在0.15h^-1的指数率。当二氧化碳进化速率(CER)达到100mmole/L/h时(大约接种后21小时；与15-16g DCW/L的细胞生物量相应)，用2g/L乳糖的大剂量添加(作为20％溶液给料)诱导基因表达。给料从60％w/v葡萄糖变为50％w/v葡萄糖+10％w/v乳糖，而给料速度固定在诱导时的速度。“50％w/v葡萄糖+10％w/v乳糖”给料维持6小时。在发酵结束时，细胞通过在5000-7000×g离心10分钟来收获，在80℃作为湿细胞糊冷冻。从2.8L细胞汤中收获细胞糊(318克)。

为了制备含有SEQ ID NO：220多肽的无细胞提取物，50g的湿细胞糊悬浮在含有50μM磷酸吡哆醛(PLP)的150mL的50mM EPPS缓冲液(pH8.4)中，然后使用Microfluidics匀浆器(Microfluidics，Newton，MA)破坏(在18,000 psi 3次通过)，维持悬液温度在低于15℃。通过离心除去细胞碎片(20,000×g 30分钟)。2mM DTT添加到澄清的细胞提取物中。

为了制备纯化的SEQ ID NO：220，2×25mL等份的澄清细胞提取物各自加载到45mL Chelating Sepharose^TM Fast Flow树脂(镍(II)形式)柱上，所述柱预先用含有0.05mM PLP和200mM氯化钠的50mM EPPS(pH 8.4)平衡。加样后，用3-5倍体积的平衡缓冲液、3-5倍体积的含25mM咪唑的平衡缓冲液、3-5倍体积的含100mM咪唑的平衡缓冲液和3-5倍体积的含500mM咪唑的平衡缓冲液连续洗涤/洗脱柱。500mM咪唑洗脱液用Amicon(Billerica，MA)Centricon-70离心过滤器设备(MWCO 10kDa)浓缩10×。通过预先用含有0.05mM PLP的50mM EPPS(pH 8.4)平衡的一次性GE Healthcare PD10脱盐柱除去咪唑和氯化钠。脱盐溶液的蛋白质浓度利用Pierce BCA分析试剂盒(Rockford，IL)测定。无细胞提取物级分中每种级分的纯度和表达水平通过用4-15％梯度凝胶的SDS-PAGE测定。～90％纯的大约450mg蛋白从50mL澄清细胞提取物中回收。2mM DTT添加到10mL纯化的蛋白中。纯化的蛋白分配为等份(0.5-5mL)，在-80℃保存。

桌面规模反应(250mL)在0.7L Sixfors搅动的发酵器(Infers AG，Bottmingen，Switzerland)中在氮气上部空间下进行。反应混合物含有10mM磷酸钾、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠和100mM D-色氨酸。反应混合物调节到合适温度，用氢氧化钾调节到合适pH。作为澄清的细胞提取物以0.02mg/mL靶蛋白添加实施例6所述的醛缩酶。以0.25mg/mL靶蛋白添加SEQ ID NO：220 DAT多肽(作为纯化的酶或作为澄清的细胞提取物)。

反应的进展利用实施例3所述的LC/MS/MS方法测量monatin浓度来跟踪。

从D-色氨酸开始、在测试条件下利用SEQ ID NO：220多肽的monatin形成反应的最佳pH发现是大约pH 8.0，利用SEQ ID NO：220多肽的monatin形成反应的最适温度发现是大约25℃。这些反应具有复杂的动力学，完全的monatin产生反应的最佳反应条件可能与DAT多肽所催化的独立反应的最佳条件是不同的。

实施例16——伴侣蛋白共表达以提高DAT多肽的可溶表达

由于SEQ ID NO：894 DAT多肽的可溶表达使用标准表达方案(LB或Novagen Overnight Express Autoinduction System 2中1mM IPTG，参见实施例8)是低的，检查了SEQ ID NO：894多肽和多种商业上可获得伴侣蛋白的共表达。

伴侣蛋白：

TaKaRa伴侣蛋白组(TAKARA BIO目录#3340)由HSP Research Institute，Inc开发的五种不同的伴侣蛋白组组成。它们被设计以允许已知在折叠过程中协同起作用的多种分子伴侣蛋白的有效表达。所述组含有以下物质：

转化方案

化学感受态BL21(DE3)细胞(EMD Biosciences/Novagen目录#69450)用20ng的TaKaRa伴侣蛋白质粒之一和20ng的SEQ ID NO：893/pET30a(编码SEQ ID NO：894多肽；质粒的构建参见实施例C2)通过在42℃热激30秒来转化。转化的细胞在37℃在0.5mL SOC培养基中恢复1小时，铺板在含有50mg/L卡那霉素和25mg/L氯霉素的LB平板上。平板在37℃孵育过夜。从过夜平板挑取菌落，用于接种含有50mg/L卡那霉素和25mg/L氯霉素的5mL 2xYT培养基。在37℃过夜孵育之后，利用QUIAprep Spin Miniprep Kit(Qiagen目录#27104)从细胞沉淀分离质粒。根据厂家建议的方案通过用来自New England Biolabs(Beverly，MA)的一种切割酶的限制消化来分析伴侣蛋白质粒和SEQ ID NO：893/pET30a质粒。

质粒	限制性酶
		pG-KJE8	XhoI
pGro7	XbaI
		pKJE7	NheI
pG-Tf2	XhoI
		pTf16	XbaI

含有SEQ ID NO：893/pET30a和pKJE7的分离的DNA用NheI和XbaI消化。

表达研究

含有溶液1-6、50mg/L卡那霉素和25mg/L氯霉素的Novagen Overnight Express^TM AutoinductionSystem 2(EMD Biosciences/Novagen目录#71366)的烧瓶(每个烧瓶中25mL)使用用伴侣蛋白质粒和SEQ ID NO：893/pET30共转化的细胞的新鲜平板接种。在接种时还添加了伴侣蛋白质粒所需的诱导物。

质粒	诱导物浓度
		pG-KJE8	2mg/mL L-阿拉伯糖；10ng/mL四环素
pGro7	2mg/mL L-阿拉伯糖
		pKJE7	2mg/mL L-阿拉伯糖
PG-Tf2	10ng/mL四环素
		PTf16	2mg/mL L-阿拉伯糖

细胞在30℃孵育过夜，当600nm的OD达到6或更高时通过离心收获。细胞用冷的50mM EPPS缓冲液(pH 8.4)洗涤，再次离心，立即使用或冷冻在-80℃。

通过向细胞中添加5mL每g细胞沉淀的BugBuster

(无伯胺的)提取试剂(EMD Biosciences/Novagen目录#70923)和5μL/mL Protease Inhibitor Cocktail II(EMD Bioscience/Calbiochem目录#539132)、1μl/mL Benzonase核酸酶(EMD Biosciences/Novagen catalog#70746)和0.033μl/mL r-Lysozyme溶液(EMD Biosciences/Novagen目录#71110)来制备细胞提取物。细胞悬浮液在室温下柔和混合孵育15分钟；在14,000rpm旋转20分钟(4℃)，小心取出上清。利用Pierce BCA蛋白质分析试剂盒(Pierce目录#23225)和牛血清白蛋白作为标准物和微量滴定板形式测定总蛋白浓度。D-氨基转移酶的表达通过利用Bio-Rad Ready Gel

Precast 4-15％聚丙烯酰胺梯度凝胶(Bio-Rad Laboratories目录#161-1104)的SDS-PAGE来分析。BioRad SDS-PAGE低范围标准物(目录#161-0304)作为每个凝胶上标准物来运行。细胞提取物(15μg蛋白质)的等份与含有2％ SDS、10％甘油、12.5％ 2-巯基乙醇、0.1％溴酚蓝和62.5mM Tris-HCl(pH 8)的蛋白质加样缓冲液混合，在95℃孵育5分钟，冷却，加样到凝胶上。此外，对每个转化体分析了组合的可溶和不溶蛋白表达(总蛋白)。离心之前每种细胞悬浮液的10μl等份在90μl蛋白质加样缓冲液中稀释，在95℃孵育10分钟，冷却。每个冷却溶液的10μl加样到凝胶上。

当伴侣蛋白GroEL-GroES(pGro7)共表达时，可溶蛋白凝胶显示了具有SEQ ID NO：894序列的多肽的最佳可溶表达。

还检查了在存在GroEL-GroES伴侣蛋白的情况下利用可选择的质粒的SEQ ID NO：894多肽的表达。SEQ ID NO：893核酸利用来自New England Biolabs的限制性内切酶NdeI和XhoI亚克隆到pMET1a质粒中。这个质粒是pET23a(EMD Biosciences/Novagen catalog #69745-3)的衍生物，带有metE基因(插入在质粒的NgoMIV位点处)，可以补足大肠杆菌菌株B834(DE3)和大肠杆菌BW30384(DE3)ompTmetE(“EE2D”)的甲硫氨酸营养缺陷。“EE2D”菌株的构建在WO2006/066072中描述。作为pET23d衍生物的pMET1a的类似质粒的构建在同一PCT申请中描述。

SEQ ID NO：893/pMET1a质粒(25ng)使用用于大肠杆菌细胞的标准Bio-Rad电穿孔方案、用Bio-Rad Gene Pulser II系统(目录#165-2111)单独或与pGro7(20ng)共同转化到“EE2D”电感受态细胞。转化的细胞在0.5mL SOC培养基中在37℃恢复1小时，铺板在含有100mg/L氨苄青霉素的LB平板上或含有100mg/L氨苄青霉素和25mg/L氯霉素(双质粒转化体)的平板上。平板在37℃孵育过夜。来自每个平板组的一个菌落用于接种含有溶液1-6、100mg/L氨苄青霉素和2mg/mL L-阿拉伯糖的50mL Novagen Overnight Express^TM AutoinductionSystem 2。用含有pGro7质粒的细胞接种的培养物还含有25mg/L氯霉素。细胞在30℃孵育过夜，当OD600达到6或更大时通过离心收获。细胞沉淀用冷的50mM EPPS缓冲液(pH 8.4)洗涤，再次离心，立即使用或冷冻在-80℃。细胞提取物如上所述利用Novagen BugBuster(无伯胺的)提取试剂制备。可溶和总D-氨基转移酶的表达通过如上所述的SDS-PAGE来分析。

当GroEL-GroES蛋白质共表达时，凝胶显示了可溶SEQ ID NO：894多肽的表达更大。然而，可溶表达不如使用上述pET30a构建体的那么高。

还检查了在表达期间孵育温度的影响。含有100mg/L氨苄青霉素和25mg/L氯霉素的5mL LB培养物从EE2D：：SEQ ID NO：894PMET1a+pGro7的新鲜平板上接种。培养物在30℃孵育过夜，然后用于接种3个烧瓶，每个烧瓶各含有含溶液1-6、100mg/mL氨苄青霉素、25mg/L氯霉素和2mg/mLL-阿拉伯糖的50mL Novagen Overnight Express^TM Autoinduction System 2。一个烧瓶在20℃孵育，第二个在25℃孵育，第三个在30℃孵育。当OD600达到6或更高时收获细胞。收获细胞，如上所述制备细胞提取物。利用Pierce BCA蛋白质分析试剂盒(Pierce目录#23225)和牛血清白蛋白作为标准物和微量滴定板形式测定总蛋白浓度。根据厂家方案使用稀释到1mg/mL的细胞提取物溶液使用Bio-Rad Experion Pro260 Automated Electrophoresis Station分析D-氨基转移酶的表达。结果在表32中示出。看起来，最低温度得到了SEQ ID NO：894多肽表达的最大量。

表32.

泳道	样品	温度	估计的DAT表达
				1	Pro260 Ladder
2	EE2D：：23463pMET1+pGR07细胞提取物	20℃	23％
				3	EE2D：：23463pMET1+pGR07细胞提取物	25℃	21％
4	EE2D：：23463pMET1+pGR07细胞提取物	30℃	19％

活性分析方案

与GroEL-GroES伴侣蛋白共表达的SEQ ID NO：894 DAT的酶活性在标准monatin反应方案之后测试。简要地，每个分析试管含有以下(在总2mL中)：细胞提取物中的0.050mg/mL醛缩酶(假定20％可溶表达)；细胞提取物中的1.0mg/mL D-氨基转移酶(对于含有SEQ ID NO：894多肽的提取物假定20％的可溶表达)或纯化的球形芽孢杆菌D-氨基转移酶；0.01％Tween-80；200mM丙酮酸钠；100mM D-色氨酸；100mM EPPS(pH 8.2)；1mM MgCl₂；0.05mM PLP；和10mM磷酸钾。

反应在Coy Laboratory Products，Inc.厌氧室中在室温下孵育以最小化对氧的暴露。除了酶之外的所有成分混合在一起(色氨酸没有完全地溶解直到添加酶之后至少1小时)。反应通过添加酶来启动。在1、4、8和22小时回收样品。还进行了使用1mg/mL纯化的球形芽孢杆菌DAT的对照反应。这种DAT的构建、表达和纯化在实施例6中描述。底物和产物的浓度如实施例3所述测量。

结果在表33中示出。在22hr，当存在SEQ ID NO：894多肽时monatin的浓度是9.2mM，当使用球形芽孢杆菌酶时是12.4mM。当SEQ ID NO：894多肽处在分析混合物中时(当与含有球形芽孢杆菌酶的分析样品比较时＜1/3的浓度)副产物HMG的浓度显著更低。HMG浓度通过比较OPA衍生的样品的峰面积来评估。

表33.monatin形成(mM)

多肽(SEQ ID NO)	1h	4h	8h	22h
					894 DAT+GroEL-ES	1.3	4.5	6.8	9.2
球形芽孢杆菌DAT	1.6	5.7	8.3	12.4

实施例17——利用ArcticExpress ^TM 系统来提高DAT多肽的可溶表达

由于SEQ ID NO：894多肽的可溶表达在使用标准表达方案时是低的(LB中或Novagen Overnight Express^TM AutoinductionSystem 2中的1mM IPTG，参见实施例8)，检查在Stratagene ArcticExpress^TM系统中SEQ ID NO：893/pMET1a质粒的表达。

Stratagene ArcticExpress^TM系统含有大肠杆菌感受态细胞，其带有嗜冷伴侣蛋白Cpn10和Cpn60。这些是分离自嗜冷生物体Oleispira antarctica的伴侣蛋白。Cpn10和Cpn60分别与大肠杆菌伴侣蛋白GroEL和GroES显示了高序列相似性，在4-12℃具有高蛋白折叠活性。ArcticExpress^TM宿主细胞来源于大肠杆菌BL21菌株。不仅这些细胞缺乏Lon蛋白酶，它们还被工程化以在OmpT蛋白酶中也是缺陷的。

转化方案

质粒SEQ ID NO：893/pMET1a(实施例16所述)根据厂家方案转化到化学感受态ArcticExpress^TM(DE3)细胞(目录#230192)。转化的细胞在0.5mL SOC培养基中在37℃恢复1小时，铺板在含有100mg/L氨苄青霉素的LB平板上。平板在37℃下孵育过夜，然后在4℃保存。

表达方案

来自转化平板的菌落用于接种含有100mg/L氨苄青霉素和10mg/L庆大霉素的5mL 2xYT培养基，在30℃孵育过夜。含有溶液1-6、100mg/L氨苄青霉素和12mg/L庆大霉素的Novagen Overnight Express^TMAutoinductionSystem 2(EMD Biosciences/Novagen catalog #71366)的烧瓶使用过夜培养物接种。在30℃孵育6小时之后，Overnight Express^TM培养物移动到15℃或20℃或25℃孵化器中。继续孵育直到培养物的600nm的OD达到6或更大。细胞通过离心收获，用冷的50mM EPPS pH 8.4洗涤，细胞沉淀在-80℃冷冻。

细胞提取物通过向细胞添加5mL每g细胞沉淀的BugBuster^R(无伯胺的)Extraction Reagent(EMD Biosciences/Novagen目录#70923)和5μL/mL Protease Inhibitor Cocktail II(EMD Bioscience/Calbiochem catalog #539132)、1μl/mL Benzonase核酸酶(EMD Biosciences/Novagen目录#70746)和0.033μl/mL r-Lysozyme^TM溶液(EMD Biosciences/Novagen目录#71110)来制备。细胞悬浮液在室温下柔和混合地孵育15分钟；在14,000rpm旋转20分钟(4℃)，小心地取出上清。利用Pierce BCA蛋白质分析试剂盒(Pierce目录#23225)和牛血清白蛋白作为标准物和微量滴定板形式测定总蛋白浓度。根据厂家方案使用稀释到1mg/mL的细胞提取物溶液使用Bio-Rad Experion Pro260 Automated Electrophoresis Station分析D-氨基转移酶的表达。

电泳结果显示，当与没有伴侣蛋白的表达比较时或当与实施例16所述的大肠杆菌GroEL-GroES伴侣蛋白共表达时，ArcticExpress^TM系统显著地提高了SEQ ID NO：894多肽的可溶表达。可溶表达在较低温度下更高，但在25℃仍然是非常高的。

活性分析方案：

ArcticExpress^TM系统中表达的SEQ ID NO：894多肽的酶活性通过根据实施例6所述在存在醛缩酶的情况下的monatin形成来测试。每个分析试管含有以下(在总共2mL中)：细胞提取物中的0.010mg/mL醛缩酶(假定20％可溶表达)；细胞提取物中的1.0或2.0mg/mL SEQ ID NO：894多肽(对于含有SEQ ID NO：894多肽的提取物假定50％的可溶表达)或纯化的球形芽孢杆菌D-氨基转移酶；0.01％ Tween-80；200mM丙酮酸钠；100mM D-色氨酸；100mM EPPS，pH 8.2)；1mM MgCl₂；0.05mM PLP；和10mM磷酸钾。

反应在Coy Laboratory Products，Inc.厌氧室中在室温下孵育以最小化对氧的暴露。除了酶之外的所有成分混合在一起(色氨酸没有完全地溶解直到添加酶之后至少1小时)。反应通过添加酶来启动。在1、4、7和22小时回收样品。还进行了利用1或2mg/mL纯化的球形芽孢杆菌D-氨基转移酶的对照反应。底物和产物的浓度如实施例3所述测量。结果在表34中示出。在22小时，当SEQ ID NO：894多肽以1mg/mL存在时monatin的浓度是8.2mM，在2mg/mL DAT多肽下是10.5mM。当球形芽孢杆菌酶以1mg/mL添加时，在22h的monatin的浓度是10.7mg/mL；在2mg/mL时，monatin浓度是14.5mM。两种酶和酶浓度的产物的立体纯度(通过实施例3所述FDAA衍生方案测定)是＞98％ R，R。当使用SEQ ID NO：894多肽时(当与任一酶浓度下的含有球形芽孢杆菌酶的分析样品比较时＜1/3的浓度)副产物HMG的浓度显著更低。HMG浓度通过比较OPA衍生的样品的峰面积来评估。

表34.monatin形成(mM)

多肽(SEQ ID NO)	1h	4h	7h	22h
					894 DAT(1mg/mL)	0.9	2.3	3.6	8.3
894 DAT(2mg/mL)	1.4	3.7	6.3	10.5
					球形芽孢杆菌DAT(1mg/1mL)	1.0	4.2	6.1	10.7
球形芽孢杆菌DAT(2mg/1mL)	1.5	6.7	8.2	14.5

实施例18——使用Stratagene ArcticExpress ^TM 系统提高DAT的可溶表达转化方案：

质粒SEQ ID NO：891/pET30a(编码SEQ ID NO：892多肽)、SEQ ID NO：873/pET30a(编码SEQ ID NO：874多肽)和pET30a中的拜氏梭状芽孢杆菌DAT(CbDAT)根据厂家方案转化化学感受态Stratagene ArcticExpress^TM(DE3)细胞(目录#230192)。这些基因的克隆如实施例4所述，分析结果在实施例9中。转化的细胞在0.5mL的SOC培养基中在37℃恢复1小时，铺板在含有100mg/L氨苄青霉素和13mg/L庆大霉素的LB平板上。平板在室温下孵育2天，然后保存在4℃。

表达方案：

来自转化恢复平板的菌落用于接种含有50mg/L卡那霉素和13mg/L庆大霉素的5mL 2xYT培养基；液体培养物在30℃孵育6小时。含有溶液1-6、100mg/L氨苄青霉素和13mg/L庆大霉素的Novagen Overnight Express^TM AutoinductionSystem 2(EMD Biosciences/Novagen catalog #71366)的烧瓶从5mL培养物接种。在30℃孵育5-6小时之后，培养物移动到15℃孵化器。继续15℃孵育直到培养物的OD₆₀₀达到6或更大。通过离心收获细胞，用冷的50mM EPPS、pH 8.4洗涤，然后细胞沉淀在-80℃冷冻。

细胞提取物通过向细胞添加5mL每g细胞沉淀的BugBusterR(无伯胺的)Extraction Reagent(EMD Biosciences/Novagen目录#70923)和5μL/mL Protease Inhibitor Cocktail II(EMD Bioscience/Calbiochem catalog #539132)、1μl/mL Benzonase核酸酶(EMD Biosciences/Novagen目录#70746)和0.033μl/mL r-Lysozyme^TM溶液(EMD Biosciences/Novagen目录#71110)来制备。细胞悬浮液在室温下柔和混合孵育15分钟；在14,000rpm旋转20分钟(4℃)，小心地取出上清。利用Pierce BCA蛋白质分析试剂盒(Pierce目录#23225)和牛血清白蛋白作为标准物和微量滴定板形式测定总蛋白浓度。根据厂家方案使用稀释到1mg/mL的细胞提取物溶液使用Bio-Rad Experion Pro260 Automated Electrophoresis Station分析DAT的表达。结果在表35和36中示出。

电泳结果显示，与利用ArcticExpress^TM系统的SEQ ID NO：892多肽相比，SEQ ID NO：874多肽稍微更好地以可溶形式表达。CbDAT的可溶表达根据转化平板中挑选的菌落而变化。利用ArcticExpress^TM系统以可溶形式表达的这些DAT多肽以及实施例16中描述的SEQ ID NO：894多肽都没有被表达。

表35

表36

活性分析方案

ArcticExpress^TM系统中表达的DAT多肽的酶活性通过根据实施例6所述在存在醛缩酶的情况下的monatin形成来测试。每个分析试管含有以下(总共3mL)：细胞提取物中的0.050mg/mL醛缩酶(估计20％可溶表达)；细胞提取物中的0.5mg/mL DAT多肽(根据Experion数据估计可溶表达)或纯化的球形芽孢杆菌DAT；0.01％ Tween-80；200mM丙酮酸钠；100mMD-色氨酸；50mM EPPS，pH 8.2；1mM MgCl₂；0.05mM PLP；和10mM磷酸钾。

反应在Coy Laboratory Products，Inc.厌氧室中在室温下孵育以最小化对氧的暴露。除了酶之外的所有成分混合在一起(色氨酸没有完全地溶解直到添加酶之后至少1小时)。反应通过添加酶来启动。在2、4.5、9和24小时回收样品。还运行了使用纯化的球形芽孢杆菌D-氨基转移酶的对照反应。底物和产物的浓度如实施例3所述测量。在24h，含有SEQ ID NO：892或894多肽的分析产生了与对照球形芽孢杆菌DAT反应大约相同的monatin效价。拜氏梭状芽孢杆菌DAT反应生产了低于monatin产物的八分之一，而SEQ ID NO：874多肽产生了约一半。对于SEQ ID NO：892多肽，在24h时产物的立体纯度(通过实施例3中的FDAA衍生方案测定)是96％ R，Rmonatin或更高。对SEQ ID NO：892、SEQ ID NO：894和球形芽孢杆菌DAT多肽的反应测量副产物HMG(4-羟基-4-甲基谷氨酸)的浓度。与另外两个相比(含有球形芽孢杆菌DAT的分析生产约20％，SEQ ID NO：892多肽的分析产生的是约40％)，使用具有SEQ ID NO：894所示序列的多肽的分析产生了少得多的HMG副产物。HMG浓度通过比较OPA柱后衍生的样品的峰面积来估计。

表37.monatin形成(mM)

多肽(SEQ ID NO)	2h	4.5h	9h	24h
					拜氏梭状芽孢杆菌DAT	0.3	0.7	0.8	0.9
874 DAT	1.8	3.2	4.1	4.4
					892 DAT	1.6	3.7	5.4	8.4
894 DAT	1.4	2.8	4.5	8.4

球形芽孢杆菌DAT

1.2

2.9

4.3

8.1

这些结果表明，当在合适的条件下表达时，具有SEQ ID NO：892和894序列的多肽可以在反应中用来产生与阳性对照酶一样高效价的高纯R，R monatin。

实施例19——可选择的表达宿主的进化以提高DAT的可溶表达

由于当核酸在BL21(DE3)中表达时SEQ ID NO：894多肽的可溶表达是低的，关于改善可溶表达，评估了可选择的表达宿主。OverExpress^TM C41(DE3)和C43(DE3)宿主含有为赋予毒性耐受性的表型上选择的遗传突变并以比其他大肠杆菌宿主更高效价表达某些毒性蛋白。

转化方案

质粒SEQ ID NO：893/pET30a根据厂家方案利用Bio-Rad Gene Pulsar II系统转化到OverExpress^TM C41(DE3)和C43(DE3)(分别为Lucigen目录#60341和60345)的电感受态细胞中。转化混合物在37℃在1mL SOC培养基中恢复1小时，铺板在含有50mg/L卡那霉素的LB平板上。平板在37℃孵育过夜。多个菌落贴到新鲜的平板上，利用集落PCR分析合适的插入序列大小。细胞的小的等份悬浮在0.025mL H₂O中，在95℃孵育10分钟。在冷却之后，2μL每种悬浮液用作0.025mL反应中的模板，各自还含有0.5μLT7启动子引物(0.1mM)、0.5μl T7终止子引物(0.1mM)、0.5μL PCR核苷酸混合物(Roche #12526720；每种核苷酸10mM)、2.5μL Roche Expand DNA聚合酶缓冲液#2，和0.5μL Expand DNA聚合酶(Roche Expand High FidelityPCR System目录#1732650)。3步骤热循环仪程序运行25-30个循环：94℃1分钟；54℃ 1分钟，72℃ 1.3分钟，和在72℃ 7分钟的最终抛光步骤。

表达研究

含有溶液1-6和50mg/L卡那霉素的Novagen Overnight Express^TM AutoinductionSystem 2(EMD Biosciences/Novagen catalog #71366)的烧瓶(每个烧瓶40mL)从转化的C41(DE3)和C43(DE3)细胞的小片平板接种(每个转化2个小片)。细胞在30℃孵育过夜，当OD₆₀₀达到6或更大时通过离心收获。细胞用冷的缓冲液洗涤，再次离心，立即使用或在-80℃冷冻。

细胞提取物通过向细胞添加5mL每g细胞沉淀的BugBuster^R(无伯胺的)Extraction Reagent(EMD Biosciences/Novagen目录#70923)和5μL/mL Protease Inhibitor Cocktail II(EMD Bioscience/Calbiochem catalog #539132)、1μl/mL Benzonase^R核酸酶(EMD Biosciences/Novagen目录#70746)和0.033μl/mL r-Lysozyme^TM溶液(EMD Biosciences/Novagen目录#71110)来制备。细胞悬浮液在室温下柔和混合地孵育15分钟，在14,000rpm旋转20分钟(4℃)，小心地取出上清。利用Pierce BCA蛋白质分析试剂盒(Pierce目录#23225)和牛血清白蛋白作为标准物和微量滴定板形式测定总蛋白浓度。DAT多肽的表达通过利用Bio-Rad Ready Gel^R Precast 4-15％聚丙烯酰胺梯度凝胶(Bio-Rad Laboratories目录#161-1104)的SDS-PAGE分析。BioRad SDS-PAGE低范围标准物(目录#161-0304)作为每个凝胶上的标准物来运行。细胞提取物(15μg蛋白质)的等份与含有2％ SDS、10％甘油、12.5％ 2-巯基乙醇、0.1％溴酚蓝和62.5mM Tris-HCl(pH 8)的蛋白质加样缓冲液混合，在95℃孵育5分钟，冷却，加样到凝胶上。此外，对所述转化体分析了组合的可溶和不溶蛋白表达(总蛋白)。离心之前的每种细胞悬浮液的10μl等份在90μl蛋白质加样缓冲液中稀释，在95℃孵育10分钟，冷却。10μl每种冷却的溶液加样到凝胶上。

电泳凝胶显示与在C43(DE3)宿主中相比，在C41(DE3)宿主中蛋白质表达更好，然而与使用BL21(DE3)细胞时相比明显可溶的表达没有更高。

实施例20——低温表达以提高DAT可溶表达的评估

由于当基因在大肠杆菌菌株BL21(DE3)中表达时SEQ ID NO：894 D-氨基转移酶的可溶表达是低的(参见实施例8)，基因被插入到具有冷休克蛋白A启动子的载体中来评估低温表达。

Takara pCold表达载体是四种不同的载体，其利用冷休克蛋白A(cspA)启动子用于在大肠杆菌中高纯度、高产量重组蛋白质的表达。这些载体在低温(15℃)选择性诱导靶蛋白合成，此时其他蛋白的合成被抑制，蛋白酶活性降低。除了cspA启动子之外，所有四种载体含有lac操纵子(用于表达控制)、氨苄青霉素抗性基因(amp^r)、ColE1复制起点、M13 IG片段和多克隆位点(MCS)。三种载体还含有翻译增强元件(TEE)、His标签序列和/或因子Xa裂解位点。

克隆方案

来自质粒SEQ ID NO：893/pET30a的SEQ ID NO：893 DAT核酸(编码具有SEQ ID NO：894序列的多肽)在pCOLDII(含有TEE和His标签序列)、pCOLDIII(含有TEE)和pCOLDIV载体的NdeI和XhoI位点亚克隆到Takara pCold载体中。根据厂家方案，消化的载体和插入序列条带利用QIAquick Gel提取试剂盒(Qiagen目录#28704)凝胶纯化，利用Roche Rapid DNA连接试剂盒(目录#1635379)连接。连接混合物通过在42℃热激转化Invitrogen OneShot TOP10化学感受态细胞(目录#C404003)。在500μL SOC培养基中在37℃恢复1h之后，转化混合物铺板在含有100mg/L氨苄青霉素的LB平板上，在37℃孵育过夜。从转化平板挑取菌落用于接种含有100mg/mL氨苄青霉素的5mL的LB培养物，在37℃孵育过夜。质粒DNA利用QIAprep^R Spin Miniprep试剂盒(Qiagen目录#27104)从5mL培养物纯化。插入序列用NdeI和XhoI限制消化通过测序(Agencourt Bioscience Corp，Beverly，MA)验证。

SEQ ID NO：894dat pCOLD质粒根据厂家方案转化到化学感受态的Stratagene ArcticExpress^TM(DE3)细胞和Novagen BL21(DE3)细胞中。转化混合物在0.5-1mL SOC培养基中在37℃恢复1h，铺板在含有100mg/mL氨苄青霉素以及13mg/L庆大霉素(ArcticExpress^TM(DE3))或100mg/mL氨苄青霉素(BL21(DE3))的LB平板上。平板在37℃孵育过夜。

表达研究

含有溶液1-6和100mg/L氨苄青霉素和13mg/L庆大霉素(ArcticExpress^TM(DE3))或100mg/mL氨苄青霉素(BL21(DE3)的Novagen Overnight Express^TM AutoinductionSystem 2(EMD Biosciences/Novagen catalog #71366)的烧瓶从转化的细胞的小片平板接种(SEQ ID NO：893/pCOLDII、SEQ ID NO：893/pCOLDIII和SEQ ID NO：893/pCOLDIV转化体每个2小片)。

在30℃孵育3-5小时之后，培养物移动到15℃孵化器。继续15℃孵育直到培养物600nm的OD达到6或更大。通过离心收获细胞，用冷的缓冲液洗涤，然后细胞沉淀在-80℃冷冻。

细胞提取物通过向细胞添加5mL每g细胞沉淀的BugBuster^R(无伯胺的)Extraction Reagent(EMD Biosciences/Novagen目录#70923)和5μL/mL Protease Inhibitor Cocktail II(EMD Bioscience/Calbiochem catalog #539132)、1μl/mL Benzonase^R核酸酶(EMD Biosciences/Novagen目录#70746)和0.033μl/mL r-Lysozyme^TM溶液(EMD Biosciences/Novagen目录#71110)来制备。细胞悬浮液在室温下柔和混合孵育15分钟；在14,000rpm旋转20分钟(4℃)，小心地取出上清。利用Pierce BCA蛋白质分析试剂盒(Pierce目录#23225)和牛血清白蛋白作为标准物和微量滴定板形式测定总蛋白浓度。根据厂家方案使用稀释到1mg/mL的细胞提取物溶液使用Bio-Rad Experion^TM Pro260 Automated Electrophoresis Station分析D-氨基转移酶的表达。结果在表38和39中示出。

表38

泳道	样品	估计的DAT表达％
			L	Pro260 Ladder
1	BL21(DE3)：：SEQ ID NO：893/pCOLDII#1	8.7
			2	BL21(DE3)：：SEQ ID NO：893/pCOLDII#2	8.5
3	ArcticExpressiM(DE3)：：SEQ ID NO：893/pCOLDII#1	9.8
			4	ArcticExpressIM(DE3)：：SEQ ID NO：893/pCOLDII#2	6.4

表39

泳道	样品	估计的DAT表达％
			L	Pro260 Ladder
1	BL21(DE3)：：SEQ ID NO：893/pCOLDIII#1	4.3
			2	BL21(DE3)：：SEQ ID NO：893/pCOLDIII#2	2.3
3	BL21(DE3)：：SEQ ID NO：893/pCOLDIV#1	14.6
			4	BL21(DE3)：：SEQ ID NO：893/pCOLDIV#2	14.2
5	BL21(DE3)：：SEQ ID NO：893/pCOLDIII#1	4.4

6	BL21(DE3)：：SEQ ID NO：893/pCOLDIII#2	5.2
			7	BL21(DE3)：：SEQ ID NO：893/pCOLDIV#1	13.8
8	BL21(DE3)：：SEQ ID NO：893/pCOLDIV#2	16.1
			9	BL21(DE3)：：SEQ ID NO：893/pCOLDIV#1	16.2
10	BL21(DE3)：：SEQ ID NO：893/pCOLDIV#2	16.8

Experion Pro260结果显示当核酸掺入pCOLDIV载体中时，与在pCOLDII或pCOLDIII载体中相比，SEQ ID NO：894 DAT蛋白表达得更好。根据上述实验，SEQ ID NO：893/pCOLDII的平均表达水平是约8％，不考虑使用的表达宿主；SEQ ID NO：893/pCOLDIII的平均表达水平是约4％，而SEQ ID NO：893/pCOLDIV的平均表达水平是～15％。这些表达水平显著地低于在实施例16中当SEQ ID NO：893核酸与GroEL-GroES伴侣蛋白共表达时和在实施例17中当核酸在Stratagene ArcticExpress^TM系统中表达时所述的。

实施例21——DAT的密码子修饰

根据一种假设进行了改善在大肠杆菌中表达的SEQ ID NO：894多肽的溶解度的尝试，所述假设是减慢大肠杆菌中翻译速率将容许更多时间用于SEQ ID NO：894多肽的适当折叠，从而得到更高的可溶蛋白质表达。SEQ ID NO：894多肽序列的BLAST检索(NCBI)显示一些最紧密相关的公众序列是来自梭状芽孢杆菌(Clostridium)物种，特别是拜氏梭状芽孢杆菌。实施例9描述了克隆、表达和分析CbDAT的结果以及它在monatin形成反应中的用途。具体地，表达在总蛋白级分中高，但是在可溶蛋白质级分中非常低。

比较了拜氏梭状芽孢杆菌和大肠杆菌K12的密码子利用率表。在拜氏梭状芽孢杆菌中几种罕有使用的密码子被发现在大肠杆菌K12中是高丰度的(表40)。可能这些稀有密码子导致拜氏梭状芽孢杆菌中的翻译停顿，而在大肠杆菌K12宿主中，可能没有停顿。在SEQ ID NO：894序列中，鉴定了4个双联体，其中拜氏梭状芽孢杆菌的串联稀有密码子在大肠杆菌K12中变成“非稀有的”(即丰富的)。目标是利用大肠杆菌K12密码子利用率表将这些密码子改变成用于在大肠杆菌K12宿主中表达的稀有密码子。设计引物来改变这些双联体。SEQ ID NO：893/pET30a(如实施例4描述的)被用作模板，根据Stratagene QuickChange试剂盒说明书进行突变。用来修饰SEQ ID NO：893核酸序列的引物显示如下，以及天然基因(靶向的双联体序列是下划线的)。

表40.

SEQ ID NO：893天然序列

ATGGACGCACTGGGATATTACAACGGAAAATGGGGGCCTCTGGACGAGATGACCGTGCCGATGAACGACAGGGGTTGTTTCTTTGGGGACGGAGTGTACGACGCTACCATCGCCGCTAACGGAGTGATCTTTGCCCTGGACGAGCACATTGACCGGTTTTTAAACAGCGCAAAGCTCCTGGAAATAGAAATCGGTTTTACAAAAGAGGAATTAAAAAAAACTTTTTTTGAAATGCACTCCAAAGTGGATAAAGGGGTGTACATGGTTTATTGGCAGGCGACTCGCGGAACAGGCCGTCGAAGCCATGTATTTCCGGCAGGTCCCTCAAATCTCTGGATTATGATTAAGCCCAATCACGTCGACGATCTTTATAGAAAAATCAAGCTCATTACCATGGAAGATACCCGCTTCCTCCACTGCAACATCAAGACCCTTAACCTTATTCCCAATGTCATTGCCTCCCAGCGGGCGCTGGAAGCGGGCTGCCACGAGGCGGTCTTTCACCGGGGTGAAACAGTAACCGAGTGCGCCCACAGCAATGTCCACATCATTAAAAACGGCAGGTTTATCACCCACCAGGCGGACAACCTAATCCTTCGGGGCATAGCCCGTAGCCATTTATTGCAAGCCTGTATCAGGCTGAACATTCCATTTGACGAACGGGAATTTACCCTTTCGGAATTATTTGACGCGGATGAGATTCTTGTGTCCAGCAGCGGCACACTCGGCCTTAGCGCCAATACAATTGATGGAAAAAACGTGGGGGGAAAAGCGCCGGAACTGCTAAAAAAAATTCAGGGCGAAGTGTTGAGGGAATTTATCGAAGCGACAGGCTACACGCCTGAGTGGAGCACAGTATAG

双联体1突变体的引物

CTAACGGAGTGATCTTTGCTCTAGACGAGCACATTGAC (SEQ ID NO：1074)

GTCAATGTGCTCGTCTAGAGCAAAGATCACTCCGTTAG (SEQ ID NO：1075)

双联体2突变体的引物

CATGGAAGATACACGATTCCTCCACTGCAACATCAAGAC (SEQ ID NO：1076)

GTCTTGATGTTGCAGTGGAGGAATCGTGTATCTTCCATG (SEQ ID NO：1077)

双联体3突变体的引物

ATTGCCTCCCAGCGGGCTCTAGAAGCGGGCTGCCACG (SEQ ID NO：1078)

CGTGGCAGCCCGCTTCTAGAGCCCGCTGGGAGGCAAT (SEQ ID NO：1079)

双联体4突变体的引物

GGGGGGAAAAGCTCCCGAACTGCTAAAAAAAATTCAGG (SEQ ID NO：1080)

CCTGAATTTTTTTTAGCAGGTCGGGAGCTTTTCCCCCC (SEQ ID NO：1081)

具有正确改变的序列的克隆转化到BL21(DE3)宿主中用于酶表达分析。通过在Overnight Express II中生长细胞过夜和用BugBuster试剂裂解细胞之后通过对粗制细胞提取物和可溶蛋白质的SDS PAGE分析测定酶表达。

看起来随着密码子改变为双联体1、2和3，可溶蛋白质表达方面存在轻微改进。双联体4的密码子改变对可溶蛋白质表达没有益处。双联体1、2和3的密码子改变利用Stratagene QuickChange试剂盒和设计用于起始密码子改变的引物来成对组合。具有正确改变的序列的克隆转化到BL21(DE3)宿主中用于酶表达分析。通过在Overnight Express II中生长细胞过夜和用BugBuster试剂裂解细胞之后通过对粗制细胞提取物和可溶蛋白质的SDS PAGE分析测定酶表达。双联体1和2、2和3以及1和3的突变组合产生了在SDS-PAGE凝胶上可见的可溶蛋白条带。然而，仍然看起来有更多的蛋白质在总蛋白级分中。

实施例22——DAT多肽周质表达的评估

由于当基因产物在大肠杆菌宿主BL21(DE3)中表达为细胞质蛋白时SEQ ID NO：894多肽的可溶表达是低的(参见实施例8)，基因被克隆到载体中来产生将被输出到周质间隙中的融合蛋白。周质提供了促进适当折叠和二硫键形成的条件，可以增强某些靶蛋白的溶解度和活性。

克隆到EMD Biosciences/Novagen pET26b中容许具有周质信号序列的靶蛋白产生。信号序列伴随着输出由信号肽酶裂解。EMD Biosciences/Novagen pET39b和pET40b被设计用于与208氨基酸DsbA-Tag^TM或236氨基酸DsbC-Tag^TM融合的靶蛋白的克隆和表达。DsbA和DsbC是分别催化二硫键形成和异构化的周质酶。融合蛋白一般被定位在周质中。

克隆方案

来自质粒SEQ ID NO：893/pET30a(实施例4中描述的)的SEQ ID NO：893核酸在载体EcoRI和NotI位点克隆到EMD Biosciences/Novagen pET26b(目录#69862-3)、pET39b(目录#70090-3)和pET40b(目录#70091-3)载体中。具有5′EcoRI位点和3′NotI位点的DAT核酸利用实施例4所述的扩增方案和以下引物产生：

5’-CGCAGAATTCGGACGCACTGGGATATTACAAC-3’(SEQ ID NO：1082)

5’-GTTAGCGGCCGCCTATACTGTGCTCCACTCAG-3’(SEQ ID NO：1083)

在引物序列中限制性位点是斜体的。产生的DNA产物和pET26b、pET39b和pET40b载体用EcoRI和NotI(New England Biolabs)根据厂家建议的方案消化。载体反应混合物随后用Shrimp碱性磷酸酶(Roche目录#1758250)处理。根据厂家方案，消化的载体和插入序列条带利用Qiagen QIAquick^R Gel提取试剂盒(Qiagen目录#28704)从1％琼脂糖凝胶凝胶纯化，利用Roche Rapid连接试剂盒(目录#1635379)连接。连接混合物通过在42℃热激来转化Invitrogen OneShot^R TOP10化学感受态细胞(目录#C404003)。在500μL SOC培养基中在37℃恢复1h之后，转化混合物铺板在含有50mg/L卡那霉素的LB平板上，在37℃孵育过夜。从转化平板中挑取菌落用于接种含有50mg/mL卡那霉素的5mL LB培养物，在37℃孵育过夜。利用Qiagen QIAprep Spin Miniprep试剂盒(目录#27104)从5mL培养物纯化质粒DNA。核酸序列通过测序来验证(Agencourt Bioscience Corp，Beverly，MA)。具有正确插入序列的质粒如上述通过热激转化EMD Biosciences/Novagen BL21(DE3)化学感受态细胞(目录#69450)。

表达研究

含有溶液1-6和50mg/L卡那霉素的Novagen Overnight Express^TM AutoinductionSystem 2(EMD Biosciences/Novagen catalog #71366)的烧瓶(每个烧瓶中50mL)从带有pET26b、pET39b或pET40b中的SEQ ID NO：893 DAT核酸(编码SEQ ID NO：894的多肽)的BL21(DE3)细胞的新鲜平板接种。细胞在30℃孵育过夜，当OD₆₀₀达到6或更高时通过离心收获。细胞用冷的缓冲液洗涤，再次离心，立即使用或细胞沉淀在-80℃冷冻。在收获之前，2mL培养物等份从每个烧瓶中取出，用于可溶和总蛋白(可溶和不溶)表达分析。如实施例16所述制备细胞提取物。总蛋白样品通过在含有2％ SDS、10％甘油、12.5％ 2-巯基乙醇、0.1％溴酚蓝和62.5mMTris-HCl、pH 8的蛋白加样缓冲液中悬浮少量细胞沉淀并在95℃孵育10分钟来制备。

周质细胞级分根据EMD Biosciences/Novagen pET System Manual中描述的方案从每种培养物的细胞剩余部分制备。产生的级分利用Amicon Ultracel 10k离心过滤设备(Millipore目录#UFC901024)浓缩30倍。细胞提取物和周质级分的总蛋白浓度利用Pierce BCA蛋白质分析试剂盒(Pierce目录#23225)和牛血清白蛋白作为标准物以及微量滴定板形式来测定。细胞提取物的15μg蛋白样品和周质级分的10μg蛋白样品利用Bio-Rad Ready Gel^R Precast 4-15％聚丙烯酰胺梯度凝胶(Bio-Rad Laboratories目录#161-1104)通过SDS-PAGE分析。此外，总蛋白样品通过SDS-PAGE分析。BioRad SDS-PAGE低范围标准物(目录#161-0304)作为每个凝胶上的标准物来运行。

总蛋白SDS-PAGE凝胶的分析显示利用Overnight Express^TM AutoinductionSystem 2表达了具有预测分子量的蛋白质。然而，加载了细胞提取物级分或周质级分的SDS-PAGE凝胶的分析表明这些蛋白质既不可溶地表达也没有输出到周质中。

实施例23——从吲哚-3-丙酮酸酯产生monatin

当D-色氨酸和丙酮酸是在实施例5所述的monatin形成分析中的起始原材料时获得的monatin的最大浓度受到色氨酸溶解度的限制。为了探索在实现更高的monatin浓度方面利用醛缩酶和SEQ ID NO：220 DAT多肽(实施例14中描述的)的潜力，分析了以吲哚-3-丙酮酸(I3P)和丙酮酸作为原材料开始的反应。在这种情况下，还必需提供氨基供体例如D-丙氨酸或D-丙氨酸和D-色氨酸两者。

测试利用纯化的SEQ ID NO：220 DAT多肽(如实施例15所述产生和纯化)和醛缩酶(如实施例6所述)来进行。反应如下设置(总共1mL)：200mM吲哚-3-丙酮酸(I3P)；200mM丙酮酸钠；400mM D-丙氨酸；100mMEPPS，pH8.0；1mM MgCl₂；0.05mM PLP；和10mM磷酸钾。

两种酶过量添加以促进向monatin的转化，以最小化非酶促降解反应的竞争。反应在Coy Laboratory Products，Inc.厌氧室中在室温下孵育以最小化对氧的暴露。除了酶的所有成分混合在一起，pH值调节到8.0。反应通过添加酶(作为细胞提取物的0.04mg/mL醛缩酶(假定20％表达)和0.40mg/mL纯化的SEQ ID NO：220 DAT多肽)来启动。

在下表中标明的某些测试中，除了D-丙氨酸之外还以50或100mM添加D-色氨酸来作为氨基供体以及来限制D-色氨酸的形成中消耗的吲哚-3-丙酮酸的量。monatin形成利用实施例3所述的LC/MS/MS方法在18小时后测量，结果在下表41中示出。

表41.来自I3P的monatin形成(mM)

反应物初始浓度(mM)	monatin浓度(mM)
		200 I3P；200 pyr：400 D-ala	44.9

200 I3P；200 pyr：400 D-ala，50 D-trp	47.8
		200 I3P；200 pyr：400 D-ala，100 D-trp	61.0

如上所示，氨基转移酶和醛缩酶在更高反应物浓度下是有活性的，达到了高得多的monatin浓度。

在18h，当使用200mM吲哚-3-丙酮酸、200mM丙酮酸钠和100mM D-色氨酸时，monatin的浓度是61mM。对比仅使用400mM D-丙氨酸，添加50mM D-色氨酸在分析的条件下观察到monatin生产的小量提高(47.8mM)。

实施例24——同源性表

表42显示了一些最有活性的DAT多肽和来自公开的数据库或文献的相应最接近的同源物。

表42

如实施例9中所示，具有SEQ ID NO：866、946、220和176所示序列的多肽的同源物被克隆，在R，R monatin的生产方面也具有活性，尽管这些多肽之中的序列相同性在49％和63％之间。类似地，来自Oceanobacter物种的预测的D-丙氨酸转氨酶和Robinginitalea biformata氨基转移酶预计与SEQ ID NO：882和918序列的DAT多肽一样具有广泛D-氨基酸氨基转移酶活性。

附录I显示了表，描述了本发明的示范性核酸和多肽的所选的特征，包括示范性序列与公众数据库的序列相同性比较。举例来说以及为了进一步帮助理解附录I，第一行，标记为“SEQ ID NO：”，数字“1、2”代表了具有由例如SEQ ID NO：1编码的、SEQ ID NO：2所示序列的本发明的示范性多肽。附录I中描述的序列(本发明的示范性序列)已经经历了相对于两组数据库的BLAST检索(如此处所述)。第一个数据库组通过NCBI(National Center for Biotechnology Information)可获得。相对于这些数据库的检索结果在标题为“NR描述”、“NR登记号”、“NR E-值”或“NR生物体”的列中找到。“NR”是指NCBI所维护的非冗余核苷酸数据库。这个数据库是GenBank、GenBank updates和EMBL updates的组合。列“NR描述”中的项目是指任何给出的NCBI记录中的定义行，其包括了序列描述，例如来源有机体、基因名称/蛋白质名称或序列功能的一些描述。列“NR登记号”中的项目是指给与序列记录的唯一标识符。列“NR E-值”中的项目是指预期值(E-值)，其代表了与在询问序列(本发明序列)和那个特定数据库序列之间发现的比对分值几乎相等的比对分值将在所述BLAST检索的相同数目的比对中在随机序列之间被发现的可能性。“NR生物体”列中的项目是指鉴定为最接近BLAST命中的序列的来源生物体。

第二数据库组被共同地称为GENESEQ^TM数据库，其是可通过Thomson Derwent(Philadelphia，PA)获得的。针对这个数据库检索的结果在标题为“GENESEQ蛋白质描述”、“GENESEQ蛋白质登记号”、“E-值”、GENESEQ DNA描述”、“GENESEQ DNA登记号”或“E-值”的列中找到。这些列中找到的信息与在如上所述的NR列中找到的信息是可比较的，只是它来自于针对GENESEQ^TM数据库而不是NCBI数据库的BLAST检索。

此外，这个表包括列“预测的EC NO.”。EC编号是根据国际生物化学和分子生物学联合会(IUBMB)命名委员会酶委员会发展的标准化酶命名法方案分配给一类酶的编号。“预测的EC NO.”列中的结果通过针对Kegg (Kyoto Encyclopedia of Genes and Genomes)数据库的BLAST检索来确定。如果最高BLAST匹配具有等于或低于e-6的E-值，被分配给最高匹配的EC编号输入到表中。列“查询DNA长度”和“查询蛋白质长度”分别是指在针对NCBI或GENESEQ^TM数据库检索或查询的本发明序列中核苷酸数目或氨基酸数目。列“对象DNA长度”和“对象蛋白质长度”分别是指在来自BLAST检索的最佳匹配的序列中核苷酸数目或氨基酸数目。这些列中提供的结果是来自从NCBI数据库或GENESEQ^TM数据库返回了较低E-值的检索。列“％ID蛋白质”和“％ID DNA”是指本发明序列和最佳BLAST匹配序列之间序列相同性百分比。这些列中提供的结果是来自从NCBI数据库或GENESEQ^TM数据库返回了较低E-值的检索。

C部分

实施例25——GSSM ^SM 突变体的构建和测试

这个实施例描述了示范性核酸和多肽的构建，并描述了它们的酶活性。核苷酸序列(SEQ ID NO：219)被亚克隆到pSE420-C-His载体中，在大肠杆菌XL1-BLUE宿主(Stratagene，La Jolla，CA)中表达以产生具有SEQ ID NO：220所示氨基酸序列的示范性D-氨基转移酶(DAT)酶。pSE420-C-His载体通过向来自Invitrogen(Carlsbad，CA)的pSE420载体添加C-末端His标签来产生。构建体SEQ ID NO：220(在大肠杆菌XL1-BLUE中)被用作向其中引入修饰的起始序列，在此被称为野生型(WT)序列。第一轮修饰(即单残基突变)利用Gene Site Saturated Mutagenesis^SM(GSSM^SM)技术(参见例如美国专利No.6,171,820)来进行。利用GSSM^SM技术产生的突变体在大肠杆菌宿主XL1-BLUE中的pSE420-C-His载体中表达，排列到384孔平板中，在37℃生长过夜。样品传代培养，在30℃生长两晚(36-48小时)。培养物在-20℃冷冻，直到将制备细胞裂解物。

通过向每个孔添加10μL的BPER II(Thermo Scientific，Rockford，IL)来裂解细胞。样品混合三次，在冰上裂解一小时。然后在初步筛选中分析粗制裂解物。用50mM磷酸钠(pH 8)中的1mM R，R-monatin、25mM丙酮酸钠盐、0.08mM PLP在室温下分析25μL粗制裂解物。在三小时之后，采集等份，添加甲酸到2％的终浓度。样品用水稀释到标准曲线的范围内。利用实施例1所述的LC/MS/MS方法(用于检测D-丙氨酸或R，R-monatin的LC/MS/MS方法)分析样品的monatin消耗和丙氨酸形成。样品性能与野生型对照(即SEQ ID NO：220)的性能比较。

性能超过野生型对照的突变体被选择作为来自GSSM^SM初步筛选的命中。初步命中的甘油原液被用于接种新的384孔平板。如对初步筛选所标明的，命中一式四份排列，生长和裂解。然后在二次筛选中测试初步命中。二次筛选方法与初次筛选相同，只是用1mM和15mM R，R-monatin底物测试突变体。利用LC/MS/MS分析样品的monatin消耗和丙氨酸形成。样品性能与野生型对照的性能比较。

根据丙氨酸生产和monatin消耗利用计分系统评估样品性能。单个样品的最大分值是6。三点的最大值被分配给丙氨酸产生，三点的最大值被分配给monatin消耗。评分标准如下：1点被分配给在阳性对照的平均值和一个标准偏差之间的值，2点被分配给在阳性对照的一个和两个标准偏差之间的值；3点被分配给超过阳性对照的两个标准偏差的值。

突变体的最高可能总分是48(因为样品在1和15mM monatin下四份筛选)。一般，分值20点或更高的突变体被选择为二次命中。然而，对于分值低于20点的样品有某些例外。具有处在阈值要求边缘的丙氨酸形成和monatin消耗值的样品也被选择作为命中。这防止了命中的过早消去，容许在第三筛选中进一步测试和表征。

利用上述标准被鉴定为二次筛选命中的样品在表43中列出。二次命中从甘油原液中划线到含有100μg/mL羧苄青霉素的LB琼脂平板上，在37℃生长过夜。单个菌落用于接种含有羧苄青霉素(100μg/mL)的1mL LB。培养物在37℃生长过夜。从培养物分离DNA，然后利用3730XL自动化测序仪(Applied Biosystems，Foster City，CA)来制备和测序。

二次命中的突变和突变的氨基酸位置在下表43中列出。氨基酸位置的编号从N-末端甲硫氨酸开始。例如，列出的第一个突变“Y6L”是指将野生型酶(SEQ ID NO：220)的氨基酸位置6中的酪氨酸改变成亮氨酸。在核酸水平上，可以使用编码期望的(突变的)氨基酸的任何密码子。

在下表43、44和50中描述的所有氨基酸序列均是示范性的多肽；还提供了编码这样多肽的核酸序列。

实施例26——GSSM ^SM 突变列表

表43：鉴定为二次筛选命中的GSSM^SM突变体

27	V93G	118	K72M
				28	L46A	119	S205A
29	L46H	120	Q209S
				30	G98A	121	V212E
31	P20S	122	R213W
				32	V93A	123	I216T

33	V103T	124	P217H
				34	P108F	125	P217V
35	V93L	126	D219F
				36	S101S	127	E220V
37	A106G	128	R221E
				38	S101Q	129	F223C
39	P108T	130	S226P
				40	N118G	131	L228F
41	P108C	132	V234A
				42	I120L	133	S238S
43	A106W	134	V236T
				44	N118R	135	V236T
45	N110A；N118G	136	T241R
				46	N118A	137	L242F
47	N118R	138	T241R
				48	P117W；N118K	139	T241C
49	D133N	140	E248F
				50	K126Q	141	D250E
51	K126R	142	K257V
				52	K128S	143	G256K
53	I127M	144	E260G

54	T131T	145	L262R
				55	D133L	146	K263M
56	M132A	147	D267G
				57	D133E	148	D267R
58	L129V	149	I265L
				59	K126K	150	E268S
60	I130M	151	L270S
				61	M132Y	152	L270G
62	K128R	153	L270W
				63	M132R	154	R271S
64	L129I	155	I274W
				65	K128L；D2D(GAC→GAT)	156	G278S
66	F137W	157	Y279C
				67	I152V	158	S284R
68	N55L	159	E282G
				69	N150S	160	T280N
70	L138L	161	V286G
				71	P149P	162	R285F
72	G161G	163	V286R
				73	A165T	164	G240G
74	H163R	165	E61R

75	H163K	166	E61D
				76	HI 68A	167	E61Y
77	E171S	168	G85G
				78	E171R	169	G85D
79	E171R	170	S80R
				80	T172I	171	Y79R
81	C176G	172	Y79V
				82	A177S	173	W283V
83	A177S	174	W283E
				84	S80L；R156W	175	W283A
85	H182G	176	W283S
				86	N186S	177	W283G
87	K185R	178	W283A
				88	K185T	179	W283R
89	D2H	180	W283T
				90	D2T；E260G	181	P281W
91	D2Y	182^*	V236T；T241R

^*突变体182利用定点诱变，利用突变体136 DNA作为模板，然后导入V236T突变来产生。本领域技术人员可利用定点诱变技术合成这种基因。

表43中列出的样品然后准备三次筛选。甘油原液用于接种含有100μg/mL羧苄青霉素的5mL LB。培养物在37℃生长过夜。过夜培养物用于接种250mL挡板烧瓶中含有100μg/mL羧苄青霉素的50mL的LB培养物至OD_600nm为0.05。当OD_600nm达到0.4-0.8时添加IPTG到1mM的终浓度。培养物在30℃诱导过夜。细胞沉淀通过在6,000rpm离心20分钟收获。细胞沉淀在-20℃冷冻，直到将制备细胞裂解物。细胞在冰上用BPER II(Thermo Scientific，Rockford，IL)裂解1小时。澄清的裂解物通过在12,000rpm离心30分钟制备。

根据厂家说明通过Bio-Rad Bradford Protein Assay(Bio-Rad，Hercules，CA)定量蛋白质。SDS-PAGE分析和密度测定法用于测定表达的D-氨基转移酶的量。对于表达的D-氨基转移酶，将样品标准化。在三次筛选中测试0.02mg/mL D-氨基转移酶。三次筛选方法与二次筛选方法相同，只是在0、5、10、15、30、60、120和210分钟采集样品来显示时间进程。丙氨酸生产和monatin消耗值通过LC/MS/MS分析测量并与标准曲线比较。样品与野生型对照比较。

与野生型对照相比具有更高最终效价或更快初始速率的样品被鉴定为命中，被称作高表达突变体(upmutant)。在三次筛选中鉴定的GSSM^SM高表达突变体在表44中列出。这些高表达突变体在以下实施例27中进一步描述。

实施例27——多肽高表达突变体的酶活性

这个实施例描述了数据，证明在此公开示范性高表达突变体多肽例如具有表44所述氨基酸序列的多肽的酶活性。表44显示了在利用1mM和15mM R，R-Monatin底物的反应中在15分钟时点相对于野生型对照的高表达突变体的活性。相对活性是样品产生的丙氨酸的量除以野生型对照产生的丙氨酸的量。

表44：三次筛选中GSSM高表达突变体的活性

135	V236T	3.44	2.88
				136	T241R	2.64	1.79
152	L270G	1.24	0.89
				153	L270W	2.00	1.54
174	W283E	1.23	0.84
				175	W283A	1.61	1.09
177	W283G	1.71	1.06
				6	Y6L	2.52	2.21
88	K185T	1.04	0.95

107

L66G

1.08

1.02

几个样品被鉴定出在测试的条件下性能超过野生型对照。鉴定了潜在的K_m和V_max高表达突变体。这些结果表明野生型对照(SEQ ID NO：220)可进一步进化，以提高对monatin的特异性D-氨基转移酶活性。

实施例28——monatin方法中GSSM ^SM 突变体的活性

pSE420-C-His中GSSM DAT的分析

这个实施例描述了证明在此公开的示范性多肽的酶活性的数据。突变体27、突变体44、突变体58、突变体119、突变体135、突变体136、突变体152、突变体154和野生型对照(如实施例25和26所述在大肠杆菌XL1-Blue中的载体pSE420-C-His中)在琼脂平板上划线，所述琼脂平板含有具有氨苄青霉素(100μg/mL)的LB培养基。单个菌落被用于接种含有氨苄青霉素(100μg/mL)的5mL LB培养基。500μl用于接种在250mL挡板烧瓶中的50mL相同培养基。细胞在30℃生长到大约0.4的OD_600nm。添加IPTG到1mM的终浓度。细胞在30℃生长4小时，通过离收集。细胞立即在-80℃冷冻，直到制备细胞提取物时。

如实施例4所述制备细胞提取物。使用BCA(Pierce，Rockford，1L)微量滴定板分析用BSA(Pierce Rockford，IL)作为标准物根据厂家说明测定蛋白质浓度。为了估计无细胞提取物中D-氨基转移酶的浓度，进行SDS-PAGE分析，使用目测来估计表达的百分比。作为总蛋白的百分比，DAT蛋白质在10-25％表达的范围内是可溶的，这用于计算分析的剂量。

在室温下在4mL反应中进行R，R monatin形成分析，其含有100mM EPPS缓冲液pH 7.8、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠、10mM磷酸钾、0.01％ Tween-80与0.1mg/mL醛缩酶和0.2mg/mL的DAT。突变体27使用0.15mg/mL的DAT酶而不是0.2mg/mL。在0.5、1、2、4和23小时之后，采集等份，甲酸添加到2％的终浓度，旋转样品并过滤。样品利用实施例36所述的LC/MS/MS方法分析monatin。结果在表45中示出。

表45：DAT的分析(克隆到pSE420-C-His中)

根据表45中的数据可见，通过GSSM^SM进化获得的许多DAT突变体显示了在分析条件下相对于野生型对照改善的monatin形成初始速率。

pMet1a中GSSM ^SM DAT的分析

这个实施例描述了证明在此公开的示范性多肽的酶活性的数据。突变体2、突变体6、突变体11、突变体27、突变体40、突变体44、突变体45、突变体58、突变体110、突变体135和突变体136利用QuikChange Multi Site-Directed Mutagenesis Kit(Stratagene，La Jolla，CA)根据厂家说明通过定点诱变来重新产生。为了产生突变体，实施例16所述的pMET1a标签化的构建体(pMET1a：SEQ ID NO：220(WT))用作模板。使用的诱变引物在下表46中列出。PCR片段用DpnI(Invitrogen，Carlsbad，CA)消化1小时，转化到大肠杆菌Top10细胞(Invitrogen，Carlsbad，CA)中。产生的纯化的质粒制品进行测序(Agencourt，Beverly，MA)来验证掺入了正确的突变。质粒然后转化到大肠杆菌B834(DE3)表达宿主(Novagen，San Diego，CA)中。

表46：用于诱变的引物

突变体2、突变体6、突变体27、突变体40、突变体45、突变体58、突变体110、突变体119、突变体131、突变体135、突变体136、突变体152、突变体154在pMET1a载体中产生，转化到实施例2所述的相容大肠杆菌表达宿主B834(DE3)(Novagen，San Diego，Ca)中。含有羧苄青霉素(100μg/mL)的LB培养基中的过夜培养物在100mL相同培养基中1∶100稀释，在500mL挡板烧瓶中生长。培养物在Overnight Express II培养基(溶液1-6，Novagen)中在30℃生长过夜到10的OD_600nm。总蛋白的样品在即将收获之前采集。细胞通过离心收获，用10mL磷酸钾缓冲液pH 7.8洗涤一次。细胞立即在-80℃冷冻，直到制备细胞提取物时。注意除了定点诱变之外，本领域技术人员可以利用多改变诱变PCR技术例如实施例25所述合成编码这些D-氨基转移酶的基因。

如实施例4所述利用100mM磷酸钾作为缓冲液洗脱和平衡PD10柱制备细胞提取物并脱盐。如所述测定总蛋白和DAT浓度。

用丙酮酸作为氨基接受体的R，R monatin的转氨基如实施例5所述进行，只是使用15mM R，R monatin。丙氨酸、monatin和monatin前体水平的初步分析将突变体40、突变体135和突变体136鉴定为产生最高水平的丙氨酸生产的优秀突变体，如表47所示。DAT突变体136看起来具有将R，R monatin转化为R-MP的最高活性。各个时点的丙氨酸生产数量(按mM)如表47中所示。

表47：克隆到pMET1a中的DAT的R，R monatin转氨基反应的丙氨酸形成(mM)

--：在当前条件下未测定

为了进一步评估活性，如实施例1所述用大约0.2mg/mL的DAT浓度进行monatin形成分析。作为对照，评估了纯化的野生型DAT的0.2mg/mL浓度。在0.5、1、2和4小时之后，采集等份，添加甲酸到2％的终浓度，旋转样品并过滤。利用此处描述的LC/MS/MS方法分析样品的monatin，利用实施例36所述的LC/OPA柱后荧光方法分析色氨酸和丙氨酸。

表48：pMET1a中的DAT的活性

突变体44	3.03	5.61	8.50	12.28
					突变体45	1.40	4.00	7.70	11.50
突变体58	3.83	7.23	11.33	14.12

突变体110	2.60	5.90	9.90	12.70
					突变体119	4.12	7.87	11.37	13.50
突变体131	3.75	7.41	11.40	13.90
					突变体135	6.39	10.65	13.49	13.15
突变体136	3.36	8.02	12.86	13.16
					突变体154	3.00	6.06	10.67	13.17

表48所示的所有DAT产生了monatin。DAT突变体，突变体58、突变体135和突变体136具有比野生型对照更快的初始速率。与野生型对照相比，突变体136对于反应一(D-Trp到I3P的转化)是更慢的，但是具有更好的总体monatin产生。

对于最后的时点，采集另外的等份(不添加甲酸)来利用实施例36所述的FDAA衍生化方法测定产生的monatin的立体异构化分布。对于测试的选定突变体，对立体纯度有很小的影响或没有影响。在所有情况下，突变体在测试分析条件下产生了超过98.8％的R，R。这些结果示于表49。

表49：选定突变体在4小时时产生的Monatin的立体纯度

DAT多肽	％SS	％RS	％RR	％SR
					野生型(pMet1a)对照	0.00	0.40	99.30	0.20
突变体6	0.00	0.40	99.50	0.10
					突变体27	0.00	0.80	98.80	0.30
突变体40	0.00	0.20	99.80	0.00
					突变体45	0.00	0.50	99.40	0.10
突变体110	0.10	0.40	99.30	0.10
					突变体135	0.00	0.40	99.50	0.10
突变体136	0.02	1.00	99.00	0.03

实施例29——定制的多位点组合组装(TMCA ^SM )突变体的构建和测试

这个实施例描述了示范性核酸和多肽的构建，并描述了它们的酶活性。选择GSSM突变的子集用于利用定制的(tailored)多位点组合组装(Tailored Multi-Site Combinatorial Assembly^SM，TMCA^SM)技术组合。来自GSSM进化、在1或15mM monatin反应中的前十个完成者被选择用于TMCA^SM进化。野生型序列(SEQ ID NO：220)作为3DAA-D氨基酸氨基转移酶的模型(图4)。图4中的模型以吡哆醛-5′-磷酸D-丙氨酸(pyridoxyl-5’-phosphate D-alanine)显示，编号的残基表明被选择用于TMCA^SM进化的那些位点。表50还列出了被选择包括在TMCA^SM文库中的突变。利用PCT国际申请NO.PCT/US08/071771所述方法对野生型(SEQ ID NO：220)和突变体45进行TMCA^SM进化。

TMCA进化在PCT申请号PCT/US08/071771中描述，包括产生在多个位点具有各种突变的不同组合的大量子代多核苷酸的方法。所述方法可以通过至少一或多个以下步骤的组合来部分地进行：

获得(“第一”或“模板”)多核苷酸的序列信息。例如，第一或模板序列可以是野生型(例如SEQ ID NO：220)或突变的(例如突变体45)序列。序列信息可以是完整的多核苷酸(例如基因或开放读框)或感兴趣的部分区域例如编码关于结合、结合特异性、催化或底物特异性的位点的序列。

沿着第一或模板多核苷酸序列鉴定三个或更多个感兴趣的突变。例如，突变可以在所述第一或模板序列中的3、4、5、6、8、10、12、20或更多个位置上。所述位置可以通过绝对位置或通过围绕残基的前后或同源性来预先确定。对于DAT多肽的TMCA，包括产生改善的酶性能的前10种密码子变化作为感兴趣的突变。在任一侧位于突变位置侧翼的序列可以是已知的。每个突变位置可以含有两个或更多个突变，例如对不同的氨基酸。这样的突变可以通过使用在此描述的和在美国专利NO.6,171,820；6,562,594；和6,764,835中描述的基因位点饱和诱变^SM(Gene Site Saturation Mutagenesis^SM，GSSM^SM)技术鉴定。

提供包含感兴趣突变的引物(例如合成的寡核苷酸)。在一个实施方案中，为感兴趣的每个突变提供引物。因而，具有感兴趣的3个突变的第一或模板多核苷酸可以在其位置上使用3个引物。引物也可以作为含有简并位置的引物库来提供，从而感兴趣的突变是任何核苷酸或天然发生的氨基酸的范围，或该范围的子集。例如，可以提供引物库，其有利于脂肪族氨基酸残基的突变。

引物可以正向或反向引物来制备，或引物可以至少一种正向引物和至少一种反向引物来制备。当突变紧密地位于一起时，方便的是使用含有超过一个位置的突变、或在多个位置上突变的不同组合的引物。

提供含有模板序列的多核苷酸。第一或模板多核苷酸可以是环形的，或可以是超螺旋的，例如用于克隆、测序或表达的质粒或载体。多核苷酸可以是单链的(“ssDNA”)，或可以是双链的(“dsDNA”)。例如，TCMA方法使得超螺旋(“sc”)dsDNA模板经历95℃的加热步骤1分钟(参见Levy，Nucleic Acid Res.，28(12)：e57(i-vii)(2000))。

将引物添加到反应混合物中的模板多核苷酸。引物和模板多核苷酸在容许引物与所述模板多核苷酸退火的条件下组合。在TMCA方案的一个实施方案中，引物被添加给单反应混合物中的多核苷酸，但是可以添加到多个反应中。

进行聚合酶延伸反应。延伸产物(例如“子代”或“修饰的延伸的多核苷酸”)可以通过常规手段扩增。产物可以分析长度、序列、期望的核酸性质，或作为多肽来表达。其他分析方法包括原位杂交、序列筛选或表达筛选。分析可以包括对期望性质的一或多轮的筛选和选择。

产物还可以转化到细胞或其他表达系统中，例如无细胞系统。无细胞系统可以含有与DNA复制、修复、重组、转录或翻译相关的酶。示范性的宿主包括细菌、酵母、植物和动物细胞和细胞系，包括大肠杆菌、荧光假单胞菌、巴斯德毕赤氏酵母和黑色曲霉(Aspergillus niger)。例如，大肠杆菌的XL1-Blue或Stb12菌株可以用作宿主。

本发明的方法可以在不同反应条件下用相同或不同引物来使用以得到具有不同组合或突变数目的产物。

通过进行如上述的示范性方法，这种方案还提供了通过这种TMCA进化方法产生的一或多种多核苷酸，其然后可以对期望的性质进行筛选或选择。子代多核苷酸的一或多种可以表达为多肽，以及任选地对期望的性质进行筛选或选择。因而，TMCA进化方案的这个实施方案提供了多核苷酸和编码的多肽，以及编码这样多肽的这样多核苷酸的文库。TMCA进化方案的这个实施方案进一步提供了通过筛选或选择所述文库来获得编码具有期望活性的一或多种多肽的一或多种多核苷酸的文库筛选。

在PCT/US08/071771中描述的TMCA进化方案的另一个实施方案包括产生多个修饰多核苷酸的方法。这样的方法一般包括(a)向单反应混合物中的双链模板多核苷酸添加至少三个引物，其中所述至少三个引物不重叠，以及其中所述至少三个引物的每一个包含与其他引物不同的至少一个突变，其中至少一个引物是可以与模板负链退火的正向引物，至少一个引物是可以与模板正链退火的反向引物，和(b)使反应混合物经历聚合酶延伸反应来从所述至少三个引物产生多种延伸的修饰多核苷酸。

PCT/US08/071771中描述的TMCA进化方案的另一个实施方案包括一种方法，其中细胞用多种延伸产物来转化，所述延伸产物没有用连接酶处理。在本发明的另一个实施方案中，所述多种延伸的修饰多核苷酸从细胞中回收。在另一个实施方案中，例如通过表达至少一个所述多种延伸的修饰多核苷酸和分析由此表达的多肽来分析回收的多种延伸的修饰多核苷酸。在另一个实施方案中，选择包含感兴趣突变的所述多种延伸的修饰多核苷酸。

在TMCA进化方案的另一个实施方案中，获得关于模板多核苷酸的序列信息，可以鉴定沿着模板多核苷酸的感兴趣的三个或更多个突变。在另一个实施方案中，通过聚合酶延伸获得的产物可以在将多种延伸的修饰产物转化到细胞中之前分析。

在TMCA进化方案的一个实施方案中，通过聚合酶延伸获得的产物用酶处理，例如限制性内切酶，例如DpnI限制性内切酶，从而破坏模板多核苷酸序列。处理的产物可以转化到细胞中，例如大肠杆菌细胞。

在TMCA进化方案的一个实施方案中，可以使用至少两个、或至少三个、或至少四个、或至少五个、或至少六个、或至少七个、或至少八个、或至少九个、或至少十个、或至少十一个、或至少十二个、或更多个引物。在一个实施方案中，每个引物包含单个点突变。在另一个实施方案中，两个正向或两个反向引物包含在模板多核苷酸上相同位置的不同改变。在另一个实施方案中，至少一种引物包含在模板多核苷酸上不同位置中的至少两个改变。在又一个实施方案中，至少一种引物包含在不同位置中的至少两个改变，至少两种正向引物或两种反向引物包含在模板多核苷酸上相同位置的不同改变。

在TMCA进化方案的一个实施方案中，正向引物被集中到正向组中，反向引物被集中到反向组中，正向组中的引物和反向组中的引物彼此独立，不考虑模板多核苷酸上的位置，在相应组中被标准化为等浓度，和其中在标准化之后，等量的正向和反向引物添加到反应中。在这种标准化方法中，某些位置的组合可能是偏爱的。所述偏爱可能是由于例如与含有多个引物的位置相比，在含有单个引物的一个位置处相对低的引物浓度。“位置偏爱”是指产生多核苷酸，其显示了相对于它的正向或反向引物组中的其他位置，在单个位置处引物的掺入的强偏爱性。这产生了修饰多核苷酸的组合，其可能在单个引物位置处具有高百分比的突变，但是在它的正向或反向引物组的其他位置处具有低百分比的突变。当TMCA的目标是产生包含对模板的所有可能改变的组合的子代多核苷酸时，这种偏爱是不利的。例如通过将引物标准化为在每个位置均是相等的库可以校正这种偏爱。

在TMCA进化方案的一个实施方案中，进行引物标准化，通过取决于引物在模板多核苷酸上的位置将引物组织到多个组中，其中覆盖了模板上相同的选择区域的引物处在一个组中；将每个组内被分组的引物标准化为相等浓度；将一个组内的正向引物集中到正向组中并将正向引物的每个组之间的浓度标准化为相等的；将一个组内的反向引物集中到反向组中并将反向引物的每个组之间的浓度标准化为相等的；以及将相等量的所述集中的正向和反向引物添加到反应中来进行。对于位置组合没有观察到偏爱。

在TMCA进化方案的一个实施方案中，提供了各自包含简并位置的一组简并引物，其中感兴趣的突变是在简并位置处的一系列不同核苷酸。在另一个实施方案中，提供了一组简并引物，其包含与模板多核苷酸的至少一个密码子相应的至少一个简并密码子，和与邻近于所述模板多核苷酸序列的密码子的序列同源的至少一个邻近序列。在另一个实施方案中，所述简并密码子是N，N，N，编码20种天然发生氨基酸的任一种。在另一个实施方案中，所述简并密码子编码少于20种天然发生的氨基酸。

在PCT/US08/071771中描述的TMCA进化方案的另一个实施方案包括产生包含感兴趣突变的多个修饰多核苷酸的方法。这样的方法一般包括(a)向单个反应混合物中的双链模板多核苷酸添加至少两个引物，其中所述至少两个引物不重叠，以及其中所述至少两个引物的每一个包含与其他引物不同的至少一个突变，其中至少一个引物是可以与模板负链退火的正向引物，至少一个引物是可以与模板正链退火的反向引物，(b)使所述反应混合物经历聚合酶延伸反应来从所述至少两个引物产生多种延伸的修饰多核苷酸，(c)用酶处理所述多种延伸的修饰多核苷酸，从而破坏所述模板多核苷酸，(d)将没有用连接酶处理的所述处理的延伸的修饰多核苷酸转化到细胞中，(e)从所述细胞回收所述多种延伸的修饰多核苷酸，和(f)选择含有感兴趣突变的所述多种延伸的修饰多核苷酸。

表50：TMCA进化的位点列表

突变	新密码子
		P20S	AGT
K73L	TTG
		T74V	GTG
V93G	GGT
		N110A	GCT

P117W	TGG
		N118G	GGG
N118A	GCG
		V236T	ACT
T241R	CGG
		L270W	TGG

使用实施例25中对GSSM进化描述的同样的方法生长、排列、分析和测序TMCA突变体。使用与实施例25所述相同的计分系统，将样品性能与来自GSSM进化的最佳候选物突变体135的性能相比较。表52列出了具有独特DNA序列的TMCA二次筛选命中(TMCA突变体用字母符号来命名，以将它们与GSSM突变体区分，GSSM突变体是数字命名的)。

表52：鉴定为二次筛选命中的TMCA突变体

利用实施例26中对GSSM进化描述的相同方法，生长，标准化和在三次筛选中分析表52中鉴定的样品。通过LC/MS/MS测定monatin和丙氨酸值并与标准曲线比较。样品性能与突变体135(来自GSSM进化的最好完成者)的活性相比较。在三次筛选中鉴定的TMCA高表达突变体在表53中列出。

实施例31——TMCA命中的活性

这个实施例描述了证明示范性多肽的酶活性的数据。下表53显示了在利用1mM和15mM R，R-Monatin底物的反应中在15分钟时点高表达突变体相对于突变体135的活性。相对活性是样品产生的丙氨酸量除以突变体135产生的丙氨酸量。

表53：三次筛选中TMCA高表达突变体的活性

鉴定了几个样品在测试条件下性能超过突变体135。鉴定了潜在的K_m和V_max高表达突变体。GSSM和TMCA进化的结果表明野生型SEQ ID NO：220是可以进一步进化的，以提高对monatin的特异性活性。

实施例32——pMET1a中TMCA突变体DAT的评估

这个实施例描述了证明在此公开的示范性多肽的酶活性的数据。突变体E、突变体G、突变体I、突变体M、突变体O、突变体P、突变体BB、突变体PP、突变体WW和突变体AAA(利用TMCA技术产生是DAT，参见实施例29和30)利用QuikChange Multi Site-Directed Mutagenesis Kit(Stratagene，La Jolla，CA)根据厂家说明通过定点诱变来重新产生。为了产生突变体，实施例16和实施例28中描述的pMET1a标签的构建体被用作模板。使用的诱变引物在下表54中列出。PCR片段用DpnI(Invitrogen，Carlsbad，CA)消化1小时，转化到大肠杆菌XL10-Gold细胞(Stratagene，La Jolla，CA)中。产生的纯化的质粒制品进行测序(Agencourt，Beverly，MA)来验证掺入了正确突变。质粒然后转化大肠杆菌B834(DE3)表达宿主(Novagen，San Diego，CA)。

表54：用于pMET1a载体中突变体的引物

表达羧基末端His标签的突变体110、突变体135、突变体136、突变体E、突变体G、突变体I、突变体M、突变体O、突变体P、突变体BB、突变体PP、突变体WW、突变体AAA和野生型(SEQ ID NO：220)蛋白质的大肠杆菌B834(DE3)(Novagen，San Diego，CA)培养物在30℃在500mL挡板烧瓶中的200mL Overnight Express II培养基(溶液1-6，Novagen)中生长到OD₆₀₀为10。总蛋白的样品在即将收获之前采集。通过离心收获细胞，立即在-80℃冷冻，直到如实施例4所述制备细胞提取物。

通过添加50mL的Bug Buster Primary Amine Free(Novagen，San Diego，CA)和50μl Benzonase Nuclease(Novagen，San Diego，CA)、0.75μl rLysozyme(Novagen，San Diego，CA)和250μl Protease Inhibitor Cocktail II(Calbiochem，San Diego，CA)来产生细胞提取物。细胞在室温下柔和摇摆孵育15分钟。提取物在45,000×g离心10分钟。

His标签的蛋白质使用GE Healthcare(Piscataway，NJ)Chelating Sepharose^TM Fast Flow树脂如实施例4所述来纯化。例外是突变体182，其如实施例4所述作为CFE来分析。纯化的蛋白质利用PD10柱来脱盐到具有0.050mM PLP的100mM磷酸钾，pH 7.8中。如实施例4所述测定总蛋白和DAT浓度。

用大约0.2mg/mL的DAT浓度和0.1mg/mL浓度的醛缩酶如实施例5所述进行3步骤monatin形成分析。作为对照，评估了纯化的野生型DAT(SEQ ID NO：220)的0.2mg/mL浓度。在0.5、1、2、4和24小时之后，采集等份，甲酸添加到2％的终浓度，旋转样品并过滤。利用LC/MS/MS方法分析样品的monatin，利用实施例36所述的LC/OPA柱后荧光方法分析色氨酸和丙氨酸。在最后的时点，采集另外的等份(没有pH调整)来通过实施例36所述的FDAA衍生方法测定％R，R monatin。在各个时点产生的monatin(mM)的量可以在表55中找到。还测定了立体纯度，R，R立体异构体的百分比可以在最右侧列中找到。立体异构体R，S构成平衡的大部分。

表55：选择的DAT突变体的活性

--＝在测试的条件下未测出

如通过在突变体和野生型对照(SEQ ID NO：220)DAT之间比较在第一个小时期间纯化蛋白质的monatin形成速率所确定的，在测试的条件下monatin生产的相对速率表明来自突变体135、突变体136、突变体E、突变体G、突变体M、突变体O、突变体BB和突变体AAA的初活性方面的最大改善。DAT突变体E和突变体AAA具有高活性，但是在测试的条件下不是良好表达(低于总蛋白的5％)，也不易溶。

还如实施例36所述分析了分析样品的中间物，例如monatin前体、I3P、和副产物4-羟基-4-甲基谷氨酸(HGM)。对突变体E、突变体G、突变体I、突变体M、突变体O、突变体BB、突变体PP、突变体AAA和突变体110、突变体135和突变体136测定了形成的HMG量的分析。看起来在4小时时点突变体135、突变体G、突变体I、突变体M和突变体BB形成了更多的HMG。这些突变体全部含有改变V236T。可能由于残基P20S的改变，对于突变体E、突变体G、突变体M和突变体AAA，HMG也以高于野生型对照(SEQ ID NO：220)的水平存在。

表56：在4小时后DAT突变体的HMG形成

DAT多肽

HMG(mM)4小时

野生型对照(SEQIDNO：220)	nd
		突变体110	nd
突变体135	1.0
		突变体136	nd
突变体E	0.2
		突变体G	1.6
突变体1	0.8
		突变体M	1.6
突变体0	nd
		突变体BB	1.5
突变体AAA	0.6

nd＝未检出

监测I3P形成的DAT分析

在340nm波长下检测和监测了来自色氨酸的I3P形成。反应在1mL反应体积中进行，所述反应体积含有25mM D-色氨酸、25mM丙酮酸钠盐、0.05mM PLP、100mM磷酸钾(pH 7.8)溶液900μL与100μL如上所述制备的DAT(总蛋白)稀释液组合。酶用冷的50mM磷酸钾(pH 7.8)和50μMPLP在添加到分析之前以1∶100和1∶200稀释。酶添加到反应混合物1∶100，以15秒的递增量监测3分钟。吲哚-3-丙酮酸(I3P)的形成在340nm波长下在BioRad分光光度计(GE Healthscience，Piscataway，NJ)上监视3分钟，速率在标准曲线的动态范围内测量。用纯化的野生型(SEQ ID NO：220)DAT蛋白产生标准曲线，细胞提取物中DAT的浓度根据标准曲线的线的方程式来测定。相对于第一个反应的野生型DAT的DAT有效浓度在表57中报告。

表57：DAT的活性(色氨酸向I3P的转化)

野生型DAT(SEQ ID NO：220)和突变体136、E、G、M、O、BB和AAA可以促进色氨酸到I3P和monatin前体到monatin的转化。表57显示了相对于野生型DAT(SEQ ID NO：220)，这些突变体具有更低的色氨酸到I3P转化的活性。又根据表55，相同的突变体比野生型DAT(SEQ ID NO：220)从色氨酸产生更多的总monatin。因而，在此处描述的分析的条件下，看起来通过控制monatin生物合成途径中色氨酸向I3P的转化，对monatin生产具有有益效果。例如，虽然突变体E显示了转化色氨酸到I3P的最低相对活性(参见表57)，它在4小时还产生了最高量的monatin(参见表55)。不受理论的限制，控制反应中第一步骤的有益效果可以归于I3P积累的降低以及随后I3P降解成为monatin以外其他产物的潜力。一般，还明显的是利用例如一或多种突变体DAT控制涉及自色氨酸产生monatin的一或多个反应的速率对产生的monatin总量具有有益作用。

实施例33——在35℃突变体DAT的评估

这个实施例描述了证明在此公开的示范性多肽的酶活性的数据。起始培养物在37℃在250rpm摇动生长过夜，直至OD_600nm达到0.05。如实施例3所述接种并生长200mL的Overnight Express II培养基(Novagen，San Diego，CA)。一式两份地生长培养物，组合细胞沉淀。沉淀重悬在具有0.05mM PLP的40mL的50mM磷酸钠缓冲液(pH 7.8)中，使用French Press(Sim Aminco，Rochester，NY)根据厂家说明裂解。上清收集在清洁试管中，在-80℃保存待用。

用大约0.2mg/mL的DAT浓度和0.1mg/mL浓度的醛缩酶在玻璃小瓶中如方法中所述进行3步骤monatin形成分析。双份样品在25℃或35℃孵育，在1、3和4小时之后，采集等份，添加甲酸到2％的终浓度，旋转样品并过滤。利用LC/MS/MS方法分析样品的monatin，利用实施例36所述的LC/OPA柱后荧光方法分析色氨酸和丙氨酸。还如实施例36所述分析了分析样品的中间物，例如monatin前体、I3P、和4-羟基-4-甲基谷氨酸(HGM)。在各个时点产生的monatin(mM)的量表58中示出。

对野生型对照(SEQ ID NO：220)、突变体135和突变体M在相似条件下重复monatin形成分析，只是反应在塑料小瓶中进行。在各个时点的monatin产生可以在表58中找到。

表58：在25℃和35℃下的monatin形成

在分析条件下在35℃使用在此描述的DAT酶观察到更低的monatin效价。然而，选择突变体135、突变体136、突变体M、突变体O和突变体BB在分析条件下在35℃显示了提高的起始monatin生产速率和比野生型对照(SEQ ID NO：220)更大的4小时monatin效价。

实施例34——生物反应器中突变体DAT的评估

这个实施例描述了证明在生物反应器中在此公开的示范性多肽的酶活性的数据。野生型对照(SEQ ID NO：220)、突变体135、突变体136、突变体M、突变体O和突变体BB的甘油原液用于单个菌落在平板上划线。单个菌落用于接种含有具有合适抗生素的5mL LB培养基的烧瓶。起始培养物在37℃在250rpm摇动生长过夜，检查OD_600nm。当OD_600nm达到0.05时，5mL培养物接种到200mL的Overnight Express II培养基(Novagen，San Diego，CA)中，然后在30℃在250rpm摇动孵育。一式两份地生长每种培养物，组合细胞沉淀。通过在4000rpm离心15分钟沉淀细胞来收获培养物。倒出上清，沉淀冷冻用于以后使用或重悬在40mL的50mM磷酸钠缓冲液(pH 7.8)中，根据厂家说明利用French Press(SimAminco，Rochester，NY)或者微射流匀质机(microfluidizer)裂解。上清收集在清洁试管中，在-80℃保存待用。保留大约1mL澄清的裂解物用于利用BCA分析(Pierce，Rockford，IL)和SDS-PAGE分析的蛋白质定量。

如实施例15所述桌面规模反应(250mL)在0.7L Sixfors搅动发酵器(Infers AG，Bottmingen，Switzerland)中在氮顶部空间下进行。反应混合物含有10mM磷酸钾、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠和130mM D-色氨酸。反应混合物调节到25℃，用氢氧化钾调节到pH 7.8。作为澄清的细胞提取物以0.02mg/mL靶蛋白质添加实施例6所述的醛缩酶。根据目测，野生型对照(SEQ ID NO：220)、突变体135、突变体136、突变体M、突变体O和突变体BB DAT具有从15-35％范围的可溶蛋白质表达。以0.20mg/mL靶蛋白质添加澄清的细胞提取物。

反应的进展利用实施例36所述的LC/MS/MS方法通过在1、2、4和24小时测量monatin产生来跟踪。结果在表59中示出。

表59：发酵器中的monatin生产

用突变体136、突变体M、突变体O和突变体BB观察到的monatin生产的初始速率比用野生型对照(SEQ ID NO：220)的速率更快。所有突变体显示了在测试的条件下在2小时时改善的monatin形成。突变体135在1小时时比预计的monatin效价低是归因于在第一个小时期间对氧的无意暴露。在4小时之后，在测试的条件下在突变体和对照之间的monatin效价是相当的。

实施例35——在生物反应器中温度对突变体DAT的影响的评估

这个实施例描述了证明在不同温度条件下在此公开的示范性多肽的酶活性的数据。野生型对照(SEQ ID NO：220)、突变体135和突变体M如实施例15所述在2.5L规模的发酵器中产生。在发酵结束时，通过在5000-7000×g离心10分钟收获细胞，作为湿细胞糊在-80℃冷冻。

为了制备含有野生型对照、突变体135和突变体M D-氨基转移酶的无细胞提取物，50g湿细胞糊悬浮在含0.05mM磷酸吡哆醛(PLP)的150mL 50mM磷酸钾缓冲液(pH 7.8)中，然后使用Microfluidics匀浆器(Microfluidics，Newton，MA)(以18,000 psi 3次通过)破坏，悬浮液的温度维持在低于15℃。细胞碎片通过离心除去(20,000×g 30分钟)。

来自色氨酸的I3P的形成速率如实施例32所述在340nm处监测三分钟。根据用纯化的DAT野生型对照产生的标准曲线，野生型对照的浓度被测定为6.8mg/mL，突变体135的浓度被测定为7.0mg/mL，突变体M被测定为5.6mg/mL。通过I3P形成测定的DAT浓度用于将Infors剂量调整到0.2mg/mL DAT。以0.02mg/mL醛缩酶作为无细胞提取物添加。反应混合物含有处在氮气顶部空间下的10mM磷酸钾、1mM MgCl₂、0.05mM PLP、200mM丙酮酸钠和130mM D-色氨酸。在35℃和25℃在生物反应器中评估每种DAT的monatin生产。

样品在0.5、1、3、4和24小时采集，利用实施例36所述的LC/MS/MS方法分析。结果在表60中示出。

表60：25℃和35℃的发酵器

如实施例34所示，选择突变体DAT在35℃产生了比野生型对照DAT(SEQ ID NO：220)更高的monatin效价。在测试的条件下，在25℃，野生型对照DAT具有更慢的monatin生产初始速率，但是更高的最终效价。突变体135和突变体M都显示了在25℃和35℃下相对于野生型对照的改善活性。在测试条件下与对照相比，在35℃，突变体135和突变体M都具有更高的monatin生产初始速率和更高的最终效价。选择的突变体在更高的温度下比野生型对照更稳定。这表明了GSSM和TMCA技术在产生比野生型对照具有更大热稳定性的突变体方面的优势。本领域的技术人员可以筛选这些GSSM或TMCA文库中具有例如提高的温度耐受性的突变体。

实施例36——monatin、MP、色氨酸、丙氨酸和HMG的检测

这个实施例描述了与在此公开的示范性D-氨基转移酶(DAT)的进一步表征相关的分析方法。

monatin和色氨酸的UPLC/UV分析

来自生化反应的monatin和色氨酸的混合物的分析使用包括Waters Acquity Photo-Diode Array(PDA)吸光度监测器的Waters Acquity UPLC仪器进行。使用Agilent XDB C8 1.8μm 2.1×100mm柱(部分# 928700-906)(Milford，MA)在23℃进行UPLC分离。UPLC流动相由A)含有0.1％甲酸的水，B)含有0.1％甲酸的乙腈组成。

梯度洗脱是5％B到40％B、0-4分钟线性，40％B到90％B、4-4.2分钟线性，90％B到90％B、4.2-5.2分钟无梯度，90％B到5％B、5.2-5.3分钟线性，运行之间1.2分钟的再平衡时间。流动速度是0.5mL/分钟，PDA吸光度在280nm处监测。

样品浓度根据已知浓度的280nm处峰面积的线性最小平方校准来计算，最小决定系数99.9％。

monatin中间物(吲哚-3-丙酮酸(I3P)、羟基甲氧基谷氨酸、monatin 前体和丙酮酸)用O-(4-硝基苄基)羟胺盐酸(NBHA)衍生化

在monatin产生的过程中，形成和利用了各种中间化合物。这些化合物包括：吲哚-3-丙酮酸(I3P)、羟基甲氧基谷氨酸、monatin前体和丙酮酸。这些化合物上的酮官能团可以用O-(4-硝基苄基)羟胺盐酸(NBHA)来衍生化。

向20μL样品或标准物中，将140μL的NBHA(吡啶中40mg/mL)添加到琥珀色小瓶中。样品在存在热量的情况下偶尔混合地超声15分钟。在水中的35％乙腈中1∶3稀释。

monatin中间物(吲哚-3-丙酮酸、羟基甲氧基谷氨酸、monatin前体和丙酮酸)的UPLC/UV分析

包括Waters Acquity Photo-Diode Array(PDA)吸光度检测器(Waters，Milford，MA)的Waters Acquity UPLC仪器用于中间产物化合物的分析。利用Waters Acquity HSS T3 1.8mm×150mm柱(Waters，Milford，MA)在50℃进行UPLC分离。UPLC流动相由A)含有0.3％甲酸和10mM甲酸铵的水和B)含有0.3％甲酸和10mM甲酸铵的50/50乙腈/甲醇组成。

梯度洗脱是5％B到40％B、0-1.5分钟线性，40％B到50％B、1.5-4.5分钟线性，50％B到90％B、4.5-7.5分钟线性，90％B到95％B、7.5-10.5分钟线性，运行之间3分钟的再平衡时间。流动速度是0-7.5分钟是0.15mL/分钟、7.5-10.5分钟是0.18mL/分钟、10.5-11分钟是0.19mL/分钟和11-13.5分钟是0.15mL/分钟。在270nm监测PDA吸光度。

样品浓度根据已知浓度的270nm处峰面积的线性最小平方校准来计算，最小决定系数99.9％。

monatin的手性LC/MS/MS(MRM)测量

在生化反应中monatin的立体异构体分布的测定通过用1-氟-2-4-二硝基苯基-5-L-丙氨酸酰胺30(FDAA)和随后的反相LC/MS/MS MRM测量来进行。

用FDAA衍生Monatin

FDAA在丙酮中的100μL的1％溶液添加到50μL样品或标准物中。添加20μL的1.0M碳酸氢钠，混合物在40℃偶尔混合地孵育1小时。取出样品并冷却，用20μL的2.0M HCl(可能需要更多HCl来实现缓冲的生物学混合物的中和)中和。样品通过LC/MS/MS分析。

用于monatin的立体异构体分布的测定的LC/MS/MS多反应监测

利用Waters/Micromass

液相层析串联质谱法(LC/MS/MS)仪器进行分析，所述仪器包括串联置于色谱和Micromass

Quattro Ultima

三重四极质谱仪之间的、具有Waters 996 Photo-Diode Array(PDA)吸光度监测器(Waters，Milford，MA)的Waters 2795液相色谱。能够分离monatin(具体是FDAA-monatin)的所有四种立体异构体的LC分离在40℃在PhenomenexLuna

2.0×250mm(3μm)C18反相层析柱上进行。LC流动相由A)含有0.05％(质量/体积)乙酸铵的水和B)乙腈组成。洗脱是在13％B、0-2分钟无梯度，从13％B到30％B、2-15分钟线性，从30％B到80％B、15-16分钟线性，80％B、16-21分钟无梯度，和80％B到13％B、21-22分钟线性，运行之间是8分钟的再平衡时间。流动速度是0.23mL/分钟，PDA吸光度从200nm到400nm监测。根据FDAA-monatin的去质子化的20种分子离子([M-H]-)的产生和特征性片段离子的产生来优化和选择ESI-MS的所有参数。以下仪器参数用于负离子ESI/MS模式中monatin的LC/MS分析：Capillary：3.0kV；Cone：40V；Hex 1：15V；Aperture：0.1V；Hex 2：0.1V；源温度：120℃；去溶剂化温度：350℃；去溶剂化气体：662L/h；Cone气体：42L/h；低质量分辨率(Q1)：14.0；高质量分辨率(Q1)：15.0；离子能量：0.5；Entrance：0V；碰撞能量：20；Exit：0V；低质量分辨率(Q2)：15；高质量分辨率(Q2)：14；离子能量(Q2)：2.0；倍增器：650。三种FDAA-monatin特异性亲本到子代的转变被用于特异性检测体外和体内反应中的FDAA-monatin。对monatin监测的转变是542.97到267.94、542.97到499.07和542.97到525.04。FDAA-monatin立体异构体的鉴定基于与纯化的monatin立体异构体和质谱数据相比较的色谱停留时间。

OPA的液相层析-柱后衍生化、氨基酸包括：羟甲基谷氨酸(HMG)和丙氨酸的荧光检测

来自生化反应的HMG和丙氨酸的混合物的分析利用具有Waters 2487 Dual Wavelengths Absorbance Detector和Waters 2475 Fluorescence Detector作为检测系统(Waters，Milford，MA)的Waters Alliance 2695和Waters 600配置的仪器来进行。HPLC分离利用两个串联Phenomenex Aqua C18 125A、150mm x 2.1mm，3μ，Cat #00F-4311B0柱作为分析柱和Phenomenex Aqua C18 125A，30mm x 2.1mm，3μ，Cat #00A-4311B0作为在线固相提取(SPE)柱来进行。两个分析柱的温度设置在55℃，在线SPE柱设置在室温。HPLC流动相由A)具有1％甲醇的0.6％乙酸组成。流动速度是(100％A)0-3.5分钟0.2mL/分钟、3.5-6.5分钟0.24mL/分钟、6.5-10.4分钟0.26mL/分钟、和10.4-11分钟0.2mL/分钟。UV-VIS吸光度检测器被设置来监测336nm波长。荧光检测器设置在348nm和450nm来分别监测激发和发射波长。

其他实施方案

要理解虽然已经连同其详细说明描述了本发明，上述说明意图说明而不是限制本发明的范围，本发明的范围由附随的权利要求书的范围所限定。其他方面、优点和改变在以下权利要求书的范围之内。

Claims

1.一种将色氨酸转化成吲哚-3-丙酮酸(或吲哚-3-丙酮酸转化成色氨酸)的方法，包括：

组合色氨酸(或吲哚-3-丙酮酸)和

a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587 589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975组成的组中的一或多种核酸分子，其中所述一或多种核酸分子编码具有氨基转移酶(AT)或氧化还原酶活性的多肽；

b)a)的变体，其中所述变体编码具有AT或氧化还原酶活性的多肽；

c)a)或b)的片段，其中所述片段编码具有AT或氧化还原酶活性的多肽；

d)选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示一或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974、976、1069、1070、1071、1072和1073组成的组中的一或多种多肽，其中所述一或多种多肽具有AT或氧化还原酶活性；

e)d)的变体，其中所述变体具有AT或氧化还原酶活性；或

f)d)或e)的片段，其中所述片段具有AT或氧化还原酶活性。

2.一种将MP转化成monatin或(monatin转化成MP)的方法，包括组合MP(或monatin)和

a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、716、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973和975组成的组中的一或多种核酸分子；其中所述一或多种核酸分子编码具有氨基转移酶(AT)或氧化还原酶活性的多肽；

e)d)的变体，其中所述变体具有AT或氧化还原酶活性；或

f)d)或e)的片段，其中所述片段具有AT或氧化还原酶活性。

3.权利要求1或2的方法，其中所述一或多种核酸分子选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973和975组成的组中。

4.权利要求1或2的方法，其中所述一或多种多肽选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示一或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974和976组成的组中。

5.权利要求1或2的方法，其中所述核酸分子具有选自由SEQ ID NO：945、891、893、219、175、1063、1065和1067组成的组中的序列。

6.权利要求1或2的方法，其中所述多肽具有选自由SEQ ID NO：946、892、894、220、176、1064、1066和1068组成的组中的序列。

7.权利要求1或2的方法，其中所述多肽具有与SEQ ID NO：1069或1070所示共有序列相应的序列。

8.权利要求1或2的方法，其中所述多肽具有与SEQ ID NO：1071、1072和1073所示共有序列相应的序列。

9.权利要求1或2的方法，其中所述变体是与SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973和975具有至少80％、至少85％、至少90％、至少95％或至少99％序列相同性的核酸分子。

10.权利要求1或2的方法，其中所述变体是与SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示一或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974和976具有至少80％、至少85％、至少90％、至少95％或至少99％序列相同性的多肽。

11.权利要求1或2的方法，其中所述变体是与SEQ ID NO：220具有至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％序列相同性的多肽。

12.权利要求1或2的方法，其中所述变体是与SEQ ID NO：870具有至少80％、至少85％、至少90％、至少95％或至少99％序列相同性的多肽。

13.权利要求1或2的方法，其中所述变体是与SEQ ID NO：894具有至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少99％序列相同性的多肽。

14.权利要求1或2的方法，其中所述变体是突变体。

15.权利要求14的方法，其中所述突变体在与DAT 4978的残基243对准的残基处具有突变。

16.权利要求15的方法，其中所述突变体选自由SEQ ID NO：870T242N、SEQ ID NO：220 G240N和SEQ ID NO：220 T241N组成的组。

17.权利要求1或2的方法，其中所述变体是被密码子优化的核酸分子。

18.权利要求1或2的方法，其中所述核酸分子包含在表达载体中。

19.权利要求18的方法，其中所述核酸分子过表达。

20.权利要求1或2的方法，其中所述氨基转移酶或氧化还原酶多肽被固定在固相支持物上。

21.权利要求1或2的方法，其中所述变体多肽是嵌合多肽。

22.权利要求1或2的方法，其中所述色氨酸或MP是取代的色氨酸或取代的MP。

23.一种将色氨酸转化成吲哚-3-丙酮酸(或吲哚-3-丙酮酸转化成色氨酸)的方法，包括：

组合色氨酸(或吲哚-3-丙酮酸)和

a)选自由SEQ ID NO：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、969、971、973和975组成的组中的一或多种核酸分子，其中所述一或多种核酸分子编码具有D-氨基转移酶(DAT)活性的多肽；

b)a)的变体，其中所述变体编码具有DAT活性的多肽；

c)a)或b)的片段，其中所述片段编码具有DAT活性的多肽；

d)选自由SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、220 G240N、220 T241N、具有表43或表52中所示一或多个突变的SEQ ID NO：220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、866、868、870、870T242N、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、970、972、974、976、1069、1070、1071、1072和1073组成的组中的一或多种多肽，其中所述一或多种多肽具有DAT活性；

e)d)的变体，其中所述变体具有DAT活性；或

f)d)或e)的片段，其中所述片段具有DAT活性。

24.一种将MP转化成monatin(或monatin转化成MP)的方法，包括组合MP(或monatin)和

b)a)的变体，其中所述变体编码具有DAT活性的多肽；

c)a)或b)的片段，其中所述片段编码具有DAT活性的多肽；

e)d)的变体，其中所述变体具有DAT活性；或

f)d)或e)的片段，其中所述片段具有DAT活性。

25.权利要求23或24的方法，其中所述核酸分子或多肽具有选自由SEQ ID NO：945、891、893、219、175、1063、1065和1067组成的组中的序列。

26.权利要求23或24的方法，其中所述多肽具有与SEQ ID NO：1069、1070、1071、1072或1073中所示共有序列相应的序列。

27.权利要求23或24的方法，其中所述色氨酸或MP是取代的色氨酸或取代的MP。

28.一种制备monatin的方法，包括

在生产monatin的条件下使色氨酸接触C3碳源和

b)a)的变体，其中所述变体编码具有DAT活性的多肽；

c)a)或b)的片段，其中所述片段编码具有DAT活性的多肽；

e)d)的变体，其中所述变体具有DAT活性；或

f)d)或e)的片段，其中所述片段具有DAT活性。

29.权利要求28的方法，其中所述核酸分子或多肽选自由SEQ ID NO：945、891、893、219、175、1063、1065和1067组成的组。

30.权利要求28的方法，其中所述C3碳源选自由丙酮酸、草酰乙酸和丝氨酸组成的组。

31.权利要求28的方法，进一步包含合酶/裂合酶(EC 4.1.2.-或4.1.3.-)多肽。

32.权利要求31的方法，其中所述合酶/裂合酶(EC 4.1.2.-或4.1.3.-)多肽是醛缩酶。

33.权利要求32的方法，其中所述醛缩酶选自由KHG醛缩酶(EC 4.1.3.16)或HMG醛缩酶(EC 4.1.3.16)组成的组。

34.权利要求28的方法，其中所述生产的monatin是R，R monatin。

35.权利要求28的方法，其中所述生产的monatin是S，R monatin。

36.权利要求28的方法，其中所述色氨酸是取代的色氨酸。

37.权利要求36的方法，其中所述取代的色氨酸是6-氯-D-色氨酸。