CN102242137A

CN102242137A - 编码碳水化合物利用相关蛋白的嗜酸乳杆菌核酸序列及其用途

Info

Publication number: CN102242137A
Application number: CN201110104038XA
Authority: CN
Inventors: T·R·克拉恩哈莫; E·奥特曼; R·巴兰格; W·M·拉塞尔; T·董
Original assignee: North Carolina State University
Current assignee: North Carolina State University; University of California
Priority date: 2004-03-08
Filing date: 2005-03-08
Publication date: 2011-11-16
Also published as: EP1727826A2; US8178337B2; EP2407481A1; EP2348041A1; BRPI0508551A; NZ578041A; JP2007527727A; AU2005218666A1; US7459289B2; WO2005084411A3; EP2407482A1; AU2005218666B2; US20090093021A1; US20120196325A1; US20110081707A1; EP1727826A4; JP2011200232A; US7838276B2; US20070003668A1; NZ550123A

Abstract

本发明公开了编码碳水化合物利用相关蛋白的嗜酸乳杆菌核酸序列及其用途。此外，还包括碳水化合物利用相关和多药转运蛋白融合蛋白、抗原肽和抗碳水化合物利用相关和抗多药转运蛋白抗体。本发明还提供了含有本发明核酸的载体和其中已经引入该载体的细胞。进一步公开了制备本发明多肽的方法和本发明多肽的使用方法。

Description

编码碳水化合物利用相关蛋白的嗜酸乳杆菌核酸序列及其用途

相关申请的互相参照

本申请要求2005年3月7日提交、题名为“编码碳水化合物利用相关蛋白的嗜酸乳杆菌核酸序列及其用途”、所列发明人为Todd R.Klaenhammer、Eric Altermann、Rodolphe Barrangou、W.MichaelRussell和Tri Duong、代理人文档号为5051-693的美国申请系列号__________的优先权，其要求了2004年3月8日提交的美国临时申请系列号60/551,121的权益，每一篇的内容在此全部引入作为参考。

发明领域

本发明涉及分离自乳酸菌，即嗜酸乳杆菌(lactobacillusacidophilus)的多核苷酸，由它们编码的多肽，以及使用该多肽和表达它们的生物的方法。

发明背景

嗜酸乳杆菌是革兰氏阳性、杆状、不形成芽孢的同型发酵细菌，它是胃肠道和泌尿生殖道的正常习居菌。自从最初由Moro(1900)从婴儿粪便中分离到该细菌以来，已在人、以母乳喂养的婴儿和消耗高乳、乳糖或糊精饮食的人的肠道中发现了这种“嗜酸”生物。历史上，嗜酸乳杆菌是常被认为能够对胃肠道微菌物群引发有益作用的肠道益生菌中的乳酸杆菌种(Klaenhammer and Russell(2000)″Species ofthe Lactobacillus acidophilus complex，″Encyclopedia of FoodMicrobiology，2：1151-1157.Robinson et al.，eds.(AcademicPress，San Diego，California)。嗜酸乳杆菌可以发酵己糖，包括乳糖和更复杂寡糖，以产生乳酸并降低培养生物的环境pH。酸化环境(例如食物、阴道和胃肠道内区域)可以干扰不合需要的细菌、病原体和酵母的生长。该生物因为它的耐酸性、在培养乳制品中的存活和通过胃与胃肠道过程中的生存力而被熟知。乳杆菌和其它共生细菌中有一些被认为是“有利于生命”的益生菌，已广泛研究了它们对人类健康的影响，尤其是在预防或治疗肠道感染、腹泻疾病、预防癌症和刺激免疫系统中的影响。还研究了乳杆菌对乳制品风味以及功能和结构特征的影响。已经描述了其它乳杆菌种的遗传特征(例如约氏乳杆菌(L johnsonii)和鼠李糖乳杆菌(L.rhamnosus))(参见例如美国专利6,476,209；美国专利6,544,772；美国专利公开号20020159976、2003013882 & 20040009490；PCT公开号WO 2004/031389；PCT公开号2003/084989；PCT公开号WO 2004/020467)。

细菌生长需要特殊转运系统从外界环境引入营养素。乳酸菌通过三个系统将分子转运入和转运出细胞：初级转运、二级转运和基团转位。在初级转运中，使用化学剂(主要是ATP)、电或太阳能驱动转运。ATP结合盒(ABC)转运蛋白是乳酸菌中最富足的初级转运系统类型。在这个系统中，ATP水解链接底物运输穿过膜，引入糖和相容溶质，和输出产物如不合细胞需要的药物或毒素，或在细胞外起作用的细胞成分，如细胞壁多糖。通常，ABC转运蛋白对于它们的底物是相对特异性的，但是有一些是多特异性的，如多药转运蛋白。

二级转运系统使用电化学梯度以提供糖运输的能量。它们包括同向转运蛋白(其协同转运两个或更多溶质)、单向转运蛋白(其转运一个分子)和反向转运蛋白(其相反转运两个或更多溶质)。同向转运蛋白通常将底物向上运动与质子(或离子)向下运动偶联，反向转运蛋白使用离子梯度分泌产物，而单向转运蛋白不使用偶联离子(Poolman(2002)Antonie vanLeeuwenhoek 82：147-164)。

基团转位包括磷酸烯醇丙酮酸(PEP)依赖性磷酸转移酶系统(PTS)，它将碳水化合物或糖醇的摄取与它的磷酸化偶联起来(Poolman(2002)，上述)。磷酸基来源于PEP向丙酮酸的转变，随后的磷酸化作用涉及能量偶联蛋白、酶I和HPr、以及底物特异性磷酰基转移蛋白IIA、IIB和IIC。

多药转运蛋白可以分成两种主要类型，二级多药转运蛋白和ABC转运蛋白。二级多药转运蛋白可以进一步分为不同的家族，包括主要促进蛋白超家族(major facilitator superfamily，MFS)、小多药抗性家族(small multidrug resistance family，SMR)、抗性-小结形成-细胞分裂家族(resistance-nodulation-cell division family，RND)和多药与毒性化合物排出家族(multidrug and toxic compoundextrusion family，MATE)(Putman et al.(2000)Microbiol.Mol.Biol.Reviews 64：672-693)。二级多药转运蛋白使用如在此描述的电化学梯度将药物排出细胞。ABC型多药转运蛋白使用来自ATP水解的能量将药物泵出细胞(Putman et al.(2000)，上述)。

细菌能够通过利用转运蛋白和具有不同碳水化合物特异性的酶，并使用不同的调节机制，如分解代谢产物阻遏，从而代谢各种碳水化合物。这些蛋白的分离和表征使得可以开发具有许多应用的必需益生菌产物，包括有益于人和/或动物健康的产物，以及涉及食物生产和安全的产物。该蛋白还可以用于开发生长或存活能力改变的转基因植物。

发明简述

提供了改变微生物和植物的组合物和方法。本发明的组合物包括来自嗜酸乳杆菌的编码碳水化合物利用相关蛋白的分离核酸，该碳水化合物利用相关蛋白包括磷酸转移酶系统(PTS)、ABC转运蛋白的蛋白，和涉及嗜酸乳杆菌中糖的转运、降解和/或合成的其它蛋白。组合物还包括来自嗜酸乳杆菌的编码多药转运蛋白的分离核酸。具体地，本发明提供了分离的核酸分子，其中单独地和/或以任何组合方式包含SEQ ID NOS：1-363中奇数号所述核苷酸序列，基本上由它们所组成，和/或由它们组成，并提供了编码SEQ ID NOS：2-364中偶数号所述的氨基酸序列(单独地或以任何组合方式)的分离核酸分子。还提供了分离和/或重组的多肽，其中包含由在此描述的核酸分子编码的和/或如SEQ ID NOS：2-364中偶数号所述的氨基酸序列(单独地和/或以任何组合方式)，其本上由它们所组成，和/或由它们所组成。与序列表所述核苷酸序列和氨基酸序列足够同一的变异核酸和多肽包括在本发明中。另外，还涵盖了该核苷酸序列和氨基酸序列的片段和足够同一的片段。还包括与本发明核酸序列互补或与本发明核苷酸序列杂交的核苷酸序列。

组合物进一步包括用于重组表达在此描述的核酸的载体和原核、真核和植物细胞，以及包含该载体的转基因微生物和植物群体。本发明还包括重组生产本发明多肽的方法和它们的使用方法。进一步包括检测样品中本发明核酸和/或多肽序列的存在的方法和试剂盒，以及与本发明多肽结合的抗体。还包括包含本发明核苷酸或氨基酸序列的细菌的生物学纯培养物。包括含有这些培养物的食物，包括乳、酸奶、凝乳、乳酪、发酵奶、冰淇淋、基于发酵谷类的产物、基于乳的粉剂、婴儿配制食品、药片、液体细菌悬液、干燥口服增补剂和液体口服增补剂。

本发明的碳水化合物利用相关性和多药转运蛋白分子可用于选择和生产重组细菌，尤其是生产发酵能力提高的细菌。这种细菌包括但不限于合成、转运、积聚和/或利用各种碳水化合物的能力改变的细菌，风味或品质(texture)改变的细菌，产生改变的碳水化合物的细菌，和在应力条件下能够更好存活的细菌，如食品加工和/或动物胃肠道中遇到的细菌。本发明的多药转运蛋白分子包括允许细菌在接触抗菌多肽如细菌素或其它毒素时更好存活的分子。这些碳水化合物利用相关和多药转运蛋白分子还可用于改变植物品种。包含一个或多个本发明序列的转基因植物在经济上可能有益，因为它们对所述环境应力更具抗性，所述环境应力包括但不限于植物病原体、高盐浓度或脱水。它们还可能能更好经受食品加工和储藏条件。

本发明提供了选自下组的分离核酸，所述组由包含下述的核苷酸序列、由其组成和/或基本上由其组成的核酸：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363(可以任何组合存在，包括多个相同序列)和/或其互补链，包含与下述核苷酸序列具有至少90％序列同一性的核苷酸序列、由其组成和/或基本上由其组成的核酸：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核苷酸序列(可以任意组合方式存在，包括多个相同序列)，和/或其互补链，包含下述核苷酸序列的片段、由其组成和/或基本上由其组成的核酸：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363(可以任意组合方式，包括多个相同序列)和/或其互补链，编码包含下述氨基酸序列的多肽的核酸：SEQ ID NO：2、4、6、8、10、12、i4、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(可以任意组合方式，包括多个相同序列)和/或由在此描述的核酸分子编码的氨基酸序列，包含编码与下述氨基酸序列具有至少90％氨基酸序列同一性的多肽的核苷酸序列的核酸：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(可以任意组合方式，包括多个相同序列)和/或由在此描述的核酸分子编码的氨基酸序列，以及在严格条件下与上述任何核酸杂交的核酸。

组合物进一步包括包含在此描述的核酸的载体，进一步包含编码异源多肽的核酸的载体，和含有所述载体的细胞，包括细菌、植物和真核细胞。本发明还包括重组生产本发明多肽的方法和它们的使用方法。进一步包括检测样品中本发明核酸或多肽序列的存在的方法和试剂盒，以及与本发明多肽结合的抗体。

本发明进一步提供了选自下组的分离的多肽：a)包含下述氨基酸序列(以任意组合方式，包括多个相同序列)、由其组成和/或基本上由其组成的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列和/或由在此描述的核酸分子编码的氨基酸序列；b)包含下述氨基酸序列(以任意组合方式，包括多个相同序列)和/或由本文所述核酸分子编码的氨基酸序列的片段、由其组成和/或基本上由其组成的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列；c)包含与下述氨基酸序列(以任何组合，包含多个相同序列)和/或本文所述核酸分子编码的氨基酸序列具有至少90％序列同一性的氨基酸序列、由其组成和/或基本上由其组成的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列；d)由与下述核苷酸序列具有至少90％序列同一性的核苷酸序列编码的多肽：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核苷酸序列(以任何组合)；和e)由下述核苷酸序列编码的多肽：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363(以任何组合)。

还提供了进一步包含一个或多个异源氨基酸序列的本发明多肽，和与在此描述的多肽选择性结合的抗体。

另外提供了制备多肽的方法，所述方法包括在编码该多肽的核酸被表达的条件下培养本发明的细胞，所述多肽选自下组：a)包含下述氨基酸序列的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(以任何组合，包括多个相同序列)，和/或由在此描述的核酸分子编码的氨基酸序列；b)包含下述氨基酸序列的片段的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(以任何组合，包括多个相同序列)，和/或由在此描述的核酸分子编码的氨基酸序列；c)包含与下述氨基酸序列具有至少90％序列同一性的氨基酸序列的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(以任何组合，包括多个相同序列)，和/或由在此描述的核酸分子编码的氨基酸序列；d)由与下述核苷酸序列具有至少90％序列同一性的核苷酸序列编码的多肽：SEQ IDNOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361所述核苷酸序列(以任何组合)；和e)由下列核苷酸序列编码的多肽：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核苷酸序列(以任何组合)。

还提供了检测样品中多肽的存在情况的方法，所述方法包括使样品接触选择性结合该多肽的化合物并确定该化合物是否与样品中多肽结合；其中所述多肽选自下组：a)由下述核苷酸序列编码的多肽：SEQIDNOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核苷酸序列(以任何组合)；b)包含下述核酸序列编码的氨基酸序列的片段的多肽：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核酸序列(以任何组合)；c)由与下述核苷酸具有至少90％序列同一性的核苷酸序列编码的多肽：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核苷酸序列(以任何组合)；d)包含与下述氨基酸序列具有至少90％序列同一性的氨基酸序列的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(以任何组合)；和e)包含下述氨基酸序列的多肽：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(以任何组合)。

另外提供的是检测样品中多肽的存在情况的方法，所述方法包括使样品接触与多肽选择性结合的化合物并测定该化合物是否与样品中本发明的多肽结合，其中与多肽结合的化合物是抗体。还提供了包括用在本发明方法中的化合物和使用说明书的试剂盒。

本发明还提供了检测样品中本发明核酸分子和/或其片段的存在情况的方法，包括：a)使样品接触与该核酸分子和/或其片段选择性杂交的核酸探针或引物；和b)测定核酸探针或引物是否与样品中的核酸分子杂交，由此检测样品中本发明核酸分子和/或其片段的存在情况。还提供了检测样品中本发明核酸分子和/或片段的存在情况的方法，其中样品包含mRNA分子并且使之接触核酸探针。在此另外提供了包含与本发明核酸选择性杂交的化合物和使用说明书的试剂盒。

另外提供了1)改变生物体将碳水化合物转运进入或转运出细胞的能力；2)改变生物体积聚碳水化合物的能力；3)改变生物体利用碳水化合物作为能源的能力；4)改变生物产生修饰的碳水化合物的能力；5)改变由微生物发酵的食品的风味；6)改变由微生物发酵的食品的品质；7)改变生物体经受食品加工和储藏条件的能力；8)改变微生物在胃肠(GI)道存活的能力；9)改变生物体将药物转运进入或转运出细胞的能力；和10)改变生物体产生碳水化合物的能力的方法，包括将载体引入所述生物体和/或微生物，该载体包含本发明的至少一个核苷酸序列和/或至少一个选自下组的核苷酸序列：a)SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核苷酸序列(以任何组合)；b)包含下述核苷酸序列的片段的核苷酸序列：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述核苷酸序列(以任何组合)，其中所述片段编码保留活性的多肽；c)与下述序列至少90％同一的核苷酸序列：SEQ ID NOS：1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361和/或363所述序列(以任何组合)，其中所述核苷酸序列编码保留活性的多肽；和d)编码包含与下述氨基酸序列具有至少90％序列同一性的氨基酸序列的多肽的核苷酸序列：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364所述氨基酸序列(以任何组合)，其中所述多肽保留活性；和e)编码包含下述氨基酸序列的多肽的核苷酸序列：SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364氨基酸序列(以任何组合)。

在此进一步提供的是1)与野生型嗜酸乳杆菌相比，将碳水化合物转运进入或转运出细胞的能力改变的嗜酸乳杆菌菌株；2)与野生型嗜酸乳杆菌相比，积聚碳水化合物的能力改变的嗜酸乳杆菌菌株；3)与野生型嗜酸乳杆菌相比，利用碳水化合物作为能源的能力改变的嗜酸乳杆菌菌株；4)与野生型嗜酸乳杆菌相比，提供由于发酵而使风味改变的食品的嗜酸乳杆菌菌株；5)与野生型嗜酸乳杆菌相比，提供由于发酵而使品质改变的食品的嗜酸乳杆菌菌株；6)与野生型嗜酸乳杆菌相比，产生碳水化合物能力改变的嗜酸乳杆菌菌株；7)与野生型嗜酸乳杆菌相比，经受食品加工和储藏条件的能力改变的嗜酸乳杆菌菌株；和8)与野生型嗜酸乳杆菌相比，在GI道中存活的能力改变的嗜酸乳杆菌菌株，其中所述改变的能力、风味和/或品质是由于SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362和/或364(以任何组合)所述的至少一个碳水化合物利用多肽的表达所致。

另外提供了与野生型嗜酸乳杆菌相比，经受接触抗菌多肽或毒素的能力改变的嗜酸乳杆菌菌株，其中所述改变的能力是由于SEQ IDNOs：78-88，92-94，124-126，132，282-288，308和/或312-322中偶数号所述的至少一种多药转运多肽的表达所致。

还提供了将包含本发明的至少一个核苷酸序列的DNA构建体和/或本发明的至少一个核苷酸序列稳定掺入其基因组的植物、植物细胞和/或植物种子，该序列选自下组：a)SEQ ID NOs：1-363中(单独和/或以任何组合)任何一个所述的核苷酸序列，或其互补链；b)与SEQID NOs：1-363中(单独和/或以任何组合)任何一个所述的核苷酸序列具有至少90％序列同一性的核苷酸序列，或其互补链；c)包含SEQ IDNOs：1-363中(单独和/或以任何组合)任何一个所述的核苷酸序列的片段的核苷酸序列，或其互补链；d)编码包含SEQ ID NOs：2-364中任一所述氨基酸序列的多肽的核苷酸序列；e)编码包含与SEQ IDNOs：2-364中任何一个所述氨基酸序列具有至少90％序列同一性的氨基酸序列的多肽的核苷酸序列和f)在严格条件下与a)-e)任何一个杂交的核苷酸序列。

附图简述

图1.感兴趣的基因位点。显示了正文中讨论的位点的布局：man：葡萄糖-甘露糖位点；fru：果糖位点；suc：蔗糖位点；fos：FOS位点；raff：棉子糖位点；Lac：乳糖-半乳糖位点；tre：海藻糖位点；CCR：碳分解代谢产物位点。

图2.嗜酸乳杆菌中的碳水化合物利用。该图显示了如转录谱预测的碳水化合物转运蛋白和水解酶。说明了每个元件的蛋白名称和EC号。PTS转运蛋白以黑色显示。GPH转运蛋白以浅灰色显示。ABC转运蛋白以暗灰色显示。

发明详述

本发明涉及来自嗜酸乳杆菌的碳水化合物利用相关和多药转运蛋白。提供了碳水化合物利用相关和多药转运蛋白的核苷酸和氨基酸序列。该序列可用于改变微生物、细胞和植物，使其具有提高的性能。

在此使用的“一个(种)”和“该”可以是复数或单数，如贯穿说明书和权利要求书中使用。例如“一个(种)”细胞可以指单个(种)细胞或许多个(种)细胞。

同样在此使用的“和/或”是指并且包括一个或多个所列相关项目的任何和所有可能的组合，并且以择一方式(“或”)使用时不包括组合。

“碳水化合物利用相关”分子或基因意思指来自嗜酸乳杆菌的新序列，其编码涉及碳水化合物分子利用的蛋白，包括但不限于碳水化合物的合成、转运或降解。“多药转运蛋白”分子意思指涉及抗菌多肽转运的分子，所述抗菌多肽例如是细菌素或其它药物或毒素。本发明的具体碳水化合物利用相关性多药转运蛋白分子参见表1。全长基因序列表示为“碳水化合物利用相关序列”或“多药转运蛋白序列”表明它们分别与碳水化合物利用相关基因或多药转运蛋白基因具有相似性。本发明进一步提供了这些碳水化合物利用相关序列或多药转运蛋白序列的片段和变体，其也可以用于实施本发明的方法。

“碳水化合物”是指含有碳、氢和氧的有机化合物，通常比率为1∶2∶1。碳水化合物包括但不限于糖、淀粉、纤维素和树胶。在此使用的术语“基因”和“重组基因”是指包含开放读框的核酸，尤其是编码碳水化合物利用相关蛋白或多药转运蛋白的核酸。本发明的分离的核酸包含编码碳水化合物利用相关蛋白或多药转运蛋白的核酸序列、编码SEQ ID NOS：2-364中偶数号所述氨基酸序列的核酸序列、SEQ IDNOS：1-363中奇数号所述核酸序列、及其变体和片段。本发明还包括反义核酸，如下所述。

此外，包括具有碳水化合物利用相关活性或多药转运蛋白活性的分离的多肽和蛋白及其变体和片段，以及产生这些多肽的方法。为了本发明的目的，术语“蛋白”和“多肽”可以互换使用。本发明的多肽具有碳水化合物利用相关蛋白活性或多药转运蛋白活性。碳水化合物利用相关蛋白活性或多药转运蛋白活性是指根据标准试验技术在体内或体外测定的生物学或功能性活性。这些活性包括但不限于合成碳水化合物的能力、将碳水化合物转运进入或转运出细胞的能力、降解碳水化合物的能力、调节细胞中碳水化合物浓度的能力、结合碳水化合物的能力和将药物或毒素转运进入或转运出细胞的能力。

各种类型的细菌转运蛋白的结构是本领域熟知的。转运蛋白的ATP结合盒(ABC)超家族由具有四个核心结构域的蛋白组成(Higginset al.(1986)Nature 323：448-450；Hyde et al.(1990)Nature346：362-365；Higgins(2001)Res.Microbiol.152：205-210)。典型地，有两个跨膜结构域(PFAM登录号PF00664)，其中每一结构域具有六个跨膜α螺旋，和两个ATP结合结构域，其含有确定转运蛋白的核心氨基酸(Higgins(2001)上述.)，以及另一个保守基序，包括Walker A和Walker B基序(Walker et al.(1982)EMBO J.1：945-951；Prosite Ref.No.PDOC00185)。

本发明的ABC转运蛋白包括SEQ ID NOS：40，42，44，48，52，54，56，58，62，64，66，68，70，72，74，110，112，114，116，122，124，126，128，130，132，134，136，144，146，148，152，154，160，236，262，274，278，280，294，296，298，300，302，306，338，340和360中的蛋白。SEQ ID NOS：126和144是ABC转运蛋白跨膜区家族的成员(PFAM登录号PF00664)。

TOBE结构域(转运相关OB)(PFAM登录号PF03459)总是以二聚物存在，因为每个结构域的C末端链由伙伴供给(Koonin et al.(2000)Adv.Protein Chem.54：245-75)。它大概涉及小的配体如钼和硫酸盐的识别。在ABC转运蛋白中，发现它就在ATP酶结构域之后。本发明的TOBE结构域蛋白包括SEQ ID NO：110中的蛋白。

二级转运系统蛋白包括转运蛋白的半乳糖苷-戊糖-己糖醛酸酐(hexuronide)组(Poolman et al.(1996)Mol.Microbiol.19：911-922)。这些蛋白通常由包含十二个跨膜结构域和羧基末端酶IIA结构域的疏水性结构域组成(Poolman et al.(1989)J.Bacteriol.171：244-253)。

磷酸转移酶系统(PTS)催化糖底物在移位穿过细胞膜过程中的磷酸化。该机制包括通过PTS系统的酶I(EI)(Prosite Ref.No.PDOC00527)将磷酰基从磷酸烯醇丙酮酸(PEP)转移至酶II(EII)(Prosite Ref.Nos.PDOC00528；PDOC00795)，继而将其转移至磷酸载体蛋白(HPr)(Prosite Ref.No.PDOC00318)(PFAM登录号PF00381)。HPr蛋白含有两个保守磷酸化位点-一个是位于氨基末端侧、被酶I磷酸化的组氨酸残基，一个是在该蛋白的羧基末端侧、可以被ATP依赖性蛋白激酶磷酸化的丝氨酸残基(de Vos(1996)AntonievanLeeuwenhoek 70：223-242)。SEQ ID NO：178是PTS HPr组分磷酸化位点家族(PFAM登录号PF00381)的成员。

PTS系统的糖特异性通透酶(酶II)由至少三个结构不同的结构域(IIA、IIB和IIC)组成，其可以以单个多肽链形式融合在一起，或者作为两个或三个相互作用的链存在。IIA结构域携带第一个通透酶特异性磷酸化位点，即被磷酸基-HPr磷酸化的组氨酸。第二个结构域(IIB)被磷酸基-IIA在半胱氨酰基或组氨酸酰基残基处磷酸化，这取决于通透酶。最后，磷酰基在被IIC结构域催化的过程中从IIB结构域转移至糖底物，这个过程与糖的跨膜转运偶联。本发明的磷酸烯醇丙酮酸依赖性糖磷酸转移酶系统，EIIA 1家族(PFAM登录号PF00358)蛋白，包括SEQ ID NOS：6，12，14，34，102，104，174，176，268和290中的蛋白。本发明的磷酸烯醇丙酮酸依赖性糖磷酸转移酶系统，EIIA 2(PFAM登录号PF00359)蛋白，包括SEQ ID NO：36中的蛋白。SEQ ID NO：36也是PTS系统的成员，果糖特异性I IB亚单位(PFAM登录号PF02379)。本发明的磷酸转移酶系统，EIIB家族(PFAM登录号PF00367)蛋白，包括SEQ ID NOS：12，14，32，34，102，104268和290中的蛋白。本发明的磷酸转移酶系统，EIIC家族(PFAM登录号PF02378)蛋白，包括SEQ ID NOS：12，14，16，28，30，32，34，36，102，104，174，268，270，272和290中的蛋白。

乳糖/纤维二糖特异性家族是四个结构和功能上不同的群体之一。IIA PTS系统酶(PFAM登录号PF02255)正常以位于中心的金属离子稳定化的同型三聚体起作用。本发明的PTS系统，乳糖/纤维二糖特异性IIA亚单位家族蛋白包括SEQ ID NO：4的蛋白。乳糖/纤维二糖特异性IIB亚单位家族(PFAM登录号PF02302)是胞质酶。IIB纤维二糖的折叠显示出与哺乳动物酪氨酸磷酸酶相似的结构。本发明的PTS系统，乳糖/纤维二糖特异性IIB亚单位家族蛋白包括SEQ ID NO：170的蛋白。

甘露糖家族在PTS通透酶家族当中，在几个方面是独特的。它是唯一的其中成员具有IID蛋白的PTS家族；它是唯一的其中IIB组分在组氨酰上而不是半胱氨酰残基上磷酸化的PTS家族；以及它的通透酶成员显示出对大范围糖的宽泛特异性，而不是仅对一种或一些糖具有特异性。SEQ ID NOS：20和264是PTS系统果糖IIA组分(PFAM登录号PF03610)家族的成员。SEQ ID NO：168是PTS系统甘露糖/果糖/山梨糖家族IID组分(PFAM登录号PF03613)的成员。SEQ ID NO：264是PTS系统山梨糖亚家族IIB组分(PFAM登录号PF03830)的成员。SEQ ID NO：166是PTS系统山梨糖特异性iic组分家族(PFAM登录号PF03609)的成员。

已经证明催化磷酰基从磷酸烯醇丙酮酸(PEP)通过磷酸基*组氨酸中间体转移的许多酶在结构上相关(Reizer et al.(1993)ProteinSci.2：506-21)。所有这些酶共享相同的催化机制：它们结合PEP并将磷酰基从它转移至组氨酸残基。那个残基周围的序列非常保守。常常发现PEP利用酶TIM圆筒结构域(PFAM登录号PF02896)与丙酮酸磷酸二激酶PEP/丙酮酸结合结构域(INTERPRO：IPR002192)在它的N-末端和PEP利用酶可移动结构域(PFAM登录号PF00391)相结合。PEP利用酶可移动结构域是“旋转”β/β/α结构域，被认为是已知在含有它的所有蛋白中均可以移动(Cosenza et al.(2002)J.Mol.Biol.318：1417-32)。常常发现它与丙酮酸磷酸二激酶PEP/丙酮酸结合结构域(INTERPRO：IPR002192)在它的N-末端相结合。本发明的PEP利用酶TIM圆筒结构域蛋白包括SEQ ID NO：180的蛋白。本发明的PEP利用酶可移动结构域蛋白包括SEQ ID NO：180和258的蛋白。本发明的PEP利用酶N-末端家族(PFAM登录号PF05524)蛋白包括SEQ ID NO：180的蛋白。

多药转运蛋白的主要促进蛋白超家族(major facilitatorsuperfamily，MFS)的成员具有12或14个跨膜区段。多药转运蛋白的小多药抗性家族(SMR)成员被认为形成紧密压实的四螺旋反平行束。它们赋予对各种各样的毒性化合物的抗性(通过从细胞中除去它们)。抗性小结-细胞分裂家族(RND)成员含有单个N-末端跨膜区段和大的C-末端周质结构域(Putman et al.(2000)Microbiol.Mol.Biol.Reviews 64：672-693)。已经描述了这些类型的多药转运蛋白以及MFS、SMR和RND家族的全部多药转运蛋白，以及来自各种细菌的特异性蛋白中每一种蛋白内的保守基序(具有登录号)(Putman et al.(2000)supra)。本发明的多药转运蛋白包括SEQ ID NOS：78，80，82，84，86，88，92，94，282，284，286，288和322的蛋白。

糖(及其它)转运蛋白家族(PFAM登录号PF00083)是主要促进蛋白超家族族的成员。MFS转运蛋白是仅能够应答化学渗透离子梯度而转运小溶质的单一多肽二级载体。所有目前认可的MFS通透酶在单个多肽链内保留两个六跨膜区段(TMS)单位，尽管在17个MFS家族中的3个发现了另外的两个TMSs(Paulson et al.(1996)Microbiol.Rev.60：575-608)。此外，TMS2和TMS3之间很保守的MFS特异基序以及TMS8和TMS9之间相关但不是很保守的基序(Henderson and Maiden(1990)Philos.Trans.R.Soc.Lond.B.Biol.Sci.326：391-410)被证明是所鉴定到的事实上全部300种以上MFS蛋白的特征。本发明的糖(及其它)转运蛋白包括SEQ ID NOS：80和282的蛋白。

细菌结合蛋白依赖性转运系统是通常由将能量与活化转运系统相偶合的周质底物结合蛋白、一个或两个相互同源的整合内膜蛋白(PFAM登录号PF00528)和一个或两个外周膜ATP结合蛋白组成的多组分系统。该整合内膜蛋白将底物移位穿过膜。已经表明大多数这些蛋白含有位于它们C-末端约80至100个残基的保守区(Dassa and Hofnung(1985)EMBO J.4：2287-93；Saurin et al.(1994)Mol.Microbiol.12：993-1004)。这个区域似乎位于两个跨膜结构域之间的胞质环(Pearce et al.(1992)Mol.Microbiol.6：47-57)。这些蛋白可以分为七个家族，分别被称为：araH、cysTW、fecCD、hisMQ、livHM、malFG和oppBC。本发明的结合蛋白依赖性转运系统内膜组分蛋白包括SEQ ID NOS：42，44，62，64，112，114和294中的蛋白。支链氨基酸转运系统/通透酶组分家族(PFAM登录号PF02653)是主要包含高亲合力支链氨基酸转运蛋白的大家族。在这个家族中还发现了来自半乳糖转运系统通透酶和核糖转运系统的蛋白。本发明的支链氨基酸转运系统/通透酶组分蛋白包括SEQ ID NOS：54，72和74中的蛋白。

SEQ ID NO：184是HPr丝氨酸激酶N末端家族(PFAM登录号PF02603)的成员，和HPr丝氨酸激酶C末端家族(PFAM登录号PF07475)的成员。N末端家族表示Hpr丝氨酸-苏氨酸激酶PtsK的N-末端区域。C末端家族表示Hpr丝氨酸-苏氨酸激酶PtsK的C末端激酶结构域。这个激酶是细菌中控制碳分解代谢物阻遏的多组分磷酸化系统的传感器(Marquez et al.(2002)Proc.Natl.Acad.Sci.U.S.A.99：3458-63)。这个激酶异乎寻常，因为它识别它的靶的三级结构，并且是与任何先前描述的蛋白磷酸化酶无关的新家族的成员。1.95A的分辨率下，来自木糖葡萄球菌的全长晶体酶的X-射线分析显示该酶由两个明显分开的结构域组成，它们装配在类似三叶螺旋桨的六聚结构中。桨叶各由两个N-末端结构域每一个形成，紧密轮毂装配C-末端激酶结构域(Reizer et al.(1998)Mol.Microbiol.27：1157-69)。

LacI家族(PFAM登录号PF00532)的周质结合蛋白和糖结合结构域包括周质结合蛋白和LacI家族转录调节蛋白。周质结合蛋白是趋化性和许多基于糖的溶质转运的初级受体。LacI家族的蛋白由lac阻遏子相关的转录调节蛋白组成。在这种情况下，通常糖结合结构域结合改变阻遏子结构域(lacI)的DNA结合活性的糖。本发明的LacI家族蛋白的周质结合蛋白和糖结合结构域包括SEQ ID NOS：38和98中的蛋白。

细菌高亲合力转运系统涉及溶质穿过细胞质膜的主动转运。这些运输系统的蛋白成分包括一个或两个跨膜蛋白成分、一个或两个膜关联ATP结合蛋白和高亲合力周质溶质-结合蛋白(PFAM登录号PF01547)。革兰氏阳性细菌由单一膜围绕，因此没有周质区域，在这种细菌中，同等蛋白通过N-末端脂质锚与膜结合。这些同源蛋白在转运过程本身中不起完整作用，但是大概充当受体以触发或启动溶质通过与流出系统的整合膜蛋白的外部部位结合而跨膜的转运。此外，至少一些溶质结合蛋白在感觉转导途径的启动中起作用。本发明的细菌胞外溶质结合蛋白包括SEQ ID NOS：40，66，116，262，274和296中的蛋白。

糖转运蛋白家族(PFAM登录号PF06800)是大约300个残基长的细菌糖转运蛋白的家族。成员包括葡萄糖摄取蛋白(Fiegler et al.(1999)J.Bacteriol.181：4929-36)、核糖转运蛋白和可能与跨细菌膜的糖转运有关的几个推定的和设想的膜蛋白。本发明的糖转运蛋白包括SEQ ID NO：234中的蛋白。

MIP(主要内在蛋白)家族蛋白(PFAM登录号PF00230)显示出基本上截然不同的两类通道性能：(1)通过aquaporins的特异水分转运，和(2)小的中性溶质转运，如通过甘油促进蛋白转运甘油(Froger et al.(1998)Protein Sci.7：1458-68)。MIP家族蛋白被认为含有6个TM结构域。序列分析提示这些蛋白也许是由含有3个TM结构域的原始蛋白通过串联、基因内复制而产生(Wistow et al.(1991)TrendsBiochem.Sci.16：170-1)。

本发明的一般转运蛋白包括SEQ ID NOS：76，90，96和194中的蛋白。

本发明包括的核酸和蛋白成分是分离或基本上纯化的。“分离”或“基本上纯化”意思是所述核酸或蛋白分子或其生物学活性片段或变体实质上或基本上没有正常发现的与自然状态的核酸或蛋白结合的成分。这种成分包括其它细胞物质、来自重组产物的培养基、和/或化学合成蛋白或核酸中使用的各种化学试剂。优选地，本发明的“分离的”核酸不含与获得该核酸的生物体的基因组DNA中感兴趣核酸侧接的核酸序列(如5′或3′末端存在的编码序列)。然而，该分子可能包括一些不会有害影响组分的基本特征的另外碱基或部分。例如，在各种实施方案中，分离的核酸含有正常与获得它的细胞中基因组DNA结合的小于5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核酸序列。类似地，基本上纯化的蛋白具有小于约30％、20％、10％、5％或1％(以干重计算)的污染蛋白或非碳水化合物利用相关蛋白。当重组生产该蛋白时，优选培养基占蛋白制剂的体积的30％、20％、10％或5％以下，当化学生产该蛋白时，优选制剂中具有小于约30％、20％、10％或5％(以干重计算)的化学试剂前体或非碳水化合物利用相关化学试剂。

本发明的组合物和方法可用于调节嗜酸乳杆菌的碳水化合物利用相关或多药转运蛋白分子的功能。“调节”、“改变”或“改进”意思指靶生物活性的上调或下调。本发明的蛋白可用于改进乳酸菌的生物学活性，以及改进由这种细菌发酵的食物的营养或健康促进特征。本发明的核苷酸分子可用于调节乳酸菌表达碳水化合物利用相关或多药转运蛋白。包括本发明核酸表达的上调或下调。上调可以例如通过提供多基因拷贝、通过修饰调节元件调节表达、促进转录或翻译机制或其它方式完成。下调可以例如通过使用已知的反义和基因沉默技术完成。

“乳酸菌”是指来自选自下列属的细菌：气球菌属(Aerococcus)、肉杆菌属(Carnobacterium)、肠球菌属(Enterococcus)、乳球菌属(Lactococcus)、乳杆菌属(Lactobacillus)、明串珠菌属(Leuconostoc)、酒球菌属(Oenococcus)、小球菌属(Pediococcus)、链球菌属(Streptococcus)、蜜蜂球菌属(Melissococcus)、差异球菌属(Alloiococcus)、狡诈球菌属(Dolosigranulum)、产乳酸球菌属(Lactosphaera)、四联球菌属(Tetragenococcus)、漫游球菌属(Vagococcus)和魏斯氏菌属(Weissella)(Holzapfel et al.(2001)Am.J Clin.Nutr.73：365S-373S；Bergey′s Manual of SystematicBacteriology，Vol.2(Williams and Wilkins，Baltimore；(1986))pp.1075-1079)。

本发明的多肽或表达它们的微生物可有效作为营养增补剂或添加物以及作为乳品和发酵过程中的增补剂。核酸序列、所编码多肽和表达它们的微生物在乳副产品，如乳酪、酸乳酪、发酵乳产品、酸牛奶和酪乳的制备中有用。表达本发明多肽的微生物可以是益生菌生物体。“益生菌”意思指通过胃肠道能存活和对受试者具有有益影响的活微生物。“受试者”意思指接触表达本发明蛋白的微生物的生物体。受试者可以指人和其它动物。

除在此公开的碳水化合物利用相关和多药转运蛋白核苷酸序列及其片段和变体之外，本发明的核酸还包括通过与获自在此公开的碳水化合物利用相关和多药转运蛋白核苷酸序列或其变体和片段的全部或部分序列杂交而从其它生物体或细胞鉴定和分离的同源核酸序列。

片段和变体

本发明提供了包含编码碳水化合物利用相关和多药转运蛋白的核苷酸序列的分离的核酸，以及由其编码的碳水化合物利用相关和多药转运蛋白。“碳水化合物利用相关蛋白”是指具有SEQ ID NOS：2-364中偶数号所述的氨基酸序列的蛋白。还提供了这些核苷酸序列及所编码的蛋白的片段和变体。核苷酸序列或蛋白的“片段”是指所述核苷酸或氨基酸序列的一部分。

在此公开的核酸的片段可以用作杂交探针以鉴定编码碳水化合物利用相关蛋白的核酸或编码多药转运蛋白的核酸，或可以用作扩增方案例如[例如聚合酶链式反应(PCR)]或者碳水化合物利用相关或多药转运蛋白核酸突变中的引物。本发明的核酸片段还可以与物理基质结合以包含可视作大或微阵列的物质(参见例如美国专利5,837,832；美国专利5,861,242；WO 89/10977；WO 89/11548；WO 93/17126；美国专利6,309,823)。这种核酸阵列或“芯片”可以用于研究基因表达或鉴定与靶序列具有足够同一性的核酸。

本发明进一步提供了核酸阵列或芯片，即众多核酸(例如DNA)作为精确组织或阵列在固相支持物上的分子探针，其可用于基因测序、其中所含突变的研究和/或基因表达分析，由于它们的尺寸很小并且在分析数量方面具有大容量，象这样的阵列和芯片目前令人感兴趣。

这些核酸阵列/芯片的功能是基于分子探针，主要是寡核苷酸，其附着于具有通常几平方厘米或依照要求为更大尺寸的载体。为了分析，载体，如DNA阵列/芯片中的载体，被DNA探针(例如寡核苷酸)包被，这些探针排列在载体上预定的地点或位置。使含有待分析的靶核酸和/或其片段(例如已经预先标记的DNA或RNA或cDNA)的样品接触该DNA阵列/芯片，导致通过杂交形成双螺旋。洗涤步骤后，芯片表面的分析使得可借助标记靶发出的信号而对任何杂交进行定位。产生杂交指纹，通过计算机处理，可用于情报检索如基因表达、样品中特异性片段的存在、序列测定和/或突变鉴定。

在本发明的一个实施方案中，靶核酸和以探针形式使用和放置或原位合成在DNA芯片/阵列上的本发明核酸之间的杂交可以通过如本领域熟知的荧光、放射性、电子检测技术等等确定。

在另一个实施方案中，本发明的核苷酸序列可以DNA阵列/芯片形式使用，以进行嗜酸乳杆菌基因表达的分析。这个分析是基于DNA阵列/芯片，其上存在针对其特异性而选择的、用于表征给定基因或核苷酸序列的探针。待分析的靶序列在芯片上杂交之前被标记。洗涤后，检测和定量标记的复合物，至少一式两份进行杂交。相同探针针对不同样品和/或不同探针针对相同样品获得的信号强度的比较分析可以用于分析例如来源于样品的RNA的差异转录。

在又一个实施方案中，含有本发明核苷酸序列的阵列/芯片可以包含对其它微生物特异的核苷酸序列，其允许对样品中微生物的存在情况进行系列测试和快速鉴定。

在进一步的实施方案中，DNA阵列/芯片的原理还可以用于制备蛋白阵列/芯片，其上的支持物已经被本发明的多肽和/或抗体或其阵列代替核酸包被。这些蛋白阵列/芯片使得有可能通过例如表面基元共振(SPR)分析例如包被了蛋白的载体上靶的亲合性捕获诱导的生物分子相互作用。能够特异性结合来源于待分析样品的抗体或多肽的本发明多肽或抗体可以用在检测和/或鉴定样品中蛋白和/或肽的蛋白阵列/芯片中。

因此，本发明提供了包含本发明各种核酸(以任何组合，包括重复)的微阵列或微芯片，以及包含本发明各种多肽(以任何组合，包括重复)的微阵列。还提供了包含与本发明各种多肽(以任何组合，包括重复)特异性反应的抗体的微阵列。

“核酸”是指DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)和使用核苷酸类似物产生的DNA或RNA的类似物。核酸可以是单链或双链的，但是通常是双链DNA。编码碳水化合物利用相关蛋白或多药转运蛋白的核酸的片段可以编码具有生物学活性的蛋白片段或可以用作在此描述的杂交探针或PCR引物。在此公开的多肽的生物学活性片段可以通过以下方法制备：分离本发明核苷酸序列之一的一部分，表达所编码的蛋白部分(例如通过体外重组表达)和评估所编码蛋白部分的活性。编码碳水化合物利用相关或多药转运蛋白的核酸的片段包含至少约5、10、15、20、25、30、35、40、45、50、75、100、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1600、1700、1800、1900、2000、2200或2500个连续核苷酸，包括5和2500之间的在此未具体余述的任何数目，或可多达在此公开的全长碳水化合物利用相关或多药转运蛋白核苷酸序列中存在的核苷酸总数(例如对于SEQ ID NO：1是432，对于SEQ ID NO：3是369，等等)。

氨基酸序列的片段包括适合用作免疫原以产生抗碳水化合物利用相关或抗多药转运蛋白抗体的多肽片段。片段包括包含与本发明的碳水化合物利用相关或多药转运蛋白或部分长度蛋白的氨基酸序列足够相同或来源于此的氨基酸序列、并且显示出碳水化合物利用相关或多药转运蛋白的至少一种活性，但是包括比在此公开的全长蛋白更少的氨基酸的肽。典型地，生物学活性部分包含具有碳水化合物利用相关或多药转运蛋白至少一种活性的结构域或基序。碳水化合物利用相关或多药转运蛋白的生物学活性部分可以是如下多肽，例如长度为10、25、50、100、150、200、250、300、350、400、450、500、550、600、650个连续氨基酸，或10和650之间的在此没有具体叙述的任何数字，可高达本发明全长蛋白中存在的氨基酸总数(例如对于SEQ ID NO：2是144，对于SEQ ID NO：4是123等等)。这种生物学活性部分可以通过重组技术制备并评价天然碳水化合物利用相关或多药转运蛋白的一种或多种功能活性。如这里使用的，片段包含SEQ ID NOS：2-364中任何偶数号序列的至少5个连续氨基酸。然而，本发明包括其它片段，如蛋白质的大于6、7、8或9个氨基酸的任何片段。

核苷酸和氨基酸序列的变体包括在本发明中。“变体”是指足够相同的序列。因此，本发明包括与编码SEQ ID NOS：2-364中偶数号的碳水化合物利用相关蛋白和多药转运蛋白的核苷酸序列足够相同的分离的核酸，或在严格条件下与SEQ ID NOS：1-363中奇数编号的核酸或其互补链杂交的核酸。变体还包括由本发明的变异核苷酸序列编码的多肽。此外，本发明的多肽具有与SEQ ID NOS：2-364中偶数号所述氨基酸序列足够相同的氨基酸序列。“足够相同”是指第一个氨基酸或核苷酸序列与第二个氨基酸或核苷酸序列相比，含有足够或最小量的等同或相同氨基酸残基，因而提供共同的结构域和/或显示共同的功能活性。保守变体包括由于遗传密码简并性而不同的那些序列。

通常，分别与SEQ ID NOS：2-364中偶数号的任何氨基酸序列或SEQ ID NOS：1-363中奇数编号的任何核苷酸序列具有至少约45％、55％或65％同一性，优选至少约70％或75％同一性，更优选至少约80％、85％或90％，最优选至少约91％、92％、93％、94％、95％、95％、96％、97％、98％或99％序列同一性的氨基酸或核苷酸序列在此被定义为足够相同。本发明中包括的变异蛋白是有生物学活性的，也就是说它们保留天然蛋白的期望生物活性，即在此描述的碳水化合物利用相关活性或多药转运蛋白活性。本发明蛋白的生物学活性变体可以与所述蛋白有少至如1-15个氨基酸残基、少至如1-10个、如6-10个、少至如5个、少至如4、3、2或甚至1个氨基酸残基的差异。

天然存在的变体可以存在于群体内(例如嗜酸乳杆菌群)。这种变体可以使用众所周知的分子生物学技术鉴定到，如聚合酶链式反应(PCR)和如下所述的杂交。合成得到的核苷酸序列，例如由定点诱变或PCR介导的诱变产生的、仍然编码碳水化合物利用相关蛋白或多药转运蛋白的序列也包括在变体范围内。可以将一个或多个核苷酸或氨基酸取代、添加或缺失引入在此公开的核苷酸或氨基酸序列内，从而将该取代、添加或缺失引入编码的蛋白。可以在天然蛋白的N末端或C末端，或在天然蛋白的一个或多个位点进行添加(插入)或缺失(截短)。类似地，一个或多个核苷酸或氨基酸的取代可以在天然蛋白的一个或多个位点进行。

例如，保守氨基酸取代可以在一个或多个预测的、优选非必需的氨基酸残基处进行。“非必需”氨基酸残基是可以由蛋白的野生型序列改变、而不改变生物活性的残基，而“必需”氨基酸是生物活性所需要的。“保守氨基酸取代”是氨基酸残基被具有相似侧链的氨基酸残基所代替的取代。具有相似侧链的氨基酸残基家族是本领域已知的。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。这种取代不应对保守氨基酸残基或对位于保守基序内(在那里这种残基是蛋白活性必需的)的氨基酸残基进行。

可供选择地，突变可以随机地沿碳水化合物利用相关或多药转运蛋白编码序列的全部或部分长度进行，如通过饱和诱变。突变体可以被重组表达，并通过使用标准试验技术检测碳水化合物利用相关或多药转运蛋白活性来筛选保留生物活性的突变体。诱变和核苷酸序列改变的方法是本领域已知的。参见例如Kunkel(1985)Proc.Natl.Acad.Sci.USA 82：488-492；Kunkel et al.(1987)Methods in Enzymol.Molecular Biology(MacMillan Publishing Company，New York)和其中引用的参考文献。显然，在编码变体的DNA中进行的突变不应该破坏阅读框，优选不会产生可以形成二级mRNA结构的互补区。参见EP专利申请公开号75,444。有关不影响感兴趣蛋白的生物活性的适当氨基酸取代的指导可以在Dayhoff et al.(1978)Atlas of ProteinSequence and Structure(Natl.Biomed.Res.Found.，Washington，D.C.)的模型中找到，在此引入作为参考。

预计在此包括的蛋白序列的缺失、插入和取代对蛋白的特性不产生根本改变。然而，当在这样做之前难以预测取代、缺失或插入的确切影响时，本领域技术人员会理解该影响能通过常规筛选试验评估。也就是说，该活性可以通过原始序列活性与修饰序列活性比较来估计。参见下部分的“使用方法”，例如可以用来测定碳水化合物利用相关活性或多药转运蛋白活性的试验。

本发明的变异核苷酸和氨基酸序列也包括得自诱变和重组程序如DNA改组的序列。用这种程序，一个或多个不同的碳水化合物利用相关或多药转运蛋白编码区可用于产生具有期望特性的新的碳水化合物利用相关蛋白或新的多药转运蛋白。用这样的方式，从包含具有基本序列同一性的序列区的相关序列多核苷酸群产生重组多核苷酸文库并可以在体外或体内同源重组。例如，使用这个方法，编码感兴趣结构域的序列基序可以在本发明碳水化合物利用相关或多药转运蛋白基因和其它碳水化合物利用相关或多药转运蛋白基因之间进行改组，以获得编码感兴趣的性能提高的蛋白的新基因，如在酶的情况下Km增加。这种DNA改组的策略是本领域已知的。参见例如Stemmer(1994)Proc.Natl.Acad.Sci.USA 91：10747-10751；Stemmer(1994)Nature370：389-391；Crameri et al.(1997)Nature Biotech.15：436-438；Moore et al.(1997)J Mol.Biol.272：336-347；Zhang et al.(1997)Proc.Natl.Acad.Sci.USA 94：4504-4509；Crameri et al.(1998)Nature 391：288-291；和美国专利5,605,793和5,837,458。

碳水化合物利用相关和多药转运蛋白的变体可以起激动剂(模拟)或拮抗剂的作用。蛋白激动剂可以保留与天然存在形式的蛋白基本上相同的生物学活性或其亚组。蛋白拮抗剂可以抑制天然存在形式蛋白的一种或多种活性，通过例如竞争性结合包括碳水化合物利用相关或多药转运蛋白的细胞信号级联反应的下游或上游成员。

起激动剂或拮抗剂作用的碳水化合物利用相关或多药转运蛋白的变体可以通过针对碳水化合物利用相关或多药转运蛋白的突变体，例如截短突变体的激动剂或拮抗剂活性筛选组合文库鉴定到。在一个实施方案中，碳水化合物利用相关变体的多样化文库通过在核酸水平组合诱变产生并由多样化基因文库编码。碳水化合物利用相关或多药转运蛋白变体的多样化文库可以如下产生，通过例如酶法将合成寡核苷酸混合物连入基因序列，使得潜在的碳水化合物利用相关或多药转运蛋白序列的简并组可作为独立多肽表达，或者可供选择地，作为其中含有碳水化合物利用相关或多药转运蛋白序列组的一组较大的融合蛋白(例如对于噬菌体展示)表达。有可用于从简并寡核苷酸序列产生潜在碳水化合物利用相关或多药转运蛋白变体的文库的各种方法。简并基因序列的化学合成可以在DNA自动合成仪中进行，然后可以将合成基因与适当的表达载体相连接。基因简并组的使用允许以混合物提供编码期望潜在碳水化合物利用相关或多药转运蛋白序列组的所有序列。合成兼并寡核苷酸的方法是本领域已知的(参见例如，Narang(1983)Tetrahedron 39：3；Itakura et al.(1984)Annu.Rev.Biochem.53：323；Itakura et al.(1984)Science 198：1056；Ikeet al.(1983)Nucleic Acids Res.11：477)。

此外，碳水化合物利用相关或多药转运蛋白编码序列片段的文库可用于产生筛选和随后选择碳水化合物利用相关或多药转运蛋白变体的碳水化合物利用相关或多药转运蛋白片段的多样化群。在一个实施方案中，编码序列片段的文库可以通过以下产生：在每分子仅仅发生大约一次切口的条件下，用核酸酶处理碳水化合物利用相关或多药转运蛋白编码序列的双链PCR片段，变性双链DNA，对DNA复性以形成双链DNA(双链DNA可以包括来自不同切口产物的有义/反义对)，通过用S1核酸酶处理而从重新形成的双螺旋除去单链部分，和将所产生的片段连入表达载体。用这个方法，人们可以得到编码碳水化合物利用相关或多药转运蛋白的各种大小N末端和内部片段的表达文库。

筛选由点突变或截短制备的组合文库基因产物和筛选具有所选性能的基因产物的cDNA文库的几个技术是本领域已知的。这种技术可调整成用于由碳水化合物利用相关或多药转运蛋白的组合诱变产生的基因文库的快速筛选。适于高流通量分析、筛选大基因文库的最广泛使用的技术通常包括将基因文库克隆入复制型表达载体，用所产生的载体文库转化适当的细胞，和在对期望活性的检测可促进分离编码产物被检测的基因的载体条件下表达组合基因。循环整体诱变(REM)-一种增加文库中功能性突变体频率的技术，可以与筛选试验组合使用以鉴定碳水化合物利用相关或多药转运蛋白变体(Arkin and Yourvan(1992)Proc.Natl.Acad.Sci.USA 89：7811-7815；Delgrave etal.(1993)Protein Engineering 6(3)：327-331).

序列同一性

碳水化合物利用相关和多药转运蛋白序列是具有保守功能特征的分子的家族的成员。“家族”是指具有足够核苷酸或氨基酸序列同一性的两个或更多蛋白或核酸。含有高度不同的组的家族可以被分成亚家族。氏族(clan)是被认为具有共同祖先的一组家族。氏族成员常常具有相似的三级结构。“序列同一性”意思指当对至少一个针对比较窗口比对两个序列以获得最大一致性时相同的核苷酸或氨基酸残基。“比较窗口”是指两个核苷酸或氨基酸序列最佳比对时的连续片段，其中第二个序列与第一个序列相比可以含有添加或缺失(即缺口)。通常，对于核酸比对，比较窗口长度至少20个连续核苷酸，任选可以是30、40、50、100个或更长。对于氨基酸序列比对，比较窗口长度至少6个连续氨基酸，任选可以是10、15、20、30个或更长。本领域技术人员理解，为了避免由于包含缺口造成的高相似性，通常引入缺口罚分并从匹配数字减去该罚分。

家族成员可以来自相同或不同物种，并且可以包括同源物以及不同的蛋白。常常一个家族的成员显示出共同的功能特征。同源物可以根据它们与在此公开的嗜酸乳杆菌碳水化合物利用相关或多药转运蛋白核酸序列的同一性，使用cDNA或其部分作为杂交探针，根据标准杂交技术在如下公开的严格杂交条件下而分离。

为确定两个氨基酸或核苷酸序列的同一性百分比，进行比对。两个序列的同一性百分比是比较窗口中两个序列共享的相同残基数的函数(即同一性百分比＝相同残基数/残基总数×100)。在一个实施方案中，序列长度相同。与以下提及方法相似的方法可以用来确定两个序列之间的同一性百分比。该方法可以在允许或不允许缺口的情况下使用。比对也可以通过检查人工进行。

当氨基酸序列在保守取代方面不同时，同一性百分比可以向上调节以修正取代的保守性质。进行这种调整的方法是本领域已知的。通常保守取代作为部分而不是完全错配进行评分，由此增加序列同一性百分比。

数学算法可用于确定两个序列的同一性百分比。数学算法的非限制性实例是Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA87：2264的算法，如Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90：5873-5877修改；Myers和Miller(1988)CABIOS 4：11-17的算法；Smith et al.(1981)Adv.Appl.Math.2：482的局部比对算法；Needleman和Wunsch(1970)J.Mol.Biol.48：443-453的全面比对算法；和Pearson和Lipman(1988)Proc.Natl.Acad.Sci.USA 85：2444-2448的检索局部比对方法。

已经设计了基于这些数学算法的各种计算机执行程序，以便能够确定序列同一性。Altschul et al.(1990)J.Mol.Biol.215：403的BLAST程序是基于上述Karlin和Altschul(1990)的算法。获得与本发明核苷酸序列同源的核苷酸序列的检索可以用BLASTN程序、得分＝100、字长＝12实施。为获得与编码本发明的蛋白或多肽的序列同源的氨基酸序列，可以使用BLASTX程序，得分＝50、字长＝3。通过使用Altschul et al.(1997)Nucleic acids Res.25：3389中描述的Gapped BLAST(BLAST 2.0)可以获得缺口比对。为了检测分子间的距离关系，可以使用PSI-BLAST。参见上述Altschul et al.(1997)。对于所有BLAST程序，可以使用各个程序的默认参数。比对也可以通过检查人工进行。

可以用来确定序列同一性百分比的另一程序是ALIGN程序(2.0版本)，其使用上述Myers和Miiler(1988)的数学算法。当比较氨基酸序列时，PAM120加权残基表、缺口长度罚分为12和缺口罚分为4可以与这个程序一起使用。

除ALIGN和BLAST程序之外，BESTFIT、GAP、FASTA和TFASTA程序是GCG Wisconsin遗传学软件包第10版本(可以从Accelrys Inc.，9685 Scranton Rd.，San Diego，California，USA获得)的一部分，并可以用于进行序列比对。该优选程序是GAP版本10，它使用上述Needleman和Wuns ch(1970)的算法。除非另有说明，在此提供的序列同一性值是指通过使用具有下列参数的GAP版本10获得的那些值：核苷酸序列同一性％和相似性％使用GAP重量为50和长度重量为3，以及nwsgapdna.cmp得分矩阵；氨基酸序列同一性％和相似性％使用GAP重量为8和长度重量为2以及BLOSUM62得分矩阵；或其任何等同程序。“等同程序”意思指对于讨论中的任何两个序列任何序列，当与GAP版本10产生的相应比对相比时，产生具有相同核苷酸或氨基酸残基匹配和相同序列同一性百分比的比对的比较程序。

BLASTN、FASTA、BLASTP或相似算法产生的数据库中序列与询问序列的比对通常被描述为“命中”(hit)。通过BLASTN、FASTA、BLASTP或相似算法产生的一个或多个数据库序列对被询问序列的命中可比对和鉴定序列的相似部分。对数据库序列的命中通常表示与询问序列的序列长度一部分，即询问序列的部分或片段重叠。然而，重叠可以表示询问序列的整个长度。BLASTN、FASTA或BLASTP算法产生的询问序列与数据库序列比对的命中通常以相似度和序列重叠长度的顺序排列。

通过BLASTN、FASTA或BLASTP算法与询问序列比对的多核苷酸和多肽命中产生“预期”值。预期值(E值)表示当检索某一大小的数据库时，人们“预期”在一定数目的连续序列上可随机看到的命中“数”。预期值被用作确定对数据库如GenBank或EMBL数据库的命中是否表明真实相似性的显著性阈值。例如，给多核苷酸命中指定为0.1的E值被解释为在GenBank数据库大小的数据库中，人们可以预期在具有相似得分的序列比对部分上随机看到0.1个匹配。通过这个标准，多核苷酸序列的比对和匹配部分相同的概率为90％。对于比对和匹配部分具有0.01或更小的E值序列，使用BLASTN或FASTA算法在GenBank数据库中随机找到匹配的概率是1％或更小。

根据本发明的实施方案，本发明的“变异”多核苷酸和多肽包含当与本发明的多核苷酸或多肽序列相比时产生约0.01或更小E值的序列。也就是说，变异多核苷酸或多肽是与本发明多核苷酸或多肽具有至少99％相同可能性，如使用设置为在此描述的参数的BLASTN、FASTA或BLASTP算法测定到具有0.01或更小E值的任何序列。在其它实施方案中，变异多核苷酸是与本发明多核苷酸具有至少99％相同可能性，如使用设置为在此描述参数的BLASTN或FASTA算法测定到具有0.01或更小E值的本发明多核苷酸序列具有相同数量或比其更少数量核酸的序列。类似地，变异多肽是与本发明多肽具有至少99％相同可能性，如使用设置为在此描述参数的BLASTP算法测定到具有0.01或更小E值的本发明多肽序列具有相同数量或比其更少数量氨基酸的序列。

如上所述，同一性百分比是如下确定的：使用设置为在此描述的工作参数的BLASTN、FASTA或BLASTP算法之一比对序列，并鉴定在比对部分上相同核酸或氨基酸的数量；将相同核酸或氨基酸的数量除以本发明多核苷酸或多肽序列的核酸或氨基酸总数；然后乘以100以确定同一性百分比。例如，在BLASTN算法使用在此描述的参数进行的比对中，本发明的具有220个核酸的多核苷酸与GenBank数据库中具有520个核酸的多核苷酸序列在23个核苷酸的片段上具有一个命中。23个核苷酸命中包括21个相同的核苷酸，一个缺口和一个不同的核苷酸。因此本发明多核苷酸与GenBank文库中命中的同一性百分比是21/220再乘以100，或9.5％。因此GenBank数据库中的多核苷酸序列不是本发明多核苷酸的变体。

同源序列的鉴定和分离

基于它们与在此所述的碳水化合物利用相关或多药转运蛋白核苷酸序列或其片段和变体的序列同一性鉴定的碳水化合物利用相关核苷酸序列包括在本发明中。方法如PCR或杂交可用于从cDNA或基因组文库鉴定序列，例如基本上与本发明序列相同的序列。参见例如Sambrook et al.(1989)Molecular Cloning.Laboratory Manual(2ded.，Cold Spring Harbor Laboratory Press，Plainview，NewYork)and Innis，et al.(1990)PCR Protocols：A Guide to Methodsand Applications(Academic Press，New York)。构建这种cDNA和基因组文库的方法通常是本领域已知的，并且也在上述参考文献中公开。

在杂交技术中，杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸，并且可以由在此公开的已知核苷酸序列的全部或部分组成。此外，可以用可检测基团如³²P或任何其它可检测标记，如其它放射性同位素、荧光化合物、酶或酶辅因子来标记它们。用于杂交的探针可以通过对基于在此公开的已知碳水化合物利用相关或多药转运蛋白核苷酸序列的合成寡核苷酸进行标记来制备。另外可以使用基于已知碳水化合物利用相关或多药转运蛋白核苷酸序列或所编码氨基酸序列的保守核苷酸或氨基酸残基设计的简并引物。杂交探针典型地包含在严格条件下与本发明核苷酸序列或其片段或变体的至少约10、优选约20、更优选约50、75、100、125、150、175、200、250、300、350或400个连续核苷酸杂交的核苷酸序列区域。为完成在各种条件下的特异性杂交，这种探针包括碳水化合物利用相关或多药转运蛋白序列当中独特的序列。杂交探针的制备是本领域已知的，并且在Sambrook et al.(1989)Molecular Cloning：A Laboratory Manual(2ded.，Cold Spring Harbor Laboratory Press，Plainview，NewYork)中公开，在此引入作为参考。

在一个实施方案中，编码碳水化合物利用相关或多药转运蛋白的全部核苷酸序列用作鉴定新的碳水化合物利用相关或多药转运蛋白序列和信使RNAs的探针。在另一个实施方案中，该探针是在此公开的核苷酸序列的片段。在一些实施方案中，在严格条件下与探针杂交的核苷酸序列长度可以是至少约300、325、350、375、400、425、450、500、550、600、650、700、800、900、1000、1200、1400、1600、1800或2000个核苷酸。

基本上相同的序列将在严格条件下彼此杂交。“严格条件”是指探针将与它的靶序列比与其它序列以可检测的更大程度杂交的条件(例如超过背景至少2倍)。通常，严格条件包括杂交和洗涤的那些条件，在此条件下具有至少约60％、65％、70％，优选75％序列同一性的核苷酸通常彼此保持杂交。严格条件是本领域已知的并且可以在Molecular Biology的Current Protocols中找到(John Wiley & Sons，New York(1989))，6.3.1-6.3.6。杂交通常进行约24小时以内，通常约4至约12小时。

严格条件是依赖于序列的，并且在不同的环境下将不同。全长或部分核酸序列可以用来获得本发明包括的同源物和/或直向同源基因。“直向同源基因”是指由共同的祖先基因得来的、并且由于物种形成而在不同物种中发现的基因。在不同物种中发现的基因，当它们的核苷酸序列和/或它们的编码蛋白序列共享在此任何地方定义的基本同一性时被认为是直向同源基因。直向同源基因的功能在各物种当中常常非常保守。

当使用探针时，杂交条件将是盐浓度小于约1.5M、通常约0.01至1.0M Na离子浓度(或其它盐)，pH 7.0至8.3，并且对于短探针(例如10至50个核苷酸)而言温度至少约30℃、对于长探针(例如大于50个核苷酸)而言温度至少约60℃的条件。

杂交后洗涤有助于控制特异性。两个关键因素是最终洗涤溶液的离子强度和温度。对于检测与全长或近似全长的靶序列杂交的序列，严格条件下的温度选择成比该具体序列在确定的离子强度和pH下的解链温度(Tm)低约5℃。然而，严格条件将包括比Tm低1℃至20℃范围的温度，这取决于期望的严格程度，或者是本文中合格的其它温度。对于DNA-DNA杂交，Tm可以使用Meinkoth and Wahl(1984)Anal.Biochem.138：267-284的方程式来确定：Tm＝81.5℃+16.6(logM)+0.41(％GC)-0.61(％甲酰胺)-500/L；其中M是一价阳离子的摩尔浓度、％GC是鸟嘌呤和胞嘧啶核苷酸在DNA中的百分比、％甲酰胺是杂交液中甲酰胺的百分比、L是以碱基对表示的杂交体长度。Tm是50％的互补靶序列与完美匹配的探针杂交的温度(在限定的离子强度和pH下)。

检测具有不同程度同源性的序列的能力可以通过改变杂交和/或洗涤条件的严格性获得。对于100％相同(同源探测)的靶序列，必须获得不允许错配的严格条件。若允许核苷酸残基错配发生，则可以检测到具有较低相似度的序列(异源探测)。对于每1％的错配，Tm降低约1℃；因此，可以操纵杂交和/或洗涤条件以允许具有目标同一性百分比的序列杂交。例如，如果优选具有≥90％序列同一性的序列，则Tm可以降低10℃。两个核苷酸序列可以基本上相同，而不能在严格条件下彼此杂交，但是它们编码的多肽基本上相同。例如，如果使用遗传密码的最大密码子简并性产生核酸拷贝的话，这种情况可以发生。

示例性的低严格条件包括在30-35％甲酰胺、1M NaCl、1％SDS(十二烷基硫酸钠)、37℃的缓冲液中杂交，和在1X至2X SSC(20X SSC＝3.0M NaCl/0.3M柠檬酸钠)、50至55℃洗涤。示例的中等严格条件包括在40至45％甲酰胺、1.0M NaCl、1％SDS、37℃杂交，和0.5X至1X SSC、55至60℃洗涤。示例的高严格条件包括在50％甲酰胺、1MNaCl、1％SDS、37℃杂交，和在0.1×SSC、60至65℃洗涤。任选地，洗涤缓冲液可以包含约0.1％至约1％SDS。杂交持续时间通常小于约24小时，通常约4至约12小时。核酸杂交的扩展指导在Tijssen(1993)Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes，Part I，Chapter2(Elsevier，New York)；和Ausubel et al.，eds.(1995)CurrentProtocols in Molecular Biology，Chapter 2(Greene Publishing andWiley-Interscience，New York)中找到。参见Sambrook et al.(1989)Molecular Cloning：A Laboratory Manual(2d ed.；Cold SpringHarbor Laboratory Press，Plainview，New York)。

在PCR方法中，可以设计寡核苷酸引物，用于在PCR反应中从感兴趣的任何生物提取的cDNA或基因组DNA扩增相应DNA序列。优选PCR引物长度至少约10个核苷酸，最优选至少约20个核苷酸。设计PCR引物和PCR克隆的方法是本领域通常已知的，并且在Sambrook etal.(1989)Molecular Cloning：A Laboratory Manual(2d ed.；ColdSpring Harbor Laboratory Press，Plainview，New York)中公开。还参见Innis et al.，eds.(1990)PCR Protocols：A Guide to Methodsand Applications(Academic Press，New York)；Innis and Gelfand，eds.(1995)PCR Strategies(Academic Press，New York)；和Innisand Gelfand，eds.(1999)PCR Methods Manual(Academic Press，NewYork)。PCR的已知方法包括但不限于使用配对引物、嵌套引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等等的方法。

试验

公开了检测样品中所述公开的多肽和/或核酸的表达以及所公开的它们的活性的诊断试验。检测样品中存在或不存在包含公开的多肽的公开的核酸或蛋白的示例方法包括从食品/乳制品/饲料产品、起始培养物(母液、种子、大规模/配套、浓缩、干燥、冻干、冰冻)、培养的食品/乳制品/饲料产品、食品增补剂、生物加工发酵物或已经摄取益生菌物质的受试者获得样品，使样品接触能够检测所公开的多肽或核酸(例如包含所公开的核酸或其片段的mRNA或基因组DNA)的化合物或试剂，使得在样品中检测所公开序列的存在情况。由来自食物、增补剂、培养物、产品或受试者的样品得到的结果可以与由来自对照培养物、产品或受试着得到的结果相比较。

检测包含公开的核苷酸序列的mRNA或基因组DNA的一种试剂是能够与mRNA或基因组DNA的已公开核苷酸序列杂交的标记核酸探针。核酸探针可以是例如公开的核酸，如SEQ ID NOS：1-363中奇数号的核酸或其一部分，如长度至少15、30、50、100、250或500个核苷酸并且在严格条件下足以与包含所述公开的核酸序列的mRNA或基因组DNA特异性杂交的核酸。在此描述了用于本发明诊断试验的其它合适探针。

检测包含公开多肽序列的蛋白的一种试剂是能够结合该公开多肽的抗体，优选具有可检测标记的抗体。抗体可以是多克隆的，或更优选单克隆的。可以使用完整抗体或其片段(例如Fab或F(ab′)2)。针对于探针或抗体使用的术语“标记的”意味着包括通过将可检测物质与探针或抗体偶联(即物理连接)直接标记探针或抗体，以及通过与直接标记的另一试剂反应而间接标记探针或抗体。间接标记的实例包括使用荧光标记二抗检测初级抗体和用生物素末端标记DNA探针，使得探针可以用荧光标记的链霉抗生物素蛋白检测到。

术语“样品”意思包括受试者中存在的或从其分离的组织、细胞和生物学流体，以及来自起始培养物的细胞或携带这种培养物或使用这种培养物得来的食品。也就是说，本发明的检测方法可用于体外和体内检测样品中包含公开序列的mRNA、蛋白或基因组DNA。检测包含公开序列的mRNA的体外技术包括Northern杂交和原位杂交。检测包含公开多肽的蛋白的体外技术包括酶联免疫吸附试验(ELISAs)、Western印迹、免疫沉淀法和免疫荧光法。检测包含公开核苷酸序列的基因组DNA的体外技术包括Southern杂交。此外，检测包含公开多肽的蛋白的体内技术包括将抗公开多肽的标记抗体引入受试者。例如，该抗体可以用其存在和在受试者中的定位可以通过标准成像技术检测的放射性标记来标记。

在一个实施方案中，该样品含有来自消耗益生菌物质的试验受试者的蛋白分子。可供选择地，该样品可以含有来自起始培养物的mRNA或基因组DNA。

本发明还包括检测样品中包含公开多肽的公开核酸或蛋白的存在情况的试剂盒。这种试剂盒可用于测定表达本发明具体多肽的微生物是否存在于食品或起始培养物或消耗益生菌物质的受试者中。例如，该试剂盒可以包括能够检测样品中的公开多肽或mRNA的标记化合物或试剂和测定样品中所公开多肽的量的途径(例如识别公开多肽的抗体或与编码公开多肽、例如SEQ ID NOS：2-364中的偶数号序列的DNA结合的寡核苷酸探针)。试剂盒还可以包括详述这种化合物的使用的说明书。

对于基于抗体的试剂盒，该试剂盒可以包括例如：(1)与公开多肽结合的第一抗体(例如附着于固相支持体)；和任选地(2)与公开多肽或第一个抗体结合并且缀合可检测试剂的的第二个不同抗体。对于基于寡核苷酸的试剂盒，该试剂盒可以包括例如：(1)与所公开核酸序列杂交的寡核苷酸，例如可检测标记的寡核苷酸或(2)可用于扩增所公开核酸的引物对。

该试剂盒还可以包括例如缓冲剂、防腐剂或蛋白稳定剂。该试剂盒还可以包括检测可检测试剂(例如酶或底物)所需的成分。该试剂盒还可以含有对照样品或对照样品系列，可以对其测试并与所含的测试样品比较。试剂盒的每个成分通常密封在单独容器内，并且所有各种各样的容器与使用说明书一起装在单个包装内。

在一个实施方案中，该试剂盒包括阵列形式的多个探针，如例如美国专利5,412,087和5,545,531以及国际公开号WO 95/00530中描述的探针，在此引入作为参考。供阵列之用的探针可以直接合成在阵列表面上，如国际公开号WO 95/00530公开的，或在固定到阵列表面上前先合成(Gait编(1984)Oligonucleotide Synthesis aPractical Approach IRL Press，Oxford，England)。该探针可以，使用本领域技术人员熟知的技术，如美国专利5,412,087中描述的技术固定在表面上。探针可以是核酸或肽序列，优选纯化的形式，或抗体。

阵列可以用来筛选生物体、样品或产品在它们的基因组、cDNA、多肽或抗体含量方面的差异，包括具体序列或蛋白的存在与否，以及那些物质的浓度。与捕获探针的结合例如通过来自附着于包含所述公开核酸序列的核酸、包含所公开氨基酸序列的多肽或抗体的标记产生的信号来检测。该方法可以包括使包含公开核酸、多肽或抗体的分子接触具有多元捕获探针的第一阵列和具有不同的多元捕获探针的第二阵列。可以比较每个杂交的结果以分析第一和第二样品之间表达的差异。第一个多元捕获探针可以来自对照样品，例如野生型乳酸菌或对照受试者，例如食品、食品增补剂、起始培养物样品或生物流体。第二个多元捕获探针可以来自实验样品，例如突变型乳酸菌或消耗益生菌物质的受试者，例如起始培养物样品或生物流体。

这些试验可能对微生物选择和必须检测不需要的物质的质量控制程序特别有用。特殊核苷酸序列或多肽的检测也可以用于确定食品、发酵产品或工业微生物或存在于消耗益生菌的动物或人消化系统的微生物的遗传组成。

反义核苷酸序列

本发明还包括反义核酸，即与编码蛋白的有义核酸互补的分子，例如与双链cDNA分子编码链互补的或与mRNA序列互补的分子。因此，反义核酸可以与有义核酸以氢键结合。反义核酸可以与整个碳水化合物利用相关或多药转运蛋白编码链互补，或仅与其一部分互补，例如全部或部分蛋白编码区(或开放读框)。反义核酸可以与编码碳水化合物利用相关或多药转运蛋白的核苷酸序列编码链的非编码区反义。非编码区是位于编码区侧翼并且不被翻译为氨基酸的5′和3′序列。反义核苷酸序列在破坏靶基因表达中有用。可以使用与相应序列具有70％，优选80％，更优选85％、90％或95％序列同一性的反义构建体。

在有编码在此公开的碳水化合物利用相关或多药转运蛋白(例如SEQ ID NOS：2-364中的偶数号序列)的编码链序列的情形下，可以根据Watson和Crick的碱基配对规则设计本发明的反义核酸。反义核酸可以与碳水化合物利用相关或多药转运蛋白mRNA整个编码区互补，但是更优选是与碳水化合物利用相关或多药转运蛋白mRNA的编码或非编码区的仅仅一部分反义的寡核苷酸。例如，反义寡核苷酸可以与围绕碳水化合物利用相关或多药转运蛋白mRNA翻译起始位点的区域互补。反义寡核苷酸长度可以是例如约5、10、15、20、25、30、35、40、45或50个核苷酸，或它可以是100、200个核苷酸或更长长度。本发明的反义核酸可以使用本领域已知的化学合成和酶促连接步骤来构建。

例如，可以使用天然存在的核苷酸或设计成增加该分子的生物学稳定性或增加反义和有义核酸之间形成的双螺旋的物理稳定性的各种修饰核苷酸，包括但不限于例如硫代磷酸酯衍生物和吖啶取代核苷酸来化学合成反义核酸(例如反义寡核苷酸)。可供选择地，可以使用其中核酸以反义方向(即从所插入的核酸转录的RNA对感兴趣的靶核酸将是反义方向)亚克隆核酸的表达载体来生物学制备反义核酸。

本发明的反义核酸可以是α-异头核酸。α-异头核酸与互补RNA形成特殊双链杂合体，其中与通常的β单位相反，该链彼此平行(Gaultier et al.(1987)Nucleic Acids Res.15：6625-6641)。反义核酸还可以包含2′-O-甲基核糖核苷酸(Inoue et al.(1987)Nucleic Acids Res.15：6131-6148)或嵌合RNA-DNA类似物(Inoueet al.(1987)FEBSLett.215：327-330)。

本发明还包括核酶，它是具有能够切割与其具有互补区的单链核酸如mRNA的核糖核酸酶活性的催化性RNA分子。核酶(例如锤头状核酶(Haselhoff and Gerlach(1988)Nature 334：585-591)中描述)可以用于催化切割碳水化合物利用相关蛋白mRNA转录物，由此抑制碳水化合物利用相关或多药转运蛋白mRNA的翻译。可以基于在此公开的碳水化合物利用相关或多药转运蛋白cDNA的核苷酸序列(例如SEQ IDNOS：1-363中的奇数号序列)设计对编码碳水化合物利用相关或多药转运蛋白的核酸具有特异性的核酶。参见例如Cech等的美国专利4,987,071；和Cech等的美国专利5,116,742。可供选择地，碳水化合物利用相关或多药转运蛋白mRNA可以用于从RNA分子库中选择具有特异核酶活性的催化性RNA。参见例如Bartel and Szostak(1993)Science 261：1411-1418。

本发明还包括形成三螺旋结构的核酸。例如，通过靶向与碳水化合物利用相关或多药转运蛋白调节区(例如碳水化合物利用相关或多药转运蛋白启动子和/或增强子)互补的核苷酸序列，形成阻止碳水化合物利用相关或多药转运基因在靶细胞中转录的三螺旋结构，可以抑制碳水化合物利用相关或多药转运蛋白基因表达。通常参见Helene(1991)Anticancer Drug Des.6(6)：569；Helene(1992)Ann.N.Y.Acad.Sci.660：27；and Maher(1992)Bioassays 14(12)：807。

在一些实施方案中，本发明核酸可以在碱基部分、糖部分或磷酸酯主链被修饰，以提高例如该分子的稳定性、杂交或溶解度。例如，核酸的脱氧核糖磷酸酯主链可以被修饰，以产生肽核酸(参见Hyrup etal.(1996)Bioorganic & Medicinal Chemistry 4：5)。在此使用的术语“肽核酸”或“PNAs”是指核酸模拟物，例如DNA模拟物，其中脱氧核糖磷酸酯主链被假肽主链取代，并且仅仅保留四种天然核碱基。已经表明PNAs的中性主链允许在低离子强度条件下与DNA和RNA特异性杂交。PNA寡聚体的合成可以使用例如Hyrup et al.(1996)supra；Perry-O′Keefe et al.(1996)Proc.Natl.Acad Sci.USA 93：14670中所述的标准固相多肽合成方案进行。

PNAs可以用作反义或反基因试剂，通过例如诱导转录或翻译停止或抑制复制而造成基因表达的序列特异性调控。本发明的PNAs还可以用在例如基因中单一碱基对突变的分析中，通过例如PNA指导的PCR夹板进行；当与其它酶，例如S1核酸酶(上述Hyrup(1996))组合使用时，可用作人工限制性内切酶；或用作DNA序列和杂交的探针或引物(上述Hyrup(1996)；上述Perry-O′Keefe et al.(1996)。

在另一个实施方案中，碳水化合物利用相关或多药转运蛋白分子的PNA s可以被修饰，以便如提高它们的稳定性、特异性或细胞摄取，通过将亲脂性或其它辅助基团与PNA连接、通过形成PNA-DNA嵌合体或通过使用脂质体或本领域已知的其它药物递送技术。PNA-DNA嵌合体的形成可以如Hyrup(1996)supra；Finn et al.(1996)NucleicAcids Res.24(17)：3357-63；Mag et al.(1989)Nucleic AcidsRes.17：5973；和Peterson et al.(1975)Bioorganic Med.Chem.Lett.5：1119所述来进行。

融合蛋白

本发明还包括碳水化合物利用相关或多药转运蛋白嵌合或融合蛋白。碳水化合物利用相关或多药转运蛋白“嵌合蛋白”或“融合蛋白”分别包含与非碳水化合物利用相关或非多药转运多肽可操作连接的碳水化合物利用相关或多药转运多肽。“碳水化合物利用相关多肽”或“多药转运多肽”是指分别具有对应于碳水化合物利用相关蛋白或多药转运蛋白的氨基酸序列的多肽，而“非碳水化合物利用相关多肽”或“非多药转运多肽”是指分别具有对应于与碳水化合物利用相关蛋白或多药转运蛋白并不基本上相同、源自于相同或不同生物的蛋白的氨基酸序列。在碳水化合物利用相关或多药转运蛋白融合蛋白内，碳水化合物利用相关或多药转运多肽可以相当于碳水化合物利用相关或多药转运蛋白的全部或部分，优选包括碳水化合物利用相关或多药转运蛋白的至少一种生物学活性部分。与融合蛋白有关的术语“可操作连接”意思表明碳水化合物利用相关或多药转运多肽和非碳水化合物利用相关或多药转运多肽彼此以符合读框的方式融合。非碳水化合物利用相关或多药转运多肽可以与碳水化合物利用相关或多药转运多肽的N末端或C末端融合。

连接的编码序列的表达产生形成融合蛋白的两个连接的异源氨基酸序列。载体序列(非碳水化合物利用相关或非多药转运多肽)可以编码增强或增加融合蛋白在细菌宿主中的表达的载体多肽。载体序列编码的融合蛋白部分，即载体多肽，可以是蛋白片段、完整功能性部分或完整蛋白序列。载体区域或多肽可以另外被设计用来纯化融合蛋白，包括用抗体或对载体多肽特异的亲和纯化。同样地，可以利用载体多肽的物理性能以允许融合蛋白的选择性纯化。

感兴趣的特殊载体多肽包括过氧化物歧化酶(SOD)、麦芽糖结合蛋白(MBP)、谷胱甘肽-S-转移酶(GST)、N-末端组氨酸(His)标记等等。这个名单不是限制性的，因为增强碳水化合物利用相关蛋白或多种药物抗性蛋白作为融合蛋白表达的任何载体多肽均可以用在本发明的方法中。

在一个实施方案中，融合蛋白是GST-碳水化合物利用相关融合蛋白，其中碳水化合物利用相关序列与GST序列C末端融合。在另一个实施方案中，融合蛋白是碳水化合物利用相关蛋白-免疫球蛋白融合蛋白，其中碳水化合物利用相关蛋白的全部或部分与来源于免疫球蛋白家族成员的序列融合。在其它实施方案中，融合蛋白包含本发明的多药转运蛋白。本发明的碳水化合物利用相关或多药转运蛋白-免疫球蛋白融合蛋白可以用作免疫原，在受试者中产生抗碳水化合物利用相关或抗多药转运蛋白相关抗体，纯化碳水化合物利用相关或多药转运蛋白相关配体，和用在筛选试验中以鉴定抑制碳水化合物利用相关或多药转运蛋白与碳水化合物利用相关或多药转运蛋白配体相互作用的分子。

本领域技术人员将认识到，可根据纯化方案选择特定载体多肽。例如，His标记、GST和麦芽糖结合蛋白代表具有易获得亲和柱的载体多肽，载体多肽可以与该柱结合和洗脱下来。因此，在载体多肽是N-末端His标记如六个组氨酸(His6标记)的情况下，可以使用包含金属-螯合树脂，例如镍次氮基三乙酸(Ni-NTA)、镍亚氨基二乙酸(Ni-IDA)和含钴树脂(Co-树脂)的基质纯化碳水化合物利用相关或多药转运蛋白融合蛋白。参见例如Steinert et al.(1997)QIAGEN News 4：11-15，在此全部引入作为参考。在载体多肽是GST的情况下，可以使用包含谷胱甘肽-琼脂糖珠(Sigma或Pharmacia Biotech)的基质纯化碳水化合物利用相关或多药转运蛋白融合蛋白；在载体多肽是麦芽糖结合蛋白(MBP)的情况下，可以使用包含用直链淀粉衍生的琼脂糖树脂的基质纯化碳水化合物利用相关或多药转运蛋白融合蛋白。

优选地，通过标准重组DNA技术生产本发明的嵌合或融合蛋白。例如，编码不同多肽序列的DNA片段可以符合读框地连接在一起，或可以合成融合基因，如用自动DNA合成仪。可供选择地，可以使用在两个连续基因片段之间引起互补突出端的锚定引物进行基因片段的PCR扩增，随后可以使该基因片段退火并再扩增，产生嵌合基因序列(参见例如Ausubel et al.，eds.(1995)Current Protocols inMolecular Biology(Greene Publishing and Wiley-Interscience，New York)。此外，编码碳水化合物利用相关或多药转运蛋白的核酸可以以使得它与已有的融合部分符合读框地连接的方式克隆入市售表达载体中。

融合蛋白表达载体通常被设计成便于除去载体多肽，以允许碳水化合物利用相关或多药转运蛋白保留与其有关的天然生物活性。切割融合蛋白的方法是本领域已知的。参见例如Ausubel et al.，eds.(1998)Current Protocols in Molecular Biology(John Wiley & Sons，Inc.)。融合蛋白的化学切割可以用试剂如溴化氰、2-(2-硝基苯基sulphenyl)-3-甲基-3′-溴代假吲哚、羟胺或低pH完成。化学切割常常在变性条件下完成，以切割原本不溶的融合蛋白。

在期望将碳水化合物利用相关或多药转运多肽与载体多肽分开、并且这些融合多肽之间的接头处的切割位点不是天然存在的情况下，融合构建体可以被设计成含有特异性蛋白酶切割位点，以促进酶切割和载体多肽的除去。用这样的方式，包含感兴趣酶的特异性切割位点的肽编码序列的接头序列可以在载体多肽编码序列(例如MBP、GST、SOD或N-末端His标签)和碳水化合物利用相关或多药转运多肽编码序列之间符合读框地融合。具有切割位点特异性的合适酶包括但不限于因子Xa、凝血酶、肠激酶、remin、胶原酶和烟草蚀纹病毒(tobacco etchvirus，TEV)蛋白酶。这些酶的切割位点是本领域熟知的。因此，例如在使用因子Xa将载体多肽与碳水化合物利用相关或多药转运多肽切割开来的情况下，融合构建体可以被设计成包含编码因子Xa敏感性切割位点的接头序列，例如序列IEGR(参见例如Nagai andThegersen(1984)Nature309：810-812，Nagai and Thφgersen(1987)Meth.Enzymol.153：461-481和Pryor and Leiting(1997)ProteinExpr.Purif.10(3)：309-319，在此引入作为参考)。在使用凝血酶将载体多肽与碳水化合物利用相关或多药转运多肽切割开来的情况下，融合构建体可以被设计成包含编码凝血酶敏感性切割位点的接头序列，例如序列LVPRGS或VIAGR(分别参见例如Pryor and Leiting(1997)Protein Expr.Purif 10(3)：309-319和Hong et al.(1997)Chin.Med.Sci.J.12(3)：143-147，在此引入作为参考)。TEV蛋白酶切割位点是本领域已知的。参见例如美国专利5,532,142中描述的切割位点，在此全部引入作为参考。也参见Ausubel et al.，eds.(1998)Current Protocols in Molecular Biology(John Wiley & Sons，Inc.)，Chapter 16中的讨论。

抗体

本发明的分离多肽可以用作免疫原，以产生特异性结合碳水化合物利用相关或多药转运蛋白的抗体或刺激体内产生抗体。全长碳水化合物利用相关或多药转运蛋白可以用作免疫原，或可替换地可以使用在此描述的碳水化合物利用相关或多药转运蛋白的抗原性肽片段。碳水化合物利用相关或多药转运蛋白的抗原性肽包含SEQ ID NOS：1-320中偶数号所示氨基酸序列的至少8个，优选10、15、20或30个氨基酸残基，并且包括碳水化合物利用相关或多药转运蛋白的表位，使得抗该肽的抗体与碳水化合物利用相关或多药转运蛋白形成特异性免疫复合物。抗原性肽包括的优选表位是位于蛋白表面的碳水化合物利用相关或多药转运蛋白区域，例如亲水区。

重组表达载体和细胞

本发明的核酸可以包括在载体中，优选表达载体。“载体”是指能够转运它所连接的另一核酸的核酸。表达载体包括一个或多个调节序列，并指导与它们可操作连接的基因的表达。“可操作连接”是指感兴趣核苷酸序列与调节序列相连接，使得允许该核苷酸序列表达(例如在体外转录/翻译系统或当该载体导入宿主细胞时，在宿主细胞中)。术语“调节序列”意思包括可控制转录的启动子、操纵子、增强子、转录终止子，和其它表达控制元件如翻译控制序列(例如Shine-Dalgarno共有序列、起始和终止密码子)。这些调节序列会有所不同，这取决于例如所使用的细胞。

载体可以在细胞中自主复制(游离体型载体)，或可以整合到细胞基因组中，与宿主基因组一起复制(非游离体型哺乳动物载体)。整合型载体通常含有允许载体中同源DNA和细菌染色体之间发生重组的至少一个与细菌染色体同源的序列。整合型载体也可以包含噬菌体或转座子序列。游离体型载体或质粒是其中可以连入额外DNA片段的环形双链DNA环。当使用重组DNA技术时，能够在宿主中稳定保持的质粒通常是表达载体的优选形式。

本发明包括的表达构建体或载体包含适于在细胞中表达核酸的形式的本发明核酸构建体。原核细胞和植物细胞中的表达包括在本发明中。本领域技术人员将领会到表达载体的设计可以取决于例如待转化细胞的选择、期望的蛋白表达水平等等的因素。本发明的表达载体可以被引入细胞，由此生产在此描述的核酸编码的蛋白或肽，包括融合蛋白或肽，例如碳水化合物利用相关或多药转运蛋白、突变形式的碳水化合物利用相关或多药转运蛋白、融合蛋白等等)。

细菌表达载体

调节序列包括指导核苷酸序列组成型表达的序列，以及仅在某些环境条件下指导核苷酸序列诱导型表达的序列。细菌启动子是能够结合细菌RNA聚合酶并启动编码序列(例如结构基因)下游(3’)转录为mRNA的任何DNA序列。启动子将具有转录启动区，其通常处于最接近编码序列5’端的位置。这个转录起始区通常包括RNA聚合酶结合位点和转录起始位点。细菌启动子也可以具有称作操纵子的第二结构域，其可与RNA合成开始处的邻近RNA聚合酶结合位点重叠。该操纵子允许负调节(诱导型)转录，因为基因抑制蛋白可以结合该操纵子并由此抑制特殊基因的转录。组成型表达可以在不存在负调节元件，如操纵子的情况下发生。此外，正调节可以通过基因活化蛋白结合序列实现，该序列如果存在，则通常(5’)接近RNA聚合酶结合序列。

基因活化蛋白的实例是代谢产物活化蛋白(CAP)，其有助于启动lac操纵子在大肠杆菌中转录(Raibaud et al.(1984)Annu.Rev.Genet.18：173)。因此受调节的表达可以是正向或负向的，由此增加或降低转录。正和负调节元件的其它实例是本领域熟知的。可以包含在蛋白表达系统中的各种启动子包括但不限于T7/LacO杂合启动子、trp启动子、T7启动子、lac启动子和噬菌体λ启动子。可以使用任何合适的启动子实施本发明，包括天然启动子或异源启动子。异源启动子可以是组成型活性的或诱导型的。美国专利6,242,194中给出了异源启动子的非限制性实例。

编码代谢途径酶的序列提供了特别有效的启动子序列。实例包括来源于糖代谢酶的启动子序列，如半乳糖、乳糖(lac)(Chang etal.(1987)Nature 198：1056)和麦芽糖。另外的实例包括来源于生物合成酶如色氨酸(trp)的启动子序列(Goeddel et al.(1980)NucleicAcids Res.8：4057；Yelverton et al.(1981)Nucleic AcidsRes.9：731；美国专利4,738,921；EPO公开号36,776和121,775)。β-内酰胺酶(bla)启动子系统(Weissmann，(1981)″The Cloning ofInterferon and Other Mistakes，″in Interferon 3(ed.I.Gresser)；噬菌体λPL(Shimatake et al.(1981)Nature 292：128)；阿拉伯糖诱导型araB启动子(美国专利5,028,530)和T5(美国专利4,689,406)启动子系统也提供了有效的启动子序列。也参见Balbas(2001)Mol.Biotech.19：251-267，其中讨论了大肠杆菌表达载体。

此外，天然不存在的合成启动子也可起细菌启动子的作用。例如，一个细菌或噬菌体启动子的转录活化序列可以与另一个细菌或噬菌体启动子的操纵子序列结合，产生合成杂合启动子(美国专利4,551,433)。例如，tac(Amann et al.(1983)Gene 25：167；de Boeret al.(1983)Proc.Natl.Acad.Sci.80：21)和trc(Brosius etal.(1985)J Biol.Chem.260：3539-3541)启动子是杂合trp-lac启动子，其由trp启动子和通过乳糖阻遏子调节的lac操纵子序列组成。tac启动子具有作为诱导型调节序列的另外特征。因此，例如，与tac启动子可操作连接的编码序列的表达可以在细胞培养中通过添加异丙基-1-硫代-β-D-半乳糖苷(IPTG)来诱导。此外，细菌启动子可以包括具有结合细菌RNA聚合酶和启动转录的能力的非细菌来源的天然启动子。非细菌来源的天然启动子还可以与相容的RNA聚合酶偶联，使一些基因在原核生物中产生高水平表达。噬菌体T7RNA聚合酶/启动子系统是偶联启动子系统的实例(Studier et al.(1986)J.Mol.Biol.189：113；Tabor et al.(1985)Proc.Natl.Acad.Sci.82：1074)。此外，杂合启动子还可以由噬菌体启动子和大肠杆菌操纵子区组成(EPO公开号267,851)。

该载体可以另外含有编码针对该启动子的阻遏子(或诱导物)的基因。例如，本发明的诱导型载体可以通过表达编码Lad阻抑蛋白的基因来调节来自Lac操纵子(LacO)的转录。其它实例包括使用lexA基因调节pRecA表达，和使用trpO调节ptrp。可以使用增加阻遏程度(例如lacIq)或修饰诱导方式(例如λCI857，提供λpL热诱导型，或λCI+，提供λpL化学诱导型)的这种基因的等位基因。

除功能性启动子序列之外，有效的核糖体结合位点也可用于表达融合构建体。在原核生物中，核糖体结合位点被称为Shine-Dalgarno(SD)序列并包括起始密码子(ATG)和位于起始密码子上游3-11个核苷酸的3-9个核苷酸长的序列(Shine et al.(1975)Nature 254：34)。SD序列被认为通过SD序列和细菌16S rRNA 3′端之间的碱基配对而促进mRNA与核糖体结合(Steitz et al.(1979)″Genetic Signals andNucleotide Sequences in Messenger RNA，″in BiologicalRegulation and Development：Gene Expression(ed.R.F.Goldberger，Plenum Press，NY)。

碳水化合物利用相关蛋白还可以通过产生编码蛋白的嵌合DNA分子而从细胞分泌，该蛋白包含提供碳水化合物利用相关和多药转运多肽在细菌中的分泌的信号肽序列片段(美国专利4,336,336)。信号序列片段通常编码由指导蛋白从细胞分泌的疏水氨基酸组成的信号肽。该蛋白分泌到生长培养基(革兰氏阳性细菌)或位于细胞内膜和外膜之间的周质间隙(革兰氏阴性细菌)。优选有加工位点，其可以在体内或体外被切割，编码在信号肽片段和碳水化合物利用相关或多药转运蛋白之间。

编码合适信号序列的DNA可以源自于分泌细菌蛋白的基因，如大肠杆菌外膜蛋白基因(ompA)(Masuiet al.(1983)FEBS Lett.151(1)：159-164；Ghrayeb et al.(1984)EMBO J.3：2437-2442)和大肠杆菌碱性磷酸酶信号序列(phoA)(Oka et al.(1985)Proc.Natl.Acad.Sci.82：7212)。其它原核信号包括例如来自青霉素酶的信号序列Ipp或耐热肠毒素II前导序列。

细菌如嗜酸乳杆菌通常利用起始密码子ATG，其确定甲硫氨酸(其在原核生物中被修饰为N-甲酰甲硫氨酸)。细菌还识别可选择的起始密码子，如密码子GTG和TTG，它们分别编码缬氨酸和亮氨酸。然而，当它们被用作起始密码子时，这些密码子将指导甲硫氨酸的掺入，而不是它们正常编码的氨基酸。嗜酸乳杆菌NCFM识别这些可供选择的起始位点，并掺入甲硫氨酸作为第一个氨基酸。

典型地，细菌识别的转录终止序列是位于翻译终止密码子3′侧的调节区，因此与启动子一起侧接编码序列。这些序列指导可以翻译为由DNA编码的多肽的mRNA转录。转录终止序列常常包括能够形成帮助终止转录的茎-环结构的DNA序列(约50个核苷酸)。实例包括来源于具有强启动子的基因的转录终止序列，如大肠杆菌中的trp基因以及其它生物合成基因。

表达载体将具有许多限制酶切位点供插入碳水化合物利用相关或多药转运蛋白序列，以便处于调节区的转录调节下。确保载体在细胞中保持的选择性标记基因也可以包括在表达载体中。优选的选择性标记包括赋予对药物如氨苄青霉素、氯霉素、红霉素、卡那霉素(新霉素)和四环素的抗性的标记(Davies et al.(1978)Annu.Rev.Microbiol.32：469)。选择性标记还可以允许细胞在基本培养基，或在有毒代谢物存在下生长，并且可以包括生物合成基因，如组氨酸、色氨酸和亮氨酸生物合成途径中的基因。

调节区可以是天然的(同源的)或可以对于细胞和/或本发明核苷酸序列来说是外来的(异源的)。调节区也可以是天然的或合成的。当该区域对细胞来说是“外来的”或“异源的”的情况下，意味着在引入该区域的天然细胞中不能找到该区域。当该区域对本发明的碳水化合物利用相关或多药转运蛋白核苷酸序列是“外来的”或“异源的”，意味着该区域对于可操作连接的本发明碳水化合物利用相关或多药转运蛋白核苷酸序列来说不是天然的或不是天然存在区域。例如，该区域可以来源于噬菌体。尽管优选使用异源调节区表达序列，但是仍可以使用天然的区域。预期这种构建体有时将改变碳水化合物利用相关或多药转运蛋白在细胞中的表达水平。因此，细胞的表型可被改变。

在制备该表达盒时，可以操作各种DNA片段，使得以合适方向提供DNA序列，并且视情况，使它们处于适当读框中。为此，可以使用连接子或接头连接DNA片段，或可以包括其它操作以提供方便的限制酶切位点、除去多余的DNA、除去限制酶切位点等等。为了这个目的，可以包括体外诱变、引物修复、限制性酶切、退火、再取代，例如转换和易位。

本发明进一步提供了包含以反义方向克隆入表达载体的本发明DNA分子的重组表达载体。也就是说，DNA分子与调节序列以允许与碳水化合物利用相关或多药转运蛋白mRNA反义的RNA分子表达(通过DNA分子转录)的方式可操作连接。可以选择与以反义方向克隆的核酸可操作连接的调节序列，以指导反义RNA分子的连续或诱导型表达。反义表达载体可以是重组质粒或噬菌粒形式，其中反义核酸在高效率调节区控制下产生，其活性可以通过引入载体的细胞类型来测定。对于使用反义基因调节基因表达的讨论参见Weintraub et al.(1986)Reviews-Trends in Genetics，Vol.1(1)。

或者，某些上述组分可一起放在转化载体中。如上所述，转化载体通常含有选择性标记，所述标记或者保持在复制子内或者进入整合载体内。

植物表达载体

就植物细胞中的表达而言，表达盒应包含与本发明核苷酸序列可操作性连接的转录起始区。这些表达载体中可包含各种各样的限制性切点，以便能插入核苷酸序列以处于调控区的转录调控下。此外，所述表达盒可包含选择性标记基因，包括那些使其具有除草剂或抗生素抗性的基因，诸如四环素抗性、潮霉素抗性、氨苄青霉素抗性或草甘膦抗性。

所述表达盒按5’到3’的转录方向将包含在植物内有功能的转录和翻译起始区、本发明的核苷酸序列以及转录和翻译终止区(即终止区)。所述终止区可以是含启动子核苷酸序列的转录起始区的天然区域，可以是本发明核苷酸序列的天然区域，或者可以来自另外的来源。许多方便的终止区是本领域所已知的，包括但不局限于，来自根瘤土壤杆菌(A.tumefaciens)之Ti质粒的终止区，诸如章鱼碱合酶和胭脂碱合酶终止区。也可参阅Guerineau等(1991)Mol.Gen.Genet.262：141-144；Proudfoot(1991)Cell 64：671-674；Sanfacon et al.(1991)Genes Dev.5：141-149；Mogen et al.(1990)Plant Cell2：1261-1272；Munroe et al.(1990)Gene 91：151-158；Ballas etal.1989)Nucleic Acids Res.17：7891-7903；and Joshi et al.(1987)Nucleic Acid Res.15：9627-9639.

含有本发明核苷酸序列的表达盒还可包含至少一种另外的核苷酸序列，以便将基因能共转化进入生物体内。或者，所述的另外的序列可以在另一表达盒上提供。

所述的表达盒可另外包含5’非翻译前导序列或5’非编码序列。用于此处时，“5’前导序列”、“翻译前导序列”或“5’非编码序列”指基因中启动子和编码序列之间的DNA序列部分，它被转录成RNA并且存在于完全加工好的mRNA上游中，翻译起始密码子上游(5’)。5′非翻译前导序列通常表征为这样的mRNA分子部分，其最普遍地是从5’CAP位点延伸至AUG蛋白质翻译起始密码子。翻译前导序列可能影响初级转录产物加工成mRNA、mRNA的稳定性或翻译效率(Turner等(1995)Molecular Biotechnology 3：225)。因此，翻译前导序列在基因表达调控中起着重要的作用。

翻译前导序列是本领域所已知的，包括但不局限于：小核糖核酸病毒前导序列，例如EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein等(1989)Proc.Nat.Acad.Sci.USA 86：6126-6130)；马铃薯Y病毒组前导序列，例如TEV前导序列(烟草Etch病毒)(Allison等(1986)Virology 154：9-20)；MDMV前导序列(玉米矮小花叶病毒)；人免疫球蛋白重链结合蛋白(BiP)(Macejak等(1991)Nature353：90-94)；来自紫花苜蓿花叶病毒外壳蛋白mRNA的非翻译前导序列(AMV RNA 4)(Jobling等(1987)Nature 325：622-625)；烟草花叶病毒前导序列(TMV)(Gallie等(1989)MolecularBiology of RNA，页码237-256)；以及玉米褪绿斑驳病毒前导序列(MCMV)(Lommel等(1991)Virology 81：382-385)。

还可应用已知增强翻译和/或mRNA稳定性的其它方法，例如内含子，诸如玉米泛素内含子(Christensen和Quail(1996)TransgenicRes.5：213-218以及Christensen等(1992)Plant MolecularBiology 18：675-689)或者玉米AdhI内含子(Kyozuka等(1991)Mol.Gen.Genet.228：40-48和Kyozuka等(1990)Maydica 35：353-357)，等等。已显示出有各种各样的内含子序列可增强表达，尤其是在单子叶植物细胞内。已发现玉米Adhl基因内含子在引入玉米细胞时可在其同源启动子的控制下显著增强野生型基因的表达。研究发现在含氯霉素乙酰转移酶基因的融合构建体中内含子1尤其有效且增强表达(Callis等(1987)Genes Develop.1：1183-1200)。在同一实验体系中，来自玉米bronze 1基因的内含子具有相似的增强表达的作用。AdhI内含子也显示出将CAT的表达增强了12倍(Mascarenhas等(1990)Plant Mol.Biol.6：913-920)。内含子序列常规被掺入植物转化载体中，通常在非翻译前导序列内。

含有本发明启动子序列的表达盒可另外包含3’非编码序列。“3’非编码序列”或“3’非翻译区”指位于编码序列3’侧(下游)的核苷酸序列，并且包括聚腺苷化信号序列和编码能影响多聚腺苷酸片断添加至mRNA前体3’端的调控信号的其它序列。3′非翻译区包含mRNA的一个区域，该区域通常起始于翻译终止密码子并至少延伸至多聚腺苷化位点之后。已发现位于基因3’端的非翻译序列影响基因的表达水平。Ingelbrecht等(参阅Plant Cell，1：671-680，1989)对这些元件的重要性进行了评估，发现随着3’非翻译区来源的不同在稳定植物内的表达有很大的差异。利用与以下蛋白相关的3’非翻译区：章鱼碱合酶、来自拟南芥的2S种子蛋白、来自拟南芥的rbcS小亚基、来自胡萝卜的延伸片断和来自金鱼草属的苯基苯乙烯酮合酶，观察到表达最佳的构建体(含rbcS 3’非翻译区)和表达最低的构建体(含苯基苯乙烯酮合酶3’区域)之间有60倍的差异。

还可通过利用与本发明启动子区联合的增强子提高转录水平。增强子是用于增加启动子区表达的核苷酸序列。增强子是本领域所已知的，包括SV40增强子区、35S增强子元件等等。

在表达盒的制备中，可操作各种各样的DNA片段以便以合适方向提供DNA序列且在适当的时候便于处于正确的阅读框架中。可应用衔接子或连接子连接DNA片段，或者可进行其它的处理以获得便利的限制性切点。可以添加或去除限制性位点，多余的DNA可被去除，或者可对本发明的序列进行其它的修饰。为此，可进行体外诱变、引物修补、限制性酶切、退火、再取代，例如转换和颠换。

除了提供抗生素或除草剂抗性的选择性标记之外，如上所述，在转基因事件回收中可能有用但在终产物中可能不是必需的其它基因包括，但不局限于，GUS(b-葡糖醛酸糖苷酶；Jefferson(1987)PlantMol.Biol.Rep.5：387)、GFP(绿色荧光蛋白；Chalfie等(1994)Science 263：802)、荧光素酶(Riggs等(1987)Nucleic Acids Res.15(19)：8115和Luehrsen等(1992)MethodsEnzymol.216：397-414)以及编码花色素苷产品的玉米基因(Ludwig等(1990)Science247：449)。

本发明的核酸可用于针对在植物中表达核苷酸序列的方法中。通过用含有与本文所确定的核苷酸序列可操作性连接的启动子的表达盒转化目的植物细胞并且从所说的植物细胞再生稳定转化的植物，可以达到上述目的。含有与本发明的核苷酸序列可操作性连接的启动子序列的表达盒可被用于转化任何植物。以此方式可获得遗传修饰的，即转基因或转化的植物、植物细胞、植物组织、种子、根等等。

微生物或细菌细胞

含异源噬菌体抗性基因的细菌的产生、所述细菌起始培养物的制备以及发酵底物、尤其是诸如牛奶等食品底物的方法可依照已知的工艺进行。

“引入”一词在与核酸相关时，意指通过常规转化或转染技术或者通过噬菌体介导的感染导入原核或真核细胞。用于此处时，术语“转化”、“转导”、“缀合”以及“原生质体融合”意指多种本领域内公认用于将外源核酸(例如DNA)引入细胞的技术，包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质体转染或电穿孔。

合适的转化或转染细胞的方法可参阅书籍Sambrook等(1989)分子克隆：实验室手册Molecular Cloning：A Laboratory Manual(第二版，冷泉港实验室出版社，Plainview，New York)和其它的实验室手册。当“引入”一词与本发明的多肽或微生物相关时，意味着通过摄取、局部施用、鼻饲、栓剂、泌尿生殖道、或者口服应用将多肽或微生物引入宿主。

如文献Sambrook等(1989)Molecular Cloning，ALaboratoryManual(2d ed.，Cold Spring Harbor Laboratory Press，Plainview，New York中通常所述的，将用于产生本发明的碳水化合物利用相关或多药物转运蛋白多肽的细菌细胞培养于合适的培养基中。

本发明牵涉的细菌菌株包括包含至少一种本发明核苷酸或氨基酸序列的细菌的生物学上纯的细菌培养物。这些菌株包括：具有较野生型嗜酸乳杆菌而言改良的运送碳水化合物进或出细胞之能力的嗜酸乳杆菌细菌菌株，其中所述的改良的能力是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，具有改良的积累碳水化合物能力的嗜酸乳杆菌细菌株系，其中所述的能力改良是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，具有改良的利用碳水化合物作为能源的能力的嗜酸乳杆菌细菌株系，其中所述的能力改良是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，通过发酵提供气味改良的食物产品的嗜酸乳杆菌细菌株系，其中所述的气味改良是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，通过发酵提供具有改进结构之食物产品的嗜酸乳杆菌细菌株系，其中所述的结构改进是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，具有改进的产生碳水化合物的能力的嗜酸乳杆菌细菌株系，其中所述的能力是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，具有改进的经受食品加工和贮存条件的能力的嗜酸乳杆菌细菌株系，其中所述的改进能力是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，具有改进的在GI道中存活的能力的嗜酸乳杆菌细菌株系，其中所述的改进能力是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的；与野生型嗜酸乳杆菌相比，具有改进的耐受抗微生物多肽或毒素的能力的嗜酸乳杆菌细菌株系，其中所述的改进能力是由于至少一种本发明的碳水化合物利用相关性多肽的表达造成的。

转基因植物和植物细胞

用于此处时，术语“转化植物”和“转基因植物”指在其基因组内含有异源多核苷酸的植物。通常，异源多核苷酸稳定整合入转基因或转化植物的基因组中以便多核苷酸传到后续代中。

异源多核苷酸可单独或作为重组表达盒的一部分整合进入基因组中。应理解，用于此处时，术语“转基因”包括由于异源核酸的存在而其基因型已改变的任何细胞、细胞系、愈伤组织、植物部分或植物，包括那些最初这样改变的转基因类型以及通过有性杂交或无性繁殖产生自最初的转基因类型的那些类型。术语“转基因”用于此处时不包括利用常规的植物培育方法或由于诸如随机杂交授粉、非重组病毒感染、非重组细菌转化、非重组转座或自发突变等天然存在的事件造成的基因组(染色体的或染色体体的)改变。

转基因“事件”是异源DNA构建体转化植物细胞(所述构建体包括含有目的转基因的核酸表达盒)、再生出因转基因插入植物基因组而生成的植物群并选择特征为插入到特定基因组位置的特殊植物。所述事件在表型上表现为转基因的表达。在遗传水平上，事件是植物遗传组成的一部分。术语“事件”也指转化子和含异源DNA的另一品种有性异型杂交产生的后裔。

用于此处时，术语“植物”包括完整的植物、植物器官(例如叶、茎、根等)、种子、植物细胞以及它们的后代。本发明范围内转基因植物的部分应理解为包括，例如，来源于事先已转化了本发明DNA分子的转基因植物或它们的后裔的植物细胞、原生质体、组织、愈伤组织、胚以及花、花粉、花粉囊、茎、果实、胚珠、叶或根，因此至少部分由转基因细胞组成。

用于此处时，术语“植物细胞”包括，但不限于种子悬浮液培养物、胚、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。可用于本发明方法中的植物种类一般说来与能用转化方法处理的高等植物的种类一样广泛，包括单子叶植物和双子叶植物两者。

本发明可用于转化任一植物种属，包括但不局限于，单子叶和双子叶植物。目的植物的例子包括，但不局限于，玉米(Zeamays)、芸苔种(Brassica sp.)(例如B.napus，B.rapa，B.juncea)，尤其是可用作种子油来源的那些芸苔种植物，紫花苜蓿(Medicagosativa)、稻(Oryza sativa)、黑麦(Secale cereale)、高粱(Sorghumbicolor，Sorghum vulgare)、粟(例如珍珠稷(Pennisetum glaucum)、黍(Panicum miliaceum)、谷子(Setaria italica)、粟(Eleusinecoracana))，向日葵(Helianthus annuus)，红花(Carthamustinctorius)，小麦(Triticum aestivum)，大豆(Glycine max)，烟草(Nicotiana tabacum)，马铃薯(Solanum tuberosum)，落花生(Arachis hypogaea)，棉花(Gossypium barbadense，Gossypiumhirsutum)，甘薯(Ipomoea batatus)，木薯(Manihot esculenta)，咖啡(Coffea spp.)椰子(Cocos nucifera)，凤梨(Ananas comosus)，柑桔树(Citrus spp.)，cocoa(Theobroma cacao)，茶树(Camelliasinensis)，香蕉(Musa spp.)，鳄梨(Persea americana)，无花果(Ficus casica)，番石榴(Psidium guajava)，芒果(Mangiferaindica)，橄榄(Olea europaea)，papaya(Carica papaya)，cashew(Anacardium occidentale)，macadamia(Macadamiaintegrifolia)，杏(Prunus amygdalus)，甜菜(Beta vulgaris)，甘蔗(Saccharum spp.)，燕麦，大麦，蔬菜，观赏植物和针叶树。

蔬菜包括西红柿(Lycopersicon esculentum)，卷心菜(e.g.，Lactuca sativa)，绿扁豆(Phaseolus vulgaris)，利马豆(Phaseolus limensis)，豌豆(Lathyrus spp.)，以及黄瓜属成员，例如黄瓜(C.sativus)，甜瓜(C.cantalupensis)和香瓜(C.melo)。观赏植物包括杜鹃花(Rhododendron spp.)、八仙花属(Macrophylla hydrangea)、芙蓉属(Hibiscus rosasanensis)、玫瑰(Rosa spp.)、郁金香(Tulipa spp.)、水仙花(Narcissus spp.)、矮牵牛花(Petunia hybrida)、康乃馨(Dianthus caryophyllus)、猩猩木(Euphorbia pulcherrima)和菊花。可用于进行本发明的针叶树包括，例如，松树，诸如火炬松(Pinus taeda)、沼泽松(Pinus elliotii)、美国黄松(Pinus ponderosa)、果松(Pinus contorta)和辐射松(Pinusradiata)；花旗松(Pseudotsugamenziesii)；加州铁杉(Tsugacanadensis)；北美云杉(Piceaglauca)；红杉(Sequoiasempervirens)；真正的枞木，诸如银枞(Abies amabilis)和胶枞(Abiesbalsamea)；以及诸如美国西部侧柏(Thuja plicata)和黄扁柏(Chamaecyparis nootkatensis)等雪松。

本发明的方法并不取决于某种将核苷酸构建体引入植物的具体方法，只要所述的核苷酸构建体能够进入植物的至少一个细胞内部即可。将核苷酸构建体引入植物内的方法是本领域所已知的，包括但不局限于，稳定转化方法、瞬时转化方法和病毒介导的方法。

“瞬时转化”意味着引入植物的核苷酸构建体不整合入植物的基因组中。“稳定转化”意指引入植物的核苷酸构建体整合入植物的基因组并且能被其后代所继承。“初级转化株”和“T0代”转基因植物与最初被转化的组织属于同一遗传代数(即，转化后未经过减数分裂和授精)。“次级转化株”和“T1、T2、T3和后续代数”指来自初级转化株并经过一次或多次减数分裂和授精循环的转基因植物。它们可来自初级或次级转化株的自体授精或者初级或次级转化株与其它被转化或未转化植物的杂交。

转化方案以及将核苷酸序列引入植物的方法可依转化所针对的植物或植物细胞的类型而变化(即单子叶或双子叶植物)。本发明的核苷酸构建体可通过本领域已知的任一方法引入植物中，包括但不局限于，用病毒或病毒核酸接触植物(例如，美国专利5,889,191、5,889,190、5,866,785、5,589,367和5,316,931；在此收编作为参考)、显微注射(Crossway等(1986)Biotechniques 4：320-334)、电穿孔(Riggs等(1986)Proc.Natl.Acad.Sci.USA 83：5602-5606)、农杆菌介导的转化(美国专利5,981,840和5,563,055)、直接的基因转移(Paszkowski等(1984)EMBO J.3：2717-2722)和弹道颗粒加速(参阅，例如美国专利4,945,050、5,879,918、5,886,244和5,932,782)，所有这些方法均在此收编作为参考。

利用本领域已知的方法可以使被转化的细胞生长成为植物。参阅，例如，McCormick等(1986)Plant Cell Reports 5：81-84。然后可培养这些植物，或者用同样的被转化品系或者用不同的品系授粉，鉴定所产生的具有预期表型特征的杂合体。可培养两代或更多代以保证预期表型特征的表达稳定维持并遗传，然后收获种子以确保达到预期表型特征的表达。因此，当用于此处时，“被转化的种子”指含有稳定整合入植物基因组的核苷酸构建体的种子。

使用方法

在此提供了可用于改进生物体的碳水化合物利用相关或多药物转运蛋白基因或蛋白质的表达的方法。在某一实施方案中，发酵中所使用的微生物的特性被加以修饰以便植株能利用备选的碳水化合物作为能量或碳的来源。这些修饰可导致合成、转运、积聚或降解碳水化合物的新能力。或者，这些修饰可导致菌株与抗微生物多肽(包括抗生素和毒素)接触后仍生存的能力。

这些新能力还使得微生物能在充满压力的环境中更好的存活，诸如消化道或食物加工和贮存过程中遇到的环境等，它们可增加这些微生物在发酵各种食品中的效用，并使得它们在摄取后可提供较持久的益生活性。这些新能力还使得微生物通过发酵在产品中产生不同的气味或品质(texture)。此外，所述的新能力还使细菌能产生改性的碳水化合物、外多糖或细胞表面多糖。在另一实施方案中，植物的特性被加以修饰使其具有相似的能力。这些能力是由本发明所公布的核苷酸和氨基酸序列所提供的。

一般而言，所述的方法包括引入或过表达碳水化合物利用或多药抗性中所涉及的一种或多种蛋白质。“引入”意指目的蛋白质在修饰过的细胞中表达而在未修饰过的细胞中不表达。“过表达”意指目的蛋白质在修饰过的生物体中的表达量较其在未修饰的野生型生物体中的表达而言有所增加。具体而言，同型发酵的乳酸细菌具有相对简单的新陈代谢，在能量代谢和生物合成代谢之间几乎没有重叠，这使得它们成为新陈代谢基因工程的理想对象(Hugenholz和Kleerebezem(1999)Current Opin.Biotech.10：492-497)。细菌基因在植物中的表达是本领域众所周知的。参阅，例如，Shewmaker等(1994)PlantPhysiol.104：1159-1166；Shen等(1997)Plant Physiol.113：1177-1183；Blaszczyk等(1999)Plant J.20：237-243。

表达一种或多种碳水化合物利用相关或多药物转运蛋白可使得生物体具有改良的转运碳水化合物或诸如细菌素等抗菌多肽进或出细胞的能力。与转运相关的碳水化合物应用蛋白或多药物转运蛋白质包括含底物结合蛋白质在内的ABC转运蛋白体系组分(例如HisJ和MalE)、诸如通透酶等膜相关组分(例如LacF和LacG)以及诸如ATP-结合蛋白质等胞质蛋白质(例如msmK)。转运相关的碳水化合物利用蛋白质或多药物转运蛋白质还包括次级转运体系蛋白，诸如主要的促进蛋白超家族(MFS)成员，而葡糖苷/戊糖苷/乙糖醛酸苷家族成员。基团转位体系蛋白也包括在内，包括酶I、酶II和HPr蛋白质。

碳水化合物利用相关性蛋白质还包括脱氢酶。乙醛脱氢酶(EC：1.2.1.3和EC：1.2.1.5)(PFAM收录号PF00171)是以NADP作为辅因子氧化多种脂肪族和芳香族醛的酶。在哺乳动物中至少有四种不同形式的酶是已知的(Hempel等(1989)Biochemistry 28：1160-7)：类型-1(或Ald C)-四聚胞浆酶、类型2(或Ald M)-四聚线粒体酶、类型3(或Ald D)-二聚胞浆酶和类型4-微粒体酶。此外还对真菌和细菌物种来源的乙醛脱氢酶进行了测序。许多酶已知是与乙醛脱氢酶进化相关的。

哺乳动物乙醛脱氢酶的催化活性中涉及谷氨酸和半胱氨酸残基。这些残基在该家族的所有酶中是保守的。本发明的乙醛脱氢酶蛋白质包括SEQ ID NO：228中的蛋白质。D-异构体特异的2-羟酸脱氢酶，本发明催化结构域蛋白质(PFAM收编号PF00389)序列如SEQ ID NO：242中所示。D-异构体特异的2-羟酸脱氢酶，本发明NAD结合结构域(PFAM收编号PF02826)蛋白质包括SEQ ID NO：242中的那些序列。甘油醛-3-磷酸脱氢酶(GAPDH)通过可逆性催化D-甘油醛-3-磷酸氧化和磷酸化成1，3-二磷酸甘油酸而在糖酵解和糖原异生中起重要作用(Huang等(1989)J.Mol.Biol.206：411-24)。

所述的酶以相同亚基的四聚体形式存在，每个包含2个保守的功能性结构域：NAD-结合结构域和高度保守的催化结构域。SEQ ID NO：248具有甘油醛3-磷酸脱氢酶C-末端结构域(PFAM收编号PF02800)以及甘油醛3-磷酸脱氢酶NAD结合结构域(PFAM收编号PF00044)。

L-乳酸脱氢酶是催化L-乳酸转化为丙酮酸的代谢酶，这是厌氧糖酵解中的最后一步。苹果酸脱氢酶催化苹果酸和草酰乙酸的互变。所述的酶参与柠檬酸循环。本发明蛋白质的乳酸/苹果酸脱氢酶α/βC-末端结构域(PFAM收编号PF02866)和乳酸/苹果酸脱氢酶NAD结合结构域(PFAM收编号PF00056)蛋白如SEQ ID NOS：222和246中所示。用于检测脱氢酶活性的方法是本领域众所周知的(参阅，例如，Ercolani等(1988)J.Biol.Chem.263：15335-41)。

碳水化合物利用相关蛋白质还包括O-糖基水解酶。O-糖基水解酶(EC 3.2.1.-)是一类分布广泛的酶，它们水解两个或多个碳水化合物之间的糖苷键或碳水化合物和非碳水化合物部分之间的糖苷键。检测水解酶活性的试验是本领域众所周知的(参阅，例如，Avigad和Bauer(1966)Methods Enzymol.8：621-628；Neumann和Lampen(1967)Biochemistry 6：468-475；Henry和Darbyshire(1980)Phytochemistry 19：1017-1020)。

α淀粉酶催化结构域蛋白质(PFAM收编号PF00128)被归为糖基水解酶的第13家族。本发明的α淀粉酶催化结构域蛋白质序列如SEQ IDNOS：108、196、240、292和332所示。

β-半乳糖苷酶家族(PFAM收编号PF02449)属于糖基水解酶42家族。所述的酶催化末端非还原性末端β-D-半乳糖苷酶残基的水解。本发明的β-半乳糖苷酶蛋白质包括SEQ ID NO：210中所示的蛋白质。β半乳糖苷酶小链C末端结构域(PFAM收编号PF02930)被发现存在于二聚体β-半乳糖苷酶(EC：3.2.1.23)小链的羧基末端部分中。β半乳糖苷酶小链N末端结构域(PFAM收编号PF02929)被发现存在于二聚体β-半乳糖苷酶(EC：3.2.1.23)小链的氨基末端部分内。这些结构域还被发现存在于单链β半乳糖苷酶中。本发明的β半乳糖苷酶小链C末端结构域蛋白质如SEQ ID NO：214中所示。本发明β半乳糖苷酶小链N末端结构域蛋白质包括如SEQ ID NO：214中所示序列。

糖苷水解酶家族1(PFAM收编号PF00232)包含具有许多已知活性的酶：β-葡糖苷酶(EC：3.2.1.21)；p-半乳糖苷酶(EC：3.2.1.23)；6-磷酸-β-半乳糖苷酶(EC：3.2.1.85)；6-磷酸-β-葡糖苷酶(EC：3.2.1.86)；乳糖酶-根皮苷水解酶(EC：3.2.1.62)、(EC：3.2.1.108)；p-甘露糖苷酶(EC：3.2.1.25)；黑芥子酶(EC：3.2.1.147)。本发明的葡糖苷水解酶家族1蛋白质序列如SEQ ID NOS：10和220中所示。

糖苷水解酶家族2包括具有许多已知活性的酶：β-半乳糖苷酶(EC：3.2.1.23)；β-甘露糖苷酶(EC：3.2.1.25)；β-葡糖醛酸糖苷酶(EC：3.2.1.31)。这些酶包含保守的谷氨酸残基，该残基已显示出在大肠杆菌lacZ中是酶活性位点内常见的酸/碱催化剂(Gebler等(1992)J.Biol.Chem.267：11126-30)。糖基水解酶家族2免疫球蛋白样β夹心结构域(PFAM收编号PF00703)描述了免疫球蛋白样β-夹心结构域。糖结合结构域(PFAM收编号PF02837)具有果冻卷折叠结构。来自大肠杆菌的β-半乳糖苷酶具有被四个其它大β结构域所环绕的TIM-桶状核心(PFAM收编号PF02836)。SEQ ID NO：212具有这些结构域中的每一种。

糖苷水解酶家族31(PFAM收编号PF01055)包含具有数种已知活性的酶：α-葡糖苷酶(EC：3.2.1.20)、α-半乳糖苷酶(EC：3.2.1.22)、葡糖淀粉酶(EC：3.2.1.3)、蔗糖酶-异麦芽糖酶(EC：3.2.1.48)(EC：3.2.1.10)、α-木糖苷酶(EC：3.2.1)和α-葡聚糖裂合酶(EC：4.2.2.13)。糖苷水解酶家族31以序列相似性为基础对许多糖基水解酶进行了分组(Henrissat(1991)Biochem.J 280：309-16；Naim等(1991)FEBS Lett.294：109-12)。在蔗糖酶、异麦芽糖酶和溶酶体α-葡糖苷酶的催化活性中都涉及了天冬氨酸(Hermans等(1991)J.Biol.Chem.266：13507-12)。本发明的糖苷水解酶家族31蛋白质包括如SEQ ID NO：226中所示的蛋白质。糖苷水解酶家族32(PFAM收编号PF00251)包含具有数种已知活性的酶：转化酶(EC：3.2.1.26)、菊粉酶(EC：3.2.1.7)、果聚糖酶(EC：3.2.1.65)、外菊粉酶(EC：3.2.1.80)、蔗糖：蔗糖1-果糖基转移酶(EC：2.4.1.99)和果聚糖：果聚糖1-果糖基转移酶(EC：2.4.1.100)。本发明的糖苷水解酶家族32蛋白质包括如SEQ ID NOS：46和100中所示序列。

包含异淀粉酶N末端结构域(PFAM收编号PF02922)的酶属于糖基水解酶家族13。在作用于分支底物的一系列酶中发现了有此结构域，所说的酶即异淀粉酶、支链淀粉酶和分支酶。异淀粉酶水解糖原、支链淀粉和糊精中的1，6-α-D-葡糖苷分支联接；1，4-α-葡聚糖分支酶在糖原的1，6-葡糖苷联接形成中起作用；而支链淀粉酶是淀粉去分支酶。本发明的异淀粉酶N末端结构域蛋白质包括SEQ ID NO：240中所示序列。

α-半乳糖苷酶(EC：3.2.1.22)(蜜二糖酶)(PFAM收编号PF02065)催化蜜二糖水解成为半乳糖和葡萄糖(Dey和Pridham(1972)Adv.Enzymol.Relat.AreasMol.Biol.36：91-130)。α-半乳糖苷酶存在于多种生物体中。来自各种真核物种的α半乳糖苷酶在序列上存在很大程度的相似性。

大肠杆菌α半乳糖苷酶(基因melA)需要NAD和镁作为辅因子，它在结构上与真核状态的酶无关；相反，大肠杆菌质粒编码的α-半乳糖苷酶(基因rafA)含有与真核α半乳糖苷酶结构域相似的约50个氨基酸的区域(Aslanidis等(1989)J.Bacteriol.171：6753-63)。本发明的蜜二糖酶蛋白质包括如SEQ ID NO：198中所示序列。

碳水化合物利用相关性蛋白质还包括但不局限于以下类型的酶：醛糖1-差向异构酶(EC：5.1.3.3)(变旋酶)(PFAM收编号PF01263)，这是负责D-葡萄糖和其它醛糖在其α-和β-形式之间异头互换的酶。检测醛糖1-差向异构酶活性的方法是本领域众所周知的(参阅，例如，Majumdar等(2004)Eur.J Biochem.271：753-9)。本发明的醛糖1-差向异构酶序列如SEQ ID NO：200中所示。

烯醇酶(2-磷酸-D-甘油酸水解酶)是催化2-磷酸甘油酸和磷酸烯醇丙酮酸之间的互换的基本糖分解酶。

检测磷酸烯醇丙酮酸水解酶活性的方法是本领域众所周知的(参阅，例如，Fox等(1995)Plant Physio.109：433-43)。SEQ ID NO：254包含烯醇酶C-末端TIM桶状结构域(PFAM收编号PF00113)和烯醇酶N-末端结构域(PFAM收编号PF03952)。

果糖-双磷酸醛缩酶(EC：4.1.2.13)是催化可逆的醛醇裂解或果糖-1，6-双磷酸缩合成为二羟基丙酮磷酸和甘油醛3-磷酸的糖分解酶。有两类具有不同催化机制的果糖-双磷酸醛缩酶。类型11醛缩酶(PFAM收编号PF01116)(Marsh和Lebherz(1992)Trends Biochem.Sci.17：110-3)主要发现于原核生物和真菌中，它们是同型二聚体酶，其活性需要二价金属离子，一般是锌。该家族还包括大肠杆菌半乳糖醇操纵子蛋白质gatY，它催化塔格糖1，6-双磷酸转化成glycerone磷酸和D-甘油醛3-磷酸，而大肠杆菌N-乙酰半乳糖胺操纵子蛋白agaY催化相同的反应。在这些酶的前半段序列中存在两个组氨酸残基，已显示出与锌离子的结合相关。检测果糖双磷酸醛缩酶活性的方法是本领域众所周知的(参阅，例如，Alefounder等(1989)Biochem.J.257：529-534)。本发明的果糖-双磷酸醛缩酶类型I I蛋白质包含如SEQ IDNO：260中所示序列。

半乳糖-1-磷酸尿苷酰转移酶催化UTP和α-D-半乳糖1-磷酸在半乳糖代谢期间转变成UDP-葡萄糖和焦磷酸盐。C-末端结构域(PFAM收编号PF02744)所指的是半乳糖-1-磷酸尿苷酰转移酶的C末端。N-末端结构域(PFAM收编号PF01087)指的是半乳糖-1-磷酸尿苷酰转移酶的N末端。SEQID NO：202具有这两个结构域。检测UTP-已糖-1-磷酸尿苷酰转移酶活性的方法是本领域众所周知的(参阅，例如，Lobelle-Rich和Reeves(1983)Mol.Biochem.Parasitol.7：173-182)。

半乳糖-(EC：2.7.1.6)、同型丝氨酸(EC：2.7.1.39)、甲羟戊酸(EC：2.7.1.36)和磷酸甲羟戊酸(EC：2.7.4.2)激酶在其N末端部分含有保守的富Gly/Ser区，该区域可能涉及ATP的结合。SEQID NO：204是GHMP激酶推定的ATP结合蛋白家族成员(PFAM收编号PF00288)。检测激酶活性的方法是本领域众所周知的(参阅，例如，Tsay和Robinson(1991)Mol.Cell Biol.11：620-31)。

NAD依赖性差向异构酶/脱水酶家族(PFAM收编号PF01370)蛋白质利用NAD作为辅助因子。该家族的蛋白质利用核苷酸-糖底物进行多种化学反应(Thoden等(1997)Biochemistry 36：6294-304)。本发明的NAD依赖性差向异构酶/脱水酶蛋白质包括SEQ ID NO：216中所述序列。

羊毛硫抗生素和非羊毛硫抗生素的细菌素是作为含N末端延伸区的前体肽合成的(前导肽)，该延伸区成熟期间被切掉。大部分非羊毛硫抗生素以及一些羊毛硫抗生素具有所谓的双甘氨酸类型的前导肽。这些前导肽享有共有序列以及在位置-1和-2中具有两个保守甘氨酸残基的共同加工位点。双甘氨酸类型前导肽与指导蛋白质通过sec途径穿越胞质膜的N末端信号序列是无关的。它们的加工位点也不同于典型的信号肽酶切割位点，表明其中涉及了不同的加工酶。肽类细菌素是通过专门的ATP结合盒(ABC)转运蛋白穿越细胞质膜输出。ABC转运蛋白是成熟的蛋白酶，它的蛋白水解结构域位于该蛋白质的N末端(Havarstein等(1995)Mol.Microbiol.16：229-40)。肽酶C 39家族(PFAM收编号PF03412)结构域被发现存在于一系列的ABC转运蛋白中。不过，推测的催化性半胱氨酸和组氨酸并非在该家族的所有成员中均保守。本发明的肽酶C39家族蛋白质包括SEQ ID NO：144中所示的蛋白质。肽酶的活性可通过检测其水解活性进行评估(参阅，例如，Sasaki等(1995)J Dairy Res.62：601-610，以及Machuga和Ives(1984)Biochim.Biophys.Acta 789：26-36)。

PfkB家族碳水化合物激酶家族(PFAM收编号PF00294)包括多种碳水化合物和嘧啶激酶。所述的家族包括磷酸甲基嘧啶激酶(EC：2.7.4.7)、果糖激酶(EC：2.7.1.4)和核糖激酶(ribokinase)(EC：2.7.1.15)(rbsK基因)。该酶是焦磷酸硫胺素(TPP)合成途径的一部分，TPP是许多酶的一个基本辅因子。检测激酶活性的方法是本领域众所周知的(参阅，例如，Sato等(1993)J.Gen.Microbiol.139：921-7)。本发明的pfkB家族碳水化合物激酶蛋白质包括SEQ ID NOS：60、186、224和238所示的蛋白质。

酶催化的磷酸基团从ATP上转移是许多生物学过程中的一个重要反应。利用该反应的一种酶是磷酸果糖激酶(PFK)(PFAM收编号PF00365)，它催化果糖-6-磷酸磷酸化成为果糖-1，6-双磷酸，这是糖酵解途径中的一个关键调控步骤。PFK长度大约为300个氨基酸，有关该细菌酶的结构研究显示它含有两个相似的(a/(β)小叶：一个涉及ATP结合而另一个兼具底物结合位点和变构位点(与活性位点截然不同但影响酶活性的调控结合位点)。同样的四聚物亚基采取了两种不同的构象：在“关闭的”状态下，被结合的镁离子将酶产物(ADP和果糖-1，6-二磷酸)的磷酰基基团桥接起来；而在“开放的”状态下，镁离子只结合ADP，因为这两种产物此时被更远的分开。这些构象被认为是反应途径的连续阶段，所述途径需要亚基关闭使得两个分子足够靠近以便反应(Shirakihara和Evans(1988)J.Mol.Biol.204：973-94)。检测6-磷酸果糖激酶活性的方法是本领域众所周知的(参阅，例如，Wegener和Krause(2002)Biochem.Soc.Trans.30：264-70)。本发明的磷酸果糖激酶蛋白包括SEQ ID NO：256中所示蛋白质。

磷酸葡萄糖异构酶(EC：5.3.1.9)(PGI)(PFAM收编号PF00342)是催化葡萄糖-6-磷酸和果糖-6-磷酸可逆性异构化的二聚体酶。PGI与不同的途径有关：在大多数高等生物体中，它与糖酵解有关；在哺乳动物中它与糖原异生有关；在植物中它与碳水化合物生物合成有关；在某些细菌中它为果糖进入Entner-Doudouroff途径提供了入口。还已知多功能蛋白质PGI是神经白细胞素(介导神经元分化的神经营养因子)、自分泌运动性因子(调控细胞运动性的肿瘤分泌细胞因子)、分化和成熟介质以及肌原纤维结合的丝氨酸蛋白酶抑制剂，并且在细胞内外具有不同的作用。在细胞质中，它催化糖酵解的第二步，而在细胞外它起着神经生长因子和细胞因子的作用。检测葡萄糖-6-磷酸异构酶活性的方法是本领域众所周知的(参阅，例如，Nozue等(1996)DNA Seq.6：127-35)。本发明的磷酸葡糖异构酶蛋白包括SEQID NO：252中所示蛋白。

磷酸甘油酸激酶(EC：2.7.2.3)(PGK)(PFAM收编号PF00162)是催化ATP形成ADP以及逆过程的酶。在糖酵解第二阶段的第二步中，1，3-二磷酸甘油酸被转变成3-磷酸甘油酸，形成一分子ATP。如果出现相反的情况，则将形成一分子的ADP。此反应在大部分细胞中是必须的，在需氧生物中用于ATP的产生、厌氧生物中用于发酵以及植物中用于碳固定。PGK被发现于所有活的生物体中，并且其序列在整个进化过程中非常保守。所述的酶以单体形式存在，含有相应于该蛋白N-和C-末端的两个大小几乎相等的结构域(最后15个C-末端残基绕回入N-末端结构域)。3-磷酸甘油酸(3-PG)与该酶的N末端结合，而核苷酸底物MgATP或MgADP则结合该酶的C-末端结构域。这种延伸的双结构域结构是与大规模的“铰链弯曲”构象改变相关的，类似于己糖激酶中所发现的结构(Kumar等(1999)Cell Biochem.Biophys.31：141-64)。在每个结构域的核心是被α螺旋环绕的6链平行β折叠。结构域1是次序为342156的6链平行β-折叠片，而结构域2是次序为321456的6链平行β-折叠片。对酵母磷酸甘油酸激酶的可逆性解折叠进行分析表明，所述的两个小叶能独立折叠，这与折叠途径中出现具有单一结构域折叠的中间物是一致的(Yon等(1990)Biochimie 72：417-29)。检测磷酸甘油酸激酶活性的方法是本领域众所周知的(参阅，例如，Pal等(2004)Biochim.Biophys.Acta.1699：277-80)。本发明的磷酸甘油酸激酶蛋白包括SEQ ID NO：250所示蛋白。

磷酸甘油酸变位酶(EC：5.4.2.1)(PGAM)和二磷酸甘油酸变位酶(EC：5.4.2.4)(BPGM)是结构上相关的酶，它们催化涉及磷酸基团在磷酸甘油酸的三个碳原子之间的转移的反应。两种酶均能以不同特异性催化三种不同反应，以2，3-二磷酸甘油酸异构酯(2，3-DPG)作为反应起始物将2-磷酸甘油酸(2-PGA)异构化为3-磷酸甘油酸(3-PGA)，以3-PGA作为起始物从1，3-DPG合成2，3-DPG以及将2，3-DPG降解成3-PGA(磷酸酯酶EC：3.1.3.13活性)。许多其他的蛋白质包括，催化果糖-2，6-二磷酸和细菌的α-ribazole-5’-磷酸磷酸酯酶合成以及降解的双功能酶6-磷酸果糖-2-激酶/果糖-2，6-双磷酸酯酶，它与钴胺素生物合成有关，属于这一家族。检测这些酶的催化活性的方法是本领域众所周知的(参阅，例如，Rigden等(2001)Protein Sci.10：1835-46)。本发明的磷酸甘油酸变位酶家族(PFAM收编号PF00300)蛋白包括SEQ ID NO：244所述蛋白质。

丙酮酸激酶(EC：2.7.1.40)(PK)催化糖酵解中的最后步骤，即磷酸烯醇丙酮酸向丙酮酸的转变并伴随着ADP磷酸化成为ATP。大部分细菌和较低等的真核生物具有一种形式的这种酶，而某些细菌除外，例如大肠杆菌，它就具有两种同工酶。所有的同工酶似乎是约500个残基的相同亚基的四聚物。PK与磷酸果糖激酶和己糖激酶一起帮助控制糖酵解的速率。检测丙酮酸激酶活性的方法是本领域众所周知的(参阅，例如，Boles等(1997)J.Bacteriol.179：2987-93)。本发明的丙酮酸激酶α/β结构域(PFAM收编号PF02887)蛋白包括SEQ IDNO：258中所示蛋白质。本发明的丙酮酸激酶桶状结构域(PFAM收编号PF00224)蛋白包括SEQ ID NO：258中所示蛋白质。

许多酶需要焦磷酸硫胺素(TPP)(维生素B1)作为辅助因子。已显示这些酶中的某些在结构上是相关的(Green(1989)FEBS Lett.246：1-5)。焦磷酸硫胺素酶中央结构域(PFAM收编号PF00205)含有2折的Rossman折叠。SEQ ID NO：232包括焦磷酸硫胺素酶中央结构域以及焦磷酸硫胺素酶N-末端TPP结合结构域(PFAM收编号PF02776)。

酶3β-羟基类固醇脱氢酶/5-烯-4-烯异构酶(3β-HSD)催化5-烯-3β-羟基孕烯(hydroxypregnene)和5-烯-羟基雄烯类固醇前体氧化和异构化成为所有类型类固醇激素形成必需的相应4-烯-酮类固醇。本发明的3-β羟基类固醇脱氢酶/异构酶家族(PFAM收编号PF01073)蛋白包括SEQ ID NO：216中所述蛋白质。检测3-β-羟基-δ5-类固醇脱氢酶活性的方法是本领域众所周知的(参阅，例如，Moisan等(1999)J Clin Endocrinol Metab.84：4410-25)。

二羟基丙酮激酶(glycerone激酶)(EC：2.7.1.29)催化丙三醇应用途径中在ATP存在的条件下将glycerone磷酸化成为glycerone磷酸。Dak1结构域(PFAM收编号PF02733)是二羟基丙酮激酶家族的激酶结构域。本发明的Dak1结构域蛋白包括SEQ ID NO：190所示蛋白质。DAK2结构域(PFAM收编号PF02734)是二羟基丙酮激酶家族预测的磷酸酶结构域。本发明的Dak2结构域蛋白包括SEQ ID NO：192所示蛋白质。检测glycerone激酶活性的方法是本领域众所周知的(参阅，例如，Sellinger和Miller(1957)Fed.Proc.16：245-246)。

二糖、寡糖和多糖的生物合成涉及数百种不同的糖基转移酶的作用。这些酶是催化糖基部分从被激活的供体分子转移至特异的受体分子形成糖苷键的酶。已描述了将利用核苷酸二磷酸-糖、核苷酸单磷酸一糖和蔗糖磷酸的糖基转移酶(EC：2.4.1)以及相关的蛋白分为基于独特序列的家族。相同的三维折叠预期存在于各个家族中。因为3-D结构比序列更保守，所述家族中基于序列相似性定义的几个家族可能具有相似的3-D结构，并因此形成“小集团”。糖基转移酶组1家族的成员(PFAM收编号PF00534)转移UDP、ADP、GDP或CMP联接的糖。细菌酶与各种生物合成过程有关，包括外多糖生物合成、脂多糖核心生物合成以及粘多糖colanic acid的生物合成。本发明的糖基转移酶组1蛋白包括SEQ ID NO：328中所示的蛋白质。

本发明的激酶蛋白包括SEQ ID NOS：224、230、190、192、186和238中所示的蛋白。本发明的水解蛋白质包括SEQ ID NOS：10、46、50、60、100、108、196、198、200、202、204、210、212、214、216、218、220、222、226、276、292、342、344、346、356、358、362和364中所示的蛋白质。

代谢中所涉及的本发明蛋白质包括SEQ ID NOS：60、186、200、202、216、218、228、342、344、346、356和358中所示的蛋白质。本发明的糖酵解蛋白包括SEQ ID NOS：242、244、246、248、250、252、254、256、258、260中所示的蛋白。本发明的糖原代谢蛋白包括SEQ ID NOS：240、324、326、328、330和332中所示的蛋白。EPS代谢中涉及的本发明蛋白质包括SEQ ID NOS：348、350、352和354中所示的蛋白。

在微生物和植物中克隆和表达碳水化合物利用相关性蛋白质的方法以及评估那些蛋白质的功能的方法是本领域所已知的(参阅，例如，de Vos(1996)Antonie vanLeeuwenhoek 70：223-242；Yeo etal.(2000)Mol.Cells 10：263-268；Goddijn等(1997)Plant Physio.113：181-190)。例如，可通过酶测定、发酵测定和转运测定评估初级和次级转运体系相关蛋白质的功能。例如，可通过糖磷酸化作用测定来评估基团转位体系相关蛋白的功能。参阅，例如，Russell等(Russell等(1992)J Biol.Chem.267：4631-4637)，其中鉴定了来自变异链球菌中初级转运体系(msm)的基因并在大肠杆菌中进行了表达；Leong-Morgenthaler等(Leong-Morgenthaler et al.(1991)J.Bacteriol.173：1951-1957)，其中克隆了来自保加利亚乳杆菌次级转运体系(乳糖)的两种基因并于大肠杆菌中进行了表达；Vaughan等(Vaughan等(1996)Appl.Env.Microbiol.62：1574-1582)，其中克隆来自乳明串珠菌(Leuconostoc lactis)的次级转运体系(lacS)基因并于大肠杆菌中进行了表达；de Vos等(de Vos等(1990)J Biol.Chem.265：22554-22560)，其中鉴定、克隆并于大肠杆菌和乳酸乳杆菌(Lactobacillu slactis)中表达了来自乳酸乳球菌的两种PTS体系基因；Sato等(Sato等(1989)J.Bacteriol.171：263-271)，其中将来自变异链球菌的scrA基因克隆入大肠杆菌中并发现展示出蔗糖PTS活性；Alpert和Chassy(Alpert和Chassy(1990)J.Biol.Chem.265：22561-22568)，其中克隆了编码干酪乳杆菌的乳糖特异性酶II的基因并表达于大肠杆菌中；Boyd等(Boyd等(1994)Infect.Immun.62：1156-1165)，其中克隆了编码变异链球菌的PTS转运体系的HPr和酶I的基因并表达于大肠杆菌中；Garg等(Garg等(2002)Proc.Natl.Acad.Sci.USA 99：15898-15903)，其中大肠杆菌海藻糖生物合成基因otsA和otsB的过表达导致转基因植物对非生物性压力的耐受力提高并且增强了生产力；以及Grinius和Goldberg(Grinius和Goldberg(1994)J.Biol.Chem.269：29998-30004)，其中表达了多药抗性蛋白质并证实发挥了药物泵的作用。

一种或多种碳水化合物利用相关蛋白质的表达使得生物体具有改良的在细胞胞质中积聚碳水化合物的能力。例如，引入或过表达糖分解代谢中所涉及的酶而不表达相应的转运蛋白质可能导致碳水化合物在细胞质中积聚。或者，引入或过表达碳水化合物转运相关蛋白可能导致增加碳水化合物转运入外部环境中。将碳水化合物相关性基因引入生物体内或在其中表达的方法是本领域所已知的。

碳水化合物在细胞中的积聚是可评估的，例如，通过层析法或酶检测法。参阅，例如，Chaillou等(1998)J.Bacteriol.180：4011-4014 andGoddijn et al.(1997)同上文。

一种或多种碳水化合物利用相关蛋白的表达使得生物体可能具有改良的利用或生产碳水化合物作为能源的能力。在生物体中克隆和表达碳水化合物利用相关蛋白质的方法以及评估那些蛋白质功能的方法是本领域所已知的(参阅，例如，de Vos(1996)AntonievanLeeuwenhoek 70：223-242；Hugenholz等(2002)AntonievanLeeuwenhoek 82：217-235)。例如，可将乳糖代谢的基因引入细菌中以改善乳糖的利用，并产生不耐乳糖的人群更可接受的产物(Hugenholz等(2002)，见上文)。在这些改良的细菌中可进行进一步的修饰，诸如阻断葡萄糖代谢以便葡萄糖不被降解，而是从细胞释放入培养基中，从而提供自然的甜味。参阅，例如，(Hugenholz等(2002)见上文)。或者，可引入半乳糖代谢的基因以及α-葡萄糖磷酸变位酶的基因以提高微生物的半乳糖发酵能力，从而帮助防止消耗高水平的半乳糖，因为后者可能会引起健康问题(Hugenholz等(2002)见上文；Hirasuka和Li(1992)J.Stud.Alcohol 62：397-402)。与半乳糖代谢相关的一个基因是α-半乳糖苷酶，它的表达可能对于从发酵产物中去除蜜三糖类型的糖类是有用的，因为单胃动物不能降解它们(Hugenholz等(2002)见上文)。在烟草植物中成功的表达细菌的甘露醇-1-磷酸脱氢酶(mtlD)基因导致甘露醇的合成和积聚(Tarczynski等(1992)Proc.Natl.Acad.Sci.USA 89：2600-2604)。

各种碳水化合物相关蛋白质的功能可用以下方法进行评估，例如，通过微生物生长测定、转运测定、酶测定或通过层析法和NMR进行分析。参阅，例如，Djordjevic等(2001)J.Bacteriol.183：3224-3236；Chaillou等(1998)J.Bacteriol.180：4011-4014；和Tarczynski等(1992)见上文。

一般而言，通透酶、膜相关酶和诸如转录阻遏子或抗终止子等调控子可能需要表达于细胞中以便最佳的应用碳水化合物。转录抗终止子的作用可通过测定报告系统中抗终止子的活性进行检测(参阅，例如，Alpert和Siebers(1997)J.Bacteriol.179：1555-1562)。诸如lacR等阻遏子的功能可通过酶活性或生长测定法进行评估(参阅，例如，van Rooijen等(1993)Protein Eng.6：201-206；vanRooijen和de Vos(1990)J Biol.Chem.265：18499-18503)。

本发明的细菌调控蛋白质包括SEQ ID NOS：8、38、98、104、118、150、178、180、182、184、188、266、290、304和336中所示的序列。

本发明的细菌调控蛋白lacI家族(PFAM收编号PF00356)蛋白包括SEQ ID NOS：38、98和182中所示的序列。

本发明的细菌调控蛋白gntR家族(PFAM收编号PF00392)包括SEQID NO：106中所示的序列。本发明的细菌调控的螺旋-转角-螺旋蛋白质AraC家族(PFAM收编号PF00165)蛋白包括SEQ ID NO：118中所示的蛋白质。本发明的细菌调控蛋白deoR家族(PFAM收编号PF00455)蛋白包括SEQ ID NO：188和336中所示的蛋白质。

PRD结构域(针对PTS调控结构域)(PFAM收编号PF00874)是发现于BglG家族的细菌转录抗终止子中以及诸如MtlR和LevR等活化子中的可磷酸化调控结构域。PRD结构域在保守的组氨酸残基上被磷酸化。含PRD的蛋白质与革兰氏阳性和革兰氏阴性细菌中分解代谢操纵子的调节有关，其特征常常在于与RNA(就抗终止子(CAT RBD)而言是CAT-RBD)或DNA(就活化子而言)结合的短N末端效应器结构域以及通过糖磷酸转移酶体系(PTS)响应于碳源的可供利用性而在保守的组氨酸上磷酸化的重复PRD模块。磷酸化作用被认为可改变二聚体蛋白质的稳定性，并因此改变效应器结构域的RNA-或DNA-结合活性。这是一个与大肠杆菌bglG蛋白相关的细菌蛋白家族。大肠杆菌bglG蛋白通过发挥转录终止子的作用介导了β-葡糖苷(bgl)操纵子的正调控(Houman等(1990)Cell 62：1153-63)。BglG是识别恰好位于操纵子内两个终止位点上游的特异序列的RNA-结合蛋白。bglG的活性通过来自β-葡糖苷PTS体系的通透酶bglF(EII-bgl)对其的磷酸化作用而受到阻遏(Amster-Choder和Wright(1990)Science 249：540-2)。BglG与其他的蛋白质高度相似，它还可能用作转录抗终止子。本发明的含PRD结构域的蛋白质包括SEQ ID NOS：8和266的序列。

AraC-样配体结合结构域家族(PFAM收编号PF02311)代表了细菌基因调控蛋白AraC的结合阿拉伯糖和二聚化的结构域。所述结构域被发现与螺旋-转角-螺旋(HTH)DNA结合基元HTH AraC联合。该结构域与Cupin结构域关系较远。本发明的AraC-样配体结合结构域家族蛋白包括SEQ ID NO：118中所述的蛋白质。

CAT RNA结合结构域(PFAM收编号PF03123)被发现存在于转录抗终止子蛋白家族的氨基末端。该结构域已被称为CAT(Co-AntiTerminator共抗终止子)结构域。该结构域在已知结构内形成二聚体。BglG/SacY家族的转录抗终止子是介导革兰氏阳性和革兰氏阴性细菌中糖代谢操纵子的诱导作用的调控蛋白。通过活化，这些蛋白质与新生mRNA中的特异目标结合，从而防止RNA聚合酶从DNA模板上解离失败(Declerck等(1999)J.Mol.Biol.294：389-402)。本发明的CAT RNA结合结构域蛋白包括SEQ ID NOS：8和266中所述的蛋白质。

SEQ ID NO：184是HPr丝氨酸激酶N末端家族(PFAM收编号PF02603)的成员，以及HPr丝氨酸激酶C末端家族(PFAM收编号PF07475)的成员。N末端家族代表了Hpr丝氨酸/苏氨酸激酶PtsK的N末端区域。C末端家族代表了Hpr丝氨酸/苏氨酸激酶PtsK的C末端激酶结构域。该激酶是细菌内碳分解代谢抑制作用调控下的多组分磷酸传递体系内的感应器(Marquez等(2002)Proc.Natl.Acad.Sci.U.S.A.99：3458-63)。该激酶与众不同的识别其靶目标的三级结构，并且是与任一前述蛋白质磷酸化酶都无关的新家族的成员。对来自Staphylococcus xylosus的全长结晶状酶以1.95A的分辨率进行X-射线分析显示，该酶由两个明显分离的结构域组成，装配于类似三叶螺旋浆的六聚体结构中。每个叶片由两个N末端结构域组成，紧凑的中央轮轴集合了C末端激酶结构域(Reizer等(1998)Mol.Microbiol.27：1157-69)。

本发明的序列还可改变生物体的能力从而改变食品的气味或品质。修饰葡萄糖代谢以产生可供选择的糖类是可导致气味或品质特性改变的一种方法。乳酸脱氢酶基因的破坏并伴随着来自甘露醇或山梨醇操纵子基因的表达导致产生甘露醇和山梨醇(Hugenholz等(2002)见上文)。发酵期间二乙酰基的产生导致植物黄油香味，这种作用可通过乳酸脱氢酶的破坏或NADH氧化酶的过表达并结合α-乙酰乳酸脱羧酶的破坏得以增强(Hugenholz和Kleerebezem，(1999)见上文；Hugenholtz等(2000)Appl.Environ.Microbiol.66：4112-4114)。或者，α-乙酰乳酸合酶或乙酰羟酸合酶的过量生产伴随着α-乙酰乳酸脱羧酶的破坏导致了二乙酰基产量的增加(Swindell等(1996)Appl.Environ.Microbiol.62：2641-2643；Platteeuw等(1995)Appl.Environ.Microbiol.61：3967-3971)。丙氨酸脱氢酶的过表达导致了产生丙氨酸而非乳酸，为发酵食品提供了增味剂和甜料(Hols等(1999)Nat.Biotechnol.17：588-592)。

用于改进生物体产生改良的碳水化合物的能力的方法也在本发明范围内，包括将至少一种本发明的核苷酸序列引入生物体中。此外还涉及产生改良的碳水化合物的方法，包括用本发明的多肽接触待修饰的碳水化合物。产生改良的碳水化合物的方法是本领域所已知的。参阅，例如，Kim等(2001)Biotechnol.Prog.17：208-210。

本发明的序列还可改进生物体在食物体系或哺乳动物胃肠道中存活的能力，或者改进生物体在食物加工和贮存期间的稳定性和存活力。例如，海藻糖产量的增加可能使发酵产品的新鲜程度和味道保持时间延长(参阅，例如，www.nutracells.com)。海藻糖还可帮助预防蛋白质聚集或蛋白质病态构象所导致的疾病，诸如Creutzfeld-Jacob症。在植物中，海藻糖的积聚产生了对抗诸如干旱、盐和寒冷等环境压力的保护作用(参阅，例如，Jang等(2003)Plant Physiol.131：516-524；Penna(2003)Trends Plant Sci.8：355-357；Garg等(2002)Proc.Natl.Acad.Science 99：15898-15903；Yeo等(2000)见上文)。此外，植物已被果糖转移酶基因转化，它使得该植物能积聚高水平的果聚糖(van der Meer等(1994)Plant Cell 6：561-570)。除了作为碳水化合物储备的作用之外，果聚糖还可使植物耐受干和冷的条件(Pontis和delCampillo(1985)″Fructans″in Biochemistry ofStorage Carbohydrates in Green Plants，Day and Dixon，eds.(London：Academic Press)，pp.810-816；Pilon-Smits等(1995)Plant Physiol.107：125-130)。细菌基因甘露醇-1-磷酸脱氢酶也已表达于植物中，导致甘露醇产生，这被认为赋予了有利的性状，包括渗透调节和中和氢氧根(Tarczynski等(1992)见上文)。

本发明的多药转运蛋白序列可使得生物体在接触抗菌多肽或其它毒素后仍能存活。这可能是由于将药物或毒素运送出细胞的能力有所提高造成的。

这些核苷酸序列的变体也包括在内，诸如那些保持或改变将碳水化合物或毒素进或出细胞的运送能力的序列，以及那些保持或改变积聚或利用碳水化合物的能力的序列。

制备和检测碳水化合物相关的或多药转运蛋白的变体的方法是本领域众所周知的。参阅，例如，Poolman等(Poolman等(1996)Mol.Microbiol.19：911-911)，其中分离或构建了具有改变的底物特异性的次级转运体系蛋白质变体(mellibiose和乳糖)并进行了测试。在这些突变体中，糖的转运是与阳离子同向转运不相偶联的。还可参阅，例如，Djorovevic等(2001)见上文，其中构建了具有改变的调控活性的突变体HPr蛋白质；以及Adams等(Adams等(1994)J.Biol.Chem.269：5666-5672)，其中产生并鉴定了来自Lactobacillusdelbr üeckiisubsp.Bulgaricus的冷敏感型β-半乳糖苷酶基因变体。这些突变的基因在低温下Vma_x降低，因此可用于预防发酵产物在冷藏期间酸化(Mainzer等(1990)″Pathway engineering of保加利亚乳杆菌forimproved yoghurt，″in Yoghurt：Nutritional and Health Properties，Chandan，ed.，(National Yoghurt Association，Virginia，US)，pp.41-55。还可参阅，Bettenbrock等(Bettenbrock等(1999)J Bacteriol.181：225-230)，其中分离了具有改良的半乳糖特异性PTS基因的突变体。还可参阅，vanRooijen等(1990)见上文，其中分离了对活性无影响的lacR阻遏子变体。还可参阅Kroetz等，其中分析了人MDR1基因的多态性(Kroetz等(2003)Pharmacogenetics 13：481-94)，以及Mitomo等，其中分析了ABC转运蛋白ABCG2的变体(Mitomo等(2003)Biochem.J.373：767-74)。

任何以上修饰都可与在乳酸细菌中已被改造或提议的其他代谢变化相结合。这些变化包括B-维生素的产生，诸如叶酸(B11)、核黄素(B2)或钴胺素(B12)；多元醇化合物或低卡路里糖的产生，可取代蔗糖、乳糖、葡萄糖或果糖作为甜味剂；塔格糖-另一种蔗糖替代品-的产生各种外多糖的产生，阻断葡萄糖代谢以提供天然的甜味，降低半乳糖的产量；α-半乳糖苷诸如水苏糖和蜜三糖水平较低的食物的产生；以及海藻糖产量的增加，这些变化都保留了食品的特色并可能与疾病的预防有关(Hugenholz等(2002)见上文；van Roojen等(1991)J.Biol.Chem.266：7176-7178)。

本发明还提供了从食物或化学产品中去除或改变不合需要的碳水化合物的方法。所述的方法包括用本发明的纯化多肽接触所述产品。测定碳水化合物的去除或改变的方法是本领域众所周知的。

表1.本发明的碳水化合物应用蛋白

以下实施例只供说明而非对本发明的限制。

*实施例1.氨基酸序列的缺口BlastP结果

缺口BlastP序列比对显示SEQ ID NO：2(144个氨基酸)的第1-140位氨基酸与来自无害利斯特氏菌并同源于PTS体系甘露糖特异因子IIAB的蛋白质(收编号NP469488.1；NC003212)具有大约61％的同一性，第1-140位氨基酸与来自单核细胞增生利斯特氏菌并同源于PTS体系甘露糖特异因子IIAB的蛋白质(收编号NP463629.1；NC～003210)具有大约60％的同一性，第1-139位氨基酸与来自丙酮丁醇梭菌并且是甘露糖特异磷酸转移酶体系组分IIAB的蛋白质(收编号NP～149230.1；NC～001988)具有大约63％的同一性，第1-139位氨基酸与来自产气英膜梭菌(Clostridium perfringens)并且是PTS体系蛋白的蛋白质(收编号NP561737.1；NC003366)具有大约62％的同一性，第2-141位氨基酸与来自酿脓链球菌(Streptococcuspyogenes)并且是甘露糖特异磷酸转移酶体系组分IIAB的蛋白质(收编号NP269761.1；NC～002737)具有大约50％的同一性。

缺口BlastP序列比对显示SEQ ID NO：4(123个氨基酸)第20-109位氨基酸与来自无害利斯特氏菌并同源于磷酸转移酶体系(PTS)地衣聚糖(lichenan)特异性酶IIA组分的蛋白质(收编号NP～471165.1；NC～003212)具有大约60％的同一性，第20-110位氨基酸与来自无害利斯特氏菌并同源于纤维二糖磷酸转移酶IIA组分的蛋白质(收编号NP～472161.1；NC～003212)具有大约57％的同一性，第1-112位氨基酸与来自乳酸乳球菌乳亚种并且是纤维二糖特异PTS体系IIA组分(EC 2.7.1.69)的蛋白质(收编号NP266570.1；NC002662)具有大约46％的同一性，第9-112位氨基酸与来自Bacillushalodurans并且是PTS体系纤维二糖特异性酶IIA组分的蛋白质(收编号NP241776.1；NC_002570)具有大约44％的同一性，以及第16-112位氨基酸与来自酿脓链球菌并同源于PTS酶III的蛋白质(收编号NP607437.1；NC_003485)具有大约51％的同一性。

缺口BlastP序列比对显示SEQ ID NO：6(161个氨基酸)第6-143位氨基酸与来自屎肠球菌并且是β葡糖苷特异转运蛋白的蛋白质(BglS)的蛋白质(收编号gblAAD28228.1；AF121254)具有大约53％的同一性，第13-159位氨基酸与来自肺炎链球菌并且是PTS体系IIABC组分的蛋白质(收编号NP_345256.1；NC003028)具有大约48％的同一性，第13-159位氨基酸与来自肺炎链球菌并且是PTS葡萄糖特异酶IIABC组分的蛋白质(收编号NP358262.1；NC_003098)具有大约48％的同一性，第13-159位氨基酸与来自酿脓链球菌并且同源于PTS体系酶IIA组分的蛋白质(收编号NP608025.1；NC_003485)具有大约46％的同一性，以及第13-159位氨基酸与来自酿脓链球菌并同源于PTS酶IIA组分的蛋白质(收编号NP269950.1；NC_002737)具有大约46％的同一性。

缺口BlastP序列比对显示SEQ ID NO：8(291个氨基酸)第11-282位氨基酸与来自枯草芽孢杆菌并且是转录抗终止子(licT)的蛋白质(收编号sp/P39805/LICT_BACSU)具有大约36％的同一性，第11-282位氨基酸与来自枯草芽孢杆菌并且是转录抗终止子(BglG家族)的蛋白质(收编号NP_391787.1；NC_000964)具有大约36％的同一性，第11-282位氨基酸与来自大肠杆菌并且涉及bgl操纵子正调控的蛋白质(收编号NP-418179.1；NC～000913)具有大约37％的同一性，第11-282位氨基酸与来自菊欧文氏菌(Erwinia chrysanthemi)并且是β葡糖苷操纵子抗终止子的蛋白质(收编号splP26211 1ARBG～ERWCH)具有大约33％的同一性，以及第9-288位氨基酸与来自丙酮丁醇梭菌并且是转录抗终止子(licT)的蛋白质(收编号Nu-347062.1；NC～003030)具有大约34％的同一性。

缺口BlastP序列比对显示SEQ ID NO：10(480个氨基酸)的第8-473位氨基酸与来自单核细胞增生利斯特氏菌并同源于磷酸β葡糖苷酶的蛋白质(收编号NP463849.1；NC～003210)具有大约59％的同一性，第8-473位氨基酸与来自无害利斯特氏菌并同源于磷酸β葡糖苷酶的蛋白质(收编号NP469689.1；NC～003212)具有大约58％的同一性，第7-473位氨基酸与来自丙酮丁醇梭菌并且是6-磷酸-β-葡糖苷酶的蛋白质(NP～347379.1；NC003030)具有大约57％的同一性，第8-473位氨基酸与来自Clostridium longisporum并且是6-磷酸-β-葡糖苷酶的蛋白质(收编号splQ461301ABGA～CLOLO)具有大约57％的同一性，第1-473位氨基酸与来自枯草芽孢杆菌并且是β-葡糖苷酶的蛋白质(收编号NP～391805.1；NC～000964)具有大约55％的同一性。

缺口BlastP序列比对显示SEQ ID NO：12(625个氨基酸)的第1-624位氨基酸与来自酿脓链球菌并且是β-葡糖苷通透酶IIABC组分的蛋白质(收编号NP 268836.1；NC～002737)具有大约38％的同一性，第1-624位氨基酸与来自酿脓链球菌并且是β-葡糖苷通透酶IIABC组分的蛋白质(收编号NP606826.1；NC～003485)具有大约38％的同一性，第1-605位氨基酸与来自肺炎链球菌并且是磷酸转移酶体系糖特异EII组分的蛋白质(收编号NP～358099.1；NC003098)具有大约38％的同一性，第1-605位氨基酸与来自肺炎链球菌并且是PTS体系β-葡糖苷特异的IIABC组分的蛋白质(收编号NP～345091.1；NC～003028)具有大约38％的同一性，第1-622位氨基酸与来自Bacillus halodurans并且是PTS体系β-葡糖苷特异的IIABC组分的蛋白质(收编号NP 241162.1；NC～002570)具有大约38％的同一性。

缺口BlastP序列比对显示SEQ ID NO：14(675个氨基酸)的第17-648位氨基酸与来自丙酮丁醇梭菌并且是PTS体系β-葡糖苷特异的IIABC组分的蛋白质(收编号NP_348035.1；NC_003030)具有大约50％的同一性，第17-656位氨基酸与来自Bacillus halodurans并且是PTS体系β-葡糖苷特异酶IIABC的蛋白质(收编号NP～241461.1；NC～002570)具有大约50％的同一性，第17-656位氨基酸与来自单核细胞增生利斯特氏菌并且同源于PTS体系β-葡糖苷特异性酶IIABC的蛋白质(收编号NP_463560.1；NC_003210)具有大约50％的同一性，第17-654位氨基酸与来自Clostridium longisporum并且是PTS依赖型酶II的蛋白质(收编号gb/AAC05713.1；L49336)有大约48％的同一性，第13-654位氨基酸与来自变异链球菌并且是β-葡糖苷特异性EII通透酶的蛋白质(收编号gb/AAF89975.1；AF206272)有大约48％的同一性。

缺口BlastP序列比对显示SEQ ID NO：16(445个氨基酸)第10-443位氨基酸与来自枯草芽孢杆菌并且是磷酸转移酶体系(PTS)蛋白地衣聚糖特异性酶IIC组分的蛋白质(收编号NP_391737.1；NC_000964)有大约41％的同一性，第14-442位氨基酸与来自枯草芽孢杆菌并且同源于PTS体系IIBC组分(ywbA)组分的蛋白质(收编号sp/P39584/YWBA_BACSU)有大约42％的同一性，第14-441位氨基酸与来自嗜热脂肪芽孢杆菌并且是纤维二糖磷酸转移酶IIC组分的蛋白质(收编号SP/Q45400/PTCC_BACST)有大约41％的同一性，第12-441位氨基酸与来自肺炎链球菌并且是磷酸转移酶体系糖特异性EII组分的蛋白质(收编号NP_358015.1；NC_003098)有大约41％的同一性，并且第12-441位氨基酸与来自肺炎链球菌并且是PTS体系纤维二糖特异性IIC组分的蛋白质(收编号NP_344993.1；NC_003028)有大约40％的同一性。

缺口BlastP序列比对显示SEQ ID NO：18(422个氨基酸)第9-417位氨基酸与来自枯草芽孢杆菌并且同源于磷酸转移酶体系酶II的蛋白质(收编号NP_391718.1；NC_000964)具有大约34％的同一性，第17-414位氨基酸与来自枯草芽孢杆菌并且是磷酸转移酶体系(PTS)地衣聚糖特异性酶IIC组分的蛋白质(收缩号NP_391737.1；NC_000964)具有大约33％的同一性，第10-417位氨基酸与来自嗜热脂肪芽孢杆菌并且是纤维二糖磷酸转移酶IIC组分的蛋白质(收编号SP/Q45400/PTCC_BACST)有大约34％的同一性，第9-414位氨基酸与来自无毒利斯特氏菌并且同源于PTS体系纤维二糖特异性IIC组分的蛋白质(收编号NP_470241.1；NC_003212)有大约33％的同一性，并且第11-415位氨基酸与来自布氏疏螺旋体并且是PTS体系纤维二糖特异性IIC组分(CelB)的蛋白质(收编号NP_046990.1；NC_001903)有大约31％的同一性。

缺口BlastP序列比对显示SEQ ID NO：20(130个氨基酸)与来自马尔他布鲁氏菌并且是磷酸转移酶体系IIA组分的蛋白质(收编号NP_540949.1；NC_003317)有大约33％的同一性，第2-102位氨基酸与来自弯曲乳杆菌并且是EIIA-甘露糖蛋白的蛋白质(收编号96/AAB04153.1；U28163)有大约32％的同一性，第3-96位氨基酸与来自产气荚膜梭菌并且同源于PTS体系蛋白的蛋白质(收编号NP_563545.1；NC_003366)有大约32％的同一性，第3-123位氨基酸与来自产气荚膜梭菌并且同源于PTS体系蛋白的蛋白质(收编号NP_561737.1；NC_003366)有大约25％的同一性，并且第3-123位氨基酸与来自丙酮丁醇梭菌并且是甘露糖特异性磷酸转移酶体系组分IIAB的蛋白质(收编号NP_149230.1；NC_001988)有大约25％的同一性。

缺口BlastP序列比对显示SEQ ID NO：22(162个氨基酸)第8-159位氨基酸与来自丙酮丁醇梭菌并且是PTS体系酶IIBC组分(半乳糖醇/果糖特异性)的蛋白质(收编号NP_349560.1；NC_003030)有大约38％的同一性，第7-158位氨基酸与来自肺炎链球菌并且是磷酸转移酶体系糖特异性EII成分的蛋白质(收编号NP_358156.1；NC_003098)有大约36％的同一性，第7-158位氨基酸与来自肺炎链球菌并且同源于PTS体系IIA组分的蛋白质(收编号NP_345152.1；NC_003028)有大约36％的同一性，第20-134位氨基酸与来自无乳链球菌并且是GatA蛋白的蛋白质(收编号gb/AAG 09977.1；AF248038)有大约38％的同一性，并且第16-159位氨基酸与来自Bacillus halodurans并且是PTS体系半乳糖醇特异性酶IIA组分的蛋白质(收编号NP_241058.1；NC_002570)有大约33％的同一性，

缺口BlastP序列比对显示SEQ ID NO：24(466位氨基酸)第30-461位氨基酸与来自丙酮丁醇梭菌并且是PTS纤维二糖特异性组分IIC的蛋白质(收编号NP～347026.1；NC～003030)具有大约47％的同一性，第26-465位氨基酸与来自乳酸乳球菌乳亚种并且是纤维二糖特异PTS体系IIC组分(EC 2.7.1.69)的蛋白质(收编号NP266974.1；NC～002662)具有大约45％的同一性，第82-465位氨基酸与来自乳酸乳球菌乳亚种并且是纤维二糖特异PTS体系IIC组分(EC 2.7.1.69)的蛋白质(收编号NP～266572.1；NC～002662)具有大约46％的同一性，第34-466位氨基酸与来自酿脓链球菌并且是PTS体系酶IIC组分的蛋白质(收编号NP269994.1；NC～002737)具有大约41％的同一性，以及第34-466位氨基酸与来自酿脓链球菌并且同源于PTS体系酶IIC组分的蛋白质(收编号NP～608069.1；NC～003485)具有大约40％的同一性。

缺口BlastP序列比对显示SEQ ID NO：26(428个氨基酸)的第25-420位氨基酸与来自无害利斯特氏菌并同源于PTS纤维二糖特异酶IIC组分的蛋白质(收编号NP-472233.1；NC003212)具有大约28％的同一性，第115-415位氨基酸与来自干酪乳杆菌并且是LacE蛋白质(收编号emblCAB02556.1；Z80834)具有大约27％的同一性，第137-425位氨基酸与来自无害利斯特氏菌并同源于PTS体系纤维二糖特异酶IIC的蛋白质(收编号NP-472184.1；NC 003212)具有大约26％的同一性，第137-425位氨基酸与来自单核细胞增生利斯特氏菌并且同源于PTS体系纤维二糖特异酶IIC的蛋白质(收编号NP466230.1；NC003210)具有大约26％的同一性，以及第115-415位氨基酸与来自干酪乳杆菌并且是磷酸转移酶体系酶II(EC 2.7.1.69)的蛋白质(收编号pirllB23697)具有大约26％的同一性。

缺口BlastP序列比对显示SEQ ID NO：28(475个氨基酸)的第10-471位氨基酸与来自乳酸乳球菌乳亚种并且是纤维二糖特异PTS体系IIC组分(EC 2.7.1.69)的蛋白质(收编号NP～266974.1；NC～002662)具有大约57％的同一性，第71-475位氨基酸与来自乳酸乳球菌乳亚种并且是纤维二糖特异PTS体系IIC组分(EC 2.7.1.69)的蛋白质(收编号NP266572.1；NC～002662)具有大约45％的同一性，第13-470位氨基酸与来自丙酮丁醇梭菌的PTS纤维二糖特异组分IIC蛋白质(收编号Nu-347026.1；NC003030)具有大约42％的同一性，第17-468位氨基酸与来自酿脓链球菌并同源于PTS体系酶IIC组分的蛋白质(收编号NP269994.1；NC～002737)具有大约41％的同一性，第17-468位氨基酸与来自酿脓链球菌并同源于PTS体系酶IIC组分的蛋白质(收编号NP～608069.11(NC～003485)具有大约41％的同一性。

缺口BlastP序列比对显示SEQ ID NO：30(441个氨基酸)的第1-428位氨基酸与来自无害利斯特氏菌并同源于PTS体系纤维二糖特异酶IIC的蛋白质(收编号Nu-472184.1；NC～003212)具有大约46％的同一性，第1-428位氨基酸与来自单核细胞增生利斯特氏菌并且同源于PTS体系纤维二糖特异酶IIC的蛋白质(收编号NP466230.1；NC～003210)具有大约46％的同一性，第10-427位氨基酸与来自酿脓链球菌并同源于PTS体系IIC组分的蛋白质(收编号NP 607435.1；NC～003485)具有大约39％的同一性，第1-428位氨基酸与来自乳酸乳球菌乳亚种的纤维二糖特异PTS体系IIC组分(EC 2.7.1.69)的蛋白质(收编号NP266330.1；NC002662)具有大约36％的同一性，第1-421位氨基酸与来自单核细胞增生利斯特氏菌并同源于纤维二糖磷酸转移酶IIC组分的蛋白质(收编号NP466206.1；NC～003210)具有大约31％的同一性。

缺口BlastP序列比对显示SEQ ID NO：32(626个氨基酸)的第1-532位氨基酸与来自枯草芽孢杆菌的磷酸转移酶体系(PTS)熊果苷样酶IIBC组分的蛋白质(收编号NP-388701.1；NC000964)具有大约54％的同一性，第2-530位氨基酸与来自产气荚膜梭菌(Clostridiumperfringens)的PTS熊果苷样酶IIBC组分的蛋白质(收编号NP561112.1；NC～003366)具有大约51％的同一性，第1-533位氨基酸与来自死亡梭杆菌并且是PTS蛋白EII的蛋白质(收编号gblAAB63014.2；U81185)具有大约52％的同一性，第1-533位氨基酸与来自丙酮丁醇梭菌并且是MalP蛋白的蛋白质(收编号gblAAK69555.1；AF290982)具有大约51％的同一性，第1-533位氨基酸与来自丙酮丁醇梭菌并且是PTS体系熊果苷样IIBC组分的蛋白质(收编号NP～347171.1；NC～003030)具有大约51％的同一性。

缺口BlastP序列比对显示SEQ ID NO：34(663个氨基酸)的第1-456位氨基酸与来自乳酸乳球菌乳亚种并且是蔗糖特异PTS体系IIBC组分(EC2.7.1.69)的蛋白质(收编号NP267287.1；NC～002662)具有大约58％的同一性，第5-471位氨基酸与来自金黄色葡糖球菌金黄亚种并同源于蔗糖磷酸转移酶II的蛋白质(收编号Nu～373429.1；NC002745)具有大约54％的同一性，第5-472位氨基酸与来自Bacillushalodurans并且是PTS体系蔗糖磷酸转移酶IIBC组分的蛋白质(收编号NP～244441.1；NC～002570)具有大约46％的同一性，第4-468位氨基酸与来自Salmonella enterica subsp.enteric serovar Typhi并且同源于PTS体系IIBC组分的蛋白质(收编号Nu-457099.1；NC003198)具有大约39％的同一性，以及第4-468位氨基酸与来自鼠伤寒沙门氏菌(Salmonella typhimurium)并同源于磷酸转移酶IIB组分的蛋白质(收编号NP461505.1；NC～003197)具有大约39％的同一性。

缺口BlastP序列比对显示SEQ ID NO：36(665个氨基酸)的第1-661位氨基酸与来自产气荚膜梭菌并且是PTS系统蛋白的蛋白质(收编号.NP561500.1；NC～003366)具有大约44％的同一性，第1-657位氨基酸与来自酿脓链球菌并同源于果糖特异酶I I的PTS体系BC组分的蛋白质(收编号NP269062.1；NC002737)具有大约46％的同一性，第1-657位氨基酸与来自酿脓链球菌并且同源于果糖特异酶II PTS体系BC组分的蛋白质(收编号NP607065.1；NC_003485)具有大约46％的同一性，第1-657位氨基酸与来自乳酸乳球菌乳亚种并且是果糖特异的PTS体系酶IIBC组分(EC 2.7.1.69)的蛋白质(收编号NP267115.1；NC_002662)具有大约45％的同一性，以及第1-660位氨基酸与来自Bacillus halodurans并且是PTS体系果糖特异酶IIB组分的蛋白质(收编号NP241694.1；NC_002570)具有大约43％的同一性。

缺口BlastP序列比对显示SEQ ID NO：38(334个氨基酸)第4-334位氨基酸与来自肺炎链球菌并且是蔗糖操纵子阻遏物(Scr操纵子调控蛋白)的蛋白质(收编号NP-359213.1；NC_003098)具有大约48％的同一性，第4-334位氨基酸与来自肺炎链球菌并且是LacI家族中糖结合转录调节子的蛋白质(收编号NP-346232.1；NC003028)具有大约46％的同一性，第13-332位氨基酸与来自戊糖片球菌并且是蔗糖操纵子阻遏物(Scr操纵子调控蛋白)的蛋白质(收编号splP434721SCRR_PEDPE)具有大约35％的同一性，第10-334位氨基酸与来自Bacillus halodurans并且是核糖操纵子转录阻遏物的蛋白质(收编号NP244594.1；NC_002570)具有大约35％的同一性，以及第10-332位氨基酸与来自肺炎链球菌并且是蔗糖操纵子阻遏物的蛋白质(收编号NP-346162.1；NC003028)具有大约35％的同一性。

缺口BlastP序列比对显示SEQ ID NO：40(415个氨基酸)第3-415位氨基酸与来自肺炎链球菌并且ABC转运蛋白底物结合蛋白的蛋白质(收编号NP～359212.1；NC003098)具有大约50％的同一性，第19-389位氨基酸与来自根癌土壤杆菌并且是糖结合蛋白的蛋白质(收编号NP-535638.1；NC～003306)具有大约27％的同一性，第11-396位氨基酸与来自念珠蓝细菌属PCC 7120并且是ABC转运蛋白糖结合蛋白的蛋白质(收编号NP-488317.1；NC003272)具有大约25％的同一性，第76-353位氨基酸与来自天蓝色链霉菌(Streptomycescoelicolor)并且同源于糖转运蛋白糖结合蛋白的蛋白质(收编号emblCAB95275.1；AL359779)具有大约26％的同一性，以及第1-324位氨基酸与来自无害利斯特氏菌并同源于糖ABC转运蛋白周质糖结合蛋白的蛋白质(收编号Nu-470104.1；NC～003212)具有大约26％的同一性。

缺口BlastP序列比对显示SEQ ID NO：42(294个氨基酸)第10-285位氨基酸与来自肺炎链球菌并且是ABC转运蛋白跨膜通透酶糖转运蛋白的蛋白质(收编号NP 359211.1；NC～003098)具有大约56％的同一性，第7-285位氨基酸与来自单核细胞增生利斯特氏菌并且同源于糖转运蛋白通透酶蛋白的蛋白质(收编号NP464293.1；NC003210)具有大约38％的同一性，第7-285位氨基酸与来自无害利斯特氏菌并且同源于糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP-470102.1；NC003212)具有大约38％的同一性，第12-286位氨基酸与来自集胞蓝细菌属PCC 6803并且是乳糖转运系统通透酶蛋白(LacF)的蛋白质(收编号NP-440703.1；NC_000911)具有大约36％的同一性，以及第11-281位氨基酸与来自苛养木杆菌并且是ABC转运蛋白糖通透酶的蛋白质(收编号NP299726.1；NC_002488)具有大约36％的同一性。

缺口BlastP序列比对显示SEQ ID NO：44(285个氨基酸)第12-285位氨基酸与来自肺炎链球菌并且是ABC转运蛋白跨膜通透酶糖转运蛋白的蛋白质(收编号NP_359210.1；NC_003098)具有大约59％的同一性，第30-281位氨基酸与来自根癌土壤杆菌的蛋白质(收编号NP 356672.1；NC003063)具有大约32％的同一性，第30-281位氨基酸与来自根癌土壤杆菌并且是ABC转运蛋白跨膜蛋白[糖]的蛋白质(收编号NP-534455.1；NC_003305)具有大约32％的同一性，第10-281位氨基酸与来自单核细胞增生利斯特氏菌并且同源于糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP463711.1；NC003210)具有大约33％的同一性，以及第13-281位氨基酸与来自无害利斯特氏菌并且同源于糖ABC转运蛋白糖通透酶蛋白的蛋白质(收编号NP469564.1；NC_003212)具有大约34％的同一性。

缺口BlastP序列比对显示SEQ ID NO：46(430个氨基酸)第2-429位氨基酸与来自肺炎链球菌并且是蔗糖-6-磷酸水解酶的蛋白质(收编号NP-359209.1；NC003098)具有大约36％的同一性，第2-429位氨基酸与来自肺炎链球菌并同源于蔗糖-6-磷酸水解酶的蛋白质(收编号NP-346228.1；NC_003028)具有大约36％的同一性，第18-373位氨基酸与来自海栖热袍菌并且是β果糖苷酶的蛋白质(收编号NP229215.1；NC_000853)具有大约36％的同一性，第21-405位氨基酸与来自运动发酵单胞菌并且是β呋喃果糖苷酶(EC 3.2.1.26)的蛋白质(收编号pirllJU0460)具有大约31％的同一性，以及第21-362位氨基酸与来自大肠杆菌并且是蔗糖-6-磷酸水解酶的蛋白质(收编号NP-311270.1；NC_002695)具有大约35％的同一性。

缺口BlastP序列比对显示SEQ ID NO：48(368个氨基酸)第1-366位氨基酸与来自变异链球菌并且是多种糖结合转运ATP结合蛋白(msmK)的蛋白质(收编号splQ007521MSMK_STRMU)具有大约65％的同一性，第1-366位氨基酸与来自酿脓链球菌并且是多种糖结合ABC转运系统(ATP结合蛋白)的蛋白质(收编号NP269942.1；NC_002737)具有大约65％的同一性，第1-367位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白多种糖转运蛋白的蛋白质(收编号NP-359030.1；NC_003098)具有大约66％的同一性，第1-366位氨基酸与来自酿脓链球菌并且是结合多种糖的ABC转运系统(ATP结合蛋白)的蛋白质(收编号NP608016.1；NC003485)具有大约65％的同一性，以及第1-367位氨基酸与来自肺炎链球菌并且是糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-346026.1；NC003028)具有大约66％的同一性。

缺口BlastP序列比对显示SEQ ID NO：50(490个氨基酸)第11-489位氨基酸与来自变异链球菌并且是gtfA蛋白的蛋白质(收编号pirllBWSOGM)具有大约63％的同一性，第11-490位氨基酸与来自变异链球菌并且是蔗糖磷酸化酶(EC 2.4.1.7)的蛋白质(收编号pirllA27626)具有大约63％的同一性，第11-489位氨基酸与来自变异链球菌并且是蔗糖磷酸化酶(蔗糖转葡糖基酶)的蛋白质(收编号splP102491SUCP_STRMU)具有大约63％的同一性，第11-484位氨基酸与来自肺炎链球菌并且是葡聚糖蔗糖酶(蔗糖-6-葡糖基转移酶)的蛋白质(收编号NP-359301.1；NC003098)具有大约63％的同一性，以及第11-484位氨基酸与来自肺炎链球菌并且是蔗糖磷酸化酶的蛋白质(收编号NP-346325.1；NC_003028)具有大约63％的同一性。

缺口BlastP序列比对显示SEQ ID NO：52(328个氨基酸)第47-316位氨基酸与来自枯草芽孢杆菌并且是核糖ABC转运蛋白(核糖结合蛋白)的蛋白质(收编号NP-391477.1；NC_000964)具有大约55％的同一性，第5-323位氨基酸与来自乳酸乳球菌乳亚种并且是核糖ABC转运蛋白底物结合蛋白的蛋白质(收编号NP_267791.1；NC_002662)具有大约45％的同一性，第4-278位氨基酸与来自嗜盐四联球菌并且是核糖结合蛋白的蛋白质(收编号dbj BAA31869-1；AB009593)具有大约42％的同一性，第15-316位氨基酸与来自Bacillushalodurans并且是核糖ABC转运蛋白(核糖结合蛋白)的蛋白质(收编号NP244599.1；NC_002570)具有大约39％的同一性，以及第4-315位氨基酸与来自多杀巴斯德氏菌(Pasteurella multocida)并且是RbsB蛋白的蛋白质(收编号NP245090.1；NC_002663)具有大约42％的同一性。

缺口BlastP序列比对显示SEQ ID NO：54(285个氨基酸)第1-277位氨基酸与来自枯草芽孢杆菌并且是核糖ABC转运蛋白(通透酶)的蛋白质(收编号NP_391476.1；NC_000964)具有大约60％的同一性，第1-277位氨基酸与来自枯草芽孢杆菌并且是核糖转运体系通透酶蛋白(rbcS)的蛋白质(收编号splP369481RBSC_BACSU)具有大约59％的同一性，第4-277位氨基酸与来自Bacillus halodurans并且是核糖ABC转运蛋白(通透酶)的蛋白质(收编号NP244598.1；NC002570)具有大约57％的同一性，第4-277位氨基酸与来自乳酸乳球菌乳亚种并且是核糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP267792.1；NC002662)具有大约58％的同一性，以及第4-278位氨基酸与来自流感嗜血菌并且是D-核糖ABC转运蛋白通透酶蛋白(rbsC)的蛋白质(收编号NP～438661.1；NC～000907)具有大约54％的同一性。

缺口BlastP序列比对显示SEQ ID NO：56(496个氨基酸)第5-496位氨基酸与来自乳酸乳球菌乳亚种并且是核糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP267793.1；NC～002662)具有大约59％的同一性，第5-496位氨基酸与来自枯草芽孢杆菌并且是ATP结合蛋白的蛋白质(收编号pirllI40465)具有大约51％的同一性，第5-495位氨基酸与来自Bacillus halodurans并且是核糖ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP～244597.1；NC002570)具有大约49％的同一性，以及第7-494位氨基酸与来自根癌土壤杆菌并且是ABC转运蛋白、结合核酸的/ATPase蛋白[核糖]的蛋白质(收编号NP～533484.1；NC003304)具有大约45％的同一性。

缺口BlastP序列比对显示SEQ ID NO：58(134个氨基酸)第4-134位氨基酸与来自清酒乳杆菌i并且是核糖通透酶(RbsD)的蛋白质(收编号gblAAD34337.1；AF115391)具有大约58％的同一性，第4-134位氨基酸与来自产气荚膜梭菌(Clostridium perfringens)并且同源于核糖ABC转运蛋白的蛋白质(收编号Nos.NP562547.1；NC～003366)具有大约51％的同一性，第4-132位氨基酸与来自乳酸乳球菌乳亚种并且是核糖ABC转运蛋白通透酶的蛋白质(收编号NP267794.1；NC～002662)具有大约50％的同一性，第4-134位氨基酸与来自Bacillus halodurans并且是核糖ABC转运蛋白(通透酶)的蛋白质(收编号NP244596.1；NC～002570)具有大约45％的同一性，以及第4-134位氨基酸与来自金黄色葡糖球菌金黄亚种并且是核糖通透酶的蛋白质(收编号NP-370793.1；NC002758)具有大约51％的同一性。

缺口BlastP序列比对显示SEQ ID NO：60(308个氨基酸)第4-301位氨基酸与来自清酒乳杆菌i并且是核糖激酶(RbsK)的蛋白质(收编号gblAAD34338.1；AF115391)具有大约51％的同一性，第1-303位氨基酸与来自金黄色葡糖球菌金黄亚种并且同源于核糖激酶的蛋白质(收编号NP-370792.1；NC～002758)具有大约48％的同一性，第3-305位氨基酸与来自Clostridium perfringens并且是核糖激酶的蛋白质(收编号NP～562548.1；NC003366)具有大约45％的同一性，第1-299位氨基酸与来自流感嗜血菌并且是核糖激酶(RbsK)的蛋白质(收编号NP～438663.1；NC～000907)具有大约41％的同一性，以及第2-300位氨基酸与来自鼠疫耶尔森氏菌并且是核糖激酶的蛋白质(收编号NP403674.1；NC～003143)具有大约38％的同一性。

缺口BlastP序列比对显示SEQ ID NO：62(285个氨基酸)第1-285位氨基酸与来自乳酸乳球菌乳亚种并且是麦芽糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP267841.1；NC002662)具有大约63％的同一性，第6-284位氨基酸与来自酿脓链球菌并且同源于麦芽糖/麦芽糊精ABC转运体系蛋白(通透酶)的蛋白质(收编号NP269423.1；NC～002737)具有大约54％的同一性，第12-284位氨基酸与来自产酸克雷伯氏菌并且同源于malG蛋白的蛋白质(收编号pirllS63616)具有大约38％的同一性，第9-285位氨基酸与来自Bacillus halodurans并且是麦芽糖/麦芽糊精转运系统(通透酶)的蛋白质(收编号NP243790.1；NC～002570)具有大约39％的同一性，以及第7-285位氨基酸与来自枯草芽孢杆菌并且同源于麦芽糊精转运系统通透酶的蛋白质(收编号NP～391294.1；NC～000964)具有大约36％的同一性。

缺口BlastP序列比对显示SEQ ID NO：64(452个氨基酸)第1-452位氨基酸与来自乳酸乳球菌乳亚种并且是麦芽糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP267840.1；NC002662)具有大约63％的同一性，第3-452位氨基酸与来自酿脓链球菌并且同源于麦芽糖/麦芽糊精ABC转运体系蛋白(通透酶)的蛋白质(收编号NP269422.1；NC～002737)具有大约52％的同一性，第3-452位氨基酸与来自酿脓链球菌并且同源于麦芽糖/麦芽糊精ABC转运系统(通透酶)的蛋白质(收编号NP607422.1；NC003485)具有大约52％的同一性，第28-451位氨基酸与来自产酸克雷伯氏菌并且同源于malF蛋白的蛋白质(收编号pirllS63615)具有大约34％的同一性，以及第23-451位氨基酸与来自Bacillus halodurans并且是麦芽糊精转运系统通透酶的蛋白质(收编号NP243791.1；NC002570)具有大约33％的同一性。

缺口BlastP序列比对显示SEQ ID NO：66(408个氨基酸)第1-407位氨基酸与来自乳酸乳球菌乳亚种并且是麦芽糖ABC转运蛋白底物结合蛋白的蛋白质(收编号NP267839.1；NC002662)具有大约49％的同一性，第1-405位氨基酸与来自酿脓链球菌并且同源于麦芽糖/麦芽糊精结合蛋白的蛋白质(收编号NP607421.1；NC003485)具有大约37％的同一性，第1-405位氨基酸与来自酿脓链球菌并且同源于麦芽糖/麦芽糊精结合蛋白的蛋白质(收编号NP_269421.1；NC_002737)具有大约36％的同一性，第1-393位氨基酸与来自无害利斯特氏菌并且同源于麦芽糖/麦芽糊精ABC转运蛋白(结合蛋白)的蛋白质(收编号NP_471563.1；NC_003212)具有大约27％的同一性，以及第1-403位氨基酸与来自枯草芽孢杆菌并且同源于麦芽糖/麦芽糊精结合蛋白的蛋白质(收编号NP_391296.1；NC_000964)具有大约26％的同一性。

缺口BlastP序列比对显示SEQ ID NO：68(368个氨基酸)第1-366位氨基酸与来自变异链球菌并且是多种糖结合转运蛋白ATP结合蛋白(msmK)的蛋白质(收编号splQO07521MSMK_STRMU)具有大约64％的同一性，第1-366位氨基酸与来自酿脓链球菌并且是多种糖结合ABC转运系统(ATP结合)蛋白的蛋白质(收编号NP269942.1；NC_002737)具有大约64％的同一性，第1-366位氨基酸与来自酿脓链球菌并且是多种糖结合ABC转运系统(ATP结合)蛋白的蛋白质(收编号NP608016.1；NC_003485)具有大约64％的同一性，第1-366位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白多种糖转运蛋白的蛋白质(收编号NP-359030.1；NC_003098)具有大约64％的同一性，以及第1-368位氨基酸与来自乳酸乳球菌乳亚种并且是多种糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP266577.1；NC_002662)具有大约62％的同一性。

缺口BlastP序列比对显示SEQ ID NO：70(512个氨基酸)第1-510位氨基酸与来自酿脓链球菌并且同源于糖ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP269365.1；NC002737)具有大约60％的同一性，第1-510位氨基酸与来自酿脓链球菌并且同源于糖ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP607296.1；NC_003485)具有大约60％的同一性，第5-503位氨基酸与来自乳酸乳球菌乳亚种并且是糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP_267484.1；NC002662)具有大约59％的同一性，第7-503位氨基酸与来自肺炎链球菌并且是糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP_345337.1；NC003028)具有大约61％的同一性，以及第7-503位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白-核糖/半乳糖转运蛋白的蛋白质(收编号NP_358342.1；NC_003098)具有大约60％的同一性。

缺口BlastP序列比对显示SEQ ID NO：72(383个氨基酸)第7-351位氨基酸与来自乳酸乳球菌乳亚种并且是糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP267485.1；NC～002662)具有大约49％的同一性，第4-351位氨基酸与来自肺炎链球菌并且ABC转运蛋白跨膜通透酶(核糖/半乳糖转运蛋白)的蛋白质(收编号NP～358343.1；NC003098)具有大约47％的同一性，第4-351位氨基酸与来自肺炎链球菌并且同源于糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP-345338.1；NC～003028)具有大约47％的同一性，第4-342位氨基酸与来自酿脓链球菌并且同源于糖ABC转运蛋白(通透酶蛋白)的蛋白质(收编号NP269364.1；NC002737)具有大约49％的同一性，以及第4-342位氨基酸与来自酿脓链球菌并且同源于糖ABC转运蛋白(通透酶蛋白)的蛋白质(收编号NP607295.1；NC～003485)具有大约49％的同一性。

缺口BlastP序列比对显示SEQ ID NO：74(318个氨基酸)第1-318位氨基酸与来自酿脓链球菌并且同源于糖ABC转运蛋白(通透酶蛋白)的蛋白质(收编号NP607294.1；NC～003485)具有大约67％的同一性，第1-318位氨基酸与来自酿脓链球菌并且同源于糖ABC转运蛋白(通透酶蛋白)的蛋白质(收编号NP269363.1；NC～002737)具有大约66％的同一性，第1-318位氨基酸与来自肺炎链球菌并且同源于糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP-345339.1；NC～003028)具有大约65％的同一性，第1-318位氨基酸与来自乳酸乳球菌乳亚种并且是糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP267486.1；NC002662)具有大约63％的同一性，以及第6-318位氨基酸与来自无害利斯特氏菌并且是糖ABC转运蛋白(通透酶蛋白)的蛋白质(收编号NP-470764.1；NC～003212)具有大约61％的同一性。

缺口BlastP序列比对显示SEQ ID NO：76(450个氨基酸)第11-448位氨基酸与来自脑膜炎奈瑟氏球菌(Neisseria meningitidis)并且同源于糖转运蛋白的蛋白质(收编号NP～273437.1；NC～003112)具有大约68％的同一性，第11-448位氨基酸与来自Neisseriameningitidis并且同源于内在膜转运蛋白的蛋白质(收编号NP284797.1；NC～003116)具有大约68％的同一性，第17-229位氨基酸与来自新月柄杆菌(Caulobacter crescentus)并且同源于转运蛋白的蛋白质(收编号NP_421086.1；NC_002696)有大约39％的同一性。第31-450位氨基酸与来自Lycopersicon esculentum并且是蔗糖转运蛋白的蛋白质(收编号gb|AAG09270.1；AF176950)具有大约21％的同一性，以及第31-442位氨基酸与来自拟南芥(Arabidopsis thaliana)并且是蔗糖转运蛋白的蛋白质(收编号gblAAG09191.1；AF175321)具有大约21％的同一性。

缺口BlastP序列比对显示SEQ ID NO：78(495个氨基酸)第8-482位氨基酸与来自乳酸乳球菌乳亚种并且是转运蛋白的蛋白质(收编号NP266394.1；NC002662)具有大约32％的同一性，第8-482位氨基酸与来自单核细胞增生利斯特氏菌并且同源于流出物转运蛋白的蛋白质(收编号NP464506.1；NC～003210)具有大约34％的同一性，第8-482位氨基酸与来自无害利斯特氏菌并且是流出物转运蛋白的蛋白质(收编号NP 470317.1；NC～003212)具有大约34％的同一性，第7-422位氨基酸与来自丙酮丁醇梭菌并是MDR相关通透酶的蛋白质(收编号NP_149294.1；NC_001988)具有大约30％的同一性，并且第8-425位氨基酸与来自天蓝色链霉菌并且同源于膜转运蛋白的蛋白质(收编号emb|CAB89031.1；AL353870)具有大约29％的同一性。

缺口BlastP序列比对显示SEQ ID NO：80(471个氨基酸)第1-440位氨基酸与来自乳酸乳球菌乳亚种并且是转运蛋白的蛋白质(收编号NP266394.1；NC002662)具有大约32％的同一性，第1-464位氨基酸与来自单核细胞增生利斯特氏菌并且同源于流出物转运蛋白的蛋白质(收编号NP464506.1；NC～003210)具有大约34％的同一性，第1-464位氨基酸与来自无害利斯特氏菌并且同源于流出物转运蛋白的蛋白质(收编号NP-470317.1；NC003212)具有大约34％的同一性，第1-412位氨基酸与来自丙酮丁醇梭菌并且是MDR相关通透酶的蛋白质(收编号NP_149294.1；NC001988)具有大约29％的同一性，以及第4-459位氨基酸与来自天蓝色链霉菌并且同源于输出蛋白的蛋白质(收编号pirllT36377)具有大约28％的同一性。

缺口BlastP序列比对显示SEQ ID NO：82(412个氨基酸)第18-400位氨基酸与来自无害利斯特氏菌并且同源于药物流出转运蛋白的蛋白质(收编号NP-472212.1；NC003212)具有大约49％的同一性，第18-400位氨基酸与来自单核细胞增生利斯特氏菌并且同源于药物流出转运蛋白的蛋白质(收编号NP466263.1；NC_003210)具有大约49％的同一性，第18-397位氨基酸与来自大肠杆菌并且同源于转运蛋白的蛋白质(收编号NP_415571.1；NC_000913)具有大约48％的同一性，第15-399位氨基酸与来自乳酸乳球菌乳亚种并且是多药抗性流出物泵的蛋白质(收编号Nu 266282.1；NC_002662)具有大约47％的同一性，以及第18-399位氨基酸与来自鼠伤寒沙门氏菌(Salmonella typhimurium)并且同源于MFS家族转运蛋白的蛋白质(收编号NP460125.1；NC_003197)具有大约48％的同一性。

缺口BlastP序列比对显示SEQ ID NO：84(462个氨基酸)第9-413位氨基酸与来自酒酒球菌的ORFC(收编号emblCAB61253.1；AJ250422)具有大约38％的同一性，第2-378位氨基酸与来自乳酸乳球菌乳亚种并且是转运蛋白的蛋白质(收编号NP267695.1；NC_002662)具有大约38％的同一性，第6-411位氨基酸与来自酿脓链球菌并且是药物抗性蛋白的蛋白质(收编号NP606824.1；NC_003485)具有大约34％的同一性，第6-411位氨基酸与来自酿脓链球菌并且是同源于药物抗性蛋白的蛋白质(收编号NP268834.1；NC002737)具有大约33％的同一性，以及第2-454位氨基酸与来自乳酸乳球菌乳亚种并且是药物输出蛋白的蛋白质(收编号NP267504.1；NC002662)具有大约34％的同一性。

缺口BlastP序列比对显示SEQ ID NO：86(490个氨基酸)第3-476位氨基酸与来自单核细胞增生利斯特氏菌并且同源于药物输出蛋白的蛋白质(收编号NP 466111.1；NC_003210)具有大约55％的同一性，第3-476位氨基酸与来自无害利斯特氏菌并且同源于药物输出蛋白的蛋白质(收编号NP-472062.1；NC_003212)具有大约54％的同一性，第6-478位氨基酸与来自乳酸乳球菌乳亚种并且是多药抗性蛋白的蛋白质(收编号NP267065.1；NC_002662)具有大约45％的同一性，第8-484位氨基酸与来自枯草芽孢杆菌并且是同源于多药抗性蛋白的蛋白质(收编号NP_388266.1；NC000964)具有大约49％的同一性，以及第18-425位氨基酸与来自枯草芽孢杆菌并且同源于多药抗性蛋白的蛋白质(收编号NP_388782.1；NC_000964)具有大约44％的同一性。

缺口BlastP序列比对显SEQ ID NO：88(416个氨基酸)第17-408位氨基酸与来自Desulftobacterium hafniense的蛋白质(收编号gblAAL87781.1；AF403184)具有大约26％的同一性，第26-408位氨基酸与来自肺炎链球菌并且是主要促进蛋白超家族中的转运蛋白的蛋白质(收编号Nu-359046.1；NC～003098)具有大约25％的同一性，第61-399位氨基酸与来自空肠弯曲杆菌并且同源于流出物蛋白的蛋白质(收编号NP282813.1；NC002163)具有大约21％的同一性，第25-368位氨基酸与来自根癌土壤杆菌并且是同源于MFS通透酶的蛋白质(收编号NP-533033.1；NC～003304)具有大约19％的同一性，以及第19-205位氨基酸与来自Bacillus halodurans并且是多药抗性蛋白的蛋白质(收编号NP244175.1；NC002570)具有大约25％的同一性。

缺口BlastP序列比对显示SEQ ID NO：90(548个氨基酸)第17-546位氨基酸与来自无害利斯特氏菌并且同源于转运蛋白的蛋白质(收编号NP～471001.1；NC～003212)具有大约38％的同一性，第17-546位氨基酸与来自单核细胞增生利斯特氏菌并且同源于转运蛋白的蛋白质(收编号NP465149.1；NC～003210)具有大约37％的同一性，第1-534位氨基酸与来自肺炎链球菌并且是多糖转运蛋白的蛋白质(收编号NP-358976.1；NC～003098)具有大约36％的同一性，第17-534位氨基酸与来自肺炎链球菌并且是同源于多糖生物合成蛋白的蛋白质(收编号NP-345978.1；NC～003028)具有大约36％的同一性，以及第12-546位氨基酸与来自乳酸乳球菌乳亚种的假定蛋白质(收编号NP267962.1；NC002662)具有大约35％的同一性。

缺口BlastP序列比对显示SEQ ID NO：92(485个氨基酸)第1-484位氨基酸与来自单核细胞增生利斯特氏菌并且同源于流出物转运蛋白的蛋白质(收编号NP464506.1；NC～003210)具有大约44％的同一性，第1-484位氨基酸与来自无害利斯特氏菌并且同源于流出物转运蛋白的蛋白质(收编号NP-470317.1；NC～003212)具有大约44％的同一性，第9-420位氨基酸与来自丙酮丁醇梭菌并且是MDR相关通透酶的蛋白质(收编号NP_149294.1；NC_001988)具有大约34％的同一性，第12-475位氨基酸与来自乳酸乳球菌乳亚种并且是转运蛋白的蛋白质(收编号NP_266394.1；NC_002662)具有大约33％的同一性，以及第1-457位氨基酸与来自黄色粘球菌的假定蛋白质(收编号emblCAB37973.1；X76640)具有大约34％的同一性。

缺口BlastP序列比对显示SEQ ID NO：94(199个氨基酸)第23-173位氨基酸与来自无害利斯特氏菌并且同源于药物流出运输器蛋白的蛋白质(收编号NP-472212.1；NC_003212)具有大约46％的同一性，第23-173位氨基酸与来自单核细胞增生利斯特氏菌并且同源于药物流出运输器蛋白的蛋白质(收编号NP 466263.1；NC003210)具有大约45％的同一性，第23-173位氨基酸与来自乳酸乳球菌乳亚种并且是多药抗性流出泵的蛋白质(收编号NP266282.1；NC002662)具有大约49％的同一性，第23-173位氨基酸与来自Salmonella entericasubsp.enterica serovar Typhi并且是同源于流出物泵的蛋白质(收编号NP-454977.1；NC_003198)具有大约46％的同一性，以及第23-173位氨基酸与来自鼠伤寒沙门氏菌并且同源于通透酶的蛋白质(收编号NP_459377.1；NC 003197)具有大约46％的同一性。

缺口BlastP序列比对显示SEQ ID NO：96(538个氨基酸)第4-525位氨基酸与来自肺炎链球菌并且是多糖转运蛋白的蛋白质(收编号NP-358976.1；NC_003098)具有大约32％的同一性，第5-525位氨基酸与来自肺炎链球菌并且同源于多糖生物合成蛋白的蛋白质(收编号NP-345978.1；NC_003028)具有大约32％的同一性，第5-526位氨基酸与来自酿脓链球菌的保守假定蛋白质(收编号NP-606680.1；NC_003485)具有大约33％的同一性，第5-526位氨基酸与来自酿脓链球菌的保守假定蛋白质(收编号NP268708.1；NC002737)具有大约33％的同一性，以及第4-526位氨基酸与来自乳酸乳球菌乳亚种的假定蛋白质(收编号NP267962.1；NC_002662)具有大约30％的同一性。

缺口BlastP序列比对显示SEQ ID NO：98(328个氨基酸)第1-323位氨基酸与来自戊糖片球菌并且是蔗糖操纵子调控蛋白(scrR)的蛋白质(收编号splP434721SCRR～PEDPE)具有大约57％的同一性，第1-322位氨基酸与来自肺炎链球菌并且是蔗糖操纵子阻遏物的蛋白质(收编号NP-346162.1；NC003028)具有大约51％的同一性，第1-326位氨基酸与来自变异链球菌并且是蔗糖操纵子调控蛋白(scrR)的蛋白质(收编号splQ544301SCRR～STRMU)具有大约49％的同一性，第1-322位氨基酸与来自酿脓链球菌并且同源于蔗糖操纵子阻遏物的蛋白质(收编号NP607889.1；NC～003485)具有大约49％的同一性，以及第1-322位氨基酸与来自酿脓链球菌并且同源于蔗糖操纵子阻遏物的蛋白质(收编号NP 269821.1；NC～002737)具有大约49％的同一性。

缺口BlastP序列比对显示SEQ ID NO：100(485个氨基酸)第1-466位氨基酸与来自表兄链球菌(Streptococcus sobrinus)并且是蔗糖-6-磷酸水解酶(ScrB)的蛋白质(收编号pirllS68598)具有大约50％的同一性，第1-461位氨基酸与来自肺炎链球菌并且是蔗糖-6-磷酸水解酶的蛋白质(收编号NP～359160.1；NC003098)具有大约49％的同一性，第1-461位氨基酸与来自肺炎链球菌并且是蔗糖-6-磷酸水解酶的蛋白质(收编号NP～346161.1；NC003028)具有大约49％的同一性，第1-466位氨基酸与来自酿脓链球菌并且同源于蔗糖-6-磷酸水解酶的蛋白质(收编号NP607888.1；NC003485)具有大约49％的同一性，以及第1-466位氨基酸与来自酿脓链球菌并且同源于蔗糖-6-磷酸水解酶的蛋白质(收编号NP269820.1；NC～002737)具有大约49％的同一性。

缺口BlastP序列比对显示SEQ ID NO：102(649个氨基酸)第1-645位氨基酸与来自变异链球菌并且是磷酸转移酶体系I I型酶(EC2.7.1.69)的蔗糖特异IIABC组分的蛋白质(收编号splP126551PTSA～STRMU)具有大约65％的同一性，第1-647位氨基酸与来自戊糖片球菌并且是磷酸转移酶体系II型酶(EC 2.7.1.69)的蔗糖特异酶IIABC的蛋白质(收编号splP434701PTSA～PEDPE)具有大约56％的同一性，第1-643位氨基酸与来自乳酸乳球菌并且是I I型酶蔗糖蛋白的蛋白质(收编号emblCAB09690.1；Z97015)具有大约52％的同一性，第114-647位氨基酸与来自清酒乳杆菌并且是PTS的蔗糖特异性II型酶的蛋白质(收编号gblAAK92528.1；AF401046)具有大约52％的同一性，以及第1-621位氨基酸与来自谷氨酸棒杆菌(Corynebacterium glutamicum)并且是磷酸转移酶体系IIB组分的蛋白质(收编号NP601842.1；NC003450)具有大约45％的同一性。

缺口BlastP序列比对显示SEQ ID NO：104(667个氨基酸)第192-661位氨基酸与来自乳酸乳球菌乳亚种并且是β-葡糖苷特异性PTS体系IIABC组分(EC 2.7.1.69)的蛋白质(收编号NP266583.1；NC～002662)具有大约42％的同一性，第191-652位氨基酸与来自单核细胞增生利斯特氏菌并且同源于磷酸转移酶体系(PTS)β葡糖苷特异性酶IIABC的蛋白质(收编号NP464560.1；NC003210)具有大约39％的同一性，第191-662位氨基酸与来自Clostridium longisporum并且是PTS依赖型酶II的蛋白质(收编号gblAAC05713.1；L49336)具有大约37％的同一性，第191-666位氨基酸与来自Bacillushalodurans并且是PTS体系β葡糖苷特异性I I型酶ABC组分的蛋白质(收编号NP241461.1；NC～002570)具有大约36％的同一性，以及第191-650位氨基酸与来自无害利斯特氏菌并且同源于PTS体系β葡糖苷特异性酶IIABC的蛋白质(收编号NP469373.1；NC003212)具有大约36％的同一性。

缺口BlastP序列比对显示SEQ ID NO：106(241个氨基酸)第1-238位氨基酸与来自枯草芽孢杆菌并且是海藻糖操纵子转录阻遏物的蛋白质(收编号splP397961TRER～BACSU)具有大约47％的同一性，第4-238位氨基酸与来自Bacillus halodurans并且是海藻糖操纵子的转录阻遏物的蛋白质(收编号NP241739.1；NC002570)具有大约41％的同一性，第9-237位氨基酸与来自无害利斯特氏菌并且同源于转录调控子GntR家族的蛋白质(收编号NP～470558.1；NC003212)具有大约44％的同一性，第9-237位氨基酸与来自单核细胞增生利斯特氏菌并且同源于转录调控子GntR家族的蛋白质(收编号NP464778.1；NC003210)具有大约44％的同一性，以及第5-238位氨基酸与来自乳酸乳球菌乳亚种并且是GntR家族转录调控子的蛋白质(收编号NP266581.1；NC002662)具有大约41％的同一性。

缺口BlastP序列比对显示SEQ ID NO：108(570个氨基酸)第22-566位氨基酸与来自酿脓链球菌并且同源于葡聚糖葡糖苷酶的蛋白质(收编号NP608103.1；NC003485)具有大约56％的同一性，第23-568位氨基酸与来自肺炎链球菌并且是葡聚糖葡糖苷酶的蛋白质(收编号NP～359290.1；NC003098)具有大约57％的同一性，第22-566位氨基酸与来自酿脓链球菌并且同源于葡聚糖葡糖苷酶的蛋白质(收编号NP270026.1；NC～002737)具有大约56％的同一性，第23-568位氨基酸与来自肺炎链球菌并且同源于葡聚糖葡糖苷酶DexS的蛋白质(收编号NP-346315.1；NC003028)具有大约57％的同一性，以及第17-570位氨基酸与来自产气荚膜梭菌并且是α葡糖苷酶的蛋白质(收编号NP561478.1；NC003366)具有大约54％的同一性。

缺口BlastP序列比对显示SEQ ID NO：110(370个氨基酸)第1-368位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白多种糖转运蛋白的蛋白质(收编号NP-359030.1；NC～003098)具有大约67％的同一性，第1-368位氨基酸与来自肺炎链球菌并且是糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-346026.1；NC～003028)具有大约67％的同一性，第1-368位氨基酸与来自变异链球菌并且是多种糖结合转运蛋白ATP结合蛋白(msmK)的蛋白质(收编号splQ007521MSMK～STRMU)具有大约66％的同一性，第1-365位氨基酸与来自无害利斯特氏菌并且同源于糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP469649.1；NC～003212)具有大约68％的同一性，以及第1-365位氨基酸与来自单核细胞增生利斯特氏菌并且同源于糖ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP 463809.1；NC～003210)具有大约67％的同一性。

缺口BlastP序列比对显示SEQ ID NO：112(278个氨基酸)第2-278位氨基酸与来自变异链球菌并且是多种糖结合转运体系通透酶蛋白(msmG)的蛋白质(收编号splQ007511MSMG～STRMU)具有大约81％的同一性，第1-278位氨基酸与来自肺炎链球菌并且是糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP～346326.1，NC～003028)具有大约73％的同一性，第2-278位氨基酸与来自肺炎链球菌并且是ABC转运蛋白跨膜通透酶多种糖的蛋白质(收编号NP-359302.1；NC003098)具有大约72％的同一性，第72-278位氨基酸与来自变异链球菌的假定蛋白质片段(收编号pirllB27626)具有大约85％的同一性，以及第4-278位氨基酸与来自丙酮丁醇梭菌并且是糖通透酶的蛋白质(收编号NP～350251.1；NC～003030)具有大约44％的同一性。

缺口BlastP序列比对显示SEQ ID NO：114(291个氨基酸)第4-290位氨基酸与来自肺炎链球菌并且是ABC转运蛋白跨膜通透酶-多种糖的蛋白质(收编号Nu-359303.1；NC003098)具有大约73％的同一性，第4-290位氨基酸与来自肺炎链球菌并且是糖ABC转运蛋白通透酶蛋白的蛋白质(收编号NP-346327.1；NC～003028)具有大约73％的同一性，第1-290位氨基酸与来自变异链球菌并且是多种糖结合转运体系通透酶蛋白(msmF)的蛋白质(收编号splQ007501MSMF～STRMU)具有大约73％的同一性，第6-291位氨基酸与来自丙酮丁醇梭菌并且是ABC型糖转运体系通透酶组分的蛋白质(收编号NP-350252.1；NC～003030)具有大约53％的同一性，以及第2-291位氨基酸与来自热产硫磺热厌氧杆菌(Thermoanaerobacterium thermosulfurigenes)并且是潜在的淀粉降解产物转运体系通透酶蛋白的蛋白质(收编号splP377301AMYD～THETU)具有大约32％的同一性。

缺口BlastP序列比对显示SEQ ID NO：116(423个氨基酸)第8-421位氨基酸与来自变异链球菌并且是多种糖结合蛋白前体的蛋白质(收编号splQ007491MSME～STRMU)具有大约60％的同一性，第9-421位氨基酸与来自肺炎链球菌并且是糖ABC转运蛋白糖结合蛋白的蛋白质(收编号NP-346328.1；NC～003028)具有大约56％的同一性，第9-421位氨基酸与来自肺炎链球菌并且是ABC转运蛋白底物结合蛋白-多种糖的蛋白质(收编号NP～359304.1；NC003098)具有大约56％的同一性，第9-420位氨基酸与来自丙酮丁醇梭菌并且是ABC型糖转运体系周质糖结合组分的蛋白质(收编号NP～350253.1；NC～003030)具有大约29％的同一性，以及第6-412位氨基酸与来自枯草芽孢杆菌并且同源于多种糖结合蛋白的蛋白质(收编号NP-391140.1；NC～000964)具有大约24％的同一性。

缺口BlastP序列比对显示SEQ ID NO：118(279个氨基酸)第1-273位氨基酸与来自戊糖片球菌并且是蜜三糖操纵子转录调控蛋白(rafR)的蛋白质(收编号splP434651RAFR～PEDPE)具有大约57％的同一性，第5-273位氨基酸与来自变异链球菌并且同源于转录调控子(msmR)的蛋白质(收编号pirllA42400)具有大约35％的同一性，第5-273位氨基酸与来自变异链球菌并且是msm操纵子调控蛋白的蛋白质(收编号splQ007531MSMR～STRMU)具有大约35％的同一性，第19-273位氨基酸与来自肺炎链球菌并且是msm操纵子调控蛋白的蛋白质(收编号NP～346330.1；NC003028)具有大约36％的同一性，以及第19-273位氨基酸与来自肺炎链球菌并且是msm(multiple sugarmetabolism，多种糖代谢)操纵子调控蛋白的蛋白质(收编号NP-359306.1；NC～003098)具有大约36％的同一性。

缺口BlastP序列比对显示SEQ ID NO：120(277个氨基酸)第37-141位氨基酸与来自苍白密螺旋体(Treponema pallidum)并且同源于rRNA甲基化酶的蛋白质(收编号NP218549.1；NC～000919)具有大约28％的同一性，第74-141位氨基酸与来自Guillardia theta并且是GTP结合核蛋白RAN的蛋白质(收编号NP～113408.1；NC～002753)具有大约32％的同一性，第75-141位氨基酸与来自Dictyostelium discoideum并且是GTP结合核蛋白RAN/TC4的蛋白质(收编号splP335191RAN～DICDI)具有大约29％的同一性，以及第140-190位氨基酸与来自拟南芥(Arabidopsis thaliana)的推定蛋白质(收编号NP～191798.1；NM～116104)具有大约25％的同一性。

缺口BlastP序列比对显示SEQ ID NO：122(530个氨基酸)第8-524位氨基酸与来自乳酸乳球菌乳亚种并且是结合ATP的ABC转运蛋白和通透酶蛋白的蛋白质(收编号NP 267678.1；NC002662)具有大约26％的同一性，第49-518位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-344680.1；NC～003028)具有大约25％的同一性，第49-518位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合/跨膜通透酶的蛋白质(收编号NP357731.1；NC003098)具有大约25％的同一性，第47-511位氨基酸与来自集胞蓝细菌属PCC 6803并且是ABC转运蛋白的蛋白质(收编号Nu-440626.1；NC000911)具有大约24％的同一性，以及第7-511位氨基酸与来自枯草芽孢杆菌并且同源于ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP～388852.1；NC000964)具有大约24％的同一性。

缺口BlastP序列比对显示SEQ ID NO：124(530个氨基酸)第4-524位氨基酸与来自乳酸乳球菌乳亚种并且是结合ATP的ABC转运蛋白和通透酶蛋白的蛋白质(收编号NP267678.1；NC～002662)具有大约24％的同一性，第55-508位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-344680.1；NC～003028)具有大约25％的同一性，第55-508位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合/跨膜通透酶的蛋白质(收编号NP～357731.1；NC003098)具有大约25％的同一性，第1-511位氨基酸与来自肺炎链球菌并且是结合ATP的药物流出ABC型转运蛋白/通透酶的蛋白质(收编号NP-345800.1；NC～003028)具有大约24％的同一性，以及第1-511位氨基酸与来自肺炎链球菌并且是结合ATP的ABC转运蛋白/跨膜蛋白的蛋白质(收编号NP～358796.1；NC003098)具有大约24％的同一性。

缺口BlastP序列比对显示SEQ ID NO：126(527个氨基酸)第8-527位氨基酸与来自乳酸乳球菌乳亚种并且是结合ATP的ABC转运蛋白和通透酶蛋白的蛋白质(收编号NP267678.1；NC～002662)具有大约25％的同一性，第13-520位氨基酸与来自肺炎链球菌并且是结合ATP的ABC转运蛋白/跨膜通透酶蛋白的蛋白质(收编号NP～357731.1；NC～003098)具有大约24％的同一性，第13-520位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-344680.1；NC～003028)具有大约24％的同一性，第22-511位氨基酸与来自肺炎链球菌并且是结合ATP的药物流出ABC型转运蛋白/通透酶蛋白的蛋白质(收编号NP-345800.1；NC～003028)具有大约22％的同一性，以及第22-511位氨基酸与来自肺炎链球菌并且是结合ATP的ABC转运蛋白/跨膜蛋白的蛋白质(收编号NP～358796.1；NC003098)具有大约22％的同一性。

缺口BlastP序列比对显示SEQ ID NO：128(534个氨基酸)第14-512位氨基酸与来自肺炎链球菌并且是comA蛋自的蛋白质(收编号pirllA39203)具有大约23％的同一性，第3-512位氨基酸与来自乳酸乳球菌并且是Lactococcin A转运蛋白ATP结合蛋白(lcnC)的蛋白质(收编号splQ005641LCNC～LACLA)具有大约26％的同一性，第14-512位氨基酸与来自肺炎链球菌并且是结合ATP的转运蛋白(ComA)的蛋白质(收编号NP-357637.1；NC～003098)具有大约23％的同一性，第113-509位氨基酸与来自唾液链球菌(Streptococcus salivarius)并且是ABC型转运蛋白的蛋白质(收编号gblAAC72026.1；AF043280)具有大约25％的同一性，以及第14-512位氨基酸与来自肺炎链球菌并且是转运ATP结合/通透酶蛋白的感受态因子(ComA)的蛋白质(收编号NP-344591.1；NC～003028)具有大约22％的同一性。

缺口BlastP序列比对显示SEQ ID NO：130(527个氨基酸)第16-524位氨基酸与来自乳酸乳球菌乳亚种并且是结合ATP的ABC转运蛋白和通透酶蛋白的蛋白质(收编号NP267678.1；NC～002662)具有大约23％的同一性，第6-520位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP～344680.1，NC～003028)具有大约25％的同一性，第6-520位氨基酸与来自肺炎链球菌并且是结合ATP的ABC转运蛋白/跨膜通透酶的蛋白质(收编号NP～357731.1；NC003098)具有大约25％的同一性，第105-511位氨基酸与来自肺炎链球菌并且是结合ATP的ABC型转运蛋白/跨膜蛋白的蛋白质(收编号NP～358796.1；NC003098)具有大约24％的同一性，以及第99-511位氨基酸与来自念珠蓝细菌属PCC7120并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-490403.1；NC～003276)具有大约25％的同一性。

缺口BlastP序列比对显示SEQ ID NO：132(529个氨基酸)第10-526位氨基酸与来自乳酸乳球菌乳亚种并且是结合ATP的ABC转运蛋白和通透酶蛋白的蛋白质(收编号NP267678.1；NC～002662)具有大约25％的同一性，第112-525位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合/跨膜通透酶的蛋白质(收编号NP_357731.1；NC_003098)具有大约26％的同一性，第112-525位氨基酸与来自肺炎链球菌并且是结合ATP的蛋白质-ABC转运蛋白的蛋白质(收编号NP-344680.1；NC～003028)具有大约26％的同一性，第107-518位氨基酸与来自Brevibacillus brevis并且同源于ABC转运蛋白(TycD)的蛋白质(收编号pirllT31077)具有大约24％的同一性，以及第83-521位氨基酸与来自肺炎链球菌并且是结合ATP的药物流出ABC型转运蛋白/通透酶的蛋白质(收编号NP-345800.1；NC～003028)具有大约24％的同一性。

缺口BlastP序列比对显示SEQ ID NO：134(600个氨基酸)第2-600位氨基酸与来自无害利斯特氏菌并且同源于ABC转运蛋白(通透酶)的蛋白质(收编号NP-471553.1；NC～003212)具有大约23％的同一性，第1-598位氨基酸与来自单核细胞增生利丝特氏菌并且是同源于ABC转运蛋白(通透酶)的蛋白质(收编号NP 465271.1；NC～003210)具有大约23％的同一性，第1-599位氨基酸与来自产气荚膜梭菌并且同源于ABC转运蛋白的蛋白质(收编号NP_561767.1；NC_003366)具有大约22％的同一性，第1-564位氨基酸与来自产气荚膜梭菌并且同源于ABC转运蛋白的蛋白质(收编号NP_561039.1；NC_003366)具有大约22％的同一性，以及第4-593位氨基酸与来自丙酮丁醇梭菌并且同源于通透酶的蛋白质(收编号NP_346868.1；NC_003030)具有大约22％的同一性。

缺口BlastP序列比对显示SEQ ID NO：136(249个氨基酸)第1-242位氨基酸与来自产气荚膜梭菌并且同源于ABC转运蛋白的蛋白质(收编号NP_561766.1；NC003366)具有大约58％的同一性，第3-242位氨基酸与来自产气荚膜梭菌并且同源于ABC转运蛋白的蛋白质(收编号NP561038.1；NC_003366)具有大约55％的同一性，第1-242位氨基酸与来自单核细胞增生利斯特氏菌并且同源于ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP465638.1；NC_003210)具有大约51％的同一性，第1-242位氨基酸与来自无害利斯特氏菌并且同源于ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP-471552.1；NC_003212)具有大约50％的同一性，以及第3-242位氨基酸与来自丙酮丁醇梭菌并且是ABC型转运蛋白-ATP结合蛋白的蛋白质(收编号NP-346867.1；NC003030)具有大约54％的同一性。

缺口BlastP序列比对显示SEQ ID NO：138(423个氨基酸)第2-391位氨基酸与来自酿脓链球菌的假定蛋白质(收编号NP270004.1；NC002737)具有大约21％的同一性，第2-383位氨基酸与来自酿脓链球菌的假定蛋白质(收编号NP608080.1；NC_003485)具有大约21％的同一性，第9-166位氨基酸与来自枯草芽孢杆菌并且是yvbJ蛋白的蛋白质(收编号NP_391268.1；NC000964)具有大约26％的同一性，第92-281位氨基酸与来自山羊关节炎-脑炎病毒并且是env多蛋白前体的蛋白质(收编号pirllVCLJC6)具有大约25％的同一性，以及第92-281位氨基酸与来自山羊关节炎-脑炎病毒并且是包膜糖蛋白的蛋白质(收编号gb AAD 14661.1；AF105181)具有大约24％的同一性。

缺口BlastP序列比对显示SEQ ID NO：140(438个氨基酸)第86-216位氨基酸与来自野油菜索丝菌并且是转运附属蛋白的蛋白质(收编号gblAAC95141.1；AF075600)具有大约27％的同一性，第107-219位氨基酸与来自肺炎链球菌并且是bacterocin转运附属蛋白的蛋白质(收编号NP-345950.1；NC003028)具有大约26％的同一性，第107-219位氨基酸与来自肺炎链球菌并且是Bta的蛋白质(收编号gblAAD56628.1；AF 165218)具有大约26％的同一性，第88-201位氨基酸与来自炭疽芽孢杆菌(Bacillus anthracis)的假定蛋白质(收编号NP052783.1；NC_001496)具有大约23％的同一性，以及第144-214位氨基酸与来自脑膜炎奈瑟氏球菌(Neisseria meningitidis)并且是硫氧还蛋白的蛋白质(收编号NP274384.1；NC_003112)具有大约32％的同一性。

缺口BlastP序列比对显示SEQ ID NO：142(196个氨基酸)第1-196位氨基酸与来自加氏乳杆菌(Lactobacillus gasseri)的蛋白质(收编号dbj！BAA82351.1；AB029612)具有大约56％的同一性，第10-196位氨基酸与来自乳杆菌的假定蛋白质(收编号splP294701YLA1_LACAC)具有大约49％的同一性，第41-196位氨基酸与来自干酪乳杆菌并且是ABC转运附属因子的蛋白质(收编号NP_542220.1；NC003320)具有大约28％的同一性，第90-196位氨基酸与来自植物乳杆菌并且是ABC转运蛋白附属因子(PlnH)的蛋白质(收编号emblCAA64190.1；X94434)具有大约35％的同一性，以及第41-196位氨基酸与来自清酒乳杆菌(Lactobacillus sake)并且同源于ABC输出蛋白附属因子(SapE)的蛋白质(收编号pirllA56973)具有大约30％的同一性。

缺口BlastP序列比对显示SEQ ID NO：144(720个氨基酸)第9-720位氨基酸与来自植物乳杆菌并且是ABC转运蛋白(PlnG)的蛋白质(收编号emblCAA64189.1；X94434)具有大约62％的同一性，第6-720位氨基酸与来自清酒乳杆菌i并且同源于ATP依赖型转位蛋白(sppT)的蛋白质(收编号pirllS57913)具有大约62％的同一性，第2-720位氨基酸与来自清酒乳杆菌i并且是ATP依赖型转运蛋白(SapT)的蛋白质(收编号pirllI56273)具有大约62％的同一性，第9-720位氨基酸与来自干酪乳杆菌并且是ABC转运蛋白的蛋白质(收编号NP_542219.1；NC003320)具有大约62％的同一性，以及第25-718位氨基酸与来自嗜酸乳杆菌并且是ABC转运蛋白的蛋白质(收编号NP604412.1；NC003458)具有大约57％的同一性。

缺口BlastP序列比对显示SEQ ID NO：146(234个氨基酸)第13-228位氨基酸与来自金黄色葡糖球菌金黄亚种并且同源于ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-370833.1；NC～002758)具有大约52％的同一性，第11-234位氨基酸与来自酿脓链球菌并且同源于ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP～606994.1；NC003485)具有大约50％的同一性，第11-234位氨基酸与来自酿脓链球菌并且同源于ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP268993.1；NC～002737)具有大约50％的同一性，第13-232位氨基酸与来自乳酸乳球菌乳亚种并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP266815.1；NC～002662)具有大约50％的同一性，以及第11-233位氨基酸与来自乳酸乳球菌乳亚种并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP268413.1；NC002662)具有大约53％的同一性。

缺口BlastP序列比对显示SEQ ID NO：148(353个氨基酸)第1-352位氨基酸与来自乳酸乳球菌乳亚种的假定蛋白质(收编号NP268412.1；NC002662)具有大约40％的同一性，第1-352位氨基酸与来自金黄色葡糖球菌金黄亚种的保守假定蛋白质(收编号NP-370832.1；NC～002758)具有大约38％的同一性，第1-352位氨基酸与来自酿脓链球菌的保守假定蛋白质(收编号NP268992.1；NC～002737)具有大约33％的同一性，第1-352位氨基酸与来自酿脓链球菌的保守假定蛋白质(收编号NP606993.1；NC～003485)具有大约33％的同一性，以及第1-352位氨基酸与来自乳酸乳球菌乳亚种并且是ABC转运蛋白通透酶蛋白的蛋白质(收编号NP-266816.1；NC～002662)具有大约34％的同一性。

缺口BlastP序列比对显示SEQ ID NO：150(188个氨基酸)第14-85位氨基酸与来自乳酸乳球菌乳亚种并且是转录调节子的蛋白质(收编号NP266817.1；NC002662)具有大约47％的同一性，第21-90位氨基酸与来自Aquifex aeolicus并且是TetR/AcrR家族中的转录调节子的蛋白质(收编号NP213195.1；NC～000918)具有大约28％的同一性，第14-75位氨基酸与来自丙酮丁醇梭菌并且是AcrR家族中的转录调节子的蛋白质(收编号NP-348163.1；NC～003030)具有大约30％的同一性，第25-109位氨基酸与来自天蓝色链霉菌并且同源于转录调节子的蛋白质(收编号emblCAB93030.1；AL357432)具有大约29％的同一性，以及第27-88位氨基酸与来自丙酮丁醇梭菌并且是TetR/AcrR家族中的转录调节子的蛋白质(收编号NP～347457.1；NC～003030)具有大约41％的同一性。

缺口BlastP序列比对显示SEQ ID NO：152(236个氨基酸)第3-236位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号Nu-359090.1；NC～003098)具有大约65％的同一性，第4-236位氨基酸与来自肺炎链球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP-346092.1；NC～003028)具有大约66％的同一性，第4-236位氨基酸与来自酿脓链球菌并且同源于ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP607321.1；NC003485)具有大约65％的同一性，第4-236位氨基酸与来自酿脓链球菌并且同源于ABC转运蛋白(ATP结合蛋白)的蛋白质(收编号NP269390.1；NC～002737)具有大约65％的同一性，以及第4-236位氨基酸与来自单核细胞增生利斯特氏菌并且同源于ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP 464748.1；NC003210)具有大约62％的同一性。

缺口BlastP序列比对显示SEQ ID NO：154(846个氨基酸)的第6-846位氨基酸与来自乳酸乳球菌乳亚种并且是ABC转运蛋白通透酶蛋白的蛋白质(收编号NP267260.1；NC～002662)具有大约41％的同一性，第2-846位氨基酸与来自肺炎链球菌的假定蛋白质(收编号NP-359089.1；NC003098)具有大约34％的同一性，第2-846位氨基酸与来自肺炎链球菌的假定蛋白质(收编号NP 346091.1；NC～003028)具有大约34％的同一性，第4-846位氨基酸与来自酿脓链球菌的假定蛋白质(收编号NP269389.1；NC002737)具有大约33％的同一性，以及第4-846位氨基酸与来自酿脓链球菌的假定蛋白质(收编号NP607320.1；NC～003485)具有大约33％的同一性。

缺口BlastP序列比对显示SEQ ID NO：156(78个氨基酸)第12-70位氨基酸与来自拟南芥的蛋白质(收编号gblAAF 19707.1；AC008047)具有大约30％的同一性，第12-70位氨基酸与来自拟南芥并且同源于ATP依赖型铜转运蛋白的蛋白质(收编号NP-176533.1；NM-105023)具有大约30％的同一性，第1-65位氨基酸与来自激烈热球菌的假定蛋白质(收编号NP-579673.1；NC～003413)具有大约32％的同一性，以及第21-55位氨基酸与来自肝炎TT病毒的蛋白质(收编号gblAAK1 1712.1；AF345529)具有大约37％的同一性。

缺口BlastP(版本)序列比对显示SEQ ID NO：158(379个氨基酸)第32-368位氨基酸与来自无害利斯特氏菌的保守假定蛋白质(收编号NP-470340.1；NC～003212)具有大约36％的同一性，第32-353位氨基酸与来自单核细胞增生利斯特菌的保守假定蛋白质(收编号NP464529.1；NC～003210)具有大约37％的同一性，第87-370位氨基酸与来自乳酸乳球菌的蛋白质(收编号emblCAA68042.1；X99710)具有大约36％的同一性，第28-372位氨基酸与来自乳酸乳球菌乳亚种的假定蛋白质(收编号NP267885.1；NC～002662)具有大约31％的同一性，以及第32-348位氨基酸与来自珍贵束丝放线菌桔橙亚种的蛋白质(收编号gblAAC14002.1；U33059)具有大约30％的同一性。

缺口BlastP序列比对显示SEQ ID NO：160(779个氨基酸)第1-308位氨基酸与来自变异链球菌并且是ABC转运蛋白ATP结合亚基的蛋白质(收编号gblAAD09218.1；U73183)具有大约61％的同一性，第1-362位氨基酸与来自乳酸乳球菌乳亚种并且是ABC转运蛋白ATP结合以及通透酶蛋白的蛋白质(收编号NP266870.1；NC～002662)具有大约37％的同一性，第1-295位氨基酸与来自单核细胞增生利斯特菌并且同源于ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP464271.1；NC003210)具有大约39％的同一性，第1-221位氨基酸与来自闪烁古生球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP070298.1；NC000917)具有大约47％的同一性，以及第1-218位氨基酸与来自闪烁古生球菌并且是ABC转运蛋白ATP结合蛋白的蛋白质(收编号NP069851.1；NC000917)具有大约49％的同一性。

缺口BlastP序列比对显示SEQ ID NO：162(38个氨基酸)第1-27位氨基酸与来自丙酮丁醇梭菌并且是甘露糖特异磷酸转移酶体系组分的蛋白质(收编号NP～149230.1；NC001988)具有大约66％的同一性，第3-27位氨基酸与来自单核细胞增生利斯特氏菌并且同源于PTS体系甘露糖特异因子IIAB的蛋白质(收编号NP463629.1；NC～003210)具有大约72％的同一性，第3-27位氨基酸与来自无害利斯特氏菌并且同源于PTS体系甘露糖特异因子IIAB的蛋白质(收编号NP469488.1；NC～003212)具有大约72％的同一性，第1-27位氨基酸与来自产气荚膜梭菌并且是PTS体系蛋白的蛋白质(收编号NP 561737.1；NC003366)具有大约66％的同一性，以及第2-27位氨基酸与来自酿脓链球菌并且是甘露糖特异磷酸转移酶体系组分IIAB的蛋白质(收编号NP269761.1；NC002737)具有大约65％的同一性。

缺口BlastP序列比对显示SEQ ID NO：164(105个氨基酸)第1-103位氨基酸与来自单核细胞增生利斯特氏菌并且同源于PTS体系甘露糖特异因子IIAB的蛋白质(收编号NP463629.1；NC～003210)具有大约60％的同一性，第1-103位氨基酸与来自无害利斯特氏菌并且同源于PTS体系甘露糖特异因子IIAB的蛋白质(收编号NP469488.1；NC～003212)具有大约59％的同一性，第1-104位氨基酸与来自产气荚膜梭菌并且是PTS体系蛋白的蛋白质(收编号NP 561737.1；NC003366)具有大约57％的同一性，第1-104位氨基酸与来自丙酮丁醇梭菌并且是甘露糖特异磷酸转移酶体系组分IIAB的蛋白质(收编号NP149230.1；NC001988)具有大约53％的同一性，以及第1-96位氨基酸与来自酿脓链球菌并且是甘露糖特异磷酸转移酶体系组分IIAB的蛋白质(收编号NP607831.1；NC003485)具有大约54％的同一性。

缺口BlastP序列比对显示SEQ ID NO：166(269个氨基酸)第1-269位氨基酸与来自无害利斯特氏菌并且同源于PTS体系甘露糖特异因子IIC的蛋白质(收编号NP469489.1；NC～003212)具有大约69％的同一性，第1-269位氨基酸与来自单核细胞增生利斯特氏菌并且同源于PTS体系甘露糖特异因子IIC的蛋白质(收编号NP463630.1；NC003210)具有大约69％的同一性，第1-269位氨基酸与来自肺炎链球菌并且是PTS体系甘露糖特异IIC组分的蛋白质(收编号NP～344821.1；NC～003028)具有大约67％的同一性，第1-269位氨基酸与来自酿脓链球菌并且同源于甘露糖特异磷酸转移酶体系组分IIC的蛋白质(收编号NP269762.1；NC～002737)具有大约65％的同一性，以及第1-269位氨基酸与来自丙酮丁醇梭菌并且是甘露糖/果糖特异磷酸转移酶体系组分IIC的蛋白质(收编号NP～149231.1；NC001988)具有大约64％的同一性。

缺口BlastP序列比对显示SEQ ID NO：168(307个氨基酸)第5-307位氨基酸与来自无害利斯特氏菌并且同源于PTS体系甘露糖特异因子IID的蛋白质(收编号NP469490.1；NC003212)具有大约67％的同一性，第5-307位氨基酸与来自单核细胞增生利斯特氏菌并且同源于PTS体系甘露糖特异因子I ID的蛋白质(收编号NP463631.1；NC003210)具有大约67％的同一性，第6-303位氨基酸与来自丙酮丁醇梭菌并且是甘露糖特异磷酸转移酶体系组分IID的蛋白质(收编号NP～149232.1；NC001988)具有大约64％的同一性，第4-300位氨基酸与来自乳酸乳球菌乳亚种并且是甘露糖特异PTS体系组分IID(EC2.7.1.69)的蛋白质(收编号NP267864.1；NC002662)具有大约64％的同一性，以及第5-307位氨基酸与来自肺炎链球菌并且是PTS体系甘露糖特异IID组分的蛋白质(收编号NP-344820.1；NC～003028)具有大约64％的同一性。

缺口BlastP序列比对显示SEQ ID NO：170(111个氨基酸)第4-105位氨基酸与来自酿脓链球菌并且同源于PTS体系酶I I蛋白的蛋白质(收编号NP269441.1；NC002737)具有大约51％的同一性，第4-110位氨基酸与来自单核细胞增生利斯特氏菌并且同源于纤维二糖磷酸转移酶IIB组分的蛋白质(收编号NP_466205.1；NC_003210)具有大约54％的同一性，第4-110位氨基酸与来自无害利斯特氏菌并且同源于纤维二糖磷酸转移酶IIB组分的蛋白质(收编号NP_472159.1；NC_003212)具有大约54％的同一性，第4-105位氨基酸与来自酿脓链球菌并且同源于PTS体系酶II的蛋白质(收编号NP_607438.1；NC_003485)具有大约50％的同一性，以及第1-109位氨基酸与来自乳酸乳球菌乳亚种并且是纤维二糖特异PTS体系IIB组分的蛋白质(EC2.7.1.69)(收编号NP_266569.1；NC_002662)具有大约50％的同一性。

缺口BlastP序列比对显示SEQ ID NO：172(256个氨基酸)第1-250位氨基酸与来自肺炎链球菌并且是磷酸转移酶体系糖特异EII组分的蛋白质(收编号NP-357876.1；NC003098)具有大约53％的同一性，第1-250位氨基酸与来自肺炎链球菌并且是PTS体系IIC组分的蛋白质(收编号NP-344847.1；NC003028)具有大约53％的同一性，第1-255位氨基酸与来自丙酮丁醇梭菌并且是PTS体系纤维二糖特异组分IIC的蛋白质(收编号NP-347026.1；NC003030)具有大约43％的同一性，第1-249位氨基酸与来自乳酸乳球菌乳亚种并且是纤维二糖特异PTS体系IIC组分(EC 2.7.1.69)的蛋白质(收编号NP～266572.1；NC002662)具有大约38％的同一性，以及第1-255位氨基酸与来自无害利斯特氏菌并且同源于PTS体系纤维二糖特异IIC组分的蛋白质(收编号NP～470241.1；NC～003212)具有大约37％的同一性。

缺口BlastP序列比对显示SEQ ID NO：174(560个氨基酸)第1-551位氨基酸与来自Bacillus halodurans并且是PTS体系β葡糖苷特异酶IIABC组分的蛋白质(收编号NP241162.1；NC～002570)具有大约39％的同一性，第1-551位氨基酸与来自单核细胞增生利斯特氏菌并且同源于磷酸转移酶体系(PTS)β葡糖苷特异酶IIABC组分的蛋白质(收编号NP464265.1；NC003210)具有大约39％的同一性，第1-554位氨基酸与来自枯草芽孢杆菌并且是磷酸转移酶体系(PTS)β葡糖苷特异酶IIABC组分的蛋白质(收编号NP 391806.1；NC～000964)具有大约38％的同一性，第1-554位氨基酸与来自枯草芽孢杆菌并且是PTS体系β葡糖苷特异IIABC组分(EIIABC-BGL)(β葡糖苷通透酶IIABC组分)的蛋白质(收编号splP407391PTBA～BACSU)具有大约38％的同一性，以及第1-554位氨基酸与来自Bacillushalodurans并且是PTS体系β葡糖苷特异酶IIABC组分的蛋白质(收编号NP241461.1；NC002570)具有大约37％的同一性。

有关SEQ ID NOS：176-364中偶数号序列的最佳序列比对结果如表2所示。

表2.SEQ ID NOS：176-308的最佳序列比对结果

实施例3：糖代谢基因

正如它的API50糖发酵模式所显示的，嗜酸乳杆菌有能力利用各种碳水化合物，包括单糖、二糖和多糖。尤其是，可利用未被上部消化道消化的复杂膳食碳水化合物，诸如蜜三糖和果糖寡糖等(Gibson等(1995)J.Nutr.125：1401-1412；Barrangou等(2003)Proc.Natl.Acad.Sci.U.S.A 100：8957-8962)。NCFM基因组编码许多种与碳水化合物利用相关的基因，包括转运蛋白的20种磷酸烯醇丙酮酸糖转移酶体系(PTS)和5个ATP结合盒(ABC)家族。

已鉴定了以下糖类的推定的PTS转运蛋白：海藻糖(ORF 1012)(SEQ ID NOS：103和289)、果糖(ORF 1777)(SEQ ID NO：35)、蔗糖(ORF 401)(SEQ ID NO：101)、葡萄糖和甘露糖(ORF 452(SEQ IDNOS：1和263)、ORF 453(SEQ ID NO：161)、ORF 454(SEQ ID NO：163)、ORF 455(SEQ ID NO：165)和ORF 456(SEQ ID NO：167))、蜜二糖(ORF 1705)(SEQ ID NO：33)、龙胆二糖和纤维二糖(ORF 1369)(SEQ ID NOS：17和269)、水杨苷(ORF 876)(SEQ ID NO：169)、ORF 877(SEQ ID NO：3)、ORF 879(SEQ ID NO：171))、熊果苷(ORF 884)(SEQ ID NO：27)和N-乙酰葡糖胺(ORF 146)(SEQ IDNO：21)。已鉴定了以下糖类的推定的ABC转运蛋白：FOS(ORF 502(SEQID NOS：39和273)、ORF 504(SEQ ID NO：43)、ORF 506(SEQ IDNO：47))、蜜三糖(ORF1439(SEQ ID NO：109)、ORF 1440(SEQ IDNOS：111和293)、ORF1441(SEQ ID NO：113)、ORF 1442(SEQ IDNOS：115和295)以及麦芽糖(ORF 1854-ORF 1857)。推定的乳糖-半乳糖通透酶也被鉴定出来了(ORF 1463)(SEQ ID NO：175)。大部分这些转运蛋白与糖苷酶和转录调控子共有某一遗传位点，使得转录调控可以局部化。

基因组的In silico分析显示存在代表整个糖酵解途径的基因。此外，综合的碳水化合物利用调控网络成员也被确定，即，HPr(ORF 639(SEQ ID NO：177)，ptsH)、EI(ORF 640(SEQ ID NO：179)，ptsI)、CcpA(ORF 431(SEQ ID NO：181)，ccpA)和HPrK/P(ORF 676(SEQ IDNO：183)，ptsK)，显示了以糖的可用性为基础的活跃碳代谢抑制网络。

实施例4：差异表达基因

利用Ward′s分级群聚法、火山形图和等高线图通过群聚分析显现从8种不同的碳水化合物培养中获得的综合基因表达模式(Eisen等(1998)Proc.Natl.Acad.Sci.USA 95：14863-14868)。大体上，在成对处理条件之间有23-379个基因是差异表达的(p值低于Bonferroni校正值)，分别代表了基因组的1％-20％。考虑了所有可能的处理，而且如果某基因在至少一种处理比较中显示出有诱导，则该基因被视为被诱导超过了某一特殊水平。对于在一个以上的情形下显示出诱导的基因，选择最高的诱导水平。尽管有342种基因(基因组的19％)显示出诱导水平高2倍以上，但只有63种基因(基因组的3％)显示出诱导水平高4倍以上，表明相对小数量的基因被高度诱导。尽管无论生长所用培养基为何种，大部分基因的全面表达水平保持一致(基因组的80％)，精选的基因簇显示出基因和操纵子的差异转录。不过，对于每种糖而言，只有有限数量的基因显示出有特异的诱导。

与其它的单糖(果糖、半乳糖)和二糖(蔗糖、乳糖、海藻糖)相比较而言，在葡萄糖存在的情况下，ORF 1679(SEQ ID NO：133)和ORF 1680(SEQ ID NO：135)被高度诱导。与其它糖相比较，对于ORF 1679(SEQ ID NO：133)而言诱导水平在3.5和6.3倍之间变化，对于ORF 1680(SEQ ID NO：135)而言诱导水平在3.7和4.7倍之间变化。ORF 1679(SEQ ID NO：133)编码ABC核苷酸结合蛋白，包括通常找到的核苷酸结合结构域基元，即WalkerA、WalkerB、ABC信号序列以及Linton和Higgins基元。ORF1680(SEQ ID NO：135)编码ABC通透酶，具有10个预测的跨膜结构域。在它们的附近不编码溶质结合蛋白，表明其作用可能是输出器而非输入器。有数种基因和操纵子被葡萄糖特异的阻遏，包括ORFs 680(SEQ ID NO：239)-ORF 686，它们与糖原代谢相关。由于细胞进行糖原代谢以贮存能量，所以当有诸如葡萄糖等优选的碳源存在时，能量贮存就不是必要的了。在葡萄糖存在的情况下受阻遏的其它基因包括其它碳水化合物来源物质摄取中所涉及的蛋白质以及所述碳水化合物水解中涉及的酶。

在推定的果糖基因座处的三个基因ORF 1777(SEQ ID NO：35)(FruA，果糖PTS转运蛋白EIIABC^Pru)、ORF 1778(SEQ ID NO：185)(FruK，磷酸果糖激酶EC 2.7.1.56)和ORF 1779(SEQ ID NO：187)(FruR，转录调节子)是差异表达的。fruA、fruK和fruR的诱导水平分别高达3.9、4.3和4.6倍。这些结果显示果糖通过PTS转运蛋白转运进入细胞，转换成果糖-6-磷酸，磷酸果糖激酶FruK将其磷酸化成为糖酵解的中间产物果糖-1，6-二磷酸。

在有蔗糖的情况下，蔗糖基因座上的三个基因是差异表达的，即ORF 399(SEQ ID NO：97)(ScrR，转录调节子)、ORF 400(SEQ IDNO：99)(ScrB，蔗糖-6-磷酸水解酶EC 3.2.1.26)和ORF 401(SEQID NO：101)(ScrA，蔗糖PTS转运蛋白EIIBCA^Suc)。与葡萄糖存在的情况相比，scrR、scrB和scrA的诱导水平分别高达3.1、2.8和17.2倍。与单糖和二糖存在的情况相比，ORF 401(SEQ ID NO：101)尤其表现出高诱导水平，在8.0至17.2之间。这些结果表明蔗糖通过PTS转运蛋白运送进入细胞，转变成为蔗糖-6-磷酸，它随后被ScrB水解成葡萄糖-6-磷酸和果糖。

FOS操纵子的6个基因是差异表达的，即ORF 502(SEQ ID NOS：39和273)、ORF 503(SEQ ID NO：41)、ORF 504(SEQ ID NO：43)、ORF 506(SEQ ID NO：47)(MsmEFGK ABC转运蛋白)、ORF 505(SEQID NO：45)(BfrA，β-果糖苷酶EC 3.2.1.26)和ORF 507(SEQ IDNOS：49和275)(GtfA，蔗糖磷酸化酶EC 2.7.1.4)。与单糖和二糖存在的情况相比，它们的诱导水平在15.1至40.6倍之间变化，与蜜三糖存在的情况相比，它们的诱导水平在5.5至8.9倍之间变化。这些结果表明FOS通过ABC转运蛋白运送进入细胞并随后被果糖苷酶水解成果糖和蔗糖。蔗糖有可能随后被蔗糖磷酸化酶水解成果糖和葡萄糖-1-P。除了FOS操纵子之外，FOS还诱导果糖操纵子、蔗糖PTS转运蛋白、海藻糖操纵子和ABC转运蛋白(ORF 1679-ORF 1680)(分别是SEQ ID NOS：133和135)。

在有蜜三糖的情况下，蜜三糖操纵子的6个基因被特异诱导。蜜三糖基因座由ORF 1442(SEQ ID NOS：115和295)、ORF 1441(SEQ IDNO：113)、ORF 1440(SEQ ID NOS：111和293)、ORF1439(SEQ ID NO：109)(MsmEFGK2ABC转运蛋白)、ORF1438(SEQ ID NO：197)(MelAα-半乳糖苷酶EC 3.2.1.22)和ORF1437(SEQ ID NO：195)(GtfA₂，蔗糖磷酸化酶EC 2.7.1.4)组成。与所有其它条件相比，它们的诱导水平在15.1至45.6倍之间变化。此外，与其它条件相比，ORFs 1433(SEQID NO：189)、1434(SEQ ID NO：191)(二羟丙酮激酶EC 2.7.1.29)和ORF 1436(SEQ ID NO：193)(甘油摄取促进蛋白)诱导水平在1.9和24.7倍之间。

在有乳糖和半乳糖的情况下，分布在两个基因座的10种基因差异表达，即ORF 1463(SEQ ID NO：175)(GPH转位子家族的LacS通透酶)、ORF 1462(SEQ ID NO：209)(LacZ，β-半乳糖苷酶EC 3.2.1.23)、ORF 1461(SEQ ID NO：207)、ORF 1460(SEQ ID NO：205)(表面蛋白)、ORF 1459(SEQ ID NO：203)(GalK，半乳糖激酶EC 2.7.1.6)、ORF 1458(SEQ ID NO：201)(GalT，半乳糖-1-磷酸尿苷酰转移酶EC 2.7.7.10)、ORF 1457(SEQ ID NO：199)(GalM，半乳糖差向异构酶EC 5.1.3.3)、ORFs 1467(SEQ ID NO：211)、1468(SEQID NO：213)(LacLM，β-半乳糖苷酶EC 3.2.1.23大小亚基)和1469(SEQ ID NO：215)(GalE，UDP-葡萄糖差向异构酶EC 5.1.3.2)。LacS(SEQ ID NO：175)与先前在乳酸细菌中确定的GPH通透酶相似。尽管LacS(SEQ ID NO：175)在羧基端含有EIIA，但它并非PTS转运蛋白。此外，LacS(SEQ ID NO：175)在第553位含有一His，这可能涉及与HPr的相互作用，正如S.salivarius中的那样(Lessard等(2003)J.Bacteriol.185：6764-6772)。与有其它不含半乳糖的碳水化合物(即葡萄糖、果糖、蔗糖、海藻糖和FOS)的情况相比，在有乳糖和半乳糖的情况下，galKTM(SEQ ID NOS：199、201和203)的诱导水平在3.7和17.6倍之间；lacSZ(SEQ ID NOS：175和209)的诱导水平在2.8和17.6倍之间；lacL(SEQ ID NO：213)和galE(SEQID NO：215)的诱导水平在2.7至29.5倍之间。这些结果表明半乳糖通过半乳糖苷-戊糖己糖醛酸糖苷转位子家族的LacS通透酶被转运进入细胞。在细胞内，乳糖被LacZ水解成葡萄糖和半乳糖。然后半乳糖被GalK磷酸化成半乳糖-1-磷酸，进一步被GalT转化成UDP-半乳糖。UDP-半乳糖随后被GalE差向异构化成UDP-葡萄糖。UDP-葡萄糖可能被ORF 1719(SEQ ID NO：217)转变成葡萄糖-IP，它编码一贯高表达的UDP-葡萄糖磷酸化酶EC 2.7.7.9。最后，葡萄糖磷酸变位酶EC5.4.2.2很可能作用于葡萄糖-1P，产生葡萄糖-6P，一种糖酵解的底物。

推定的海藻糖基因座的三个基因也是差异表达的。海藻糖基因座由ORF 1012(SEQ ID NOS：103和289)(编码TreB海藻糖PTS转运蛋白EIIABCTre EC 2.7.1.69)、ORF1013(SEQ ID NO：105)(TreR，海藻糖调控子)和ORF1014(SEQ ID NOS：107和291)(TreC，海藻糖-6磷酸水解酶EC 3.2.1.93)组成。与有葡萄糖、蔗糖、蜜三糖和半乳糖的情况相比，有关treB(SEQ ID NOS：103和289)的诱导水平在4.3至18.6倍之间，有关treR(SEQ ID NO：105)的诱导水平在2.3至7.3倍之间，而有关treC(SEQ ID NOS：107和291)的诱导水平在2.7至18.5倍之间。这些结果表明海藻糖通过PTS转运蛋白运送进入细胞，磷酸化成海藻糖-6-磷酸并被TreC水解成葡萄糖和葡萄糖-6-磷酸。

此外，显示出差异表达的基因包括与糖和能量相关的基因ORF 874(SEQ ID NO：219)(β半乳糖苷酶EC 3.2.1.86)、ORF 910(SEQ IDNO：221)(L-LDH EC 1.1.1.27)、ORF 1007(SEQ ID NO：223(吡哆醛激酶2.7.1.35)、ORF 1812(SEQ ID NO：225)(α葡糖苷酶EC3.2.1.3)、ORF 1632(SEQ ID NO：227)(乙醛脱氢酶EC 1.2.1.16)、ORF 1401(SEQ ID NO：229)(NADH过氧化物酶EC 1.11.1.1)、ORF1974(SEQ ID NO：231)(丙酮酸氧化酶EC 1.2.3.3)；附着基因ORF555、ORF 649、ORF 1019；氨肽酶ORF 911、ORF 1086；氨基酸通透酶，ORF 1102(SEQ ID NO：233)(膜蛋白)、ORF 1783(SEQ ID NO：235)(ABC转运蛋白)和ORF 1879(SEQ ID NO：237)(嘧啶激酶EC 2.7.4.7)。

实施例5.实时RT-PCR

为了证实用微阵列所检测的诱导水平，选择在微阵列实验中差异表达的5个基因进行实时定量RT-PCR实验。根据它们的宽表达水平范围(LSM在-1.52和+3.87之间)以及在各种糖类之间的诱导水平(诱导倍数高达34)选择这些基因。所有被选基因都在至少一种情形下显示出高于6倍的诱导水平。此外，被选基因的注释在功能上都与碳水化合物的利用相关。选定的5种基因是β-果糖苷酶(ORF 505)(SEQ ID NO：45)、海藻糖PTS(ORF 1012)(SEQ ID NOS：103和289)、甘油摄取促进蛋白(ORF 1436)(SEQ ID NO：193)、β半乳糖苷酶(ORF 1467)(SEQ ID NO：211)和ABC转运蛋白(ORF 1679)(SEQ ID NO：133)。

对于这5种选定基因，比较6种不同处理的诱导水平，导致对每种基因而言有15种诱导水平。为了证实微阵列的数据，用微阵列检测的诱导水平对Q-PCR检测的诱导水平作图。对于每种被测基因而言各个R-方值在0.642和0.883之间变化(用log2衡量的数据在0.652和0.978之间)。当数据组合时，总的R-方值是0.78(用log2衡量的数据是0.88)。用SAS(Cary，NC)进行相关性分析，显示出就Spearman、Hoeffding和Kendall测试而言，两种方法的P值小于0.001，因而具有相关性。此外，用excel(Microsoft，CA)进行回归分析，在微阵列和Q-PCR的结果之间显示出统计学上显著的高相关性(p＜1.02×10^-25)。不过，Q-PCR测量值显示出较高的诱导水平，这可能是由于与Q-PCR循环仪相比，微阵列扫描仪动态范围较小造成的。

相似的结果在先前的文献中已有报道(Wagner等(2003)J.Bacteriol.185：2080-2095)。

实施例6：比较分析

对用8种碳水化合物培养所测定的总转录图谱进行比较分析确定了嗜酸乳杆菌中碳水化合物转运和分解代谢的基础。明确的说，三种不同类型的碳水化合物转运蛋白被差异表达，即磷酸烯醇丙酮酸：糖磷酸转移酶体系(PTS)、ATP结合盒(ABC)和半乳糖苷-戊糖己糖醛酸酐(GPH)转位子，说明了嗜酸乳杆菌所用的碳水化合物转运蛋白的多样性。转录图谱表明半乳糖苷是由GPH转位子转运的，而单糖和二糖是由PTS家族成员转运的，多糖是由ABC家族成员转运的。

微阵列结果显示果糖、蔗糖和海藻糖分别是由PTS转运蛋白EIIABC^Fru(ORF 1777)(SEQ ID NO：35)、EIIBCA^SuC(ORF 401)(SEQID NO：101)和EIIABC^Tre(ORF1012)(SEQ ID NOS：103和289)转运的。那些基因编码在典型的PTS基因座上(图1)，连同以及在其它生物体中已被很好鉴定的调节子酶。与此不同的是，FOS和蜜三糖分别是由MsmEFGK家族的ABC转运蛋白ORFs 502(SEQ ID NOS：39和273)、503(SEQ ID NO：41)、504(SEQ ID NO：43)和505(SEQ IDNO：45)；以及ORFs 1437(SEQ ID NO：195)、ORF 1438(SEQ ID NO：197)、1439(SEQ ID NO：109)、ORF 1440(SEQ ID NOS：111和293)、ORF 1441(SEQ ID NO：113)和ORF 1442(SEQ ID NO：115和295)转运的。在海藻糖和FOS的情况下，微阵列结果与定点敲除碳水化合物转运蛋白和水解酶改进嗜酸乳杆菌NCFM的糖分解潜能的功能性研究有很好的相关性。

EIIABC^Tre的差异表达是与最近有关嗜酸乳杆菌的研究一致的，其中显示ORF 1012(SEQ ID NOS：103和289)涉及海藻糖的摄取。类似的，fos操纵子的差异表达是与先前有关嗜酸乳杆菌的工作一致的，该先前的研究显示那些基因与FOS的摄取和分解代谢有关，并且在有FOS时被诱导，而在有葡萄糖时被阻遏(Barrangou等(2003)Proc.Natl.Acad.Sci.USA 100：8957-8962)。此外，蜜三糖msm基因座的诱导是与先前有关变异链球菌(Russell等(1992)J.Biol.Chem.267：4631-4637)和肺炎链球菌(Rosenow等(1999)Genome Res.9：1189-1197)的工作是一致的。

许多乳酸细菌通过PTS转运蛋白摄入葡萄糖。EII^ManPTS转运蛋白具有输入甘露糖和葡萄糖二者的能力(Cochu等，2003)。嗜酸乳杆菌的甘露糖PTS体系与嗜热链球菌(Streptococcus thermophilus)的相似，其蛋白质具有53-65％的同一性和72-79％的相似性。明确的说，EII^Man含三种蛋白质IIAB^Man、IIC^Man和IID^Man，分别由ORF 452(SEQ IDNOS：1和263)(manL)、ORF455(SEQ ID NO：165)(manM)和ORF 456(SEQID NO：167)(manN)编码(图1)。

在此检查的大部分碳水化合物特异诱导它们自身转运和水解中涉及的基因，但葡萄糖不是如此。有关甘露糖PTS的分析表明，无论碳水化合物来源如何，编码EIIABCD^Man的基因都一贯高表达。正如先前有关植物乳杆菌的研究所显示的，此表达图谱表明葡萄糖是一种优选的碳水化合物，而嗜酸乳杆菌也被设计成有效的利用不同的碳水化合物来源(Kleerebezem等(2003)Proc.Natl.Acad.Sci.USA 100：1990-1995)。

在有半乳糖和乳糖时差异表达的基因包括通透酶(LacS)和Leloir途径的酶促进制。在多种乳酸细菌中都记录有LacS亚家族成员半乳糖苷-戊糖-己糖醛酸酐(GPH)转位子，包括乳明串球菌(Vaughan等(1996)Appl.Environ.Microbiol.62：1574-1582)、S.thermophilus(van den Bogaard等(2000)J.Bacteriol.182：5982-5989)、唾液链球菌(Lessard等(2003)JBacteriol.185：6764-6772)和德氏乳杆菌(Lapierre等(2002)J.Bacteriol.184：928-935)。尽管LacS在羧基末端含有PTS EIIA，但它不是PTS家族转运蛋白的成员。据报道，在某些选定的生物体中，LacS能输入半乳糖和乳糖(Vaughan等(1996)Appl.Environ.Microbiol.62：1574-1582；van den Bogaard等(2000)J.Bacteriol.182：5982-5989)。尽管LacS乳糖通透酶和两个β半乳糖苷酶亚基LacL和LacM的联合在植物乳杆菌(Kleerebezem等2003)和乳明串球菌(Vaughan等(1996)Appl.Environ.Microbiol.62：1574-1582)中都有描述，但在嗜酸乳杆菌中从未有有关报道。虽然先前已有关于lacS和lacLM组成型表达的报道(Vaughan等(1996)Appl.Environ.Microbiol.62：1574-1582)，这些结果表明半乳糖和乳糖二者摄取和分解代谢中所涉及的基因是特异性诱导的。有关半乳糖苷应用的操纵子组成在革兰氏阳性细菌之间是可变的和不稳定的(Lapierre等(2002)J BacterioL184：928-935；Vaillancourt等(2002)J.Bacteriol.184：785-793；Boucher等(2003)Appl.Environ.Microbiol.69：4149-4156；Fortina等(2003)Appl.Environ.Microbiol.69：3238-3243；Grossiord等(2003)J.Bacteriol.185：870-878)。即使是密切相关的乳杆菌种，即约氏乳杆菌、加氏乳杆菌和嗜酸乳杆菌，乳糖-半乳糖基因座也不是很保守的(Pridmore等(2004)Proc.Natl.Acad.Sci.USA 101：2512-2517)。

尽管先前已显示磷酸烯醇丙酮酸：磷酸转移酶体系是革兰氏阳性细菌的主要糖运送体系(Ajdic等(2002)Proc.Natl.Acad.Sci.USA99：14434-14439；Warner和Lolkema(2003)Microbiol.Mol.Rev.67：475-490)，目前的微阵列数据表明ABC转运体系也是很重要的。而PTS转运蛋白是与单糖和二糖摄入有关的，那些碳水化合物在消化道上部被消化。相反，寡糖则到达较下面的肠道部分，从而共生微生物有可能竞争更多的复合物和不足的营养物。可能在这样的条件下ABC转运蛋白甚至比PTS更重要，包括它们在FOS和蜜三糖等寡糖的运送中表现出明显的作用。在这点上，利用宿主不能消化的营养物的能力是与结肠内有益的肠道菌群的竞争性和持久性相关的(Schell等(2002)Proc.Natl.Acad.Sci.USA 99：14422-14427)。

在测试条件下差异表达的基因的转录图谱表明，除了葡萄糖之外，所有的碳水化合物摄取系统以及它们各自的糖水解酶都受其底物的特异诱导。而且，那些可诱导基因座内的基因在有葡萄糖存在时受阻遏，并在它们的启动子-操纵子区鉴定到cre序列。依照共有序列TGNNWNCGNNWNCA(SEQ ID NO：365)(Miwa等(2000)Nucleic AcidsRes.28：1206-1210)和TGWAANCGNTNWCA(SEQ ID NO：366)(Weickert和Chambliss(1990)Proc.Natl.Acad.Sci.USA 87：6238-6242)搜寻有关推定的分解产物响应元件的差异表达基因和操纵子的启动子-操纵子区。总的来说，这些结果揭示了碳水化合物摄取和代谢在转录水平的调控，并显示可能涉及与碳分解产物抑制的全面调控系统。碳分解产物抑制(CCR)控制着碳水化合物转运和代谢中所涉及的蛋白质的转录(Miwa等(2000)Nucleic Acids Res.28：1206-1210)。分解产物抑制是广泛分布于革兰氏阳性细菌中的机制，受分解产物响应元件顺式介导(Miwa等(2000)Nucleic Acids Res.28：1206-1210；Wickert和Chambliss(1990)Proc.Natl.Acad.Sci.USA87：6238-6242)，并且受LacI家族阻遏物的反式介导，该家族负责在优选底物存在下编码非必需的糖分解产物的基因的转录阻遏(Wickert和Chambliss(1990)Proc.Natl.Hcad.Sci.USA 87：6238-6242；Viana等(2000)Mol.Microbiol.36：570-584；Muscariello等(2001)Appl.Environ.Microbiol.67：2903-2907；Warner和Lolkema(2003)Microbiol.Mol.Rev.67：475-490)。这一调控机制使得细胞可以协调利用不同的碳水化合物，主要集中于优选的能量来源上。CCR是以数种关键的酶为基础的，即HPr(ORF 639(SEQ ID NO：177)，ptsH)、EI(ORF 640(SEQ ID NO：179)，ptsI)、CcpA(ORF 431(SEQ ID NO：181)，ccpA)和HPrK/P(ORF 676(SEQ ID NO：183)，ptsK)，所有这些酶都是在嗜酸乳杆菌染色体内编码的。

碳分解产物抑制作用在乳杆菌内已有报道(Mahr等2000)。PTS的特征在于涉及PEP、EI、HPr、EIIABC的磷酸转移级联反应，从而使磷酸基最终被转移到碳水化合物底物上(Saier，2000；Warner和Lolkema，2003)。HPr是CCR的一个重要组分，它受酶I和HPrK/P的磷酸化作用的调控。当HPr在His15被磷酸化时，PTS激活，且通过PTS转运的碳水化合物被EIIABC磷酸化。相反，当HPr在Ser46处被磷酸化时，PTS机制则不发挥作用(Mijakovic等(2002)Proc.Natl.Acad.Sci.USA 99：13442-13447)。

尽管磷酸化作用级联反应显示了在蛋白质水平的调控，还有几项研究报道了ccpA和ptsHI的转录调制。在S.thermophilus中，CcpA产生是受葡萄糖诱导的(van den Bogaart等2000)。在数种细菌中，碳水化合物来源调节着ptsHI的转录水平(Luesink等1999)。相反，ccpA、ptsH、ptsI和ptsK的表达水平不随嗜酸乳杆菌内不同碳水化合物的存在而变化。这些结果是与蛋白质水平上磷酸化作用的调控一致的。有关戊糖乳杆菌(Lactobacillus pentosus)内ccpA的表达水平(Mahr等(2000)Appl.Environ.Microbiol.66：277-283)和S.thermophilus内ptsHI的转录(Cochu等(2003)Appl.Environ.Microbiol.69：5423-5432)也有相似的报道。

全面的看，微阵列结果使得研究者可以重建碳水化合物转运和分解代谢途径(图2)。尽管碳水化合物转运蛋白和水解酶的转录是受它们各自的底物特异诱导的，这些糖酵解基因还是一贯高表达的：D型乳酸脱氢酶(D-LDH，ORF 55(SEQ ID NO：241))、磷酸甘油酸变位酶(PGM，ORF 185(SEQ ID NO：243))、L型乳酸脱氢酶(L-LDH，ORF271(SEQ ID NO：245))、甘油醛3-磷酸脱氢酶(GPDH，ORF 698(SEQID NO：247))、磷酸甘油酸激酶(PGK ORF 699(SEQ ID NO：249))、葡萄糖-6-磷酸异构酶(GPI，ORF 752(SEQ ID NO：251))、2-磷酸甘油酸脱水酶(PGDH，ORF 889(SEQ ID NO：253))、磷酸果糖激酶(PFK，ORF 956(SEQ ID NO：255))、丙酮酸激酶(PK，ORF 957(SEQID NO：257))和果糖双磷酸醛缩酶(FBPA，ORF 1599(SEQ ID NO：259))。甘油-3-磷酸ABC转运蛋白(ORF 1641(SEQ ID NO：261))也是持续高表达的基因之一。协调碳水化合物摄取有可能从肠道环境中撤消能量来源并使其它细菌不能接近这些资源。从而，嗜酸乳杆菌可能很好的与其它共生微生物竞争营养成分。

总之，就不同碳水化合物存在时的表达图谱而言，有多种碳水化合物摄取系统被识别并鉴定，包括PTS、ABC和GHP转运蛋白。摄取和分解代谢的机制是在转录水平被高度调控的，表明嗜酸乳杆菌转录组是灵活的、动态的并适于有效的利用碳水化合物。差异基因表达显示存在一个总的碳分解产物抑制调控网络。调控蛋白一贯高表达，表明调控是在蛋白质水平，而非转录水平。总之，嗜酸乳杆菌看起来能有效的改变其代谢机理以变动小肠营养复合物环境中可利用的碳水化合物来源。具体而言，FOS和蜜三糖摄取中所涉及的MsmEFG家族的ABC转运蛋白有可能在嗜酸乳杆菌与肠道共生物竞争宿主人所未消化的复合糖的能力中起重要作用。

最后，此资料为了解饮食中未消化的化合物如何影响肠道微生物平衡提供了新的视点。此研究是适于暴露在不断变化的生长培养基中的细菌的比较转录分析模型。

实施例7：多药转运蛋白

诸如嗜酸乳杆菌等微生物已发展出抵抗抗生素和其它有害化合物毒性作用的各种方法。这些手段之一涉及促进药物主动流出的转运蛋白，由此对于特殊的微生物而言药物抗性可能受到影响。

有两种主要的多药物转运蛋白：利用质子或钠离子的跨膜电化学梯度驱使药物从细胞中被挤出去的次级多药物转运蛋白；利用ATP水解的自由能将药物泵出细胞的ATP结合盒(ABC)式多药物转运蛋白。

次级多药物转运蛋白被细分成几个截然不同的转运蛋白家族：主要的促进蛋白超家族(MFS，Pao等(1998)Microbiol.Mol.Biol.Rev.62：1-34)，小型多药抗性(small multidrug resistance，SMR)家族(Paulsen等(1996)Mol.Microbiol.19：1167-1175)、抵抗生瘤细胞分裂(resistance-nodulation-cell division，RND)家族(Saier等(1994)Mol.Microbiol.11：841-847)以及多药和毒性化合物排出(multidrug and toxic compound extrusion，MATE)家族(Brown等(1999)Mol.Microbiol.31：394-395)。这些家族不仅与多药输出相关，而且还包括其它质子运动力依赖性转运过程或其它功能所涉及的蛋白质。

MFS膜转运蛋白涉及各种底物的共转运、逆向转运或单向转运，其中包括抗生素(Marger和Saier(1993)Trends Biochem.Sci.18：13-20)。对令生物体具有抗性的药物流出蛋白的保守基元进行的分析和序列比对表明这些蛋白质可分开成两个单独的类群，具有12个或14个跨膜片断(Paulsen和Skurry(1993)Gene 124：1-11)。NCFM基因组包含编码造成多药物转运的MFS转运蛋白的数种基因。其中包括ORFs 552(SEQ ID NO：77)、566(SEQ ID NO：79)、567(SEQNO：81)、1446(SEQ ID NO：85)、1471(SEQ ID NO：87)、1621(SEQ ID NO：91)、1853(SEQ ID NO：93)、1854(SEQ ID NO：321)、164(SEQ ID NO：309)、251-253(SEQ ID NOs：311，313，315)和1062(SEQ ID NO：317)中编码的转运蛋白。

ABC转运蛋白需要4个不同的结构域：两个疏水膜结构域，其中每个通常由6个推定的跨膜α螺旋组成，以及两个亲水核苷酸结合结构域(NBD)，包括Walker A和B基元(Walker等(1982)EMBO J.1：945-951)和ABC信号(Hyde等(1990)Nature 346：362-365)。各个结构域可作为分离的蛋白质表达或可以多种方式融入多结构域多肽中(Faith和Kolter(1993)Microbiol.Rev.57：995-1017；Higgens(1992)Annu.Rev.Cell Bio.8：67-113；Hyde等(1990)Nature 346：362-365)。NCFM基因组中与来自乳酸乳球菌的ABC多药物转运蛋白ImrA以及来自短乳杆菌的多药转运蛋白horA相似的多药物ABC转运蛋白由ORF 597(SEQ ID NO：320)编码。

本说明书中所提及的所有出版物、专利和专利申请都指示本发明所属领域内的技术熟练人员的水平。所有的出版物、专利和专利申请均在此收编作为参考，其范围与各个单独的出版物或专利申请被明确和个别地指示收编作为参考一样。

尽管前述发明已经以图解和实施例的方式在某些细节上进行了描述以便于清楚的理解，但显而易见可在所附的权利要求范围内进行某些改变和修饰。

Claims

1.选自下组的分离的核酸：

a)包含下述核苷酸序列的核酸：SEQ ID NO：289，1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361和/或363，可以是任何组合，或其互补链；

b)包含与下述核苷酸序列具有至少90％序列同一性的核苷酸序列的核酸：SEQ ID NO：289，1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361和/或363，可以是任何组合，或其互补链；

c)包含下述核苷酸序列的片段的核酸：SEQ ID NO：289，1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361和/或363，可以是任何组合，或其互补链；

d)编码包含下述氨基酸序列的多肽的核酸：SEQ ID NO：290，2，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88，90，92，94，96，98，100，102，104，106，108，110，112，114，116，118，120，122，124，126，128，130，132，134，136，138，140，142，144，146，148，150，152，154，156，158，160，162，164，166，168，170，172，174，178，180，182，184，186，188，190，192，194，196，198，200，202，204，206，208，210，212，214，216，218，220，222，224，226，228，230，232，234，236，238，240，242，244，246，248，250，252，254，256，258，260，262，264，266，268，270，272，274，276，278，280，282，284，286，288，292，294，296，298，300，302，304，306，308，310，312，314，316，318，320，322，324，326，328，330，332，334，336，338，340，342，344，346，348，350，352，354，356，358，360，362和/或364，可以是任何组合；

e)包含编码与下述氨基酸序列具有至少90％氨基酸序列同一性的多肽的核苷酸序列的核酸：SEQ ID NO：290，2，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88，90，92，94，96，98，100，102，104，106，108，110，112，114，116，118，120，122，124，126，128，130，132，134，136，138，140，142，144，146，148，150，152，154，156，158，160，162，164，166，168，170，172，174，178，180，182，184，186，188，190，192，194，196，198，200，202，204，206，208，210，212，214，216，218，220，222，224，226，228，230，232，234，236，238，240，242，244，246，248，250，252，254，256，258，260，262，264，266，268，270，272，274，276，278，280，282，284，286，288，292，294，296，298，300，302，304，306，308，310，312，314，316，318，320，322，324，326，328，330，332，334，336，338，340，342，344，346，348，350，352，354，356，358，360，362和/或364，可以是任何组合；和

f)在严格条件下与a-e中任何核酸杂交的核酸。

2.包含权利要求1的核酸的载体。

3.权利要求2的载体，进一步包含编码异源多肽的核酸。

4.包含权利要求2的载体的微生物。

5.一种分离的多肽，选自下组：

a)包含下述氨基酸序列的多肽：SEQ ID NO：290，2，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88，90，92，94，96，98，100，102，104，106，108，110，112，114，116，118，120，122，124，126，128，130，132，134，136，138，140，142，144，146，148，150，152，154，156，158，160，162，164，166，168，170，172，174，178，180，182，184，186，188，190，192，194，196，198，200，202，204，206，208，210，212，214，216，218，220，222，224，226，228，230，232，234，236，238，240，242，244，246，248，250，252，254，256，258，260，262，264，266，268，270，272，274，276，278，280，282，284，286，288，292，294，296，298，300，302，304，306，308，310，312，314，316，318，320，322，324，326，328，330，332，334，336，338，340，342，344，346，348，350，352，354，356，358，360，362和/或364，可以是任何组合；

b)包含下述氨基酸序列的片段的多肽：SEQ ID NO：290，2，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88，90，92，94，96，98，100，102，104，106，108，110，112，114，116，118，120，122，124，126，128，130，132，134，136，138，140，142，144，146，148，150，152，154，156，158，160，162，164，166，168，170，172，174，178，180，182，184，186，188，190，192，194，196，198，200，202，204，206，208，210，212，214，216，218，220，222，224，226，228，230，232，234，236，238，240，242，244，246，248，250，252，254，256，258，260，262，264，266，268，270，272，274，276，278，280，282，284，286，288，292，294，296，298，300，302，304，306，308，310，312，314，316，318，320，322，324，326，328，330，332，334，336，338，340，342，344，346，348，350，352，354，356，358，360，362和/或364，可以是任何组合；

c)包含与下述氨基酸序列具有至少90％序列同一性的氨基酸序列的多肽：SEQ ID NO：290，2，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，40，42，44，46，48，50，52，54，56，58，60，62，64，66，68，70，72，74，76，78，80，82，84，86，88，90，92，94，96，98，100，102，104，106，108，110，112，114，116，118，120，122，124，126，128，130，132，134，136，138，140，142，144，146，148，150，152，154，156，158，160，162，164，166，168，170，172，174，178，180，182，184，186，188，190，192，194，196，198，200，202，204，206，208，210，212，214，216，218，220，222，224，226，228，230，232，234，236，238，240，242，244，246，248，250，252，254，256，258，260，262，264，266，268，270，272，274，276，278，280，282，284，286，288，292，294，296，298，300，302，304，306，308，310，312，314，316，318，320，322，324，326，328，330，332，334，336，338，340，342，344，346，348，350，352，354，356，358，360，362和/或364，可以是任何组合；

d)由下述核苷酸序列编码的多肽：SEQ ID NO：289，1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361和/或363，可以是任何组合，或其互补链；和

e)由与下述核苷酸序列具有至少90％序列同一性的核苷酸序列编码的多肽：SEQ ID NO：289，1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361和/或363，可以是任何组合，或其互补链，其中所述多肽保留活性。

6.权利要求5的多肽，进一步包含异源氨基酸序列。

7.与权利要求5的多肽选择性结合的抗体。

8.一种制备多肽的方法，包括在编码该多肽的核酸被表达的条件下培养权利要求4的细胞，所述多肽选自下组：

d)由与下述核苷酸序列具有至少90％序列同一性的核苷酸序列编码的多肽：SEQ ID NO：289，1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361和/或363，可以是任何组合；和

e)由下述核苷酸序列编码的多肽：SEQ ID NO：289，1，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，41，43，45，47，49，51，53，55，57，59，61，63，65，67，69，71，73，75，77，79，81，83，85，87，89，91，93，95，97，99，101，103，105，107，109，111，113，115，117，119，121，123，125，127，129，131，133，135，137，139，141，143，145，147，149，151，153，155，157，159，161，163，165，167，169，171，173，177，179，181，183，185，187，189，191，193，195，197，199，201，203，205，207，209，211，213，215，217，219，221，223，225，227，229，231，233，235，237，239，241，243，245，247，249，251，253，255，257，259，261，263，265，267，269，271，273，275，277，279，281，283，285，287，291，293，295，297，299，301，303，305，307，309，311，313，315，317，319，321，323，325，327，329，331，333，335，337，339，341，343，345，347，349，351，353，355，357，359，361和/或363，可以是任何组合。

9.一种改变微生物将碳水化合物转运进入或转运出细胞的能力的方法，包括将权利要求1的核酸引入所述生物体。

10.一种改变微生物积聚碳水化合物的能力的方法，包括将权利要求1的核酸引入所述生物体。

11.一种改变微生物利用碳水化合物作为能源的能力的方法，包括将权利要求1的核酸引入所述微生物。

12.一种改变由微生物发酵的食品的风味的方法，包括将权利要求1的核酸引入所述微生物。

13.一种改变由微生物发酵的食品的质地的方法，包括将权利要求1的核酸引入所述微生物。

14.一种改变微生物产生修饰的碳水化合物的能力的方法，包括将权利要求1的核酸引入所述微生物。

15.一种改变微生物经受食品加工和储藏条件的能力的方法，包括将权利要求1的核酸引入所述微生物。

16.一种改变微生物在GI道存活的能力的方法，包括将权利要求1的核酸引入所述微生物。

17.一种改变微生物产生碳水化合物的能力的方法，包括将权利要求1的核酸引入所述微生物。

18.一种改变微生物将药物转运进入或转运出细胞的能力的方法，包括将权利要求1的核酸引入所述微生物。

19.包含核酸构建体的植物细胞，该核酸构建体包含权利要求1的核酸。

20.由权利要求19的植物细胞产生的植物。