CN110914445A - 工程化糖基转移酶和甜菊醇糖苷葡糖基化方法 - Google Patents

工程化糖基转移酶和甜菊醇糖苷葡糖基化方法 Download PDF

Info

Publication number
CN110914445A
CN110914445A CN201880024548.6A CN201880024548A CN110914445A CN 110914445 A CN110914445 A CN 110914445A CN 201880024548 A CN201880024548 A CN 201880024548A CN 110914445 A CN110914445 A CN 110914445A
Authority
CN
China
Prior art keywords
engineered
positions
glycosyltransferase
polypeptide sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880024548.6A
Other languages
English (en)
Inventor
乔纳森·弗罗姆
斯蒂芬妮·苏·加兰妮
尼基·德拉斯
杰克·梁
刘至中
大卫·恩特韦斯特尔
考特尼·黛安娜·莫菲特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taylor Solutions Usa LLC
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of CN110914445A publication Critical patent/CN110914445A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • C12N9/1062Sucrose synthase (2.4.1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01013Sucrose synthase (2.4.1.13)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明提供了工程化糖基转移酶(GT)酶、具有GT活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明提供了工程化蔗糖合酶(SuS)酶、具有SuS活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了包含GT酶的组合物和使用工程化GT酶来制备具有β‑葡萄糖键的产物的方法。本发明还提供了用于产生莱鲍迪苷(例如莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和莱鲍迪苷D)的组合物和方法。本发明还提供了包含SuS酶的组合物及使用其的方法。还提供了用于产生GT和SuS酶的方法。

Description

工程化糖基转移酶和甜菊醇糖苷葡糖基化方法
本申请要求2017年2月3日提交的美国临时专利申请序号62/454,417和2017年3月30日提交的美国临时专利申请序号62/479,262的优先权,出于所有目的,这两个专利特此通过引用以其整体并入。
发明领域
本发明提供了工程化糖基转移酶(GT)酶、具有GT活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明提供了工程化蔗糖合酶(SuS)酶、具有SuS活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了包含GT酶的组合物和使用工程化GT酶来制备具有β-葡萄糖键(linkage)的产物的方法。本发明还提供了用于产生莱鲍迪苷(rebaudioside)(例如莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和莱鲍迪苷D)的组合物和方法。本发明还提供了包含SuS酶的组合物及使用其的方法。还提供了用于产生GT和SuS酶的方法。
对序列表、表格或计算机程序的引用
序列表的正式副本作为ASCII格式的文本文件经由EFS-Web与本说明书同时提交,其文件名为“CX8-162WO3_ST25.txt”,创建日期为2018年1月24日,且大小为31,100千字节。经由EFS-Web提交的序列表是本说明书的一部分并通过引用以其整体并入本文。
发明背景
糖基转移酶(GT)是在翻译后将糖基残基从活化的核苷糖转移到单体的和聚合的受体分子(例如其他糖、蛋白、脂质和其他有机底物)的酶。因此,这些酶利用含有被取代的磷酸离去基团的活化的供体糖底物。供体糖底物(即“糖基供体”)通常被活化为核苷二磷酸糖。然而,也使用其他糖,诸如核苷单磷酸糖、脂质磷酸酯和未取代的磷酸酯(参见例如Lairson等人,Ann.Rev.Biochem.,77:25.1-25.35[2008])。基于底物和反应产物的立体化学,GT被归类为保留酶或转化酶。在其中供体的异头键的立体化学被保留(例如α至α)的反应中,GT是保留酶。在立体化学发生转化(例如α至β)的反应中,GT是转化酶。这些糖基化产物参与多种代谢途径和过程。事实上,许多二糖、寡糖和多糖的生物合成涉及多种糖基转移酶的作用。葡糖基部分的转移可以改变受体的生物活性、溶解度和细胞内的转运特性。GT已经被用于靶向合成特定化合物(例如糖缀合物和糖苷),以及产生差异糖基化的药物、生物探针或天然产物文库。在一些方法中,大规模使用GT用于糖缀合物合成需要大量糖基供体,增加了这种方法的成本。核苷酸循环系统已经被开发,以允许从释放的核苷酸重新合成糖基供体。这些再循环系统还减少了反应期间形成的核苷酸副产物的量,从而减少了由GT引起的抑制。然而,仍然需要适合于通过GT大规模产生糖缀合物的改进方法。
发明概述
本发明提供了工程化糖基转移酶(GT)酶、具有GT活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明提供了工程化蔗糖合酶(SuS)酶、具有SuS活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了包含GT酶的组合物和使用工程化GT酶来制备具有β-葡萄糖键的产物的方法。本发明还提供了用于产生莱鲍迪苷(例如莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和莱鲍迪苷D)的组合物和方法。本发明还提供了包含SuS酶的组合物及使用其的方法。还提供了用于产生GT和SuS酶的方法。
本发明提供了工程化糖基转移酶,其包含与SEQ ID NO:2具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少90%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少91%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少92%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少93%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:44、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少94%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少95%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少96%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少97%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:44、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少98%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含与SEQ ID NO:44、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088具有至少99%序列同一性的多肽。在一些另外的实施方案中,工程化糖基转移酶包含选自SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088的多肽。在一些另外的实施方案中,工程化糖基转移酶选自β-1,2-糖基转移酶和β-1,3-糖基转移酶。在一些另外的实施方案中,工程化糖基转移酶优先地使用除尿嘧啶二磷酸(uracil-diphosphate)以外的糖供体。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下表中提供的变体工程化糖基转移酶:表2.1、3.1、5.1、6.1、6.3、8.1、9.1、9.2、9.4、11.1、12.1、14.1、15.1、15.2、15.3、16.1、17.1、43.1、43.2、44.2、45.1、45.3、46.1、46.2、46.3、47.1、47.2、47.3、48.1、48.2、49.1、49.3、50.1、50.2、50.3、50.4、51.1、51.2、52.1、53.1、53.3、54.1、54.2、54.3、55.1、55.2、55.3、56.1、56.2、56.3、57.1、58.1、58.2、58.3、59.1、59.3、59.3、60.1、60.2、61.1、61.2、62.1、62.2、63.1、63.2、64.1、64.2、65.1、65.2、66.1、66.2、67.1、67.2、67.3、68.1、68.2、69.1、69.2、70.1、70.2、71.1、71.2、71.3、72.1、72.2、72.3、73.1、73.2、74.1、74.2、74.3、75.1、75.2、75.3、77.1和/或77.2。本发明提供了包含与以下序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列的工程化糖基转移酶:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、22、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974、976、978、980、982、984、986、988、990、992、994、996、998、1000、1002、1004、1006、1008、1010、1012、1014、1016、1018、1020、1022、1024、1026、1028、1030、1032、1034、1036、1038、1040、1042、1044、1046、1048、1050、1052、1054、1056、1058、1060、1062、1064、1066、1068、1070、1072、1074、1076、1078、1290、1292、1294、2596、2598、2600、2602、2604、2606、2608、2610、2612、2614、2616、2618、2620、2622、2624、2626、2628、2630、2632、2634、2636、2638、2640、2642、2644、2646、2648、2650、2652、2654、2656、2658、2660、2662、2664、2666、2668、2670、2672、2674、2676、2678、2680、2682、2684、2686、2688、2690、2692、2694、2696、2698、2700、2702、2704、2706、2708、2710、2712、2714、2716、2718、2720、2722、2724、2726、2728、2730、2732、2734、2736、2738、2740、2742、2744、2746、2748、2750、2752、2754、2756、2758、2760、2762、2764、2766、2768、2770、2772、2774、2776、2778、2780、2782、2784、2786、2788、2790、2792、2794、2796、2798、2800、2802、2804、2806、2808、2810、2812、2814、2816、2818、2820、2822、2824、2826、2828、2830、2832、2834、2836、2838、2840、2842、2844、2846、2848、2850、2852、2854、2856、2858、2860、2862、2864、2866、2868、2870、2872、2874、2876、2878、2880、2882、2884、2886、2888、2890、2892、2894、2896、2898、2900、2902、2904、2906、2908、2910、2912、2914、2916、2918、2920、2922、2924、2926、2928、2830、2932、2934、2936、2938、2940、2942、2944、2946、2948、2950、2952、2954、2956、2958、2960、2962、2964、2966、2968、2970、2972、2974、2976、2978、2980、2982、2984、2986、2988、2990、2992、2994、2996、2998、3000、3002、3004、3006、3008、3010、3012、3014、3016、3018、3020、3022、3024、3026、3028、3030、3032、3034、3036、3038、3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062、3064、3066、3068、3070、3072、3074、3076、3078、3080、3082、3084、3086、3088、3090、3092、3094、3096、3098、3100、3102、3104、3106、3108、3110、3112、3114、3116、3118、3120、3122、3124、3126、3128、3130、3132、3134、3136、3138、3140、3142、3144、3146、3148、3150、3152、3154、3156、3158、3160、3162、3164、3166、3168、3170、3172、3174、3176、3178、3180、3182、3184、3186、3188、3190、3192、3194、3196、3198、3200、3202、3204、3206、3208、3210、3212、3214、3216、3218、3220、3222、3224、3226、3228、3230、3232、3234、3236、3238、3240、3242、3244、3246、3248、3250、3252、3254、3256、3258、3260、3262、3264、3266、3268、3270、3272、3274、3276、3278、3280、3282、3284、3286、3288、3290、3292、3294、3296、3298、3300、3302、3304、3306、3308、3310、3312、3314、3316、3318、3320、3322、3324、3326、3328、3330、3332、3334、3336、3338、3340、3342、3344、3346、3348、3350、3352、3354、3356、3358、3360、3362、3364、3366、3368、3370、3372、3374、3376、3378、3380、3382、3384、3386、3388、3390、3392、3394、3396、3398、3400、3402、3404、3406、3408、3410、3412、3414、3416、3418、3420、3422、3424、3426、3428、3430、3432、3434、3436、3438、3440、3442、3444、3446、3448、3450、3452、3454、3456、3458、3460、3462、3464、3466、3468、3470、3472、3474、3476、3478、3480、3482、3484、3486、3488、3490、3492、3494、3496、3498、3500、3502、3504、3506、3508、3510、3512、3514、3516、3518、3520、3522、3524、3526、3528、3530、3532、3534、3536、3538、3540、3542、3544、3546、3548、3550、3552、3554、3556、3558、3560、3562、3564、3566、3568、3570、3572、3574、3576、3578、3580、3582、3584、3586、3588、3590、3592、3594、3596、3598、3600、3602、3604、3606、3608、3610、3612、3614、3616、3618、3620、3622、3624、3626、3628、3630、3632、3634、3636、3638、3640、3642、3644、3646、3648、3650、3652、3654、3656、3658、3660、3662、3664、3666、3668、3670、3672、3674、3676、3678、3680、3682、3684、3686、3688、3690、3692、3694、3696、3698、3700、3702、3704、3706、3708、3710、3712、3714、3716、3718、3720、3722、3724、3726、3728、3730、3732、3734、3736、3738、3740、3742、3744、3746、3748、3750、3752、3754、3756、3758、3760、3762、3764、3766、3768、3770、3772、3774、3776、3778、3780、3782、3784、3786、3788、3790、3792、3794、3796、3798、3800、3802、3804、3806、3808、3810、3812、3814、3816、3818、3820、3822、3824、3826、3828、3830、3832、3834、3836、3838、3840、3842、3844、3846、3848、3850、3852、3854、3856、3858、3860、3862、3864、3866、3868、3870、3872、3874、3876、3878、3880、3882、3884、3886、3888、3890、3892、3894、3896、3898、3900、3902、3904、3906、3908、3910、3912、3914、3916、3918、3920、3922、3924、3926、3928、3930、3932、3934、3936、3938、3940、3942、3944、3946、3948、3950、3952、3954、3956、3958、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020、4022、4024、4026、4028、4030、4032、4034、4036、4038、4040、4042、4044、4046、4048、4050、4052、4054、4056、4058、4060、4062、4064、4066、4068、4070、4072、4074、4076、4078、4080、4082、4084、4086、4088、4090、4092、4094、4096、4098、4100、4102、4104、4106、4108、4110、4112、4114、4116、4118、4120、4122、4124、4126、4128、4130、4132、4134、4136、4138、4140、4142、4144、4146、4148、4150、4152、4154、4156、4158、4160、4162、4164、4166、4168、4170、4172、4174、4176、4178、4180、4182、4184、4186、4188、4190、4192、4194、4196、4198、4200、4202、4204、4206、4208、4210、4212、4214、4216、4218、4220、4222、4224、4226、4228、4230、4232、4234、4236、4238、4240、4242、4244、4246、4248、4250、4252、4254、4256、4258、4260、4262、4264、4266、4268、4270、4272、4274、4276、4278、4280、4282、4284、4286、4288、4290、4292、4294、4296、4298、4300、4302、4304、4306、4308、4310、4312、4314、4316、4318、4320、4322、4324、4326、4328、4330、4332、4334、4336、4338、4340、4342、4344、4346、4348、4350、4352、4354、4356、4358、4360、4362、4364、4366、4368、4370、4372、4374、4376、4378、4380、4382、4384、4386、4388、4390、4392、4394、4396、4398、4400、4402、4404、4406、4408、4410、4412、4414、4416、4418、4420、4422、4424、4426、4428、4430、4432、4434、4436、4438、4440、4442、4444、4446、4448、4450、4452、4454、4456、4458、4460、4462、4464、4466、4468、4470、4472、4474、4476、4478、4480、4482、4484、4486、4488、4490、4492、4494、4496、4498、4500、4502、4504、4506、4508、4510、4512、4514、4516、4518、4520、4522、4524、4526、4528、4530、4532、4534、4536、4538、4540、4542、4544、4546、4548、4550、4552、4554、4556、4558、4560、4562、4564、4566、4568、4570、4572、4574、4576、4578、4580、4582、4584、4586、4588、4590、4592、4594、4596、4598、4600、4602、4604、4606、4608、4610、4612、4614、4616、4618、4620、4622、4624、4626、4628、4630、4632、4634、4636、4638、4640、4642、4644、4646、4648、4650、4652、4654、4656、4658、4660、4662、4664、4666、4668、4670、4672、4674、4676、4678、4680、4682、4684、4686、4688、4690、4692、4694、4696、4698、4700、4702、4704、4706、4708、4710、4712、4714、4716、4718、4720、4722、4724、4726、4728、4730、4732、4734、4736、4738、4740、4742、4744、4746、4748、4750、4752、4754、4756、4758、4760、4762、4764、4766、4768、4770、4772、4774、4776、4778、4780、4782、4784、4786、4788、4790、4792、4794、4796、4798、4800、4902、4804、4806、4808、4810、4812、4814、4816、4818、4820、4822、4824、4826、4828、4830、4832、4834、4836、4838、4840、4842、4844、4846、4848、4850、4852、4854、4856、4858、4860、4862、4864、4866、4868、4870、4872、4874、4876、4878、4880、4882、4884、4886、4888、4890、4892、4894、4896、4898、4900、4902、4904、4906、4908、4910、4912、4914、4916、4918、4920、4922、4924、4926、4928、4930、4932、4934、4936、4938、4940、4942、4944、4946、4948、4950、4952、4954、4956、4958、4960、4962、4964、4966、4968、4970、4972、4974、4976、4978、4980、4982、4984、4986、4988、4990、4992、4994、4996、4998、5000、5002、5004、5006、5008、5010、5012、5014、5016、5018、5020、5022、5024、5026、5028、5030、5032、5034、5036、5038、5040、5042、5044、5046、5048、5050、5052、5054、5056、5058、5060、5062、5064、5066、5068、5070、5072、5074、5076、5078、5080、5082、5084、5086、5088、5090、5092、5094、5096、5098、5100、5102、5104、5106、5108、5110、5112、5114、5116、5118、5120、5122、5124、5126、5128、5130、5132、5134、5136、5138、5140、5142、5144、5146、5148、5150、5152、5154、5156、5158、5160、5162、5164、5166、5168、5170、5172、5174、5176、5178、5180、5182、5184、5186、5188、5190、5192、5194、5196、5198、5200、5202、5204、5206、5208、5210、5212、5214、5216、5218、5220、5222、5224、5226、5228、5230、5232、5234、5236、5238、5240、5242、5244、5246、5248、5250、5252、5254、5256、5258、5260、5262、5264、5266、5268、5270、5272、5274、5276、5278、5280、5282、5284、5286、5288、5290、5292、5294、5296、5298、5300、5302、5304、5306、5308、5310、5312、5314、5316、5318、5320、5322、5324、5326、5328、5330、5332、5334、5336、5338、5340、5342、5344、5346、5348、5350、5352、5354、5356、5358、5360、5362、5364、5366、5368、5370、5372、5374、5376、5378、5380、5382、5384、5386、5388、5390、5392、5394、5396、5398、5400、5402、5404、5406、5408、5410、5412、5414、5416、5418、5420、5422、5424、5426、5428、5430、5432、5434、5436、5438、5440、5442、5444、5446、5448、5450、5452、5454、5456、5458、5460、5462、5464、5466、5468、5470、5472、5474、5476、5478、5480、5482、5484、5486、5488、5490、5492、5494、5496、5498、5500、5502、5504、5506、5508、5510、5512、5514、5516、5518、5520、5522、5524、5526、5528、5530、5532、5534、5536、5538、5540、5542、5544、5546、5548、5550、5552、5554、5556、5558、5560、5562、5564、5566、5568、5570、5572、5574、5576、5578、5580、5582、5584、5586、5588、5590、5592、5594、5596、5598、5600、5602、5604、5606、5608、5610、5612、5614、5616、5618、5620、5622、5624、5626、5628、5630、5632、5634、5636、5638、5640、5642、5644、5646、5648、5650、5652、5654、5656、5658、5660、5662、5664、5666、5668、5670、5672、5674、5676、5678、5680、5682、5684、5686、5688、5690、5692、5694、5696、5698、5700、5702、5704、5706、5708、5710、5712、5714、5716、5718、5720、5722、5724、5726、5728、5730、5732、5734、5736、5738、5740、5742、5744、5746、5748、5750、5752、5754、5756、5758、5760、5762、5764、5766、5768、5770、5772、5774、5776、5778、5780、5782、5784、5786、5788、5790、5792、5794、5796、5798、5800、5802、5804、5806、5808、5810、5812、5814、5816、5818、5820、5822、5824、5826、5828、5830、5832、5834、5836、5838、5840、5842、5844、5846、5848、5850、5852、5854、5856、5858、5860、5862、5864、5866、5868、5870、5872、5874、5876、5878、5880、5882、5884、5886、5888、5890、5892、5894、5896、5898、5900、5902、5904、5906、5908、5910、5912、5914、5916、5918、5920、5922、5924、5926、5928、5930、5932、5934、5936、5938、5940、5942、5944、5946、5948、5950、5952、5954、5956、5958、5960、5962、5964、5966、5968、5970、5972、5974、5976、5978、5980、5982、5984、5986、5988、5990、5992、5994、5996、5998、6000、6002、6004、6006、6008、6010、6012、6014、6016、6018、6020、6022、6024、6026、6028、6030、6032、6034、6036、6038、6040、6042、6044、6046、6048、6050、6052、6054、6056、6058、6060、6062、6064、6066、6068、6070、6072、6074、6076、6078、6080、6082、6084、6086、6088、6090、6092、6094、6096、6098、6100、6102、6104、6106、6108、6110、6112、6114、6116、6118、6120、6122、6124、6126、6128、6130、6132、6134、6136、6138、6140、6142、6144、6146、6148、6150、6152、6154、6156、6158、6160、6162、6164、6166、6168、6170、6172、6174、6176、6178、6180、6182、6184、6186、6188、6190、6192、6194、6196、6198、6200、6202、6204、6206、6208、6210、6212、6214、6216、6218、6220、6222、6224、6226、6228、6230、6232、6234、6236、6238、6240、6242、6244、6246、6248、6250、6252、6254、6256、6258、6260、6262、6264、6266、6268、6270、6272、6274、6276、6278、6280、6282、6284、6286、6288、6290、6292、6294、6296、6298、6300、6302、6304、6306、6308、6310、6312、6314、6316、6318、6320、6322、6324、6326、6328、6330、6332、6334、6336、6338、6340、6342、6344、6346、6348、6350、6352、6354、6356、6358、6360、6362、6364、6366、6368、6370、6372、6374、6376、6378、6380、6382、6384、6386、6388、6390、6392、6394、6396、6398、6400、6402、6404、6406、6408、6410、6412、6414、6416、6418、6420、6422、6424、6426、6428、6430、6432、6434、6436、6438、6440、6442、6444、6446、6448、6450、6452、6454、6456、6458、6460、6462、6464、6466、6468、6470、6472、6474、6476、6478、6480、6482、6484、6486、6488、6490、6492、6494、6496、6498、6500、6502、6504、6506、6508、6510、6512、6514、6516、6518、6520、6522、6524、6526、6528、6530、6532、6534、6536、6538、6540、6542、6544、6546、6548、6550、6552、6554、6556、6558、6560、6562、6564、6566、6568、6570、6572、6574、6576、6578、6580、6582、6584、6586、6588、6590、6592、6594、6596、6598、6600、6602、6604、6606、6608、6610、6612、6614、6616、6618、6620、6622、6624、6626、6628、6630、6632、6634、6636、6638、6640、6642、6644、6646、6648、6650、6652、6654、6656、6658、6660、6662、6664、6666、6668、6670、6672、6674、6676、6678、6680、6682、6684、6686、6688、6690、6692、6694、6696、6698、6700、6702、6704、6706、6708、6710、6712、6714、6716、6718、6720、6722、6724、6726、6728、6730、6732、6734、6736、6738、6740、6742、6744、6746、6748、6750、6752、6754、6756、6758、6760、6762、6764、6766、6768、6770、6772、6774、6776、6778、6780、6782、6784、6786、6788、6790、6792、6794、6796、6798、6800、6802、6804、6806、6808、6810、6812、6814、6816、6818、6820、6822、6824、6826、6828、6830、6832、6834、6836、6838、6840、6842、6844、6846、6848、6850、6852、6854、6856、6858、6860、6862、6864、6866、6868、6870、6872、6874、6876、6878、6880、6882、6884、6886、6888、6890、6892、6894、6896、6898、6900、6902、6904、6906、6908、6910、6912、6914、6916、6918、6920、6922、6924、6926、6928、6930、6932、6934、6936、6938、6940、6942、6944、6946、6948、6950、6952、6954、6956、6958、6960、6962、6964、6966、6968、6970、6972、6974、6976、6978、6980、6982、6984、6986、6988、6990、6992、6994、6996、6998、7000、7002、7004、7006、7008、7010、7012、7014、7016、7018、7020、7022、7024、7026、7028、7030、7032、7034、7036、7038、7040、7042、7044、7046、7048、7050、7052、7054、7056、7058、7060、7062、7064、7066、7068、7070、7072、7074、7076、7078、7080、7082、7084、7086、7088、7090、7092、7094、7096、7098、7100、7102、7104、7106、7108、7110、7112、7114、7116、7118、7120、7122、7124、7126、7128、7130、7132、7134、7136、7138、7140、7142、7144、7146、7148、7150、7152、7154、7156、7158、7160、7162、7164、7166、7168、7170、7172、7174、7176、7178、7180、7182、7184、7186、7188、7190、7192、7194、7196、7198、7200、7202、7204、7206、7208、7210、7212、7214、7216、7218、7220、7222、7224、7226、7228、7230、7232、7234、7236、7238、7240、7242、7244、7246、7248、7250、7252、7254、7256、7258、7260、7262、7264、7266、7268、7270、7272、7274、7276、7278、7280、7282、7284、7286、7288、7290、7292、7294、7296、7298、7300、7302、7304、7306、7308、7310、7312、7314、7316、7318、7320、7322、7324、7326、7328、7330、7332、7334、7336、7338、7340、7342、7344、7346、7348、7350、7352、7354、7356、7358、7360、7362、7364、7366、7368、7370、7372、7374、7376、7378、7380、7382、7384、7386、7388、7390、7392、7394、7396、7398、7400、7402、7404、7406、7408、7410、7412、7414、7416、7418、7420、7422、7424、7426、7428、7430、7432、7434、7436、7766、7768、7770、7772、7774、7776、7778、7780、7782、7784、7786、7788、7790、7792、7794、7796、7798、7800、7812、7814、7816、7818、7820、7822、7824、7826、7828、7830、7832、7834、7836、7838、7840、7842、7844、7846、7848、7850、7852、7854、7856、7858、7860、7862、7864、7866、7868、7870、7872、7874、7876、7878、7880、7882、7884、7886、7888、7890、7892、7894、7896、7898、7900、7902、7904、7906、7908、7910、7912、7914、7916、7918、7920、7922、7924、7926、7928、7930、7932、7934、7936、7938、7940、7942、7944、7946、7948、7950、7952、7954、7956、7958、7960、7962、7964、7966、7968、7970、7972、7974、7976、7978、7980、7982、7984、7986、7988、7990、7992、7994、7996、7998、8000、8002、8004、8006、8008、8010、8012、8014、8016、8018、8020、8022、8024、8026、8028、8030、8032、8034、8036、8038、8040、8042、8044、8046、8048、8050、8052、8054、8056、8058、8060、8062、8064、8066、8068、8070、8072、8074、8076、8078、8080、8082、8084、8086、8088、8090、8092、8094、8096、8098、8100、8102、8104、8106、8108、8110、8112、8114、8116、8118、8120、8122、8124、8126、8128、8130、8132、8134、8136、8138、8140、8142、8144、8146、8148、8150、8152、8154、8156、8158、8160、8162、8164、8166、8168、8170、8172、8174、8176、8178、8180、8182、8184、8186、8188、8190、8192、8194、8196、8198、8200、8202、8204、8206、8208、8210、8212、8214、8216、8218、8220、8222、8224、8226、8228、8230、8232、8234、8236、8238、8240、8242、8244、8246、8248、8250、8252、8254、8256、8258、8260、8262、8264、8266、8268、8270、8272、8274、8276、8278、8280、8282、8284、8286、8288、8290、8292、8294、8296、8298、8300、8302、8304、8306、8308、8310、8312、8314、8316、8318、8320、8322、8324、8326、8328、8330、8332、8334、8336、8338、8340、8342、8344、8346、8348、8350、8352、8354、8356、8358、8360、8362、8364、8366、8368、8482、8484、8486、8488、8490、8492、8494、8496、8498、8500、8502、8504、8506、8508、8510、8512、8514、8516、8518、8520、8522、8524、8526、8528、8530、8532、8534、8536、8538、8540、8542、8544、8546、8548、8550、8552、8554、8556、8558、8560、8562、8564、8566、8568、8570、8572、8574、8576、8578、8580、8582、8584、8586、8588、8590、8592、8594、8596、8598、8600、8602、8604、8606、8608、8610、8612、8614、8616、8618、8620、8622、8624、8626、8628、8630、8632、8634、8636、8638、8640、8642、8644、8646、8648、8650、8652、8654、8656、8658、8660、8662、8664、8666、8668、8670、8672、8674、8676、8678、8680、8682、8684、8686、8688、8690、8692、8694、8696、8698、8700、8702、8704、8706、8708、8710、8712、8714、8716、8718、8720、8722、8724、8726、8728、8730、8732、8734、8736、8738、8740、8742、8744、8746、8748、8750、8752、8754、8756、8758、8760、8762、8764、8766、8768、8770、8772、8774、8776、8778、8780、8782、8784、8786、8788、8790、8792、8794、8796、9108、9110、9112、9114、9116、9118、9120、9122、9124、9126、9128、9130、9132、9134、9136、9138、9140、9142、9144、9146、9148、9150、9152、9154、9156、9158、9160、9162、9164、9166、9168、9170、9172、9174、9176、9178、9180、9182、9184、9186、9188、9190、9192、9194、9196、9198、9200、9202、9204、9206、9208、9210、9212、9214、9216、9218、9220、9222、9224、9226、9228、9230、9232、9234、9236、9238和/或9240。
在一些另外的实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:10、10/309、262、278/284/311/339/360、283、307、309、339/361、344/361和361,其中所述位置参照SEQ ID NO:4来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:10-/309R、262K、262L、278L/284I/311G/339A/360G、283T、307V、309L/N/R/S、339A/361G、344I/361G和361G,其中所述位置参照SEQ ID NO:4来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:R10-/V309R、R262K、R262L、Y278L/T284I/R311G/V339A/N360G、S283T、L307V、V309L/N/R/S、V339A/S361G、V344I/S361G和S361G,其中所述位置参照SEQ ID NO:4来编号。在又一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28和/或30。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ IDNO:6、8、10、12、14、16、18、20、22、24、26、28和/或30。在又一些另外的实施方案中,工程化糖基转移酶的多肽序列包含SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28和/或30。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:112/172/283/318、112/261/318、112/282/283/431、137/283、137/283/431、163/318、261/283/306/337、261/283/337、261/337、269/318、282/283、282/283/431、283、283/306/308/360、283/306/337/426、283/318/337/360、283/360、318、360和431,其中所述位置参照SEQ ID NO:8来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:112S/172S/283Q/318E、112S/261S/318E、112S/282T/283Q/431E、137K/283Q、137K/283Q/431E、163K/318E、261S/283Q/306V/337F、261S/283Q/337F、261S/337S、269T/318E、282T/283Q、282T/283Q/431E、283Q、283Q/306V/308S/360G、283Q/306V/337S/426V、283Q/318E/337S/360G、283Q/360G、318E、360G和431E,其中所述位置参照SEQ ID NO:8来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:E112S/T172S/T283Q/T318E、E112S/R261S/T318E、E112S/S282T/T283Q/Q431E、N137K/T283Q、N137K/T283Q/Q431E、L163K/T318E、R261S/T283Q/L306V/W337F、R261S/T283Q/W337F、R261S/W337S、Q269T/T318E、S282T/T283Q、S282T/T283Q/Q431E、T283Q、T283Q/L306V/R308S/S360G、T283Q/L306V/W337S/A426V、T283Q/T318E/W337S/S360G、T283Q/S360G、T318E、S360G和Q431E,其中所述位置参照SEQ ID NO:8来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68和/或70。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68和/或70。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含SEQ ID NO:32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68和/或70。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:4、6、22、64、74、84、87、97、106、110、112、137、139、154、159、169、179、191、195、198、199、207、233、259、261、262、306、347、356、396、417、421、427和435,其中所述位置参照SEQ ID NO:32来编号。在又一些另外的实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:4P、6P、22A/L/H/P、64P、74W、84A/G、87A/H、97S、106D/G/S/T、110S、112A/P、137G、139P、154A/L/Q/V、159M/R、169T、179V、191R、195G、198M/S/V、199A/D/G/K/Q/S、207L、233R、259Q、261A/H/P/W、262G、306V、347D、356G、396R、417A/R/P、421V、427A和435Q/R,其中所述位置参照SEQ ID NO:32来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:K4P、E6P、Q22A/L/H/P、F64P、R74W、L84A/G、M87A/H、A97S、L106D/G/S/T、A110S、E112A/P、N137G、R139P、H154A/L/Q/V、Q159M/R、D169T、S179V、S191R、N195G、I198M/S/V、L199A/D/G/K/Q/S、I207L、I233R、H259Q、R261A/H/P/W、T262G、L306V、G347D、S356G、Y396R、E417A/R/P、Y421V、R427A和V435Q/R,其中所述位置参照SEQ IDNO:32来编号。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:22/84/87/154/198/199/356、22/84/87/154/198/199/306/356、22/84/87/154/199/306/356、22/84/87/154/356、22/84/87/154/198/199/306/356、22/84/87/154/199/306/356、22/84/87/198/199/306/356、22/84/87/198/199/356、22/84/87/198/199/306/356、22/84/87/198/199/356、22/84/87/199/306/356、22/84/87/199/356、22/84/154/198/199/207/306、22/84/154/198/199/306、22/84/154/198/199/356、22/84/154/198/199/356、22/84/154/198/199/356、22/84/154/199/356、22/84/154/199/207、22/84/154/199/356、22/84/154/207/306/356、22/84/154/306/356、22/84/154/198/199/306/356、22/84/154/198/199、22/84/154/198/199/306/356、22/84/154/199/306/356、22/84/154/199/356、22/84/154/199/356、22/84/198/199/306/356、22/84/199/356、22/84/207/356、22/84/356、22/84/154/198/199/306/356、22/87/154/198/199/356、22/87/154/199/306/356、22/87/154/322/356、22/87/154/198/199/356、22/87/154/199/356、22/87/154/198/199/207/306/356、22/87/154/199/207/356、22/87/154/199/356、22/87/154/199/306/356、22/87/198/199/306/356、22/87/198/199/306/356、22/87/198/199/207/356、22/87/198/199/356、22/87/199/356、22/87/199/356、22/154/198/199/207/306/356、22/154/198/199/356、22/154/199/356、22/154/198/199/306/356、22/154/199/356、22/154/199/207/306/356、22/198/199/356、22/198/199/207/329/356、22/199/356、22/207/356、22/356和84/154/198/199,其中所述位置参照SEQ ID NO:32来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:22P/84G/87H/154L/198S/199A/356G、22P/84G/87H/154L/198S/199S/306V/356G、22P/84G/87H/154L/199K/306V/356G、22P/84G/87H/154L/356G、22P/84G/87H/154V/198S/199S/306V/356G、22P/84G/87H/154V/199K/306V/356G、22P/84G/87H/198S/199A/306V/356G、22P/84G/87H/198S/199K/356G、22P/84G/87H/198S/199S/306V/356G、22P/84G/87H/198S/199S/356G、22P/84G/87H/199A/306V/356G、22P/84G/87H/199S/356G、22P/84G/154L/198S/199A/207L/306V、22P/84G/154L/198S/199A/306V、22P/84G/154L/198S/199A/356G、22P/84G/154L/198S/199K/356G、22P/84G/154L/198S/199S/356G、22P/84G/154L/199A/356G、22P/84G/154L/199K/207L、22P/84G/154L/199S/356G、22P/84G/154L/207L/306V/356G、22P/84G/154L/306V/356G,22P/84G/154V/198S/199A/306V/356G、22P/84G/154V/198S/199K、22P/84G/154V/198S/199K/306V/356G、22P/84G/154V/199A/306V/356G、22P/84G/154V/199A/356G、22P/84G/154V/199S/356G、22P/84G/198S/199K/306V/356G、22P/84G/199S/356G、22P/84G/207L/356G、22P/84G/356G、22P/84V/154V/198S/199S/306V/356G、22P/87H/154L/198S/199K/356G、22P/87H/154L/199A/306V/356G、22P/87H/154L/322S/356G、22P/87H/154V/198S/199K/356G、22P/87H/154V/199S/356G、22P/87H/154V/198S/199S/207L/306V/356G、22P/87H/154V/199A/207L/356G、22P/87H/154V/199K/356G、22P/87H/154V/199S/306V/356G、22P/87H/198S/199A/306V/356G、22P/87H/198S/199K/306V/356G、22P/87H/198S/199S/207L/356G、22P/87H/198S/199K/356G、22P/87H/199A/356G、22P/87H/199K/356G、22P/154L/198S/199A/207L/306V/356G、22P/154L/198S/199A/356G、22P/154L/199A/356G、22P/154V/198S/199S/306V/356G、22P/154V/199A/356G、22P/154V/199K/207L/306V/356G、22P/198S/199A/356G、22P/198S/199K/207L/329C/356G、22P/199A/356G、22P/207L/356G、22P/356G和84G/154L/198S/199K,其中所述位置参照SEQ ID NO:32来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含至少一个突变或突变集,所述突变或突变集选自:Q22P/L84G/M87H/H154L/I198S/L199A/S356G、Q22P/L84G/M87H/H154L/I198S/L199S/L306V/S356G、Q22P/L84G/M87H/H154L/L199K/L306V/S356G、Q22P/L84G/M87H/H154L/S356G、Q22P/L84G/M87H/H154V/I198S/L199S/L306V/S356G、Q22P/L84G/M87H/H154V/L199K/L306V/S356G、Q22P/L84G/M87H/I198S/L199A/L306V/S356G、Q22P/L84G/M87H/I198S/L199K/S356G、Q22P/L84G/M87H/I198S/L199S/L306V/S356G、Q22P/L84G/M87H/I198S/L199S/S356G、Q22P/L84G/M87H/L199A/L306V/S356G、Q22P/L84G/M87H/L199S/S356G、Q22P/L84G/H154L/I198S/L199A/I207L/L306V、Q22P/L84G/H154L/I198S/L199A/L306V、Q22P/L84G/H154L/I198S/L199A/S356G、Q22P/L84G/H154L/I198S/L199K/S356G、Q22P/L84G/H154L/I198S/L199S/S356G、Q22P/L84G/H154L/L199A/S356G、Q22P/L84G/H154L/L199K/I207L、Q22P/L84G/H154L/L199S/S356G、Q22P/L84G/H154L/I207L/L306V/S356G、Q22P/L84G/H154L/L306V/S356G、Q22P/L84G/H154V/I198S/L199A/L306V/S356G、Q22P/L84G/H154V/I198S/L199K、Q22P/L84G/H154V/I198S/L199K/L306V/S356G、Q22P/L84G/H154V/L199A/L306V/S356G、Q22P/L84G/H154V/L199A/S356G、Q22P/L84G/H154V/L199S/S356G、Q22P/L84G/I198S/L199K/L306V/S356G、Q22P/L84G/L199S/S356G、Q22P/L84G/I207L/S356G、Q22P/L84G/S356G、Q22P/L84V/H154V/I198S/L199S/L306V/S356G、Q22P/M87H/H154L/I198S/L199K/S356G、Q22P/M87H/H154L/L199A/L306V/S356G、Q22P/M87H/H154L/P322S/S356G、Q22P/M87H/H154V/I198S/L199K/S356G、Q22P/M87H/H154V/L199S/S356G、Q22P/M87H/H154V/I198S/L199S/I207L/L306V/S356G、Q22P/M87H/H154V/L199A/I207L/S356G、Q22P/M87H/H154V/L199K/S356G、Q22P/M87H/H154V/L199S/L306V/S356G、Q22P/M87H/I198S/L199A/L306V/S356G、Q22P/M87H/I198S/L199K/L306V/S356G、Q22P/M87H/I198S/L199S/I207L/S356G、Q22P/M87H/I198S/L199K/S356G、Q22P/M87H/L199A/S356G、Q22P/M87H/L199K/S356G、Q22P/H154L/I198S/L199A/I207L/L306V/S356G、Q22P/H154L/I198S/L199A/S356G、Q22P/H154L/L199A/S356G、Q22P/H154V/I198S/L199S/L306V/S356G、Q22P/H154V/L199A/S356G、Q22P/H154V/L199K/I207L/L306V/S356G、Q22P/I198S/L199A/S356G、Q22P/I198S/L199K/I207L/G329C/S356G、Q22P/L199A/S356G、Q22P/I207L/S356G、Q22P/S356G和L84G/H154L/I198S/L199K,其中所述位置参照SEQ ID NO:32来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346和1290。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346和1290。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346和1290。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:64/106/109/112/131/159/233/421/427/431、64/106/109/112/417/421/427/431、64/106/109/139/179/417/421/427/431、64/106/109/233/347/427/431、64/106/112/347/417/421、64/106/139/179/233/417/427/431、64/106/417/421、64/106/431、64/106/109/112/131/179/417/427/431、64/106/109/417/421/427/431/439、64/106/112/139/159/179/204/396/417、64/106/112/159/179/417/421、64/106/204/417/421/427、64/109/112/139/159/179/417/431、64/109/112/139/417、64/109/139/233/417/421、64/109/159/179/204/233/417/421、64/109/417/421、64/109/417/421、64/139/233/417/427/431/439、64/139/347/417/421/427/431、64/417/421/431、106/109/112/131/159/179/417/421、106/109/112/131/159/204/347/417/421/427、106/109/112/204/347/421/439、106/109/112/261/417/431、106/109/112/347/427、106/109/139/427/431、106/109/417/421/427、106/112/159/204/233/417/421/427/431、106/112/233/417、106/112/396/417/421、106/139/159/233/347/417/421/427/431、106/233/421/427、106/417、106/109/139/347/417/421/427、106/109、106/109/139/233/417/421、106/109/139/417、106/109/233/427/431、106/112/159/179/204/417/421、106/112/159/179/233/417/421/427/439、106/131/179/233/421/427/431、106/139/421、106/347/417/427/431、109/112/131/159/179/439、109/112/131/159/417/421、109/112/139/179/417/427、109/112/159/179/417/421、109/112/159/417/427、109/112/179/204/233/417/421/427、109/112/179/347/417、109/112/204/233/417、109/112/204/427、109/112/233/417/431、109/112/417/421/427、109/112/417/427/431、109/131/139/179/261/396/421、109/131/204、109/139/179/417/421/427、109/139/179/417/427、109/179/233/421、109/204/417/431、109/417/421、109/417/427/431、112/131/179/204/417/421/427、112/131/179/347/417/421、112/139/179/204/233/347/427、112/159/417/421、112/417/421、131/179/233/417/427、139/233/417、159/347/417/421/431、179/417/421、233/417/421/427/431和347/417,其中所述位置参照SEQ ID NO:232来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:64P/106S/109R/112P/131P/159R/233R/421V/427L/431D、64P/106S/109R/112P/417A/421V/427A/431D、64P/106S/109R/139P/179L/417R/421V/427L/431D、64P/106S/109R/233R/347D/427A/431D、64P/106S/112P/347D/417A/421V、64P/106S/139P/179L/233R/417A/427A/431D、64P/106S/417R/421V、64P/106S/431D、64P/106T/109R/112P/131P/179L/417R/427A/431D、64P/106T/109R/417A/421V/427L/431D/439P、64P/106T/112P/139P/159R/179V/204D/396R/417A、64P/106T/112P/159R/179L/417R/421V、64P/106T/204D/417A/421V/427A、64P/109R/112P/139P/159R/179L/417R/431D、64P/109R/112P/139P/417A、64P/109R/139P/233R/417R/421V、64P/109R/159R/179V/204D/233R/417R/421V、64P/109R/417A/421V、64P/109R/417R/421V、64P/139P/233R/417R/427L/431D/439P、64P/139P/347D/417R/421V/427L/431D、64P/417R/421V/431D、106S/109R/112P/131P/159R/179L/417A/421V、106S/109R/112P/131P/159R/204D/347D/417A/421V/427L、106S/109R/112P/204D/347D/421V/439P、106S/109R/112P/261P/417R/431D、106S/109R/112P/347D/427A、106S/109R/139P/427A/431D、106S/109R/417R/421V/427L、106S/112P/159R/204D/233R/417R/421V/427A/431D、106S/112P/233R/417R、106S/112P/396R/417R/421V、106S/139P/159R/233R/347D/417R/421V/427A/431D、106S/233R/421V/427A、106S/417A、106T/109R/139P/347D/417A/421V/427A、106T/109R、106T/109R/139P/233R/417R/421V、106T/109R/139P/417R、106T/109R/233R/427A/431D、106T/112P/159R/179L/204D/417A/421V、106T/112P/159R/179V/233R/417A/421V/427L/439P、106T/131P/179L/233R/421V/427L/431D、106T/139P/421V、106T/347D/417R/427A/431D、109R/112P/131P/159R/179V/439P、109R/112P/131P/159R/417R/421V、109R/112P/139P/179V/417R/427A、109R/112P/159R/179V/417R/421V、109R/112P/159R/417R/427L、109R/112P/179V/204D/233R/417A/421V/427L、109R/112P/179V/347D/417R、109R/112P/204D/233R/417R、109R/112P/204D/427A、109R/112P/233R/417A/431D、109R/112P/417A/421V/427L、109R/112P/417A/427A/431D、109R/131P/139P/179V/261P/396R/421V、109R/131P/204D、109R/139P/179L/417R/421V/427A、109R/139P/179L/417R/427L、109R/179V/233R/421V、109R/204D/417R/431D、109R/417R/421V、109R/417R/427A/431D、112P/131P/179V/204D/417R/421V/427L、112P/131P/179L/347D/417R/421V、112P/139P/179V/204D/233R/347D/427L、112P/159R/417R/421V、112P/417R/421V、131P/179L/233R/417R/427A、139P/233R/417A、159R/347D/417A/421V/431D、179V/417R/421V、233R/417R/421V/427L/431D和347D/417R,其中所述位置参照SEQ ID NO:232来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:F64P/L106S/L109R/E112P/S131P/Q159R/I233R/Y421V/R427L/Q431D、F64P/L106S/L109R/E112P/E417A/Y421V/R427A/Q431D、F64P/L106S/L109R/R139P/S179L/E417R/Y421V/R427L/Q431D、F64P/L106S/L109R/I233R/G347D/R427A/Q431D、F64P/L106S/E112P/G347D/E417A/Y421V、F64P/L106S/R139P/S179L/I233R/E417A/R427A/Q431D、F64P/L106S/E417R/Y421V、F64P/L106S/Q431D、F64P/L106T/L109R/E112P/S131P/S179L/E417R/R427A/Q431D、F64P/L106T/L109R/E417A/Y421V/R427L/Q431D/K439P、F64P/L106T/E112P/R139P/Q159R/S179V/G204D/Y396R/E417A、F64P/L106T/E112P/Q159R/S179L/E417R/Y421V、F64P/L106T/G204D/E417A/Y421V/R427A、F64P/L109R/E112P/R139P/Q159R/S179L/E417R/Q431D、F64P/L109R/E112P/R139P/E417A、F64P/L109R/R139P/I233R/E417R/Y421V、F64P/L109R/Q159R/S179V/G204D/I233R/E417R/Y421V、F64P/L109R/E417A/Y421V、F64P/L109R/E417R/Y421V、F64P/R139P/I233R/E417R/R427L/Q431D/K439P、F64P/R139P/G347D/E417R/Y421V/R427L/Q431D、F64P/E417R/Y421V/Q431D、L106S/L109R/E112P/S131P/Q159R/S179L/E417A/Y421V、L106S/L109R/E112P/S131P/Q159R/G204D/G347D/E417A/Y421V/R427L、L106S/L109R/E112P/G204D/G347D/Y421V/K439P、L106S/L109R/E112P/R261P/E417R/Q431D、L106S/L109R/E112P/G347D/R427A、L106S/L109R/R139P/R427A/Q431D、L106S/L109R/E417R/Y421V/R427L、L106S/E112P/Q159R/G204D/I233R/E417R/Y421V/R427A/Q431D、L106S/E112P/I233R/E417R、L106S/E112P/Y396R/E417R/Y421V、L106S/R139P/Q159R/I233R/G347D/E417R/Y421V/R427A/Q431D、L106S/I233R/Y421V/R427A、L106S/E417A、L106T/L109R/R139P/G347D/E417A/Y421V/R427A、L106T/L109R、L106T/L109R/R139P/I233R/E417R/Y421V、L106T/L109R/R139P/E417R、L106T/L109R/I233R/R427A/Q431D、L106T/E112P/Q159R/S179L/G204D/E417A/Y421V、L106T/E112P/Q159R/S179V/I233R/E417A/Y421V/R427L/K439P、L106T/S131P/S179L/I233R/Y421V/R427L/Q431D、L106T/R139P/Y421V、L106T/G347D/E417R/R427A/Q431D、L109R/E112P/S131P/Q159R/S179V/K439P、L109R/E112P/S131P/Q159R/E417R/Y421V、L109R/E112P/R139P/S179V/E417R/R427A、L109R/E112P/Q159R/S179V/E417R/Y421V、L109R/E112P/Q159R/E417R/R427L、L109R/E112P/S179V/G204D/I233R/E417A/Y421V/R427L、L109R/E112P/S179V/G347D/E417R、L109R/E112P/G204D/I233R/E417R、L109R/E112P/G204D/R427A、L109R/E112P/I233R/E417A/Q431D、L109R/E112P/E417A/Y421V/R427L、L109R/E112P/E417A/R427A/Q431D、L109R/S131P/R139P/S179V/R261P/Y396R/Y421V、L109R/S131P/G204D、L109R/R139P/S179L/E417R/Y421V/R427A、L109R/R139P/S179L/E417R/R427L、L109R/S179V/I233R/Y421V、L109R/G204D/E417R/Q431D、L109R/E417R/Y421V、L109R/E417R/R427A/Q431D、E112P/S131P/S179V/G204D/E417R/Y421V/R427L、E112P/S131P/S179L/G347D/E417R/Y421V、E112P/R139P/S179V/G204D/I233R/G347D/R427L、E112P/Q159R/E417R/Y421V、E112P/E417R/Y421V、S131P/S179L/I233R/E417R/R427A、R139P/I233R/E417A、Q159R/G347D/E417A/Y421V/Q431D、S179V/E417R/Y421V、I233R/E417R/Y421V/R427L/Q431D和G347D/E417R,其中所述位置参照SEQ ID NO:232来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496和/或498。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496和/或498。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496和/或498。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:106/112/204/347/396/417、106/112/204/347/396/417/427、106/112/204/347/396/417/427/431、112/204/347/396/417/427、112/204/347/396/417/427/431和204/347/396/417/431,其中所述位置参照SEQ ID NO:348来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:106S/112P/204D/347D/396Y/417R、106S/112P/204D/347D/396Y/417R/427A、106S/112P/204D/347D/396Y/417R/427A/431D、112P/204D/347D/396Y/417R/427A、112P/204D/347D/396Y/417R/427A/431D和204D/347D/396Y/417R/431D,其中所述位置参照SEQ ID NO:348来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:L106S/E112P/G204D/G347D/R396Y/E417R、L106S/E112P/G204D/G347D/R396Y/E417R/R427A、L106S/E112P/G204D/G347D/R396Y/E417R/R427A/Q431D、E112P/G204D/G347D/R396Y/E417R/R427A、E112P/G204D/G347D/R396Y/E417R/R427A/Q431D和G204D/G347D/R396Y/E417R/Q431D,其中所述位置参照SEQ ID NO:348来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:500、502、504、506、508和/或510。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:500、502、504、506、508和/或510。在一些实施方案中,工程化糖基转移酶的多肽序列包含SEQ ID NO:500、502、504、506、508和/或510。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/100、28/44/365/407、38/118/290/351/375/401/422、38/178/401、38/290/351/401/422、54/413、74/102/137/161/259/289、92/118、98/233、102/161/250/435、110/222/250/259/435、118/156/178/290/375/401/422、137/161/435、137/169、159/169/173/300/424/438、185/290/401/422、290/351/401和435/438,其中所述位置参照SEQ ID NO:348来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14V/100F、28M/44V/365I/407E、38R/118A/290E/351G/375P/401L/422M、38R/178V/401L、38R/290E/351G/401L/422M、54P/413L、74W/102K/137G/161L/259S/289S、92L/118A、98P/233W、102K/161L/250A/435E、110G/222R/250R/259P/435G、118A/156A/178V/290E/375P/401L/422M、137G/161L/435R、137G/169G、159M/169S/173G/300Q/424E/438A、185R/290E/401L/422M、290E/351G/401L和435Q/438A,其中所述位置参照SEQ ID NO:348来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:I14V/L100F、I28M/I44V/V365I/A407E、K38R/S118A/D290E/A351G/D375P/W401L/I422M、K38R/A178V/W401L、K38R/D290E/A351G/W401L/I422M、T54P/V413L、R74W/R102K/N137G/D161L/H259S/K289S、I92L/S118A、D98P/I233W、R102K/D161L/T250A/V435E、A110G/K222R/T250R/H259P/V435G、S118A/S156A/A178V/D290E/D375P/W401L/I422M、N137G/D161L/V435R、N137G/D169G、Q159M/D169S/R173G/D300Q/Q424E/M438A、K185R/D290E/W401L/I422M、D290E/A351G/W401L和V435Q/M438A,其中所述位置参照SEQ ID NO:348来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:500、502、504、506、508、510、512、514、516、518、520、222、524、526、528、530、532、534、536、538、540、542、544、546和/或548。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:500、502、504、506、508、510、512、514、516、518、520、222、524、526、528、530、532、534、536、538、540、542、544、546和/或548。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:500、502、504、506、508、510、512、514、516、518、520、222、524、526、528、530、532、534、536、538、540、542、544、546和/或548。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/28/38/74/100/102/118/161/169/178/233/250/407/422/438、14/28/38/74/102/156/159/233/250/289/413/422/424/435/438、14/28/38/100/102/110/159/161/233/259/290/300/351/435、14/28/38/110/137/161/222/289/401、14/28/44/74/98/102/137/159/161/185/222/250、14/28/44/92、14/28/44/161/169、14/28/44/375、14/28/54/161/185/413、14/28/54/365、14/28/74/98/100/102/161/173/178/233/250/259/290/407、14/28/92/100/102/159/161/169/233、14/28/92/100/102/159/161/233/351/422、14/28/92/100/102/422/424/435、14/28/92/100/161/222/233/289/300、14/28/100/137/156/161/222/259/289/365/401/435/438、14/28/100/156/161/250、14/28/102/118/137/161/185/222/250/259/401、14/28/159/289/290/300、14/28/159/365/435、14/28/35、14/38/74/110/156/161/173/178/222/300、14/38/100/102/161/173/178/222/250/375/401/413、44/74/100/102/161/233/365/435/438、14/74/110/159/161/169/173/250/259/290/375/407/422、14/74/161/375/401、14/92/98/100/159/161/259/365/422/424/435、14/110/156/161/375/401/435/438、14/159/161/365/435/438、14/161/222/250/259/289/375/401/413、14/161/222/250/435/438、14/161/300、28、28/38/92/98/100/102/156/161、28/44/74/401、28/44/92/161/222/300/413、28/44/98/100/102/118、28/44/118/156/161/222/289/435/M438、28/44/289/290/351/422、28/44/435/438、28/54/92/159/161/290、28/54/159/290/438、28/54/250/439、28/74/156/159/161/178/300/365/435/438、28/74/156/161/365/407、28/74/161/290/365、28/92/100/102/110/161/185/250/300/375/435、28/92/98/100/110/156/161/401、28/92/118/159/222/250/259/300/407、28/156/161/185/435/438、28/156/161/233/259/300/435、28/98/100/102/161/185/351/401/435/438、38/161/300/438、74/98/100/102/110/118/161/178/250/289/290/300/435/438、74/98/100/102/118/156/159/161/435/438、74/156/161/173/178/424/435、74/375/435、98/100/118/159/161/300、98/100/156/159/161/178/259/289/290/351/422、102/137/159/161/422/424、118、137/159/161/185/300/351/365/435、156/159/161/169、159/161/222/290/375/407、159/161/401和161/259/289/435/438,其中所述位置参照SEQ ID NO:548来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14V/28M/38R/74/100F/102K/118A/161L/169G/178V/233W/250R/407E/422M/438A、14V/28M/38R/74W/102K/156A/159M/233W/250A/289S/413L/422M/424E/435R/438A、14V/28M/38R/100F/102K/110G/159M/161L/233W/259S/290E/300Q/351G/435Q、14V/28M/38R/110G/137G/161L/222R/289S/401L、14V/28M/44V/74W/98P/102K/137G/159M/161L/185R/222R/250A、14V/28M/44V/92L、14V/28M/44V/161L/169S、14V/28M/44V/375P、14V/28M/54P/161L/185R/413L、14V/28M/54P/365I、14V/28M/74W/98P/100F/102K/161L/173G/178V/233W/250A/259S/290E/407E、14V/28M/92L/100F/102K/159M/161L/169S/233W、14V/28M/92L/100F/102K/159M/161L/233W/351G/422M、14V/28M/92L/100F/102K/422M/424E/435Q、14V/28M/92L/100F/161L/222R/233W/289S/300Q、14V/28M/100F/137G/156A/161L/222R/259S/289S/365I/401L/435R/438A、14V/28M/100F/156A/161L/250R、14V/28M/102K/118A/137G/161L/185R/222R/250R/259P/401L、14V/28M/159M/289S/290E/300Q、14V/28M/159M/365I/435Q、14V/28M/351G、14V/38R/74W/110G/156A/161L/173G/178V/222R/300Q、14V/38R/100F/102K/161L/173G/178V/222R/250R/375P/401L/413L、44V/74W/100F/102K/161L/I33W/365I/435G/438A、14V/74W/110G/159M/161L/169G/173G/250A/259P/290E/375P/407E/422M、14V/74W/161L/375P/401L、14V/92L/98P/100F/159M/161L/259P/365I/422M/424E/435R、14V/110G/156A/161L/375P/401L/435EM438A、14V/159M/161L/365I/435E/438A、14V/161L/222R/250R/259S/289S/375P/401L/413L、14V/161L/222R/250R/435Q/438A、14V/161L/300Q、28M、28M/38R/92L/98P/100F/102K/156A/161L、28M/44V/74W/401L、28M/44V/92L/161L/222R/300Q/413L、28M/44V/98P/100F/102K/118A、28M/44V/118A/156A/161L/222R/289S/435Q/438A、28M/44V/289S/290E/351G/422M、28M/44V/435R/438A、28M/54P/92L/159M/161L/290E、28M/54P/159M/290E/438A、28M/54P/250R/439N、28M/74W/156A/159M/161L/178V/300Q/365I/435Q/438A、28M/74W/156A/161L/365I/407E、28M/74W/161L/290E/365I、28M/92L/98P/100F/110G/156A/161L/401L、28M/92L/100F/102K/110G/161L/185R/250A/300Q/375P/435Q、28M/92L/118A/159M/222R/250R/259P/300Q/407E、28M/98P/100F/102K/161L/185R/351G/401L/435E/438A、28M/156A/161L/185R/435R/438A、28M/156A/161L/233W/259S/300Q/435R、38R/161L/300Q/438A、74W/98P/100F/102K/110G/118A/161L/178V/250R/289S/290E/300Q/435E/438A、74W/98P/100F/102K/118A/156A/159M/161L/435E/438A、74W/156A/161L/173G/178V/424E/435E、74W/375P/435G、98P/100F/118A/159M/161L/300Q、98P/100F/156A/159M/161L/178V/259S/289S/290E/351G/422M、102K/137G/159M/161L/422M/424E、118A、137G/159M/161L/185R/300Q/351G/365I/435Q、156A/159M/161L/169S、159M/161L/222R/290E/375P/407E、159M/161L/401L和161L/259S/289S/435R/438A,其中所述位置参照SEQ ID NO:548来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:I14V/I28M/K38R/R74W/L100F/R102K/S118A/D161L/D169G/A178V/I233W/T250R/A407E/I422M/M438A、I14V/I28M/K38R/R74W/R102K/S156A/Q159M/I233W/T250A/K289S/V413L/I422M/Q424E/V435R/M438A、I14V/I28M/K38R/L100F/R102K/A110G/Q159M/D161L/I233W/H259S/D290E/D300Q/A351G/V435Q、I14V/I28M/K38R/A110G/N137G/D161L/K222R/K289S/W401L、I14V/I28M/I44V/R74W/D98P/R102K/N137G/Q159M/D161L/K185R/K222R/T250A、I14V/I28M/I44V/I92L、I14V/I28M/I44V/D161L/D169S、I14V/I28M/I44V/D375P、I14V/I28M/T54P/D161L/K185R/V413L、I14V/I28M/T54P/V365I、I14V/I28M/R74W/D98P/L100F/R102K/D161L/R173G/A178V/I233W/T250A/H259S/D290E/A407E、I14V/I28M/I92L/L100F/R102K/Q159M/D161L/D169S/I233W、I14V/I28M/I92L/L100F/R102K/Q159M/D161L/I233W/A351G/I422M、I14V/I28M/I92L/L100F/R102K/I422M/Q424E/V435Q、I14V/I28M/I92L/L100F/D161L/K222R/I233W/K289S/D300Q、I14V/I28M/L100F/N137G/S156A/D161L/K222R/H259S/K289S/V365I/W401L/V435R/M438A、I14V/I28M/L100F/S156A/D161L/T250R、I14V/I28M/R102K/S118A/N137G/D161L/K185R/K222R/T250R/H259P/W401L、I14V/I28M/Q159M/K289S/D290E/D300Q、I14V/I28M/Q159M/V365I/V435Q、I14V/I28M/A351G、I14V/K38R/R74W/A110G/S156A/D161L/R173G/A178V/K222R/D300Q、I14V/K38R/L100F/R102K/D161L/R173G/A178V/K222R/T250R/D375P/W401L/V413L、I44V/R74W/L100F/R102K/D161L/I233W/V365I/V435G/M438A、I14V/R74W/A110G/Q159M/D161L/D169G/R173G/T250A/H259P/D290E/D375P/A407E/I422M、I14V/R74W/D161L/D375P/W401L、I14V/I92L/D98P/L100F/Q159M/D161L/H259P/V365I/I422M/Q424E/V435R、I14V/A110G/S156A/D161L/D375P/W401L/V435E/M438A、I14V/Q159M/D161L/V365I/V435E/M438A、I14V/D161L/K222R/T250R/H259S/K289S/D375P/W401L/V413L、I14V/D161L/K222R/T250R/V435Q/M438A、I14V/D161L/D300Q、I28M、I28M/K38R/I92L/D98P/L100F/R102K/S156A/D161L、I28M/I44V/R74W/W401L、I28M/I44V/I92L/D161L/K222R/D300Q/V413L、I28M/I44V/D98P/L100F/R102K/S118A、I28M/I44V/S118A/S156A/D161L/K222R/K289S/V435Q/M438A、I28M/I44V/K289S/D290E/A351G/I422M、I28M/I44V/V435R/M438A、I28M/T54P/I92L/Q159M/D161L/D290E、I28M/T54P/Q159M/D290E/M438A、I28M/T54P/T250R/K439N、I28M/R74W/S156A/Q159M/D161L/A178V/D300Q/V365I/V435Q/M438A、I28M/R74W/S156A/D161L/V365I/A407E、I28M/R74W/D161L/D290E/V365I、I28M/D98P/L100F/R102K/D161L/K185R/A351G/W401L/V435E/M438A、I28M/I92L/L100F/R102K/A110G/D161L/K185R/T250A/D300Q/D375P/V435Q、I28M/I92L/S118A/Q159M/K222R/T250R/H259P/D300Q/A407E、I28M/S156A/D161L/K185R/V435R/M438A、I28M/S156A/D161L/I233W/H259S/D300Q/V435R、I28M/I92L/D98P/L100F/A110G/S156A/D161L/W401L、K38R/D161L/D300Q/M438A、R74W/D98P/L100F/R102K/A110G/S118A/D161L/A178V/T250R/K289S/D290E/D300Q/V435E/M438A、R74W/D98P/L100F/R102K/S118A/S156A/Q159M/D161L/V435E/M438A、R74W/S156A/D161L/R173G/A178V/Q424E/V435E、R74W/D375P/V435G、D98P/L100F/S118A/Q159M/D161L/D300Q、D98P/L100F/S156A/Q159M/D161L/A178V/H259S/K289S/D290E/A351G/I422M、R102K/N137G/Q159M/D161L/I422M/Q424E、S118A、N137G/Q159M/D161L/K185R/D300Q/A351G/V365I/V435Q、S156A/Q159M/D161L/D169S、Q159M/D161L/K222R/D290E/D375P/A407E、Q159M/D161L/W401L和D161L/H259S/K289S/V435R/M438A,其中所述位置参照SEQ ID NO:548来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ IDNO:550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678和680,其中所述位置参照SEQ ID NO:548来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678和680,其中所述位置参照SEQID NO:548来编号。
在一些实施方案中,工程化糖基转移酶的多肽序列包含以下中的任何一个序列:SEQ ID NO:550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678和680,其中所述位置参照SEQ ID NO:548来编号。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:19/44/110/191/198/199/208/300/365、19/75/76/87/92/199/207/208、19/87/92/191/199/209/413/435、44/76/197/199/208/351、44/87/92/137/159/199/209、44/87/137/159/169/191/199/208、44/87/137/191/197/209/289/401、44/87/199/208、75/76/87/92、75/76/87/92/290/300、75/76/87/191、75/76/87/191/197/199/209/300、75/87/92/169/207/208/300/413/435、75/87/110/137/169/191/199/208/209/289/435、75/87/110/191/197/198/207/208/289/290/300/401/413、75/87/300、75/110/197/199/208/290/300/401/413、76/92/199/209、87/92/197/198/199/208/300、87/137/435、87/169/191/199/207/209/401/413、87/191/198/199/222/244/289/300/435、87/92/110/169/199/207/209/290/300、87/92/159/169/191/198/290/413/435、87/92/159/191/199/208/209/289/290、87/92/208/401、87/435、92/137/191/199/209、92/197/199/207/208/401、137/198/199/207/208/426/435、137/199/208/209/290/435、137/365、159/197/199/207/209、169/191/197/199/207/208、169/197/199/207/209/222/300/413/435、191/207/208/289/290/413/435和197/198/199/208/209,其中所述位置参照SEQ ID NO:562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:19L/44V/110G/191R/198M/199K/208A/300Q/365I、19L/75L/76R/87W/92L/199K/207L/208A、19L/87W/92L/191R/199K/209G/413L/435Q、44V/76R/197R/199K/208D/351G、44V/87W/92L/137G/159M/199K/209G、44V/87W/137G/159M/169S/191R/199K/208D、44V/87W/137G/191R/197R/209G/289S/401L、44V/87W/199K/208A、75L/76R/87W/92L、75L/76R/87W/92L/290E/300Q、75L/76R/87W/191R、75L/76R/87W/191R/197R/199K/209G/300Q、75L/87W/92L/169S/207L/208A/300Q/413L/435Q、75L/87W/110G/137G/169S/191R/199K/208A/209G/289S/435Q、75L/87W/110G/191R/197R/198M/207L/208D/289S/290E/300Q/401L/413L、75L/87W/300Q、75L/110G/197R/199K/208A/290E/300Q/401L/413L、76R/92L/199K/209G、87L/92L/197R/198M/199K/208D/300Q、87W/137G/435R、87W/169S/191R/199K/207L/209G/401L/413L、87W/191R/198M/199K/222R/244L/289S/300Q/435R、87W/92L/110G/169S/199K/207L/209G/290E/300Q、87W/92L/159M/169S/191R/198M/290E/413L/435Q、87W/92L/159M/191R/199K/208A/209G/289S/290E、87W/92L/208A/401L、87W/435R、92L/137G/191R/199K/209G、92L/197R/199K/207L/208D/401L、137G/198M/199K/207L/208D/426V/435R、137G/199K/208A/209G/290E/435R、137G/365I、159M/197R/199K/207L/209G、169S/191R/197R/199K/207L/208D、169S/197R/199K/207L/209G/222R/300Q/413L/435R、191R/207L/208A/289S/290E/413L/435Q和197R/198M/199K/208D/209G,其中所述位置参照SEQ ID NO:562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:V19L/I44V/A110G/S191R/I198M/A199K/K208A/D300Q/V365I、V19L/I75L/S76R/M87W/I92L/A199K/I207L/K208A、V19L/M87W/I92L/S191R/A199K/Q209G/V413L/V435Q、I44V/S76R/Q197R/A199K/K208D/A351G、I44V/M87W/I92L/N137G/Q159M/A199K/Q209G、I44V/M87W/N137G/Q159M/G169S/S191R/A199K/K208D、I44V/M87W/N137G/S191R/Q197R/Q209G/K289S/W401L、I44V/M87W/A199K/K208A、I75L/S76R/M87W/I92L、I75L/S76R/M87W/I92L/D290E/D300Q、I75L/S76R/M87W/S191R、I75L/S76R/M87W/S191R/Q197R/A199K/Q209G/D300Q、I75L/M87W/I92L/G169S/I207L/K208A/D300Q/V413L/V435Q、I75L/M87W/A110G/N137G/G169S/S191R/A199K/K208A/Q209G/K289S/V435Q、I75L/M87W/A110G/S191R/Q197R/I198M/I207L/K208D/K289S/D290E/D300Q/W401L/V41L、I75L/M87W/D300Q、I75L/A110G/Q197R/A199K/K208A/D290E/D300Q/W401L/V413L、S76R/I92L/A199K/Q209G、M87L/I92L/Q197R/I198M/A199K/K208D/D300Q、M87W/N137G/V435R、M87W/G169S/S191R/A199K/I207L/Q209G/W401L/V413L、M87W/S191R/I198M/A199K/K222R/P244L/K289S/D300Q/V435R、M87W/I92L/A110G/G169S/A199K/I207L/Q209G/D290E/D300Q、M87W/I92L/Q159M/G169S/S191R/I198M/D290E/V413L/V435Q、M87W/I92L/Q159M/S191R/A199K/K208A/Q209G/K289S/D290E、M87W/I92L/K208A/W401L、M87W/V435R、I92L/N137G/S191R/A199K/Q209G、I92L/Q197R/A199K/I207L/K208D/W401L、N137G/I198M/A199K/I207L/K208D/A426V/V435R、N137G/A199K/K208A/Q209G/D290E/V435R、N137G/V365I、Q159M/Q197R/A199K/I207L/Q209G、G169S/S191R/Q197R/A199K/I207L/K208D、G169S/Q197R/A199K/I207L/Q209G/K222R/D300Q/V413L/V435R、S191R/I207L/K208A/K289S/D290E/V413L/V435Q和Q197R/I198M/A199K/K208D/Q209G,其中所述位置参照SEQ ID NO:562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752和/或754。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752和/或754。在一些实施方案中,工程化糖基转移酶的多肽序列包含SEQ ID NO:682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752和/或754。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:22、25、51、56、71、78、80、81、88、157、185/208/230/252/255/290/365、189/206/208/365、200、208/365/435、243、245、249、259、262/401、279、282、284、304/322/365/401、308、338、339、352、362、364、365/401/413/435、366和374,其中所述位置参照SEQ ID NO:696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:22L、25L、25V、51A、56L、71R、78E、78F、78G、78I、78K、78M、78P、78Q、78R、80L、81C、88I、88K、88V、157G、157Q、185R/208A/230S/252N/255N/290E/365I、189L/206K/208A/365I、200N、200S、208A/365I/435Q、243C、243L、243M、243V、243Y、245G、249E、249H、249I、249M、249N、249P、249S、249T、249Y、259G、259S、259Y、262S/401L、279G、282T、284T、304P/322S/365I/401L、308F、308Y、338C、339D、352Q、362T、364G、365I/401L/413L/435Q、366A和374T,其中所述位置参照SEQ ID NO:696来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:P22L、I25L、I25V、K51A、N56L、Q71R、L78E、L78F、L78G、L78I、L78K、L78M、L78P、L78Q、L78R、T80L、H81C、R88I、R88K、R88V、L157G、L157Q、K185R/K208A/E230S/S252N/S255N/D290E/V365I、I189L/M206K/K208A/V365I、K200N、K200S、K208A/V365I/V435Q、I243C、I243L、I243M、I243V、I243Y、L245G、L249E、L249H、L249I、L249M、L249N、L249P、L249S、L249T、L249Y、H259G、H259S、H259Y、T262S/W401L、S279G、S282T、S284T、S304P/P322S/V365I/W401L、R308F、R308Y、V338C、P339D、F352Q、L362T、S364G、V365I/W401L/V413L/V435Q、C366A和S374T,其中所述位置参照SEQ IDNO:696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:4684、4686、4688、4690、4692、4694、4696、4698、4700、4702、4704、4706、4708、4710、4712、4714、4716、4718、4720、4722、4724、4726、4728、4730、4732、4734、4736、4738、4740、4742、4744、4746、4748、4750、4752、4754、4756、4758、4760、4762、4764、4766、4768、4770、4772、4774、4776、4778、4780、4782、4784、4786、4788、4790、4792、4794、4796、4798、4800、4902、4804、4806、4808、4810和4812。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQID NO:4684、4686、4688、4690、4692、4694、4696、4698、4700、4702、4704、4706、4708、4710、4712、4714、4716、4718、4720、4722、4724、4726、4728、4730、4732、4734、4736、4738、4740、4742、4744、4746、4748、4750、4752、4754、4756、4758、4760、4762、4764、4766、4768、4770、4772、4774、4776、4778、4780、4782、4784、4786、4788、4790、4792、4794、4796、4798、4800、4902、4804、4806、4808、4810和4812。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:4684、4686、4688、4690、4692、4694、4696、4698、4700、4702、4704、4706、4708、4710、4712、4714、4716、4718、4720、4722、4724、4726、4728、4730、4732、4734、4736、4738、4740、4742、4744、4746、4748、4750、4752、4754、4756、4758、4760、4762、4764、4766、4768、4770、4772、4774、4776、4778、4780、4782、4784、4786、4788、4790、4792、4794、4796、4798、4800、4902、4804、4806、4808、4810和4812。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:51/56、51/56/243/249/282/353/362/366、51/56/243/249/308/362/364、51/56/249/353、51/56/249/362/364、51/56/249/362/366、51/243/249/308/353、51/243/249/348/362/366、51/249、51/249/282/284/364、51/249/282/353/366、51/249/284/308/362/366、51/249/353/362/364、51/353/362、56、56/243/249/282/364/366、56/243/364/366、56/249、56/249/284/353、56/249/353、56/284/366、243/249/282/284/362/364/366、243/249/308/353/366、243/249/353/362/366、243/282/353/362/364、243/282/362/364/366、243/308/353、249/353/362/366、282、308/366和362/366,其中所述位置参照SEQ ID NO:4684来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:51A/56H、51A/56H/243L/249E/282T/353Y/362M/366S、51A/56H/243L/249E/308F/362M/364G、51A/56H/249M/362M/364G、51A/56H/249M/362M/366S、51A/56H/249Y/353Y、51A/243L/249E/308F/353Y、51A/243L/249E/348S/362M/366V、51A/249E/353Y/362M/364G、51A/249M、51A/249M/282T/284T/364G、51A/249M/282T/353Y/366S、51A/249Y/284T/308F/362M/366V、51A/353Y/362M、56H、56H/243L/249E/282T/364G/366V、56H/243L/364G/366V、56H/249M/284T/353Y、56H/249M/353Y、56H/249Y、56H/284T/366V、243L/249E/282T/284T/362M/364G/366S、243L/249M/308F/353Y/366A、243L/249Y/353Y/362M/366S、243L/282T/353Y/362M/364G、243L/282T/362M/364G/366V、243L/308F/353Y、249Y/353Y/362M/366S、282T、308F/366A和362M/366A,其中所述位置参照SEQ ID NO:4684来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:K51A/N56H、K51A/N56H/I243L/L249E/S282T/W353Y/L362M/C366S、K51A/N56H/I243L/L249E/R308F/L362M/S364G、K51A/N56H/L249M/L362M/S364G、K51A/N56H/L249M/L362M/C366S、K51A/N56H/L249Y/W353Y、K51A/I243L/L249E/R308F/W353Y、K51A/I243L/L249E/A348S/L362M/C366V、K51A/L249E/W353Y/L362M/S364G、K51A/L249M、K51A/L249M/S282T/S284T/S364G、K51A/L249M/S282T/W353Y/C366S、K51A/L249Y/S284T/R308F/L362M/C366V、K51A/W353Y/L362M、N56H、N56H/I243L/L249E/S282T/S364G/C366V、N56H/I243L/S364G/C366V、N56H/L249M/S284T/W353Y、N56H/L249M/W353Y、N56H/L249Y、N56H/S284T/C366V、I243L/L249E/S282T/S284T/L362M/S364G/C366S、I243L/L249M/R308F/W353Y/C366A、I243L/L249Y/W353Y/L362M/C366S、I243L/S282T/W353Y/L362M/S364G、I243L/S282T/L362M/S364G/C366V、I243L/R308F/W353Y、L249Y/W353Y/L362M/C366S、S282T、R308F/C366A和L362M/C366A,其中所述位置参照SEQ ID NO:4684来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:4814、4816、4818、4820、4822、4824、4826、4828、4830、4832、4834、4836、4838、4840、4842、4844、4846、4848、4850、4852、4854、4856、4858、4860、4862、4864、4866、4868、4870、4872和4874。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:4814、4816、4818、4820、4822、4824、4826、4828、4830、4832、4834、4836、4838、4840、4842、4844、4846、4848、4850、4852、4854、4856、4858、4860、4862、4864、4866、4868、4870、4872和4874。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:4814、4816、4818、4820、4822、4824、4826、4828、4830、4832、4834、4836、4838、4840、4842、4844、4846、4848、4850、4852、4854、4856、4858、4860、4862、4864、4866、4868、4870、4872和4874。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:25、25/56/353、25/243/249/259/366、25/243/249/362、25/362/366、51、51/56/200/243/249/259/338、51/56/362、51/71/249/279/284/362/366、56/243/249、56/362/366、70/198/259/313、85、88、88/173、110、159、163、171、174、175、177、198、198/313、198/313/428、200/243/249/259、208、208/320、209、209/234、222、226、234、234/408、243/338/362/366、253、256、259、265、272、289、322、336、353/362、405、411、428和439,其中所述位置参照SEQ ID NO:4838来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:25L、25L/56L/353Y、25V/243M/249I/362M、25V/243M/249Y/259G/366A、25V/362M/366S、51A、51A/56L/200S/243M/249I/259G/338C、51A/56L/362M、51A/71R/249M/279G/284T/362M/366S、56L/243M/249M、56L/243M/249Y、56L/362M/366A、70S/198D/259E/313S、85E、88C/173S、88I、110S、159N、163K、171D、171E、171P、171V、174E、174S、175N、177K、177P、177S、198D、198D/313S、198D/313S/428S、198E、198S、198T、200S/243M/249Y/259G、208E、208G、208I、208L、208N、208T、208V、208W/320I、209A、209E/234Q、222P、226R、226T、234A、234E、234H/408D、234T、243M/338C/362M/366S、253A、256A、259N、259S、259T、265A、272D、289H、289T、322V、336E、353Y/362M、405Q、411T、428K、439D和439Q,其中所述位置参照SEQID NO:4838来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:I25L、I25L/H56L/W353Y、I25V/L243M/E249I/L362M、I25V/L243M/E249Y/H259G/V366A、I25V/L362M/V366S、K51A、K51A/H56L/K200S/L243M/E249I/H259G/V338C、K51A/H56L/L362M、K51A/Q71R/E249M/S279G/S284T/L362M/V366S、H56L/L243M/E249M、H56L/L243M/E249Y、H56L/L362M/V366A、P70S/I198D/H259E/F313S、A85E、R88C/R173S、R88I、A110S、Q159N、L163K、K171D、K171E、K171P、K171V、L174E、L174S、E175N、Q177K、Q177P、Q177S、I198D、I198D/F313S、I198D/F313S/V428S、I198E、I198S、I198T、K200S/L243M/E249Y/H259G、K208E、K208G、K208I、K208L、K208N、K208T、K208V、K208W/V320I、Q209A、Q209E/R234Q、K222P、E226R、E226T、R234A、R234E、R234H/N408D、R234T、L243M/V338C/L362M/V366S、S253A、L256A、H259N、H259S、H259T、Q265A、P272D、K289H、K289T、P322V、K336E、W353Y/L362M、E405Q、R411T、V428K、K439D和K439Q,其中所述位置参照SEQ ID NO:4838来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:4876、4878、4880、4882、4884、4886、4888、4890、4892、4894、4896、4898、4900、4902、4904、4906、4908、4910、4912、4914、4916、4918、4920、4922、4924、4926、4928、4930、4932、4934、4936、4938、4940、4942、4944、4946、4948、4950、4952、4954、4956、4958、4960、4962、4964、4966、4968、4970、4972、4974、4976、4978、4980、4982、4984、4986、4988、4990、4992、4994、4996、4998、5000、5002、5004、5006、5008、5010、5012、5014和5016。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:4876、4878、4880、4882、4884、4886、4888、4890、4892、4894、4896、4898、4900、4902、4904、4906、4908、4910、4912、4914、4916、4918、4920、4922、4924、4926、4928、4930、4932、4934、4936、4938、4940、4942、4944、4946、4948、4950、4952、4954、4956、4958、4960、4962、4964、4966、4968、4970、4972、4974、4976、4978、4980、4982、4984、4986、4988、4990、4992、4994、4996、4998、5000、5002、5004、5006、5008、5010、5012、5014和5016。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:4876、4878、4880、4882、4884、4886、4888、4890、4892、4894、4896、4898、4900、4902、4904、4906、4908、4910、4912、4914、4916、4918、4920、4922、4924、4926、4928、4930、4932、4934、4936、4938、4940、4942、4944、4946、4948、4950、4952、4954、4956、4958、4960、4962、4964、4966、4968、4970、4972、4974、4976、4978、4980、4982、4984、4986、4988、4990、4992、4994、4996、4998、5000、5002、5004、5006、5008、5010、5012、5014和5016。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8、9、25、25/198/209、25/200/209/338、25/200/243/249、25/209/243、25/209/243/249、25/209/243/259、25/209/249/259/366、25/209/259、25/209/279/366、25/209/289/366、25/249、25/259/279、25/259/279/289、25/279/284、25/279/284/289、25/289、34、53、54、55、61、69、70、73、79、87、91、107、108、111、141、153、158、174、190、194、198、198/200/209/243/249/289、198/249/338、200/209/366、201、205、209、209/249/259/279/338/366、209/249/259/289、209/249/279/284/289、209/249/338、209/279/289、209/366、234/297、238、247、249/259、252、253、254、256、259/366、279、279/338、289、297、308、321、322、327、336、338、341、342、364、366、388、392、411、412、414、426、430、432、446和449,其中所述位置参照SEQ ID NO:4876来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8D、8L、9G、25H/209E/243M/249Y、25L、25L/198D/209E、25L/200S/209E/338C、25L/200S/243M/249M、25L/209E/243M、25L/209E/243M/249Y、25L/209E/243M/259G、25L/209E/249I/259G/366A、25L/209E/259G、25L/209E/279G/366A、25L/209E/289T/366A、25L/249I、25L/259G/279G、25L/259G/279G/289T、25L/279G/284T、25L/279G/284T/289T、25L/289T、34I、53C、53L、53R、53V、54P、54V、55T、55W、61S、69N、69Q、69S、69T、70K、73S、79G、79S、79V、87L、87M、87R、91Q、91R、91T、107A、107C、107T、108C、111C、111G、141M、153S、158Q、174M、190R、194Q、198D、198D/200S/209E/243M/249Y/289T、198D/249M/338C、200S/209E/366A、201P、201T、205P、209E、209E/249I/259G/289T、209E/249M/338C、209E/249Y/259G/279G/338C/366A、209E/249Y/279G/284T/289T、209E/279G/289T、209E/366A、234H/297A、238K、247A、247L、249M/259G、252A、252E、252Q、253G、253P、254G、254M、254P、256D、256T、256W、259G/366A、279G、279G/338C、289T、297A、308C、308L、308T、321D、322M、322R、322T、327L、336M、336Y、338C、341V、342R、364S、366A、388T、388V、392H、392Q、411E、411S、412H、412T、414L、426T、430R、432T、446F和449L,其中所述位置参照SEQ ID NO:4876来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:T8D、T8L、V9G、I25H/Q209E/L243M/E249Y、I25L、I25L/I198D/Q209E、I25L/K200S/Q209E/V338C、I25L/K200S/L243M/E249M、I25L/Q209E/L243M、I25L/Q209E/L243M/E249Y、I25L/Q209E/L243M/H259G、I25L/Q209E/E249I/H259G/V366A、I25L/Q209E/H259G、I25L/Q209E/S279G/V366A、I25L/Q209E/K289T/V366A、I25L/E249I、I25L/H259G/S279G、I25L/H259G/S279G/K289T、I25L/S279G/S284T、I25L/S279G/S284T/K289T、I25L/K289T、V34I、K53C、K53L、K53R、K53V、T54P、T54V、S55T、S55W、T61S、D69N、D69Q、D69S、D69T、P70K、E73S、P79G、P79S、P79V、W87L、W87M、W87R、I91Q、I91R、I91T、L107A、L107C、L107T、M108C、S111C、S111G、L141M、A153S、P158Q、L174M、K190R、S194Q、I198D、I198D/K200S/Q209E/L243M/E249Y/K289T、I198D/E249M/V338C、K200S/Q209E/V366A、E201P、E201T、K205P、Q209E、Q209E/E249I/H259G/K289T、Q209E/E249M/V338C、Q209E/E249Y/H259G/S279G/V338C/V366A、Q209E/E249Y/S279G/S284T/K289T、Q209E/S279G/K289T、Q209E/V366A、R234H/G297A、A238K、K247A、K247L、E249M/H259G、S252A、S252E、S252Q、S253G、S253P、S254G、S254M、S254P、L256D、L256T、L256W、H259G/V366A、S279G、S279G/V338C、K289T、G297A、R308C、R308L、R308T、E321D、P322M、P322R、P322T、F327L、K336M、K336Y、V338C、Q341V、E342R、G364S、V366A、S388T、S388V、K392H、K392Q、R411E、R411S、R412H、R412T、M414L、A426T、K430R、K432T、S446F和S449L,其中所述位置参照SEQ ID NO:4876来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:5018、5020、5022、5024、5026、5028、5030、5032、5034、5036、5038、5040、5042、5044、5046、5048、5050、5052、5054、5056、5058、5060、5062、5064、5066、5068、5070、5072、5074、5076、5078、5080、5082、5084、5086、5088、5090、5092、5094、5096、5098、5100、5102、5104、5106、5108、5110、5112、5114、5116、5118、5120、5122、5124、5126、5128、5130、5132、5134、5136、5138、5140、5142、5144、5146、5148、5150、5152、5154、5156、5158、5160、5162、5164、5166、5168、5170、5172、5174、5176、5178、5180、5182、5184、5186、5188、5190、5192、5194、5196、5198、5200、5202、5204、5206、5208、5210、5212、5214、5216、5218、5220、5222、5224、5226、5228、5230、5232、5234、5236、5238、5240、5242、5244、5246、5248、5250、5252、5254、5256、5258和5260。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:5018、5020、5022、5024、5026、5028、5030、5032、5034、5036、5038、5040、5042、5044、5046、5048、5050、5052、5054、5056、5058、5060、5062、5064、5066、5068、5070、5072、5074、5076、5078、5080、5082、5084、5086、5088、5090、5092、5094、5096、5098、5100、5102、5104、5106、5108、5110、5112、5114、5116、5118、5120、5122、5124、5126、5128、5130、5132、5134、5136、5138、5140、5142、5144、5146、5148、5150、5152、5154、5156、5158、5160、5162、5164、5166、5168、5170、5172、5174、5176、5178、5180、5182、5184、5186、5188、5190、5192、5194、5196、5198、5200、5202、5204、5206、5208、5210、5212、5214、5216、5218、5220、5222、5224、5226、5228、5230、5232、5234、5236、5238、5240、5242、5244、5246、5248、5250、5252、5254、5256、5258和5260。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ IDNO:5018、5020、5022、5024、5026、5028、5030、5032、5034、5036、5038、5040、5042、5044、5046、5048、5050、5052、5054、5056、5058、5060、5062、5064、5066、5068、5070、5072、5074、5076、5078、5080、5082、5084、5086、5088、5090、5092、5094、5096、5098、5100、5102、5104、5106、5108、5110、5112、5114、5116、5118、5120、5122、5124、5126、5128、5130、5132、5134、5136、5138、5140、5142、5144、5146、5148、5150、5152、5154、5156、5158、5160、5162、5164、5166、5168、5170、5172、5174、5176、5178、5180、5182、5184、5186、5188、5190、5192、5194、5196、5198、5200、5202、5204、5206、5208、5210、5212、5214、5216、5218、5220、5222、5224、5226、5228、5230、5232、5234、5236、5238、5240、5242、5244、5246、5248、5250、5252、5254、5256、5258和5260。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:88、88/110、88/110/159/198/200、88/110/159/198/234/259/265、88/110/159/198/259、88/110/198、88/110/234、88/159/198、88/198、88/198/200/259、88/198/259、88/259、88/259/265、110/259/265/411、159/198/411、159/259/411、171/174/175/177/208/320/428/439、171/175/177/208/320/428、171/177、171/177/226/428/439、171/208/320、171/208/320/428、171/208/428、174/175/177/208/320/428、174/175/428、174/320、198、198/200、198/200/234、198/234、198/259、208、208/320/331/428、208/320/428、208/428、234、259、320/428和428,其中所述位置参照SEQID NO:5066来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:88I、88I/110D、88I/110D/159N/198D/234T/259N/265A、88I/110D/159N/198D/259E、88I/110D/159N/198E/200S、88I/110D/198D、88I/110D/198S、88I/110D/234T、88I/159N/198D、88I/198D/200S/259E、88I/198D/259E、88I/198S、88I/259E/265A、88I/259N、110D/259N/265A/411T、159N/198E/411T、159N/259E/411T、171E/177P/226T/428K/439D、171E/208E/320I、171E/208E/320I/428K、171E/208E/428K、171P/174E/175N/177P/208W/320I/428K/439D、171P/175N/177P/208L/320I/428K、171P/177P、174E/175N/177P/208E/320I/428K、174E/175N/428K、174E/320I、198D、198D/200S/234E、198D/234Q、198E/200S、198E/259E、208E、208E/320I/428K、208E/428K、208L/320I/331C/428K、234E、259E、320I/428K和428K,其中所述位置参照SEQ ID NO:5066来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:R88I、R88I/A110D、R88I/A110D/Q159N/I198D/R234T/G259N/Q265A、R88I/A110D/Q159N/I198D/G259E、R88I/A110D/Q159N/I198E/K200S、R88I/A110D/I198D、R88I/A110D/I198S、R88I/A110D/R234T、R88I/Q159N/I198D、R88I/I198D/K200S/G259E、R88I/I198D/G259E、R88I/I198S、R88I/G259E/Q265A、R88I/G259N、A110D/G259N/Q265A/R411T、Q159N/I198E/R411T、Q159N/G259E/R411T、K171E/Q177P/E226T/V428K/K439D、K171E/K208E/V320I、K171E/K208E/V320I/V428K、K171E/K208E/V428K、K171P/L174E/E175N/Q177P/K208W/V320I/V428K/K439D、K171P/E175N/Q177P/K208L/V320I/V428K、K171P/Q177P、L174E/E175N/Q177P/K208E/V320I/V428K、L174E/E175N/V428K、L174E/V320I、I198D、I198D/K200S/R234E、I198D/R234Q、I198E/K200S、I198E/G259E、K208E、K208E/V320I/V428K、K208E/V428K、K208L/V320I/R331C/V428K、R234E、G259E、V320I/V428K和V428K,其中所述位置参照SEQ ID NO:5066来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:5262、5264、5266、5268、5270、5272、5274、5276、5278、5280、5282、5284、5286、5288、5290、5292、5294、5296、5298、5300、5302、5304、5306、5308、5310、5312、5314、5316、5318、5320、5322、5324、5326、5328、5330、5332、5334、5336、5338、5340和5342。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:5262、5264、5266、5268、5270、5272、5274、5276、5278、5280、5282、5284、5286、5288、5290、5292、5294、5296、5298、5300、5302、5304、5306、5308、5310、5312、5314、5316、5318、5320、5322、5324、5326、5328、5330、5332、5334、5336、5338、5340和5342。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:5262、5264、5266、5268、5270、5272、5274、5276、5278、5280、5282、5284、5286、5288、5290、5292、5294、5296、5298、5300、5302、5304、5306、5308、5310、5312、5314、5316、5318、5320、5322、5324、5326、5328、5330、5332、5334、5336、5338、5340和5342。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、7、25/61/208/252/253、25/61/428、25/107/208/320/428、25/208/247/252/253/364/428、25/247/249/252/364/428、38、53/54/55/153/201、53/54/308/392、53/171/308/392、54、61/107/208/252/253/254/364/428、61/208/252/254/428、64、68、73/87/201、91/201/439/444、99、106、107、107/208/320/364/428、107/247/249/252/254/364、107/247/252、107/247/428、109、159、169、171、172、177、179、190、190/208/247/252/428、222、233、233/269、247/249/252/254/320/428、249/252/253/254、249/252/254/428、251、252/253/254、253/320、259、264、289、296、300、308、308/327/439、317、318、320、320/364/428、320/428、347、404、408、417、424、427、428、428/434、431、435和438,其中所述位置参照SEQ ID NO:5290来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2L、2N、7P、25L/61S/208N/252E/253G、25L/61S/428K、25L/107T/208E/320I/428K、25L/208E/247L/252E/253G/364S/428K、25L/247L/249I/252E/364S/428K、38Q、53R/54V/55T/153S/201P、53V/54V/308L/392H、53V/171P/308L/392H、54A、61S/107T/208N/252E/253G/254M/364S/428K、61S/208W/252E/254M/428K、64S、68K、73S/87M/201P、91T/201P/439D/444H、99P、106T、107A、107A/208N/320I/364S/428K、107A/247A/249I/252E/254M/364S、107A/247A/252E、107A/247A/428K、109S、159L、169C、169E、169L、169Q、169V、171S、171T、171V、172H、172N、177P、179A、179S、190R、190R/208N/247L/252E/428K、222A、233C、233G、233K、233L、233M、233Q、233Q/269R、233V、247A/249I/252E/254M/320I/428K、249I/252E/253G/254M、249I/252E/254M/428K、251L、252E/253G/254M、253G/320I、259T、264A、289S、296A、296H、296Q、300G、308L、308L/327L/439D、317R、318T、320I、320I/364S/428K、320I/428K、347H、347K、347P、347R、404T、408R、417P、424A、424W、427L、427R、428E/434N、428F、428I、428K、428Q、428R、428S、431E、431R、435C、435K、435M、435Q、435R、435T和438Q,其中所述位置参照SEQ ID NO:5290来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E2L、E2N、T7P、I25L/T61S/K208N/S252E/S253G、I25L/T61S/V428K、I25L/L107T/K208E/V320I/V428K、I25L/K208E/K247L/S252E/S253G/G364S/V428K、I25L/K247L/Y249I/S252E/G364S/V428K、R38Q、K53R/T54V/S55T/A153S/E201P、K53V/T54V/R308L/K392H、K53V/K171P/R308L/K392H、T54A、T61S/L107T/K208N/S252E/S253G/S254M/G364S/V428K、T61S/K208W/S252E/S254M/V428K、F64S、N68K、E73S/W87M/E201P、I91T/E201P/K439D/Y444H、E99P、S106T、L107A、L107A/K208N/V320I/G364S/V428K、L107A/K247A/Y249I/S252E/S254M/G364S、L107A/K247A/S252E、L107A/K247A/V428K、R109S、N159L、G169C、G169E、G169L、G169Q、G169V、K171S、K171T、K171V、T172H、T172N、Q177P、V179A、V179S、K190R、K190R/K208N/K247L/S252E/V428K、K222A、W233C、W233G、W233K、W233L、W233M、W233Q、W233Q/Q269R、W233V、K247A/Y249I/S252E/S254M/V320I/V428K、Y249I/S252E/S253G/S254M、Y249I/S252E/S254M/V428K、A251L、S252E/S253G/S254M、S253G/V320I、E259T、F264A、K289S、R296A、R296H、R296Q、D300G、R308L、R308L/F327L/K439D、S317R、E318T、V320I、V320I/G364S/V428K、V320I/V428K、D347H、D347K、D347P、D347R、G404T、N408R、R417P、Q424A、Q424W、A427L、A427R、V428E/D434N、V428F、V428I、V428K、V428Q、V428R、V428S、D431E、D431R、V435C、V435K、V435M、V435Q、V435R、V435T和A438Q,其中所述位置参照SEQ ID NO:5290来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQID NO:5344、5346、5348、5350、5352、5354、5356、5358、5360、5362、5364、5366、5368、5370、5372、5374、5376、5378、5380、5382、5384、5386、5388、5390、5392、5394、5396、5398、5400、5402、5404、5406、5408、5410、5412、5414、5416、5418、5420、5422、5424、5426、5428、5430、5432、5434、5436、5438、5440、5442、5444、5446、5448、5450、5452、5454、5456、5458、5460、5462、5464、5466、5468、5470、5472、5474、5476、5478、5480、5482、5484、5486、5488、5490、5492、5494、5496、5498、5500、5502、5504、5506、5508、5510、5512、5514、5516、5518、5520、5522、5524、5526、5528、5530、5532、5534、5536、5538、5540和5542。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:5344、5346、5348、5350、5352、5354、5356、5358、5360、5362、5364、5366、5368、5370、5372、5374、5376、5378、5380、5382、5384、5386、5388、5390、5392、5394、5396、5398、5400、5402、5404、5406、5408、5410、5412、5414、5416、5418、5420、5422、5424、5426、5428、5430、5432、5434、5436、5438、5440、5442、5444、5446、5448、5450、5452、5454、5456、5458、5460、5462、5464、5466、5468、5470、5472、5474、5476、5478、5480、5482、5484、5486、5488、5490、5492、5494、5496、5498、5500、5502、5504、5506、5508、5510、5512、5514、5516、5518、5520、5522、5524、5526、5528、5530、5532、5534、5536、5538、5540和5542。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:5344、5346、5348、5350、5352、5354、5356、5358、5360、5362、5364、5366、5368、5370、5372、5374、5376、5378、5380、5382、5384、5386、5388、5390、5392、5394、5396、5398、5400、5402、5404、5406、5408、5410、5412、5414、5416、5418、5420、5422、5424、5426、5428、5430、5432、5434、5436、5438、5440、5442、5444、5446、5448、5450、5452、5454、5456、5458、5460、5462、5464、5466、5468、5470、5472、5474、5476、5478、5480、5482、5484、5486、5488、5490、5492、5494、5496、5498、5500、5502、5504、5506、5508、5510、5512、5514、5516、5518、5520、5522、5524、5526、5528、5530、5532、5534、5536、5538、5540和5542。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、49、73、87、87/88、87/88/94/159/177/208、87/88/159/198、87/88/177/198/249、87/88/208、87/159/177、87/159/320、87/177/249、87/198、87/198/199、87/198/208/320、87/208、87/208/320、87/320、88、88/177、88/177/208、88/177/320、88/198、88/199、88/199/208、88/208、88/208/249/320、88/320、113、134、135、158、159/177/198、159/177/208、159/198/208/320、171、173、177/198、177/208、195、214、222、253、256、257、268、272、289、300、302、330、348、374、392、399、408、411、412、437、439、445和453,其中所述位置参照SEQ ID NO:5372来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2G、2H、2P、49A、73P、73T、87M、87M/88R、87M/88R/94K/159Q/177P/208E、87M/88R/159Q/198E、87M/88R/177P/198E/249I、87M/88R/208E、87M/159Q/177P、87M/159Q/320I、87M/177P/249I、87M/198E、87M/198E/199K、87M/198E/208E/320I、87M/208E、87M/208E/320I、87M/320I、88R、88R/177P、88R/177P/208E、88R/177P/320I、88R/198I、88R/199K、88R/199K/208E、88R/208E、88R/208E/249I/320I、88R/320I、113S、134G、134S、135A、158D、158E、159Q/177P/198E、159Q/177P/208E、159Q/198I/208E/320I、171T、173N、173P、177P/198E、177P/208E、195H、214L、222R、253G、256P、257A、257Q、268A、268G、268H、272K、289T、300G、302R、330D、348C、374K、374R、392D、399D、408D、411Q、412H、437I、437T、437V、439A、445T和453R,其中所述位置参照SEQ ID NO:5372来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E2G、E2H、E2P、F49A、E73P、E73T、W87M、W87M/I88R、W87M/I88R/E94K/N159Q/Q177P/K208E、W87M/I88R/N159Q/D198E、W87M/I88R/Q177P/D198E/Y249I、W87M/I88R/K208E、W87M/N159Q/Q177P、W87M/N159Q/V320I、W87M/Q177P/Y249I、W87M/D198E、W87M/D198E/A199K、W87M/D198E/K208E/V320I、W87M/K208E、W87M/K208E/V320I、W87M/V320I、I88R、I88R/Q177P、I88R/Q177P/K208E、I88R/Q177P/V320I、I88R/D198I、I88R/A199K、I88R/A199K/K208E、I88R/K208E、I88R/K208E/Y249I/V320I、I88R/V320I、E113S、D134G、D134S、S135A、P158D、P158E、N159Q/Q177P/D198E、N159Q/Q177P/K208E、N159Q/D198I/K208E/V320I、K171T、R173N、R173P、Q177P/D198E、Q177P/K208E、N195H、S214L、K222R、S253G、L256P、L257A、L257Q、D268A、D268G、D268H、P272K、K289T、D300G、K302R、E330D、A348C、S374K、S374R、K392D、N399D、N408D、R411Q、R412H、L437I、L437T、L437V、K439A、E445T和Y453R,其中所述位置参照SEQ IDNO:5372来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:5544、5546、5548、5550、5552、5554、5556、5558、5560、5562、5564、5566、5568、5570、5572、5574、5576、5578、5580、5582、5584、5586、5588、5590、5592、5594、5596、5598、5600、5602、5604、5606、5608、5610、5612、5614、5616、5618、5620、5622、5624、5626、5628、5630、5632、5634、5636、5638、5640、5642、5644、5646、5648、5650、5652、5654、5656、5658、5660、5662、5664、5666、5668、5670、5672、5674、5676、5678、5680、5682、5684、5686、5688和5690。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:5544、5546、5548、5550、5552、5554、5556、5558、5560、5562、5564、5566、5568、5570、5572、5574、5576、5578、5580、5582、5584、5586、5588、5590、5592、5594、5596、5598、5600、5602、5604、5606、5608、5610、5612、5614、5616、5618、5620、5622、5624、5626、5628、5630、5632、5634、5636、5638、5640、5642、5644、5646、5648、5650、5652、5654、5656、5658、5660、5662、5664、5666、5668、5670、5672、5674、5676、5678、5680、5682、5684、5686、5688和5690。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:5544、5546、5548、5550、5552、5554、5556、5558、5560、5562、5564、5566、5568、5570、5572、5574、5576、5578、5580、5582、5584、5586、5588、5590、5592、5594、5596、5598、5600、5602、5604、5606、5608、5610、5612、5614、5616、5618、5620、5622、5624、5626、5628、5630、5632、5634、5636、5638、5640、5642、5644、5646、5648、5650、5652、5654、5656、5658、5660、5662、5664、5666、5668、5670、5672、5674、5676、5678、5680、5682、5684、5686、5688和5690。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/7/107/233/252/253/320、2/7/107/233/252/253/320/408/428、2/7/233/252/253/320/427/428、2/233/252/317/320、7/107/190/233/252/253/317/408/427、7/107/233/252/253、7/107/233/252/317/320、7/107/233/252/317/408、7/190/233/252/253/320/427、7/190/233/252/317/320/427/428、7/190/233/252/408/427、7/233/252/253/317/408/427、7/233/252/253/408、7/233/252/317/320/427、7/233/252/317/428、64/169/201/347/392、64/172/264/268/347/392/417、91/94/171/172/201/264/347、91/201/264/347/392、94/201/264/347/435、107/190/233/252、107/190/233/252/317/320、107/233/252/253、107/252/317、169/171/172/264/392/435、169/171/201/264/392/435、169/172/201/264/347、169/172/201/264/347/392/435、169/172/201/347/392、169/172/201/417/435、171/172/201/264/392/417/435、171/201/392/417、190/233/252、190/233/252/253/317/320/408/428、190/233/252/317/408、190/233/252/320/408、201/264/347/392/417/435、201/264/347/392/435、201/264/347/417/435、233/252/253/317/320/427/428、233/252/253/408/427、233/252/317/408、233/252/317/427、233/252/320、233/252/320/408/428、348/374/435和374,其中所述位置参照SEQID NO:5562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2L/7P/233K/252E/253G/320I/427R/428R、2N/7P/107A/233K/252E/253G/320I、2N/7P/107A/233K/252E/253G/320I/408R/428R、2N/233K/252E/317R/320I、7P/107A/190R/233K/252E/253G/317R/408R/427R、7P/107A/233K/252E/253G、7P/107A/233K/252E/317R/320I、7P/107A/233K/252E/317R/408R、7P/190R/233K/252E/253G/320I/427L、7P/190R/233K/252E/317R/320I/427R/428R、7P/190R/233K/252E/408R/427R、7P/233K/252E/253G/317R/408R/427L、7P/233K/252E/253G/408R、7P/233K/252E/317R/320I/427L、7P/233K/252E/317R/428R、64S/169E/201P/347P/392H、64S/172H/264A/268V/347P/392H/417P、91T/94E/171T/172H/201P/264A/347G、91T/201P/264A/347G/392H、94E/201P/264A/347G/435Q、107A/190R/233K/252E、107A/190R/233K/252E/317R/320I、107A/233K/252E/253G、107A/252E/317R、169E/171T/172H/264A/392H/435Q、169E/171T/201P/264A/392H/435Q、169E/172H/201P/264A/347G、169E/172H/201P/264A/347K/392H/435R、169E/172H/201P/347G/392H、169E/172H/201P/417P/435R、171T/172H/201P/264A/392H/417P/435R、171T/201P/392H/417P、190R/233K/252E、190R/233K/252E/253G/317R/320I/408R/428R、190R/233K/252E/317R/408R、190R/233K/252E/320I/408R、201P/264A/347K/392H/417P/435R、201P/264A/347K/417P/435R、201P/264A/347P/392H/435Q、233K/252E/253G/317R/320I/427R/428R、233K/252E/253G/408R/427L、233K/252E/317R/408R、233K/252E/317R/427R、233K/252E/320I、233K/252E/320I/408R/428R、348S/374R/435R和374R,其中所述位置参照SEQ ID NO:5562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E2L/T7P/W233K/S252E/S253G/V320I/A427R/K428R、E2N/T7P/L107A/W233K/S252E/S253G/V320I、E2N/T7P/L107A/W233K/S252E/S253G/V320I/N408R/K428R、E2N/W233K/S252E/S317R/V320I、T7P/L107A/K190R/W233K/S252E/S253G/S317R/N408R/A427R、T7P/L107A/W233K/S252E/S253G、T7P/L107A/W233K/S252E/S317R/V320I、T7P/L107A/W233K/S252E/S317R/N408R、T7P/K190R/W233K/S252E/S253G/V320I/A427L、T7P/K190R/W233K/S252E/S317R/V320I/A427R/K428R、T7P/K190R/W233K/S252E/N408R/A427R、T7P/W233K/S252E/S253G/S317R/N408R/A427L、T7P/W233K/S252E/S253G/N408R、T7P/W233K/S252E/S317R/V320I/A427L、T7P/W233K/S252E/S317R/K428R、F64S/G169E/E201P/D347P/K392H、F64S/T172H/F264A/D268V/D347P/K392H/R417P、I91T/K94E/K171T/T172H/E201P/F264A/D347G、I91T/E201P/F264A/D347G/K392H、K94E/E201P/F264A/D347G/V435Q、L107A/K190R/W233K/S252E、L107A/K190R/W233K/S252E/S317R/V320I、L107A/W233K/S252E/S253G、L107A/S252E/S317R、G169E/K171T/T172H/F264A/K392H/V435Q、G169E/K171T/E201P/F264A/K392H/V435Q、G169E/T172H/E201P/F264A/D347G、G169E/T172H/E201P/F264A/D347K/K392H/V435R、G169E/T172H/E201P/D347G/K392H、G169E/T172H/E201P/R417P/V435R、K171T/T172H/E201P/F264A/K392H/R417P/V435R、K171T/E201P/K392H/R417P、K190R/W233K/S252E、K190R/W233K/S252E/S253G/S317R/V320I/N408R/K428R、K190R/W233K/S252E/S317R/N408R、K190R/W233K/S252E/V320I/N408R、E201P/F264A/D347K/K392H/R417P/V435R、E201P/F264A/D347K/R417P/V435R、E201P/F264A/D347P/K392H/V435Q、W233K/S252E/S253G/S317R/V320I/A427R/K428R、W233K/S252E/S253G/N408R/A427L、W233K/S252E/S317R/N408R、W233K/S252E/S317R/A427R、W233K/S252E/V320I、W233K/S252E/V320I/N408R/K428R、A348S/S374R/V435R和S374R,其中所述位置参照SEQ ID NO:5562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14、55、56、255、282、308、336、342、364、391、407和422,其中所述位置参照SEQ ID NO:5562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14I、55V、56A、255L、282S、308L、308Q、336Q、342W、364A、364S、391C、407C、407V和422Q,其中所述位置参照SEQ ID NO:5562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:V14I、S55V、L56A、S255L、T282S、R308L、R308Q、K336Q、E342W、G364A、G364S、L391C、E407C、E407V和M422Q,其中所述位置参照SEQ ID NO:5562来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:5692、5694、5696、5698、5700、5702、5704、5706、5708、5710、5712、5714、5716、5718、5720、5722、5724、5726、5728、5730、5732、5734、5736、5738、5740、5742、5744、5746、5748、5750、5752、5754、5756、5758、5760、5762、5764、5766、5768、5770、5772、5774、5776、5778、5780、5782、5784、5786、5788、5790、5792、5794、5796、5798、5800、5802、5804、5806、5808、5810、5812和5814。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:5692、5694、5696、5698、5700、5702、5704、5706、5708、5710、5712、5714、5716、5718、5720、5722、5724、5726、5728、5730、5732、5734、5736、5738、5740、5742、5744、5746、5748、5750、5752、5754、5756、5758、5760、5762、5764、5766、5768、5770、5772、5774、5776、5778、5780、5782、5784、5786、5788、5790、5792、5794、5796、5798、5800、5802、5804、5806、5808、5810、5812和5814。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:5692、5694、5696、5698、5700、5702、5704、5706、5708、5710、5712、5714、5716、5718、5720、5722、5724、5726、5728、5730、5732、5734、5736、5738、5740、5742、5744、5746、5748、5750、5752、5754、5756、5758、5760、5762、5764、5766、5768、5770、5772、5774、5776、5778、5780、5782、5784、5786、5788、5790、5792、5794、5796、5798、5800、5802、5804、5806、5808、5810、5812和5814。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/4/113/158/163/302/364/399/449、2/4/113/158/163/330/449、2/4/113/163/449、2/4/158/163/364/449、2/4/158/222/257/302/330、2/4/158/330、2/4/163/222/302/330/364/449、2/4/163/257、2/4/163/257/330/399/449、2/4/163/330/449、2/4/163/364、2/4/163/364/453、2/4/302、2/113、2/113/163、2/113/163/449、2/113/330/399、2/113/449、2/158/163、2/158/163/364/399、2/163/364/453、2/364/449、4/113/158/163/330/364/399、4/113/158/302/330/364、4/113/163/364/399、4/158/163/364/399、4/364/449、87、87/95/198、87/198、87/266、87/322、107/134/135/195/412/417、107/195/268/322/439、107/195/272、107/195/417/439、107/374/417/439、113/158/163/364/399、134、134/135/195/268/317、158/163/257/330/364/449、158/163/302/330/364/399、158/163/364、163/257/302/364、163/302/330/364/449、163/364、173、173/190/233/252/427/437、173/190/252/257/347/427/437、173/190/257/374/437、173/190/257/427/437、173/233/252/257/427、173/233/437、173/252、173/252/268/437、173/252/347/411、173/257/374/437、173/374/437、173/427/437、190/233/252/257/347/411/437、190/252、190/252/257/285/427、190/252/257/411/437、190/252/257/427、190/374/427/437、195/272/320/439、195/317/320、198、198/244、198/292、233/252、233/252/257、233/252/257/347、233/252/257/347/411/437、233/252/257/427/437、233/252/285、233/252/285/437、233/252/411/437、233/252/437、233/374、233/374/437、252/257、252/257/347/437、257/347/411/437、268/417、285/347/437、302/364、330/364、347/411/437、347/427/437、364/399、374、374/411/437、408/417、411/437和437,其中所述位置参照SEQID NO:5708来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2P/4T/113S/158D/163A/330D/449R、2P/4T/113S/158D/163R/302R/364S/399D/449R、2P/4T/113S/163R/449R、2P/4T/158D/163A/364S/449R、2P/4T/158D/222R/257Q/302R/330D、2P/4T/158D/330D、2P/4T/163A/257Q、2P/4T/163A/330D/449R、2P/4T/163A/364S、2P/4T/163A/364S/453R、2P/4T/163R/222R/302R/330D/364S/449R、2P/4T/163R/257Q/330D/399D/449R、2P/4T/302R、2P/113S、2P/113S/163A、2P/113S/163R/449R、2P/113S/330D/399D、2P/113S/449R、2P/158D/163A/364S/399D、2P/158D/163R、2P/163R/364S/453R、2P/364S/449R、4T/113S/158D/163A/330D/364S/399D、4T/113S/158D/302R/330D/364S、4T/113S/163A/364S/399D、4T/158D/163A/364S/399D、4T/364S/449R、87W、87W/95L/198E、87W/198E、87W/198I、87W/266L、87W/322S、107A/134S/135A/195H/412H/417P、107A/195H/268A/322L/439P、107A/195H/272K、107A/195H/417P/439P、107A/374T/417P/439P、113S/158D/163A/364S/399D、113S/158D/163R/364S/399D、134S、134S/135A/195H/268A/317R、158D/163A/257Q/330D/364S/449R、158D/163A/364S、158D/163R/302R/330D/364S/399D、163A/257Q/302R/364S、163A/364S、163R/302R/330D/364S/449R、173N、173N/190R/233K/252E/427R/437V、173N/190R/252E/257A/347G/427R/437I、173N/190R/257A/374K/437V、173N/190R/257A/427R/437I、173N/233K/252E/257A/427R、173N/233K/437I、173N/252E、173N/252E/268H/437V、173N/252E/347G/411Q、173N/257A/374K/437V、173N/374K/437I、173N/427R/437I、190R/233K/252E/257A/347G/411Q/437I、190R/252E、190R/252E/257A/285Q/427R、190R/252E/257A/411Q/437I、190R/252E/257A/427R、190R/374K/427R/437V、195H/272K/320I/439P、195H/317R/320I、198E、198E/292P、198I、198I/244L、233K/252E、233K/252E/257A、233K/252E/257A/347G、233K/252E/257A/347G/411Q/437I、233K/252E/257A/427R/437V、233K/252E/285Q、233K/252E/285Q/437V、233K/252E/411Q/437V、233K/252E/437V、233K/374K、233K/374K/437I、252E/257A、252E/257A/347G/437V、257A/347G/411Q/437V、268A/417P、285Q/347G/437V、302R/364S、330D/364S、347G/411Q/437I、347G/427R/437V、364S/399D、374K、374K/411Q/437I、374K/411Q/437V、408D/417P、411Q/437V和437I,其中所述位置参照SEQ ID NO:5708来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E2P/K4T/E113S/P158D/L163A/E330D/S449R、E2P/K4T/E113S/P158D/L163R/K302R/G364S/N399D/S449R、E2P/K4T/E113S/L163R/S449R、E2P/K4T/P158D/L163A/G364S/S449R、E2P/K4T/P158D/K222R/L257Q/K302R/E330D、E2P/K4T/P158D/E330D、E2P/K4T/L163A/L257Q、E2P/K4T/L163A/E330D/S449R、E2P/K4T/L163A/G364S、E2P/K4T/L163A/G364S/Y453R、E2P/K4T/L163R/K222R/K302R/E330D/G364S/S449R、E2P/K4T/L163R/L257Q/E330D/N399D/S449R、E2P/K4T/K302R、E2P/E113S、E2P/E113S/L163A、E2P/E113S/L163R/S449R、E2P/E113S/E330D/N399D、E2P/E113S/S449R、E2P/P158D/L163A/G364S/N399D、E2P/P158D/L163R、E2P/L163R/G364S/Y453R、E2P/G364S/S449R、K4T/E113S/P158D/L163A/E330D/G364S/N399D、K4T/E113S/P158D/K302R/E330D/G364S、K4T/E113S/L163A/G364S/N399D、K4T/P158D/L163A/G364S/N399D、K4T/G364S/S449R、M87W、M87W/H95L/D198E、M87W/D198E、M87W/D198I、M87W/W266L、M87W/P322S、L107A/D134S/S135A/N195H/R412H/R417P、L107A/N195H/D268A/P322L/K439P、L107A/N195H/P272K、L107A/N195H/R417P/K439P、L107A/S374T/R417P/K439P、E113S/P158D/L163A/G364S/N399D、E113S/P158D/L163R/G364S/N399D、D134S、D134S/S135A/N195H/D268A/S317R、P158D/L163A/L257Q/E330D/G364S/S449R、P158D/L163A/G364S、P158D/L163R/K302R/E330D/G364S/N399D、L163A/L257Q/K302R/G364S、L163A/G364S、L163R/K302R/E330D/G364S/S449R、R173N、R173N/K190R/W233K/S252E/A427R/L437V、R173N/K190R/S252E/L257A/K347G/A427R/L437I、R173N/K190R/L257A/S374K/L437V、R173N/K190R/L257A/A427R/L437I、R173N/W233K/S252E/L257A/A427R、R173N/W233K/L437I、R173N/S252E、R173N/S252E/D268H/L437V、R173N/S252E/K347G/R411Q、R173N/L257A/S374K/L437V、R173N/S374K/L437I、R173N/A427R/L437I、K190R/W233K/S252E/L257A/K347G/R411Q/L437I、K190R/S252E、K190R/S252E/L257A/E285Q/A427R、K190R/S252E/L257A/R411Q/L437I、K190R/S252E/L257A/A427R、K190R/S374K/A427R/L437V、N195H/P272K/V320I/K439P、N195H/S317R/V320I、D198E、D198E/L292P、D198I、D198I/P244L、W233K/S252E、W233K/S252E/L257A、W233K/S252E/L257A/K347G、W233K/S252E/L257A/K347G/R411Q/L437I、W233K/S252E/L257A/A427R/L437V、W233K/S252E/E285Q、W233K/S252E/E285Q/L437V、W233K/S252E/R411Q/L437V、W233K/S252E/L437V、W233K/S374K、W233K/S374K/L437I、S252E/L257A、S252E/L257A/K347G/L437V、L257A/K347G/R411Q/L437V、D268A/R417P、E285Q/K347G/L437V、K302R/G364S、E330D/G364S、K347G/R411Q/L437I、K347G/A427R/L437V、G364S/N399D、S374K、S374K/R411Q/L437I、S374K/R411Q/L437V、N408D/R417P、R411Q/L437V和L437I,其中所述位置参照SEQ ID NO:5708来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:5816、5818、5820、5822、5824、5826、5828、5830、5832、5834、5836、5838、5840、5842、5844、5846、5848、5850、5852、5854、5856、5858、5860、5862、5864、5866、5868、5870、5872、5874、5876、5878、5880、5882、5884、5886、5888、5890、5892、5894、5896、5898、5900、5902、5904、5906、5908、5910、5912、5914、5916、5918、5920、5922、5924、5926、5928、5930、5932、5934、5936、5938、5940、5942、5944、5946、5948、5950、5952、5954、5956、5958、5960、5962、5964、5966、5968、5970、5972、5974、5976、5978、5980、5982、5984、5986、5988、5990、5992、5994、5996、5998、6000、6002、6004、6006、6008、6010、6012和6014。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:5816、5818、5820、5822、5824、5826、5828、5830、5832、5834、5836、5838、5840、5842、5844、5846、5848、5850、5852、5854、5856、5858、5860、5862、5864、5866、5868、5870、5872、5874、5876、5878、5880、5882、5884、5886、5888、5890、5892、5894、5896、5898、5900、5902、5904、5906、5908、5910、5912、5914、5916、5918、5920、5922、5924、5926、5928、5930、5932、5934、5936、5938、5940、5942、5944、5946、5948、5950、5952、5954、5956、5958、5960、5962、5964、5966、5968、5970、5972、5974、5976、5978、5980、5982、5984、5986、5988、5990、5992、5994、5996、5998、6000、6002、6004、6006、6008、6010、6012和6014。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:5816、5818、5820、5822、5824、5826、5828、5830、5832、5834、5836、5838、5840、5842、5844、5846、5848、5850、5852、5854、5856、5858、5860、5862、5864、5866、5868、5870、5872、5874、5876、5878、5880、5882、5884、5886、5888、5890、5892、5894、5896、5898、5900、5902、5904、5906、5908、5910、5912、5914、5916、5918、5920、5922、5924、5926、5928、5930、5932、5934、5936、5938、5940、5942、5944、5946、5948、5950、5952、5954、5956、5958、5960、5962、5964、5966、5968、5970、5972、5974、5976、5978、5980、5982、5984、5986、5988、5990、5992、5994、5996、5998、6000、6002、6004、6006、6008、6010、6012和6014。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/4/14/158/282/364/449、2/4/14/158/282/407、2/4/14/163/198、2/4/14/163/282/399、2/4/14/198/308/407、2/4/14/282/308/364、2/4/14/282/308/407、2/4/14/282/364、2/4/158/163/364/399/407、2/4/158/198/282/364/407、2/4/163/198/282/308/342、2/4/163/282/342/364、2/4/163/364/399/449、2/4/198/282/449、2/4/198/364/391/449、2/4/282/342/364/407、2/14/158/198/407/449、2/14/163/308/364、2/14/163/364/407、2/14/282、2/14/282/308、2/14/282/308/364、2/14/282/399、2/14/308、2/14/308/364、2/158/163/407/449、2/163/282、2/163/282/308/364、2/198/282/308/342、2/198/282/399、2/282、2/282/308/342/407、2/282/308/391/407、2/282/399、2/282/399/407、2/308、2/308/364/399、4/14/158/163/198/282/407、4/14/158/282/364/391/407、4/14/163/282、4/14/163/282/308/342/407/449、4/14/198/308/364、4/14/282、4/14/282/308/364/407/449、4/14/282/342/399/407、4/14/364/391、4/158/282/364/399、4/163/282/308/407、4/198/399/407、4/282/342/364/407、4/282/364/407、4/364、12、14/158/163/198/364、14/158/163/282/364、14/158/198/282/342/364/449、14/158/364、14/163/198/282/342/364/449、14/163/282/308、14/282、14/282/308、14/282/342/364/391、14/282/364、14/282/364/391/407/449、14/282/399/407/449、14/407、37、44、70、71/331、74、75、90、106、108、112、114、115、131、138、139、156、158/282/407、158/282/407/449、158/364/399/407/449、158/364/449、162、163/198/282/342、163/282/308/364/399、163/282/399/407、163/282/407/449、174、198/282/308/342、198/282/407、198/308、247、248、254、258、282/308/342/364/449、282/308/449、365、389、401/402、416、427、429、432、433和456,其中所述位置参照SEQ ID NO:5976来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2P/4T/14I/158D/282S/364A/449R、2P/4T/14I/158D/282S/407V、2P/4T/14I/163A/198E、2P/4T/14I/163A/282S/399D、2P/4T/14I/198E/308L/407V、2P/4T/14I/282S/308L/364A、2P/4T/14I/282S/308L/407V、2P/4T/14I/282S/364A、2P/4T/158D/163A/364A/399D/407V、2P/4T/158D/198E/282S/364A/407V、2P/4T/163A/198E/282S/308L/342W、2P/4T/163A/282S/342W/364A、2P/4T/163A/364A/399D/449R、2P/4T/198E/282S/449R、2P/4T/198E/364A/391C/449R、2P/4T/282S/342W/364A/407V、2P/14I/158D/198E/407V/449R、2P/14I/163A/308L/364A、2P/14I/163A/364A/407V、2P/14I/282S、2P/14I/282S/308L、2P/14I/282S/308L/364A、2P/14I/282S/399D、2P/14I/308L、2P/14I/308L/364A、2P/158D/163A/407V/449R、2P/163A/282S、2P/163A/282S/308L/364A、2P/198E/282S/308L/342W、2P/198E/282S/399D、2P/282S、2P/282S/308L/342W/407V、2P/282S/308L/391C/407V、2P/282S/399D、2P/282S/399D/407V、2P/308L、2P/308L/364A/399D、4T/14I/158D/163A/198E/282S/407V、4T/14I/158D/282S/364A/391C/407V、4T/14I/163A/282S、4T/14I/163A/282S/308L/342W/407V/449R、4T/14I/198E/308L/364A、4T/14I/282S、4T/14I/282S/308L/364A/407V/449R、4T/14I/282S/342W/399D/407V、4T/14I/364A/391C、4T/158D/282S/364A/399D、4T/163A/282S/308L/407V、4T/198E/399D/407V、4T/282S/342W/364A/407V、4T/282S/364A/407V、4T/364A、12S、14I/158D/163A/198E/364A、14I/158D/163A/282S/364A、14I/158D/198E/282S/342W/364A/449R、14I/158D/364A、14I/163A/198E/282S/342W/364A/449R、14I/163A/282S/308L、14I/282S、14I/282S/308L、14I/282S/342W/364A/391C、14I/282S/364A、14I/282S/364A/391C/407V/449R、14I/282S/399D/407V/449R、14I/407V、37R、44V、70K、71L/331K、74H、75G、75M、90Q、90S、90T、106Y、108H、112N、114P、115R、131V、138V、139A、139R、139S、156C、158D/282S/407V、158D/282S/407V/449R、158D/364A/399D/407V/449R、158D/364A/449R、162A、163A/198E/282S/342W、163A/282S/308L/364A/399D、163A/282S/399D/407V、163A/282S/407V/449R、174P、198E/282S/308L/342W、198E/282S/407V、198E/308L、247C、247L、248C、248L、248W、254Q、258N、282S/308L/342W/364A/449R、282S/308L/449R、365I、389A、389E、389S、401F/402L、416L、416S、427K、427R、429W、432L、433L和456R,其中所述位置参照SEQ ID NO:5976来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E2P/K4T/V14I/P158D/T282S/G364A/S449R、E2P/K4T/V14I/P158D/T282S/E407V、E2P/K4T/V14I/L163A/D198E、E2P/K4T/V14I/L163A/T282S/N399D、E2P/K4T/V14I/D198E/R308L/E407V、E2P/K4T/V14I/T282S/R308L/G364A、E2P/K4T/V14I/T282S/R308L/E407V、E2P/K4T/V14I/T282S/G364A、E2P/K4T/P158D/L163A/G364A/N399D/E407V、E2P/K4T/P158D/D198E/T282S/G364A/E407V、E2P/K4T/L163A/D198E/T282S/R308L/E342W、E2P/K4T/L163A/T282S/E342W/G364A、E2P/K4T/L163A/G364A/N399D/S449R、E2P/K4T/D198E/T282S/S449R、E2P/K4T/D198E/G364A/L391C/S449R、E2P/K4T/T282S/E342W/G364A/E407V、E2P/V14I/P158D/D198E/E407V/S449R、E2P/V14I/L163A/R308L/G364A、E2P/V14I/L163A/G364A/E407V、E2P/V14I/T282S、E2P/V14I/T282S/R308L、E2P/V14I/T282S/R308L/G364A、E2P/V14I/T282S/N399D、E2P/V14I/R308L、E2P/V14I/R308L/G364A、E2P/P158D/L163A/E407V/S449R、E2P/L163A/T282S、E2P/L163A/T282S/R308L/G364A、E2P/D198E/T282S/R308L/E342W、E2P/D198E/T282S/N399D、E2P/T282S、E2P/T282S/R308L/E342W/E407V、E2P/T282S/R308L/L391C/E407V、E2P/T282S/N399D、E2P/T282S/N399D/E407V、E2P/R308L、E2P/R308L/G364A/N399D、K4T/V14I/P158D/L163A/D198E/T282S/E407V、K4T/V14I/P158D/T282S/G364A/L391C/E407V、K4T/V14I/L163A/T282S、K4T/V14I/L163A/T282S/R308L/E342W/E407V/S449R、K4T/V14I/D198E/R308L/G364A、K4T/V14I/T282S、K4T/V14I/T282S/R308L/G364A/E407V/S449R、K4T/V14I/T282S/E342W/N399D/E407V、K4T/V14I/G364A/L391C、K4T/P158D/T282S/G364A/N399D、K4T/L163A/T282S/R308L/E407V、K4T/D198E/N399D/E407V、K4T/T282S/E342W/G364A/E407V、K4T/T282S/G364A/E407V、K4T/G364A、R12S、V14I/P158D/L163A/D198E/G364A、V14I/P158D/L163A/T282S/G364A、V14I/P158D/D198E/T282S/E342W/G364A/S449R、V14I/P158D/G364A、V14I/L163A/D198E/T282S/E342W/G364A/S449R、V14I/L163A/T282S/R308L、V14I/T282S、V14I/T282S/R308L、V14I/T282S/E342W/G364A/L391C、V14I/T282S/G364A、V14I/T282S/G364A/L391C/E407V/S449R、V14I/T282S/N399D/E407V/S449R、V14I/E407V、S37R、I44V、P70K、Q71L/R331K、W74H、L75G、L75M、P90Q、P90S、P90T、S106Y、M108H、P112N、D114P、E115R、P131V、L138V、P139A、P139R、P139S、S156C、P158D/T282S/E407V、P158D/T282S/E407V/S449R、P158D/G364A/N399D/E407V/S449R、P158D/G364A/S449R、E162A、L163A/D198E/T282S/E342W、L163A/T282S/R308L/G364A/N399D、L163A/T282S/N399D/E407V、L163A/T282S/E407V/S449R、L174P、D198E/T282S/R308L/E342W、D198E/T282S/E407V、D198E/R308L、K247C、K247L、H248C、H248L、H248W、S254Q、D258N、T282S/R308L/E342W/G364A/S449R、T282S/R308L/S449R、V365I、D389A、D389E、D389S、L401F/E402L、D416L、D416S、A427K、A427R、L429W、K432L、A433L和S456R,其中所述位置参照SEQ ID NO:5976来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:6016、6018、6020、6022、6024、6026、6028、6030、6032、6034、6036、6038、6040、6042、6044、6046、6048、6050、6052、6054、6056、6058、6060、6062、6064、6066、6068、6070、6072、6074、6076、6078、6080、6082、6084、6086、6088、6090、6092、6094、6096、6098、6100、6102、6104、6106、6108、6110、6112、6114、6116、6118、6120、6122、6124、6126、6128、6130、6132、6134、6136、6138、6140、6142、6144、6146、6148、6150、6152、6154、6156、6158、6160、6162、6164、6166、6168、6170、6172、6174、6176、6178、6180、6182、6184、6186、6188、6190、6192、6194、6196、6198、6200、6202、6204、6206、6208、6210、6212、6214、6216、6218、6220、6222、6224、6226、6228、6230、6232、6234、6236、6238、6240、6242、6244、6246、6248、6250、6252、6254、6256、6258和6260。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:6016、6018、6020、6022、6024、6026、6028、6030、6032、6034、6036、6038、6040、6042、6044、6046、6048、6050、6052、6054、6056、6058、6060、6062、6064、6066、6068、6070、6072、6074、6076、6078、6080、6082、6084、6086、6088、6090、6092、6094、6096、6098、6100、6102、6104、6106、6108、6110、6112、6114、6116、6118、6120、6122、6124、6126、6128、6130、6132、6134、6136、6138、6140、6142、6144、6146、6148、6150、6152、6154、6156、6158、6160、6162、6164、6166、6168、6170、6172、6174、6176、6178、6180、6182、6184、6186、6188、6190、6192、6194、6196、6198、6200、6202、6204、6206、6208、6210、6212、6214、6216、6218、6220、6222、6224、6226、6228、6230、6232、6234、6236、6238、6240、6242、6244、6246、6248、6250、6252、6254、6256、6258和6260。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/113/158、14/113/158/163、14/113/158/163/190/257/308/342、14/113/158/163/437、14/113/158/308/317/330/449、14/113/163/190/308/317、14/113/163/257/308/342/437/449、14/113/163/257/437、14/113/163/308/317/320/322/330/449、14/113/320/437/449、14/158、14/158/163/190/257/308/317/330/437、14/158/163/190/342/437、14/158/163/257、14/158/163/257/308/449、14/158/257/308/437/449、14/158/317/320/330/437、14/163/317/320、14/190、14/190/257/317/320/322、14/257/308/320/322/330、14/257/308/322/330/437、14/317、14/330、14/449、19、29/375、41、45、46、71、72、80、81、83、84、85、88、95、105、113/158/163/190/257/437、113/158/163/190/308/317/322、113/158/163/190/308/320、113/158/163/257/308/317/322/437/449、113/158/190/257/320、113/158/190/320/322/449、113/158/320/322/437、113/257/308、113/257/317/322/437、155、158/163、158/163/190/257/308/342/449、158/163/308、158/163/322/437、158/308/320/437、158/320/437/449、163/308/330/437/449、168、190/449、197、199、202、209、243、249、263、273、317/320/322/330、322/330、366、375和383,其中所述位置参照SEQ ID NO:6138来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14I/113S/158P、14I/113S/158P/163A、14I/113S/158P/163A/190R/257Q/308L/342W、14I/113S/158P/163A/437I、14I/113S/158P/308L/317R/330D/449R、14I/113S/163A/190R/308L/317R、14I/113S/163A/257Q/308L/342W/437I/449R、14I/113S/163A/257Q/437I、14I/113S/163A/308L/317R/320I/322L/330D/449R、14I/113S/320I/437I/449R、14I/158P、14I/158P/163A/190R/257Q/308L/317R/330D/437I、14I/158P/163A/190R/342W/437I、14I/158P/163A/257Q、14I/158P/163A/257Q/308L/449R、14I/158P/257Q/308L/437I/449R、14I/158P/317R/320I/330D/437I、14I/163A/317R/320I、14I/190R、14I/190R/257Q/317R/320I/322L、14I/257Q/308L/320I/322L/330D、14I/257Q/308L/322L/330D/437I、14I/317R、14I/330D、14I/449R、19Q、29M/375P、41A、45L、46S、71V、72S、72T、80P、81T、83A、83K、83N、83S、83T、84D、84H、84N、85L、88A、88C、88H、88K、88T、95N、105A、113S/158P/163A/190R/257Q/437I、113S/158P/163A/190R/308L/317R/322L、113S/158P/163A/190R/308L/320I、113S/158P/163A/257Q/308L/317R/322L/437I/449R、113S/158P/190R/257Q/320I、113S/158P/190R/320I/322L/449R、113S/158P/320I/322L/437I、113S/257Q/308L、113S/257Q/317R/322L/437I、155L、158P/163A、158P/163A/190R/257Q/308L/342W/449R、158P/163A/308L、158P/163A/322L/437I、158P/308L/320I/437I、158P/320I/437I/449R、163A/308L/330D/437I/449R、168C、168T、190R/449R、197K、199E、199H、199M、199Q、199Y、202H、202Q、202T、202V、209T、243I、249S、263T、273A、273H、273R、317R/320I/322L/330D、322L/330D、366C、366L、366S、366T、366V、375A、375P、375T、375V和383V,其中所述位置参照SEQ ID NO:6138来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:V14I/E113S/D158P、V14I/E113S/D158P/L163A、V14I/E113S/D158P/L163A/K190R/L257Q/R308L/E342W、V14I/E113S/D158P/L163A/L437I、V14I/E113S/D158P/R308L/S317R/E330D/S449R、V14I/E113S/L163A/K190R/R308L/S317R、V14I/E113S/L163A/L257Q/R308L/E342W/L437I/S449R、V14I/E113S/L163A/L257Q/L437I、V14I/E113S/L163A/R308L/S317R/V320I/P322L/E330D/S449R、V14I/E113S/V320I/L437I/S449R、V14I/D158P、V14I/D158P/L163A/K190R/L257Q/R308L/S317R/E330D/L437I、V14I/D158P/L163A/K190R/E342W/L437I、V14I/D158P/L163A/L257Q、V14I/D158P/L163A/L257Q/R308L/S449R、V14I/D158P/L257Q/R308L/L437I/S449R、V14I/D158P/S317R/V320I/E330D/L437I、V14I/L163A/S317R/V320I、V14I/K190R、V14I/K190R/L257Q/S317R/V320I/P322L、V14I/L257Q/R308L/V320I/P322L/E330D、V14I/L257Q/R308L/P322L/E330D/L437I、V14I/S317R、V14I/E330D、V14I/S449R、V19Q、L29M/D375P、S41A、F45L、H46S、Q71V、D72S、D72T、T80P、H81T、P83A、P83K、P83N、P83S、P83T、G84D、G84H、G84N、A85L、R88A、R88C、R88H、R88K、R88T、H95N、E105A、E113S/D158P/L163A/K190R/L257Q/L437I、E113S/D158P/L163A/K190R/R308L/S317R/P322L、E113S/D158P/L163A/K190R/R308L/V320I、E113S/D158P/L163A/L257Q/R308L/S317R/P322L/L437I/S449R、E113S/D158P/K190R/L257Q/V320I、E113S/D158P/K190R/V320I/P322L/S449R、E113S/D158P/V320I/P322L/L437I、E113S/L257Q/R308L、E113S/L257Q/S317R/P322L/L437I、V155L、D158P/L163A、D158P/L163A/K190R/L257Q/R308L/E342W/S449R、D158P/L163A/R308L、D158P/L163A/P322L/L437I、D158P/R308L/V320I/L437I、D158P/V320I/L437I/S449R、L163A/R308L/E330D/L437I/S449R、P168C、P168T、K190R/S449R、Q197K、A199E、A199H、A199M、A199Q、A199Y、I202H、I202Q、I202T、I202V、E209T、L243I、Y249S、V263T、S273A、S273H、S273R、S317R/V320I/P322L/E330D、P322L/E330D、A366C、A366L、A366S、A366T、A366V、D375A、D375P、D375T、D375V和N383V,其中所述位置参照SEQ ID NO:6138来编号。
在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:6262、6264、6266、6268、6270、6272、6274、6276、6278、6280、6282、6284、6286、6288、6290、6292、6294、6296、6298、6300、6302、6304、6306、6308、6310、6312、6314、6316、6318、6320、6322、6324、6326、6328、6330、6332、6334、6336、6338、6340、6342、6344、6346、6348、6350、6352、6354、6356、6358、6360、6362、6364、6366、6368、6370、6372、6374、6376、6378、6380、6382、6384、6386、6388、6390、6392、6394、6396、6398、6400、6402、6404、6406、6408、6410、6412、6414、6416、6418、6420、6422、6424、6426、6428、6430、6432、6434、6436、6438、6440、6442、6444、6446、6448、6450、6452、6454、6456、6458和6460。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:6262、6264、6266、6268、6270、6272、6274、6276、6278、6280、6282、6284、6286、6288、6290、6292、6294、6296、6298、6300、6302、6304、6306、6308、6310、6312、6314、6316、6318、6320、6322、6324、6326、6328、6330、6332、6334、6336、6338、6340、6342、6344、6346、6348、6350、6352、6354、6356、6358、6360、6362、6364、6366、6368、6370、6372、6374、6376、6378、6380、6382、6384、6386、6388、6390、6392、6394、6396、6398、6400、6402、6404、6406、6408、6410、6412、6414、6416、6418、6420、6422、6424、6426、6428、6430、6432、6434、6436、6438、6440、6442、6444、6446、6448、6450、6452、6454、6456、6458和6460。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ IDNO:6262、6264、6266、6268、6270、6272、6274、6276、6278、6280、6282、6284、6286、6288、6290、6292、6294、6296、6298、6300、6302、6304、6306、6308、6310、6312、6314、6316、6318、6320、6322、6324、6326、6328、6330、6332、6334、6336、6338、6340、6342、6344、6346、6348、6350、6352、6354、6356、6358、6360、6362、6364、6366、6368、6370、6372、6374、6376、6378、6380、6382、6384、6386、6388、6390、6392、6394、6396、6398、6400、6402、6404、6406、6408、6410、6412、6414、6416、6418、6420、6422、6424、6426、6428、6430、6432、6434、6436、6438、6440、6442、6444、6446、6448、6450、6452、6454、6456、6458和6460。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:37/71/125/174/247/248/427、37/71/247/331/365/389/401/429、37/139/329/365/427/433/449、37/139/427/432/433/449、37/139/429/432/433、37/174/401/402/433/449、37/248/331/389/427/433、37/248/389/401/429、37/331/432/433、71/139/389/427/429/432/433/449、71/174/329/427/429/432/433、71/174/365/427/432、71/248/365/389/401、71/248/449、71/254/433/449、71/427/432/433/449、71/432/433、139/156/174/389/401/427/433/449、139/156/247/365/401/433/449、139/156/247/389/401/427/433/449、139/156/248/389、139/156/248/389/401/416/427/429/433、139/156/365、139/174/248/331/389/401/449、139/174/254、139/174/365/401/402/427/433/449、139/247/248/331/401/417/432/449、139/248/254/449、139/248/402/416/427/433/449、139/248/432/433、139/254/401/416/427/433/449、139/401/449、156/248/256、156/254/331/365/427/432/449、156/389/401/402/416/432/433、174/247/248/389/401/432/433、174/329/432/449、174/365、174/389/429/432/433/449、247/248/401、247/248/449、247/331/401/427/432/449、247/401、247/427/432、248/331/427/429/433、248/365/389/427/429/432/449、248/401/429/432/433、248/416、248/416/449、248/449、254/365、254/427/433、331/365/429/432/433/449、365/401/402/429/432/433、389/401/416/432/449、389/401/427/432、401/427、416/427/433/449、416/432/433、416/432/433/449、427/432、427/432/449、432和433/449,其中所述位置参照SEQ ID NO:6288来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:37R/71L/125M/174P/247C/248W/427R、37R/71L/247C/331K/365I/389E/401F/429W、37R/139K/329P/365I/427R/433L/449R、37R/139K/427R/432L/433L/449R、37R/139K/429W/432L/433L、37R/174P/401F/402L/433L/449R、37R/248W/331K/389E/427R/433L、37R/248W/389A/401F/429W、37R/331K/432L/433L、71L/139K/389A/427R/429W/432L/433L/449R、71L/174P/329P/427R/429W/432L/433L、71L/174P/365I/427R/432L、71L/248W/365I/389A/401F、71L/248W/449R、71L/254Q/433L/449R、71L/427R/432L/433L/449R、71L/432L/433L、139K/156C/174P/389E/401F/427R/433L/449R、139K/156C/247C/365I/401F/433L/449R、139K/156C/247L/389E/401F/427R/433L/449R、139K/156C/248W/389A/401F/416S/427R/429W/433L、139K/156C/248W/389E、139K/156C/365I、139K/174P/248W/331K/389A/401F/449R、139K/174P/254Q、139K/174P/365I/401F/402L/427R/433L/449R、139K/247C/248W/331K/401F/417Q/432L/449R、139K/248W/254A/449R、139K/248W/402L/416L/427R/433L/449R、139K/248W/432L/433L、139K/254Q/401F/416S/427R/433L/449R、139K/401F/449R、156C/248W/256M、156C/254Q/331K/365I/427R/432L/449R、156C/389E/401F/402L/416L/432L/433L、174P/247C/248W/389A/401F/432L/433L、174P/329P/432L/449R、174P/365I、174P/389E/429W/432L/433L/449R、247C/248W/401F、247C/331K/401F/427R/432L/449R、247C/427R/432L、247L/248W/449R、247L/401F、248W/331K/427R/429W/433L、248W/365I/389E/427R/429W/432L/449R、248W/401F/429W/432L/433L、248W/416L、248W/416L/449R、248W/449R、254Q/365I、254Q/427R/433L、331K/365I/429W/432L/433L/449R、365I/401F/402L/429W/432L/433L、389A/401F/416S/432L/449R、389E/401F/427R/432L、401F/427R、416L/427R/433L/449R、416L/432L/433L/449R、416S/432L/433L、427R/432L、427R/432L/449R、432L和433L/449R,其中所述位置参照SEQ ID NO:6288来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:S37R/Q71L/L125M/L174P/K247C/H248W/A427R、S37R/Q71L/K247C/R331K/V365I/D389E/L401F/L429W、S37R/P139K/G329P/V365I/A427R/A433L/S449R、S37R/P139K/A427R/K432L/A433L/S449R、S37R/P139K/L429W/K432L/A433L、S37R/L174P/L401F/E402L/A433L/S449R、S37R/H248W/R331K/D389E/A427R/A433L、S37R/H248W/D389A/L401F/L429W、S37R/R331K/K432L/A433L、Q71L/P139K/D389A/A427R/L429W/K432L/A433L/S449R、Q71L/L174P/G329P/A427R/L429W/K432L/A433L、Q71L/L174P/V365I/A427R/K432L、Q71L/H248W/V365I/D389A/L401F、Q71L/H248W/S449R、Q71L/S254Q/A433L/S449R、Q71L/A427R/K432L/A433L/S449R、Q71L/K432L/A433L、P139K/S156C/L174P/D389E/L401F/A427R/A433L/S449R、P139K/S156C/K247C/V365I/L401F/A433L/S449R、P139K/S156C/K247L/D389E/L401F/A427R/A433L/S449R、P139K/S156C/H248W/D389A/L401F/D416S/A427R/L429W/A433L、P139K/S156C/H248W/D389E、P139K/S156C/V365I、P139K/L174P/H248W/R331K/D389A/L401F/S449R、P139K/L174P/S254Q、P139K/L174P/V365I/L401F/E402L/A427R/A433L/S449R、P139K/K247C/H248W/R331K/L401F/P417Q/K432L/S449R、P139K/H248W/S254A/S449R、P139K/H248W/E402L/D416L/A427R/A433L/S449R、P139K/H248W/K432L/A433L、P139K/S254Q/L401F/D416S/A427R/A433L/S449R、P139K/L401F/S449R、S156C/H248W/L256M、S156C/S254Q/R331K/V365I/A427R/K432L/S449R、S156C/D389E/L401F/E402L/D416L/K432L/A433L、L174P/K247C/H248W/D389A/L401F/K432L/A433L、L174P/G329P/K432L/S449R、L174P/V365I、L174P/D389E/L429W/K432L/A433L/S449R、K247C/H248W/L401F、K247C/R331K/L401F/A427R/K432L/S449R、K247C/A427R/K432L、K247L/H248W/S449R、K247L/L401F、H248W/R331K/A427R/L429W/A433L、H248W/V365I/D389E/A427R/L429W/K432L/S449R、H248W/L401F/L429W/K432L/A433L、H248W/D416L、H248W/D416L/S449R、H248W/S449R、S254Q/V365I、S254Q/A427R/A433L、R331K/V365I/L429W/K432L/A433L/S449R、V365I/L401F/E402L/L429W/K432L/A433L、D389A/L401F/D416S/K432L/S449R、D389E/L401F/A427R/K432L、L401F/A427R、D416L/A427R/A433L/S449R、D416L/K432L/A433L/S449R、D416S/K432L/A433L、A427R/K432L、A427R/K432L/S449R、K432L和A433L/S449R,其中所述位置参照SEQ ID NO:6288来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5/449、6、10、25、25/449、69、69/449、87、87/449、91、91/449、144/449、153、153/449、159、159/449、172、172/449、212/449、233、233/449、288/449、303、317、347/449、361、369和421,其中所述位置参照SEQ ID NO:6288来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5S/449R、6P、10K、25I/449R、25M/449R、25Q/449R、25S、69A、69M/449R、87A/449R、87E、87K、87Q、87R、91L、91N/449R、91Q、91T/449R、91V、144Q/449R、153T/449R、153V、159K、159R/449R、172S、172T/449R、212L/449R、233A、233C、233G、233L/449R、233M/449R、233Q/449R、233R、233S、233V、288P/449R、303C、303V、317Y、347P/449R、361C、369K和421I,其中所述位置参照SEQ ID NO:6288来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:T5S/S449R、E6P、R10K、L25I/S449R、L25M/S449R、L25Q/S449R、L25S、D69A、D69M/S449R、M87A/S449R、M87E、M87K、M87Q、M87R、I91L、I91N/S449R、I91Q、I91T/S449R、I91V、M144Q/S449R、A153T/S449R、A153V、Q159K、Q159R/S449R、H172S、H172T/S449R、A212L/S449R、W233A、W233C、W233G、W233L/S449R、W233M/S449R、W233Q/S449R、W233R、W233S、W233V、E288P/S449R、Q303C、Q303V、S317Y、K347P/S449R、T361C、V369K和V421I,其中所述位置参照SEQ ID NO:6288来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:6462、6464、6466、6468、6470、6472、6474、6476、6478、6480、6482、6484、6486、6488、6490、6492、6494、6496、6498、6500、6502、6504、6506、6508、6510、6512、6514、6516、6518、6520、6522、6524、6526、6528、6530、6532、6534、6536、6538、6540、6542、6544、6546、6548、6550、6552、6554、6556、6558、6560、6562、6564、6566、6568、6570、6572、6574、6576、6578、6580、6582、6584、6586、6588、6590、6592、6594、6596、6598、6600、6602、6604、6606、6608、6610、6612、6614、6616、6618、6620、6622、6624、6626、6628、6630、6632、6634、6636、6638、6640、6642、6644、6646、6648、6650、6652、6654、6656、6658、6660、6662、6664、6666、6668、6670、6672、6674和6676。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:6462、6464、6466、6468、6470、6472、6474、6476、6478、6480、6482、6484、6486、6488、6490、6492、6494、6496、6498、6500、6502、6504、6506、6508、6510、6512、6514、6516、6518、6520、6522、6524、6526、6528、6530、6532、6534、6536、6538、6540、6542、6544、6546、6548、6550、6552、6554、6556、6558、6560、6562、6564、6566、6568、6570、6572、6574、6576、6578、6580、6582、6584、6586、6588、6590、6592、6594、6596、6598、6600、6602、6604、6606、6608、6610、6612、6614、6616、6618、6620、6622、6624、6626、6628、6630、6632、6634、6636、6638、6640、6642、6644、6646、6648、6650、6652、6654、6656、6658、6660、6662、6664、6666、6668、6670、6672、6674和6676。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:6462、6464、6466、6468、6470、6472、6474、6476、6478、6480、6482、6484、6486、6488、6490、6492、6494、6496、6498、6500、6502、6504、6506、6508、6510、6512、6514、6516、6518、6520、6522、6524、6526、6528、6530、6532、6534、6536、6538、6540、6542、6544、6546、6548、6550、6552、6554、6556、6558、6560、6562、6564、6566、6568、6570、6572、6574、6576、6578、6580、6582、6584、6586、6588、6590、6592、6594、6596、6598、6600、6602、6604、6606、6608、6610、6612、6614、6616、6618、6620、6622、6624、6626、6628、6630、6632、6634、6636、6638、6640、6642、6644、6646、6648、6650、6652、6654、6656、6658、6660、6662、6664、6666、6668、6670、6672、6674和6676。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:37/41/45/72/81/83/84/88/155/163/168/190/331/375、37/41/45/72/81/83/84/88/155/263/273/331/375/432、37/41/45/72/81/83/84/88/155/331/366/375、37/41/45/72/81/83/84/88/155/331/375、37/41/45/72/81/83/84/88/248/375、37/41/45/72/81/83/84/88/331/366/432/433、37/41/45/72/88/155/168/190/331/366/375/432、37/41/45/72/88/155/168/190/331/375、37/41/45/72/88/190/263/273/331/366、37/41/45/72/155/163/168/190/243/263/273/331/366/432、37/41/45/72/155/163/168/243/248/273/331/366/432/433、37/41/45/72/155/163/168/263/366/432/433、37/41/45/72/155/163/331/366/375、37/41/45/72/155/190/243/248/273/331/432/433、37/41/45/72/155/190/248/263/331、37/41/45/72/155/190/263/331/366、37/41/45/72/155/190/273/331/366/375、37/41/45/72/155/190/273/366、37/41/45/72/155/190/273/366/375/432、37/41/45/72/155/248/263/273/366、37/41/45/72/155/263/331/375、37/41/45/72/155/263/375、37/41/45/72/155/273/366、37/41/45/72/155/331/366/375/432/433、37/41/45/72/190/263/273/331、37/41/45/72/190/331/366、37/41/45/72/190/366、37/41/45/72/263/331/366、37/41/45/72/263/366/432/433、37/41/45/72/331/366、37/41/45/81/83/84/88/155/168/190/243/331/366、37/41/45/81/83/84/88/155/168/331/375、37/41/45/81/83/84/88/155/263/273/331/366、37/41/45/81/83/84/88/163/168/263/273/331/366/375、37/41/45/155/163/168/263/331/375、37/41/45/155/168/248/273/331/375、37/41/45/155/190/331/366/375、37/41/45/155/366、37/41/45/155/366/432/433、37/41/45/155/375、37/41/45/243/248/273/331、37/41/45/263/331/375/432、37/41/45/331/366/432/433、37/72/81/83/88/155/190、37/72/197/273/331/375/432、37/83/263/365/366/375、37/190/202、41/45/72/155/263/331/366/375/432/433、41/45/163/168/243/248/273/366/432、45/72/84/88/197/375、45/72/88/366、45/72/163/202/365/366/375、45/72/168/243/331/365/366/429/432、45/84/168/190/199/254/273/365/366、45/163/168/190/199/366/429/432、45/163/168/197/263/331/365/366、72/81/83/84/88/155/163/168/190/366、72/81/83/84/88/155/190、72/81/83/84/88/155/190/273/331/366/432、72/81/83/84/88/155/273/331/375、72/81/83/84/88/155/366、72/81/83/84/88/163/168/190/243/263/331/366、72/81/83/84/88/163/168/263/331/375、72/81/84/190/248、72/83/84/88/202/254/273/366/375、72/83/84/197/202/243/263/365/366、72/83/88/243/263/331/365/366、72/155/163/168/190/366/432/433、72/155/190、72/155/190/263/331/366、72/155/190/366、72/155/273/331/375/432、72/243/248/263/366/432/433、72/243/248/273/366/432/433、72/243/248/366/432/433、72/248、81/83/84/88/155/163/168/273/331/375、81/83/84/88/155/190/263/331/366、81/83/84/88/155/263/366/375、81/83/84/88/155/366、81/83/84/88/190/263/375、81/83/84/88/263/273/331/366/432、81/83/169/190/263、81/83/190/263/365/366、81/83/202/365/366/402、81/88/375/402、83/88/155/273/366/375、84/155/168/197/199/331/366/375/383/402、84/168/197/202/263/366、84/197/366/402、155/168/190/197/199/366、155/168/375、155/263/366/432/433、190/199/202/331/366、197/199/202、197/202/248、197/248、199/263/331/365/366、248/375、365/366和365/375/402,其中所述位置参照SEQ ID NO:6468来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:37R/41A/45L/72T/81T/83S/84N/88T/155L/163A/168T/190R/331K/375P、37R/41A/45L/72T/81T/83S/84N/88T/155L/263T/273R/331K/375P/432L、37R/41A/45L/72T/81T/83S/84N/88T/155L/331K/366C/375P、37R/41A/45L/72T/81T/83S/84N/88T/155L/331K/375P、37R/41A/45L/72T/81T/83S/84N/88T/248W/375P、37R/41A/45L/72T/81T/83S/84N/88T/331K/366V/432L/433A、37R/41A/45L/72T/88T/155L/168T/190R/331K/366C/375P/432L、37R/41A/45L/72T/88T/155L/168T/190R/331K/375P、37R/41A/45L/72T/88T/190R/263T/273R/331K/366C、37R/41A/45L/72T/155L/163A/168T/190R/243I/263T/273R/331K/366C/432L、37R/41A/45L/72T/155L/163A/168T/243I/248W/273R/331K/366V/432L/433A、37R/41A/45L/72T/155L/163A/168T/263T/366C/432L/433A、37R/41A/45L/72T/155L/163A/331K/366C/375P、37R/41A/45L/72T/155L/190R/243I/248W/273R/331K/432L/433A、37R/41A/45L/72T/155L/190R/248W/263T/331K、37R/41A/45L/72T/155L/190R/263T/331K/366C、37R/41A/45L/72T/155L/190R/273R/331K/366V/375P、37R/41A/45L/72T/155L/190R/273R/366C、37R/41A/45L/72T/155L/190R/273R/366C/375P/432L、37R/41A/45L/72T/155L/248W/263T/273R/366C、37R/41A/45L/72T/155L/263T/331K/375P、37R/41A/45L/72T/155L/263T/375P、37R/41A/45L/72T/155L/273R/366C、37R/41A/45L/72T/155L/331K/366V/375P/432L/433A、37R/41A/45L/72T/190R/263T/273R/331K、37R/41A/45L/72T/190R/331K/366C、37R/41A/45L/72T/190R/366C、37R/41A/45L/72T/263T/331K/366C、37R/41A/45L/72T/263T/366C/432L/433A、37R/41A/45L/72T/331K/366C、37R/41A/45L/81T/83S/84N/88T/155L/168T/190R/243I/331K/366C、37R/41A/45L/81T/83S/84N/88T/155L/168T/331K/375P、37R/41A/45L/81T/83S/84N/88T/155L/263T/273R/331K/366C、37R/41A/45L/81T/83S/84N/88T/163A/168T/263T/273R/331K/366C/375P、37R/41A/45L/155L/163A/168T/263T/331K/375P、37R/41A/45L/155L/168T/248W/273R/331K/375P、37R/41A/45L/155L/190R/331K/366V/375P、37R/41A/45L/155L/366C、37R/41A/45L/155L/366C/432L/433A、37R/41A/45L/155L/375P、37R/41A/45L/243I/248W/273R/331K、37R/41A/45L/263T/331K/375P/432L、37R/41A/45L/331K/366V/432L/433A、37R/72T/81T/83S/88T/155L/190R、37R/72T/197K/273R/331K/375P/432L、37R/83S/263T/365I/366V/375P、37R/190R/202H、41A/45L/72T/155L/263T/331K/366V/375P/432L/433A、41A/45L/163A/168T/243I/248W/273R/366C/432L、45L/72T/84N/88T/197K/375P、45L/72T/88T/366C、45L/72T/163A/202H/365I/366V/375P、45L/72T/168T/243I/331K/365I/366C/429W/432L、45L/84N/168T/190R/199Q/254A/273R/365I/366C、45L/163A/168T/190R/199Q/366C/429W/432L、45L/163A/168T/197K/263T/331K/365I/366C、72T/81T/83S/84N/88T/155L/163A/168T/190R/366C、72T/81T/83S/84N/88T/155L/190R、72T/81T/83S/84N/88T/155L/190R/273R/331K/366V/432L、72T/81T/83S/84N/88T/155L/273R/331K/375P、72T/81T/83S/84N/88T/155L/366C、72T/81T/83S/84N/88T/163A/168T/190R/243I/263T/331K/366C、72T/81T/83S/84N/88T/163A/168T/263T/331K/375P、72T/81T/84N/190R/248W、72T/83S/84N/88T/202H/254A/273R/366C/375P、72T/83S/84N/197K/202H/243I/263T/365I/366C、72T/83S/88T/243I/263T/331K/365I/366C、72T/155L/163A/168T/190R/366V/432L/433A、72T/155L/190R、72T/155L/190R/263T/331K/366C、72T/155L/190R/366C、72T/155L/273R/331K/375P/432L、72T/243I/248W/263T/366V/432L/433A、72T/243I/248W/273R/366V/432L/433A、72T/243I/248W/366V/432L/433A、72T/248W、81T/83S/84N/88T/155L/163A/168T/273R/331K/375P、81T/83S/84N/88T/155L/190R/263T/331K/366C、81T/83S/84N/88T/155L/263T/366V/375P、81T/83S/84N/88T/155L/366C、81T/83S/84N/88T/190R/263T/375P、81T/83S/84N/88T/263T/273R/331K/366C/432L、81T/83S/169D/190R/263T、81T/83S/190R/263T/365I/366C、81T/83S/202H/365I/366C/402L、81T/88T/375P/402L、83S/88T/155L/273R/366V/375P、84N/155L/168T/197K/199Q/331K/366V/375P/383V/402L、84N/168T/197K/202H/263T/366C、84N/197K/366C/402L、155L/168T/190R/197K/199Q/366C、155L/168T/375P、155L/263T/366C/432L/433A、190R/199Q/202H/331K/366C、197K/199Q/202H、197K/202H/248W、197K/248W、199Q/263T/331K/365I/366C、248W/375P、365I/366C和365I/375P/402L,其中所述位置参照SEQ ID NO:6468来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:S37R/S41A/F45L/D72T/H81T/P83S/G84N/R88T/V155L/L163A/P168T/K190R/R331K/D375P、S37R/S41A/F45L/D72T/H81T/P83S/G84N/R88T/V155L/V263T/S273R/R331K/D375P/K432L、S37R/S41A/F45L/D72T/H81T/P83S/G84N/R88T/V155L/R331K/A366C/D375P、S37R/S41A/F45L/D72T/H81T/P83S/G84N/R88T/V155L/R331K/D375P、S37R/S41A/F45L/D72T/H81T/P83S/G84N/R88T/H248W/D375P、S37R/S41A/F45L/D72T/H81T/P83S/G84N/R88T/R331K/A366V/K432L/L433A、S37R/S41A/F45L/D72T/R88T/V155L/P168T/K190R/R331K/A366C/D375P/K432L、S37R/S41A/F45L/D72T/R88T/V155L/P168T/K190R/R331K/D375P、S37R/S41A/F45L/D72T/R88T/K190R/V263T/S273R/R331K/A366C、S37R/S41A/F45L/D72T/V155L/L163A/P168T/K190R/L243I/V263T/S273R/R331K/A366C/K432L、S37R/S41A/F45L/D72T/V155L/L163A/P168T/L243I/H248W/S273R/R331K/A366V/K432L/L433A、S37R/S41A/F45L/D72T/V155L/L163A/P168T/V263T/A366C/K432L/L433A、S37R/S41A/F45L/D72T/V155L/L163A/R331K/A366C/D375P、S37R/S41A/F45L/D72T/V155L/K190R/L243I/H248W/S273R/R331K/K432L/L433A、S37R/S41A/F45L/D72T/V155L/K190R/H248W/V263T/R331K、S37R/S41A/F45L/D72T/V155L/K190R/V263T/R331K/A366C、S37R/S41A/F45L/D72T/V155L/K190R/S273R/R331K/A366V/D375P、S37R/S41A/F45L/D72T/V155L/K190R/S273R/A366C、S37R/S41A/F45L/D72T/V155L/K190R/S273R/A366C/D375P/K432L、S37R/S41A/F45L/D72T/V155L/H248W/V263T/S273R/A366C、S37R/S41A/F45L/D72T/V155L/V263T/R331K/D375P、S37R/S41A/F45L/D72T/V155L/V263T/D375P、S37R/S41A/F45L/D72T/V155L/S273R/A366C、S37R/S41A/F45L/D72T/V155L/R331K/A366V/D375P/K432L/L433A、S37R/S41A/F45L/D72T/K190R/V263T/S273R/R331K、S37R/S41A/F45L/D72T/K190R/R331K/A366C、S37R/S41A/F45L/D72T/K190R/A366C、S37R/S41A/F45L/D72T/V263T/R331K/A366C、S37R/S41A/F45L/D72T/V263T/A366C/K432L/L433A、S37R/S41A/F45L/D72T/R331K/A366C、S37R/S41A/F45L/H81T/P83S/G84N/R88T/V155L/P168T/K190R/L243I/R331K/A366C、S37R/S41A/F45L/H81T/P83S/G84N/R88T/V155L/P168T/R331K/D375P、S37R/S41A/F45L/H81T/P83S/G84N/R88T/V155L/V263T/S273R/R331K/A366C、S37R/S41A/F45L/H81T/P83S/G84N/R88T/L163A/P168T/V263T/S273R/R331K/A366C/D375P、S37R/S41A/F45L/V155L/L163A/P168T/V263T/R331K/D375P、S37R/S41A/F45L/V155L/P168T/H248W/S273R/R331K/D375P、S37R/S41A/F45L/V155L/K190R/R331K/A366V/D375P、S37R/S41A/F45L/V155L/A366C、S37R/S41A/F45L/V155L/A366C/K432L/L433A、S37R/S41A/F45L/V155L/D375P、S37R/S41A/F45L/L243I/H248W/S273R/R331K、S37R/S41A/F45L/V263T/R331K/D375P/K432L、S37R/S41A/F45L/R331K/A366V/K432L/L433A、S37R/D72T/H81T/P83S/R88T/V155L/K190R、S37R/D72T/Q197K/S273R/R331K/D375P/K432L、S37R/P83S/V263T/V365I/A366V/D375P、S37R/K190R/I202H、S41A/F45L/D72T/V155L/V263T/R331K/A366V/D375P/K432L/L433A、S41A/F45L/L163A/P168T/L243I/H248W/S273R/A366C/K432L、F45L/D72T/G84N/R88T/Q197K/D375P、F45L/D72T/R88T/A366C、F45L/D72T/L163A/I202H/V365I/A366V/D375P、F45L/D72T/P168T/L243I/R331K/V365I/A366C/L429W/K432L、F45L/G84N/P168T/K190R/A199Q/S254A/S273R/V365I/A366C、F45L/L163A/P168T/K190R/A199Q/A366C/L429W/K432L、F45L/L163A/P168T/Q197K/V263T/R331K/V365I/A366C、D72T/H81T/P83S/G84N/R88T/V155L/L163A/P168T/K190R/A366C、D72T/H81T/P83S/G84N/R88T/V155L/K190R、D72T/H81T/P83S/G84N/R88T/V155L/K190R/S273R/R331K/A366V/K432L、D72T/H81T/P83S/G84N/R88T/V155L/S273R/R331K/D375P、D72T/H81T/P83S/G84N/R88T/V155L/A366C、D72T/H81T/P83S/G84N/R88T/L163A/P168T/K190R/L243I/V263T/R331K/A366C、D72T/H81T/P83S/G84N/R88T/L163A/P168T/V263T/R331K/D375P、D72T/H81T/G84N/K190R/H248W、D72T/P83S/G84N/R88T/I202H/S254A/S273R/A366C/D375P、D72T/P83S/G84N/Q197K/I202H/L243I/V263T/V365I/A366C、D72T/P83S/R88T/L243I/V263T/R331K/V365I/A366C、D72T/V155L/L163A/P168T/K190R/A366V/K432L/L433A、D72T/V155L/K190R、D72T/V155L/K190R/V263T/R331K/A366C、D72T/V155L/K190R/A366C、D72T/V155L/S273R/R331K/D375P/K432L、D72T/L243I/H248W/V263T/A366V/K432L/L433A、D72T/L243I/H248W/S273R/A366V/K432L/L433A、D72T/L243I/H248W/A366V/K432L/L433A、D72T/H248W、H81T/P83S/G84N/R88T/V155L/L163A/P168T/S273R/R331K/D375P、H81T/P83S/G84N/R88T/V155L/K190R/V263T/R331K/A366C、H81T/P83S/G84N/R88T/V155L/V263T/A366V/D375P、H81T/P83S/G84N/R88T/V155L/A366C、H81T/P83S/G84N/R88T/K190R/V263T/D375P、H81T/P83S/G84N/R88T/V263T/S273R/R331K/A366C/K432L、H81T/P83S/E169D/K190R/V263T、H81T/P83S/K190R/V263T/V365I/A366C、H81T/P83S/I202H/V365I/A366C/E402L、H81T/R88T/D375P/E402L、P83S/R88T/V155L/S273R/A366V/D375P、G84N/V155L/P168T/Q197K/A199Q/R331K/A366V/D375P/N383V/E402L、G84N/P168T/Q197K/I202H/V263T/A366C、G84N/Q197K/A366C/E402L、V155L/P168T/K190R/Q197K/A199Q/A366C、V155L/P168T/D375P、V155L/V263T/A366C/K432L/L433A、K190R/A199Q/I202H/R331K/A366C、Q197K/A199Q/I202H、Q197K/I202H/H248W、Q197K/H248W、A199Q/V263T/R331K/V365I/A366C、H248W/D375P、V365I/A366C和V365I/D375P/E402L,其中所述位置参照SEQ ID NO:6468来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、3、4、9、53/437、61、64、72/170、72/405、94、96、98、113、118、118/120、120、129、134/158、158、165、170、171、173、183、193、214、214/222、222、226、229、234、253、265、269、272、289、296、300、302、304、322、322/407、330、390、395/439、396、398、399、403、405、408、411、412、423、428、434、435、438、439、442、444、448、449、452和454,其中所述位置参照SEQ ID NO:6468来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2F、2H、2K、2M、2Q、2R、2V、3F、3L、3M、4N、4S、9A、9G、9K、9M、9S、53E/437T、61Q、64L、64M、72E/170A、72E/405S、94R、96C、96K、98E、98S、98T、113D、113G、113P、118C、118T/120V、118V、120V、129P、134E/158N、158T、165L、170A、170G、170H、170P、170V、171A、171L、171P、171Q、173I、173K、173L、173S、183I、183L、183P、193F、214K、214R、214R/222H、222A、222N、222Q、222R、226S、229M、229Q、234N、234S、234T、253D、253E、253N、253P、253T、253V、265H、269L、269M、269N、269R、272S、289D、289G、289N、289R、296Q、300A、300E、302G、304K、304P、322A、322G、322K、322P、322P/407I、322S、322T、322V/407I、330S、390I、390R、395I/439V、396T、396V、398S、399P、399Q、399S、403V、405A、405D、405P、405S、405T、408D、408K、408S、411H、411K、411T、412K、423T、428E、428G、428I、428L、428N、428Q、428R、428S、428T、428V、428Y、434E、434G、435A、435D、435E、435G、435I、435K、435L、435N、435S、435V、435Y、438E、438R、438S、439A、439E、439G、439H、439M、439R、439W、442F、442T、444A、448K、448Q、449G、449L、449S、452T和454V,其中所述位置参照SEQID NO:6468来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:P2F、P2H、P2K、P2M、P2Q、P2R、P2V、N3F、N3L、N3M、T4N、T4S、V9A、V9G、V9K、V9M、V9S、K53E/I437T、S61Q、F64L、F64M、D72E/D170A、D72E/E405S、K94R、G96C、G96K、D98E、D98S、D98T、S113D、S113G、S113P、A118C、A118T/L120V、A118V、L120V、A129P、D134E/P158N、P158T、Y165L、D170A、D170G、D170H、D170P、D170V、K171A、K171L、K171P、K171Q、R173I、R173K、R173L、R173S、M183I、M183L、M183P、Y193F、S214K、S214R、S214R/K222H、K222A、K222N、K222Q、K222R、E226S、L229M、L229Q、R234N、R234S、R234T、S253D、S253E、S253N、S253P、S253T、S253V、Q265H、Q269L、Q269M、Q269N、Q269R、P272S、K289D、K289G、K289N、K289R、R296Q、D300A、D300E、K302G、S304K、S304P、L322A、L322G、L322K、L322P、L322P/V407I、L322S、L322T、L322V/V407I、E330S、V390I、V390R、V395I/P439V、Y396T、Y396V、E398S、N399P、N399Q、N399S、R403V、E405A、E405D、E405P、E405S、E405T、N408D、N408K、N408S、R411H、R411K、R411T、R412K、R423T、K428E、K428G、K428I、K428L、K428N、K428Q、K428R、K428S、K428T、K428V、K428Y、D434E、D434G、R435A、R435D、R435E、R435G、R435I、R435K、R435L、R435N、R435S、R435V、R435Y、A438E、A438R、A438S、P439A、P439E、P439G、P439H、P439M、P439R、P439W、S442F、S442T、Y444A、E448K、E448Q、R449G、R449L、R449S、S452T和I454V,其中所述位置参照SEQ ID NO:6468来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:6678、6680、6682、6684、6686、6688、6690、6692、6694、6696、6698、6700、6702、6704、6706、6708、6710、6712、6714、6716、6718、6720、6722、6724、6726、6728、6730、6732、6734、6736、6738、6740、6742、6744、6746、6748、6750、6752、6754、6756、6758、6760、6762、6764、6766、6768、6770、6772、6774、6776、6778、6780、6782、6784、6786、6788、6790、6792、6794、6796、6798、6800、6802、6804、6806、6808、6810、6812、6814、6816、6818、6820、6822、6824、6826、6828、6830、6832、6834、6836、6838、6840、6842、6844、6846、6848、6850、6852、6854、6856、6858、6860、6862、6864、6866、6868、6870、6872、6874、6876、6878、6880、6882、6884、6886、6888、6890、6892、6894、6896、6898、6900、6902、6904、6906、6908、6910、6912、6914、6916、6918、6920、6922、6924、6926、6928、6930、6932、6934、6936、6938、6940、6942、6944、6946、6948、6950、6952、6954、6956、6958、6960、6962、6964、6966、6968、6970、6972、6974、6976、6978、6980、6982、6984、6986、6988、6990、6992、6994、6996、6998、7000、7002、7004、7006、7008、7010、7012、7014、7016、7018、7020、7022、7024、7026、7028、7030、7032、7034、7036、7038、7040、7042、7044、7046、7048、7050、7052、7054、7056、7058、7060、7062、7064、7066、7068、7070、7072、7074、7076、7078、7080、7082、7084、7086、7088、7090、7092、7094、7096、7098、7100、7102、7104、7106、7108、7110、7112、7114、7116、7118、7120、7122、7124、7126、7128、7130、7132、7134、7136、7138、7140、7142、7144、7146、7148、7150、7152、7154、7156、7158、7160、7162、7164、7166、7168、7170、7172、7174、7176、7178、7180、7182、7184、7186、7188、7190、7192、7194、7196、7198、7200、7202、7204、7206、7208、7210、7212和7214。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:6678、6680、6682、6684、6686、6688、6690、6692、6694、6696、6698、6700、6702、6704、6706、6708、6710、6712、6714、6716、6718、6720、6722、6724、6726、6728、6730、6732、6734、6736、6738、6740、6742、6744、6746、6748、6750、6752、6754、6756、6758、6760、6762、6764、6766、6768、6770、6772、6774、6776、6778、6780、6782、6784、6786、6788、6790、6792、6794、6796、6798、6800、6802、6804、6806、6808、6810、6812、6814、6816、6818、6820、6822、6824、6826、6828、6830、6832、6834、6836、6838、6840、6842、6844、6846、6848、6850、6852、6854、6856、6858、6860、6862、6864、6866、6868、6870、6872、6874、6876、6878、6880、6882、6884、6886、6888、6890、6892、6894、6896、6898、6900、6902、6904、6906、6908、6910、6912、6914、6916、6918、6920、6922、6924、6926、6928、6930、6932、6934、6936、6938、6940、6942、6944、6946、6948、6950、6952、6954、6956、6958、6960、6962、6964、6966、6968、6970、6972、6974、6976、6978、6980、6982、6984、6986、6988、6990、6992、6994、6996、6998、7000、7002、7004、7006、7008、7010、7012、7014、7016、7018、7020、7022、7024、7026、7028、7030、7032、7034、7036、7038、7040、7042、7044、7046、7048、7050、7052、7054、7056、7058、7060、7062、7064、7066、7068、7070、7072、7074、7076、7078、7080、7082、7084、7086、7088、7090、7092、7094、7096、7098、7100、7102、7104、7106、7108、7110、7112、7114、7116、7118、7120、7122、7124、7126、7128、7130、7132、7134、7136、7138、7140、7142、7144、7146、7148、7150、7152、7154、7156、7158、7160、7162、7164、7166、7168、7170、7172、7174、7176、7178、7180、7182、7184、7186、7188、7190、7192、7194、7196、7198,7200、7202、7204、7206、7208、7210、7212和7214。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:6678、6680、6682、6684、6686、6688、6690、6692、6694、6696、6698、6700、6702、6704、6706、6708、6710、6712、6714、6716、6718、6720、6722、6724、6726、6728、6730、6732、6734、6736、6738、6740、6742、6744、6746、6748、6750、6752、6754、6756、6758、6760、6762、6764、6766、6768、6770、6772、6774、6776、6778、6780、6782、6784、6786、6788、6790、6792、6794、6796、6798、6800、6802、6804、6806、6808、6810、6812、6814、6816、6818、6820、6822、6824、6826、6828、6830、6832、6834、6836、6838、6840、6842、6844、6846、6848、6850、6852、6854、6856、6858、6860、6862、6864、6866、6868、6870、6872、6874、6876、6878、6880、6882、6884、6886、6888、6890、6892、6894、6896、6898、6900、6902、6904、6906、6908、6910、6912、6914、6916、6918、6920、6922、6924、6926、6928、6930、6932、6934、6936、6938、6940、6942、6944、6946、6948、6950、6952、6954、6956、6958、6960、6962、6964、6966、6968、6970、6972、6974、6976、6978、6980、6982、6984、6986、6988、6990、6992、6994、6996、6998、7000、7002、7004、7006、7008、7010、7012、7014、7016、7018、7020、7022、7024、7026、7028、7030、7032、7034、7036、7038、7040、7042、7044、7046、7048、7050、7052、7054、7056、7058、7060、7062、7064、7066、7068、7070、7072、7074、7076、7078、7080、7082、7084、7086、7088、7090、7092、7094、7096、7098、7100、7102、7104、7106、7108、7110、7112、7114、7116、7118、7120、7122、7124、7126、7128、7130、7132、7134、7136、7138、7140、7142、7144、7146、7148、7150、7152、7154、7156、7158、7160、7162、7164、7166、7168、7170、7172、7174、7176、7178、7180、7182、7184、7186、7188、7190、7192、7194、7196、7198,7200、7202、7204、7206、7208、7210、7212和7214。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5/6/25/317、5/6/69/288/303、5/6/91/288/317、5/25/91/212/303/317、5/25/91/263、5/25/288、5/69/91/212/288、5/69/91/212/303、5/91/288/303、5/91/303、5/91/317/421、5/288、6/91/212/288/303/369/421、6/212/288/303、6/288、25/91/212/288、25/91/263/288/303、25/91/303/317/369、25/91/317/369、25/263/317、87/144、87/144/159/361、87/144/159/361/433、87/433、88/144、88/144/159、91/263/317/369、91/288/303/317/369、91/288/317/369/421、91/303、91/317、91/317/369、109/144/153/155/159/433、144、212/288、263/288/303/317和288,其中所述位置参照SEQ ID NO:6864来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5S/6P/25I/317Y、5S/6P/69A/288P/303V、5S/6P/91Q/288P/317Y、5S/25Q/91Q/212L/303V/317Y、5S/25Q/91Q/263T、5S/25Q/288P、5S/69A/91Q/212L/288P、5S/69A/91Q/212L/303V、5S/91Q/288P/303V、5S/91Q/303V、5S/91Q/317Y/421I、5S/288P、6P/91Q/212L/288P/303V/369K/421I、6P/212L/288P/303V、6P/288P、25Q/91Q/212L/288P、25Q/91Q/263T/288P/303V、25Q/91Q/317Y/369K、25Q/91T/303V/317Y/369K、25Q/263T/317Y、87K/144Q、87K/144Q/159K/361C、87K/144Q/159K/361C/433A、87K/433A、88T/144Q、88T/144Q/159K、91Q/263T/317Y/369K、91Q/288P/303V/317Y/369K、91Q/288P/317Y/369K/421I、91Q/303V、91Q/317Y、91Q/317Y/369K、109W/144Q/153V/155L/159K/433A、144Q、212L/288P、263T/288P/303V/317Y和288P,其中所述位置参照SEQ ID NO:6864来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:T5S/E6P/L25I/S317Y、T5S/E6P/D69A/E288P/Q303V、T5S/E6P/I91Q/E288P/S317Y、T5S/L25Q/I91Q/A212L/Q303V/S317Y、T5S/L25Q/I91Q/V263T、T5S/L25Q/E288P、T5S/D69A/I91Q/A212L/E288P、T5S/D69A/I91Q/A212L/Q303V、T5S/I91Q/E288P/Q303V、T5S/I91Q/Q303V、T5S/I91Q/S317Y/V421I、T5S/E288P、E6P/I91Q/A212L/E288P/Q303V/V369K/V421I、E6P/A212L/E288P/Q303V、E6P/E288P、L25Q/I91Q/A212L/E288P、L25Q/I91Q/V263T/E288P/Q303V、L25Q/I91Q/S317Y/V369K、L25Q/I91T/Q303V/S317Y/V369K、L25Q/V263T/S317Y、M87K/M144Q、M87K/M144Q/Q159K/T361C、M87K/M144Q/Q159K/T361C/L433A、M87K/L433A、R88T/M144Q、R88T/M144Q/Q159K、I91Q/V263T/S317Y/V369K、I91Q/E288P/Q303V/S317Y/V369K、I91Q/E288P/S317Y/V369K/V421I、I91Q/Q303V、I91Q/S317Y、I91Q/S317Y/V369K、R109W/M144Q/A153V/V155L/Q159K/L433A、M144Q、A212L/E288P、V263T/E288P/Q303V/S317Y和E288P,其中所述位置参照SEQ ID NO:6864来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:7362、7364、7366、7368、7370、7372、7374、7376、7378、7380、7382、7384、7386、7388、7390、7392、7394、7396、7398、7400、7402、7404、7406、7408、7410、7412、7414、7416、7418、7420、7422、7424、7426、7428、7430、7432、7434和7436,其中所述位置参照SEQ ID NO:6864来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:7362、7364、7366、7368、7370、7372、7374、7376、7378、7380、7382、7384、7386、7388、7390、7392、7394、7396、7398、7400、7402、7404、7406、7408、7410、7412、7414、7416、7418、7420、7422、7424、7426、7428、7430、7432、7434和7436。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:7362、7364、7366、7368、7370、7372、7374、7376、7378、7380、7382、7384、7386、7388、7390、7392、7394、7396、7398、7400、7402、7404、7406、7408、7410、7412、7414、7416、7418、7420、7422、7424、7426、7428、7430、7432、7434和7436。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/3/433/435/442、2/81、9/37/113/396、9/87、9/144/331、37/113/144/396、37/233、53/144/233/269/331/428、53/233/269/390/395/396、53/234、61/120/156/163/165/197/303/308、61/120/159/300/308/407、61/120/300/303/407、61/156/159/163/165/243/248/253/300/303/308、61/156/163/243/248/300/303/308/407、61/156/163/300/365/411、61/156/197/253、61/163/300/303/308/405/407/411、61/165/248/253/407/411、61/214、61/214/300/308、61/243/300/308/407/411、61/300/303/308、61/300/303/405、61/365/405、69、69/81、69/134、69/263、69/263/434/438/439、69/439、81、81/134、81/222、81/222/263/322/435/442、81/433/435/438/442、85/156/159/243/248/253/308/405/407/411、87/144、87/144/396、113/233/234、120/156/159/169/197/214/303/308/365/405/407、120/156/159/248/300/308、120/156/248/303/308/411、120/159、120/159/165/197、120/159/197/308/407/411、120/159/197/365/411、120/197/253/300/308、120/253/300/303/308/407、120/308/407/411、134/222/263、144/234/269、156/165/248/300/303/308、156/197/248/300/411、156/214/308/411、156/248/253/308、159/163/165/197/214/243/300/303/308/407、163/197/253/300/303/308/365、171/263、183/233/234/331/428、197/253/308/407、197/300/303/308/365、197/300/308/411、222、222/263/435/442、233/396/399、263、269、269/428/437、300/303/308、300/308/405/411、308和322,其中所述位置参照SEQ ID NO:7388来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2K/3M/433A/435E/442F、2K/81T、9G/37S/113D/396T、9G/87K、9G/144Q/331R、37S/113D/144Q/396T、37S/233S、53E/144Q/233Q/269R/331R/428I、53E/233Q/269R/390I/395I/396T、53E/234N、61Q/120V/156S/163A/165L/197K/303V/308L、61Q/120V/159K/300A/308L/407I、61Q/120V/300A/303V/407I、61Q/156S/159K/163A/165L/243I/248W/253T/300A/303V/308L、61Q/156S/163A/243I/248W/300A/303V/308L/407I、61Q/156S/163A/300A/365I/411T、61Q/156S/197K/253E、61Q/163A/300A/303V/308L/405P/407I/411T、61Q/165L/248W/253T/407I/411T、61Q/214R、61Q/214R/300A/308L、61Q/243I/300A/308L/407I/411T、61Q/300A/303V/308L、61Q/300A/303V/405P、61Q/365I/405P、69A、69A/81T、69A/134E、69A/263T、69A/263T/434E/438S/439H、69A/439H、81T、81T/134E、81T/222A、81T/222A/263T/322S/435E/442F、81T/433A/435I/438R/442F、85V/156S/159K/243I/248W/253T/308L/405P/407I/411T、87K/144Q、87K/144Q/396T、113D/233Q/234N、120V/156S/159K/169D/197K/214R/303V/308L/365I/405P/407I、120V/156S/159K/248W/300A/308L、120V/156S/248W/303V/308L/411T、120V/159K、120V/159K/165L/197K、120V/159K/197K/308L/407I/411T、120V/159K/197K/365I/411T、120V/197K/253T/300A/308L、120V/253T/300A/303V/308L/407I、120V/308L/407I/411T、134E/222A/263T、144Q/234N/269R、156S/165L/248W/300A/303V/308L、156S/197K/248W/300A/411T、156S/214R/308L/411T、156S/248W/253T/308L、159K/163A/165L/197K/214R/243I/300A/303V/308L/407I、163A/197K/253E/300A/303V/308L/365I、171P/263T、183L/233Q/234N/331R/428I、197K/253T/308L/407I、197K/300A/303V/308L/365I、197K/300A/308L/411T、222A、222A/263T/435I/442F、233Q/396T/399Q、263T、269R、269R/428I/437L、300A/303V/308L、300A/308L/405P/411T、308L和322S,其中所述位置参照SEQ ID NO:7388来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:P2K/N3M/L433A/R435E/S442F、P2K/H81T、V9G/R37S/S113D/Y396T、V9G/M87K、V9G/M144Q/K331R、R37S/S113D/M144Q/Y396T、R37S/W233S、K53E/M144Q/W233Q/Q269R/K331R/K428I、K53E/W233Q/Q269R/V390I/V395I/Y396T、K53E/R234N、S61Q/L120V/C156S/L163A/Y165L/Q197K/Q303V/R308L、S61Q/L120V/Q159K/D300A/R308L/V407I、S61Q/L120V/D300A/Q303V/V407I、S61Q/C156S/Q159K/L163A/Y165L/L243I/H248W/S253T/D300A/Q303V/R308L、S61Q/C156S/L163A/L243I/H248W/D300A/Q303V/R308L/V407I、S61Q/C156S/L163A/D300A/V365I/R411T、S61Q/C156S/Q197K/S253E、S61Q/L163A/D300A/Q303V/R308L/E405P/V407I/R411T、S61Q/Y165L/H248W/S253T/V407I/R411T、S61Q/S214R、S61Q/S214R/D300A/R308L、S61Q/L243I/D300A/R308L/V407I/R411T、S61Q/D300A/Q303V/R308L、S61Q/D300A/Q303V/E405P、S61Q/V365I/E405P、D69A、D69A/H81T、D69A/D134E、D69A/V263T、D69A/V263T/D434E/A438S/P439H、D69A/P439H、H81T、H81T/D134E、H81T/K222A、H81T/K222A/V263T/L322S/R435E/S442F、H81T/L433A/R435I/A438R/S442F、A85V/C156S/Q159K/L243I/H248W/S253T/R308L/E405P/V407I/R411T、M87K/M144Q、M87K/M144Q/Y396T、S113D/W233Q/R234N、L120V/C156S/Q159K/E169D/Q197K/S214R/Q303V/R308L/V365I/E405P/V407I、L120V/C156S/Q159K/H248W/D300A/R308L、L120V/C156S/H248W/Q303V/R308L/R411T、L120V/Q159K、L120V/Q159K/Y165L/Q197K、L120V/Q159K/Q197K/R308L/V407I/R411T、L120V/Q159K/Q197K/V365I/R411T、L120V/Q197K/S253T/D300A/R308L、L120V/S253T/D300A/Q303V/R308L/V407I、L120V/R308L/V407I/R411T、D134E/K222A/V263T、M144Q/R234N/Q269R、C156S/Y165L/H248W/D300A/Q303V/R308L、C156S/Q197K/H248W/D300A/R411T、C156S/S214R/R308L/R411T、C156S/H248W/S253T/R308L、Q159K/L163A/Y165L/Q197K/S214R/L243I/D300A/Q303V/R308L/V407I、L163A/Q197K/S253E/D300A/Q303V/R308L/V365I、K171P/V263T、M183L/W233Q/R234N/K331R/K428I、Q197K/S253T/R308L/V407I、Q197K/D300A/Q303V/R308L/V365I、Q197K/D300A/R308L/R411T、K222A、K222A/V263T/R435I/S442F、W233Q/Y396T/N399Q、V263T、Q269R、Q269R/K428I/I437L、D300A/Q303V/R308L、D300A/R308L/E405P/R411T、R308L和L322S,其中所述位置参照SEQ ID NO:7388来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:41、56、61、72、76、87、88、107、139、156、338和407,其中所述位置参照SEQ ID NO:7388来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:41E、56D、61D、61E、72P、76S、87E、88L、88M、107L、107V、139N、156S、338V和407T,其中所述位置参照SEQ ID NO:7388来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:A41E、L56D、S61D、S61E、T72P、R76S、M87E、R88L、R88M、A107L、A107V、K139N、C156S、C338V和V407T,其中所述位置参照SEQ ID NO:7388来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:7946、7948、7950、7952、7954、7956、7958、7960、7962、7964、7966、7968、7970、7972、7974、7976、7978、7980、7982、7984、7986、7988、7990、7992、7994、7996、7998、8000、8002、8004、8006、8008、8010、8012、8014、8016、8018、8020、8022、8024、8026、8028、8030、8032、8034、8036、8038、8040、8042、8044、8046、8048、8050、8052、8054、8056、8058、8060、8062、8064、8066、8068、8070、8072、8074、8076、8078、8080、8082、8084、8086、8088、8090、8340、8342、8344、8346、8348、8350、8352、8354、8356、8358、8360、8362、8364、8366和8368。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:7946、7948、7950、7952、7954、7956、7958、7960、7962、7964、7966、7968、7970、7972、7974、7976、7978、7980、7982、7984、7986、7988、7990、7992、7994、7996、7998、8000、8002、8004、8006、8008、8010、8012、8014、8016、8018、8020、8022、8024、8026、8028、8030、8032、8034、8036、8038、8040、8042、8044、8046、8048、8050、8052、8054、8056、8058、8060、8062、8064、8066、8068、8070、8072、8074、8076、8078、8080、8082、8084、8086、8088、8090、8340、8342、8344、8346、8348、8350、8352、8354、8356、8358、8360、8362、8364、8366和8368。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:7946、7948、7950、7952、7954、7956、7958、7960、7962、7964、7966、7968、7970、7972、7974、7976、7978、7980、7982、7984、7986、7988、7990、7992、7994、7996、7998、8000、8002、8004、8006、8008、8010、8012、8014、8016、8018、8020、8022、8024、8026、8028、8030、8032、8034、8036、8038、8040、8042、8044、8046、8048、8050、8052、8054、8056、8058、8060、8062、8064、8066、8068、8070、8072、8074、8076、8078、8080、8082、8084、8086、8088、8090、8340、8342、8344、8346、8348、8350、8352、8354、8356、8358、8360、8362、8364、8366和8368。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:37/72/76/81、37/72/76/107/156/331、37/72/195/331、53/81/195/197、69/72/76/107、72/76/107/156、72/76/107/195/197、72/269、81/107/195、87、87/91、87/91/94、87/91/94/120、87/91/94/233、87/91/94/233/259、87/91/94/263/389、87/91/120/233、87/91/120/233/411/431/435/437、87/91/144/259、87/91/163、87/91/163/233、87/91/163/233/263、87/91/163/389、87/91/233、87/91/233/389、87/91/259/263/389/428/431/435/437、87/91/263/389、87/91/322、87/91/389、87/94、87/94/144/263/428/435、87/94/263、87/163/233、87/233、87/233/259、87/233/322/389/411、87/233/389、87/259、87/263、87/428/431/435、87/435、91、91/94、91/94/120/233、91/94/120/233/389/431/438、91/94/233/259、91/120、91/120/233、91/233、91/233/259/389、91/233/389、94/233/411、144/389、163/233、195/197、197、233、233/259/263、233/259/389、233/438、259、263、263/389、322、389和428/431/435,其中所述位置参照SEQ ID NO:8088来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:37S/72P/76S/81T、37S/72P/76S/107L/156S/331R、37S/72P/195Q/331R、53E/81T/195Q/197K、69A/72P/76S/107L、72P/76S/107L/156S、72P/76S/107L/195Q/197K、72P/269R、81T/107L/195Q、87A、87A/91L、87A/91L/94C/233Q、87A/91L/94C/233Q/259T、87A/91L/120L/233Q、87A/91L/120L/233Q/411T/431M/435E/437L、87A/91L/163A、87A/91L/233Q、87A/91L/233Q/389L、87A/91L/259T/263T/389L/428I/431M/435I/437L、87A/91L/322S、87A/94C、87A/94C/263T、87A/233Q、87A/233Q/259T、87A/233Q/322S/389L/411T、87A/233Q/389L、87A/259T、87A/263T、87A/428I/431M/435E、87A/435E、87K、87K/91L、87K/91L/94C、87K/91L/94C/120L、87K/91L/94C/233Q、87K/91L/94C/263T/389L、87K/91L/120L/233Q、87K/91L/144Q/259T、87K/91L/163A/233Q、87K/91L/163A/233Q/263T、87K/91L/163A/389L、87K/91L/233Q、87K/91L/263T/389L、87K/91L/389L、87K/94C/144Q/263T/428I/435E、87K/163A/233Q、91L、91L/94C、91L/94C/120L/233Q、91L/94C/120L/233Q/389L/431M/438S、91L/94C/233Q/259T、91L/120L、91L/120L/233Q、91L/233Q、91L/233Q/259T/389L、91L/233Q/389L、94C/233Q/411T、144Q/389L、163A/233Q、195Q/197K、197K、233Q、233Q/259T/263T、233Q/259T/389L、233Q/438S、259T、263T、263T/389L、322S、389L和428I/431M/435E,其中所述位置参照SEQ ID NO:8088来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:R37S/T72P/R76S/H81T、R37S/T72P/R76S/A107L/C156S/K331R、R37S/T72P/H195Q/K331R、K53E/H81T/H195Q/Q197K、D69A/T72P/R76S/A107L、T72P/R76S/A107L/C156S、T72P/R76S/A107L/H195Q/Q197K、T72P/Q269R、H81T/A107L/H195Q、M87A、M87A/Q91L、M87A/Q91L/K94C/W233Q、M87A/Q91L/K94C/W233Q/E259T、M87A/Q91L/V120L/W233Q、M87A/Q91L/V120L/W233Q/R411T/D431M/R435E/I437L、M87A/Q91L/L163A、M87A/Q91L/W233Q、M87A/Q91L/W233Q/E389L、M87A/Q91L/E259T/V263T/E389L/K428I/D431M/R435I/I437L、M87A/Q91L/L322S、M87A/K94C、M87A/K94C/V263T、M87A/W233Q、M87A/W233Q/E259T、M87A/W233Q/L322S/E389L/R411T、M87A/W233Q/E389L、M87A/E259T、M87A/V263T、M87A/K428I/D431M/R435E、M87A/R435E、M87K、M87K/Q91L、M87K/Q91L/K94C、M87K/Q91L/K94C/V120L、M87K/Q91L/K94C/W233Q、M87K/Q91L/K94C/V263T/E389L、M87K/Q91L/V120L/W233Q、M87K/Q91L/M144Q/E259T、M87K/Q91L/L163A/W233Q、M87K/Q91L/L163A/W233Q/V263T、M87K/Q91L/L163A/E389L、M87K/Q91L/W233Q、M87K/Q91L/V263T/E389L、M87K/Q91L/E389L、M87K/K94C/M144Q/V263T/K428I/R435E、M87K/L163A/W233Q、Q91L、Q91L/K94C、Q91L/K94C/V120L/W233Q、Q91L/K94C/V120L/W233Q/E389L/D431M/A438S、Q91L/K94C/W233Q/E259T、Q91L/V120L、Q91L/V120L/W233Q、Q91L/W233Q、Q91L/W233Q/E259T/E389L、Q91L/W233Q/E389L、K94C/W233Q/R411T、M144Q/E389L、L163A/W233Q、H195Q/Q197K、Q197K、W233Q、W233Q/E259T/V263T、W233Q/E259T/E389L、W233Q/A438S、E259T、V263T、V263T/E389L、L322S、E389L和K428I/D431M/R435E,其中所述位置参照SEQ ID NO:8088来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:55、111、252、255、324、328、413和451,其中所述位置参照SEQ ID NO:8088来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:55G、111T、252P、255T、324D、324G、328T、413L和451Q,其中所述位置参照SEQ ID NO:8088来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:S55G、S111T、S252P、S255T、P324D、P324G、L328T、V413L和V451Q,其中所述位置参照SEQ ID NO:8088来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:8482、8484、8486、8488、8490、8492、8494、8496、8498、8500、8502、8504、8506、8508、8510、8512、8514、8516、8518、8520、8522、8524、8526、8528、8530、8532、8534、8536、8538、8540、8542、8544、8546、8548、8550、8552、8554、8556、8558、8560、8562、8564、8566、8568、8570、8572、8574、8576、8578、8580、8582、8584、8586、8588、8590、8592、8594、8596、8598、8600、8602、8604、8606、8608、8610、8612、8614、8616、8618、8620、8622、9224、9226、9228、9230、9232、9234、9236、9238和9240。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:8482、8484、8486、8488、8490、8492、8494、8496、8498、8500、8502、8504、8506、8508、8510、8512、8514、8516、8518、8520、8522、8524、8526、8528、8530、8532、8534、8536、8538、8540、8542、8544、8546、8548、8550、8552、8554、8556、8558、8560、8562、8564、8566、8568、8570、8572、8574、8576、8578、8580、8582、8584、8586、8588、8590、8592、8594、8596、8598、8600、8602、8604、8606、8608、8610、8612、8614、8616、8618、8620、8622、9224、9226、9228、9230、9232、9234、9236、9238和9240。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:8482、8484、8486、8488、8490、8492、8494、8496、8498、8500、8502、8504、8506、8508、8510、8512、8514、8516、8518、8520、8522、8524、8526、8528、8530、8532、8534、8536、8538、8540、8542、8544、8546、8548、8550、8552、8554、8556、8558、8560、8562、8564、8566、8568、8570、8572、8574、8576、8578、8580、8582、8584、8586、8588、8590、8592、8594、8596、8598、8600、8602、8604、8606、8608、8610、8612、8614、8616、8618、8620、8622、9224、9226、9228、9230、9232、9234、9236、9238和9240。
在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106和/或108。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106和/或108。在一些实施方案中,工程化糖基转移酶的多肽序列包含SEQ ID NO:76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106和/或108。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:69/173/175/243/246/354/365/383/399、69/173/243/383/399、56/191/354/383/399、70/225/246/409/413、70/115/225/409、70/225/413、70/225/247、74/310/396/424、74/396和173/175/191/365/383/399,其中所述位置参照SEQ ID NO:758来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:69H/173N/175S/243A/246K/354I/365I/383V/399A、69H/173N/243A/383V/399A、56T/191D/354I/383V/399A、70L/225G/246P/409K/413V、70L/115S/225G/409K、70L/225G/413V、70L/225G/247G、74T/310D/396E/424S、74T/396E和173H/175S/191D/365I/383V/399A,其中所述位置参照SEQ ID NO:758来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:R69H/Y173N/P175S/V243A/M246K/L354I/M365I/M383V/T399A、R69H/Y173N/V243A/M383V/T399A、I56T/N191D/L354I/M383V/T399A、F70L/N225G/M246P/E409K/I413V、F70L/Q115S/N225G/E409K、F70L/N225G/I413V、F70L/N225G/E247G、H74T/K310D/G396E/N424S、H74T/G396E和Y173H/P175S/N191D/M365I/M383V/T399A,其中所述位置参照SEQ ID NO:758来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:770、772、774、776、778、780、782、784、786和/或788。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:770、772、774、776、778、780、782、784、786和/或788。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQID NO:770、772、774、776、778、780、782、784、786和/或788。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24/28、24/28/262、24/28/262/264、24/28/262/264/423、24/264/294、28、28/262/264、28/423、69/173/175/243/246/354/365/383/399、69/173/243/383/399、56/191/354/383/399、70/115/225/409、70/225/246/409/413、70/225/247、70/225/413、74/310/396/424、74/396、159、173/175/191/365/383/399、199、262/264和264/29,其中所述位置参照SEQ ID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24E/28N、24E/28N/262Y、24E/28N/262Y/264S、24E/28N/262Y/264S/423E、24E/264S/294V、28N、28N/262Y/264S、28N/423E、69H/173N/175S/243A/246K/354I/365I/383V/399A、69H/173N/243A/383V/399A、56T/191D/354I/383V/399A、70L/115S/225G/409K、70L/225G/246P/409K/413V、70L/225G/247G、70L/225G/413V、74T/310D/396E/424S、74T/396E、159R、173H/175S/191D/365I/383V/399A、199H、262Y/264S和264S/291V,其中所述位置参照SEQ ID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Y24E/S28N、Y24E/S28N/F262Y、Y24E/S28N/F262Y/C264S、Y24E/S28N/F262Y/C264S/K423E,Y24E/C264S/A294V、S28N、S28N/F262Y/C264S、S28N/K423E、R69H/Y173N/P175S/V243A/M246K/L354I/M365I/M383V/T399A、R69H/Y173N/V243A/M383V/T399A、I56T/N191D/L354I/M383V/T399A、F70L/Q115S/N225G/E409K、F70L/N225G/M246P/E409K/I413V、F70L/N225G/E247G、F70L/N225G/I413V、H74T/K310D/G396E/N424S、H74T/G396E、F156R、Y173H/P175S/N191D/M365I/M383V/T399A、G199H、F262Y/C264S和C264S/I291V,其中所述位置参照SEQ ID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:790、792、794、796、798、800、802、804、806、808、1292和/或1294。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:790、792、794、796、798、800、802、804、806、808、1292和/或1294。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:790、792、794、796、798、800、802、804、806、808、1292和/或1294。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24、28、32、264、269、325、341、351和366,其中所述位置参照SEQ ID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24L/V、28G/K/L、32C/R/S、264A/G、269S/W、325G/H、341V、351L和366L/Q/T,其中所述位置参照SEQ ID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Y24L/V、S28G/K/L、N32C/R/S、C264A/G、Y269S/W、K325G/H、F341V、M351L和H366L/Q/T,其中所述位置参照SEQ ID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ IDNO:810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844和/或846。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844和/或846。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844和/或846。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:56/69/70/175/191/246、56/69/70/175/191/246/354、56/69/70/175/354、56/69/70/191/246/354/365、56/69/70/246/354、56/69/175/191/246/354、56/69/175/246/354、56/69/175/246/354/365、56/69/246/354、56/69/246/365、56/70/175/191/246、56/70/175/191/246/354、56/70/175/191/354/365、56/70/175/246/354、56/70/175/246/365、56/70/191/246/354/365、56/70/191/354、56/175/246、56/175/354、56/175/354/365、56/191/246/354、56/246、56/246/354/365、56/354、69、69/70/175/191/246/354/365、69/70/191/246/354/365、69/70/246、69/70/354/365、69/175/191/246/354、69/175/354、69/246/354/365、69/354、70、70/175/191/246/354/365、70/175/191/354/365、70/191/246/354/365、70/191/246/365、126、126/220、126/403、175、175/191、175/191/246/354/365、175/191/354、175/191/354/365、175/246/354、175/246/354/365、175/354、191/246/354、246/354、354和354/365,其中所述位置参照SEQID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:56T/69Q/70L/175S/191D/246K、56T/69Q/70L/175S/191D/246K/354I、56T/69Q/70L/175S/354I、56T/69Q/70L/191D/246K/354I/365I、56T/69Q/70L/246K/354I、56T/69Q/175S/191D/246K/354I、56T/69Q/175S/246K/354I、56T/69Q/175S/246K/354I/365I、56T/69Q/246K/354I、56T/69Q/246K/M65I、56T/70L/175S/191D/246K、56T/70L/175S/191D/246K/354I、56T/70L/175S/191D/354I/365I、56T/70L/175S/246K/354I、56T/70L/175S/246K/365I、56T/70L/191D/246K/354I/365I、56T/70L/191D/354I、56T/175S/246K、56T/175S/354I、56T/175S/354I/365I、56T/191D/246K/354I、56T/246K、56T/246K/354I/365I、56T/354I、69Q、69Q/70L/175S/191D/246K/354I/365I、69Q/70L/191D/246K/354I/365I、69Q/70L/246K、69Q/70L/354I/365I、69Q/175S/191D/246K/354I、69Q/175S/354I、69Q/246K/354I/365I、69Q/354I、70L、70L/175S/191D/246K/354I/365I、70L/175S/191D/354I/365I、70L/191D/246K/354I/365I、70L/191D/246K/365I、126F、126F/220L、126F/403R、175S、175S/191D、175S/191D/246K/354I/365I、175S/191D/354I、175S/191D/354I/365I、175S/246K/354I、175S/246K/354I/365I、175S/354I、191D/246K/354I、246K/354I、354I和354I/365I,其中所述位置参照SEQ ID NO:770来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:I56T/H69Q/F70L/P175S/N191D/M246K、I56T/H69Q/F70L/P175S/N191D/M246K/L354I、I56T/H69Q/F70L/P175S/L354I、I56T/H69Q/F70L/N191D/M246K/L354I/M365I、I56T/H69Q/F70L/M246K/L354I、I56T/H69Q/P175S/N191D/M246K/L354I、I56T/H69Q/P175S/M246K/L354I、I56T/H69Q/P175S/M246K/L354I/M365I、I56T/H69Q/M246K/L354I、I56T/H69Q/M246K/M365I、I56T/F70L/P175S/N191D/M246K、I56T/F70L/P175S/N191D/M246K/L354I、I56T/F70L/P175S/N191D/L354I/M365I、I56T/F70L/P175S/M246K/L354I、I56T/F70L/P175S/M246K/M365I、I56T/F70L/N191D/M246K/L354I/M365I、I56T/F70L/N191D/L354I、I56T/P175S/M246K、I56T/P175S/L354I、I56T/P175S/L354I/M365I、I56T/N191D/M246K/L354I、I56T/M246K、I56T/M246K/L354I/M365I、I56T/L354I、H69Q、H69Q/F70L/P175S/N191D/M246K/L354I/M365I、H69Q/F70L/N191D/M246K/L354I/M365I、H69Q/F70L/M246K、H69Q/F70L/L354I/M365I、H69Q/P175S/N191D/M246K/L354I、H69Q/P175S/L354I、H69Q/M246K/L354I/M365I、H69Q/L354I、F70L、F70L/P175S/N191D/M246K/L354I/M365I、F70L/P175S/N191D/L354I/M365I、F70L/N191D/M246K/L354I/M365I、F70L/N191D/M246K/M365I、I126F、I126F/C220L、I126F/K403R、P175S、P175S/N191D、P175S/N191D/M246K/L354I/M365I、P175S/N191D/L354I、P175S/N191D/L354I/M365I、P175S/M246K/L354I、P175S/M246K/L354I/M365I、P175S/L354I、N191D/M246K/L354I、M246K/L354I、L354I和L354I/M365I,其中所述位置参照SEQ ID NO:770来编号。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950和/或952。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950和/或952。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ IDNO:848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950和/或952。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24/32/264/269/330/402/403、24/32/264/269/382/403/406、24/32/264/330、24/32/269、24/32/269/382/385/389/402/406、24/32/269/403、24/32/330、24/264/269/389/402/406、70/126/175/191/246/325/354/366、70/126/175/325/330/351/354/366、70/126/191/246/325/351/354/366/423、70/126/191/246/325/351/354/423、70/126/191/246/325/351/366/423、70/126/191/246/354/366、70/126/246/330/366、70/126/246/354/366、126/211/220/253/316/342、126/211/220/275/279/323、126/211/260/423、126/220/260、126/220/316、56/220/260/423、220/260和220/260/423,其中所述位置参照SEQ ID NO:792来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24L/32S/264A/269S/330Q/402V/403R、24L/32S/264A/269S/382G/403R/406M、24L/32S/264A/330Q、24L/32S/269S、24L/32S/269S/382G/385V/389E/402I/406M、24L/32S/269S/403R、24L/32S/330Q、24L/264A/269S/389E/402V/406M、70L/126F/175S/191D/246K/325H/354I/366Q、70L/126F/175S/325H/330Q/351L/354I/366Q、70L/126F/191D/246K/325H/351L/354I/366Q/423K、70L/126F/191D/246K/325H/351L/354I/423K、70L/126F/191D/246K/325H/351L/366Q/423K、70L/126F/191D/246K/354I/366Q、70L/126F/246K/330Q/366Q、70L/126F/246K/354I/366Q、126F/211E/220L/253D/316V/342L、126F/211E/220L/275Q/279L/323V、126F/211E/260V/423K、126F/220L/260V、126F/220L/316V、56V/220L/260V/423K、220L/260V和220L/260V/423K,其中所述位置参照SEQ ID NO:792来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E24L/N32S/S264A/Y269S/P330Q/L402V/K403R、E24L/N32S/S264A/Y269S/A382G/K403R/I406M、E24L/N32S/S264A/P330Q、E24L/N32S/Y269S、E24L/N32S/Y269S/A382G/I385V/D389E/L402I/I406M、E24L/N32S/Y269S/K403R、E24L/N32S/P330Q、E24L/S264A/Y269S/D389E/L402V/I406M、F70L/I126F/P175S/N191D/M246K/K325H/L354I/H366Q、F70L/I126F/P175S/K325H/P330Q/M351L/L354I/H366Q、F70L/I126F/N191D/M246K/K325H/M351L/L354I/H366Q/E423K、F70L/I126F/N191D/M246K/K325H/M351L/L354I/E423K、F70L/I126F/N191D/M246K/K325H/M351L/H366Q/E423K、F70L/I126F/N191D/M246K/L354I/H366Q、F70L/I126F/M246K/P330Q/H366Q、F70L/I126F/M246K/L354I/H366Q、I126F/T211E/C220L/G253D/I316V/I342L、I126F/T211E/C220L/D275Q/V279L/L323V、I126F/T211E/T260V/E423K、I126F/C220L/T260V、I126F/C220L/I316V、I56V/C220L/T260V/E423K、C220L/T260V和C220L/T260V/E423K,其中所述位置参照SEQ ID NO:792来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:954、956、958、960、962、964、966、968、970、972、974、976、978、980、982、984、986、988、990、992、994、996、998和/或1000。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:954、956、958、960、962、964、966、968、970、972、974、976、978、980、982、984、986、988、990、992、994、996、998和/或1000。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:954、956、958、960、962、964、966、968、970、972、974、976、978、980、982、984、986、988、990、992、994、996、998和/或1000。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24/32/97/162/202、24/32/126/198/201/367、24/32/126/198/202/220/226/260/269S、24/32/146/226、24/32/198/201/220/226、24/32/198/201/226、24/97/260/367、32/97/198/202/226/260、32/202/367、32/226/367、56/175/197/211/330/382/385、56/175/197/253/385/389、56/175/264/382/385/389/402/406、56/197/264/279/330/382/389/402/403/406、56/211/253/316/323、56/211/264/316/389、56/211/279/323/330/402、56/264/385/389、97/202/367、162/220/226/367、175/197/211/264/330、175/211/264/279/316/323、175/211/279/323/330/402/403/406、175/211/323/382/402/403/406、175/211/403/406、175/264/316/323/330/403/406、175/264/316/389/402、175/264/323/330、197/211/316/342/406、197/211/316/382/389/402/403、197/211/402、197/279/323、198/201/367、198/202/220/269/367、201/202/367、211/382/406、211/385/389、211/402/403和389,其中所述位置参照SEQ ID NO:954来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24L/32S/97G/162R/202G、24L/32S/126A/198P/201G/367W、24L/32S/126A/198P/202G/220L/226V/260V/269S、24L/32S/146A/226V、24L/32S/198P/201G/220L/226V、24L/32S/198P/201G/226V、24L/97G/260V/367W、32S/97G/198P/202G/226V/260V、32S/202G/367W、32S/226V/367W、56V/175S/197P/211E/330Q/382G/385V、56V/175S/197P/253D/385V/389E、56V/175S/264A/382G/385V/389E/402V/406M、56V/197P/264A/279L/330Q/382G/389E/402V/403R/406M、56V/211E/253D/316V/323V、56V/211E/264A/316V/389E、56V/211E/279L/323V/330Q/402I、56V/264A/385V/389E、97G/202G/367W、162R/220L/226V/367W、175S/197P/211E/264A/330Q、175S/211E/264A/279L/316V/323V、175S/211E/279L/323V/330Q/402I/403R/406M、175S/211E/323V/382G/402I/403R/406M、175S/211E/403R/406M、175S/264A/316V/323V/330Q/403R/406M、175S/264A/316V/389E/402V、175S/264A/323V/330Q、197P/211E/316V/342L/406M、197P/211E/316V/382G/389E/402I/403R、197P/211E/402I、197P/279L/323V、198P/201G/367W、198P/202G/220L/269S/367W、201G/202G/367W、211E/382G/406M、211E/385V/389E、211E/402I/403R和D389E,其中所述位置参照SEQID NO:954来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E24L/N32S/H97G/N162R/Q202G、E24L/N32S/F126A/E198P/M201G/N367W、E24L/N32S/F126A/E198P/Q202G/C220L/W226V/T260V/Y269S、E24L/N32S/L146A/W226V、E24L/N32S/E198P/M201G/C220L/W226V、E24L/N32S/E198P/M201G/W226V、E24L/H97G/T260V/N367W、N32S/H97G/E198P/Q202G/W226V/T260V、N32S/Q202G/N367W、N32S/W226V/N367W、I56V/P175S/A197P/T211E/P330Q/A382G/I385V、I56V/P175S/A197P/G253D/I385V/D389E、I56V/P175S/S264A/A382G/I385V/D389E/L402V/I406M、I56V/A197P/S264A/V279L/P330Q/A382G/D389E/L402V/K403R/I406M、I56V/T211E/G253D/I316V/L323V、I56V/T211E/S264A/I316V/D389E、I56V/T211E/V279L/L323V/P330Q/L402I、I56V/S264A/I385V/D389E、H97G/Q202G/N367W、N162R/C220L/W226V/N367W、P175S/A197P/T211E/S264A/P330Q、P175S/T211E/S264A/V279L/I316V/L323V、P175S/T211E/V279L/L323V/P330Q/L402I/K403R/I406M、P175S/T211E/L323V/A382G/L402I/K403R/I406M、P175S/T211E/K403R/I406M、P175S/S264A/I316V/L323V/P330Q/K403R/I406M、P175S/S264A/I316V/D389E/L402V、P175S/S264A/L323V/P330Q、A197P/T211E/I316V/I342L/I406M、A197P/T211E/I316V/A382G/D389E/L402I/K403R、A197P/T211E/L402I、A197P/V279L/L323V、E198P/M201G/N367W、E198P/Q202G/C220L/Y269S/N367W、M201G/Q202G/N367W、T211E/A382G/I406M、T211E/I385V/D389E、T211E/L402I/K403R和D389E,其中所述位置参照SEQ ID NO:954来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1002、1004、1006、1008、1010、1012、1014、1016、1018、1020、1022、1024、1026、1028、1030、1032、1034、1036、1038、1040、1042、1044、1046、1048、1050、1052、1054、1056、1058、1060、1062、1064、1066、1068、1070、1072、1074、1076和/或1078。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1002、1004、1006、1008、1010、1012、1014、1016、1018、1020、1022、1024、1026、1028、1030、1032、1034、1036、1038、1040、1042、1044、1046、1048、1050、1052、1054、1056、1058、1060、1062、1064、1066、1068、1070、1072、1074、1076和/或1078。在一些另外的实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1002、1004、1006、1008、1010、1012、1014、1016、1018、1020、1022、1024、1026、1028、1030、1032、1034、1036、1038、1040、1042、1044、1046、1048、1050、1052、1054、1056、1058、1060、1062、1064、1066、1068、1070、1072、1074、1076和/或1078。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24/32/175/211/260/330/403/406、24/32/175/226/253/275/316、24/32/201/226/260/264/330/402/406、24/162/175/198/211/226/275/316/323/389、24/162/175/201/275/316、24/162/198/201/211/226/323/351、24/162/198/201/226/351、24/162/201/253/264/351/402/406、24/175/198/211/226/253/316、24/175/201/275/316/351、24/175/201/316、24/175/211/220/260/275/330/389、24/175/211/253/316、24/175/211/316/330、24/175/226/323/351、24/198/201、24/198/201/211、24/198/201/211/220/260、24/198/201/220/275/389/402/406、24/198/201/226/330/389、24/198/201/351、24/201/211/253/323/351/366/389/402/403、24/201/226/253/402/403/406、24/226/330/351/403、175/198/201/211/226/260/264/323/402/406和175/198/226/260/351/402/403/406,其中所述位置参照SEQ ID NO:1054来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24L/32S/175S/211E/260V/330Q/403R/406M、24L/32S/175S/226V/253D/275Q/316V、24L/32S/201G/226V/260V/264A/330Q/402I/406M、24L/162R/175S/198P/211E/226V/275Q/316V/323V/389E、24L/162R/175S/201G/275Q/316V、24L/162R/198P/201G/211E/226V/323V/351M、24L/162R/198P/201G/226V/351M、24L/162R/201G/253D/264A/351M/402I/406M、24L/175S/198P/211E/226V/253D/316V、24L/175S/201G/275Q/316V/351M、24L/175S/201G/316V、24L/175S/211E/220L/260V/275Q/330Q/389E、24L/175S/211E/253D/316V、24L/175S/211E/316V/330Q、24L/175S/226V/323V/351M、24L/198P/201G、24L/198P/201G/211E、24L/198P/201G/211E/220L/260V、24L/198P/201G/220L/275Q/389E/402I/406M、24L/198P/201G/226V/330Q/389E、24L/198P/201G/351M、24L/201G/211E/253D/323V/351M/366H/389E/402I/403R、24L/201G/226V/253D/402I/403R/406M、24L/226V/330Q/351M/403R、175S/198P/201G/211E/226V/260V/264A/323V/402I/406M和175S/198P/226V/260V/351M/402I/403R/406M,其中所述位置参照SEQ ID NO:1054来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:E24L/N32S/P175S/T211E/T260V/P330Q/K403R/I406M、E24L/N32S/P175S/W226V/G253D/D275Q/I316V、E24L/N32S/M201G/W226V/T260V/S264A/P330Q/L402I/I406M、E24L/N162R/P175S/E198P/T211E/W226V/D275Q/I316V/L323V/D389E、E24L/N162R/P175S/M201G/D275Q/I316V、E24L/N162R/E198P/M201G/T211E/W226V/L323V/L351M、E24L/N162R/E198P/M201G/W226V/L351M、E24L/N162R/M201G/G253D/S264A/L351M/L402I/I406M、E24L/P175S/E198P/T211E/W226V/G253D/I316V、E24L/P175S/M201G/D275Q/I316V/L351M、E24L/P175S/M201G/I316V、E24L/P175S/T211E/C220L/T260V/D275Q/P330Q/D389E、E24L/P175S/T211E/G253D/I316V、E24L/P175S/T211E/I316V/P330Q、E24L/P175S/W226V/L323V/L351M、E24L/E198P/M201G、E24L/E198P/M201G/T211E、E24L/E198P/M201G/T211E/C220L/T260V、E24L/E198P/M201G/C220L/D275Q/D389E/L402I/I406M、E24L/E198P/M201G/W226V/P330Q/D389E、E24L/E198P/M201G/L351M、E24L/M201G/T211E/G253D/L323V/L351M/Q366H/D389E/L402I/K403R、E24L/M201G/W226V/G253D/L402I/K403R/I406M、E24L/W226V/P330Q/L351M/K403R、P175S/E198P/M201G/T211E/W226V/T260V/S264A/L323V/L402I/I406M和P175S/E198P/W226V/T260V/L351M/L402I/K403R/I406M,其中所述位置参照SEQ ID NO:1054来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:2596、2598、2600、2602、2604、2606、2608、2610、2612、2614、2616、2618、2620、2622、2624、2626、2628、2630、2632、2634、2636、2638、2640、2642、2644和2646。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2596、2598、2600、2602、2604、2606、2608、2610、2612、2614、2616、2618、2620、2622、2624、2626、2628、2630、2632、2634、2636、2638、2640、2642、2644和2646。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2596、2598、2600、2602、2604、2606、2608、2610、2612、2614、2616、2618、2620、2622、2624、2626、2628、2630、2632、2634、2636、2638、2640、2642、2644和2646。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21/127/129/161、21/127/129/161/162、21/127/129/162/199/200、127/129/161/162/199、127/129/161/199/200、127/129/162、156、156/161、156/161/162、156/162/199和156/199/200,其中所述位置参照SEQ IDNO:1002来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21Y/127H/129A/161S、21Y/127H/129A/161S/162G、21Y/127H/129A/162T/199H/200A、127H/129A/162T、127Q/129A/161S/162G/199H、127Q/129A/161S/199H/200A、156R、156R/161S、156R/161S/162G、156R/161S/162T、156R/162G/199H和156R/199H/200A,其中所述位置参照SEQ ID NO:1002来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:W21Y/L127H/P129A/K161S、W21Y/L127H/P129A/K161S/N162G、W21Y/L127H/P129A/N162T/G199H/N200A、L127H/P129A/N162T、L127Q/P129A/K161S/N162G/G199H、L127Q/P129A/K161S/G199H/N200A、F156R、F156R/K161S、F156R/K161S/N162G、F156R/K161S/N162T、F156R/N162G/G199H和F156R/G199H/N200A,其中所述位置参照SEQ ID NO:1002来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:2648、2650、2652、2654、2656、2658、2660、2662、2664、2666、2668、2670、2672、2674、2676、2678、2680、2682和2684。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2648、2650、2652、2654、2656、2658、2660、2662、2664、2666、2668、2670、2672、2674、2676、2678、2680、2682和2684。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2648、2650、2652、2654、2656、2658、2660、2662、2664、2666、2668、2670、2672、2674、2676、2678、2680、2682和2684。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/7/12/15/175/260/318、7/12/400/435、7/318/451、12/15/57/71/175/260/400/402、12/15/57/220/254/260/318/402、12/15/57/318/402/435、12/15/318/400/402/406、12/57/175/451、12/175/260/264/318/400、12/175/400/402/406、12/318/402/404/406/451、12/318/402/404/451、15/175/318/400/402、57/175/220/260/264/402、57/175/404、57/220/260/400/402/406、57/260/400/402/404、57/400/402、57/402、152/192/195、160/186/195、195、260和400/402,其中所述位置参照SEQ ID NO:2600来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2-/7E/12S/15K/175S/260V/318D、7E/12S/400Q/435V、7E/318D/451N、12S/15K/57K/71I/175S/260V/400Q/402I、12S/15K/57K/220L/254K/260V/318D/402I、12S/15K/57K/318D/402I/435V、12S/15K/318D/400Q/402I/406M、12S/57K/175S/451N、12S/175S/260V/264A/318D/400Q、12S/175S/400Q/402I/406M、12S/318D/402I/404S/406M/451N、12S/318D/402I/404S/451N、15K/175S/318D/400Q/402I、57K/175S/220L/260V/264A/402I、57K/175S/404G、57K/220L/260V/400Q/402I/406M、57K/260V/400Q/402I/404S、57K/400Q/402I、57K/402I、152V/192D/195P、160V/186M/195P、195P、260V和400Q/402I,其中所述位置参照SEQ ID NO:2600来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H2-/H7E/A12S/R15K/P175S/T260V/E318D、H7E/A12S/E400Q/A435V、H7E/E318D/K451N、A12S/R15K/I57K/V71I/P175S/T260V/E400Q/L402I、A12S/R15K/I57K/C220L/T254K/T260V/E318D/L402I、A12S/R15K/I57K/E318D/L402I/A435V、A12S/R15K/E318D/E400Q/L402I/I406M、A12S/I57K/P175S/K451N、A12S/P175S/T260V/S264A/E318D/E400Q、A12S/P175S/E400Q/L402I/I406M、A12S/E318D/L402I/D404S/I406M/K451N、A12S/E318D/L402I/D404S/K451N、R15K/P175S/E318D/E400Q/L402I、I57K/P175S/C220L/T260V/S264A/L402I、I57K/P175S/D404G、I57K/C220L/T260V/E400Q/L402I/I406M、I57K/T260V/E400Q/L402I/D404S、I57K/E400Q/L402I、I57K/L402I、L152V/E192D/R195P、L160V/F186M/R195P、R195P、T260V和E400Q/L402I,其中所述位置参照SEQ ID NO:2600来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:32、135、148、152、186、237、239、240、323、325、326、327、330、331和356,其中所述位置参照SEQ IDNO:2600来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:32R、135A、148A、152V、186V、237T、239E、239F、239Y、240A、240P、323L、325G、325R、326M、327V、330A、331C、331H、331S和356G,其中所述位置参照SEQ ID NO:2600来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:N32R、V135A、S148A、L152V、F186V、D237T、I239E、I239F、I239Y、T240A、T240P、V323L、H325G、H325R、F326M、A327V、P330A、R331C、R331H、R331S和F356G,其中所述位置参照SEQ ID NO:2600来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:2686、2688、2690、2692、2694、2696、2698、2700、2702、2704、2706、2708、2710、2712、2714、2716、2718、2720、2722、2724、2726、2728、2730、2732、2734、2736、2738、2740、2742、2744、2746、2748、2750、2752、2754、2756、2758、2760、2762、2764、2766、2768、2770、2772和2774。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2686、2688、2690、2692、2694、2696、2698、2700、2702、2704、2706、2708、2710、2712、2714、2716、2718、2720、2722、2724、2726、2728、2730、2732、2734、2736、2738、2740、2742、2744、2746、2748、2750、2752、2754、2756、2758、2760、2762、2764、2766、2768、2770、2772和2774。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2686、2688、2690、2692、2694、2696、2698、2700、2702、2704、2706、2708、2710、2712、2714、2716、2718、2720、2722、2724、2726、2728、2730、2732、2734、2736、2738、2740、2742、2744、2746、2748、2750、2752、2754、2756、2758、2760、2762、2764、2766、2768、2770、2772和2774。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/23/274/326/329、14/31/184/274/322/326/329/330、14/56/184/185/194/238/239/274/329/399、14/56/184/194/234/315/326/329/399/401、14/56/194/238/315/325/326/329/330/399、14/56/252/274/315/326/329/330/401、14/184/185/194/234/325/326/329、14/184/185/194/388/399/401、14/184/194/355/399、14/185/194/238/399、14/185/236/238/239/274/322/326/329/355/399/401、14/194、14/322/326/330、14/326/330、14/355、14/355/399、23/31/147/184/185/238/252/325/329/330/388/401、31/56/315/329/330、65、65/114/132/238、65/238/240、147/236/238/243/315/329/330/399/401、185/194/236/239/325/326、223/412和238,其中所述位置参照SEQ ID NO:2718来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14R/23Q/274Q/326V/329A、14R/31R/184A/274Q/322L/326V/329A/330H、14R/56K/184A/185M/194P/238M/239A/274Q/329A/399Q、14R/56K/184A/194P/234Y/315V/326V/329Q/399Q/401I、14R/56K/194P/238M/315V/325M/326V/329A/330H/399Q、14R/56K/252D/274Q/315V/326V/329A/330H/401I、14R/184A/185M/194P/234Y/325M/326V/329A、14R/184A/185M/194P/388E/399Q/401I、14R/184A/194P/355G/399Q、14R/185M/194P/238M/399Q、14R/185M/236T/238M/239A/274Q/322L/326V/329Q/355G/399Q/401I、14R/194P、14R/322L/326V/330H、14R/326V/330H、14R/355G、14R/355G/399Q、23Q/31R/147A/184A/185M/238M/252D/325M/329A/330H/388E/401I、31R/56K/315V/329A/330H、65D、65D/114E/132R/238M、65D/238T/240S、147A/236T/238M/243G/315V/329A/330H/399Q/401I、185M/194P/236T/239A/325M/326V、223T/412S和238M,其中所述位置参照SEQ ID NO:2718来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:K14R/L23Q/D274Q/A326V/P329A、K14R/N31R/M184A/D274Q/V322L/A326V/P329A/R330H、K14R/I56K/M184A/F185M/R194P/I238M/T239A/D274Q/P329A/E399Q、K14R/I56K/M184A/R194P/F234Y/I315V/A326V/P329Q/E399Q/L401I、K14R/I56K/R194P/I238M/I315V/F325M/A326V/P329A/R330H/E399Q、K14R/I56K/G252D/D274Q/I315V/A326V/P329A/R330H/L401I、K14R/M184A/F185M/R194P/F234Y/F325M/A326V/P329A、K14R/M184A/F185M/R194P/D388E/E399Q/L401I、K14R/M184A/R194P/F355G/E399Q、K14R/F185M/R194P/I238M/E399Q、K14R/F185M/D236T/I238M/T239A/D274Q/V322L/A326V/P329Q/F355G/E399Q/L401I、K14R/R194P、K14R/V322L/A326V/R330H、K14R/A326V/R330H、K14R/F355G、K14R/F355G/E399Q、L23Q/N31R/S147A/M184A/F185M/I238M/G252D/F325M/P329A/R330H/D388E/L401I、N31R/I56K/I315V/P329A/R330H、E65D、E65D/Q114E/H132R/I238M、E65D/I238T/N240S、S147A/D236T/I238M/D243G/I315V/P329A/R330H/E399Q/L401I、F185M/R194P/D236T/T239A/F325M/A326V、S223T/I412S和I238M,其中所述位置参照SEQ ID NO:2718来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11、45、55、56、58、65、104、113、114、132、135、138、165、238、256、273、286、309、391、422、430和449,其中所述位置参照SEQ ID NO:2718来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11G、11Q、45F、45V、55L、56T、58R、65N、65S、104L、113V、114R、132Q、132S、135L、138G、138K、165P、238G、256P、273R、286R、309E、309H、391R、422R、430L、430V和449F,其中所述位置参照SEQ ID NO:2718来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:S11G、S11Q、L45F、L45V、I55L、I56T、K58R、E65N、E65S、M104L、L113V、Q114R、H132Q、H132S、N135L、N138G、N138K、E165P、I238G、E256P、E273R、N286R、K309E、K309H、N391R、K422R、E430L、E430V和Y449F,其中所述位置参照SEQ ID NO:2718来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQID NO:2776、2778、2780、2782、2784、2786、2788、2790、2792、2794、2796、2798、2800、2802、2804、2806、2808、2810、2812、2814、2816、2818、2820、2822、2824、2826、2828、2830、2832、2834、2836、2838、2840、2842、2844、2846、2848、2850、2852、2854、2856、2858、2860、2862、2864、2866、2868、2870、2872、2874、2876、2878、2880和2882。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2776、2778、2780、2782、2784、2786、2788、2790、2792、2794、2796、2798、2800、2802、2804、2806、2808、2810、2812、2814、2816、2818、2820、2822、2824、2826、2828、2830、2832、2834、2836、2838、2840、2842、2844、2846、2848、2850、2852、2854、2856、2858、2860、2862、2864、2866、2868、2870、2872、2874、2876、2878、2880和2882。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2776、2778、2780、2782、2784、2786、2788、2790、2792、2794、2796、2798、2800、2802、2804、2806、2808、2810、2812、2814、2816、2818、2820、2822、2824、2826、2828、2830、2832、2834、2836、2838、2840、2842、2844、2846、2848、2850、2852、2854、2856、2858、2860、2862、2864、2866、2868、2870、2872、2874、2876、2878、2880和2882。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:23/31/185/324/401、23/31/185/355、31/134/185/252/274/324/388、31/134/238/252/322/324/388、31/134/252/324、31/184/185/238/239/322、31/236、31/322、31/388、134/184/185/234/236/239/274/324/388、184/185/322、234/236/238/322/324/355、236、238/324/329/355、322/324和324/329/355/401,参照SEQ ID NO:2814来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:23Q/31R/185M/324G/401I、23Q/31R/185M/355G、31R/134A/185M/252D/274Q/324G/388E、31R/134A/238E/252D/322L/324G/388E、31R/134A/252D/324G、31R/184A/185M/238Y/239A/322L、31R/236T、31R/322L、31R/388E、134A/184A/185M/234Y/236T/239A/274Q/324G/388E、184A/185M/322L、234Y/236T/238E/322L/324G/355G、236T、238Y/324G/329Q/355G、322L/324G和324G/329Q/355G/401I,参照SEQ ID NO:2814来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:L23Q/N31R/F185M/H324G/L401I、L23Q/N31R/F185M/F355G、N31R/V134A/F185M/G252D/D274Q/H324G/D388E、N31R/V134A/M238E/G252D/V322L/H324G/D388E、N31R/V134A/G252D/H324G、N31R/M184A/F185M/M238Y/T239A/V322L、N31R/D236T、N31R/V322L、N31R/D388E、V134A/M184A/F185M/F234Y/D236T/T239A/D274Q/H324G/D388E、M184A/F185M/V322L、F234Y/D236T/M238E/V322L/H324G/F355G、D236T、M238Y/H324G/A329Q/F355G、V322L/H324G和H324G/A329Q/F355G/L401I,参照SEQ ID NO:2814来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:122、164、176、177、316、325、400、425、426、427、440和446,参照SEQ ID NO:2814来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:122L、164H、164M、164R、176K、176L、176N、176R、177A、316R、325L、400V、425R、426A、426R、427R、440R和446R,参照SEQ ID NO:2814来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:I122L、V164H、V164M、V164R、V176K、V176L、V176N、V176R、E177A、G316R、M325L、T400V、K425R、S426A、S426R、I427R、I440R和S446R,参照SEQ ID NO:2814来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:2884、2886、2888、2890、2892、2894、2896、2898、2900、2902、2904、2906、2908、2910、2912、2914、2916、2918、2920、2922、2924、2926、2928、2830、2932、2934、2936、2938、2940、2942、2944、2946、2948和2950,参照SEQ IDNO:2814来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2884、2886、2888、2890、2892、2894、2896、2898、2900、2902、2904、2906、2908、2910、2912、2914、2916、2918、2920、2922、2924、2926、2928、2830、2932、2934、2936、2938、2940、2942、2944、2946、2948和2950。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2884、2886、2888、2890、2892、2894、2896、2898、2900、2902、2904、2906、2908、2910、2912、2914、2916、2918、2920、2922、2924、2926、2928、2830、2932、2934、2936、2938、2940、2942、2944、2946、2948和2950。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11、11/45/58/132/138/286、11/58、11/58/65/104/107/138/286、11/58/65/107/135/223/286/391/430、11/58/65/135/138、11/58/104/107/114/138/223/391、11/58/114/286/309/391、11/58/132/165/286/391/422/430、11/58/138/309、11/65/104/107/138/165/286/391/430、11/65/107/135/165/391/430、11/65/132/135/138/223/391、11/65/132/135/252、11/65/132/391/430、11/65/135/138、11/104/132/138/309/391、11/104/132/138/391、11/107/114/223/309/430、11/107/138、11/114/135/138/223、11/114/223/252/286/391、11/132/135/138/223/286、11/132/138/223/286/391、11/138/165/223/309、58/65/138、58/65/138/165、58/65/165/309/430、58/104/114/165/391、107/114/132/138、107/430、135/138/165/309/430和223/309,其中所述位置参照SEQ ID NO:2884来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11G/45V/58R/132Q/138G/286R、11G/58R/104L/107G/114R/138K/223T/391R、11G/58R/114R/286R/309H/391R、11G/58R/132Q/165P/286R/391R/422S/430L、11G/65N/132Q/391R/430L、11G/104L/132Q/138G/309H/391R、11G/107G/114R/223T/309H/430L、11Q、11Q/58R、11Q/58R/65N/104L/107G/138G/286R、11Q/58R/65N/107G/135L/223T/286R/391R/430L、11Q/58R/65N/135L/138G、11Q/58R/138G/309E、11Q/65N/104L/107G/138G/165P/286R/391R/430L、11Q/65N/107G/135L/165P/391R/430L、11Q/65N/132Q/135L/138G/223T/391R、11Q/65N/132Q/135L/252D、11Q/65N/135L/138G、11Q/104L/132Q/138K/391R、11Q/107G/138G、11Q/114R/135L/138G/223T、11Q/114R/223T/252D/286R/391R、11Q/132Q/135L/138K/223T/286R、11Q/132Q/138G/223T/286R/391R、11Q/138K/165P/223T/309H、58R/65N/138G/165P、58R/65N/138K、58R/65N/165P/309H/430L、58R/104L/114R/165P/391R、107G/114R/132Q/138G、107G/430L、135L/138G/165P/309H/430L和223T/309E,其中所述位置参照SEQ ID NO:2884来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:S11G/L45V/K58R/H132Q/N138G/N286R、S11G/K58R/M104L/P107G/Q114R/N138K/S223T/N391R、S11G/K58R/Q114R/N286R/K309H/N391R、S11G/K58R/H132Q/E165P/N286R/N391R/K422S/E430L、S11G/E65N/H132Q/N391R/E430L、S11G/M104L/H132Q/N138G/K309H/N391R、S11G/P107G/Q114R/S223T/K309H/E430L、S11Q、S11Q/K58R、S11Q/K58R/E65N/M104L/P107G/N138G/N286R、S11Q/K58R/E65N/P107G/N135L/S223T/N286R/N391R/E430L、S11Q/K58R/E65N/N135L/N138G、S11Q/K58R/N138G/K309E、S11Q/E65N/M104L/P107G/N138G/E165P/N286R/N391R/E430L、S11Q/E65N/P107G/N135L/E165P/N391R/E430L、S11Q/E65N/H132Q/N135L/N138G/S223T/N391R、S11Q/E65N/H132Q/N135L/G252D、S11Q/E65N/N135L/N138G、S11Q/M104L/H132Q/N138K/N391R、S11Q/P107G/N138G、S11Q/Q114R/N135L/N138G/S223T、S11Q/Q114R/S223T/G252D/N286R/N391R、S11Q/H132Q/N135L/N138K/S223T/N286R、S11Q/H132Q/N138G/S223T/N286R/N391R、S11Q/N138K/E165P/S223T/K309H、K58R/E65N/N138G/E165P、K58R/E65N/N138K、K58R/E65N/E165P/K309H/E430L、K58R/M104L/Q114R/E165P/N391R、P107G/Q114R/H132Q/N138G、P107G/E430L、N135L/N138G/E165P/K309H/E430L和S223T/K309E,其中所述位置参照SEQ ID NO:2884来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:2952、2954、2956、2958、2960、2962、2964、2966、2968、2970、2972、2974、2976、2978、2980、2982、2984、2986、2988、2990、2992、2994、2996、2998、3000、3002、3004、3006、3008、3010、3012、3014和3016。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2952、2954、2956、2958、2960、2962、2964、2966、2968、2970、2972、2974、2976、2978、2980、2982、2984、2986、2988、2990、2992、2994、2996、2998、3000、3002、3004、3006、3008、3010、3012、3014和3016。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2952、2954、2956、2958、2960、2962、2964、2966、2968、2970、2972、2974、2976、2978、2980、2982、2984、2986、2988、2990、2992、2994、2996、2998、3000、3002、3004、3006、3008、3010、3012、3014和3016。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/448、58/107/122/176/236/324/325/400/426/427、58/107/122/236/324/400/425/446、58/107/122/322/400/425/427/440/446、58/107/164/400、58/107/236/400、58/107/400、58/122/164/236/446、58/122/176/236/400/446、58/122/176/322/324/426/427、58/122/322/325、58/122/325、58/122/440、58/164/176、58/164/324/425/427、58/176/236、58/236、107/122/236/425/426/446、107/164/236/400/446、107/176/322/325/440/446、107/176/400/425/427/440、107/236、107/440、122/164/176/324/400、122/164/400/440、122/164/400/440/446、122/176/236/400、122/176/324/400/440、122/400、122/425/426/446、122/440/446、139、139/252、164、164/271/425/426、164/322/324/325/400/425/440/446、164/400、176/400、189和324/400/425/426/440/446,其中所述位置参照SEQ ID NO:3016来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8S/448A、58R/107G/122L/176R/236T/324G/325L/400V/426R/427R、58R/107G/122L/236T/324G/400V/425R/446R、58R/107G/122L/322L/400V/425R/427R/440R/446R、58R/107G/164H/400V、58R/107G/236T/400V、58R/107G/400V、58R/122L/164H/236T/446R、58R/122L/176R/236T/400V/446R、58R/122L/176R/322L/324G/426A/427R、58R/122L/322L/325L、58R/122L/325L、58R/122L/440R、58R/164H/176R、58R/164H/324G/425R/427R、58R/176R/236T、58R/236T、107G/122L/236T/425R/426A/446R、107G/164H/236T/400V/446R、107G/176R/322L/325L/440R/446R、107G/176R/400V/425R/427R/440R、107G/236T、107G/440R、122L/164H/176R/324G/400V、122L/164H/400V/440R、122L/164H/400V/440R/446R、122L/176R/236T/400V、122L/176R/324G/400V/440R、122L/400V、122L/425R/426R/446R、122L/440R/446R、139V、139V/252D、164H、164H/271G/425R/426R、164H/322L/324G/325L/400V/425R/440R/446R、164H/400V、176R/400V、189R和324G/400V/425R/426R/440R/446R,其中所述位置参照SEQ ID NO:3016来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:G8S/K448A、K58R/P107G/I122L/V176R/D236T/H324G/M325L/T400V/S426R/I427R、K58R/P107G/I122L/D236T/H324G/T400V/K425R/S446R、K58R/P107G/I122L/V322L/T400V/K425R/I427R/I440R/S446R、K58R/P107G/V164H/T400V、K58R/P107G/D236T/T400V、K58R/P107G/T400V、K58R/I122L/V164H/D236T/S446R、K58R/I122L/V176R/D236T/T400V/S446R、K58R/I122L/V176R/V322L/H324G/S426A/I427R、K58R/I122L/V322L/M325L、K58R/I122L/M325L、K58R/I122L/I440R、K58R/V164H/V176R、K58R/V164H/H324G/K425R/I427R、K58R/V176R/D236T、K58R/D236T、P107G/I122L/D236T/K425R/S426A/S446R、P107G/V164H/D236T/T400V/S446R、P107G/V176R/V322L/M325L/I440R/S446R、P107G/V176R/T400V/K425R/I427R/I440R、P107G/D236T、P107G/I440R、I122L/V164H/V176R/H324G/T400V、I122L/V164H/T400V/I440R、I122L/V164H/T400V/I440R/S446R、I122L/V176R/D236T/T400V、I122L/V176R/H324G/T400V/I440R、I122L/T400V、I122L/K425R/S426R/S446R、I122L/I440R/S446R、I139V、I139V/G252D、V164H、V164H/S271G/K425R/S426R、V164H/V322L/H324G/M325L/T400V/K425R/I440R/S446R、V164H/T400V、V176R/T400V、P189R和H324G/T400V/K425R/S426R/I440R/S446R,其中所述位置参照SEQ ID NO:3016来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:9、65、106、115、116、172、178、200、210、213、240、242、245、255、324/423、385、408、409、411、412、415、416、423和447,其中所述位置参照SEQ ID NO:3016来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:9C、9M、65S、106A、115D、115R、116V、172R、172S、178K、200A、200T、200V、210L、210V、213G、240C、240E、240L、240P、240V、242I、242Y、245M、255P、324R/423R、385R、408P、409L、411Q、412R、415A、415H、415K、415R、416R、423A、423R、447L和447R,其中所述位置参照SEQ ID NO:3016来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:S9C、S9M、N65S、K106A、N115D、N115R、L116V、N172R、N172S、Q178K、G200A、G200T、G200V、E210L、E210V、A213G、N240C、N240E、N240L、N240P、N240V、A242I、A242Y、K245M、D255P、H324R/N423R、V385R、E408P、T409L、E411Q、I412R、G415A、G415H、G415K、G415R、K416R、N423A、N423R、N447L和N447R,其中所述位置参照SEQ ID NO:3016来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:3018、3020、3022、3024、3026、3028、3030、3032、3034、3036、3038、3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062、3064、3066、3068、3070、3072、3074、3076、3078、3080、3082、3084、3086、3088、3090、3092、3094、3096、3098、3100、3102、3104、3106、3108、3110、3112、3114、3116、3118、3120、3122、3124、3126、3128、3130、3132、3134、3136、3138、3140、3142、3144、3146、3148、3150、3152、3154、3156、3158、3160、3162、3164、3166、3168、3170、3172、3174、3176、3178和3180。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:3018、3020、3022、3024、3026、3028、3030、3032、3034、3036、3038、3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062、3064、3066、3068、3070、3072、3074、3076、3078、3080、3082、3084、3086、3088、3090、3092、3094、3096、3098、3100、3102、3104、3106、3108、3110、3112、3114、3116、3118、3120、3122、3124、3126、3128、3130、3132、3134、3136、3138、3140、3142、3144、3146、3148、3150、3152、3154、3156、3158、3160、3162、3164、3166、3168、3170、3172、3174、3176、3178和3180。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:3018、3020、3022、3024、3026、3028、3030、3032、3034、3036、3038、3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062、3064、3066、3068、3070、3072、3074、3076、3078、3080、3082、3084、3086、3088、3090、3092、3094、3096、3098、3100、3102、3104、3106、3108、3110、3112、3114、3116、3118、3120、3122、3124、3126、3128、3130、3132、3134、3136、3138、3140、3142、3144、3146、3148、3150、3152、3154、3156、3158、3160、3162、3164、3166、3168、3170、3172、3174、3176、3178和3180。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2-、8、8/107/139/164/415/416/440/448、8/107/139/255/322/325/415/416/440/448、8/107/164/255、8/107/164/423/440、8/139、8/139/164/200/236/240/322/440/448、8/139/164/236/416/423/440、8/139/189/240/325/416、8/139/200/236/240/255/423、8/139/255/415/416、8/164、8/164/189/200/322/324/325/416/448、8/164/240/423、8/164/252/255/448、8/164/448、8/236/240/252/448、8/240/423、8/252/255/322/325/448、12/164/440、107/139、107/139/200/240/322/324/325/448、107/236/240/325/440、107/240/252/423/448、107/423、139、139/164/236/240、139/255/325/415/440、164/189、164/189/236/240、164/189/240/252/415/423、164/200/236、164/200/236/240/324/416/440、164/200/236/255/322/324/423/440、164/236、164/236/240/440、164/236/423、164/322/325、164/322/325/416/423、164/416/448、200/236/322/325/416、200/322/325/415/448、236/415/416、240、240/252/255/322/415/416、240/252/255/415/448、255/423、325和415/416/448,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2-、8S、8S/107G/139V/164H/415A/416R/440R/448A、8S/107G/139V/255P/322L/325L/415A/416R/440R/448A、8S/107G/164H/255P、8S/107G/164H/423R/440R、8S/139V、8S/139V/164H/200A/236T/240E/322L/440R/448A、8S/139V/164H/236T/416R/423R/440R、8S/139V/189R/240E/325L/416R、8S/139V/200A/236T/240E/255P/423R、8S/139V/255P/415A/416R、8S/164H、8S/164H/189R/200A/322L/324G/325L/416R/448A、8S/164H/240E/423R、8S/164H/252D/255P/448A、8S/164H/448A、8S/236T/240E/252D/448A、8S/240E/423R、8S/252D/255P/322L/325L/448A、12S/164H/440R、107G/139V、107G/139V/200A/240E/322L/324G/325L/448A、107G/236T/240E/325L/440R、107G/240E/252D/423R/448A、107G/423R、139V、139V/164H/236T/240E、139V/255P/325L/415A/440R、164H/189R、164H/189R/236T/240E、164H/189R/240E/252D/415A/423R、164H/200A/236T、164H/200A/236T/240E/324G/416R/440R、164H/200A/236T/255P/322L/324G/423R/440R、164H/236T、164H/236T/240E/440R、164H/236T/423R、164H/322L/325L、164H/322L/325L/416R/423R、164H/416R/448A、200A/236T/322L/325L/416R、200A/322L/325L/415A/448A、236T/415A/416R、240E、240E/252D/255P/322L/415A/416R、240E/252D/255P/415A/448A、255P/423R、325L和415A/416R/448A,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H2-、G8S、G8S/P107G/I139V/V164H/G415A/K416R/I440R/K448A、G8S/P107G/I139V/D255P/V322L/M325L/G415A/K416R/I440R/K448A、G8S/P107G/V164H/D255P、G8S/P107G/V164H/N423R/I440R、G8S/I139V、G8S/I139V/V164H/G200A/D236T/N240E/V322L/I440R/K448A、G8S/I139V/V164H/D236T/K416R/N423R/I440R、G8S/I139V/P189R/N240E/M325L/K416R、G8S/I139V/G200A/D236T/N240E/D255P/N423R、G8S/I139V/D255P/G415A/K416R、G8S/V164H、G8S/V164H/P189R/G200A/V322L/H324G/M325L/K416R/K448A、G8S/V164H/N240E/N423R、G8S/V164H/G252D/D255P/K448A、G8S/V164H/K448A、G8S/D236T/N240E/G252D/K448A、G8S/N240E/N423R、G8S/G252D/D255P/V322L/M325L/K448A、T12S/V164H/I440R、P107G/I139V、P107G/I139V/G200A/N240E/V322L/H324G/M325L/K448A、P107G/D236T/N240E/M325L/I440R、P107G/N240E/G252D/N423R/K448A、P107G/N423R、I139V、I139V/V164H/D236T/N240E、I139V/D255P/M325L/G415A/I440R、V164H/P189R、V164H/P189R/D236T/N240E、V164H/P189R/N240E/G252D/G415A/N423R、V164H/G200A/D236T、V164H/G200A/D236T/N240E/H324G/K416R/I440R、V164H/G200A/D236T/D255P/V322L/H324G/N423R/I440R、V164H/D236T、V164H/D236T/N240E/I440R、V164H/D236T/N423R、V164H/V322L/M325L、V164H/V322L/M325L/K416R/N423R、V164H/K416R/K448A、G200A/D236T/V322L/M325L/K416R、G200A/V322L/M325L/G415A/K448A、D236T/G415A/K416R、N240E、N240E/G252D/D255P/V322L/G415A/K416R、N240E/G252D/D255P/G415A/K448A、D255P/N423R、M325L和G415A/K416R/K448A,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、3、8、34、72、73、75、113、114、186、189、221、235、237、239、256、286、299、305、309、312、313、323、355、389、406、422、438和446,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2N、2S、2T、3I、8S、34R、72Y、73A、73P、73T、73V、75H、113I、114V、186G、186I、189S、221K、235M、237L、237M、237V、239A、256I、256L、256S、256T、286L、286S、299A、299L、299R、299V、305G、309R、312S、312T、312V、313D、323P、355A、389F、389G、406F、406G、406N、406Q、422C、422R、422S、438T、446H和446P,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H2N、H2S、H2T、H3I、G8S、K34R、L72Y、H73A、H73P、H73T、H73V、P75H、L113I、Q114V、E186G、E186I、P189S、E221K、Q235M、P237L、P237M、P237V、T239A、E256I、E256L、E256S、E256T、N286L、N286S、E299A、E299L、E299R、E299V、D305G、K309R、L312S、L312T、L312V、E313D、D323P、F355A、D389F、D389G、T406F、T406G、T406N、T406Q、K422C、K422R、K422S、E438T、R446H和R446P,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:20/126/128/155/161、20/126/128/160/161、20/126/128/160/161/198、20/126/128/161、20/126/128/161/198/199、20/126/155/160/198、20/126/155/161、20/126/160、20/126/160/161、20/126/161、20/128/155/160/161/198、20/128/155/161/199、20/128/155/199、20/128/160/161/198、20/155/160、20/155/160/161、20/155/161、20/155/161/199、20/160/161/198、121/126/128/161/369、126/128/155/160/161、126/128/155/160/161/199、126/128/155/161/199、126/128/160/161/369、126/128/160/198/369、126/128/160/199/369、126/128/160/369、126/128/161/199/369、126/128/161/369、126/128/369、126/160/161/199/369、126/160/198/369、126/196/198/369、126/198/369、126/199/369、126/369、128/155/160/161、128/155/160/161/199、128/155/160/198、128/155/199、128/160/161/369、128/161/199/369、128/198/199/369、128/199/369、128/369、155/161/198/199、155/199、160/161/369、161/198/369、161/369和199/369,其中所述位置参照SEQID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:20Y/126H/128A/155R/161T、20Y/126H/128A/161T、20Y/126H/155R/160S/198P、20Y/126H/160S、20Y/126H/160S/161T、20Y/126Q/128A/160S/161T、20Y/126Q/128A/160S/161T/198H、20Y/126Q/128A/161T/198H/199A、20Y/126Q/155R/161G、20Y/126Q/161G、20Y/128A/155R/160S/161T/198H、20Y/128A/155R/161T/199A、20Y/128A/155R/199A、20Y/128A/160S/161T/198P、20Y/155R/160S、20Y/155R/160S/161G、20Y/155R/161T、20Y/155R/161T/199A、20Y/160S/161T/198H、121F/126H/128A/161T/369N、126H/128A/155R/160S/161T、126H/128A/160S/198H/369N、126H/128A/161G/199A/369N、126H/128A/161G/369N、126H/128A/369N、126H/160S/161G/199A/369N、126H/160S/198P/369N、126H/196V/198P/369N、126Q/128A/155R/160S/161T/199A、126Q/128A/155R/161G/199A、126Q/128A/160S/161T/369N、126Q/128A/160S/199A/369N、126Q/128A/160S/369N、126Q/198P/369N、126Q/199A/369N、126Q/369N、128A/155R/160S/161T、128A/155R/160S/161T/199A、128A/155R/160S/198P、128A/155R/199A、128A/160S/161G/369N、128A/161G/199A/369N、128A/198H/199A/369N、128A/199A/369N、128A/369N、155R/161G/198H/199A、155R/199A、160S/161G/369N、160S/161T/369N、161T/198P/369N、161T/369N和199A/369N,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:W20Y/L126H/P128A/F155R/R161T、W20Y/L126H/P128A/R161T、W20Y/L126H/F155R/K160S/G198P、W20Y/L126H/K160S、W20Y/L126H/K160S/R161T、W20Y/L126Q/P128A/K160S/R161T、W20Y/L126Q/P128A/K160S/R161T/G198H、W20Y/L126Q/P128A/R161T/G198H/N199A、W20Y/L126Q/F155R/R161G、W20Y/L126Q/R161G、W20Y/P128A/F155R/K160S/R161T/G198H、W20Y/P128A/F155R/R161T/N199A、W20Y/P128A/F155R/N199A、W20Y/P128A/K160S/R161T/G198P、W20Y/F155R/K160S、W20Y/F155R/K160S/R161G、W20Y/F155R/R161T、W20Y/F155R/R161T/N199A、W20Y/K160S/R161T/G198H、V121F/L126H/P128A/R161T/P369N、L126H/P128A/F155R/K160S/R161T、L126H/P128A/K160S/G198H/P369N、L126H/P128A/R161G/N199A/P369N、L126H/P128A/R161G/P369N、L126H/P128A/P369N、L126H/K160S/R161G/N199A/P369N、L126H/K160S/G198P/P369N、L126H/A196V/G198P/P369N、L126Q/P128A/F155R/K160S/R161T/N199A、L126Q/P128A/F155R/R161G/N199A、L126Q/P128A/K160S/R161T/P369N、L126Q/P128A/K160S/N199A/P369N、L126Q/P128A/K160S/P369N、L126Q/G198P/P369N、L126Q/N199A/P369N、L126Q/P369N、P128A/F155R/K160S/R161T、P128A/F155R/K160S/R161T/N199A、P128A/F155R/K160S/G198P、P128A/F155R/N199A、P128A/K160S/R161G/P369N、P128A/R161G/N199A/P369N、P128A/G198H/N199A/P369N、P128A/N199A/P369N、P128A/P369N、F155R/R161G/G198H/N199A、F155R/N199A、K160S/R161G/P369N、K160S/R161T/P369N、R161T/G198P/P369N、R161T/P369N和N199A/P369N,其中所述位置参照SEQ ID NO:3082来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:3182、3184、3186、3188、3190、3192、3194、3196、3198、3200、3202、3204、3206、3208、3210、3212、3214、3216、3218、3220、3222、3224、3226、3228、3230、3232、3234、3236、3238、3240、3242、3244、3246、3248、3250、3252、3254、3256、3258、3260、3262、3264、3266、3268、3270、3272、3274、3276、3278、3280、3282、3284、3286、3288、3290、3292、3294、3296、3298、3300、3302、3304、3306、3308、3310、3312、3314、3316、3318、3320、3322、3324、3326、3328、3330、3332、3334、3336、3338、3340、3342、3344、3346、3348、3350、3352、3354、3356、3358、3360、3362、3364、3366、3368、3370、3372、3374、3376、3378、3380、3382、3384、3386、3388、3390、3392、3394、3396、3398、3400、3402、3404、3406、3408、3410、3412、3414、3416、3418、3420、3422、3424、3426、3428、3430、3432、3434、3436、3438、3440、3442、3444、3446、3448、3450、3452、3454、3456、3458、3460、3462、3464、3466、3468、3470、3472、3474、3476、3478、3480、3482、3484、3486、3488和3490。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:3182、3184、3186、3188、3190、3192、3194、3196、3198、3200、3202、3204、3206、3208、3210、3212、3214、3216、3218、3220、3222、3224、3226、3228、3230、3232、3234、3236、3238、3240、3242、3244、3246、3248、3250、3252、3254、3256、3258、3260、3262、3264、3266、3268、3270、3272、3274、3276、3278、3280、3282、3284、3286、3288、3290、3292、3294、3296、3298、3300、3302、3304、3306、3308、3310、3312、3314、3316、3318、3320、3322、3324、3326、3328、3330、3332、3334、3336、3338、3340、3342、3344、3346、3348、3350、3352、3354、3356、3358、3360、3362、3364、3366、3368、3370、3372、3374、3376、3378、3380、3382、3384、3386、3388、3390、3392、3394、3396、3398、3400、3402、3404、3406、3408、3410、3412、3414、3416、3418、3420、3422、3424、3426、3428、3430、3432、3434、3436、3438、3440、3442、3444、3446、3448、3450、3452、3454、3456、3458、3460、3462、3464、3466、3468、3470、3472、3474、3476、3478、3480、3482、3484、3486、3488和3490。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:3182、3184、3186、3188、3190、3192、3194、3196、3198、3200、3202、3204、3206、3208、3210、3212、3214、3216、3218、3220、3222、3224、3226、3228、3230、3232、3234、3236、3238、3240、3242、3244、3246、3248、3250、3252、3254、3256、3258、3260、3262、3264、3266、3268、3270、3272、3274、3276、3278、3280、3282、3284、3286、3288、3290、3292、3294、3296、3298、3300、3302、3304、3306、3308、3310、3312、3314、3316、3318、3320、3322、3324、3326、3328、3330、3332、3334、3336、3338、3340、3342、3344、3346、3348、3350、3352、3354、3356、3358、3360、3362、3364、3366、3368、3370、3372、3374、3376、3378、3380、3382、3384、3386、3388、3390、3392、3394、3396、3398、3400、3402、3404、3406、3408、3410、3412、3414、3416、3418、3420、3422、3424、3426、3428、3430、3432、3434、3436、3438、3440、3442、3444、3446、3448、3450、3452、3454、3456、3458、3460、3462、3464、3466、3468、3470、3472、3474、3476、3478、3480、3482、3484、3486、3488和3490。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:106/164/172/200/409、106/164/172/210/240/415、106/164/172/242/409/416、106/164/200/210/242、106/164/200/210/415、106/164/200/240/408/409/416、106/164/210/240/408/409/416、106/164/210/408/409、106/164/240/415、106/164/409/415/423、106/172/200/210/240/242/408/415/416/423、106/172/200/210/242、106/172/240、106/172/240/242/409/415、106/172/242、106/172/242/416/423、106/172/408/409、106/172/409/423、106/200/210/409、106/210/240、106/210/240/408/415、106/240/242、106/240/242/409、106/242/408/409、164/172/200/210/242/409、164/172/240/242/415、164/172/242/408、164/200/408/415/416、164/240/242/408、164/240/242/415/423、164/423、172/200/210/240/408、172/200/240、172/200/408/416、172/210/415、172/240、172/240/242/415、172/240/409、200/210/240/242/409、200/240/242/407、200/242/415/416/423、200/408/409、210/240、240、240/242、240/242/408/416、240/242/415/423、240/408、240/415和409/415,其中所述位置参照SEQ ID NO:3244来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:106A/164H/172R/200A/409L、106A/164H/172R/210V/240E/415R、106A/164H/172R/242I/409L/416R、106A/164H/200A/210V/242I、106A/164H/200A/210V/415A、106A/164H/200A/240E/408P/409L/416R、106A/164H/210V/240E/408P/409L/416R、106A/164H/210V/408P/409L、106A/164H/240E/415A、106A/164H/409L/415A/423R、106A/172R/200A/210V/240E/242I/408P/415A/416R/423R、106A/172R/200A/210V/242I、106A/172R/240E、106A/172R/240E/242I/409L/415R、106A/172R/242I、106A/172R/242I/416R/423R、106A/172R/408P/409L、106A/172R/409L/423R、106A/200A/210V/409L、106A/210V/240E、106A/210V/240E/408P/415R、106A/240E/242I、106A/240E/242I/409L、106A/242I/408P/409L、164H/172R/200A/210V/242I/409L、164H/172R/240E/242I/415R、164H/172R/242I/408P、164H/200A/408P/415A/416R、164H/240E/242I/408P、164H/240E/242I/415R/423R、164H/423R、172R/200A/210V/240E/408P、172R/200A/240E、172R/200A/408P/416R、172R/210V/415A、172R/240E、172R/240E/242I/415R、172R/240E/409L、200A/210V/240E/242I/409L、200A/240E/242I/407S、200A/242I/415A/416R/423R、200A/408P/409L、210V/240E、240E、240E/242I、240E/242I/408P/416R、240E/242I/415A/423R、240E/408P、240E/415R和409L/415R,其中所述位置参照SEQ ID NO:3244来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:K106A/V164H/N172R/G200A/T409L、K106A/V164H/N172R/E210V/N240E/G415R、K106A/V164H/N172R/A242I/T409L/K416R、K106A/V164H/G200A/E210V/A242I、K106A/V164H/G200A/E210V/G415A、K106A/V164H/G200A/N240E/E408P/T409L/K416R、K106A/V164H/E210V/N240E/E408P/T409L/K416R、K106A/V164H/E210V/E408P/T409L、K106A/V164H/N240E/G415A、K106A/V164H/T409L/G415A/N423R、K106A/N172R/G200A/E210V/N240E/A242I/E408P/G415A/K416R/N423R、K106A/N172R/G200A/E210V/A242I、K106A/N172R/N240E、K106A/N172R/N240E/A242I/T409L/G415R、K106A/N172R/A242I、K106A/N172R/A242I/K416R/N423R、K106A/N172R/E408P/T409L、K106A/N172R/T409L/N423R、K106A/G200A/E210V/T409L、K106A/E210V/N240E、K106A/E210V/N240E/E408P/G415R、K106A/N240E/A242I、K106A/N240E/A242I/T409L、K106A/A242I/E408P/T409L、V164H/N172R/G200A/E210V/A242I/T409L、V164H/N172R/N240E/A242I/G415R、V164H/N172R/A242I/E408P、V164H/G200A/E408P/G415A/K416R、V164H/N240E/A242I/E408P、V164H/N240E/A242I/G415R/N423R、V164H/N423R、N172R/G200A/E210V/N240E/E408P、N172R/G200A/N240E、N172R/G200A/E408P/K416R、N172R/E210V/G415A、N172R/N240E、N172R/N240E/A242I/G415R、N172R/N240E/T409L、G200A/E210V/N240E/A242I/T409L、G200A/N240E/A242I/G407S、G200A/A242I/G415A/K416R/N423R、G200A/E408P/T409L、E210V/N240E、N240E、N240E/A242I、N240E/A242I/E408P/K416R、N240E/A242I/G415A/N423R、N240E/E408P、N240E/G415R和T409L/G415R,其中所述位置参照SEQ ID NO:3244来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14、35、42、46、49、105、134、143、179、181、232、278、290、336、373、381、401和441,其中所述位置参照SEQ ID NO:3244来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14K、35D、42F、42I、42V、46T、46V、49A、49M、49P、49Q、49S、105A、134A、134C、134S、143P、179A、179D、179T、181L、232T、278I、278L、290L、336A、373R、381G、401V、441I和441R,其中所述位置参照SEQ ID NO:3244来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:R14K、Q35D、L42F、L42I、L42V、C46T、C46V、L49A、L49M、L49P、L49Q、L49S、S105A、V134A、V134C、V134S、K143P、V179A、V179D、V179T、M181L、P232T、V278I、V278L、I290L、S336A、K373R、A381G、L401V、Q441I和Q441R,其中所述位置参照SEQ IDNO:3244来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:3492、3494、3496、3498、3500、3502、3504、3506、3508、3510、3512、3514、3516、3518、3520、3522、3524、3526、3528、3530、3532、3534、3536、3538、3540、3542、3544、3546、3548、3550、3552、3554、3556、3558、3560、3562、3564、3566、3568、3570、3572、3574、3576、3578、3580、3582、3584、3586、3588、3590、3592、3594、3596、3598、3600、3602、3604、3606、3608、3610、3612、3614、3616、3618、3620、3622、3624、3626、3628、3630、3632、3634、3636、3638、3640、3642、3644、3646、3648、3650和3652。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:3492、3494、3496、3498、3500、3502、3504、3506、3508、3510、3512、3514、3516、3518、3520、3522、3524、3526、3528、3530、3532、3534、3536、3538、3540、3542、3544、3546、3548、3550、3552、3554、3556、3558、3560、3562、3564、3566、3568、3570、3572、3574、3576、3578、3580、3582、3584、3586、3588、3590、3592、3594、3596、3598、3600、3602、3604、3606、3608、3610、3612、3614、3616、3618、3620、3622、3624、3626、3628、3630、3632、3634、3636、3638、3640、3642、3644、3646、3648、3650和3652。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:3492、3494、3496、3498、3500、3502、3504、3506、3508、3510、3512、3514、3516、3518、3520、3522、3524、3526、3528、3530、3532、3534、3536、3538、3540、3542、3544、3546、3548、3550、3552、3554、3556、3558、3560、3562、3564、3566、3568、3570、3572、3574、3576、3578、3580、3582、3584、3586、3588、3590、3592、3594、3596、3598、3600、3602、3604、3606、3608、3610、3612、3614、3616、3618、3620、3622、3624、3626、3628、3630、3632、3634、3636、3638、3640、3642、3644、3646、3648、3650和3652。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21、91、125、127、130/187、143、143/150、145、152、156、186、187、195、197、200、201、202、264、268、364、365和415,其中所述位置参照SEQ ID NO:3346来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21M、21P、91M、125C、125M、125V、127G、130T/187Q、143H、143P/150S、145W、152L、156P、156Q、186N、186V、187S、195F、195G、195R、195S、195T、195Y、197D、197L、197Q、197W、200E、200P、200R、200T、201A、201R、201S、201W、202A、202W、264S、264T、268F、268Q、268W、364S、364W、365L和415D,其中所述位置参照SEQID NO:3346来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:L21M、L21P、P91M、F125C、F125M、F125V、Q127G、A130T/K187Q、K143H、K143P/A150S、L145W、F152L、F156P、F156Q、E186N、E186V、K187S、L195F、L195G、L195R、L195S、L195T、L195Y、P197D、P197L、P197Q、P197W、G200E、G200P、G200R、G200T、G201A、G201R、G201S、G201W、I202A、I202W、F264S、F264T、Y268F、Y268Q、Y268W、M364S、M364W、Q365L和G415D,其中所述位置参照SEQ ID NO:3346来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:3760、3762、3764、3766、3768、3770、3772、3774、3776、3778、3780、3782、3784、3786、3788、3790、3792、3794、3796、3798、3800、3802、3804、3806、3808、3810、3812、3814、3816、3818、3820、3822、3824、3826、3828、3830、3832、3834、3836、3838、3840、3842、3844、3846、3848和3850。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:3760、3762、3764、3766、3768、3770、3772、3774、3776、3778、3780、3782、3784、3786、3788、3790、3792、3794、3796、3798、3800、3802、3804、3806、3808、3810、3812、3814、3816、3818、3820、3822、3824、3826、3828、3830、3832、3834、3836、3838、3840、3842、3844、3846、3848和3850。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:3760、3762、3764、3766、3768、3770、3772、3774、3776、3778、3780、3782、3784、3786、3788、3790、3792、3794、3796、3798、3800、3802、3804、3806、3808、3810、3812、3814、3816、3818、3820、3822、3824、3826、3828、3830、3832、3834、3836、3838、3840、3842、3844、3846、3848和3850。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/5/113/186/237/406、2/73/186/237、2/189/286、2/286/355/416/422、5/34/73/113/406、5/73/186/406、5/113/237/406、5/186/237/245/256/406、5/186/237/406、5/256/406、34/113/186/237/406、72/73/172/235/240/242/438、72/172/239/240/242/408、72/172/240/242、73/172、73/172/235/239/240、73/172/235/239/242、73/172/239/240、73/172/239/240/242、73/172/240/242/408、73/172/240/408、73/186/237/406、73/235/240/323、73/235/240/408、73/237、73/239/242、113/186/406、172、172/188/323、172/235、172/235/239/240/242、172/235/239/408、172/235/240、172/235/240/242/438、172/239/240/242/323/408、172/240、172/240/299/323、186、186/237、186/237/286、186/406、189/333/355/421、235/239/240、235/240/242、237、239/240、239/240/242/256/323、239/240/242/323/408、239/240/408、239/242/408、240/242/256/438和242/408,其中所述位置参照SEQ ID NO:3502来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2-/5N/113I/186G/237V/406Q、2-/73A/186G/237V、2S/189S/286Q、2S/286Q/355A/416R/422R、5N/34R/73A/113I/406N、5N/73A/186G/406N、5N/113I/237V/406N、5N/186G/237V/245T/256I/406Q、5N/186G/237V/406Q、5N/256L/406Q、34R/113I/186G/237L/406N、72Y/73P/172R/235M/240E/242I/438T、72Y/172R/239A/240E/242I/408P、72Y/172R/240E/242I、73A/186G/237L/406Q、73A/237V、73P/172R、73P/172R/235M/239A/240E、73P/172R/235M/239A/242I、73P/172R/239A/240E、73P/172R/239A/240E/242I、73P/172R/240E/242I/408P、73P/172R/240E/408P、73P/235M/240E/323P、73P/235M/240E/408P、73P/239A/242I、113I/186G/406Q、172R、172R/188G/323P、172R/235M、172R/235M/239A/240E/242I、172R/235M/239A/408P、172R/235M/240E、172R/235M/240E/242I/438T、172R/239A/240E/242I/323P/408P、172R/240E、172R/240E/299A/323P、186G、186G/237L、186G/237V/286S、186G/406N、186G/406Q、189S/333H/355A/421Q、235M/239A/240E、235M/240E/242I、237L、239A/240E、239A/240E/242I/256S/323P、239A/240E/242I/323P/408P、239A/240E/408P、239A/242I/408P、240E/242I/256S/438T和242I/408P,其中所述位置参照SEQ ID NO:3502来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H2-/H5N/L113I/E186G/P237V/T406Q、H2-/H73A/E186G/P237V、H2S/P189S/N286Q、H2S/N286Q/F355A/K416R/K422R、H5N/K34R/H73A/L113I/T406N、H5N/H73A/E186G/T406N、H5N/L113I/P237V/T406N、H5N/E186G/P237V/K245T/E256I/T406Q、H5N/E186G/P237V/T406Q、H5N/E256L/T406Q、K34R/L113I/E186G/P237L/T406N、L72Y/H73P/N172R/Q235M/N240E/A242I/E438T、L72Y/N172R/T239A/N240E/A242I/E408P、L72Y/N172R/N240E/A242I、H73A/E186G/P237L/T406Q、H73A/P237V、H73P/N172R、H73P/N172R/Q235M/T239A/N240E、H73P/N172R/Q235M/T239A/A242I、H73P/N172R/T239A/N240E、H73P/N172R/T239A/N240E/A242I、H73P/N172R/N240E/A242I/E408P、H73P/N172R/N240E/E408P、H73P/Q235M/N240E/D323P、H73P/Q235M/N240E/E408P、H73P/T239A/A242I、L113I/E186G/T406Q、N172R、N172R/E188G/D323P、N172R/Q235M、N172R/Q235M/T239A/N240E/A242I、N172R/Q235M/T239A/E408P、N172R/Q235M/N240E、N172R/Q235M/N240E/A242I/E438T、N172R/T239A/N240E/A242I/D323P/E408P、N172R/N240E、N172R/N240E/E299A/D323P、E186G、E186G/P237L、E186G/P237V/N286S、E186G/T406N、E186G/T406Q、P189S/N333H/F355A/S421Q、Q235M/T239A/N240E、Q235M/N240E/A242I、P237L、T239A/N240E、T239A/N240E/A242I/E256S/D323P、T239A/N240E/A242I/D323P/E408P、T239A/N240E/E408P、T239A/A242I/E408P、N240E/A242I/E256S/E438T和A242I/E408P,其中所述位置参照SEQ ID NO:3502来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:96、127、132、144、153、155、156、186、187、196、199和200,其中所述位置参照SEQ ID NO:3502来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:96A、96P、127I、127L、127V、132H、132K、132T、144V、153A、153G、155M、156W、186A、186G、186R、187A、187R、187T、196S、199A、199S、199Y和200S,其中所述位置参照SEQ ID NO:3502来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:G96A、G96P、Q127I、Q127L、Q127V、Q132H、Q132K、Q132T、I144V、S153A、S153G、F155M、F156W、E186A、E186G、E186R、K187A、K187R、K187T、A196S、N199A、N199S、N199Y和A200S,其中所述位置参照SEQ ID NO:3502来编号。
在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:3654、3656、3658、3660、3662、3664、3666、3668、3670、3672、3674、3676、3678、3680、3682、3684、3686、3688、3690、3692、3694、3696、3698、3700、3702、3704、3706、3708、3710、3712、3714、3716、3718、3720、3722、3724、3726、3728、3730、3732、3734、3736、3738、3740、3742、3744、3746、3748、3750、3752、3754、3756、3758、3852、3854、3856、3858、3860、3862、3864、3866、3868、3870、3872、3874、3876、3878、3880、3882、3884、3886、3888、3890、3892、3894、3896和3898。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:3654、3656、3658、3660、3662、3664、3666、3668、3670、3672、3674、3676、3678、3680、3682、3684、3686、3688、3690、3692、3694、3696、3698、3700、3702、3704、3706、3708、3710、3712、3714、3716、3718、3720、3722、3724、3726、3728、3730、3732、3734、3736、3738、3740、3742、3744、3746、3748、3750、3752、3754、3756、3758、3852、3854、3856、3858、3860、3862、3864、3866、3868、3870、3872、3874、3876、3878、3880、3882、3884、3886、3888、3890、3892、3894、3896和3898。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ IDNO:3654、3656、3658、3660、3662、3664、3666、3668、3670、3672、3674、3676、3678、3680、3682、3684、3686、3688、3690、3692、3694、3696、3698、3700、3702、3704、3706、3708、3710、3712、3714、3716、3718、3720、3722、3724、3726、3728、3730、3732、3734、3736、3738、3740、3742、3744、3746、3748、3750、3752、3754、3756、3758、3852、3854、3856、3858、3860、3862、3864、3866、3868、3870、3872、3874、3876、3878、3880、3882、3884、3886、3888、3890、3892、3894、3896和3898。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/5/35/105/143/237/373/416/422、2/5/35/143/232/237/416/422/441、2/5/35/232/278/373/416、2/5/105/143/232/373/416/422、2/5/278、2/105/143/232/237/278/373/441、2/143/232/373/441、2/143/373/441、5/35/232/373/416/422、5/105/232/237/373/416/441、5/105/237/278/422/441、5/105/237/416/422/441、5/143/189/232/237/441、5/143/232/237/278、5/143/232/237/416/422、5/143/232/373/422/441、5/143/237/278/373/416/422、5/143/373、5/189/237/278/373/416/422/441、5/232/416/422、5/237/373/422、5/373/416、26/42、26/42/46/49、26/42/46/49/134、26/42/46/49/134/186、26/42/46/134、26/42/49/134、26/42/49/134/186/355、26/42/49/134/401、26/42/134/401、26/49/134、26/134、26/134/186/355/401、26/134/355、26/134/401、26/355/401、35、35/105/189/232/373/416、42/46/49/97/134/401、42/46/49/134、42/46/49/134/186、42/46/49/134/186/355、42/46/49/134/235/355/401、42/46/49/134/401、42/46/49/186、42/49/134/186/355、42/49/134/186/401、42/49/134/355/401、42/134/186、42/186/355、46/49/134、49/134/355、105/143/232/237/373/416/422/441、105/143/278/373、105/189/237、105/237/278/373/416/422、105/237/373/422/441、105/373、105/373/441、134/401、143、143/189、143/189/232/422/441、143/189/237/373/416/422、143/232、143/237、143/237/422/441、186/355、189/232/373/416/422/441、189/237/278/416/441、232/237、237/373、237/373/441和237/422,其中所述位置参照SEQ ID NO:3696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2-/5N/35D/105A/143P/237V/373R/416R/422R、2-/5N/35D/143P/232T/237L/416R/422R/441R、2-/5N/35D/232T/278L/373R/416R、2-/5N/105A/143P/232T/373R/416R/422R、2-/5N/278L、2-/105A/143P/232T/237L/278L/373R/441R、2-/143P/232T/373R/441R、2-/143P/373R/441R、5N/35D/232T/373R/416R/422R、5N/105A/232T/237L/373R/416R/441R、5N/105A/237L/278I/422R/441R、5N/105A/237V/416R/422R/441R、5N/143P/189S/232T/237V/441R、5N/143P/232T/237L/278L、5N/143P/232T/237L/416R/422R、5N/143P/232T/373R/422R/441R、5N/143P/237L/278L/373R/416R/422R、5N/143P/373R、5N/189S/237V/278I/373R/416R/422R/441R、5N/232T/416R/422R、5N/237L/373R/422R、5N/373R/416R、26V/42I/49Q/134C/186G/355A、26V/42I/49Q/134C/401V、26V/42V、26V/42V/46V/49A、26V/42V/46V/49A/134A、26V/42V/46V/49A/134C/186G、26V/42V/46V/134A、26V/42V/49S/134C、26V/42V/134C/401V、26V/49Q/134A、26V/134A、26V/134A/186G/355A/401V、26V/134C/355A、26V/134T/401V、26V/355A/401V、35D、35D/105A/189S/232T/373R/416R、42I/46V/49A/134A、42I/46V/49S/134C/186G、42I/46V/49S/186G、42V/46V/49A/134A/401V、42V/46V/49A/134T/186G/355A、42V/46V/49P/134C/235R/355A/401V、42V/46V/49S/97P/134C/401V、42V/49A/134C/186G/355A、42V/49S/134A/186G/401V、42V/49S/134C/355A/401V、42V/134C/186G、42V/186G/355A、46V/49Q/134T、49S/134C/355A、105A/143P/232T/237V/373R/416R/422R/441R、105A/143P/278L/373R、105A/189S/237V、105A/237L/278L/373R/416R/422R、105A/237L/373R/422R/441R、105A/373R、105A/373R/441R、134C/401V、143P、143P/189S、143P/189S/232T/422R/441R、143P/189S/237L/373R/416R/422R、143P/232T、143P/237L/422R/441R、143P/237V、186G/355A、189S/232T/373R/416R/422R/441R、189S/237L/278I/416R/441R、232T/237L、237L/422R、237V/373R和237V/373R/441R,其中所述位置参照SEQ ID NO:3696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H2-/H5N/Q35D/S105A/K143P/P237V/K373R/K416R/K422R、H2-/H5N/Q35D/K143P/P232T/P237L/K416R/K422R/Q441R、H2-/H5N/Q35D/P232T/V278L/K373R/K416R、H2-/H5N/S105A/K143P/P232T/K373R/K416R/K422R、H2-/H5N/V278L、H2-/S105A/K143P/P232T/P237L/V278L/K373R/Q441R、H2-/K143P/P232T/K373R/Q441R、H2-/K143P/K373R/Q441R、H5N/Q35D/P232T/K373R/K416R/K422R、H5N/S105A/P232T/P237L/K373R/K416R/Q441R、H5N/S105A/P237L/V278I/K422R/Q441R、H5N/S105A/P237V/K416R/K422R/Q441R、H5N/K143P/P189S/P232T/P237V/Q441R、H5N/K143P/P232T/P237L/V278L、H5N/K143P/P232T/P237L/K416R/K422R、H5N/K143P/P232T/K373R/K422R/Q441R、H5N/K143P/P237L/V278L/K373R/K416R/K422R、H5N/K143P/K373R、H5N/P189S/P237V/V278I/K373R/K416R/K422R/Q441R、H5N/P232T/K416R/K422R、H5N/P237L/K373R/K422R、H5N/K373R/K416R、I26V/L42I/L49Q/V134C/E186G/F355A、I26V/L42I/L49Q/V134C/L401V、I26V/L42V、I26V/L42V/C46V/L49A、I26V/L42V/C46V/L49A/V134A、I26V/L42V/C46V/L49A/V134C/E186G、I26V/L42V/C46V/V134A、I26V/L42V/L49S/V134C、I26V/L42V/V134C/L401V、I26V/L49Q/V134A、I26V/V134A、I26V/V134A/E186G/F355A/L401V、I26V/V134C/F355A、I26V/V134T/L401V、I26V/F355A/L401V、Q35D、Q35D/S105A/P189S/P232T/K373R/K416R、L42I/C46V/L49A/V134A、L42I/C46V/L49S/V134C/E186G、L42I/C46V/L49S/E186G、L42V/C46V/L49A/V134A/L401V、L42V/C46V/L49A/V134T/E186G/F355A、L42V/C46V/L49P/V134C/Q235R/F355A/L401V、L42V/C46V/L49S/T97P/V134C/L401V、L42V/L49A/V134C/E186G/F355A、L42V/L49S/V134A/E186G/L401V、L42V/L49S/V134C/F355A/L401V、L42V/V134C/E186G、L42V/E186G/F355A、C46V/L49Q/V134T、L49S/V134C/F355A、S105A/K143P/P232T/P237V/K373R/K416R/K422R/Q441R、S105A/K143P/V278L/K373R、S105A/P189S/P237V、S105A/P237L/V278L/K373R/K416R/K422R、S105A/P237L/K373R/K422R/Q441R、S105A/K373R、S105A/K373R/Q441R、V134C/L401V、K143P、K143P/P189S、K143P/P189S/P232T/K422R/Q441R、K143P/P189S/P237L/K373R/K416R/K422R、K143P/P232T、K143P/P237L/K422R/Q441R、K143P/P237V、E186G/F355A、P189S/P232T/K373R/K416R/K422R/Q441R、P189S/P237L/V278I/K416R/Q441R、P232T/P237L、P237L/K422R、P237V/K373R和P237V/K373R/Q441R,其中所述位置参照SEQ ID NO:3696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:3、8、50、61、62、101、137、158、161、164、176、193、223、223/243、235、237、239、240、243、244、248、249、301、323、330、352、364、426和427,其中所述位置参照SEQ ID NO:3696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:3N、8R、8V、50P、50V、61N、61Y、62A、101L、137R、158W、161L、164A、164E、164F、164L、176P、176Q、176T、193F、223A、223L/243G、235R、237A、237L、239F、239G、239M、239P、239Q、239Y、240V、243G、243H、243R、243S、243Y、244N、248T、249G、249H、301A、323T、330C、352A、364Q、426L、427S和427T,其中所述位置参照SEQ ID NO:3696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H3N、S8R、S8V、I50P、I50V、E61N、E61Y、K62A、A101L、Q137R、F158W、R161L、H164A、H164E、H164F、H164L、R176P、R176Q、R176T、D193F、T223A、T223L/D243G、Q235R、P237A、P237L、T239F、T239G、T239M、T239P、T239Q、T239Y、E240V、D243G、D243H、D243R、D243S、D243Y、D244N、I248T、D249G、D249H、Q301A、D323T、H330C、S352A、M364Q、A426L、R427S和R427T,其中所述位置参照SEQ ID NO:3696来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:3900、3902、3904、3906、3908、3910、3912、3914、3916、3918、3920、3922、3924、3926、3928、3930、3932、3934、3936、3938、3940、3942、3944、3946、3948、3950、3952、3954、3956、3958、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020、4022、4024、4026、4028、4030、4032、4034、4036、4038、4040、4042、4044、4046、4048、4050、4052、4054、4056、4058、4060、4062、4064、4066、4068、4070、4072、4074、4076、4078、4080、4082、4084、4086、4088、4090、4092、4094、4096、4098、4100、4102、4104、4106、4108、4110、4112、4114、4116、4118、4120、4122、4124、4126、4128、4130、4132、4134、4136、4138、4140、4142、4144和4146。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:3900、3902、3904、3906、3908、3910、3912、3914、3916、3918、3920、3922、3924、3926、3928、3930、3932、3934、3936、3938、3940、3942、3944、3946、3948、3950、3952、3954、3956、3958、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020、4022、4024、4026、4028、4030、4032、4034、4036、4038、4040、4042、4044、4046、4048、4050、4052、4054、4056、4058、4060、4062、4064、4066、4068、4070、4072、4074、4076、4078、4080、4082、4084、4086、4088、4090、4092、4094、4096、4098、4100、4102、4104、4106、4108、4110、4112、4114、4116、4118、4120、4122、4124、4126、4128、4130、4132、4134、4136、4138、4140、4142、4144和4146。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:3900、3902、3904、3906、3908、3910、3912、3914、3916、3918、3920、3922、3924、3926、3928、3930、3932、3934、3936、3938、3940、3942、3944、3946、3948、3950、3952、3954、3956、3958、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020、4022、4024、4026、4028、4030、4032、4034、4036、4038、4040、4042、4044、4046、4048、4050、4052、4054、4056、4058、4060、4062、4064、4066、4068、4070、4072、4074、4076、4078、4080、4082、4084、4086、4088、4090、4092、4094、4096、4098、4100、4102、4104、4106、4108、4110、4112、4114、4116、4118、4120、4122、4124、4126、4128、4130、4132、4134、4136、4138、4140、4142、4144和4146。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5/73/113/186/187/373/423、5/73/143/144/179/186/187/422、5/73/144/179/186/373/423、5/73/144/187/373/422、5/143/144/179/181/186/187/373、5/144/179/181/373/422、5/144/373/422、49/96/127/132/156/196、49/96/127/153/278、49/96/132/153/155/156/237/278/406、49/96/132/153/199/200、49/96/132/155、49/96/132/155/237/278、49/96/155/199/200/406、49/153/155、73/113/143/179/181/422、73/113/179/181/186/187、73/143/144/179/186/187/373/423、73/179/181/186/187/373、73/179/181/186/373/422、73/181/186/187、96/127/132/153/278、96/127/153/155、96/132/153/155、96/132/153/155/156、96/132/153/155/156/200、96/132/153/156、96/132/196/199、96/132/278、96/153/155/156、96/153/155/199/200/237、96/153/406、113/143/179/186/187、113/144/186/423、113/144/373、113/181/186/373/422、113/373/422、127/132、127/132/153/156、127/132/155/156/406、127/153/155/199/200/237、127/406、132/153/155、132/153/237/406、132/155、132/237、143/144/179/181/186/187/422、143/179/181/186/187/422/423、144/179/181/186/187/373、144/179/186/187/373、153/155/156/237、153/155/196/199/237、153/199/406、153/237、155/199、179/181/186、179/181/186/187/423、179/186/187、179/187/373/422、181/186/187/422/423和373/423,其中所述位置参照SEQ ID NO:3956来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5N/73A/113I/186G/187R/373R/423R、5N/73A/143P/144V/179D/186G/187R/422R、5N/73A/144V/179D/186A/373R/423R、5N/73A/144V/187R/373R/422R、5N/143P/144V/179T/181L/186G/187R/373R、5N/144V/179T/181L/373R/422R、5N/144V/373R/422R、49S/96A/127I/132K/156W/196S、49S/96A/132H/153A/199S/200S、49S/96P/127I/153A/278L、49S/96P/132H/153A/155M/156W/237L/278L/406Q、49S/96P/132H/155M、49S/96P/132K/155M/237L/278L、49S/96P/155M/199S/200S/406Q、49S/153A/155M、73A/113I/143P/179T/181L/422R、73A/113I/179T/181L/186A/187R、73A/143P/144V/179D/186G/187T/373R/423R、73A/179D/181L/186A/373R/422R、73A/179D/181L/186G/187R/373R、73A/181L/186A/187T、96A/132H/153A/156W、96A/132K/153A/155M/156W、96A/132K/153A/155M/156W/200S、96A/153A/155M/156W、96P/127I/132H/153A/278L、96P/127I/153A/155M、96P/132H/153A/155M/156W、96P/132H/196S/199S、96P/132K/153A/155M、96P/132K/278L、96P/153A/155M/199S/200S/237L、96P/153A/406Q、113I/143P/179D/186G/187R、113I/144V/186G/423R、113I/144V/373R、113I/181L/186A/373R/422R、113I/373R/422R、127I/132H、127I/132H/153A/156W、127I/132H/155M/156W/406Q、127I/153A/155M/199S/200S/237L、127I/406Q、132H/153A/237L/406Q、132H/155M、132K/153A/155M、132K/237L、143P/144V/179T/181L/186G/187R/422R、143P/179T/181L/186G/187R/422R/423R、144V/179T/181L/186A/187R/373R、144V/179T/186A/187T/373R、153A/155M/156W/237L、153A/155M/196S/199S/237L、153A/199S/406Q、153A/237L、155M/199S、179D/181L/186G/187R/423R、179D/187T/373R/422R、179T/181L/186A、179T/186A/187T、181L/186G/187R/422R/423R和373R/423R,其中所述位置参照SEQID NO:3956来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H5N/P73A/L113I/E186G/K187R/K373R/N423R、H5N/P73A/K143P/I144V/V179D/E186G/K187R/K422R、H5N/P73A/I144V/V179D/E186A/K373R/N423R、H5N/P73A/I144V/K187R/K373R/K422R、H5N/K143P/I144V/V179T/M181L/E186G/K187R/K373R、H5N/I144V/V179T/M181L/K373R/K422R、H5N/I144V/K373R/K422R、A49S/G96A/Q127I/Q132K/F156W/A196S、A49S/G96A/Q132H/S153A/N199S/A200S、A49S/G96P/Q127I/S153A/V278L、A49S/G96P/Q132H/S153A/F155M/F156W/P237L/V278L/T406Q、A49S/G96P/Q132H/F155M、A49S/G96P/Q132K/F155M/P237L/V278L、A49S/G96P/F155M/N199S/A200S/T406Q、A49S/S153A/F155M、P73A/L113I/K143P/V179T/M181L/K422R、P73A/L113I/V179T/M181L/E186A/K187R、P73A/K143P/I144V/V179D/E186G/K187T/K373R/N423R、P73A/V179D/M181L/E186A/K373R/K422R、P73A/V179D/M181L/E186G/K187R/K373R、P73A/M181L/E186A/K187T、G96A/Q132H/S153A/F156W、G96A/Q132K/S153A/F155M/F156W、G96A/Q132K/S153A/F155M/F156W/A200S、G96A/S153A/F155M/F156W、G96P/Q127I/Q132H/S153A/V278L、G96P/Q127I/S153A/F155M、G96P/Q132H/S153A/F155M/F156W、G96P/Q132H/A196S/N199S、G96P/Q132K/S153A/F155M、G96P/Q132K/V278L、G96P/S153A/F155M/N199S/A200S/P237L、G96P/S153A/T406Q、L113I/K143P/V179D/E186G/K187R、L113I/I144V/E186G/N423R、L113I/I144V/K373R、L113I/M181L/E186A/K373R/K422R、L113I/K373R/K422R、Q127I/Q132H、Q127I/Q132H/S153A/F156W、Q127I/Q132H/F155M/F156W/T406Q、Q127I/S153A/F155M/N199S/A200S/P237L、Q127I/T406Q、Q132H/S153A/P237L/T406Q、Q132H/F155M、Q132K/S153A/F155M、Q132K/P237L、K143P/I144V/V179T/M181L/E186G/K187R/K422R、K143P/V179T/M181L/E186G/K187R/K422R/N423R、I144V/V179T/M181L/E186A/K187R/K373R、I144V/V179T/E186A/K187T/K373R、S153A/F155M/F156W/P237L、S153A/F155M/A196S/N199S/P237L、S153A/N199S/T406Q、S153A/P237L、F155M/N199S、V179D/M181L/E186G/K187R/N423R、V179D/K187T/K373R/K422R、V179T/M181L/E186A、V179T/E186A/K187T、M181L/E186G/K187R/K422R/N423R和K373R/N423R,其中所述位置参照SEQ ID NO:3956来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11、12、41、44、44/187、45、55、56、57、65、66、70、72、73、74/238、82、83、85、103、111、113、114、117、132、135、138、140、159、160、162、167、182、214、220、222、223、226、236、238、256、286、299、309、387、388、389、391、393、406、408、412、418、422、429、430、449和450,其中所述位置参照SEQ ID NO:3956来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11D、11L、12I、12L、41H、44H、44S/187T、45Y、55A、55G、55L、56R、57G、57H、57P、65C、65G、65P、65Q、65R、66L、70W、72V、73H、73S、74M/238V、82S、83R、85W、103H、103Q、111F、113S、114G、114I、117N、117S、132G、135E、138K、138S、138T、140C、140G、159N、160D、160Q、160T、162L、167L、182I、182L、182Q、182T、182V、182Y、214H、214T、220G、220S、222F、223D、226Q、236L、236T、236V、238A、238G、238I、238R、238S、238T、256R、286G、299V、309P、309R、309S、309T、387P、387Q、387R、388A、388S、389A、389G、389L、389V、391A、391L、391S、391V、393P、393T、406G、406S、408L、408T、412G、412R、418A、418H、418M、422L、429D、430P、449G、449H、449L、449R、449S、450N和450V,其中所述位置参照SEQ ID NO:3956来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q11D、Q11L、T12I、T12L、F41H、Y44H、Y44S/K187T、L45Y、I55A、I55G、I55L、K56R、K57G、K57H、K57P、N65C、N65G、N65P、N65Q、N65R、S66L、V70W、L72V、P73H、P73S、L74M/M238V、P82S、H83R、H85W、K103H、K103Q、K111F、L113S、Q114G、Q114I、K117N、K117S、Q132G、L135E、G138K、G138S、G138T、P140C、P140G、L159N、K160D、K160Q、K160T、P162L、P167L、R182I、R182L、R182Q、R182T、R182V、R182Y、K214H、K214T、T220G、T220S、L222F、T223D、K226Q、D236L、D236T、D236V、M238A、M238G、M238I、M238R、M238S、M238T、E256R、N286G、E299V、K309P、K309R、K309S、K309T、D387P、D387Q、D387R、E388A、E388S、D389A、D389G、D389L、D389V、R391A、R391L、R391S、R391V、H393P、H393T、T406G、T406S、P408L、P408T、I412G、I412R、R418A、R418H、R418M、K422L、E429D、E430P、Y449G、Y449H、Y449L、Y449R、Y449S、K450N和K450V,其中所述位置参照SEQ ID NO:3956来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:4148、4150、4152、4154、4156、4158、4160、4162、4164、4166、4168、4170、4172、4174、4176、4178、4180、4182、4184、4186、4188、4190、4192、4194、4196、4198、4200、4202、4204、4206、4208、4210、4212、4214、4216、4218、4220、4222、4224、4226、4228、4230、4232、4234、4236、4238、4240、4242、4244、4246、4248、4250、4252、4254、4256、4258、4260、4262、4264、4266、4268、4270、4272、4274、4276、4278、4280、4282、4284、4286、4288、4290、4292、4294、4296、4298、4300、4302、4304、4306、4308、4310、4312、4314、4316、4318、4320、4322、4324、4326、4328、4330、4332、4334、4336、4338、4340、4342、4344、4346、4348、4350、4352、4354、4356、4358、4360、4362、4364、4366、4368、4370、4372、4374、4376、4378、4380、4382、4384、4386、4388、4390、4392、4394、4396、4398、4400、4402、4404、4406、4408、4410、4412、4414、4416、4418、4420、4422、4424、4426、4428、4430、4432、4434、4436、4438、4440、4442、4444、4446、4448、4450、4452、4454、4456、4458、4460、4462、4464、4466、4468、4470、4472、4474、4476、4478、4480、4482、4484、4486、4488、4490、4492、4494和4496。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:4148、4150、4152、4154、4156、4158、4160、4162、4164、4166、4168、4170、4172、4174、4176、4178、4180、4182、4184、4186、4188、4190、4192、4194、4196、4198、4200、4202、4204、4206、4208、4210、4212、4214、4216、4218、4220、4222、4224、4226、4228、4230、4232、4234、4236、4238、4240、4242、4244、4246、4248、4250、4252、4254、4256、4258、4260、4262、4264、4266、4268、4270、4272、4274、4276、4278、4280、4282、4284、4286、4288、4290、4292、4294、4296、4298、4300、4302、4304、4306、4308、4310、4312、4314、4316、4318、4320、4322、4324、4326、4328、4330、4332、4334、4336、4338、4340、4342、4344、4346、4348、4350、4352、4354、4356、4358、4360、4362、4364、4366、4368、4370、4372、4374、4376、4378、4380、4382、4384、4386、4388、4390、4392、4394、4396、4398、4400、4402、4404、4406、4408、4410、4412、4414、4416、4418、4420、4422、4424、4426、4428、4430、4432、4434、4436、4438、4440、4442、4444、4446、4448、4450、4452、4454、4456、4458、4460、4462、4464、4466、4468、4470、4472、4474、4476、4478、4480、4482、4484、4486、4488、4490、4492、4494和4496。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:4148、4150、4152、4154、4156、4158、4160、4162、4164、4166、4168、4170、4172、4174、4176、4178、4180、4182、4184、4186、4188、4190、4192、4194、4196、4198、4200、4202、4204、4206、4208、4210、4212、4214、4216、4218、4220、4222、4224、4226、4228、4230、4232、4234、4236、4238、4240、4242、4244、4246、4248、4250、4252、4254、4256、4258、4260、4262、4264、4266、4268、4270、4272、4274、4276、4278、4280、4282、4284、4286、4288、4290、4292、4294、4296、4298、4300、4302、4304、4306、4308、4310、4312、4314、4316、4318、4320、4322、4324、4326、4328、4330、4332、4334、4336、4338、4340、4342、4344、4346、4348、4350、4352、4354、4356、4358、4360、4362、4364、4366、4368、4370、4372、4374、4376、4378、4380、4382、4384、4386、4388、4390、4392、4394、4396、4398、4400、4402、4404、4406、4408、4410、4412、4414、4416、4418、4420、4422、4424、4426、4428、4430、4432、4434、4436、4438、4440、4442、4444、4446、4448、4450、4452、4454、4456、4458、4460、4462、4464、4466、4468、4470、4472、4474、4476、4478、4480、4482、4484、4486、4488、4490、4492、4494和4496。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/375、50/137/189/375、62/153/155/156/159、62/153/155/156/159/427、62/153/155/199/406、137/164/375、153、153/155/156、153/155/156/159/199/238/406、153/155/237/238/239/406、153/155/238/239、153/155/427、153/156/159、153/156/199/237/427、153/156/427、153/159/237/238/352、153/176/181/427、155/156、155/156/176/181/199、155/156/176/238/427、155/181/199/238/406、156/199、156/199/427、164/375/433、223/375、375和427,其中所述位置参照SEQ IDNO:4256来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8V/375L、50V/137R/189G/375L、62A/153A/155M/156W/159V、62A/153A/155M/156W/159V/427T、62A/153A/155M/199S/406Q、137R/164E/375L、153A、153A/155M/156W、153A/155M/156W/159V/199S/238G/406Q、153A/155M/237L/238T/239F/406Q、153A/155M/238T/239F、153A/155M/427T、153A/156W/159V、153A/156W/199S/237L/427T、153A/156W/427T、153A/159V/237L/238G/352A、153A/176Q/181L/427S、155M/156W、155M/156W/176Q/181L/199S、155M/156W/176Q/238T/427S、155M/181L/199S/238G/406Q、156W/199S、156W/199S/427T、164E/375L/433D、223A/375L、375L和427S,其中所述位置参照SEQ ID NO:4256来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:S8V/I375L、I50V/Q137R/P189G/I375L、K62A/S153A/F155M/F156W/L159V、K62A/S153A/F155M/F156W/L159V/R427T、K62A/S153A/F155M/N199S/T406Q、Q137R/H164E/I375L、S153A、S153A/F155M/F156W、S153A/F155M/F156W/L159V/N199S/M238G/T406Q、S153A/F155M/P237L/M238T/T239F/T406Q、S153A/F155M/M238T/T239F、S153A/F155M/R427T、S153A/F156W/L159V、S153A/F156W/N199S/P237L/R427T、S153A/F156W/R427T、S153A/L159V/P237L/M238G/S352A、S153A/R176Q/M181L/R427S、F155M/F156W、F155M/F156W/R176Q/M181L/N199S、F155M/F156W/R176Q/M238T/R427S、F155M/M181L/N199S/M238G/T406Q、F156W/N199S、F156W/N199S/R427T、H164E/I375L/N433D、T223A/I375L、I375L和R427S,其中所述位置参照SEQ ID NO:4256来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7、9、10、12、53、65、68、99、106、110、115、116、131、132、136、170、178、190、192、194、200、220、238、242、245、257、272、280、302、304、335、385、395、399、402、408、412、416、423、445、447和449,其中所述位置参照SEQ ID NO:4256来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7H、9G、10D、12S、53N、65F、68I、99R、106K、106R、106S、110G、115A、115T、116I、131C、131S、132G、132R、132T、136D、136G、136R、136S、170E、178L、190T、192A、192L、192P、194F、200S、220M、220Q、220S、238I、238L、242L、245P、257H、272H、280W、302P、302S、304I、335K、335R、385A、385C、385P、385S、395Q、399K、402R、408E、412R、416R、423L、445H、445K、445R、447L、449K、449L、449Q和449R,其中所述位置参照SEQ ID NO:4256来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:G7H、S9G、G10D、T12S、E53N、N65F、H68I、H99R、A106K、A106R、A106S、S110G、N115A、N115T、L116I、E131C、E131S、Q132G、Q132R、Q132T、E136D、E136G、E136R、E136S、A170E、Q178L、D190T、E192A、E192L、E192P、P194F、A200S、T220M、T220Q、T220S、M238I、M238L、I242L、K245P、N257H、R272H、F280W、N302P、N302S、E304I、P335K、P335R、V385A、V385C、V385P、V385S、G395Q、Q399K、K402R、P408E、I412R、K416R、R423L、N445H、N445K、N445R、N447L、Y449K、Y449L、Y449Q和Y449R,其中所述位置参照SEQ ID NO:4256来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:4498、4500、4502、4504、4506、4508、4510、4512、4514、4516、4518、4520、4522、4524、4526、4528、4530、4532、4534、4536、4538、4540、4542、4544、4546、4548、4550、4552、4554、4556、4558、4560、4562、4564、4566、4568、4570、4572、4574、4576、4578、4580、4582、4584、4586、4588、4590、4592、4594、4596、4598、4600、4602、4604、4606、4608、4610、4612、4614、4616、4618、4620、4622、4624、4626、4628、4630、4632、4634、4636、4638、4640、4642、4644、4646、4648、4650、4652、4654、4656、4658、4660、4662、4664、4666、4668、4670、4672、4674、4676、4678、4680和4682。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:4498、4500、4502、4504、4506、4508、4510、4512、4514、4516、4518、4520、4522、4524、4526、4528、4530、4532、4534、4536、4538、4540、4542、4544、4546、4548、4550、4552、4554、4556、4558、4560、4562、4564、4566、4568、4570、4572、4574、4576、4578、4580、4582、4584、4586、4588、4590、4592、4594、4596、4598、4600、4602、4604、4606、4608、4610、4612、4614、4616、4618、4620、4622、4624、4626、4628、4630、4632、4634、4636、4638、4640、4642、4644、4646、4648、4650、4652、4654、4656、4658、4660、4662、4664、4666、4668、4670、4672、4674、4676、4678、4680和4682。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:4498、4500、4502、4504、4506、4508、4510、4512、4514、4516、4518、4520、4522、4524、4526、4528、4530、4532、4534、4536、4538、4540、4542、4544、4546、4548、4550、4552、4554、4556、4558、4560、4562、4564、4566、4568、4570、4572、4574、4576、4578、4580、4582、4584、4586、4588、4590、4592、4594、4596、4598、4600、4602、4604、4606、4608、4610、4612、4614、4616、4618、4620、4622、4624、4626、4628、4630、4632、4634、4636、4638、4640、4642、4644、4646、4648、4650、4652、4654、4656、4658、4660、4662、4664、4666、4668、4670、4672、4674、4676、4678、4680和4682。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11/41/44/127/132/406、11/41/44/127/278/406、11/41/45/73/127/278/406/408、11/41/45/127/278/406、11/41/132/278、11/44/45/127、11/44/73/127/132/135、11/44/73/127/132/135/406/408、11/44/127、11/44/132/278/406、11/45/73/127/135、11/45/127/132/135/138/182、11/45/406、11/73/127/132/135/182/278、11/73/127/132/278/406/408、11/73/127/132/406/408、11/73/132、11/73/132/135/408、11/127/132/135、11/127/132/135/182、11/127/132/135/406、11/127/132/138/182、11/127/132/182、11/132/135/406、11/182/406、41/44/45/73/127/132/278、41/45/127/132/135/278/406、41/73/132/135/406、44/45/73/132/135/406、44/45/127/132/135/138/182/406/408、44/45/127/132/278、44/73/127/135、44/73/127/135/182/278/406/408、44/73/132/135/406/408、45/73/127/132/135/406/408、45/73/132、45/73/132/135/182、45/73/278/406/408、45/127/132、45/127/132/135/182、45/127/132/135/182/406/408、45/127/135、45/132/408、45/406、56/309/449、57、65/114/422/427、65/114/427、65/143、65/143/235/427、73/127、73/127/132、127、127/132/135/182、127/132/135/182/406、132/135、132/135/182、132/135/406、132/406、164、164/220/309/449、164/220/449、164/449、182、220/449、309、309/449、406、418/427、427、427/429和449,其中所述位置参照SEQ ID NO:4550来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11L/41H/44H/127I/132K/406G、11L/41H/44H/127I/278L/406S、11L/41H/45Y/73H/127I/278L/406G/408A、11L/41H/45Y/127I/278L/406G、11L/41H/132K/278L、11L/44H/45Y/127I、11L/44H/73H/127I/132K/135E、11L/44H/73S/127I/132K/135E/406G/408A、11L/44H/127I、11L/44H/132K/278L/406G、11L/45Y/73H/127I/135E、11L/45Y/127I/132K/135E/138T/182T、11L/45Y/406G、11L/73H/127I/132K/278L/406G/408A、11L/73H/127I/132K/406G/408A、11L/73H/132K、11L/73S/127I/132K/135E/182L/278L、11L/73S/132K/135E/408A、11L/127I/132K/135E、11L/127I/132K/135E/182L、11L/127I/132K/135E/406S、11L/127I/132K/138T/182L、11L/127I/132K/182T、11L/132K/135E/406G、11L/182L/406S、41H/44H/45Y/73H/127I/132K/278L、41H/45Y/127I/132K/135E/278L/406S、41H/73H/132K/135E/406G、44H/45Y/73H/132K/135E/406G、44H/45Y/127I/132K/135E/138T/182L/406S/408A、44H/45Y/127I/132K/278L、44H/73H/127I/135E、44H/73S/127I/135E/182L/278L/406G/408A、44H/73S/132K/135E/406G/408A、45Y/73H/127I/132K/135E/406G/408A、45Y/73H/132K、45Y/73H/132K/135E/182L、45Y/73S/278L/406G/408A、45Y/127I/132K、45Y/127I/132K/135E/182L、45Y/127I/132K/135E/182T/406G/408A、45Y/127I/135E、45Y/132K/408A、45Y/406G、56R/309P/449L、57G、65G/114I/422L/427S、65G/114I/427S、65G/143K、65G/143K/235R/427S、73H/127I、73H/127I/132K、127I、127I/132K/135E/182I/406G、127I/132K/135E/182L、132K/135E、132K/135E/182I、132K/135E/406G、132K/406S、164E、164E/220G/309S/449H、164E/220G/449L、164E/449H、182L、220G/449H、309P/449L、309R、309T/449H、406G、418A/427S、427S、427S/429D和449L,其中所述位置参照SEQ ID NO:4550来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q11L/F41H/Y44H/Q127I/Q132K/T406G、Q11L/F41H/Y44H/Q127I/V278L/T406S、Q11L/F41H/L45Y/A73H/Q127I/V278L/T406G/P408A、Q11L/F41H/L45Y/Q127I/V278L/T406G、Q11L/F41H/Q132K/V278L、Q11L/Y44H/L45Y/Q127I、Q11L/Y44H/A73H/Q127I/Q132K/L135E、Q11L/Y44H/A73S/Q127I/Q132K/L135E/T406G/P408A、Q11L/Y44H/Q127I、Q11L/Y44H/Q132K/V278L/T406G、Q11L/L45Y/A73H/Q127I/L135E、Q11L/L45Y/Q127I/Q132K/L135E/G138T/R182T、Q11L/L45Y/T406G、Q11L/A73H/Q127I/Q132K/V278L/T406G/P408A、Q11L/A73H/Q127I/Q132K/T406G/P408A、Q11L/A73H/Q132K、Q11L/A73S/Q127I/Q132K/L135E/R182L/V278L、Q11L/A73S/Q132K/L135E/P408A、Q11L/Q127I/Q132K/L135E、Q11L/Q127I/Q132K/L135E/R182L、Q11L/Q127I/Q132K/L135E/T406S、Q11L/Q127I/Q132K/G138T/R182L、Q11L/Q127I/Q132K/R182T、Q11L/Q132K/L135E/T406G、Q11L/R182L/T406S、F41H/Y44H/L45Y/A73H/Q127I/Q132K/V278L、F41H/L45Y/Q127I/Q132K/L135E/V278L/T406S、F41H/A73H/Q132K/L135E/T406G、Y44H/L45Y/A73H/Q132K/L135E/T406G、Y44H/L45Y/Q127I/Q132K/L135E/G138T/R182L/T406S/P408A、Y44H/L45Y/Q127I/Q132K/V278L、Y44H/A73H/Q127I/L135E、Y44H/A73S/Q127I/L135E/R182L/V278L/T406G/P408A、Y44H/A73S/Q132K/L135E/T406G/P408A、L45Y/A73H/Q127I/Q132K/L135E/T406G/P408A、L45Y/A73H/Q132K、L45Y/A73H/Q132K/L135E/R182L、L45Y/A73S/V278L/T406G/P408A、L45Y/Q127I/Q132K、L45Y/Q127I/Q132K/L135E/R182L、L45Y/Q127I/Q132K/L135E/R182T/T406G/P408A、L45Y/Q127I/L135E、L45Y/Q132K/P408A、L45Y/T406G、K56R/K309P/Y449L、K57G、N65G/Q114I/K422L/R427S、N65G/Q114I/R427S、N65G/P143K、N65G/P143K/Q235R/R427S、A73H/Q127I、A73H/Q127I/Q132K、Q127I、Q127I/Q132K/L135E/R182I/T406G、Q127I/Q132K/L135E/R182L、Q132K/L135E、Q132K/L135E/R182I、Q132K/L135E/T406G、Q132K/T406S、H164E、H164E/T220G/K309S/Y449H、H164E/T220G/Y449L、H164E/Y449H、R182L、T220G/Y449H、K309P/Y449L、K309R、K309T/Y449H、T406G、R418A/R427S、R427S、R427S/E429D和Y449L,其中所述位置参照SEQ ID NO:4550来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:7216、7218、7220、7222、7224、7226、7228、7230、7232、7234、7236、7238、7240、7242、7244、7246、7248、7250、7252、7254、7256、7258、7260、7262、7264、7266、7268、7270、7272、7274、7276、7278、7280、7282、7284、7286、7288、7290、7292、7294、7296、7298、7300、7302、7304、7306、7308、7310、7312、7314、7316、7318、7320、7322、7324、7326、7328、7330、7332、7334、7336、7338、7340、7342、7344、7346、7348、7350、7352、7354、7356、7358和7360。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:7216、7218、7220、7222、7224、7226、7228、7230、7232、7234、7236、7238、7240、7242、7244、7246、7248、7250、7252、7254、7256、7258、7260、7262、7264、7266、7268、7270、7272、7274、7276、7278、7280、7282、7284、7286、7288、7290、7292、7294、7296、7298、7300、7302、7304、7306、7308、7310、7312、7314、7316、7318、7320、7322、7324、7326、7328、7330、7332、7334、7336、7338、7340、7342、7344、7346、7348、7350、7352、7354、7356、7358和7360。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:7216、7218、7220、7222、7224、7226、7228、7230、7232、7234、7236、7238、7240、7242、7244、7246、7248、7250、7252、7254、7256、7258、7260、7262、7264、7266、7268、7270、7272、7274、7276、7278、7280、7282、7284、7286、7288、7290、7292、7294、7296、7298、7300、7302、7304、7306、7308、7310、7312、7314、7316、7318、7320、7322、7324、7326、7328、7330、7332、7334、7336、7338、7340、7342、7344、7346、7348、7350、7352、7354、7356、7358和7360。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7/10/73/127/132/385/423、10、10/53/73/99、10/53/272/423/427、10/53/423、10/73、10/73/127、10/127/132/385、10/132/302/385、53/73/200/423、53/127/132/385、53/127/136/385、53/132/136/302/423/427、53/132/302/385/423/427、65/106/445/447/449、65/143/220、65/220/309/445/447、65/220/445/449、65/399/406/447/449、65/402/406/445/449、65/445/447/449、65/447/449、73、73/127/427、73/132/136/385/427、73/385、73/385/427、106/220/399/402/406、115/116/278、115/170/190/238/412、115/190/194、115/245/278、116/170/190、116/190/406/408、116/238、116/238/245、116/416、127、132、143/220/445/447、143/309/402、143/309/445/447/449、170、170/190/192/194、170/192、170/192/194/278、170/192/194/335、170/194、170/194/335/416、170/238、170/335、170/335/416、190、190/192/194、190/194、190/194/238/245、190/194/335/416、190/194/412、190/245/412、192/194、192/194/242/406/408、194、200、200/385、220/399、220/445、220/445/447、257/385、272/302、272/385、278、302/385、309/399/449、309/445/447/449、385、385/427、399/406、399/406/449、402/445/449、406/445/447/449、406/445/449、423/427、445/447/449、445/449、447和449,其中所述位置参照SEQ ID NO:7324来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7V/10D/73H/127I/132G/385P/423L、10D、10D/53N/73H/99R、10D/53N/272H/423L/427S、10D/53N/423L、10D/73H、10D/73H/127I、10D/127I/132R/385P、10D/132R/302P/385P、53N/73H/200S/423L、53N/127I/132R/385S、53N/127I/136R/385L、53N/132G/136R/302P/423L/427S、53N/132G/302P/385S/423L/427S、65G/106R/445K/447L/449L、65G/143K/220Q、65G/220Q/309P/445R/447L、65G/220Q/445R/449K、65G/220Q/445R/449R、65G/399K/406G/447L/449R、65G/402R/406G/445R/449R、65G/445K/447L/449R、65G/447L/449L、73H、73H/127I/427S、73H/132R/136R/385S/427S、73H/385S、73H/385S/427S、106R/220Q/399K/402R/406G、115A/170E/190T/238L/412R、115A/190T/194F、115A/245P/278L、115T/116I/278L、116I/170E/190T、116I/190T/406G/408A、116I/238L、116I/238L/245P、116I/416R、127I、132G、143K/220Q/445K/447L、143K/309P/402R、143K/309P/445K/447L/449L、170E、170E/190T/192L/194F、170E/192L、170E/192L/194F/278L、170E/192L/194F/335K、170E/194F、170E/194F/335R/416R、170E/238L、170E/335K、170E/335K/416R、190T、190T/192L/194F、190T/194F、190T/194F/238L/245P、190T/194F/335R/416R、190T/194F/412R、190T/245P/412R、192L/194F、192L/194F/242L/406G/408A、194F、200S、200S/385S、220M/445K、220Q/399K、220Q/445K/447L、257H/385S、272H/302P、272H/385P、278L、302P/385P、302P/385S、309P/399K/449L、309P/445K/447L/449L、385S、385S/427S、399K/406G、399K/406G/449L、402R/445R/449L、406G/445K/449R、406G/445R/447L/449L、406G/445R/449K、423L/427S、445K/449L、445R/447L/449L、445R/449L、447L和449L,其中所述位置参照SEQ ID NO:7324来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:G7V/G10D/A73H/Q127I/K132G/V385P/R423L、G10D、G10D/E53N/A73H/H99R、G10D/E53N/R272H/R423L/R427S、G10D/E53N/R423L、G10D/A73H、G10D/A73H/Q127I、G10D/Q127I/K132R/V385P、G10D/K132R/N302P/V385P、E53N/A73H/A200S/R423L、E53N/Q127I/K132R/V385S、E53N/Q127I/E136R/V385L、E53N/K132G/E136R/N302P/R423L/R427S、E53N/K132G/N302P/V385S/R423L/R427S、N65G/A106R/N445K/N447L/Y449L、N65G/P143K/T220Q、N65G/T220Q/K309P/N445R/N447L、N65G/T220Q/N445R/Y449K、N65G/T220Q/N445R/Y449R、N65G/Q399K/S406G/N447L/Y449R、N65G/K402R/S406G/N445R/Y449R、N65G/N445K/N447L/Y449R、N65G/N447L/Y449L、A73H、A73H/Q127I/R427S、A73H/K132R/E136R/V385S/R427S、A73H/V385S、A73H/V385S/R427S、A106R/T220Q/Q399K/K402R/S406G、N115A/A170E/D190T/M238L/I412R、N115A/D190T/P194F、N115A/K245P/V278L、N115T/L116I/V278L、L116I/A170E/D190T、L116I/D190T/S406G/P408A、L116I/M238L、L116I/M238L/K245P、L116I/K416R、Q127I、K132G、P143K/T220Q/N445K/N447L、P143K/K309P/K402R、P143K/K309P/N445K/N447L/Y449L、A170E、A170E/D190T/E192L/P194F、A170E/E192L、A170E/E192L/P194F/V278L、A170E/E192L/P194F/P335K、A170E/P194F、A170E/P194F/P335R/K416R、A170E/M238L、A170E/P335K、A170E/P335K/K416R、D190T、D190T/E192L/P194F、D190T/P194F、D190T/P194F/M238L/K245P、D190T/P194F/P335R/K416R、D190T/P194F/I412R、D190T/K245P/I412R、E192L/P194F、E192L/P194F/I242L/S406G/P408A、P194F、A200S、A200S/V385S、T220M/N445K、T220Q/Q399K、T220Q/N445K/N447L、N257H/V385S、R272H/N302P、R272H/V385P、V278L、N302P/V385P、N302P/V385S、K309P/Q399K/Y449L、K309P/N445K/N447L/Y449L、V385S、V385S/R427S、Q399K/S406G、Q399K/S406G/Y449L、K402R/N445R/Y449L、S406G/N445K/Y449R、S406G/N445R/N447L/Y449L、S406G/N445R/Y449K、R423L/R427S、N445K/Y449L、N445R/N447L/Y449L、N445R/Y449L、N447L和Y449L,其中所述位置参照SEQ IDNO:7324来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、4、11/44、11/71、11/287、11/441、37、40、42、42/138、42/141、43、46、47、48/398、49、49/406/408、51、64、71、76、97、100、108、108/172、109、112、117/157/301、118、118/406/408、119、119/172、130、133、134、141、157、169、172/420、172/437、179、181、259、274、275、287、288、333/398、333/406/408、338、356、357、376、381、385、394/420、396、397/406/408、398、401、406/408、410、417、420、434、437和441,其中所述位置参照SEQ ID NO:7324来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2T、4F、11L/44H、11L/71P、11L/71T、11L/287S、11L/441S、37G、40Q、42A、42A/141P、42D/138C、42G、43A、43L、43M、43T、46C、46L、46Q、46T、47N、48S/398V、49G、49K、49N/406G/408A、51M、51Q、51V、64A、64F、64G、64L、64Q、64R、64V、71T、76H、76L、97L、97V、100R、108G/172H、108T、109L、109V、109Y、112N、112Q、112R、112T、112V、117R/157T/301R、118A、118A/406G/408A、118I、118L、118S、118V、119A、119G、119S、119T/172H、130S、133H、133L、133R、133S、134S、141G、141Q、141S、157C、157E、157T、169E、172H/420L、172H/437D、179I、179R、181H、181T、259T、274Q、274T、275L、287A、287K、287L、287S、288P、333S/398T、333S/406G/408A、338S、356S、356T、357T、376G、376M、376N、376R、376S、381C、385A、394H/420W、396A、396S、397L/406G/408A、398H、398K、398L、398M、398R、401T、406G/408A、410R、417C、417S、420F、420L、434C、437G、437V和441L,其中所述位置参照SEQ ID NO:7324来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H2T、H4F、Q11L/Y44H、Q11L/E71P、Q11L/E71T、Q11L/V287S、Q11L/Q441S、A37G、G40Q、V42A、V42A/A141P、V42D/G138C、V42G、I43A、I43L、I43M、I43T、V46C、V46L、V46Q、V46T、S47N、T48S/A398V、A49G、A49K、A49N/S406G/P408A、N51M、N51Q、N51V、S64A、S64F、S64G、S64L、S64Q、S64R、S64V、E71T、E76H、E76L、T97L、T97V、K100R、N108G/R172H、N108T、F109L、F109V、F109Y、I112N、I112Q、I112R、I112T、I112V、K117R/N157T/Q301R、P118A、P118A/S406G/P408A、P118I、P118L、P118S、P118V、D119A、D119G、D119S、D119T/R172H、A130S、V133H、V133L、V133R、V133S、A134S、A141G、A141Q、A141S、N157C、N157E、N157T、P169E、R172H/I420L、R172H/E437D、D179I、D179R、M181H、M181T、V259T、D274Q、D274T、M275L、V287A、V287K、V287L、V287S、N288P、N333S/A398T、N333S/S406G/P408A、G338S、G356S、G356T、V357T、V376G、V376M、V376N、V376R、V376S、A381C、V385A、R394H/I420W、E396A、E396S、I397L/S406G/P408A、A398H、A398K、A398L、A398M、A398R、L401T、S406G/P408A、G410R、V417C、V417S、I420F、I420L、A434C、E437G、E437V和Q441L,其中所述位置参照SEQ ID NO:7324来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:7766、7768、7770、7772、7774、7776、7778、7780、7782、7784、7786、7788、7790、7792、7794、7796、7798、7800、7812、7814、7816、7818、7820、7822、7824、7826、7828、7830、7832、7834、7836、7838、7840、7842、7844、7846、7848、7850、7852、7854、7856、7858、7860、7862、7864、7866、7868、7870、7872、7874、7876、7878、7880、7882、7884、7886、7888、7890、7892、7894、7896、7898、7900、7902、7904、7906、7908、7910、7912、7914、7916、7918、7920、7922、7924、7926、7928、7930、7932、7934、7936、7938、7940、7942、7944、8092、8094、8096、8098、8100、8102、8104、8106、8108、8110、8112、8114、8116、8118、8120、8122、8124、8126、8128、8130、8132、8134、8136、8138、8140、8142、8144、8146、8148、8150、8152、8154、8156、8158、8160、8162、8164、8166、8168、8170、8172、8174、8176、8178、8180、8182、8184、8186、8188、8190、8192、8194、8196、8198、8200、8202、8204、8206、8208、8210、8212、8214、8216、8218、8220、8222、8224、8226、8228、8230、8232、8234、8236、8238、8240、8242、8244、8246、8248、8250、8252、8254、8256、8258、8260、8262、8264、8266、8268、8270、8272、8274、8276、8278、8280、8282、8284、8286、8288、8290、8292、8294、8296、8298、8300、8302、8304、8306、8308、8310、8312、8314、8316、8318、8320、8322、8324、8326、8328、8330、8332、8334、8336和8338。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:7766、7768、7770、7772、7774、7776、7778、7780、7782、7784、7786、7788、7790、7792、7794、7796、7798、7800、7812、7814、7816、7818、7820、7822、7824、7826、7828、7830、7832、7834、7836、7838、7840、7842、7844、7846、7848、7850、7852、7854、7856、7858、7860、7862、7864、7866、7868、7870、7872、7874、7876、7878、7880、7882、7884、7886、7888、7890、7892、7894、7896、7898、7900、7902、7904、7906、7908、7910、7912、7914、7916、7918、7920、7922、7924、7926、7928、7930、7932、7934、7936、7938、7940、7942、7944、8092、8094、8096、8098、8100、8102、8104、8106、8108、8110、8112、8114、8116、8118、8120、8122、8124、8126、8128、8130、8132、8134、8136、8138、8140、8142、8144、8146、8148、8150、8152、8154、8156、8158、8160、8162、8164、8166、8168、8170、8172、8174、8176、8178、8180、8182、8184、8186、8188、8190、8192、8194、8196、8198、8200、8202、8204、8206、8208、8210、8212、8214、8216、8218、8220、8222、8224、8226、8228、8230、8232、8234、8236、8238、8240、8242、8244、8246、8248、8250、8252、8254、8256、8258、8260、8262、8264、8266、8268、8270、8272、8274、8276、8278、8280、8282、8284、8286、8288、8290、8292、8294、8296、8298、8300、8302、8304、8306、8308、8310、8312、8314、8316、8318、8320、8322、8324、8326、8328、8330、8332、8334、8336和8338。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:7766、7768、7770、7772、7774、7776、7778、7780、7782、7784、7786、7788、7790、7792、7794、7796、7798、7800、7812、7814、7816、7818、7820、7822、7824、7826、7828、7830、7832、7834、7836、7838、7840、7842、7844、7846、7848、7850、7852、7854、7856、7858、7860、7862、7864、7866、7868、7870、7872、7874、7876、7878、7880、7882、7884、7886、7888、7890、7892、7894、7896、7898、7900、7902、7904、7906、7908、7910、7912、7914、7916、7918、7920、7922、7924、7926、7928、7930、7932、7934、7936、7938、7940、7942、7944、8092、8094、8096、8098、8100、8102、8104、8106、8108、8110、8112、8114、8116、8118、8120、8122、8124、8126、8128、8130、8132、8134、8136、8138、8140、8142、8144、8146、8148、8150、8152、8154、8156、8158、8160、8162、8164、8166、8168、8170、8172、8174、8176、8178、8180、8182、8184、8186、8188、8190、8192、8194、8196、8198、8200、8202、8204、8206、8208、8210、8212、8214、8216、8218、8220、8222、8224、8226、8228、8230、8232、8234、8236、8238、8240、8242、8244、8246、8248、8250、8252、8254、8256、8258、8260、8262、8264、8266、8268、8270、8272、8274、8276、8278、8280、8282、8284、8286、8288、8290、8292、8294、8296、8298、8300、8302、8304、8306、8308、8310、8312、8314、8316、8318、8320、8322、8324、8326、8328、8330、8332、8334、8336和8338。
本发明还提供了工程化糖基转移酶,其中工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11、11/64/109、11/445、42/43、42/44/71/73/116、43/73/141、46/47/51、46/51、47/49、47/51、64、64/65/109、64/65/112、64/112、64/134、64/445、65/112、65/112/445、71、71/73、71/73/141、71/141、71/302、73、73/116/141、73/141、73/302、109、109/112、109/115/118、109/134、109/406、112、112/445、116/287、127、127/169/172、127/169/287、127/169/376/398/399、127/169/398/399、127/287、127/376、141、141/302、169/172/287、169/172/288、169/172/288/398/399/420/423/427、169/172/398/399、169/287、169/398、169/398/399、287、287/288、287/376、287/398、287/399、287/420/423/427、288、288/376/398、288/398、288/399、302、376、376/398、376/399、398、398/399、398/399/420、398/427、399和420,其中所述位置参照SEQ ID NO:7784来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11L、11L/64R/109V、11L/445K、42A/44H/71T/73H/116I、42G/43M、43T/73H/141P、46L/47N/51Q、46T/51Q、47N/49G、47N/51V、64R、64R/65G/109V、64R/65G/112N、64R/65G/112T、64R/112N、64R/134S、64R/445K、65G/112N、65G/112N/445K、71T、71T/73H、71T/73H/141G、71T/73H/141S、71T/141P、71T/302P、73H、73H/116I/141P、73H/141G、73H/141P、73H/141S、73H/302P、109L/112T、109V、109V/112T、109V/115A/118V、109V/134S、109V/406G、112N/445K、112T、116I/287S、127I、127I/169E/172H、127I/169E/287S、127I/169E/376M/398M/399K、127I/169E/398L/399K、127I/287S、127I/376M、141G、141G/302P、141P、141S、141S/302P、169E/172H/287S、169E/172H/288P、169E/172H/288P/398L/399K/420F/423L/427S、169E/172H/398M/399K、169E/287S、169E/398M/399K、169E/398T、287L/288P、287L/399K、287M、287S、287S/376M、287S/398T、287S/399K、287S/420F/423L/427S、288P、288P/376S/398L、288P/398K、288P/399K、302P、376M、376M/398L、376M/398M、376M/399K、398L、398L/399K、398L/427S、398M、398M/399K、398M/399K/420F、398R、398R/399K、398T/399K、399K和420F,其中所述位置参照SEQ ID NO:7784来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q11L、Q11L/S64R/F109V、Q11L/N445K、V42A/Y44H/E71T/A73H/L116I、V42G/I43M、I43T/A73H/A141P、V46L/S47N/N51Q、V46T/N51Q、S47N/A49G、S47N/N51V、S64R、S64R/N65G/F109V、S64R/N65G/I112N、S64R/N65G/I112T、S64R/I112N、S64R/A134S、S64R/N445K、N65G/I112N、N65G/I112N/N445K、E71T、E71T/A73H、E71T/A73H/A141G、E71T/A73H/A141S、E71T/A141P、E71T/N302P、A73H、A73H/L116I/A141P、A73H/A141G、A73H/A141P、A73H/A141S、A73H/N302P、F109L/I112T、F109V、F109V/I112T、F109V/N115A/P118V、F109V/A134S、F109V/S406G、I112N/N445K、I112T、L116I/V287S、Q127I、Q127I/P169E/R172H、Q127I/P169E/V287S、Q127I/P169E/V376M/A398M/Q399K、Q127I/P169E/A398L/Q399K、Q127I/V287S、Q127I/V376M、A141G、A141G/N302P、A141P、A141S、A141S/N302P、P169E/R172H/V287S、P169E/R172H/N288P、P169E/R172H/N288P/A398L/Q399K/I420F/R423L/R427S、P169E/R172H/A398M/Q399K、P169E/V287S、P169E/A398M/Q399K、P169E/A398T、V287L/N288P、V287L/Q399K、V287M、V287S、V287S/V376M、V287S/A398T、V287S/Q399K、V287S/I420F/R423L/R427S、N288P、N288P/V376S/A398L、N288P/A398K、N288P/Q399K、N302P、V376M、V376M/A398L、V376M/A398M、V376M/Q399K、A398L、A398L/Q399K、A398L/R427S、A398M、A398M/Q399K、A398M/Q399K/I420F、A398R、A398R/Q399K、A398T/Q399K、Q399K和I420F,其中所述位置参照SEQ ID NO:7784来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:10、10/144、10/199、13、14、15、15/394、16、22、36、89、93、96、116、116/123、116/143、116/350、123、125、127、143、144、149、156、186、187、197、198、199、201、202、203、268、287、324、331和350,其中所述位置参照SEQ ID NO:7784来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:10D、10D/144L、10D/199G、13Q、14Q、15A、15L/394H、16A、16G、16T、22G、36M、89A、93A、96M、116I、116I/123N、116I/123S、116I/143R、116I/350L、123A、123G、123L、123S、123V、125L、127A、127G、127V、143G、144G、144Q、144S、149S、156V、186N、187G、187Y、197H、198Q、199G、199P、199R、199S、199Y、201A、201K、201L、201N、202A、202Y、203T、268W、287A、324R、331C、331V和350L,其中所述位置参照SEQ ID NO:7784来编号。在一些实施方案中,工程化糖基转移酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:G10D、G10D/V144L、G10D/N199G、L13Q、R14Q、V15A、V15L/R394H、L16A、L16G、L16T、A22G、L36M、G89A、H93A、G96M、L116I、L116I/Y123N、L116I/Y123S、L116I/P143R、L116I/M350L、Y123A、Y123G、Y123L、Y123S、Y123V、F125L、Q127A、Q127G、Q127V、P143G、V144G、V144Q、V144S、A149S、F156V、G186N、T187G、T187Y、P197H、G198Q、N199G、N199P、N199R、N199S、N199Y、G201A、G201K、G201L、G201N、I202A、I202Y、M203T、Y268W、V287A、H324R、I331C、I331V和M350L,其中所述位置参照SEQ ID NO:7784来编号。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:8624、8626、8628、8630、8632、8634、8636、8638、8640、8642、8644、8646、8648、8650、8652、8654、8656、8658、8660、8662、8664、8666、8668、8670、8672、8674、8676、8678、8680、8682、8684、8686、8688、8690、8692、8694、8696、8698、8700、8702、8704、8706、8708、8710、8712、8714、8716、8718、8720、8722、8724、8726、8728、8730、8732、8734、8736、8738、8740、8742、8744、8746、8748、8750、8752、8754、8756、8758、8760、8762、8764、8766、8768、8770、8772、8774、8776、8778、8780、8782、8784、8786、8788、8790、8792、8794、8796、9108、9110、9112、9114、9116、9118、9120、9122、9124、9126、9128、9130、9132、9134、9136、9138、9140、9142、9144、9146、9148、9150、9152、9154、9156、9158、9160、9162、9164、9166、9168、9170、9172、9174、9176、9178、9180、9182、9184、9186、9188、9190、9192、9194、9196、9198、9200、9202、9204、9206、9208、9210、9212、9214、9216、9218、9220和9222。在一些实施方案中,工程化糖基转移酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:8624、8626、8628、8630、8632、8634、8636、8638、8640、8642、8644、8646、8648、8650、8652、8654、8656、8658、8660、8662、8664、8666、8668、8670、8672、8674、8676、8678、8680、8682、8684、8686、8688、8690、8692、8694、8696、8698、8700、8702、8704、8706、8708、8710、8712、8714、8716、8718、8720、8722、8724、8726、8728、8730、8732、8734、8736、8738、8740、8742、8744、8746、8748、8750、8752、8754、8756、8758、8760、8762、8764、8766、8768、8770、8772、8774、8776、8778、8780、8782、8784、8786、8788、8790、8792、8794、8796、9108、9110、9112、9114、9116、9118、9120、9122、9124、9126、9128、9130、9132、9134、9136、9138、9140、9142、9144、9146、9148、9150、9152、9154、9156、9158、9160、9162、9164、9166、9168、9170、9172、9174、9176、9178、9180、9182、9184、9186、9188、9190、9192、9194、9196、9198、9200、9202、9204、9206、9208、9210、9212、9214、9216、9218、9220和9222。在一些实施方案中,工程化糖基转移酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:8624、8626、8628、8630、8632、8634、8636、8638、8640、8642、8644、8646、8648、8650、8652、8654、8656、8658、8660、8662、8664、8666、8668、8670、8672、8674、8676、8678、8680、8682、8684、8686、8688、8690、8692、8694、8696、8698、8700、8702、8704、8706、8708、8710、8712、8714、8716、8718、8720、8722、8724、8726、8728、8730、8732、8734、8736、8738、8740、8742、8744、8746、8748、8750、8752、8754、8756、8758、8760、8762、8764、8766、8768、8770、8772、8774、8776、8778、8780、8782、8784、8786、8788、8790、8792、8794、8796、9108、9110、9112、9114、9116、9118、9120、9122、9124、9126、9128、9130、9132、9134、9136、9138、9140、9142、9144、9146、9148、9150、9152、9154、9156、9158、9160、9162、9164、9166、9168、9170、9172、9174、9176、9178、9180、9182、9184、9186、9188、9190、9192、9194、9196、9198、9200、9202、9204、9206、9208、9210、9212、9214、9216、9218、9220和9222。
本发明还提供了工程化蔗糖合酶,其包含与SEQ ID NO:72具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少90%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少91%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少92%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少93%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少94%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少95%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少96%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少97%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少98%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少99%或更多序列同一性的多肽序列。在一些实施方案中,本发明提供了工程化蔗糖合酶,其包含SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420的多肽序列。在另外的实施方案中,本发明提供了表18.1、19.1、19.2、20.1、20.2、20.3、31.2、31.3、32.1、32.2、33.1、33.2、34.1、34.2、35.1、35.2、36.1、36.2、37.1、37.2、37.3、38.1、38.2、38.3、39.1、39.2、39.3、40.1、40.2、40.3、41.1、41.2、42.1和/或42.2中提供的蔗糖合酶。本发明还提供了工程化蔗糖合酶,其包含与以下序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列:SEQ ID NO:1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142、1144、1146、1148、1150、1152、1154、1156、1158、1160、1162、1164、1166、1168、1170、1172、1174、1176、1178、1180、1182、1184、1186、1188、1190、1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218、1220、1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286、1288、1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390、1392、1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564、1566、1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596、1598、1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770、1772、1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818、1820、1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982、1984、1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316、2318、2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500、2502、2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592、2594、7438、7440、7442、7444、7446、7448、7450、7452、7454、7456、7458、7460、7462、7464、7466、7468、7470、7472、7474、7476、7478、7480、7482、7484、7486、7488、7490、7492、7494、7496、7498、7500、7502、7504、7506、7508、7510、7512、7514、7516、7518、7520、7522、7524、7526、7528、7530、7532、7534、7536、7538、7540、7542、7544、7546、7548、7550、7552、7554、7556、7558、7560、7562、7564、7566、7568、7570、7572、7574、7576、7578、7580、7582、7584、7586、7588、7590、7592、7594、7596、7598、7600、7602、7604、7606、7608、7610、7612、7614、7616、7618、7620、7622、7624、7626、7628、7630、7632、7634、7636、7638、7640、7642、7644、7646、7648、7650、7652、7654、7656、7658、7660、7662、7664、7666、7668、7670、7672、7674、7676、7678、7680、7682、7684、7686、7688、7690、7692、7694、7696、7698、7700、7702、7704、7706、7708、7710、7712、7714、7716、7718、7720、7722、7724、7726、7728、7730、7732、7734、7736、7738、7740、7742、7744、7746、7748、7750、7752、7754、7756、7758、7760、7762、7764、8370、8372、8374、8376、8378、8380、8382、8384、8386、8388、8390、8392、8394、8396、8398、8400、8402、8404、8406、8408、8410、8412、8414、8416、8418、8420、8422、8424、8426、8428、8430、8432、8434、8436、8438、8440、8442、8444、8446、8448、8450、8452、8454、8456、8458、8460、8462、8464、8466、8468、8470、8472、8474、8476、8478、8480、8798、8800、8802、8804、8806、8808、8810、8812、8814、8816、8818、8820、8822、8824、8826、8828、8830、8832、8834、8836、8838、8840、8842、8844、8846、8848、8850、8852、8854、8856、8858、8860、8862、8864、8866、8868、8870、8872、8874、8876、8878、8880、8882、8884、8886、8888、8890、8892、8894、8896、8898、8900、8902、8904、8906、8908、8910、8912、8914、8916、8918、8920、8922、8924、8926、8928、8930、8932、8934、8936、8938、8940、8942、8944、8946、8948、8950、8952、8954、8956、8958、8960、8962、8964、8966、8968、8970、8972、8974、8976、8978、8980、8982、8984、8986、8988、8990、8992、8994、8996、8998、9000、9002、9004、9006、9008、9010、9012、9014、9016、9018、9020、9022、9024、9026、9028、9030、9032、9034、9036、9038、9040、9042、9044、9046、9048、9050、9052、9054、9056、9058、9060、9062、9064、9066、9068、9070、9072、9074、9076、9078、9080、9082、9084、9086、9088、9090、9092、9094、9096、9098、9100、9102、9104和/或9106。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:4/9/349/532、4/13/113/343/532、4/13/113/532、4/33/47/52/343/532、4/47/52/532、4/113/532、4/13/113、4/13/532、4/33/113、4/343、7、8、44、95、117/440、136、221、343/532、440、444、478、532、583、611、615、615/789、695、722和788,其中所述位置参照SEQ ID NO:74来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:4E/9T/349H/532S、4E/13R/113Q/343H/532S、4E/13R/113Q/532S、4E/33Q/47H/52D/343H/532S、4E/47H/52D/532S、4E/113Q/532S、4E/13R/113Q、4E/13R/532S、4E/33Q/113Q、4E/343H、7T、8M、44K、95S、117D/440T、136S、221A/H、343S/532S、440P/T、444K/T、478T/V、532R/T、583Q、611V、615C/E/T/V、615L/789D、695L、722Y和788E,其中所述位置参照SEQ ID NO:74来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:A4E/L9T/Q349H/F532S、A4E/P13R/I113Q/V343H/F532S、A4E/P13R/I113Q/F532S、A4E/Y33Q/L47H/A52D/V343H/F532S、A4E/L47H/A52D/F532S、A4E/I113Q/F532S、A4E/P13R/I113Q、A4E/P13R/F532S、A4E/Y33Q/I113Q、A4E/V343H、Q7T、Q8M、R44K、Q95S、G117D/R440T、R136S、R221A/H、V343S/F532S、R440P/T、Q444K/T、R478T/V、F532R/T、R583Q、R611V、R615C/E/T/V、R615L/A789D、V695L、R722Y和H788E,其中所述位置参照SEQ ID NO:74来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142,1144、1146、1148、1150和/或1152。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQID NO:1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142,1144、1146、1148、1150和/或1152。在一些另外的实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142,1144、1146、1148、1150和/或1152。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/221、47/221、68/129/248、68/129/248/595/600/756、68/146/248/387/506/550、68/189/272/316/477/719/756、75/105/154/215/264/345、75/105/345/410/769、75/105/530、75/345/530、85/170/225/266/534、87/125/230/267/375/464/708、93/129/506/550/595/719/756、93/477/635、95/136/788、95/201/478/583/724/788、95/385/478/583/788、95/440/478/724/788/792、95/444/478/603/792、95/444/478/724/788、95/478/724、98/250、113/225/266/415、126/314/499/549/589/755、136/440/444/478/603、136/440/444/478/583/788、136/444/478/583/788/792、225/372/534、266、306/358/703/776、358/636/737、440/444/583/724/788、440/478和466,其中所述位置参照SEQ ID NO:1080来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8M/221H、47L/221H、68A/129E/248A、68A/129E/248A/595V/600I/756V、68A/146N/248A/387I/506P/550H、68A/189R/272L/316I/477K/719C/756V、75V/105E/154H/215F/264V/345T、75V/105E/345T/410S/769R、75V/105E/530L、75V/345T/530L、85V/170L/225E/266N/534H、87E/125E/230D/267V/375Y/464F/708A、93V/129E/506P/550H/595V/719C/756V、93V/477K/635S、95S/136S/788E、95S/201E/478V/583Q/724H/788E、95S/385L/478V/583Q/788E、95S/440T/478V/724H/788E/792S、95S/444T/478V/603S/792S、95S/444T/478V/724H/788E、95S/478T/724H、98V/250D、113L/225E/266N/415K、126L/314L/499H/549E/589E/755G、136S/440P/444T/478T/603S、136S/440T/444T/478V/583Q/788E、136S/444T/478V/583Q/788E/792S、225E/372V/534H、266N、306L/358E/703Y/776E、358E/636Q/737I、440P/444T/583Q/724H/788E、440T/478V和466I,其中所述位置参照SEQ ID NO:1080来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q8M/R221H、H47L/R221H、V68A/R129E/S248A、V68A/R129E/S248A/I595V/V600I/I756V、V68A/D146N/S248A/V387I/S506P/R550H、V68A/G189R/I272L/V316I/D477K/A719C/I756V、M75V/A105E/R154H/I215F/I264V/A345T、M75V/A105E/A345T/T410S/Q769R、M75V/A105E/P530L、M75V/A345T/P530L、R85V/I170L/A225E/R266N/E534H、I87E/T125E/N230D/I267V/W375Y/I464F/T708A、R93V/R129E/S506P/R550H/I595V/A719C/I756V、R93V/D477K/A635S、Q95S/R136S/H788E、Q95S/Q201E/R478V/R583Q/K724H/H788E、Q95S/R385L/R478V/R583Q/H788E、Q95S/R440T/R478V/K724H/H788E/M792S、Q95S/Q444T/R478V/G603S/M792S、Q95S/Q444T/R478V/K724H/H788E、Q95S/R478T/K724H、L98V/S250D、I113L/A225E/R266N/R415K、V126L/V314L/N499H/D549E/G589E/R755G、R136S/R440P/Q444T/R478T/G603S、R136S/R440T/Q444T/R478V/R583Q/H788E、R136S/Q444T/R478V/R583Q/H788E/M792S、A225E/I372V/E534H、R266N、R306L/P358E/N703Y/Q776E、P358E/L636Q/V737I、R440P/Q444T/R583Q/K724H/H788E、R440T/R478V和V466I,其中所述位置参照SEQ ID NO:1080来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218和/或1220。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218和/或1220。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218和/或1220。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/68/95/98/358/478/595/724/792、8/68/98/221/248/250/440/477/534/595/724、8/68/788、8/93/95/98/136/221/595/600/788、8/93/95/113/250/440/595/600/724/788、8/95/98/440/478/534/600/788、8/136/248/478/788、47/75/85/105/125/129/170/635、47/75/85/105/375/756/776、47/75/85/264/267/372/415/635、47/75/85/87/129/375/776、47/75/85/87/170/372/756、47/85/105/129/201/230/267/583、47/85/125/372/583/635/756、47/85/170/756、47/85/87/105/125/635、47/85/87/154/756、47/125/129/375/756/776、47/129/170/635、47/154/372/375/583/635/708/756、68/93/95/358/440/444/478/534/595/603、68/93/95/444/788、68/93/98/136/248/250/358/440/534/724、75/85/87/105/264/267/583/708、75/85/129/154/264/375、85/125/215/375/415/635/776、85/87/105/215/267/756、85/87/129/375/756/776、87/125/129/170/230/756、87/154/306/375/756、93/95/98/534/792、95/440/444/724/788、129/215/372/756和170/264/267,其中所述位置参照SEQ ID NO:1158来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8M/68A/95S/98V/358E/478T/595V/724H/792S、8M/68A/98V/221H/248A/250D/440P/477K/534H/595V/724H、8M/68A/788E、8M/93V/95S/98V/136S/221H/595V/600I/788E、8M/93V/95S/113I/250D/440T/595V/600I/724H/788E、8M/95S/98V/440P/478V/534H/600I/788E、8M/136S/248A/478V/788E、47L/75V/85V/105E/125E/129E/170L/635S、47L/75V/85V/105E/375Y/756V/776E、47L/75V/85V/264V/267V/372V/415R/635S、H47L/M75V/R85V/I87E/R129E/W375Y/Q776E、47L/75V/85V/87E/170L/372V/756V、47L/85V/105E/129E/201E/230D/267V/583Q、47L/85V/125E/372V/583Q/635S/756V、47L/85V/170L/756V、47L/85V/87E/105E/125E/635S、47L/85V/87E/154H/756V、47L/125E/129E/375Y/756V/776E、47L/129E/170L/635S、47L/154H/372V/375Y/583Q/635S/708A/756V、68A/93V/95S/358E/440T/444T/478V/534H/595V/603S、68A/93V/95S/444T/788E、68A/93V/98V/136S/248A/250D/358E/440P/534H/724H、75V/85V/87E/105E/264V/267V/583Q/708A、75V/85V/129E/154H/264V/375Y、85V/125E/215F/375Y/415R/635S/776E、85V/87E/105E/215F/267V/756V、85V/87E/129E/375Y/756V/776E、87E/125E/129E/170L/230D/756V、87E/154H/306L/375Y/756V、93V/95S/98V/534H/792S、95S/440P/444T/724H/788E、129E/215F/372V/756V、170L/264V/267V、8M/68A/95S/98V/358E/478T/595V/724H/792S、8M/68A/98V/221H/248A/250D/440P/477K/534H/595V/724H、8M/68A/788E、8M/93V/95S/98V/136S/221H/595V/600I/788E、8M/93V/95S/113I/250D/440T/595V/600I/724H/788E、8M/95S/98V/440P/478V/534H/600I/788E、8M/136S/248A/478V/788E、47L/75V/85V/105E/125E/129E/170L/635S、47L/75V/85V/105E/375Y/756V/776E、47L/75V/85V/264V/267V/372V/415R/635S、47L/75V/85V/87E/129E/375Y/776E、47L/75V/85V/87E/170L/372V/756V、47L/85V/105E/129E/201E/230D/267V/583Q、47L/85V/125E/372V/583Q/635S/756V、47L/85V/170L/756V、47L/85V/87E/105E/125E/635S、47L/85V/87E/154H/756V、47L/125E/129E/375Y/756V/776E、47L/129E/170L/635S、47L/154H/372V/375Y/583Q/635S/708A/756V、68A/93V/95S/358E/440T/444T/478V/534H/595V/603S、68A/93V/95S/444T/788E、68A/93V/98V/136S/248A/250D/358E/440P/534H/724H、75V/85V/87E/105E/264V/267V/583Q/708A、75V/85V/129E/154H/264V/375Y、85V/125E/215F/375Y/415R/635S/776E、85V/87E/105E/215F/267V/756V、85V/87E/129E/375Y/756V/776E、87E/125E/129E/170L/230D/756V、87E/154H/306L/375Y/756V、93V/95S/98V/534H/792S、95S/440P/444T/724H/788E、129E/215F/372V/756V和170L/264V/267V,其中所述位置参照SEQ ID NO:1158来编号。在一些另外的实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q8M/V68A/Q95S/L98V/P358E/R478T/I595V/K724H/M792S、Q8M/V68A/L98V/R221H/S248A/S250D/R440P/D477K/E534H/I595V/K724H、Q8M/V68A/H788E、Q8M/R93V/Q95S/L98V/R136S/R221H/I595V/V600I/H788E、Q8M/R93V/Q95S/L113I/S250D/R440T/I595V/V600I/K724H/H788E、Q8M/Q95S/L98V/R440P/R478V/E534H/V600I/H788E、Q8M/R136S/S248A/R478V/H788E、H47L/M75V/R85V/A105E/T125E/R129E/I170L/A635S、H47L/M75V/R85V/A105E/W375Y/I756V/Q776E、H47L/M75V/R85V/I264V/I267V/I372V/K415R/A635S、H47L/M75V/R85V/I87E/R129E/W375Y/Q776E、H47L/M75V/R85V/I87E/I170L/I372V/I756V、H47L/R85V/A105E/R129E/Q201E/N230D/I267V/R583Q、H47L/R85V/T125E/I372V/R583Q/A635S/I756V、H47L/R85V/I170L/I756V、H47L/R85V/I87E/A105E/T125E/A635S、H47L/R85V/I87E/R154H/I756V、H47L/T125E/R129E/W375Y/I756V/Q776E、H47L/R129E/I170L/A635S、H47L/R154H/I372V/W375Y/R583Q/A635S/T708A/I756V、V68A/R93V/Q95S/P358E/R440T/Q444T/R478V/E534H/I595V/G603S、V68A/R93V/Q95S/Q444T/H788E、V68A/R93V/L98V/R136S/S248A/S250D/P358E/R440P/E534H/K724H、M75V/R85V/I87E/A105E/I264V/I267V/R583Q/T708A、M75V/R85V/R129E/R154H/I264V/W375Y、R85V/T125E/I215F/W375Y/K415R/A635S/Q776E、R85V/I87E/A105E/I215F/I267V/I756V、R85V/I87E/R129E/W375Y/I756V/Q776E、I87E/T125E/R129E/I170L/N230D/I756V、I87E/R154H/R306L/W375Y/I756V、R93V/Q95S/L98V/E534H/M792S、Q95S/R440P/Q444T/K724H/H788E、R129E/I215F/I372V/I756V和I170L/I264V/I267V,其中所述位置参照SEQ ID NO:1158来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286和/或1288。在一些另外的实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286和/或1288。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286和/或1288。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:47/68/93/98/358/440、47/68/154/372/375、47/93/98/136/154/772/776、47/93/98/154/372/375/776、47/93/98/358/583/635、47/93/129/136/154/250/372/534/635/724、47/93/129/136/375/534/583、47/93/358/372/375/440/724、47/93/358/372/375/776、47/98/129/358/372/375/438/534、47/98/129/375/534/635/724/776、47/98/372/375、47/125/154、47/129/136/372/375/534、47/129/248/250/372/375/534/724、47/136/583/776、47/358/440/724、47/358/635/776、47/372/635/776、68/93/98/129/358/375/724、68/93/154/358/372/440/776、68/129/440、68/129/583/724、68/136/724、68/154/358/375、68/154/534/635、68/375/440/534/724/776、93/98/125/154/248、93/98/125/154/250/440、93/98/129/154/248、93/98/154/250/358/375/534、93/98/154/635/776、93/98/534、93/125/154/440/534、93/129/250/358/372/375/583、93/154/248/724、93/358/534/635、98/129/375/583、98/534/583/635、129/136/154/248/250/372/375/534、129/136/375、129/154/248/250/358/375/534/635、129/358/372/635、154/250/358/375/583、154/358/375/534/776、154/534/635/724、372/375/776、375/635和534/583,其中所述位置参照SEQ ID NO:1222来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:47L/68A/93V/98V/358E/440P、47L/68A/154H/372V/375Y、47L/93V/98V/136S/154H/772G/776E、47L/93V/98V/154H/372V/375Y/776E、47L/93V/98V/358E/583Q/635S、47L/93V/129E/136S/154H/250D/372V/534H/635S/724H、47L/93V/129E/136S/375Y/534H/583Q、47L/93V/358E/372V/375Y/440P/724H、47L/93V/358E/372V/375Y/776E、47L/98V/129E/358E/372V/375Y/438Q/534H、47L/98V/129E/375Y/534H/635S/724H/776E、47L/98V/372V/375Y、47L/125E/154H、47L/129E/136S/372V/375Y/534H、47L/129E/248A/250D/372V/375Y/534H/724H、47L/136S/583Q/776E、47L/358E/440P/724H、47L/358E/635S/776E、47L/372V/635S/776E、68A/93V/98V/129E/358E/375Y/724H、68A/93V/154H/358E/372V/440P/776E、68A/129E/440P、68A/129E/583Q/724H、68A/136S/724H、68A/154H/358E/375Y、68A/154H/534H/635S、68A/375Y/440P/534H/724H/776E、93V/98V/125E/154H/248A、93V/98V/125E/154H/250D/440P、93V/98V/129E/154H/248A、93V/98V/154H/250D/358E/375Y/534H、93V/98V/154H/635S/776E、93V/98V/534H、93V/125E/154H/440P/534H、93V/129E/250D/358E/372V/375Y/583Q、93V/154H/248A/724H、93V/358E/534H/635S、98V/129E/375Y/583Q、98V/534H/583Q/635S、129E/136S/154H/248A/250D/372V/375Y/534H、129E/136S/375Y、129E/154H/248A/250D/358E/375Y/534H/635S、129E/358E/372V/635S、154H/250D/358E/375Y/583Q、154H/358E/375Y/534H/776E、154H/534H/635S/724H、372V/375Y/776E、375Y/635S和534H/583Q,其中所述位置参照SEQ ID NO:1222来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:H47L/V68A/R93V/L98V/P358E/R440P、H47L/V68A/R154H/I372V/W375Y、H47L/R93V/L98V/R136S/R154H/E772G/Q776E、H47L/R93V/L98V/R154H/I372V/W375Y/Q776E、H47L/R93V/L98V/P358E/R583Q/A635S、H47L/R93V/R129E/R136S/R154H/S250D/I372V/E534H/A635S/K724H、H47L/R93V/R129E/R136S/W375Y/E534H/R583Q、H47L/R93V/P358E/I372V/W375Y/R440P/K724H、H47L/R93V/P358E/I372V/W375Y/Q776E、H47L/L98V/R129E/P358E/I372V/W375Y/H438Q/E534H、H47L/L98V/R129E/W375Y/E534H/A635S/K724H/Q776E、H47L/L98V/I372V/W375Y、H47L/T125E/R154H、H47L/R129E/R136S/I372V/W375Y/E534H、H47L/R129E/S248A/S250D/I372V/W375Y/E534H/K724H、H47L/R136S/R583Q/Q776E、H47L/P358E/R440P/K724H、H47L/P358E/A635S/Q776E、H47L/I372V/A635S/Q776E、V68A/R93V/L98V/R129E/P358E/W375Y/K724H、V68A/R93V/R154H/P358E/I372V/R440P/Q776E、V68A/R129E/R440P、V68A/R129E/R583Q/K724H、V68A/R136S/K724H、V68A/R154H/P358E/W375Y、V68A/R154H/E534H/A635S、V68A/W375Y/R440P/E534H/K724H/Q776E、R93V/L98V/T125E/R154H/S248A、R93V/L98V/T125E/R154H/S250D/R440P、R93V/L98V/R129E/R154H/S248A、R93V/L98V/R154H/S250D/P358E/W375Y/E534H、R93V/L98V/R154H/A635S/Q776E、R93V/L98V/E534H、R93V/T125E/R154H/R440P/E534H、R93V/R129E/S250D/P358E/I372V/W375Y/R583Q、R93V/R154H/S248A/K724H、R93V/P358E/E534H/A635S、L98V/R129E/W375Y/R583Q、L98V/E534H/R583Q/A635S、R129E/R136S/R154H/S248A/S250D/I372V/W375Y/E534H、R129E/R136S/W375Y、R129E/R154H/S248A/S250D/P358E/W375Y/E534H/A635S、R129E/P358E/I372V/A635S、R154H/S250D/P358E/W375Y/R583Q、R154H/P358E/W375Y/E534H/Q776E、R154H/E534H/A635S/K724H、I372V/W375Y/Q776E、W375Y/A635S和E534H/R583Q,其中所述位置参照SEQ ID NO:1222来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390和1392。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390和1392。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390和1392。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17/357/364/434/519/684、17/357/434/519/684、17/434/684、17/684、54/97/118/307/694/727/738、68/98/129/136、68/98/129/136/154、68/98/129/136/154/534、68/98/129/154/534、68/98/129/154/635、68/98/136/154/534/635、68/98/136/154/635、68/98/154、68/98/154/534、68/98/154/534/635、68/129/136、68/129/136/154、68/129/136/154/464/635、68/129/136/534/635、68/129/154、68/129/154/765、68/136/154/534/635、68/136/534/635、68/136/635、68/154、68/154/534/635、68/154/635、97/118/442/694/727/738、98/129/136/154、98/129/136/154/635、98/129/136/534、98/129/136/635、98/129/154、98/129/154/534/635、98/129/534/635、98/136/154/635、98/136/534/635、98/136/635、98/154、98/154/534、122、129/136、129/136/154/635、129/136/534、129/136/635、129/154/534、129/154/635、129/635、132/136/154/534/635、136/154/635、136/534/635、136/603、136/635、154、154/635、157、160、161、167、253、285、381、519、550、563、564、635和785,其中所述位置参照SEQ ID NO:1392来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17D/357K/364R/434H/519T/684H、17D/357K/434H/519T/684H、17D/434H/684H、17D/684H、54D/97V/118N/307E/694N/727E/738E、68A/98V/129E/136S、68A/98V/129E/136S/154H、68A/98V/129E/136S/154H/534H、68A/98V/129E/154H/534H、68A/98V/129E/154H/635S、68A/98V/136S/154H/534H/635S、68A/98V/136S/154H/635S、68A/98V/154H、68A/98V/154H/534H、68A/98V/154H/534H/635S、68A/129E/136S、68A/129E/136S/154H、68A/129E/136S/154H/464F/635S、68A/129E/136S/534H/635S、68A/129E/154H、68A/129E/154H/765H、68A/136S/154H/534H/635S、68A/136S/534H/635S、68A/136S/635S、68A/154H、68A/154H/534H/635S、68A/154H/635S、97V/118N/442N/694N/727E/738E、98V/129E/136S/154H、98V/129E/136S/154H/635S、98V/129E/136S/534H、98V/129E/136S/635S、98V/129E/154H、98V/129E/154H/534H/635S、98V/129E/534H/635S、98V/136S/154H/635S、98V/136S/534H/635S、98V/136S/635S、98V/154H、98V/154H/534H、122D、122E、129E/136S、129E/136S/154H/635S、129E/136S/534H、129E/136S/635S、129E/154H/534H、129E/154H/635S、129E/635S、132C/136S/154H/534H/635S、136S/154H/635S、136S/534H/635S、136S/603D、136S/635S、154H、154H/635S、157A、157F、160A、160E、160M、160N、160S、160W、161Q、167E、253G、253T、253V、285A、381S、519A、519G、519L、519S、519T、550I、550M、550Q、550S、563V、564A、635D、635E、635R和785D,其中所述位置参照SEQ ID NO:1392来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Y17D/Y357K/P364R/Y434H/F519T/F684H、Y17D/Y357K/Y434H/F519T/F684H、Y17D/Y434H/F684H、Y17D/F684H、G54D/A97V/A118N/N307E/G694N/L727E/A738E、V68A/L98V/R129E/R136S、V68A/L98V/R129E/R136S/R154H、V68A/L98V/R129E/R136S/R154H/E534H、V68A/L98V/R129E/R154H/E534H、V68A/L98V/R129E/R154H/A635S、V68A/L98V/R136S/R154H/E534H/A635S、V68A/L98V/R136S/R154H/A635S、V68A/L98V/R154H、V68A/L98V/R154H/E534H、V68A/L98V/R154H/E534H/A635S、V68A/R129E/R136S、V68A/R129E/R136S/R154H、V68A/R129E/R136S/R154H/I464F/A635S、V68A/R129E/R136S/E534H/A635S、V68A/R129E/R154H、V68A/R129E/R154H/D765H、V68A/R136S/R154H/E534H/A635S、V68A/R136S/E534H/A635S、V68A/R136S/A635S、V68A/R154H、V68A/R154H/E534H/A635S、V68A/R154H/A635S、A97V/A118N/H442N/G694N/L727E/A738E、L98V/R129E/R136S/R154H、L98V/R129E/R136S/R154H/A635S、L98V/R129E/R136S/E534H、L98V/R129E/R136S/A635S、L98V/R129E/R154H、L98V/R129E/R154H/E534H/A635S、L98V/R129E/E534H/A635S、L98V/R136S/R154H/A635S、L98V/R136S/E534H/A635S、L98V/R136S/A635S、L98V/R154H、L98V/R154H/E534H、A122D、A122E、R129E/R136S、R129E/R136S/R154H/A635S、R129E/R136S/E534H、R129E/R136S/A635S、R129E/R154H/E534H、R129E/R154H/A635S、R129E/A635S、R132C/R136S/R154H/E534H/A635S、R136S/R154H/A635S、R136S/E534H/A635S、R136S/G603D、R136S/A635S、R154H、R154H/A635S、G157A、G157F、F160A、F160E、F160M、F160N、F160S、F160W、S161Q、R167E、A253G、A253T、A253V、P285A、Q381S、F519A、F519G、F519L、F519S、F519T、R550I、R550M、R550Q、R550S、L563V、S564A、A635D、A635E、A635R和P785D,其中所述位置参照SEQ ID NO:1392来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564和1566。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564和1566。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564和1566。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17/54/97/136/329/550/684/738、17/54/97/329/524/684、17/54/161/519/727/738、17/54/524/550/727、17/161/434/524/766、17/434/524/684、17/434/738、17/442/524/550/684/721、17/727、17/738、54/97/161/434/442、54/97/434/524/550/684/727、54/136/442/550、54/434/524/738、97/136/519/550/727/738和329/550/684/727/738,其中所述位置参照SEQ ID NO:1456来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17D/54D/97V/136P/329Q/550I/684H/738E、17D/54D/97V/329Q/524T/684H、17D/54D/161T/519T/727E/738E、17D/54D/524T/550I/727E、17D/161T/434H/524T/766H、17D/434H/524T/684H、17D/434H/738E、17D/442N/524T/550I/684H/721K、17D/727E、17D/738E、54D/97V/161T/434H/442N、54D/97V/434H/524T/550I/684H/727E、54D/136P/442N/550I、54D/434H/524T/738E、97V/136P/519T/550I/727E/738E和329Q/550I/684H/727E/738E,其中所述位置参照SEQ ID NO:1456来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Y17D/G54D/A97V/R136P/E329Q/R550I/F684H/A738E、Y17D/G54D/A97V/E329Q/A524T/F684H、Y17D/G54D/S161T/F519T/L727E/A738E、Y17D/G54D/A524T/R550I/L727E、Y17D/S161T/Y434H/A524T/R766H、Y17D/Y434H/A524T/F684H、Y17D/Y434H/A738E、Y17D/H442N/A524T/R550I/F684H/E721K、Y17D/L727E、Y17D/A738E、G54D/A97V/S161T/Y434H/H442N、G54D/A97V/Y434H/A524T/R550I/F684H/L727E、G54D/R136P/H442N/R550I、G54D/Y434H/A524T/A738E、A97V/R136P/F519T/R550I/L727E/A738E和E329Q/R550I/F684H/L727E/A738E,其中所述位置参照SEQ IDNO:1456来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596和1598。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596和1598。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596和1598。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/137/356/745、14/570、14/570/745、26/117/365、26/164/165/213/586、71/158/222/356、71/222/236、71/319/356/606、117/158/213/332/608、117/164/707、117/213/365/517、117/311/332、117/608、122、122/160/161/167/550、122/160/161/282/381/550、122/160/161/282/381/550/636、122/160/161/282/550、122/160/161/550/636、122/160/167/282/381/550/636、122/160/282/381、122/160/282/381/550、122/160/282/550、122/160/381/550、122/160/381/550/636、122/160/550、122/160/550/636、122/161/550、122/167、122/167/550、122/282/381/550、122/282/550、122/282/550/636、122/381/706、122/550、137/319/570、157/253/519、160/161、160/161/282/381/550、160/161/282/550、160/161/550/636/735、160/167/282/381/636、160/282、160/282/381/550、160/282/550/636、160/381/550/636/681、161/282/550/636、161/381/550、165/311、167/282/636、167/550、213/365/517/707、236、253/519、253/519/563、253/519/635、253/563/635、270/322/517、270/367/452/517/613/700/750、270/452/517/700/750、270/570、282/381/550、282/550、356/570、381/550、517、517/562/750、517/640、519/563、550、550/636和562,其中所述位置参照SEQ ID NO:1582来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14D/137K/356H/745L、14D/570H、14D/570H/745L、26E/117E/365E、26E/164E/165E/213E/586E、71Q/158T/222L/356H、71Q/222L/236S、71Q/319K/356H/606S、117E/158E/213E/332E/608E、117E/164E/707E、117E/213E/365E/517E、117E/311E/332E、117E/608E、122D、122D/160M/282M/550S、122D/160W/161Q/167E/550M、122D/160W/161Q/282M/550Q、122D/160W/282M/381S/550M、122D/160W/550M、122D/160W/550Q/636Q、122D/167E、122D/282M/381S/550M、122D/282M/550Q、122D/550M、122E/160I/167E/282M/381H/550Q/636Q、122E/160M/161Q/282M/381S/550M/636Q、122E/160M/550Q/636Q、122E/160W/161Q/167E/550S、122E/160W/161Q/282M/381S/550S、122E/160W/161Q/550M/636Q、122E/160W/282M/381S、122E/160W/381S/550M/636Q、122E/160W/381S/550Q、122E/161Q/550Q、122E/167E/550M、122E/282M/550M/636Q、122E/282M/550Q、122E/282M/550S、122E/381S/706K、122E/550Q、137K/319K/570H、157A/253T/519L、160M/161Q、160M/161Q/282M/381S/550M、160M/161Q/282M/550Q、160M/282M、160M/282M/381S/550M、160M/282M/550M/636Q、160W/161Q/282M/550M、160W/161Q/282M/550Q、160W/161Q/550Q/636Q/735V、160W/167E/282M/381S/636Q、160W/282M/381S/550M、160W/381S/550Q/636Q/681V、161Q/282M/550Q/636Q、161Q/381S/550Q、165E/311E、167E/282M/636Q、167E/550Q、213E/365E/517E/707E、236S、253G/519L、253T/519L、253T/519L/563V、253T/519L/635D、253T/519L/635E、253T/563V/635R、253V/519G、253V/519L、270L/322V/517A、270L/367V/452Y/517A/613Q/700F/750M、270L/452Y/517A/700F/750M、270L/570H、282M/381S/550S、282M/550Q、356H/570H、381S/550Q、381S/550S、517A、517A/562I/750M、517A/640N、519L/563V、550M/636Q、550Q和562I,其中所述位置参照SEQ ID NO:1582来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:R14D/R137K/R356H/R745L、R14D/R570H、R14D/R570H/R745L、S26E/G117E/H365E、S26E/A164E/A165E/A213E/R586E、R71Q/R158T/R222L/R356H、R71Q/R222L/R236S、R71Q/R319K/R356H/R606S、G117E/R158E/A213E/G332E/A608E、G117E/A164E/A707E、G117E/A213E/H365E/P517E、G117E/Q311E/G332E、G117E/A608E、A122D、A122D/F160M/L282M/R550S、A122D/F160W/T161Q/R167E/R550M、A122D/F160W/T161Q/L282M/R550Q、A122D/F160W/L282M/Q381S/R550M、A122D/F160W/R550M、A122D/F160W/R550Q/L636Q、A122D/R167E、A122D/L282M/Q381S/R550M、A122D/L282M/R550Q、A122D/R550M、A122E/F160I/R167E/L282M/Q381H/R550Q/L636Q、A122E/F160M/T161Q/L282M/Q381S/R550M/L636Q、A122E/F160M/R550Q/L636Q、A122E/F160W/T161Q/R167E/R550S、A122E/F160W/T161Q/L282M/Q381S/R550S、A122E/F160W/T161Q/R550M/L636Q、A122E/F160W/L282M/Q381S、A122E/F160W/Q381S/R550M/L636Q、A122E/F160W/Q381S/R550Q、A122E/T161Q/R550Q、A122E/R167E/R550M、A122E/L282M/R550M/L636Q、A122E/L282M/R550Q、A122E/L282M/R550S、A122E/Q381S/E706K、A122E/R550Q、R137K/R319K/R570H、G157A/A253T/T519L、F160M/T161Q、F160M/T161Q/L282M/Q381S/R550M、F160M/T161Q/L282M/R550Q、F160M/L282M、F160M/L282M/Q381S/R550M、F160M/L282M/R550M/L636Q、F160W/T161Q/L282M/R550M、F160W/T161Q/L282M/R550Q、F160W/T161Q/R550Q/L636Q/A735V、F160W/R167E/L282M/Q381S/L636Q、F160W/L282M/Q381S/R550M、F160W/Q381S/R550Q/L636Q/A681V、T161Q/L282M/R550Q/L636Q、T161Q/Q381S/R550Q、A165E/Q311E、R167E/L282M/L636Q、R167E/R550Q、A213E/H365E/P517E/A707E、R236S、A253G/T519L、A253T/T519L、A253T/T519L/L563V、A253T/T519L/S635D、A253T/T519L/S635E、A253T/L563V/S635R、A253V/T519G、A253V/T519L、V270L/I322V/P517A、V270L/I367V/F452Y/P517A/E613Q/I700F/L750M、V270L/F452Y/P517A/I700F/L750M、V270L/R570H、L282M/Q381S/R550S、L282M/R550Q、R356H/R570H、Q381S/R550Q、Q381S/R550S、P517A、P517A/L562I/L750M、P517A/T640N、T519L/L563V、R550M/L636Q、R550Q和L562I,其中所述位置参照SEQ ID NO:1582来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770和1772。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770和1772。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770和1772。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:63/536、117/122/270/540/681、181/536/548、181/536/548/705、181/548/705、270/681、347/532、347/536/548/705、407/570/681、407/681、536、536/548、536/548/699、536/705、548、548/580、548/705、580、681、699和705,其中所述位置参照SEQ ID NO:1764来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:63I/536L、117E/122D/270L/540M/681A、181N/536L/548P、181N/536L/548P/705M、181N/548P/705P、270L/681A、347R/532Y、347R/536L/548P/705P、407I/570H/681A、407T/681A、536L、536L/548P、536L/548P/699F、536L/705M、548P、548P/580M、548P/705P、580M、681A、699F、705M和705P,其中所述位置参照SEQ ID NO:1764来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:A63I/E536L、G117E/A122D/V270L/L540M/V681A、G181N/E536L/A548P、G181N/E536L/A548P/H705M、G181N/A548P/H705P、V270L/V681A、N347R/S532Y、N347R/E536L/A548P/H705P、L407I/R570H/V681A、L407T/V681A、E536L、E536L/A548P、E536L/A548P/H699F、E536L/H705M、A548P、A548P/L580M、A548P/H705P、L580M、V681A、H699F、H705M和H705P,其中所述位置参照SEQ ID NO:1764来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818和1820。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818和1820。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818和1820。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:13、17、18、30、37、52、57、60、71、85、87、90、98、99、118、129、164、180、183、347/434/517/562/640/681、347/434/532/562/640/681、347/434/550/562/681、347/434/681、347/517/532/681、347/532/550/640/681/699、347/536/562/681、347/550/580/681、347/550/681、347/681、365、388、389、415、433、434/517/532/681、517/681、531、532/681、535、536/580/681、539、562/681、589、606、608、707、711、727、738、748、765、769和789,其中所述位置参照SEQ ID NO:1804来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:13H、13K、13N、17R、18G、30H、37G、37R、52G、52P、52R、52W、57R、57W、60L、71G、71Q、85H、87H、87L、90H、98L、99I、118G、118N、129A、129G、129T、164S、164T、180P、183P、347R/434H/517A/562I/640N/681A、347R/434H/532Y/562I/640N/681A、347R/434H/550I/562I/681A、347R/434H/681A、347R/517A/532Y/681A、347R/532Y/550I/640N/681A/699F、347R/536L/562I/681A、347R/550I/580M/681A、347R/550I/681A、347R/681A、365W、388K、388R、389G、415H、433K、433P、434H/517A/532Y/681A、517A/681A、531A、531R、531T、532Y/681A、535A、535H、535S、536L/580M/681A、539A、539R、562I/681A、589S、606A、606H、606I、606L、606M、606Q、606V、608P、707G、711K、727K、738S、748T、765A、765S、769K、769R、789N和789R,其中所述位置参照SEQ ID NO:1804来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:P13H、P13K、P13N、D17R、A18G、S30H、Q37G、Q37R、D52G、D52P、D52R、D52W、P57R、P57W、D60L、R71G、R71Q、V85H、E87H、E87L、R90H、V98L、E99I、A118G、A118N、E129A、E129G、E129T、A164S、A164T、D180P、N183P、N347R/Y434H/P517A/L562I/T640N/V681A、N347R/Y434H/S532Y/L562I/T640N/V681A、N347R/Y434H/Q550I/L562I/V681A、N347R/Y434H/V681A、N347R/P517A/S532Y/V681A、N347R/S532Y/Q550I/T640N/V681A/H699F、N347R/E536L/L562I/V681A、N347R/Q550I/L580M/V681A、N347R/Q550I/V681A、N347R/V681A、H365W、L388K、L388R、A389G、K415H、L433K、L433P、Y434H/P517A/S532Y/V681A、P517A/V681A、S531A、S531R、S531T、S532Y/V681A、P535A、P535H、P535S、E536L/L580M/V681A、S539A、S539R、L562I/V681A、G589S、R606A、R606H、R606I、R606L、R606M、R606Q、R606V、A608P、A707G、R711K、E727K、E738S、E748T、D765A、D765S、Q769K、Q769R、A789N和A789R,其中所述位置参照SEQ ID NO:1804来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982和1984。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982和1984。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982和1984。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17/52/87/118/129/388/589/738/765、17/52/87/118/129/589/738、17/52/87/118/129/589/738/765、17/52/87/118/129/589/765、17/52/87/129/388/589、17/52/87/129/388/589/738、17/52/87/129/738、17/52/87/388/589/765、17/52/87/589/738/765、17/52/118/129/265/589/765、17/52/118/129/388/589/738/765、17/52/118/129/589/738/765、17/52/118/129/738/765、17/52/118/388/589/738、17/52/118/388/589/738/765、17/52/118/388/738/765、17/52/129/388/589/738、17/52/129/388/589/738/765、17/52/129/589、17/52/129/589/738、17/52/129/589/765、17/52/129/653/738/765、17/52/129/738、17/52/129/738/765、17/52/388/589/738、17/52/388/589/738/765、17/52/589/738/765、17/52/589/765、17/87/118/388/738、17/87/129/388/738、17/118/129/388/738/765、17/129/589、17/129/589/738、17/129/589/738/765、17/129/738/765、17/388/589/738、17/589/738、17/589/765、17/738/765、52/84/129/388/738/765、52/87/118/129/388/765、52/87/118/388/589/738、52/87/118/589/738/765、52/87/129/388/738/765、52/87/129/765、52/87/589/738、52/87/738、52/118/129/589/738、52/118/129/765、52/118/388/589/738、52/118/388/738/765、52/129/589/738/765、52/129/589/765、52/129/738、52/388/738/765、52/589/738、52/589/738/765、52/738/765、84/129/589/738/765、87/118/129/765、87/129/388/589和589/738/765,其中所述位置参照SEQ ID NO:1840来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17R/52G/87H/118N/129G/589S/738S、17R/52G/87H/118N/129T/589S/765S、17R/52G/87H/129T/388K/589S/738S、17R/52G/87H/129T/738S、17R/52G/87H/388K/589S/765S、17R/52G/118N/129T/388K/589S/738S/765S、17R/52G/118N/388K/738S/765S、17R/52G/129G/589S/738S、17R/52G/129T/388K/589S/738S、17R/52G/129T/589S、17R/52G/129T/653H/738S/765S、17R/52G/589S/765S、17R/52P/87H/118N/129T/388K/589S/738S/765S、17R/52P/87H/118N/129T/589S/738S/765S、17R/52P/87H/129G/388K/589S、17R/52P/87H/129T/388K/589S/738S、17R/52P/87H/589S/738S/765S、17R/52P/118N/129T/265T/589S/765S、17R/52P/118N/129T/589S/738S/765S、17R/52P/118N/129T/738S/765S、17R/52P/118N/388K/589S/738S、17R/52P/118N/388K/589S/738S/765S、17R/52P/129G/388K/589S/738S/765S、17R/52P/129G/738S/765S、17R/52P/129T/589S/765S、17R/52P/129T/738S、17R/52P/388K/589S/738S、17R/52P/388K/589S/738S/765S、17R/52P/589S/738S/765S、17R/87H/118N/388K/738S、17R/87H/129T/388K/738S、17R/118N/129T/388K/738S/765S、17R/129T/589S、17R/129T/589S/738S、17R/129T/589S/738S/765S、17R/129T/738S/765S、17R/388K/589S/738S、17R/589S/738S、17R/589S/765S、17R/738S/765S、52G/84A/129T/388K/738S/765S、52G/87H/118N/589S/738S/765S、52G/87H/129T/388K/738S/765S、52G/87H/738S、52G/118N/388K/589S/738S、52G/118N/388K/738S/765S、52G/129G/589S/765S、52G/388K/738S/765S、52G/589S/738S/765S、52G/738S/765S、52P/87H/118N/129T/388K/765S、52P/87H/118N/388K/589S/738S、52P/87H/129G/765S、52P/87H/589S/738S、52P/118N/129T/589S/738S、52P/118N/129T/765S、52P/129T/589S/738S/765S、52P/129T/738S、52P/589S/738S、52P/589S/738S/765S、84A/129T/589S/738S/765S、87H/118N/129T/765S、87H/129T/388K/589S和589S/738S/765S,其中所述位置参照SEQ ID NO:1840来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:D17R/D52G/E87H/A118N/E129G/G589S/E738S、D17R/D52G/E87H/A118N/E129T/G589S/D765S、D17R/D52G/E87H/E129T/L388K/G589S/E738S、D17R/D52G/E87H/E129T/E738S、D17R/D52G/E87H/L388K/G589S/D765S、D17R/D52G/A118N/E129T/L388K/G589S/E738S/D765S、D17R/D52G/A118N/L388K/E738S/D765S、D17R/D52G/E129G/G589S/E738S、D17R/D52G/E129T/L388K/G589S/E738S、D17R/D52G/E129T/G589S、D17R/D52G/E129T/R653H/E738S/D765S、D17R/D52G/G589S/D765S、D17R/D52P/E87H/A118N/E129T/L388K/G589S/E738S/D765S、D17R/D52P/E87H/A118N/E129T/G589S/E738S/D765S、D17R/D52P/E87H/E129G/L388K/G589S、D17R/D52P/E87H/E129T/L388K/G589S/E738S、D17R/D52P/E87H/G589S/E738S/D765S、D17R/D52P/A118N/E129T/S265T/G589S/D765S、D17R/D52P/A118N/E129T/G589S/E738S/D765S、D17R/D52P/A118N/E129T/E738S/D765S、D17R/D52P/A118N/L388K/G589S/E738S、D17R/D52P/A118N/L388K/G589S/E738S/D765S、D17R/D52P/E129G/L388K/G589S/E738S/D765S、D17R/D52P/E129G/E738S/D765S、D17R/D52P/E129T/G589S/D765S、D17R/D52P/E129T/E738S、D17R/D52P/L388K/G589S/E738S、D17R/D52P/L388K/G589S/E738S/D765S、D17R/D52P/G589S/E738S/D765S、D17R/E87H/A118N/L388K/E738S、D17R/E87H/E129T/L388K/E738S、D17R/A118N/E129T/L388K/E738S/D765S、D17R/E129T/G589S、D17R/E129T/G589S/E738S、D17R/E129T/G589S/E738S/D765S、D17R/E129T/E738S/D765S、D17R/L388K/G589S/E738S、D17R/G589S/E738S、D17R/G589S/D765S、D17R/E738S/D765S、D52G/G84A/E129T/L388K/E738S/D765S、D52G/E87H/A118N/G589S/E738S/D765S、D52G/E87H/E129T/L388K/E738S/D765S、D52G/E87H/E738S、D52G/A118N/L388K/G589S/E738S、D52G/A118N/L388K/E738S/D765S、D52G/E129G/G589S/D765S、D52G/L388K/E738S/D765S、D52G/G589S/E738S/D765S、D52G/E738S/D765S、D52P/E87H/A118N/E129T/L388K/D765S、D52P/E87H/A118N/L388K/G589S/E738S、D52P/E87H/E129G/D765S、D52P/E87H/G589S/E738S、D52P/A118N/E129T/G589S/E738S、D52P/A118N/E129T/D765S、D52P/E129T/G589S/E738S/D765S、D52P/E129T/E738S、D52P/G589S/E738S、D52P/G589S/E738S/D765S、G84A/E129T/G589S/E738S/D765S、E87H/A118N/E129T/D765S、E87H/E129T/L388K/G589S和G589S/E738S/D765S,其中所述位置参照SEQ ID NO:1840来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14、15、18/362、20、24、26、33、33/154、46、50、54、58、59、59/72、79、81、92、93、97/154、104、105、130、134、154、165、175、185、212、213、218、241、256、263、316、319、349、360、362、364、390、393、434、480、498、530、534、534/739、542、603和652,其中所述位置参照SEQ ID NO:1840来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14K、15A、15I、15P、18V/362A、20M、24S、26A、26E、26I、26T、33H/154C、33L、33P、33S、46G、46I、46R、46T、46V、50R、54M、58M、59A、59C、59N/72N、59R、59S、59V、59W、79H、79Y、81G、81I、81L、92G、93T、97V/154S、104T、105S、130Y、134A、134P、154A、154E、154R、154S、165I、165L、165T、175G、175T、185L、212Y、213V、218A、218N、218Q、218S、218T、218V、241T、256G、263S、263Y、316H、316T、319S、349D、349R、349T、360D、360E、360R、362E、364S、390M、393H、434G、434R、480P、480V、498L、498Q、530F、534G、534K、534L、534R、534T、534W、534W/739K、542W、603A、603E、603H、603Q、603S、652K、652L、652R、652S和652T,其中所述位置参照SEQ ID NO:1840来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:R14K、S15A、S15I、S15P、A18V/I362A、L20M、V24S、S26A、S26E、S26I、S26T、Q33H/H154C、Q33L、Q33P、Q33S、Q46G、Q46I、Q46R、Q46T、Q46V、G50R、D54M、L58M、E59A、E59C、E59N/D72N、E59R、E59S、E59V、E59W、W79H、W79Y、P81G、P81I、P81L、H92G、V93T、A97V/H154S、D104T、E105S、D130Y、V134A、V134P、H154A、H154E、H154R、H154S、A165I、A165L、A165T、S175G、S175T、M185L、W212Y、A213V、D218A、D218N、D218Q、D218S、D218T、D218V、L241T、S256G、M263S、M263Y、V316H、V316T、R319S、Q349D、Q349R、Q349T、G360D、G360E、G360R、I362E、P364S、E390M、S393H、Y434G、Y434R、I480P、I480V、E498L、E498Q、P530F、E534G、E534K、E534L、E534R、E534T、E534W、E534W/E739K、F542W、G603A、G603E、G603H、G603Q、G603S、G652K、G652L、G652R、G652S和G652T,其中所述位置参照SEQ ID NO:1840来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316和2318。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316和2318。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316和2318。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:57/71/87/347/434/562/606、57/71/129/180/434/536/562、57/71/129/434/531/536/562、57/71/129/531/532/536/539/606、57/71/562/606/711/789、57/71/789、57/87/180/531/532/562/606/612/711、57/87/347/562、57/90/129/562、57/90/129/562/711、57/96/129/180/531/532/550/562、57/129/347/531/532/539/562/711/747、57/129/347/536/550/562/711/789、57/129/347/550/711、57/129/531/539/562/789、57/129/536/606/789、57/129/606、57/180/562、57/180/562/606/612、57/347/434/531/532/539/789、57/434/550/562/606/612/789、57/531/532/536/562、57/562/606/711、57/562/711、71/129/180/347/531/539/550、71/129/180/434/532/536/539/711/789、71/129/531、71/129/606、71/347/532/550/562/711、71/347/536/562/612/789、71/536/539/562、87/189/532/536/562/711/789、87/347/531/606/789、87/347/536/539/550、90/129/539/550/606、129/180/434/562/711/789、129/180/606/711/789、129/347/562、129/536/539/562、129/539/562/789、129/550、129/550/562、129/562/606/711、180/532、180/550/606、347/531/550/711、347/536/539/550/711/789、347/536/562/606/612、347/550/562/606、434/531/539/550/562/711、434/550、531/532/536/539/562/711/789、531/532/536/550/562/606/789、531/532/562/606/711、532/539/550和562/711,其中所述位置参照SEQ ID NO:2064来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:57W/71Q/87H/347R/434H/562I/606H、57W/71Q/129G/531R/532Y/536L/539R/606H、57W/71Q/129T/180P/434H/536L/562I、57W/71Q/129T/434H/531R/536L/562I、57W/71Q/562I/606M/711K/789N、57W/71Q/789N、57W/87H/180P/531R/532Y/562I/606M/612A/711K、57W/87H/347R/562I、57W/90H/129G/562I、57W/90H/129T/562I/711K、57W/96Q/129T/180P/531R/532Y/550I/562I、57W/129G/531R/539R/562I/789N、57W/129G/536L/606M/789N、57W/129T/347R/531R/532Y/539R/562I/711K/747V、57W/129T/347R/536L/550I/562I/711K/789N、57W/129T/347R/550I/711K、57W/129T/606M、57W/180P/562I、57W/180P/562I/606H/612A、57W/347R/434H/531R/532Y/539R/789N、57W/434H/550I/562I/606H/612A/789N、57W/531R/532Y/536L/562I、57W/562I/606M/711K、57W/562I/711K、71Q/129T/180P/347R/531R/539R/550I、71Q/129T/180P/434H/532Y/536L/539R/711K/789N、71Q/129T/531R、71Q/129T/606M、71Q/347R/532Y/550I/562I/711K、71Q/347R/536L/562I/612A/789N、71Q/536L/539R/562I、87H/189D/532Y/536L/562I/711K/789N、87H/347R/531R/606M/789N、87H/347R/536L/539R/550I、90H/129T/539R/550I/606H、129G/550I、129G/550I/562I、129G/562I/606M/711K、129T/180P/434H/562I/711K/789N、129T/180P/606M/711K/789N、129T/347R/562I、129T/536L/539R/562I、129T/539R/562I/789N、129T/550I/562I、180P/532Y、180P/550I/606M、347R/531R/550I/711K、347R/536L/539R/550I/711K/789N、347R/536L/562I/606M/612A、347R/550I/562I/606H、434H/531R/539R/550I/562I/711K、434H/550I、531R/532Y/536L/539R/562I/711K/789N、531R/532Y/536L/550I/562I/606M/789N、531R/532Y/562I/606H/711K、532Y/539R/550I和562I/711K,其中所述位置参照SEQ ID NO:2064来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:P57W/R71Q/E87H/N347R/Y434H/L562I/R606H、P57W/R71Q/E129G/S531R/S532Y/E536L/S539R/R606H、P57W/R71Q/E129T/D180P/Y434H/E536L/L562I、P57W/R71Q/E129T/Y434H/S531R/E536L/L562I、P57W/R71Q/L562I/R606M/R711K/A789N、P57W/R71Q/A789N、P57W/E87H/D180P/S531R/S532Y/L562I/R606M/E612A/R711K、P57W/E87H/N347R/L562I、P57W/R90H/E129G/L562I、P57W/R90H/E129T/L562I/R711K、P57W/L96Q/E129T/D180P/S531R/S532Y/Q550I/L562I、P57W/E129G/S531R/S539R/L562I/A789N、P57W/E129G/E536L/R606M/A789N、P57W/E129T/N347R/S531R/S532Y/S539R/L562I/R711K/A747V、P57W/E129T/N347R/E536L/Q550I/L562I/R711K/A789N、P57W/E129T/N347R/Q550I/R711K、P57W/E129T/R606M、P57W/D180P/L562I、P57W/D180P/L562I/R606H/E612A、P57W/N347R/Y434H/S531R/S532Y/S539R/A789N、P57W/Y434H/Q550I/L562I/R606H/E612A/A789N、P57W/S531R/S532Y/E536L/L562I、P57W/L562I/R606M/R711K、P57W/L562I/R711K、R71Q/E129T/D180P/N347R/S531R/S539R/Q550I、R71Q/E129T/D180P/Y434H/S532Y/E536L/S539R/R711K/A789N、R71Q/E129T/S531R、R71Q/E129T/R606M、R71Q/N347R/S532Y/Q550I/L562I/R711K、R71Q/N347R/E536L/L562I/E612A/A789N、R71Q/E536L/S539R/L562I、E87H/G189D/S532Y/E536L/L562I/R711K/A789N、E87H/N347R/S531R/R606M/A789N、E87H/N347R/E536L/S539R/Q550I、R90H/E129T/S539R/Q550I/R606H、E129G/Q550I、E129G/Q550I/L562I、E129G/L562I/R606M/R711K、E129T/D180P/Y434H/L562I/R711K/A789N、E129T/D180P/R606M/R711K/A789N、E129T/N347R/L562I、E129T/E536L/S539R/L562I、E129T/S539R/L562I/A789N、E129T/Q550I/L562I、D180P/S532Y、D180P/Q550I/R606M、N347R/S531R/Q550I/R711K、N347R/E536L/S539R/Q550I/R711K/A789N、N347R/E536L/L562I/R606M/E612A、N347R/Q550I/L562I/R606H、Y434H/S531R/S539R/Q550I/L562I/R711K、Y434H/Q550I、S531R/S532Y/E536L/S539R/L562I/R711K/A789N、S531R/S532Y/E536L/Q550I/L562I/R606M/A789N、S531R/S532Y/L562I/R606H/R711K、S532Y/S539R/Q550I和L562I/R711K,其中所述位置参照SEQ ID NO:2064来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21、25/112、41、89、91、112、186、200、226、259、318、330、485、487、641、674、684、688、763和764,其中所述位置参照SEQ ID NO:2064来编号。
在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21Q、25T/112W、41K、89L、89M、91C、91G、112Q、112R、186V、200A、226V、259G、318A、330A、485A、485S、487I、487K、487R、487T、487V、641L、674A、684G、684H、684M、684T、688A、688F、688G、688H、688Q、763L和764R,其中所述位置参照SEQ ID NO:2064来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:R21Q、A25T/G112W、A41K、V89L、V89M、I91C、I91G、G112Q、G112R、L186V、V200A、P226V、D259G、P318A、S330A、G485A、G485S、Q487I、Q487K、Q487R、Q487T、Q487V、V641L、S674A、F684G、F684H、F684M、F684T、L688A、L688F、L688G、L688H、L688Q、V763L和L764R,其中所述位置参照SEQ ID NO:2064来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500和2502。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500和2502。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500和2502。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:33/47/59/81/175/530/534/550/606、33/58/59/81/130/480/530/534/550/652、33/58/59/480/530/534/550、33/58/154/480/534/550/603/606、33/59/480/530/534/550/606、33/79/81/175/530/534、33/79/81/175/530/534/603、33/79/154/480/530/534/550、33/81/130/480/530/534/550、33/81/175/530/534/542/550/652、33/130/530/534/550、33/154/480/530/534/603/606、33/154/534、33/530/534/550、58/59/79/175/480/534/550/652、59/154/530/534/550、79/81/480/530/534/550/603/606/652、81/480/530/534/550和130/480/530/534/550/603/606,其中所述位置参照SEQ ID NO:2432来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:33H/47P/59A/81L/175G/530F/534W/550I/606M、33H/58M/59A/81G/130Y/480V/530F/534W/550I/652K、33H/58M/59A/480P/530F/534W/550I、33H/58M/154A/480P/534W/550I/603A/606M、33H/59A/480P/530F/534W/550I/606M、33H/79H/81G/175G/530F/534W、33H/79H/81L/175G/530F/534W/603Q、33H/79H/154A/480P/530F/534W/550I、33H/81G/130Y/480V/530F/534W/550I、33H/81I/175G/530F/534W/542W/550I/652R、33H/130Y/530F/534W/550I、33H/154A/480P/530F/534W/603Q/606M、33H/154A/534W、33H/530F/534W/550I、58M/59A/79H/175G/480P/534W/550I/652R、59A/154A/530F/534W/550I、79H/81I/480P/530F/534W/550I/603E/606M/652R、81G/480V/530F/534W/550I和130Y/480V/530F/534W/550I/603Q/606M,其中所述位置参照SEQ ID NO:2432来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q33H/L47P/E59A/P81L/S175G/P530F/E534W/Q550I/R606M、Q33H/L58M/E59A/P81G/D130Y/I480V/P530F/E534W/Q550I/G652K、Q33H/L58M/E59A/I480P/P530F/E534W/Q550I、Q33H/L58M/H154A/I480P/E534W/Q550I/G603A/R606M、Q33H/E59A/I480P/P530F/E534W/Q550I/R606M、Q33H/W79H/P81G/S175G/P530F/E534W、Q33H/W79H/P81L/S175G/P530F/E534W/G603Q、Q33H/W79H/H154A/I480P/P530F/E534W/Q550I、Q33H/P81G/D130Y/I480V/P530F/E534W/Q550I、Q33H/P81I/S175G/P530F/E534W/F542W/Q550I/G652R、Q33H/D130Y/P530F/E534W/Q550I、Q33H/H154A/I480P/P530F/E534W/G603Q/R606M、Q33H/H154A/E534W、Q33H/P530F/E534W/Q550I、L58M/E59A/W79H/S175G/I480P/E534W/Q550I/G652R、E59A/H154A/P530F/E534W/Q550I、W79H/P81I/I480P/P530F/E534W/Q550I/G603E/R606M/G652R、P81G/I480V/P530F/E534W/Q550I和D130Y/I480V/P530F/E534W/Q550I/G603Q/R606M,其中所述位置参照SEQ ID NO:2432来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:25、42、70、75、77、106、199、265、267、380、410、561、642和758,其中所述位置参照SEQ ID NO:2432来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:25E、25G、25L、42H、42S、42T、70H、70N、70R、70S、70V、75T、75W、77L、77W、106W、199A、265A、265Q、267I、380T、410S、561I、561V、642V、758Q和758R,其中所述位置参照SEQ ID NO:2432来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:A25E、A25G、A25L、D42H、D42S、D42T、F70H、F70N、F70R、F70S、F70V、M75T、M75W、F77L、F77W、Y106W、T199A、S265A、S265Q、V267I、A380T、T410S、L561I、L561V、A642V、G758Q和G758R,其中所述位置参照SEQ ID NO:2432来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592和2594。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592和2594。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592和2594。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:41、41/71、41/71/112、41/71/112/259/485/487/684/688、41/71/112/259/485/688、41/71/259/485/532、41/71/485、41/71/485/532/684、41/71/487、41/71/487/532/684、41/71/532、41/71/532/684、41/71/684、41/84/259/485/487、41/91/112/485、41/91/112/485/487/532/684、41/91/112/485/532/684、41/91/485、41/112、41/112/259/485/487、41/112/259/487/532/684、41/112/485/684、41/112/487/684、41/112/532、41/112/684/688、41/259/485、41/259/485/487、41/259/485/487/532/684、41/259/485/487/684/688、41/259/532、41/485、41/485/487、41/485/487/684/688、41/485/532、41/485/532/688、41/485/684/688、41/487/684、41/532、41/684、41/684/688、44/112/684/688、71/112/259/485/487/684、71/112/485/688、71/485/684/688、71/532、71/684/688、112、112/259、112/259/532/684/688、112/259/684/688、112/485/684、112/485/684/688、226/487/684/688、259/485/487/684、259/485/532、259/487/684/688、259/532、485、485/487、485/487/532、485/487/532/684、485/487/684、485/487/684/688、485/532、485/684、485/684/688、532、532/684/688、684和684/688,其中所述位置参照SEQ ID NO:2510来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:41K、41K/71Q、41K/71Q/112Q、41K/71Q/112Q/259G/485A/688Q、41K/71Q/112W/259G/485S/487R/684H/688Q、41K/71Q/259G/485A/532Y、41K/71Q/485A、41K/71Q/485A/532Y/684H、41K/71Q/487R、41K/71Q/487R/532Y/684H、41K/71Q/532Y、41K/71Q/532Y/684H、41K/71Q/684H、41K/84A/259G/485A/487I、41K/91C/112Q/485S、41K/91C/112Q/485S/487K/532Y/684H、41K/91C/112Q/485S/532Y/684H、41K/91C/485S、41K/112Q/259G/485S/487R、41K/112Q/259G/487R/532Y/684H、41K/112Q/485S/684H、41K/112Q/487I/684H、41K/112Q/532Y、41K/112Q/684H/688A、41K/112W、41K/259G/485A/487I、41K/259G/485A/487R/532Y/684H、41K/259G/485A/487R/684H/688A、41K/259G/485S、41K/259G/532Y、41K/485A、41K/485A/487K、41K/485A/487R、41K/485A/532Y、41K/485A/532Y/688G、41K/485S/487I/684M/688G、41K/485S/684M/688A、41K/487I/684M、41K/487R/684M、41K/532Y、41K/684H、41K/684M/688A、44C/112W/684H/688A、71Q/112Q/259G/485A/487R/684M、71Q/112W/485S/688A、71Q/485S/684M/688Q、71Q/532Y、71Q/684M/688A、112Q、112Q/259G/532Y/684M/688G、112Q/259G/684M/688Q、112Q/485S/684H、112Q/485S/684H/688G、112Q/485S/684M/688G、112W、112W/259G、226V/487I/684M/688A、259G/485S/487K/684H、259G/485S/532Y、259G/487I/684M/688G、259G/532Y、485A、485A/487R、485A/532Y、485A/684H/688G、485A/684M、485S、485S/487I/684H/688Q、485S/487I/684M、485S/487K/532Y、485S/487R/532Y/684H、485S/684M/688G、532Y、532Y/684H/688Q、684H和684M/688Q,其中所述位置参照SEQ ID NO:2510来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:A41K、A41K/R71Q、A41K/R71Q/G112Q、A41K/R71Q/G112Q/D259G/G485A/L688Q、A41K/R71Q/G112W/D259G/G485S/Q487R/F684H/L688Q、A41K/R71Q/D259G/G485A/S532Y、A41K/R71Q/G485A、A41K/R71Q/G485A/S532Y/F684H、A41K/R71Q/Q487R、A41K/R71Q/Q487R/S532Y/F684H、A41K/R71Q/S532Y、A41K/R71Q/S532Y/F684H、A41K/R71Q/F684H、A41K/G84A/D259G/G485A/Q487I、A41K/I91C/G112Q/G485S、A41K/I91C/G112Q/G485S/Q487K/S532Y/F684H、A41K/I91C/G112Q/G485S/S532Y/F684H、A41K/I91C/G485S、A41K/G112Q/D259G/G485S/Q487R、A41K/G112Q/D259G/Q487R/S532Y/F684H、A41K/G112Q/G485S/F684H、A41K/G112Q/Q487I/F684H、A41K/G112Q/S532Y、A41K/G112Q/F684H/L688A、A41K/G112W、A41K/D259G/G485A/Q487I、A41K/D259G/G485A/Q487R/S532Y/F684H、A41K/D259G/G485A/Q487R/F684H/L688A、A41K/D259G/G485S、A41K/D259G/S532Y、A41K/G485A、A41K/G485A/Q487K、A41K/G485A/Q487R、A41K/G485A/S532Y、A41K/G485A/S532Y/L688G、A41K/G485S/Q487I/F684M/L688G、A41K/G485S/F684M/L688A、A41K/Q487I/F684M、A41K/Q487R/F684M、A41K/S532Y、A41K/F684H、A41K/F684M/L688A、R44C/G112W/F684H/L688A、R71Q/G112Q/D259G/G485A/Q487R/F684M、R71Q/G112W/G485S/L688A、R71Q/G485S/F684M/L688Q、R71Q/S532Y、R71Q/F684M/L688A、G112Q、G112Q/D259G/S532Y/F684M/L688G、G112Q/D259G/F684M/L688Q、G112Q/G485S/F684H、G112Q/G485S/F684H/L688G、G112Q/G485S/F684M/L688G、G112W、G112W/D259G、P226V/Q487I/F684M/L688A、D259G/G485S/Q487K/F684H、D259G/G485S/S532Y、D259G/Q487I/F684M/L688G、D259G/S532Y、G485A、G485A/Q487R、G485A/S532Y、G485A/F684H/L688G、G485A/F684M、G485S、G485S/Q487I/F684H/L688Q、G485S/Q487I/F684M、G485S/Q487K/S532Y、G485S/Q487R/S532Y/F684H、G485S/F684M/L688G、S532Y、S532Y/F684H/L688Q、F684H和F684M/L688Q,其中所述位置参照SEQ ID NO:2510来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7/12、12、27、29、44、45、47、48、51、55、72、95、100、116、136、139、176、178、198、201、205、205/485、207、208、280、303、317、343、358、361、440、478、611、615、630、675、724、756和788,其中所述位置参照SEQ ID NO:2510来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7K/12L、12C、12N、12Q、12S、12V、27R、29A、29G、29L、29P、44L、44V、45A、45C、45G、45L、45S、45V、47C、47D、47I、47L、47N、47T、47V、48A、48V、51P、51S、55D、55S、72E、95D、95L、95N、95T、95V、100K、100P、100Q、116A、116F、136A、136F、136K、136N、136P、136Q、139K、176M、176R、176T、176V、178H、198A、198R、201S、205R/485S、205S、207K、208K、280G、303V、317I、343A、343N、358P、358S、361A、361L、361T、440R、478H、478I、478Q、611A、615C、615K、615L、615M、630M、675C、724G、724K、724S、756C和788K,其中所述位置参照SEQ ID NO:2510来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q7K/D12L、D12C、D12N、D12Q、D12S、D12V、Q27R、D29A、D29G、D29L、D29P、R44L、R44V、E45A、E45C、E45G、E45L、E45S、E45V、P47C、P47D、P47I、P47L、P47N、P47T、P47V、P48A、P48V、Y51P、Y51S、I55D、I55S、D72E、Q95D、Q95L、Q95N、Q95T、Q95V、E100K、E100P、E100Q、L116A、L116F、R136A、R136F、R136K、R136N、R136P、R136Q、R139K、L176M、L176R、L176T、L176V、R178H、Q198A、Q198R、Q201S、T205R/G485S、T205S、P207K、R208K、K280G、R303V、E317I、H343A、H343N、E358P、E358S、R361A、R361L、R361T、P440R、R478H、R478I、R478Q、R611A、R615C、R615K、R615L、R615M、L630M、S675C、H724G、H724K、H724S、V756C和H788K,其中所述位置参照SEQ ID NO:2510来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:7438、7440、7442、7444、7446、7448、7450、7452、7454、7456、7458、7460、7462、7464、7466、7468、7470、7472、7474、7476、7478、7480、7482、7484、7486、7488、7490、7492、7494、7496、7498、7500、7502、7504、7506、7508、7510、7512、7514、7516、7518、7520、7522、7524、7526、7528、7530、7532、7534、7536、7538、7540、7542、7544、7546、7548、7550、7552、7554、7556、7558、7560、7562、7564、7566、7568、7570、7572、7574、7576、7578、7580、7582、7584、7586、7588、7590、7592、7594、7596、7598、7600、7602、7604、7606、7608、7610、7612、7614、7616、7618、7620、7622、7624、7626、7628、7630、7632、7634、7636、7638、7640、7642、7644、7646、7648、7650、7652、7654、7656、7658、7660、7662、7664、7666、7668、7670、7672、7674、7676、7678、7680、7682、7684、7686、7688、7690、7692、7694、7696、7698、7700、7702、7704、7706、7708、7710、7712、7714、7716、7718、7720、7722、7724、7726、7728、7730、7732、7734、7736、7738、7740、7742、7744、7746、7748、7750、7752、7754、7756、7758、7760、7762和7764。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:7438、7440、7442、7444、7446、7448、7450、7452、7454、7456、7458、7460、7462、7464、7466、7468、7470、7472、7474、7476、7478、7480、7482、7484、7486、7488、7490、7492、7494、7496、7498、7500、7502、7504、7506、7508、7510、7512、7514、7516、7518、7520、7522、7524、7526、7528、7530、7532、7534、7536、7538、7540、7542、7544、7546、7548、7550、7552、7554、7556、7558、7560、7562、7564、7566、7568、7570、7572、7574、7576、7578、7580、7582、7584、7586、7588、7590、7592、7594、7596、7598、7600、7602、7604、7606、7608、7610、7612、7614、7616、7618、7620、7622、7624、7626、7628、7630、7632、7634、7636、7638、7640、7642、7644、7646、7648、7650、7652、7654、7656、7658、7660、7662、7664、7666、7668、7670、7672、7674、7676、7678、7680、7682、7684、7686、7688、7690、7692、7694、7696、7698、7700、7702、7704、7706、7708、7710、7712、7714、7716、7718、7720、7722、7724、7726、7728、7730、7732、7734、7736、7738、7740、7742、7744、7746、7748、7750、7752、7754、7756、7758、7760、7762和7764。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:7438、7440、7442、7444、7446、7448、7450、7452、7454、7456、7458、7460、7462、7464、7466、7468、7470、7472、7474、7476、7478、7480、7482、7484、7486、7488、7490、7492、7494、7496、7498、7500、7502、7504、7506、7508、7510、7512、7514、7516、7518、7520、7522、7524、7526、7528、7530、7532、7534、7536、7538、7540、7542、7544、7546、7548、7550、7552、7554、7556、7558、7560、7562、7564、7566、7568、7570、7572、7574、7576、7578、7580、7582、7584、7586、7588、7590、7592、7594、7596、7598、7600、7602、7604、7606、7608、7610、7612、7614、7616、7618、7620、7622、7624、7626、7628、7630、7632、7634、7636、7638、7640、7642、7644、7646、7648、7650、7652、7654、7656、7658、7660、7662、7664、7666、7668、7670、7672、7674、7676、7678、7680、7682、7684、7686、7688、7690、7692、7694、7696、7698、7700、7702、7704、7706、7708、7710、7712、7714、7716、7718、7720、7722、7724、7726、7728、7730、7732、7734、7736、7738、7740、7742、7744、7746、7748、7750、7752、7754、7756、7758、7760、7762和7764。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/25/55/95/208/358/440/517/788、12/45/47、12/45/47/48/51/136/142/630、12/45/47/51/136/139/630/758、12/45/47/136/139/142/675/758、12/45/51/136/139/630/675/756/758、12/45/51/630/756、12/48/51/136/139/758、12/136/139/142/756/758、12/136/142、12/630/756、25/29/208/440、25/100/154/208/440/517/705/788、25/517、29/208/361/517/788、42/198/199/480/532/539/561、42/198/532/561、42/198/532/561/724、42/199/480/532/561、42/259/480/561、42/259/480/652、42/480/561、42/480/561/724、42/561、47/51/136/756/758、55、55/410/440/603/788、55/517、55/517/788、70、70/642、77/176/487/615/642、95/603、106/199/539/561/652、116、136/139/142、154/361/440/517/603/788、176、198/199/480/561、198/199/480/561/724、198/199/561/724、198/480/561、198/480/724、199/532/539/561/652/724、259/480、267/611/642、280/440/517、380、480/561/652、480/561/652/724/764、480/724、517、532/539/561、532/561/724、603和642,其中所述位置参照SEQ ID NO:7506来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8R/25E/55D/95T/208K/358S/440V/517P/788K、12N/45A/47I/51P/136P/139K/630M/758R、12N/45A/51P/136P/139K/630M/675C/756C/758Q、12N/48A/51P/136Q/139K/758Q、12N/136Q/142N、12S/45A/51P/630M/756C、12S/630M/756C、12V/45A/47I/48A/51S/136Q/142N/630M、12V/45A/47I/136Q/139K/142N/675C/758Q、12V/45A/47L、12V/136Q/139K/142N/756C/758Q、25E/29P/208K/440R、25E/100K/154A/208K/440R/517P/705M/788K、25E/517P、29P/208K/361T/517P/788K、42T/198R/199A/480V/532Y/539R/561V、42T/198R/532Y/561I/724K、42T/198R/532Y/561V、42T/199A/480V/532Y/561V、42T/259G/480V/561V、42T/259G/480V/652K、42T/480P/561I、42T/480V/561I/724K、42T/561I、47I/51S/136Q/756C/758Q、55D、55D/410S/440R/603E/788K、55D/517P、55D/517P/788K、70N、70N/642V、77L/176M/487K/615M/642V、95T/603E、106W/199A/539R/561I/652R、116F、136P/139K/142N、154A/361T/440R/517P/603E/788K、176T、198R/199A/480P/561I、198R/199A/480P/561V/724K、198R/199A/561V/724G、198R/480P/561I、198R/480V/724K、199A/532Y/539R/561I/652R/724S、259G/480V、267I/611Q/642V、280G/440R/517P、380T、480V/561V/652R、480V/561V/652R/724K/764R、480V/724K、517P、532Y/539R/561V、532Y/561I/724K、603E和642V,其中所述位置参照SEQ ID NO:7506来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:Q8R/A25E/I55D/Q95T/R208K/E358S/P440V/A517P/H788K、D12N/E45A/P47I/Y51P/R136P/R139K/L630M/G758R、D12N/E45A/Y51P/R136P/R139K/L630M/S675C/V756C/G758Q、D12N/P48A/Y51P/R136Q/R139K/G758Q、D12N/R136Q/S142N、D12S/E45A/Y51P/L630M/V756C、D12S/L630M/V756C、D12V/E45A/P47I/P48A/Y51S/R136Q/S142N/L630M、D12V/E45A/P47I/R136Q/R139K/S142N/S675C/G758Q、D12V/E45A/P47L、D12V/R136Q/R139K/S142N/V756C/G758Q、A25E/D29P/R208K/P440R、A25E/E100K/H154A/R208K/P440R/A517P/P705M/H788K、A25E/A517P、D29P/R208K/R361T/A517P/H788K、D42T/Q198R/T199A/I480V/S532Y/S539R/L561V、D42T/Q198R/S532Y/L561I/H724K、D42T/Q198R/S532Y/L561V、D42T/T199A/I480V/S532Y/L561V、D42T/D259G/I480V/L561V、D42T/D259G/I480V/G652K、D42T/I480P/L561I、D42T/I480V/L561I/H724K、D42T/L561I、P47I/Y51S/R136Q/V756C/G758Q、I55D、I55D/T410S/P440R/G603E/H788K、I55D/A517P、I55D/A517P/H788K、F70N、F70N/A642V、F77L/L176M/Q487K/R615M/A642V、Q95T/G603E、Y106W/T199A/S539R/L561I/G652R、L116F、R136P/R139K/S142N、H154A/R361T/P440R/A517P/G603E/H788K、L176T、Q198R/T199A/I480P/L561I、Q198R/T199A/I480P/L561V/H724K、Q198R/T199A/L561V/H724G、Q198R/I480P/L561I、Q198R/I480V/H724K、T199A/S532Y/S539R/L561I/G652R/H724S、D259G/I480V、V267I/R611Q/A642V、K280G/P440R/A517P、A380T、I480V/L561V/G652R、I480V/L561V/G652R/H724K/L764R、I480V/H724K、A517P、S532Y/S539R/L561V、S532Y/L561I/H724K、G603E和A642V,其中所述位置参照SEQ ID NO:7506来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQ ID NO:8370、8372、8374、8376、8378、8380、8382、8384、8386、8388、8390、8392、8394、8396、8398、8400、8402、8404、8406、8408、8410、8412、8414、8416、8418、8420、8422、8424、8426、8428、8430、8432、8434、8436、8438、8440、8442、8444、8446、8448、8450、8452、8454、8456、8458、8460、8462、8464、8466、8468、8470、8472、8474、8476、8478和8480。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:8370、8372、8374、8376、8378、8380、8382、8384、8386、8388、8390、8392、8394、8396、8398、8400、8402、8404、8406、8408、8410、8412、8414、8416、8418、8420、8422、8424、8426、8428、8430、8432、8434、8436、8438、8440、8442、8444、8446、8448、8450、8452、8454、8456、8458、8460、8462、8464、8466、8468、8470、8472、8474、8476、8478和8480。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:8370、8372、8374、8376、8378、8380、8382、8384、8386、8388、8390、8392、8394、8396、8398、8400、8402、8404、8406、8408、8410、8412、8414、8416、8418、8420、8422、8424、8426、8428、8430、8432、8434、8436、8438、8440、8442、8444、8446、8448、8450、8452、8454、8456、8458、8460、8462、8464、8466、8468、8470、8472、8474、8476、8478和8480。
本发明还提供了工程化蔗糖合酶,其中工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:
12/45/95/136/139/199/517/630/756、12/45/95/136/756、12/45/136/139/199/517/603、12/45/136/139/208/603/630/756、12/45/136/139/517/603/756、12/45/136/139/517/630/642/756、12/45/136/139/517/756、12/45/136/139/603/756、12/45/136/139/642/756、12/45/136/176/517/603/630/642、12/45/136/208/517/630/756、12/45/136/517/603/642/756/789、12/45/136/517/630/642/756、12/45/136/603/756、12/45/136/630/642、12/45/139/176/208/517/603/630、12/45/139/199/208/603、12/45/139/517/756、12/45/139/756、12/45/176/603/630/642/756、12/45/199/208/517/603/630/756、12/45/208/517/603/642/756、12/95/136/139/517/603/756、12/95/139/517/630/756、12/95/139/517/642、12/95/139/630/642、12/95/199/517/642、12/95/517/630/756、12/95/630/756、12/136、12/136/139/176/517/603/630、12/136/139/176/517/603/756、12/136/139/176/630/756、12/136/139/176/642、12/136/139/176/756、12/136/139/199/208/517/603/756、12/136/139/199/208/517/630/642/756、12/136/139/208/517、12/136/139/517、12/136/139/517/603/630/642/756、12/136/139/517/603/630/756、12/136/139/517/603/756、12/136/139/517/630、12/136/139/517/630/642、12/136/139/517/630/642/756、12/136/139/517/756、12/136/139/603/630、12/136/139/603/630/642、12/136/139/603/630/756、12/136/139/603/642/756、12/136/139/630、12/136/139/630/642/756、12/136/139/630/756、12/136/139/642/756、12/136/176/208/517/603/630/756、12/136/176/517/642、12/136/176/603/756、12/136/199/208/517/603/642/756、12/136/199/208/630/642、12/136/199/517/756、12/136/208、12/136/208/603/642、12/136/517/603/630/642、12/136/517/603/630/756、12/136/517/630、12/136/517/630/642、12/136/517/642、12/136/517/642/756、12/136/517/756、12/136/603/630/642/756、12/136/603/630/756、12/136/603/642、12/136/603/642/756、12/136/603/756、12/136/630、12/136/630/756、12/139/176/517/603/630/756、12/139/176/630/756、12/139/199/208/642、12/139/199/517/630/756、12/139/208/517、12/139/208/642、12/139/517/603/642/756、12/139/517/630/642/756、12/139/517/642、12/139/603/642/756、12/139/603/756、12/139/630/642、12/139/630/642/756、12/139/630/756、12/176/517/603/630、12/176/517/630/642/756、12/176/517/756、12/176/603/630/756、12/176/603/756、12/199/208/517/642、12/199/630/642/756、12/199/642/756、12/199/756、12/208/517/603/623/630/642、12/208/603/630/756、12/208/630/756、12/517/603/630/642/756、12/517/603/630/756、12/517/603/756、12/517/630/642/756、12/517/642/756、12/603/630/756、12/603/642/756、12/603/756、12/630/642/756、12/630/756、25/176/198/532/539、116/142/198/434/440、136/139/176/199/208/517/630/642、136/139/176/517/630/642/756、136/139/199/517/603/756、136/139/208/517/630/756、136/139/208/603/630/756、136/139/517/603/630/642/756、136/139/517/603/642/756、136/139/517/603/756、136/139/517/756、136/139/603、136/139/630/642/756、136/517/756、136/603/756、136/630/642、136/630/756、136/642、136/642/756、136/756、139/199/208/517/630/756、139/199/517/642、139/208/517/630/642/756、139/517/603/756、139/517/630/756、139/642/756、154/532/652/788、199/517/603/630/756、208/517/630/642/756、517/603/630/642/756、517/630/756、603/630/756和603/756,其中所述位置参照SEQ ID NO:8420来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:12N/45A/95T/136Q/139K/199A/517P/630M/756C、12N/45A/136Q/139K/199A/517P/603E、12N/45A/136Q/139K/517P/603E/756C、12N/45A/136Q/139K/517P/630M/642V/756C、12N/45A/136Q/139K/603E/756C、12N/45A/136Q/139K/642V/756C、12N/45A/136Q/208K/517P/630M/756C、12N/45A/136Q/517P/630M/642V/756C、12N/45A/136Q/603E/756C、12N/45A/136Q/630M/642V、12N/45A/139K/199A/208K/603E、12N/45A/139K/517P/756C、12N/45A/199A/208K/517P/603E/630M/756C、12N/95T/136Q/139K/517P/603Q/756C、12N/95T/139K/517P/642V、12N/95T/139K/630M/642V、12N/95T/199A/517P/642V、12N/95T/517P/630M/756C、12N/136Q、12N/136Q/139K/176T/517P/603Q/756C、12N/136Q/139K/176T/630M/756C、12N/136Q/139K/176T/642V、12N/136Q/139K/199A/208K/517P/630M/642V/756C、12N/136Q/139K/517P、12N/136Q/139K/517P/630M/642V、12N/136Q/139K/517P/630M/642V/756C、12N/136Q/139K/517P/756C、12N/136Q/139K/603E/630M、12N/136Q/139K/603Q/642V/756C、12N/136Q/139K/630M、12N/136Q/139K/642V/756C、12N/136Q/176T/603Q/756C、12N/136Q/199A/208K/517P/603E/642V/756C、12N/136Q/199A/517P/756C、12N/136Q/208K、12N/136Q/517P/630M、12N/136Q/603E/642V、12N/136Q/603E/642V/756C、12N/136Q/603Q/630M/756C、12N/136Q/603Q/642V/756C、12N/136Q/603Q/756C、12N/139K/199A/208K/642V、12N/139K/199A/517P/630M/756C、12N/139K/208K/517P、12N/139K/517P/603Q/642V/756C、12N/139K/603E/642V/756C、12N/139K/603Q/756C、12N/139K/630M/642V、12N/139K/630M/642V/756C、12N/139K/630M/756C、12N/176T/517P/603E/630M、12N/176T/517P/630M/642V/756C、12N/176T/517P/756C、12N/199A/208K/517P/642V、12N/199A/630M/642V/756C、12N/199A/642V/756C、12N/208K/517P/603E/623N/630M/642V、12N/208K/630M/756C、12N/517P/603E/756C、12N/517P/603Q/630M/756C、12N/517P/630M/642V/756C、12N/603E/642V/756C、12N/603Q/630M/756C、12N/603Q/642V/756C、12N/603Q/756C、12N/630M/642V/756C、12S/45A/95T/136Q/756C、12S/45A/136Q/139K/208K/603E/630M/756C、12S/45A/136Q/139K/517P/756C、12S/45A/136Q/176T/517P/603E/630M/642V、12S/45A/136Q/517P/603Q/642V/756C/789V、12S/45A/139K/176T/208K/517P/603E/630M、12S/45A/139K/517P/756C、12S/45A/139K/756C、12S/45A/176T/603Q/630M/642V/756C、12S/45A/208K/517P/603E/642V/756C、12S/95T/139K/517P/630M/756C、12S/95T/630M/756C、12S/136Q/139K/176T/517P/603Q/630M、12S/136Q/139K/176T/756C、12S/136Q/139K/199A/208K/517P/603E/756C、12S/136Q/139K/208K/517P、12S/136Q/139K/517P/603E/630M/642V/756C、12S/136Q/139K/517P/603E/630M/756C、12S/136Q/139K/517P/603E/756C、12S/136Q/139K/517P/603Q/630M/642V/756C、12S/136Q/139K/517P/603Q/756C、12S/136Q/139K/517P/630M、12S/136Q/139K/517P/630M/642V、12S/136Q/139K/603Q/630M/642V、12S/136Q/139K/603Q/630M/756C、12S/136Q/139K/630M/642V/756C、12S/136Q/139K/630M/756C、12S/136Q/176T/208K/517P/603E/630M/756C、12S/136Q/176T/517P/642V、12S/136Q/199A/208K/630M/642V、12S/136Q/208K/603Q/642V、12S/136Q/517P/603Q/630M/642V、12S/136Q/517P/603Q/630M/756C、12S/136Q/517P/630M/642V、12S/136Q/517P/642V、12S/136Q/517P/642V/756C、12S/136Q/517P/756C、12S/136Q/603E/756C、12S/136Q/603Q/630M/642V/756C、12S/136Q/630M、12S/136Q/630M/756C、12S/139K/176T/517P/603Q/630M/756C、12S/139K/176T/630M/756C、12S/139K/208K/642V、12S/139K/517P/630M/642V/756C、12S/139K/517P/642V、12S/139K/603Q/756C、12S/176T/603E/756C、12S/176T/603Q/630M/756C、12S/199A/756C、12S/208K/603Q/630M/756C、12S/517P/603Q/630M/642V/756C、12S/517P/630M/642V/756C、12S/517P/642V/756C、12S/603Q/630M/756C、12S/630M/756C、25E/176M/198R/532Y/539R、116F/142N/198R/434H/440R、136Q/139K/176T/199A/208K/517P/630M/642V、136Q/139K/176T/517P/630M/642V/756C、136Q/139K/199A/517P/603E/756C、136Q/139K/208K/517P/630M/756C、136Q/139K/208K/603Q/630M/756C、136Q/139K/517P/603E/642V/756C、136Q/139K/517P/603Q/630M/642V/756C、136Q/139K/517P/603Q/756C、136Q/139K/517P/756C、136Q/139K/603Q、136Q/139K/630M/642V/756C、136Q/517P/756C、136Q/603Q/756C、136Q/630M/642V、136Q/630M/756C、136Q/642V、136Q/642V/756C、136Q/756C、139K/199A/208K/517P/630M/756C、139K/199A/517P/642V、139K/208K/517P/630M/642V/756C、139K/517P/603Q/756C、139K/517P/630M/756C、139K/642V/756C、154A/532Y/652R/788K、199A/517P/603Q/630M/756C、208K/517P/630M/642V/756C、517P/603E/630M/642V/756C、517P/630M/756C、603E/630M/756C和603Q/756C,其中所述位置参照SEQ ID NO:8420来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:D12N/E45A/Q95T/R136Q/R139K/T199A/A517P/L630M/V756C、D12N/E45A/R136Q/R139K/T199A/A517P/G603E、D12N/E45A/R136Q/R139K/A517P/G603E/V756C、D12N/E45A/R136Q/R139K/A517P/L630M/A642V/V756C、D12N/E45A/R136Q/R139K/G603E/V756C、D12N/E45A/R136Q/R139K/A642V/V756C、D12N/E45A/R136Q/R208K/A517P/L630M/V756C、D12N/E45A/R136Q/A517P/L630M/A642V/V756C、D12N/E45A/R136Q/G603E/V756C、D12N/E45A/R136Q/L630M/A642V、D12N/E45A/R139K/T199A/R208K/G603E、D12N/E45A/R139K/A517P/V756C、D12N/E45A/T199A/R208K/A517P/G603E/L630M/V756C、D12N/Q95T/R136Q/R139K/A517P/G603Q/V756C、D12N/Q95T/R139K/A517P/A642V、D12N/Q95T/R139K/L630M/A642V、D12N/Q95T/T199A/A517P/A642V、D12N/Q95T/A517P/L630M/V756C、D12N/R136Q、D12N/R136Q/R139K/L176T/A517P/G603Q/V756C、D12N/R136Q/R139K/L176T/L630M/V756C、D12N/R136Q/R139K/L176T/A642V、D12N/R136Q/R139K/T199A/R208K/A517P/L630M/A642V/V756C、D12N/R136Q/R139K/A517P、D12N/R136Q/R139K/A517P/L630M/A642V、D12N/R136Q/R139K/A517P/L630M/A642V/V756C、D12N/R136Q/R139K/A517P/V756C、D12N/R136Q/R139K/G603E/L630M、D12N/R136Q/R139K/G603Q/A642V/V756C、D12N/R136Q/R139K/L630M、D12N/R136Q/R139K/A642V/V756C、D12N/R136Q/L176T/G603Q/V756C、D12N/R136Q/T199A/R208K/A517P/G603E/A642V/V756C、D12N/R136Q/T199A/A517P/V756C、D12N/R136Q/R208K、D12N/R136Q/A517P/L630M、D12N/R136Q/G603E/A642V、D12N/R136Q/G603E/A642V/V756C、D12N/R136Q/G603Q/L630M/V756C、D12N/R136Q/G603Q/A642V/V756C、D12N/R136Q/G603Q/V756C、D12N/R139K/T199A/R208K/A642V、D12N/R139K/T199A/A517P/L630M/V756C、D12N/R139K/R208K/A517P、D12N/R139K/A517P/G603Q/A642V/V756C、D12N/R139K/G603E/A642V/V756C、D12N/R139K/G603Q/V756C、D12N/R139K/L630M/A642V、D12N/R139K/L630M/A642V/V756C、D12N/R139K/L630M/V756C、D12N/L176T/A517P/G603E/L630M、D12N/L176T/A517P/L630M/A642V/V756C、D12N/L176T/A517P/V756C、D12N/T199A/R208K/A517P/A642V、D12N/T199A/L630M/A642V/V756C、D12N/T199A/A642V/V756C、D12N/R208K/A517P/G603E/H623N/L630M/A642V、D12N/R208K/L630M/V756C、D12N/A517P/G603E/V756C、D12N/A517P/G603Q/L630M/V756C、D12N/A517P/L630M/A642V/V756C、D12N/G603E/A642V/V756C、D12N/G603Q/L630M/V756C、D12N/G603Q/A642V/V756C、D12N/G603Q/V756C、D12N/L630M/A642V/V756C、D12S/E45A/Q95T/R136Q/V756C、D12S/E45A/R136Q/R139K/R208K/G603E/L630M/V756C、D12S/E45A/R136Q/R139K/A517P/V756C、D12S/E45A/R136Q/L176T/A517P/G603E/L630M/A642V、D12S/E45A/R136Q/A517P/G603Q/A642V/V756C/A789V、D12S/E45A/R139K/L176T/R208K/A517P/G603E/L630M、D12S/E45A/R139K/A517P/V756C、D12S/E45A/R139K/V756C、D12S/E45A/L176T/G603Q/L630M/A642V/V756C、D12S/E45A/R208K/A517P/G603E/A642V/V756C、D12S/Q95T/R139K/A517P/L630M/V756C、D12S/Q95T/L630M/V756C、D12S/R136Q/R139K/L176T/A517P/G603Q/L630M、D12S/R136Q/R139K/L176T/V756C、D12S/R136Q/R139K/T199A/R208K/A517P/G603E/V756C、D12S/R136Q/R139K/R208K/A517P、D12S/R136Q/R139K/A517P/G603E/L630M/A642V/V756C、D12S/R136Q/R139K/A517P/G603E/L630M/V756C、D12S/R136Q/R139K/A517P/G603E/V756C、D12S/R136Q/R139K/A517P/G603Q/L630M/A642V/V756C、D12S/R136Q/R139K/A517P/G603Q/V756C、D12S/R136Q/R139K/A517P/L630M、D12S/R136Q/R139K/A517P/L630M/A642V、D12S/R136Q/R139K/G603Q/L630M/A642V、D12S/R136Q/R139K/G603Q/L630M/V756C、D12S/R136Q/R139K/L630M/A642V/V756C、D12S/R136Q/R139K/L630M/V756C、D12S/R136Q/L176T/R208K/A517P/G603E/L630M/V756C、D12S/R136Q/L176T/A517P/A642V、D12S/R136Q/T199A/R208K/L630M/A642V、D12S/R136Q/R208K/G603Q/A642V、D12S/R136Q/A517P/G603Q/L630M/A642V、D12S/R136Q/A517P/G603Q/L630M/V756C、D12S/R136Q/A517P/L630M/A642V、D12S/R136Q/A517P/A642V、D12S/R136Q/A517P/A642V/V756C、D12S/R136Q/A517P/V756C、D12S/R136Q/G603E/V756C、D12S/R136Q/G603Q/L630M/A642V/V756C、D12S/R136Q/L630M、D12S/R136Q/L630M/V756C、D12S/R139K/L176T/A517P/G603Q/L630M/V756C、D12S/R139K/L176T/L630M/V756C、D12S/R139K/R208K/A642V、D12S/R139K/A517P/L630M/A642V/V756C、D12S/R139K/A517P/A642V、D12S/R139K/G603Q/V756C、D12S/L176T/G603E/V756C、D12S/L176T/G603Q/L630M/V756C、D12S/T199A/V756C、D12S/R208K/G603Q/L630M/V756C、D12S/A517P/G603Q/L630M/A642V/V756C、D12S/A517P/L630M/A642V/V756C、D12S/A517P/A642V/V756C、D12S/G603Q/L630M/V756C、D12S/L630M/V756C、A25E/L176M/Q198R/S532Y/S539R、L116F/S142N/Q198R/Y434H/P440R、R136Q/R139K/L176T/T199A/R208K/A517P/L630M/A642V、R136Q/R139K/L176T/A517P/L630M/A642V/V756C、R136Q/R139K/T199A/A517P/G603E/V756C、R136Q/R139K/R208K/A517P/L630M/V756C、R136Q/R139K/R208K/G603Q/L630M/V756C、R136Q/R139K/A517P/G603E/A642V/V756C、R136Q/R139K/A517P/G603Q/L630M/A642V/V756C、R136Q/R139K/A517P/G603Q/V756C、R136Q/R139K/A517P/V756C、R136Q/R139K/G603Q、R136Q/R139K/L630M/A642V/V756C、R136Q/A517P/V756C、R136Q/G603Q/V756C、R136Q/L630M/A642V、R136Q/L630M/V756C、R136Q/A642V、R136Q/A642V/V756C、R136Q/V756C、R139K/T199A/R208K/A517P/L630M/V756C、R139K/T199A/A517P/A642V、R139K/R208K/A517P/L630M/A642V/V756C、R139K/A517P/G603Q/V756C、R139K/A517P/L630M/V756C、R139K/A642V/V756C、H154A/S532Y/G652R/H788K、T199A/A517P/G603Q/L630M/V756C、R208K/A517P/L630M/A642V/V756C、A517P/G603E/L630M/A642V/V756C、A517P/L630M/V756C、G603E/L630M/V756C和G603Q/V756C,其中所述位置参照SEQ ID NO:8420来编号。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少90%相同的序列:SEQID NO:8798、8800、8802、8804、8806、8808、8810、8812、8814、8816、8818、8820、8822、8824、8826、8828、8830、8832、8834、8836、8838、8840、8842、8844、8846、8848、8850、8852、8854、8856、8858、8860、8862、8864、8866、8868、8870、8872、8874、8876、8878、8880、8882、8884、8886、8888、8890、8892、8894、8896、8898、8900、8902、8904、8906、8908、8910、8912、8914、8916、8918、8920、8922、8924、8926、8928、8930、8932、8934、8936、8938、8940、8942、8944、8946、8948、8950、8952、8954、8956、8958、8960、8962、8964、8966、8968、8970、8972、8974、8976、8978、8980、8982、8984、8986、8988、8990、8992、8994、8996、8998、9000、9002、9004、9006、9008、9010、9012、9014、9016、9018、9020、9022、9024、9026、9028、9030、9032、9034、9036、9038、9040、9042、9044、9046、9048、9050、9052、9054、9056、9058、9060、9062、9064、9066、9068、9070、9072、9074、9076、9078、9080、9082、9084、9086、9088、9090、9092、9094、9096、9098、9100、9102、9104和9106。在一些实施方案中,工程化蔗糖合酶的多肽序列包含与以下序列中的任何一个至少95%相同的序列:SEQ ID NO:8798、8800、8802、8804、8806、8808、8810、8812、8814、8816、8818、8820、8822、8824、8826、8828、8830、8832、8834、8836、8838、8840、8842、8844、8846、8848、8850、8852、8854、8856、8858、8860、8862、8864、8866、8868、8870、8872、8874、8876、8878、8880、8882、8884、8886、8888、8890、8892、8894、8896、8898、8900、8902、8904、8906、8908、8910、8912、8914、8916、8918、8920、8922、8924、8926、8928、8930、8932、8934、8936、8938、8940、8942、8944、8946、8948、8950、8952、8954、8956、8958、8960、8962、8964、8966、8968、8970、8972、8974、8976、8978、8980、8982、8984、8986、8988、8990、8992、8994、8996、8998、9000、9002、9004、9006、9008、9010、9012、9014、9016、9018、9020、9022、9024、9026、9028、9030、9032、9034、9036、9038、9040、9042、9044、9046、9048、9050、9052、9054、9056、9058、9060、9062、9064、9066、9068、9070、9072、9074、9076、9078、9080、9082、9084、9086、9088、9090、9092、9094、9096、9098、9100、9102、9104和9106。在一些实施方案中,工程化蔗糖合酶的多肽序列包含以下序列中的任何一个:SEQ ID NO:8798、8800、8802、8804、8806、8808、8810、8812、8814、8816、8818、8820、8822、8824、8826、8828、8830、8832、8834、8836、8838、8840、8842、8844、8846、8848、8850、8852、8854、8856、8858、8860、8862、8864、8866、8868、8870、8872、8874、8876、8878、8880、8882、8884、8886、8888、8890、8892、8894、8896、8898、8900、8902、8904、8906、8908、8910、8912、8914、8916、8918、8920、8922、8924、8926、8928、8930、8932、8934、8936、8938、8940、8942、8944、8946、8948、8950、8952、8954、8956、8958、8960、8962、8964、8966、8968、8970、8972、8974、8976、8978、8980、8982、8984、8986、8988、8990、8992、8994、8996、8998、9000、9002、9004、9006、9008、9010、9012、9014、9016、9018、9020、9022、9024、9026、9028、9030、9032、9034、9036、9038、9040、9042、9044、9046、9048、9050、9052、9054、9056、9058、9060、9062、9064、9066、9068、9070、9072、9074、9076、9078、9080、9082、9084、9086、9088、9090、9092、9094、9096、9098、9100、9102、9104和9106。
本发明还提供了是NDP-糖基转移酶的工程化糖基转移酶,其中工程化NDP-糖基转移酶是选自ADP-葡萄糖依赖性糖基转移酶(AGT)、CDP-葡萄糖依赖性糖基转移酶(CGT)、GDP-葡萄糖依赖性糖基转移酶(GGT)、TDP-葡萄糖依赖性糖基转移酶(TGT)和IDP-葡萄糖依赖性糖基转移酶(IGT)的NDP-糖基转移酶。在一些实施方案中,工程化NDP-糖基转移酶是ADP-葡萄糖依赖性糖基转移酶。在一些实施方案中,工程化NDP-糖基转移酶不是UDP-葡萄糖依赖性糖基转移酶。
本发明还提供了编码至少一种本文提供的工程化糖基转移酶多肽的工程化多核苷酸。在一些实施方案中,编码至少一种本文提供的工程化糖基转移酶的工程化多核苷酸包含与以下序列至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性:SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973、975、977、979、981、983、985、987、989、991、993、995、997、999、1001、1003、1005、1007、1009、1011、1013、1015、1017、1019、1021、1023、1025、1027、1029、1031、1033、1035、1037、1039、1041、1043、1045、1047、1049、1051、1053、1055、1057、1059、1061、1063、1065、1067、1069、1071、1073、1075、1077、1289、1291、1293、2595、2597、2599、2601、2603、2605、2607、2609、2611、2613、2615、2617、2619、2621、2623、2625、2627、2629、2631、2633、2635、2637、2639、2641、2643、2645、2647、2649、2651、2653、2655、2657、2659、2661、2663、2665、2667、2669、2671、2673、2675、2677、2679、2681、2683、2685、2687、2689、2691、2693、2695、2697、2699、2701、2703、2705、2707、2709、2711、2713、2715、2717、2719、2721、2723、2725、2727、2729、2731、2733、2735、2737、2739、2741、2743、2745、2747、2749、2751、2753、2755、2757、2759、2761、2763、2765、2767、2769、2771、2773、2775、2777、2779、2781、2783、2785、2787、2789、2791、2793、2795、2797、2799、2801、2803、2805、2807、2809、2811、2813、2815、2817、2819、2821、2823、2825、2827、2829、2831、2833、2835、2837、2839、2841、2843、2845、2847、2849、2851、2823、2855、2857、2859、2861、2863、2865、2867、2869、2871、2873、2875、2877、2879、2881、2883、2885、2887、2889、2891、2893、2895、2897、2899、2901、2903、2905、2907、2909、2911、2913、2915、2917、2919、2921、2923、2925、2927、2829、2931、2933、2935、2937、2939、2941、2943、2945、2947、2949、2951、2953、2955、2957、2959、2961、2963、2965、2967、2969、2971、2973、2975、2977、2979、2981、2983、2985、2987、2989、2991、2993、2995、2997、2999、3001、3003、3005、3007、3009、3011、3013、3015、3017、3019、3021、3023、3025、3027、3029、3031、3033、3035、3037、3039、3041、3043、3045、3047、3049、3051、3053、3055、3057、3059、3061、3063、3065、3067、3069、3071、3073、3075、3077、3079、3081、3083、3085、3087、3089、3091、3093、3095、3097、3099、3101、3103、3105、3107、3109、3111、3113、3115、3117、3119、3121、3123、3125、3127、3129、3131、3133、3135、3137、3139、3141、3143、3145、3147、3149、3151、3153、3155、3157、3159、3161、3163、3165、3167、3169、3171、3173、3175、3177、3179、3181、3183、3185、3187、3189、3191、3193、3195、3197、3199、3201、3203、3205、3207、3209、3211、3213、3215、3217、3219、3221、3223、3225、3227、3229、3231、3233、3235、3237、3239、3241、3243、3245、3247、3249、3251、3253、3255、3257、3259、3261、3263、3265、3267、3269、3271、3273、3275、3277、3279、3281、3283、3285、3287、3289、3291、3293、3295、3297、3299、3301、3303、3305、3307、3309、3311、3313、3315、3317、3319、3321、3323、3325、3327、3329、3331、3333、3335、3337、3339、3341、3343、3345、3347、3349、3351、3353、3355、3357、3359、3361、3363、3365、3367、3369、3371、3373、3375、3377、3379、3381、3383、3385、3387、3389、3391、3393、3395、3397、3399、3401、3403、3405、3407、3409、3411、3413、3415、3417、3419、3421、3423、3425、3427、3429、3431、3433、3435、3437、3439、3441、3443、3445、3447、3449、3451、3453、3455、3457、3459、3461、3463、3465、3467、3469、3471、3473、3475、3477、3479、3481、3483、3485、3487、3489、3491、3493、3495、3497、3499、3501、3503、3505、3507、3509、3511、3513、3515、3517、3519、3521、3523、3525、3527、3529、3531、3533、3535、3537、3539、3541、3543、3545、3547、3549、3551、3553、3555、3557、3559、3561、3563、3565、3567、3569、3571、3573、3575、3577、3579、3581、3583、3585、3587、3589、3591、3593、3595、3597、3599、3601、3603、3605、3607、3609、3611、3613、3615、3617、3619、3621、3623、3625、3627、3629、3631、3633、3635、3637、3639、3641、3643、3645、3647、3649、3651、3653、3655、3657、3659、3661、3663、3665、3667、3669、3671、3673、3675、3677、3679、3681、3683、3685、3687、3689、3691、3693、3695、3697、3699、3791、3703、3705、3707、3709、3711、3713、3715、3717、3719、3721、3723、3725、3727、3729、3731、3733、3735、3737、3739、3741、3743、3745、3747、3749、3751、3753、3755、3757、3759、3761、3763、3765、3767、3769、3771、3773、3775、3777、3779、3781、3783、3785、3787、3789、3791、3793、3795、3797、3799、3801、3803、3805、3807、3809、3811、3813、3815、3817、3819、3821、3823、3825、3827、3829、3831、3833、3835、3837、3839、3841、3843、3845、3847、3849、3851、3853、3855、3857、3859、3861、3863、3865、3867、3869、3871、3873、3875、3877、3879、3881、3883、3885、3887、3889、3891、3893、3895、3897、3899、3901、3903、3905、3907、3909、3911、3913、3915、3917、3919、3921、3923、3925、3927、3929、3931、3933、3935、3937、3939、3941、3943、3945、3947、3949、3951、3953、3955、3957、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017、4019、4021、4023、4025、4027、4029、4031、4033、4035、4037、4039、4041、4043、4045、4047、4049、4051、4053、4055、4057、4059、4061、4063、4065、4067、4069、4071、4073、4075、4077、4079、4081、4083、4085、4087、4089、4091、4093、4095、4097、4099、4101、4103、4105、4107、4109、4111、4113、4115、4117、4119、4121、4123、4125、4127、4129、4131、4133、4135、4137、4139、4141、4143、4145、4147、4149、4151、4153、4155、4157、4159、4161、4163、4165、4167、4169、4171、4173、4175、4177、4179、4181、4183、4185、4187、4189、4191、4193、4195、4197、4199、4201、4203、4205、4207、4209、4211、4213、4215、4217、4219、4221、4223、4225、4227、4229、4231、4233、4235、4237、4239、4241、4243、4245、4247、4249、4251、4253、4255、4257、4259、4261、4263、4265、4267、4269、4271、4273、4275、4277、4279、4281、4283、4285、4287、4289、4291、4293、4295、4297、4299、4301、4303、4305、4307、4309、4311、4313、4315、4317、4319、4321、4323、4325、4327、4329、4331、4333、4335、4337、4339、4341、4343、4345、4347、4349、4351、4353、4355、4357、4359、4361、4363、4365、4367、4369、4371、4373、4375、4377、4379、4381、4383、4385、4387、4389、4391、4393、4395、4397、4399、4401、4403、4405、4407、4409、4411、4413、4415、4417、4419、4421、4423、4425、4427、4429、4431、4433、4435、4437、4439、4441、4443、4445、4447、4449、4451、4453、4455、4457、4459、4461、4463、4465、4467、4469、4471、4473、4475、4477、4479、4481、4483、4485、4487、4489、4491、4493、4495、4497、4499、4501、4503、4505、4507、4509、4511、4513、4515、4517、4519、4521、4523、4525、4527、4529、4531、4533、4535、4537、4539、4541、4543、4545、4547、4549、4551、4553、4555、4557、4559、4561、4563、4565、4567、4569、4571、4573、4575、4577、4579、4581、4583、4585、4587、4589、4591、4593、4595、4597、4599、4601、4603、4605、4607、4609、4611、4613、4615、4617、4619、4621、4623、4625、4627、4629、4631、4633、4635、4637、4639、4641、4643、4645、4647、4649、4651、4653、4655、4657、4659、4661、4663、4665、4667、4669、4671、4673、4675、4677、4679、4681、4683、4685、4687、4689、4691、4693、4695、4697、4699、4701、4703、4705、4707、4709、4711、4713、4715、4717、4719、4721、4723、4725、4727、4729、4731、4733、4735、4737、4739、4741、4743、4745、4747、4749、4751、4753、4755、4757、4759、4761、4763、4765、4767、4769、4771、4773、4775、4777、4779、4781、4783、4785、4787、4789、4791、4793、4795、4797、4799、4801、4803、4805、4807、4809、4811、4813、4815、4817、4819、4821、4823、4825、4827、4829、4831、4833、4835、4837、4839、4841、4843、4845、4847、4849、4851、4853、4855、4857、4859、4861、4863、4865、4867、4869、4871、4873、4875、4877、4879、4881、4883、4885、4887、4889、4891、4893、4895、4897、4899、4901、4903、4905、4907、4909、4911、4913、4915、4917、4919、4921、4923、4925、4927、4929、4931、4933、4935、4937、4939、4941、4943、4945、4947、4949、4951、4953、4955、4957、4959、4961、4963、4965、4967、4969、4971、4973、4975、4977、4979、4981、4983、4985、4987、4989、4991、4993、4995、4997、4999、5001、5003、5005、5007、5009、5011、5013、5015、5017、5019、5021、5023、5025、5027、5029、5031、5033、5035、5037、5039、5041、5043、5045、5047、5059、5051、5053、5055、5057、5059、5061、5063、5065、5067、5069、5071、5073、5075、5077、5079、5081、5083、5085、5087、5089、5091、5093、5095、5097、5099、5101、5103、5105、5107、5109、5111、5113、5115、5117、5119、5121、5123、5125、5127、5129、5131、5133、5135、5137、5139、5141、5143、5145、5147、5149、5151、5153、5155、5157、5159、5161、5163、5165、5167、5169、5171、5173、5175、5177、5179、5181、5183、5185、5187、5189、5191、5193、5195、5197、5199、5201、5203、5205、5207、5209、5211、5213、5215、5217、5219、5221、5223、5225、5227、5229、5231、5233、5235、5237、5239、5241、5243、5245、5247、5249、5251、5253、5255、5257、5259、5261、5263、5265、5267、5269、5271、5273、5275、5277、5279、5281、5283、5285、5287、5289、5291、5293、5295、5297、5299、5301、5303、5305、5307、5309、5311、5313、5315、5317、5319、5321、5323、5325、5327、5329、5331、5333、5335、5337、5339、5341、5343、5345、5347、5349、5351、5353、5355、5357、5359、5361、5363、5365、5367、5369、5371、5373、5375、5377、5379、5381、5383、5385、5387、5389、5391、5393、5395、5397、5399、5401、5403、5405、5407、5409、5411、5413、5415、5417、5419、5421、5423、5425、5427、5429、5431、5433、5435、5437、5439、5441、5443、5445、5447、5449、5451、5453、5455、5457、5459、5461、5463、5465、5467、5469、5471、5473、5475、5477、5479、5481、5483、5485、5487、5489、5491、5493、5495、5497、5499、5501、5503、5505、5507、5509、5511、5513、5515、5517、5519、5521、5523、5525、5527、5529、5531、5533、5535、5537、5539、5541、5543、5545、5547、5549、5551、5553、5555、5557、5559、5561、5563、5565、5567、5569、5571、5573、5575、5577、5579、5581、5583、5585、5587、5589、5591、5593、5595、5597、5599、5601、5603、5605、5607、5609、5611、5613、5615、5617、5619、5621、5623、5625、5627、5629、5631、5633、5635、5637、5639、5641、5643、5645、5647、5649、5651、5653、5655、5657、5659、5661、5663、5665、5667、5669、5671、5673、5675、5677、5679、5681、5683、5685、5687、5689、5691、5693、5695、5697、5699、5701、5703、5705、5707、5709、5711、5713、5715、5717、5719、5721、5723、5725、5727、5729、5731、5733、5735、5737、5739、5741、5743、5745、5747、5749、5751、5753、5755、5757、5759、5761、5763、5765、5767、5769、5771、5773、5775、5777、5779、5781、5783、5785、5787、5789、5791、5793、5795、5797、5799、5801、5803、5805、5807、5809、5811、5813、5815、5817、5819、5821、5823、5825、5827、5829、5831、5833、5835、5837、5839、5841、5843、5845、5847、5849、5851、5853、5855、5857、5859、5861、5863、5865、5867、5869、5871、5873、5875、5877、5879、5881、5883、5885、5887、5889、5891、5893、5895、5897、5899、5901、5903、5905、5907、5909、5911、5913、5915、5917、5919、5921、5923、5925、5927、5929、5931、5933、5935、5937、5939、5941、5943、5945、5947、5949、5951、5953、5955、5957、5959、5961、5963、5965、5967、5969、5971、5973、5975、5977、5979、5981、5983、5985、5987、5989、5991、5993、5995、5997、5999、6001、6003、6005、6007、6009、6011、6013、6015、6017、6019、6021、6023、6025、6027、6029、6031、6033、6035、6037、6039、6041、6043、6045、6047、6049、6051、6053、6055、6057、6059、6061、6063、6065、6067、6069、6071、6073、6075、6077、6079、6081、6083、6085、6087、6089、6091、6093、6095、6097、6099、6101、6103、6105、6107、6109、6111、6113、6115、6117、6119、6121、6123、6125、6127、6129、6131、6133、6135、6137、6139、6141、6143、6145、6147、6149、6151、6153、6155、6157、6159、6161、6163、6165、6167、6169、6171、6173、6175、6177、6179、6181、6183、6185、6187、6189、6191、6193、6195、6197、6199、6201、6203、6205、6207、6209、6211、6213、6215、6217、6219、6221、6223、6225、6227、6229、6231、6233、6235、6237、6239、6241、6243、6245、6247、6249、6251、6253、6255、6257、6259、6261、6263、6265、6267、6269、6271、6273、6275、6277、6279、6281、6283、6285、6287、6289、6291、6293、6295、6297、6299、6301、6303、6305、6307、6309、6311、6313、6315、6317、6319、6321、6323、6325、6327、6329、6331、6333、6335、6337、6339、6341、6343、6345、6347、6349、6351、6353、6355、6357、6359、6361、6363、6365、6367、6369、6371、6373、6375、6377、6379、6381、6383、6385、6387、6389、6391、6393、6395、6397、6399、6401、6403、6405、6407、6409、6411、6413、6415、6417、6419、6421、6423、6425、6427、6429、6431、6433、6435、6437、6439、6441、6443、6445、6447、6449、6451、6453、6455、6457、6459、6461、6463、6465、6467、6469、6471、6473、6475、6477、6479、6481、6483、6485、6487、6489、6491、6493、6495、6497、6499、6501、6503、6505、6507、6509、6511、6513、6515、6517、6519、6521、6523、6525、6527、6529、6531、6533、6535、6537、6539、6541、6543、6545、6547、6549、6551、6553、6555、6557、6559、6561、6563、6565、6567、6569、6571、6573、6575、6577、6579、6581、6583、6585、6587、6589、6591、6593、6595、6597、6599、6601、6603、6605、6607、6609、6611、6613、6615、6617、6619、6621、6623、6625、6627、6629、6631、6633、6635、6637、6639、6641、6643、6645、6647、6649、6651、6653、6655、6657、6659、6661、6663、6665、6667、6669、6671、6673、6675、6677、6679、6681、6683、6685、6687、6689、6691、6693、6695、6697、6699、6701、6703、6705、6707、6709、6711、6713、6715、6717、6719、6721、6723、6725、6727、6729、6731、6733、6735、6737、6739、6741、6743、6745、6747、6749、6751、6753、6755、6757、6759、6761、6763、6765、6767、6769、6771、6773、6775、6777、6779、6781、6783、6785、6787、6789、6791、6793、6795、6797、6799、6801、6803、6805、6807、6809、6811、6813、6815、6817、6819、6821、6823、6825、6827、6829、6831、6833、6835、6837、6839、6841、6843、6845、6847、6849、6851、6853、6855、6857、6859、6861、6863、6865、6867、6869、6871、6873、6875、6877、6879、6881、6883、6885、6887、6889、6891、6893、6895、6897、6899、6901、6903、6905、6907、6909、6911、6913、6915、6917、6919、6921、6923、6925、6927、6929、6931、6933、6935、6937、6939、6941、6943、6945、6947、6949、6951、6953、6955、6957、6959、6961、6963、6965、6967、6969、6971、6973、6975、6977、6979、6981、6983、6985、6987、6989、6991、6993、6995、6997、6999、7001、7003、7005、7007、7009、7011、7013、7015、7017、7019、7021、7023、7025、7027、7029、7031、7033、7035、7037、7039、7041、7043、7045、7047、7049、7051、7053、7055、7057、7059、7061、7063、7065、7067、7069、7071、7073、7075、7077、7079、7081、7083、7085、7087、7089、7091、7093、7095、7097、7099、7101、7103、7105、7107、7109、7111、7113、7115、7117、7119、7121、7123、7125、7127、7129、7131、7133、7135、7137、7139、7141、7143、7145、7147、7149、7151、7153、7155、7157、7159、7161、7163、7165、7167、7169、7171、7173、7175、7177、7179、7181、7183、7185、7187、7189、7191、7193、7195、7197、7199、7201、7203、7205、7207、7209、7211、7213、7215、7217、7219、7221、7223、7225、7227、7229、7231、7233、7235、7237、7239、7241、7243、7245、7247、7249、7251、7253、7255、7257、7259、7261、7263、7265、7267、7269、7271、7273、7275、7277、7279、7281、7283、7285、7287、7289、7291、7293、7295、7297、7299、7301、7303、7305、7307、7309、7311、7313、7315、7317、7319、7321、7323、7325、7327、7329、7331、7333、7335、7337、7339、7341、7343、7345、7347、7349、7351、7353、7355、7357、7359、7361、7363、7365、7367、7369、7371、7373、7375、7377、7379、7381、7383、7385、7387、7389、7391、7393、7395、7397、7399、7401、7403、7405、7407、7409、7411、7413、7415、7417、7419、7421、7423、7425、7427、7429、7431、7433、7435、7765、7767、7769、7771、7773、7775、7777、7779、7781、7783、7785、7787、7789、7791、7793、7795、7797、7799、7811、7813、7815、7817、7819、7821、7823、7825、7827、7829、7831、7833、7835、7837、7839、7841、7843、7845、7847、7849、7851、7853、7855、7857、7859、7861、7863、7865、7867、7869、7871、7873、7875、7877、7879、7881、7883、7885、7887、7889、7891、7893、7895、7897、7899、7901、7903、7905、7907、7909、7911、7913、7915、7917、7919、7921、7923、7925、7927、7929、7931、7933、7935、7937、7939、7941、7943、7945、7947、7949、7951、7953、7955、7957、7959、7961、7963、7965、7967、7969、7971、7973、7975、7977、7979、7981、7983、7985、7987、7989、7991、7993、7995、7997、7999、8001、8003、8005、8007、8009、8011、8013、8015、8017、8019、8021、8023、8025、8027、8029、8031、8033、8035、8037、8039、8041、8043、8045、8047、8049、8051、8053、8055、8057、8059、8061、8063、8065、8067、8069、8071、8073、8075、8077、8079、8081、8083、8085、8087、8089、8091、8093、8095、8097、8099、8101、8103、8105、8107、8109、8111、8113、8115、8117、8119、8121、8123、8125、8127、8129、8131、8133、8135、8137、8139、8141、8143、8145、8147、8149、8151、8153、8155、8157、8159、8161、8163、8165、8167、8169、8171、8173、8175、8177、8179、8181、8183、8185、8187、8189、8191、8193、8195、8197、8199、8201、8203、8205、8207、8209、8211、8213、8215、8217、8219、8221、8223、8225、8227、8229、8231、8233、8235、8237、8239、8241、8243、8245、8247、8249、8251、8253、8255、8257、8259、8261、8263、8265、8267、8269、8271、8273、8275、8277、8279、8281、8283、8285、8287、8289、8291、8293、8295、8297、8299、8301、8303、8305、8307、8309、8311、8313、8315、8317、8319、8321、8323、8325、8327、8329、8331、8333、8335、8337、8339、8341、8343、8345、8347、8349、8351、8353、8355、8357、8359、8361、8363、8365、8367、8481、8483、8485、8487、8489、8491、8493、8495、8497、8489、8501、8503、8505、8507、8509、8511、8513、8515、8517、8519、8521、8523、8525、8527、8529、8531、8533、8535、8537、8539、8541、8543、8545、8547、8549、8551、8553、8555、8557、8559、8561、8563、8565、8567、8569、8571、8573、8575、8577、8579、8581、8583、8585、8587、8589、8591、8593、8595、8597、8599、8601、8603、8605、8607、8609、8611、8613、8615、8617、8619、8621、8623、8625、8627、8629、8631、8633、8635、8637、8639、8641、8643、8645、8647、8649、8651、8653、8655、8657、8659、8661、8663、8665、8667、8669、8671、8673、8675、8677、8679、8681、8683、8685、8687、8689、8691、8693、8695、8697、8699、8701、8703、8705、8707、8709、8711、8713、8715、8717、8719、8721、8723、8725、8727、8729、8731、8733、8735、8737、8739、8741、8743、8745、8747、8749、8751、8753、8755、8757、8759、8761、8763、8765、8767、8769、8771、8773、8775、8777、8779、8781、8783、8785、8787、8789、8791、8793、8795、9107、9109、9111、9113、9115、9117、9119、9121、9123、9125、9127、9129、9131、9133、9135、9137、9139、9141、9143、9145、9147、9149、9151、9153、9155、9157、9159、9161、9163、9165、9167、9169、9171、9173、9175、9177、9179、9181、9183、9185、9187、9189、9191、9193、9195、9197、9199、9201、9203、9205、9207、9209、9211、9213、9215、9217、9219、9221、9223、9225、9227、9229、9231、9233、9235、9237和/或9239。
本发明还提供了编码至少一种本文提供的工程化蔗糖合酶多肽的工程化多核苷酸。在一些实施方案中,编码至少一种本文提供的工程化蔗糖合酶的工程化多核苷酸包含与以下序列至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性:SEQ ID NO:1079、1081、1083、1085、1087、1089、1091、1093、1095、1097、1099、1101、1103、1105、1107、1109、1111、1113、1115、1117、1119、1121、1123、1125、1127、1129、1131、1133、1135、1137、1139、1141、1143、1145、1147、1149、1151、1153、1155、1157、1159、1161、1163、1165、1167、1169、1171、1173、1175、1177、1179、1181、1183、1185、1187、1189、1191、1193、1195、1197、1199、1201、1203、1205、1207、1209、1211、1213、1215、1217、1219、1221、1223、1225、1227、1229、1231、1233、1235、1237、1239、1241、1243、1245、1247、1249、1251、1253、1255、1257、1259、1261、1263、1265、1267、1269、1271、1273、1275、1277、1279、1281、1283、1285、1287、1295、1297、1299、1301、1303、1305、1307、1309、1311、1313、1315、1317、1319、1321、1323、1325、1327、1329、1331、1333、1335、1337、1339、1341、1343、1345、1347、1349、1351、1353、1355、1357、1359、1361、1363、1365、1367、1369、1371、1373、1375、1377、1379、1381、1383、1385、1387、1389、1391、1393、1395、1397、1399、1401、1403、1405、1407、1409、1411、1413、1415、1417、1419、1421、1423、1425、1427、1429、1431、1433、1435、1437、1439、1441、1443、1445、1447、1449、1451、1453、1455、1457、1459、1461、1463、1465、1467、1469、1471、1473、1475、1477、1479、1481、1483、1485、1487、1489、1491、1493、1495、1497、1499、1501、1503、1505、1507、1509、1511、1513、1515、1517、1519、1521、1523、1525、1527、1529、1531、1533、1535、1537、1539、1541、1543、1545、1547、1549、1551、1553、1555、1557、1559、1561、1563、1565、1567、1569、1571、1573、1575、1577、1579、1581、1583、1585、1587、1589、1591、1593、1595、1597、1599、1601、1603、1605、1607、1609、1611、1613、1615、1617、1619、1621、1623、1625、1627、1629、1631、1633、1635、1637、1639、1641、1643、1645、1647、1649、1651、1653、1655、1657、1659、1661、1663、1665、1667、1669、1671、1673、1675、1677、1679、1681、1683、1685、1687、1689、1691、1693、1695、1697、1699、1701、1703、1705、1707、1709、1711、1713、1715、1717、1719、1721、1723、1725、1727、1729、1731、1733、1735、1737、1739、1741、1743、1745、1747、1749、1751、1753、1755、1757、1759、1761、1763、1765、1767、1769、1771、1773、1775、1777、1779、1781、1783、1785、1787、1789、1791、1793、1795、1797、1799、1801、1803、1805、1807、1809、1811、1813、1815、1817、1819、1821、1823、1825、1827、1829、1831、1833、1835、1837、1839、1841、1843、1845、1847、1849、1851、1853、1855、1857、1859、1861、1863、1865、1867、1869、1871、1873、1875、1877、1879、1881、1883、1885、1887、1889、1891、1893、1895、1897、1899、1901、1903、1905、1907、1909、1911、1913、1915、1917、1919、1921、1923、1925、1927、1929、1931、1933、1935、1937、1939、1941、1943、1945、1947、1949、1951、1953、1955、1957、1959、1961、1963、1965、1967、1969、1971、1973、1975、1977、1979、1981、1983、1985、1987、1989、1991、1993、1995、1997、1999、2001、2003、2005、2007、2009、2011、2013、2015、2017、2019、2021、2023、2025、2027、2029、2031、2033、2035、2037、2039、2041、2043、2045、2047、2049、2051、2053、2055、2057、2059、2061、2063、2065、2067、2069、2071、2073、2075、2077、2079、2081、2083、2085、2087、2089、2091、2093、2095、2097、2099、2101、2103、2105、2107、2109、2111、2113、2115、2117、2119、2121、2123、2125、2127、2129、2131、2133、2135、2137、2139、2141、2143、2145、2147、2149、2151、2153、2155、2157、2159、2161、2163、2165、2167、2169、2171、2173、2175、2177、2179、2181、2183、2185、2187、2189、2191、2193、2195、2197、2199、2201、2203、2205、2207、2209、2211、2213、2215、2217、2219、2221、2223、2225、2227、2229、2231、2233、2235、2237、2239、2241、2243、2245、2247、2249、2251、2253、2255、2257、2259、2261、2263、2265、2267、2269、2271、2273、2275、2277、2279、2281、2283、2285、2287、2289、2291、2293、2295、2297、2299、2301、2303、2305、2307、2309、2311、2313、2315、2317、2319、2321、2323、2325、2327、2329、2331、2333、2335、2337、2339、2341、2343、2345、2347、2349、2351、2353、2355、2357、2359、2361、2363、2365、2367、2369、2371、2373、2375、2377、2379、2381、2383、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419、2421、2423、2425、2427、2429、2431、2433、2435、2437、2439、2441、2443、2445、2447、2449、2451、2453、2455、2457、2459、2461、2463、2465、2467、2469、2471、2473、2475、2477、2479、2481、2483、2485、2487、2489、2491、2493、2495、2497、2499、2501、2503、2505、2507、2509、2511、2513、2515、2517、2519、2521、2523、2525、2527、2529、2531、2533、2535、2537、2539、2541、2543、2545、2547、2549、2551、2553、2555、2557、2559、2561、2563、2565、2567、2569、2571、2573、2575、2577、2579、2581、2583、2585、2587、2589、2591、2593、7437、7439、7441、7443、7445、7447、7449、7451、7453、7455、7457、7459、7461、7463、7465、7467、7469、7471、7473、7475、7477、7479、7481、7483、7485、7487、7489、7491、7493、7495、7497、7499、7501、7503、7505、7507、7509、7511、7513、7515、7517、7519、7521、7523、7525、7527、7529、7531、7533、7535、7537、7539、7541、7543、7545、7547、7549、7551、7553、7555、7557、7559、7561、7563、7565、7567、7569、7571、7573、7575、7577、7579、7581、7583、7585、7587、7589、7591、7593、7595、7597、7599、7601、7603、7605、7607、7609、7611、7613、7615、7617、7619、7621、7623、7625、7627、7629、7631、7633、7635、7637、7639、7641、7643、7645、7647、7649、7651、7653、7655、7657、7659、7661、7663、7665、7667、7669、7671、7673、7675、7677、7679、7681、7683、7685、7687、7689、7691、7693、7695、7697、7699、7701、7703、7705、7707、7709、7711、7713、7715、7717、7719、7721、7723、7725、7727、7729、7731、7733、7735、7737、7739、7741、7743、7745、7747、7749、7751、7753、7755、7757、7759、7761、7763、8369、8371、8373、8375、8377、8379、8381、8383、8385、8387、8389、8391、8393、8395、8397、8399、8401、8403、8405、8407、8409、8411、8413、8415、8417、8419、8421、8423、8425、8427、8429、8431、8433、8435、8437、8439、8441、8443、8445、8447、8449、8451、8453、8455、8457、8459、8461、8463、8465、8467、8469、8471、8473、8475、8477、8479、8797、8799、8801、8803、8805、8807、8809、8811、8813、8815、8817、8819、8821、8823、8825、8827、8829、8831、8833、8835、8837、8839、8841、8843、8845、8847、8849、8851、8853、8855、8857、8859、8861、8863、8865、8867、8869、8871、8873、8875、8877、8879、8881、8883、8885、8887、8889、8891、8893、8895、8897、8899、8901、8903、8905、8907、8909、8911、8913、8915、8917、8919、8921、8923、8925、8927、8929、8931、8933、8935、8937、8939、8941、8943、8945、8947、8949、8951、8953、8955、8957、8959、8961、8963、8965、8967、8969、8971、8973、8975、8977、8979、8981、8983、8985、8987、8989、8991、8993、8995、8997、8999、9001、9003、9005、9007、9009、9011、9013、9015、9017、9019、9021、9023、9025、9027、9029、9031、9033、9035、9037、9039、9041、9043、9045、9047、9049、9051、9053、9055、9057、9059、9061、9063、9065、9067、9069、9071、9073、9075、9077、9079、9081、9083、9085、9087、9089、9091、9093、9095、9097、9099、9101、9103和/或9105。
本发明还提供了包含至少一种本文提供的工程化多核苷酸的载体。在一些实施方案中,载体还包含至少一种控制序列。
本发明还提供了包含至少一种本文提供的工程化多核苷酸的宿主细胞。在一些实施方案中,宿主细胞包含至少一种本文提供的载体。在一些实施方案中,宿主细胞选自真核生物体和原核生物体。在一些另外的实施方案中,宿主细胞为大肠杆菌(E.coli)。
本发明还提供了用于产生至少一种本文提供的工程化糖基转移酶变体的方法,所述方法包括在使得宿主细胞产生工程化糖基转移酶变体的条件下培养本文提供的宿主细胞。在一些实施方案中,该方法还包括回收工程化糖基转移酶变体的步骤。
本发明还提供了包含至少一种本文提供的工程化糖基转移酶变体和/或蔗糖合酶变体的组合物。在一些实施方案中,组合物包含至少一种本文提供的工程化糖基转移酶变体。
本发明还提供了用于产生至少一种本文提供的工程化蔗糖合酶变体的方法,所述方法包括在使得宿主细胞产生工程化蔗糖合酶变体的条件下培养本文提供的宿主细胞。在一些实施方案中,该方法还包括回收工程化蔗糖合酶变体的步骤。在一些实施方案中,组合物包含至少一种本文提供的工程化蔗糖合酶变体。
本发明还提供了用于底物糖基化的方法,所述方法包括:提供至少一种底物、选自本文提供的偶数序列的至少一种工程化糖基转移酶;在使得底物糖基化以产生至少一种糖基化产物的条件下,使底物与糖基转移酶接触。在一些实施方案中,底物包含至少一种甜菊醇糖苷(steviol glycoside)。在一些实施方案中,糖基化产物包括至少一种单糖基化产物和/或多糖基化产物。并不意图本发明受限于关于产物糖基化程度(例如二糖基化、三糖基化以及在本发明中可用的具有更高糖基化水平的产物)的任何限制。
本发明提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D和/或莱鲍迪苷I底物、NDP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D和莱鲍迪苷I底物、NDP-葡萄糖以及糖基转移酶组合。在一些另外的实施方案中,本发明提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D底物、NDP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D底物、NDP-葡萄糖和糖基转移酶组合。在一些另外的实施方案中,本发明提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷I底物、NDP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷I底物、NDP-葡萄糖和糖基转移酶组合。在一些本发明的实施方案中,NDP-葡萄糖选自ADP-葡萄糖、CDP-葡萄糖、TDP-葡萄糖、GDP-葡萄糖和/或IDT葡萄糖。在一些另外的实施方案中,NDP-葡萄糖不是UDP-葡萄糖。
本发明提供了用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将甜菊苷底物、NDP-葡萄糖和糖基转移酶组合。在一些实施方案中,本发明提供了用于产生莱鲍迪苷A的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷A的条件下将甜菊苷底物、NDP-葡萄糖和糖基转移酶组合。在一些另外的实施方案中,本发明提供了用于产生莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷I的条件下将甜菊苷底物、NDP-葡萄糖和糖基转移酶组合。在一些本发明的实施方案中,NDP-葡萄糖选自ADP-葡萄糖、CDP-葡萄糖、TDP-葡萄糖、GDP-葡萄糖和/或IDT葡萄糖。在一些另外的实施方案中,NDP-葡萄糖不是UDP-葡萄糖。
本发明还提供了用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷D的条件下将甜菊苷底物、NDP-葡萄糖和糖基转移酶组合。在一些本发明的实施方案中,NDP-葡萄糖选自ADP-葡萄糖、CDP-葡萄糖、TDP-葡萄糖、GDP-葡萄糖和/或IDT葡萄糖。在一些另外的实施方案中,NDP-葡萄糖不是UDP-葡萄糖。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D和/或莱鲍迪苷I底物、ADP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D和/或莱鲍迪苷I底物、ADP-葡萄糖以及糖基转移酶组合。在一些实施方案中,本发明提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D底物、ADP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D底物、ADP-葡萄糖和糖基转移酶组合。在一些另外的实施方案中,本发明提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷I底物、ADP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷I底物、ADP-葡萄糖和糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。
本发明还提供了用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将甜菊苷底物、ADP-葡萄糖和糖基转移酶组合。在一些实施方案中,本发明提供了用于产生莱鲍迪苷A的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷A的条件下将甜菊苷底物、ADP-葡萄糖和糖基转移酶组合。在一些另外的实施方案中,本发明提供了用于产生莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷I的条件下将甜菊苷底物、ADP-葡萄糖和糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。
本发明还提供了用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷D的条件下将甜菊苷底物、ADP-葡萄糖和糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。在一些另外的实施方案中,NDP选自ADP、CDP、TDP、GDP和/或IDT。在一些另外的实施方案中,NDP不是UDP。
本发明还提供了用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。在一些实施方案中,本发明提供了用于产生莱鲍迪苷A的方法,所述方法包括提供甜菊糖苷底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷A的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。在一些另外的实施方案中,本发明提供了用于产生莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷I的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。在一些另外的实施方案中,NDP选自ADP、CDP、TDP、GDP和/或IDT。在一些另外的实施方案中,NDP不是UDP。
本发明还提供了用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷D的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。在一些另外的实施方案中,NDP选自ADP、CDP、TDP、GDP和/或IDT。在一些另外的实施方案中,NDP不是UDP。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供包括至少一种甜菊苷和/或甜菊苷与rebA的混合物的甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种本文提供的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。在一些另外的实施方案中,NDP选自ADP、CDP、TDP、GDP和/或IDT。在一些另外的实施方案中,NDP不是UDP。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、至少一种蔗糖合酶、和至少一种本文提供的工程化糖基转移酶,在使得首先产生莱鲍迪苷A、然后产生莱鲍迪苷D和/或莱鲍迪苷I、且最后产生莱鲍迪苷M的条件下,将甜菊苷底物、NDP和糖基转移酶组合。在一些本发明的实施方案中,工程化糖基转移酶包括ADP-糖基转移酶。在一些另外的实施方案中,NDP选自ADP、CDP、TDP、GDP和/或IDT。在一些另外的实施方案中,NDP不是UDP。
在用于产生莱鲍迪苷的本发明的方法的一些实施方案中,方法以一锅(one-pot)反应来进行。在一些另外的实施方案中,方法相继地进行。在一些另外的实施方案中,方法还包括重复方法的步骤。在一些另外的实施方案中,蔗糖在重复步骤期间被再循环。在一些另外的实施方案中,至少一种工程化糖基转移酶和/或其他反应组分被再循环。在一些另外的实施方案中,甜菊苷底物是从甜叶菊(Stevia rebaudiana)提取的,而在一些可选择的实施方案中,甜菊苷底物是合成产生的,并且在又一些另外的实施方案中,甜菊苷底物是天然和/或合成产生的甜菊苷的混合物。在方法的一些另外的实施方案中,至少一种工程化糖基转移酶是被固定的。在方法的一些另外的实施方案中,蔗糖合酶是被固定的。在又一些另外的实施方案中,至少一种糖基转移酶和/或蔗糖合酶是被固定的。在方法的一些另外的实施方案中,产生包括果糖的反应产物。在一些实施方案中,将果糖从反应产物去除。在又一些另外的实施方案中,方法还包括洗涤步骤。在一些实施方案中,洗涤步骤包括将由该方法产生的莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和/或莱鲍迪苷D暴露于溶剂。在一些实施方案中,溶剂是水。在又另外的实施方案中,方法还包括至少一个柱层析步骤。在一些实施方案中,对由该方法产生的莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和/或莱鲍迪苷D进行至少一个柱层析步骤。在方法的一些另外的实施方案中,至少一种工程化糖基转移酶是本文提供的β-1,2糖基转移酶。在方法的一些另外的实施方案中,至少一种工程化糖基转移酶是本文提供的β-1,3糖基转移酶。在方法的又一些另外的实施方案中,至少一种工程化糖基转移酶是本文提供的β-1,2糖基转移酶,并且至少一种另外的工程化糖基转移酶是本文提供的β-1,3糖基转移酶。在方法的一些另外的实施方案中,可使用至少一种本文提供的工程化蔗糖合酶。
在本文提供的方法中,可使用包含与以下序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列的至少一种工程化糖基转移酶:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、22、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974、976、978、980、982、984、986、988、990、992、994、996、998、1000、1002、1004、1006、1008、1010、1012、1014、1016、1018、1020、1022、1024、1026、1028、1030、1032、1034、1036、1038、1040、1042、1044、1046、1048、1050、1052、1054、1056、1058、1060、1062、1064、1066、1068、1070、1072、1074、1076、1078、1290、1292、1294、2596、2598、2600、2602、2604、2606、2608、2610、2612、2614、2616、2618、2620、2622、2624、2626、2628、2630、2632、2634、2636、2638、2640、2642、2644、2646、2648、2650、2652、2654、2656、2658、2660、2662、2664、2666、2668、2670、2672、2674、2676、2678、2680、2682、2684、2686、2688、2690、2692、2694、2696、2698、2700、2702、2704、2706、2708、2710、2712、2714、2716、2718、2720、2722、2724、2726、2728、2730、2732、2734、2736、2738、2740、2742、2744、2746、2748、2750、2752、2754、2756、2758、2760、2762、2764、2766、2768、2770、2772、2774、2776、2778、2780、2782、2784、2786、2788、2790、2792、2794、2796、2798、2800、2802、2804、2806、2808、2810、2812、2814、2816、2818、2820、2822、2824、2826、2828、2830、2832、2834、2836、2838、2840、2842、2844、2846、2848、2850、2852、2854、2856、2858、2860、2862、2864、2866、2868、2870、2872、2874、2876、2878、2880、2882、2884、2886、2888、2890、2892、2894、2896、2898、2900、2902、2904、2906、2908、2910、2912、2914、2916、2918、2920、2922、2924、2926、2928、2830、2932、2934、2936、2938、2940、2942、2944、2946、2948、2950、2952、2954、2956、2958、2960、2962、2964、2966、2968、2970、2972、2974、2976、2978、2980、2982、2984、2986、2988、2990、2992、2994、2996、2998、3000、3002、3004、3006、3008、3010、3012、3014、3016、3018、3020、3022、3024、3026、3028、3030、3032、3034、3036、3038、3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062、3064、3066、3068、3070、3072、3074、3076、3078、3080、3082、3084、3086、3088、3090、3092、3094、3096、3098、3100、3102、3104、3106、3108、3110、3112、3114、3116、3118、3120、3122、3124、3126、3128、3130、3132、3134、3136、3138、3140、3142、3144、3146、3148、3150、3152、3154、3156、3158、3160、3162、3164、3166、3168、3170、3172、3174、3176、3178、3180、3182、3184、3186、3188、3190、3192、3194、3196、3198、3200、3202、3204、3206、3208、3210、3212、3214、3216、3218、3220、3222、3224、3226、3228、3230、3232、3234、3236、3238、3240、3242、3244、3246、3248、3250、3252、3254、3256、3258、3260、3262、3264、3266、3268、3270、3272、3274、3276、3278、3280、3282、3284、3286、3288、3290、3292、3294、3296、3298、3300、3302、3304、3306、3308、3310、3312、3314、3316、3318、3320、3322、3324、3326、3328、3330、3332、3334、3336、3338、3340、3342、3344、3346、3348、3350、3352、3354、3356、3358、3360、3362、3364、3366、3368、3370、3372、3374、3376、3378、3380、3382、3384、3386、3388、3390、3392、3394、3396、3398、3400、3402、3404、3406、3408、3410、3412、3414、3416、3418、3420、3422、3424、3426、3428、3430、3432、3434、3436、3438、3440、3442、3444、3446、3448、3450、3452、3454、3456、3458、3460、3462、3464、3466、3468、3470、3472、3474、3476、3478、3480、3482、3484、3486、3488、3490、3492、3494、3496、3498、3500、3502、3504、3506、3508、3510、3512、3514、3516、3518、3520、3522、3524、3526、3528、3530、3532、3534、3536、3538、3540、3542、3544、3546、3548、3550、3552、3554、3556、3558、3560、3562、3564、3566、3568、3570、3572、3574、3576、3578、3580、3582、3584、3586、3588、3590、3592、3594、3596、3598、3600、3602、3604、3606、3608、3610、3612、3614、3616、3618、3620、3622、3624、3626、3628、3630、3632、3634、3636、3638、3640、3642、3644、3646、3648、3650、3652、3654、3656、3658、3660、3662、3664、3666、3668、3670、3672、3674、3676、3678、3680、3682、3684、3686、3688、3690、3692、3694、3696、3698、3700、3702、3704、3706、3708、3710、3712、3714、3716、3718、3720、3722、3724、3726、3728、3730、3732、3734、3736、3738、3740、3742、3744、3746、3748、3750、3752、3754、3756、3758、3760、3762、3764、3766、3768、3770、3772、3774、3776、3778、3780、3782、3784、3786、3788、3790、3792、3794、3796、3798、3800、3802、3804、3806、3808、3810、3812、3814、3816、3818、3820、3822、3824、3826、3828、3830、3832、3834、3836、3838、3840、3842、3844、3846、3848、3850、3852、3854、3856、3858、3860、3862、3864、3866、3868、3870、3872、3874、3876、3878、3880、3882、3884、3886、3888、3890、3892、3894、3896、3898、3900、3902、3904、3906、3908、3910、3912、3914、3916、3918、3920、3922、3924、3926、3928、3930、3932、3934、3936、3938、3940、3942、3944、3946、3948、3950、3952、3954、3956、3958、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020、4022、4024、4026、4028、4030、4032、4034、4036、4038、4040、4042、4044、4046、4048、4050、4052、4054、4056、4058、4060、4062、4064、4066、4068、4070、4072、4074、4076、4078、4080、4082、4084、4086、4088、4090、4092、4094、4096、4098、4100、4102、4104、4106、4108、4110、4112、4114、4116、4118、4120、4122、4124、4126、4128、4130、4132、4134、4136、4138、4140、4142、4144、4146、4148、4150、4152、4154、4156、4158、4160、4162、4164、4166、4168、4170、4172、4174、4176、4178、4180、4182、4184、4186、4188、4190、4192、4194、4196、4198、4200、4202、4204、4206、4208、4210、4212、4214、4216、4218、4220、4222、4224、4226、4228、4230、4232、4234、4236、4238、4240、4242、4244、4246、4248、4250、4252、4254、4256、4258、4260、4262、4264、4266、4268、4270、4272、4274、4276、4278、4280、4282、4284、4286、4288、4290、4292、4294、4296、4298、4300、4302、4304、4306、4308、4310、4312、4314、4316、4318、4320、4322、4324、4326、4328、4330、4332、4334、4336、4338、4340、4342、4344、4346、4348、4350、4352、4354、4356、4358、4360、4362、4364、4366、4368、4370、4372、4374、4376、4378、4380、4382、4384、4386、4388、4390、4392、4394、4396、4398、4400、4402、4404、4406、4408、4410、4412、4414、4416、4418、4420、4422、4424、4426、4428、4430、4432、4434、4436、4438、4440、4442、4444、4446、4448、4450、4452、4454、4456、4458、4460、4462、4464、4466、4468、4470、4472、4474、4476、4478、4480、4482、4484、4486、4488、4490、4492、4494、4496、4498、4500、4502、4504、4506、4508、4510、4512、4514、4516、4518、4520、4522、4524、4526、4528、4530、4532、4534、4536、4538、4540、4542、4544、4546、4548、4550、4552、4554、4556、4558、4560、4562、4564、4566、4568、4570、4572、4574、4576、4578、4580、4582、4584、4586、4588、4590、4592、4594、4596、4598、4600、4602、4604、4606、4608、4610、4612、4614、4616、4618、4620、4622、4624、4626、4628、4630、4632、4634、4636、4638、4640、4642、4644、4646、4648、4650、4652、4654、4656、4658、4660、4662、4664、4666、4668、4670、4672、4674、4676、4678、4680、4682、4684、4686、4688、4690、4692、4694、4696、4698、4700、4702、4704、4706、4708、4710、4712、4714、4716、4718、4720、4722、4724、4726、4728、4730、4732、4734、4736、4738、4740、4742、4744、4746、4748、4750、4752、4754、4756、4758、4760、4762、4764、4766、4768、4770、4772、4774、4776、4778、4780、4782、4784、4786、4788、4790、4792、4794、4796、4798、4800、4902、4804、4806、4808、4810、4812、4814、4816、4818、4820、4822、4824、4826、4828、4830、4832、4834、4836、4838、4840、4842、4844、4846、4848、4850、4852、4854、4856、4858、4860、4862、4864、4866、4868、4870、4872、4874、4876、4878、4880、4882、4884、4886、4888、4890、4892、4894、4896、4898、4900、4902、4904、4906、4908、4910、4912、4914、4916、4918、4920、4922、4924、4926、4928、4930、4932、4934、4936、4938、4940、4942、4944、4946、4948、4950、4952、4954、4956、4958、4960、4962、4964、4966、4968、4970、4972、4974、4976、4978、4980、4982、4984、4986、4988、4990、4992、4994、4996、4998、5000、5002、5004、5006、5008、5010、5012、5014、5016、5018、5020、5022、5024、5026、5028、5030、5032、5034、5036、5038、5040、5042、5044、5046、5048、5050、5052、5054、5056、5058、5060、5062、5064、5066、5068、5070、5072、5074、5076、5078、5080、5082、5084、5086、5088、5090、5092、5094、5096、5098、5100、5102、5104、5106、5108、5110、5112、5114、5116、5118、5120、5122、5124、5126、5128、5130、5132、5134、5136、5138、5140、5142、5144、5146、5148、5150、5152、5154、5156、5158、5160、5162、5164、5166、5168、5170、5172、5174、5176、5178、5180、5182、5184、5186、5188、5190、5192、5194、5196、5198、5200、5202、5204、5206、5208、5210、5212、5214、5216、5218、5220、5222、5224、5226、5228、5230、5232、5234、5236、5238、5240、5242、5244、5246、5248、5250、5252、5254、5256、5258、5260、5262、5264、5266、5268、5270、5272、5274、5276、5278、5280、5282、5284、5286、5288、5290、5292、5294、5296、5298、5300、5302、5304、5306、5308、5310、5312、5314、5316、5318、5320、5322、5324、5326、5328、5330、5332、5334、5336、5338、5340、5342、5344、5346、5348、5350、5352、5354、5356、5358、5360、5362、5364、5366、5368、5370、5372、5374、5376、5378、5380、5382、5384、5386、5388、5390、5392、5394、5396、5398、5400、5402、5404、5406、5408、5410、5412、5414、5416、5418、5420、5422、5424、5426、5428、5430、5432、5434、5436、5438、5440、5442、5444、5446、5448、5450、5452、5454、5456、5458、5460、5462、5464、5466、5468、5470、5472、5474、5476、5478、5480、5482、5484、5486、5488、5490、5492、5494、5496、5498、5500、5502、5504、5506、5508、5510、5512、5514、5516、5518、5520、5522、5524、5526、5528、5530、5532、5534、5536、5538、5540、5542、5544、5546、5548、5550、5552、5554、5556、5558、5560、5562、5564、5566、5568、5570、5572、5574、5576、5578、5580、5582、5584、5586、5588、5590、5592、5594、5596、5598、5600、5602、5604、5606、5608、5610、5612、5614、5616、5618、5620、5622、5624、5626、5628、5630、5632、5634、5636、5638、5640、5642、5644、5646、5648、5650、5652、5654、5656、5658、5660、5662、5664、5666、5668、5670、5672、5674、5676、5678、5680、5682、5684、5686、5688、5690、5692、5694、5696、5698、5700、5702、5704、5706、5708、5710、5712、5714、5716、5718、5720、5722、5724、5726、5728、5730、5732、5734、5736、5738、5740、5742、5744、5746、5748、5750、5752、5754、5756、5758、5760、5762、5764、5766、5768、5770、5772、5774、5776、5778、5780、5782、5784、5786、5788、5790、5792、5794、5796、5798、5800、5802、5804、5806、5808、5810、5812、5814、5816、5818、5820、5822、5824、5826、5828、5830、5832、5834、5836、5838、5840、5842、5844、5846、5848、5850、5852、5854、5856、5858、5860、5862、5864、5866、5868、5870、5872、5874、5876、5878、5880、5882、5884、5886、5888、5890、5892、5894、5896、5898、5900、5902、5904、5906、5908、5910、5912、5914、5916、5918、5920、5922、5924、5926、5928、5930、5932、5934、5936、5938、5940、5942、5944、5946、5948、5950、5952、5954、5956、5958、5960、5962、5964、5966、5968、5970、5972、5974、5976、5978、5980、5982、5984、5986、5988、5990、5992、5994、5996、5998、6000、6002、6004、6006、6008、6010、6012、6014、6016、6018、6020、6022、6024、6026、6028、6030、6032、6034、6036、6038、6040、6042、6044、6046、6048、6050、6052、6054、6056、6058、6060、6062、6064、6066、6068、6070、6072、6074、6076、6078、6080、6082、6084、6086、6088、6090、6092、6094、6096、6098、6100、6102、6104、6106、6108、6110、6112、6114、6116、6118、6120、6122、6124、6126、6128、6130、6132、6134、6136、6138、6140、6142、6144、6146、6148、6150、6152、6154、6156、6158、6160、6162、6164、6166、6168、6170、6172、6174、6176、6178、6180、6182、6184、6186、6188、6190、6192、6194、6196、6198、6200、6202、6204、6206、6208、6210、6212、6214、6216、6218、6220、6222、6224、6226、6228、6230、6232、6234、6236、6238、6240、6242、6244、6246、6248、6250、6252、6254、6256、6258、6260、6262、6264、6266、6268、6270、6272、6274、6276、6278、6280、6282、6284、6286、6288、6290、6292、6294、6296、6298、6300、6302、6304、6306、6308、6310、6312、6314、6316、6318、6320、6322、6324、6326、6328、6330、6332、6334、6336、6338、6340、6342、6344、6346、6348、6350、6352、6354、6356、6358、6360、6362、6364、6366、6368、6370、6372、6374、6376、6378、6380、6382、6384、6386、6388、6390、6392、6394、6396、6398、6400、6402、6404、6406、6408、6410、6412、6414、6416、6418、6420、6422、6424、6426、6428、6430、6432、6434、6436、6438、6440、6442、6444、6446、6448、6450、6452、6454、6456、6458、6460、6462、6464、6466、6468、6470、6472、6474、6476、6478、6480、6482、6484、6486、6488、6490、6492、6494、6496、6498、6500、6502、6504、6506、6508、6510、6512、6514、6516、6518、6520、6522、6524、6526、6528、6530、6532、6534、6536、6538、6540、6542、6544、6546、6548、6550、6552、6554、6556、6558、6560、6562、6564、6566、6568、6570、6572、6574、6576、6578、6580、6582、6584、6586、6588、6590、6592、6594、6596、6598、6600、6602、6604、6606、6608、6610、6612、6614、6616、6618、6620、6622、6624、6626、6628、6630、6632、6634、6636、6638、6640、6642、6644、6646、6648、6650、6652、6654、6656、6658、6660、6662、6664、6666、6668、6670、6672、6674、6676、6678、6680、6682、6684、6686、6688、6690、6692、6694、6696、6698、6700、6702、6704、6706、6708、6710、6712、6714、6716、6718、6720、6722、6724、6726、6728、6730、6732、6734、6736、6738、6740、6742、6744、6746、6748、6750、6752、6754、6756、6758、6760、6762、6764、6766、6768、6770、6772、6774、6776、6778、6780、6782、6784、6786、6788、6790、6792、6794、6796、6798、6800、6802、6804、6806、6808、6810、6812、6814、6816、6818、6820、6822、6824、6826、6828、6830、6832、6834、6836、6838、6840、6842、6844、6846、6848、6850、6852、6854、6856、6858、6860、6862、6864、6866、6868、6870、6872、6874、6876、6878、6880、6882、6884、6886、6888、6890、6892、6894、6896、6898、6900、6902、6904、6906、6908、6910、6912、6914、6916、6918、6920、6922、6924、6926、6928、6930、6932、6934、6936、6938、6940、6942、6944、6946、6948、6950、6952、6954、6956、6958、6960、6962、6964、6966、6968、6970、6972、6974、6976、6978、6980、6982、6984、6986、6988、6990、6992、6994、6996、6998、7000、7002、7004、7006、7008、7010、7012、7014、7016、7018、7020、7022、7024、7026、7028、7030、7032、7034、7036、7038、7040、7042、7044、7046、7048、7050、7052、7054、7056、7058、7060、7062、7064、7066、7068、7070、7072、7074、7076、7078、7080、7082、7084、7086、7088、7090、7092、7094、7096、7098、7100、7102、7104、7106、7108、7110、7112、7114、7116、7118、7120、7122、7124、7126、7128、7130、7132、7134、7136、7138、7140、7142、7144、7146、7148、7150、7152、7154、7156、7158、7160、7162、7164、7166、7168、7170、7172、7174、7176、7178、7180、7182、7184、7186、7188、7190、7192、7194、7196、7198、7200、7202、7204、7206、7208、7210、7212、7214、7216、7218、7220、7222、7224、7226、7228、7230、7232、7234、7236、7238、7240、7242、7244、7246、7248、7250、7252、7254、7256、7258、7260、7262、7264、7266、7268、7270、7272、7274、7276、7278、7280、7282、7284、7286、7288、7290、7292、7294、7296、7298、7300、7302、7304、7306、7308、7310、7312、7314、7316、7318、7320、7322、7324、7326、7328、7330、7332、7334、7336、7338、7340、7342、7344、7346、7348、7350、7352、7354、7356、7358、7360、7362、7364、7366、7368、7370、7372、7374、7376、7378、7380、7382、7384、7386、7388、7390、7392、7394、7396、7398、7400、7402、7404、7406、7408、7410、7412、7414、7416、7418、7420、7422、7424、7426、7428、7430、7432、7434、7436、7766、7768、7770、7772、7774、7776、7778、7780、7782、7784、7786、7788、7790、7792、7794、7796、7798、7800、7812、7814、7816、7818、7820、7822、7824、7826、7828、7830、7832、7834、7836、7838、7840、7842、7844、7846、7848、7850、7852、7854、7856、7858、7860、7862、7864、7866、7868、7870、7872、7874、7876、7878、7880、7882、7884、7886、7888、7890、7892、7894、7896、7898、7900、7902、7904、7906、7908、7910、7912、7914、7916、7918、7920、7922、7924、7926、7928、7930、7932、7934、7936、7938、7940、7942、7944、7946、7948、7950、7952、7954、7956、7958、7960、7962、7964、7966、7968、7970、7972、7974、7976、7978、7980、7982、7984、7986、7988、7990、7992、7994、7996、7998、8000、8002、8004、8006、8008、8010、8012、8014、8016、8018、8020、8022、8024、8026、8028、8030、8032、8034、8036、8038、8040、8042、8044、8046、8048、8050、8052、8054、8056、8058、8060、8062、8064、8066、8068、8070、8072、8074、8076、8078、8080、8082、8084、8086、8088、8090、8092、8094、8096、8098、8100、8102、8104、8106、8108、8110、8112、8114、8116、8118、8120、8122、8124、8126、8128、8130、8132、8134、8136、8138、8140、8142、8144、8146、8148、8150、8152、8154、8156、8158、8160、8162、8164、8166、8168、8170、8172、8174、8176、8178、8180、8182、8184、8186、8188、8190、8192、8194、8196、8198、8200、8202、8204、8206、8208、8210、8212、8214、8216、8218、8220、8222、8224、8226、8228、8230、8232、8234、8236、8238、8240、8242、8244、8246、8248、8250、8252、8254、8256、8258、8260、8262、8264、8266、8268、8270、8272、8274、8276、8278、8280、8282、8284、8286、8288、8290、8292、8294、8296、8298、8300、8302、8304、8306、8308、8310、8312、8314、8316、8318、8320、8322、8324、8326、8328、8330、8332、8334、8336、8338、8340、8342、8344、8346、8348、8350、8352、8354、8356、8358、8360、8362、8364、8366、8368、8482、8484、8486、8488、8490、8492、8494、8496、8498、8500、8502、8504、8506、8508、8510、8512、8514、8516、8518、8520、8522、8524、8526、8528、8530、8532、8534、8536、8538、8540、8542、8544、8546、8548、8550、8552、8554、8556、8558、8560、8562、8564、8566、8568、8570、8572、8574、8576、8578、8580、8582、8584、8586、8588、8590、8592、8594、8596、8598、8600、8602、8604、8606、8608、8610、8612、8614、8616、8618、8620、8622、8624、8626、8628、8630、8632、8634、8636、8638、8640、8642、8644、8646、8648、8650、8652、8654、8656、8658、8660、8662、8664、8666、8668、8670、8672、8674、8676、8678、8680、8682、8684、8686、8688、8690、8692、8694、8696、8698、8700、8702、8704、8706、8708、8710、8712、8714、8716、8718、8720、8722、8724、8726、8728、8730、8732、8734、8736、8738、8740、8742、8744、8746、8748、8750、8752、8754、8756、8758、8760、8762、8764、8766、8768、8770、8772、8774、8776、8778、8780、8782、8784、8786、8788、8790、8792、8794、8796、9108、9110、9112、9114、9116、9118、9120、9122、9124、9126、9128、9130、9132、9134、9136、9138、9140、9142、9144、9146、9148、9150、9152、9154、9156、9158、9160、9162、9164、9166、9168、9170、9172、9174、9176、9178、9180、9182、9184、9186、9188、9190、9192、9194、9196、9198、9200、9202、9204、9206、9208、9210、9212、9214、9216、9218、9220、9222、9224、9226、9228、9230、9232、9234、9236、9238和/或9240。
在本文提供的方法中,可使用包含与以下序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列的至少一种工程化糖基转移酶:SEQ ID NO:1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142、1144、1146、1148、1150、1152、1154、1156、1158、1160、1162、1164、1166、1168、1170、1172、1174、1176、1178、1180、1182、1184、1186、1188、1190、1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218、1220、1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286、1288、1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390、1392、1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564、1566、1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596、1598、1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770、1772、1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818、1820、1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982、1984、1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316、2318、2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500、2502、2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592、2594、7438、7440、7442、7444、7446、7448、7450、7452、7454、7456、7458、7460、7462、7464、7466、7468、7470、7472、7474、7476、7478、7480、7482、7484、7486、7488、7490、7492、7494、7496、7498、7500、7502、7504、7506、7508、7510、7512、7514、7516、7518、7520、7522、7524、7526、7528、7530、7532、7534、7536、7538、7540、7542、7544、7546、7548、7550、7552、7554、7556、7558、7560、7562、7564、7566、7568、7570、7572、7574、7576、7578、7580、7582、7584、7586、7588、7590、7592、7594、7596、7598、7600、7602、7604、7606、7608、7610、7612、7614、7616、7618、7620、7622、7624、7626、7628、7630、7632、7634、7636、7638、7640、7642、7644、7646、7648、7650、7652、7654、7656、7658、7660、7662、7664、7666、7668、7670、7672、7674、7676、7678、7680、7682、7684、7686、7688、7690、7692、7694、7696、7698、7700、7702、7704、7706、7708、7710、7712、7714、7716、7718、7720、7722、7724、7726、7728、7730、7732、7734、7736、7738、7740、7742、7744、7746、7748、7750、7752、7754、7756、7758、7760、7762、7764、8370、8372、8374、8376、8378、8380、8382、8384、8386、8388、8390、8392、8394、8396、8398、8400、8402、8404、8406、8408、8410、8412、8414、8416、8418、8420、8422、8424、8426、8428、8430、8432、8434、8436、8438、8440、8442、8444、8446、8448、8450、8452、8454、8456、8458、8460、8462、8464、8466、8468、8470、8472、8474、8476、8478、8480、8798、8800、8802、8804、8806、8808、8810、8812、8814、8816、8818、8820、8822、8824、8826、8828、8830、8832、8834、8836、8838、8840、8842、8844、8846、8848、8850、8852、8854、8856、8858、8860、8862、8864、8866、8868、8870、8872、8874、8876、8878、8880、8882、8884、8886、8888、8890、8892、8894、8896、8898、8900、8902、8904、8906、8908、8910、8912、8914、8916、8918、8920、8922、8924、8926、8928、8930、8932、8934、8936、8938、8940、8942、8944、8946、8948、8950、8952、8954、8956、8958、8960、8962、8964、8966、8968、8970、8972、8974、8976、8978、8980、8982、8984、8986、8988、8990、8992、8994、8996、8998、9000、9002、9004、9006、9008、9010、9012、9014、9016、9018、9020、9022、9024、9026、9028、9030、9032、9034、9036、9038、9040、9042、9044、9046、9048、9050、9052、9054、9056、9058、9060、9062、9064、9066、9068、9070、9072、9074、9076、9078、9080、9082、9084、9086、9088、9090、9092、9094、9096、9098、9100、9102、9104和/或9106。
本发明还提供了莱鲍迪苷和包含根据本文提供的方法产生的莱鲍迪苷的组合物。在一些实施方案中,莱鲍迪苷是莱鲍迪苷M,而在一些可选择的实施方案中,莱鲍迪苷是莱鲍迪苷A,并且在又另外的实施方案中,莱鲍迪苷是莱鲍迪苷I,以及在一些另外的实施方案中,莱鲍迪苷是莱鲍迪苷D。在一些另外的实施方案中,本发明提供了根据本文提供的方法产生的莱鲍迪苷的混合物和其他感兴趣的组分,所述莱鲍迪苷的混合物包括莱鲍迪苷的任何组合浓度的莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和/或莱鲍迪苷D的混合物。在一些实施方案中,本发明提供了包括莱鲍迪苷的任何组合浓度的莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和/或莱鲍迪苷D的混合物和其他感兴趣的组分的组合物。事实上,并不意图本发明受限于根据本发明的方法产生的莱鲍迪苷的任何特定组合或混合物。
本发明提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D和/或莱鲍迪苷I底物、NDP-葡萄糖、和至少一种本文提供的工程化NDP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D和莱鲍迪苷I底物、NDP-葡萄糖以及NDP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D底物、NDP-葡萄糖、和至少一种本文提供的工程化NDP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D底物、NDP-葡萄糖以及NDP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷I底物、NDP-葡萄糖、和至少一种本文提供的工程化NDP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷I底物、NDP-葡萄糖以及NDP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化NDP-糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将甜菊苷底物、NDP-葡萄糖和NDP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷A的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化NDP-糖基转移酶,在使得产生莱鲍迪苷A的条件下将甜菊苷底物、NDP-葡萄糖和NDP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化NDP-糖基转移酶,在使得产生莱鲍迪苷I的条件下将甜菊苷底物、NDP-葡萄糖和NDP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种本文提供的工程化NDP-糖基转移酶,在使得产生莱鲍迪苷D的条件下将甜菊苷底物、NDP-葡萄糖和NDP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D和/或莱鲍迪苷I底物、ADP-葡萄糖、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D和/或莱鲍迪苷I底物、ADP-葡萄糖以及ADP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D底物、ADP-葡萄糖、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D底物、ADP-葡萄糖以及ADP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷I底物、ADP-葡萄糖、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷I底物、ADP-葡萄糖以及ADP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将甜菊苷底物、ADP-葡萄糖和ADP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷A的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷A的条件下将甜菊苷底物、ADP-葡萄糖和ADP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷I的条件下将甜菊苷底物、ADP-葡萄糖和ADP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种本文提供的工程化ADP-糖基转移酶、和/或118,在使得产生莱鲍迪苷D的条件下将甜菊苷底物、ADP-葡萄糖和ADP-糖基转移酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷I底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷I底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷I和/或莱鲍迪苷D底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将莱鲍迪苷D底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了用于产生莱鲍迪苷A的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷A的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了用于产生莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷D的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了用于产生莱鲍迪苷M的方法,所述方法包括提供包括至少一种甜菊苷和/或甜菊苷与rebA的混合物的甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种本文提供的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷M的条件下将甜菊苷底物、NDP、蔗糖、蔗糖合酶和ADP-糖基转移酶组合。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。在一些实施方案中,可用除蔗糖以外的糖与适当的合酶组合。
本发明还提供了产生莱鲍迪苷M的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、至少一种蔗糖合酶、和至少一种本文提供的工程化ADP-糖基转移酶,在使得首先产生莱鲍迪苷A、然后产生莱鲍迪苷D和/或莱鲍迪苷I、且最后产生莱鲍迪苷M的条件下,将甜菊苷底物、NDP和ADP-糖基转移酶组合。在一些实施方案中,该方法还包括蔗糖和蔗糖合酶。在一些实施方案中,蔗糖合酶是本文提供的工程化蔗糖合酶。
在一些实施方案中,本发明提供的方法以一锅反应来进行,而在一些可选择的实施方案中,方法在多个反应容器中进行。在一些实施方案中,方法在单个反应容器中进行和/或以相继方式在多个反应容器中进行。在一些实施方案中,方法步骤被重复(即,存在方法的一些或所有步骤的多次迭代)。在一些实施方案中,蔗糖在重复步骤期间被再循环。在一些另外的实施方案中,工程化糖基转移酶和/或其他反应组分(例如辅因子)被再循环。在方法的一些实施方案中,甜菊苷底物是从甜菊提取的,而在一些可选择的方法中,甜菊苷底物是合成产生的。在一些另外的实施方案中,糖基转移酶是被固定的。在一些另外的实施方案中,蔗糖合酶是被固定的。在一些另外的实施方案中,糖基转移酶和/或蔗糖合酶被是固定的。在方法的一些实施方案中,产生果糖。在一些另外的实施方案中,将果糖从反应产物去除。
本发明还提供了包含至少一种本文提供的工程化糖基转移酶变体的组合物。本发明还提供了包含至少一种如本文提供的非天然存在的糖基转移酶变体的组合物。
本发明还提供了用于底物糖基化以产生β-糖基化产物的方法,所述方法包括以下步骤:提供至少一种糖基基团供体、至少一种糖基基团受体和至少一种糖基转移酶;在使得糖基基团受体被糖基化以产生至少一种具有β-葡萄糖键的产物的条件下,使糖基基团供体和糖基基团受体与糖基转移酶接触。在方法的一些实施方案中,糖基基团供体是核苷酸二磷酸糖,例如腺嘌呤二磷酸葡萄糖(ADP-葡萄糖)。在方法的一些另外的实施方案中,糖基基团受体选自糖基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、杂环烷基、杂芳基和杂芳基烷基基团。在方法的一些又另外的实施方案中,具有β-葡萄糖键的产物是甜菊醇糖苷。在方法的一些另外的实施方案中,糖基基团受体是莱鲍迪苷D,糖基基团供体是ADP-葡萄糖,并且具有β-葡萄糖键的产物是莱鲍迪苷M。在方法的一些另外的实施方案中,糖基基团受体是甜菊苷,糖基基团供体是ADP-葡萄糖,并且具有β-葡萄糖键的产物是莱鲍迪苷A或莱鲍迪苷I。
本发明还提供了用于产生核苷二磷酸葡萄糖的方法,所述方法包括以下步骤:提供核苷二磷酸依赖性合酶、核苷二磷酸和合酶的二糖、三糖或寡糖底物;在使得糖被裂解以产生较低分子量的糖和核苷二磷酸葡萄糖的条件下,使合酶、核苷二磷酸和糖接触。在方法的一些实施方案中,该方法与先前描述的方法相组合。在方法的一些另外的实施方案中,核苷二磷酸是ADP,核苷二磷酸葡萄糖是ADP-葡萄糖,且合酶底物是蔗糖。
附图描述
图1提供了一种酶促反应方案,其中糖基转移酶催化葡糖基基团从核苷二磷酸葡萄糖(NDP-葡萄糖)例如ADP-葡萄糖转移到受体例如R-OH,其中R是任何糖基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、杂环烷基、杂芳基或杂芳基烷基基团。在一个另外的实施方案中,R-OH是甜菊苷或莱鲍迪苷D,并且产物是莱鲍迪苷A、莱鲍迪苷I或莱鲍迪苷M。核苷二磷酸依赖性合酶催化葡糖基基团从葡萄糖供体(例如蔗糖)转移到核苷二磷酸,再生NDP-葡萄糖并释放副产物(例如果糖)。
图2提供了莱鲍迪苷M的结构,其中碳被编号。
图3提供了莱鲍迪苷I的结构,其中碳被编号。
发明描述
本发明提供了工程化糖基转移酶(GT)酶、具有GT活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明提供了工程化蔗糖合酶(SuS)酶、具有SuS活性的多肽和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了包含GT酶的组合物和使用工程化GT酶来制备具有β-葡萄糖键的产物的方法。本发明还提供了用于产生莱鲍迪苷(例如莱鲍迪苷M、莱鲍迪苷A、莱鲍迪苷I和莱鲍迪苷D)的组合物和方法。本发明还提供了包含SuS酶的组合物及使用其的方法。还提供了用于产生GT和SuS酶的方法。
除非另外定义,否则本文使用的所有技术和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常,本文所用的命名法和以下所述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学的实验室程序是本领域熟知并通常使用的那些。这些技术是熟知的,并在本领域技术人员熟知的许多文本和参考文献中进行了描述。标准技术或其改变被用于化学合成和化学分析。本文(上文和下文两者)提及的所有专利、专利申请、文章和公布物,特此通过引用明确并入本文。
尽管与本文描述那些相似或等同的任何合适的方法和材料可用于本发明的实践,但是本文描述了一些方法和材料。应当理解本发明不限于所描述的特定方法、方案和试剂,因为依赖于本领域技术人员使用其的情况,这些可以变化。因此,以下紧接着定义的术语通过参考作为整体的本发明而被更充分地描述。
应当理解,前述一般性描述和以下详细描述仅是示例性和说明性的,而不是限制本发明。本文使用的章节标题仅用于组织目的,并且不应当被解释为限制所述主题。数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这些较宽数值范围内的每个较窄数值范围,如同这些较窄数值范围在本文中被全部明确记录。还意图本文公开的每个最大(或最小)的数值限制包括每个较低(或较高)的数值限制,如同这些较低(或较高)的数值限制在本文中被明确记录。
缩写
用于遗传编码的氨基酸的缩写是惯例的并且如下:
氨基酸 三字母缩写 一字母缩写
丙氨酸 Ala A
精氨酸 Arg R
天冬酰胺 Asn N
天冬氨酸 Asp D
半胱氨酸 Cys C
谷氨酸 Glu E
谷氨酰胺 Gln Q
甘氨酸 Gly G
组氨酸 His H
异亮氨酸 Ile I
亮氨酸 Leu L
赖氨酸 Lys K
甲硫氨酸 Met M
苯丙氨酸 Phe F
脯氨酸 Pro P
丝氨酸 Ser S
苏氨酸 Thr T
色氨酸 Trp W
酪氨酸 Tyr Y
缬氨酸 Val V
当使用三字母缩写时,除非前面具体地有“L”或“D”,或者从使用缩写的上下文明确,否则氨基酸可以关于α-碳(Cα)是L-构型或D-构型。例如,虽然“Ala”表示丙氨酸而不指定关于α-碳的构型,但是“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用一字母缩写时,大写字母表示呈关于α-碳的L-构型的氨基酸,且小写字母表示呈关于α-碳的D-构型的氨基酸。例如“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列以一字母或三字母缩写(或其混合)的串呈现时,根据通常惯例将序列以氨基(N)至羧基(C)方向呈现。
用于遗传编码核苷的缩写是惯例的并且如下:腺苷(A)、鸟苷(G)、胞苷(C)、胸苷(T)和尿苷(U)。除非具体描述,否则缩写的核苷可以是核糖核苷或2'-脱氧核糖核苷。核苷可以单独地或总体地指定为核糖核苷或2'-脱氧核糖核苷。当核酸序列以一字母缩写的串呈现时,根据通常惯例将序列以5'至3'方向呈现,并且不示出磷酸。
定义
参考本发明,本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另外具体定义。因此,意图以下术语具有以下含义。
如本文使用的,单数形式“一(a)”、“一(an)”和“该(the)”包括复数指代,除非上下文另外明确指明。因此,例如对“多肽(apolypeptide)”的提及包括多于一个多肽。
相似地,“包括/包含(comprise)”、“包括/包含(comprises)”、“包括/包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”是可互换的,而不意图是限制性的。因此,如本文使用的,术语“包括/包含(comprising)”及其同源词以其包含性含义来使用(即,等同于术语“包括(including)”及其对应的同源词)。
还应当理解,在各种实施方案的描述中使用术语“包括/包含(comprising)”的情况下,本领域技术人员将理解,在一些特定情况下,可以使用语言“基本上由......组成”或“由......组成”来可选择地描述实施方案。
如本文使用的,术语“约”意指特定值的可接受的误差。在一些情况下,“约”意指在给定值范围的0.05%、0.5%、1.0%或2.0%内。在一些情况下,“约”意指在给定值的1、2、3或4个标准差内。
如本文使用的,“EC”数字指生物化学与分子生物学国际联合命名委员会(Nomenclature Committee of the International Union of BiochemistryandMolecular Biology,NC-IUBMB)的酶命名法。IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。
如本文使用的,“ATCC”指美国典型培养物保藏中心(American Type CultureCollection),其生物保藏收集包括基因和品系。
如本文使用的,“NCBI”指美国国家生物信息中心(National CenterforBiological Information)和在其中提供的序列数据库。
“蛋白”、“多肽”和“肽”在本文可互换使用,以表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如糖基化或磷酸化)。这个定义中包括D-氨基酸和L-氨基酸、及D-氨基酸和L-氨基酸的混合物、以及包含D-氨基酸和L-氨基酸及D-氨基酸和L-氨基酸的混合物的聚合物。
“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会(Biochemical Nomenclature Commission)推荐的一字母符号在本文被提及。同样地,核苷酸可以通过其通常公认的单字母代码被提及。
如本文使用的,“多核苷酸”和“核酸”指共价连接在一起的两个或更多个核苷酸。多核苷酸可以完全包含核糖核苷酸(即RNA)、完全包含2'脱氧核糖核苷酸(即DNA)、或包含核糖核苷酸和2'脱氧核糖核苷酸的混合物。虽然核苷通常通过标准磷酸二酯键连接在一起,但多核苷酸可以包括一个或更多个非标准键。多核苷酸可以是单链或双链的,或者可以包括单链区和双链区两者。此外,虽然多核苷酸将通常包含天然存在的编码核碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),它可以包含一种或更多种修饰的和/或合成的核碱基,诸如,例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中,这些修饰的或合成的核碱基是编码氨基酸序列的核碱基。
如本文使用的,“核苷”指包含核碱基(即含氮碱基)和5-碳糖(例如核糖或脱氧核糖)的糖基胺。核苷的非限制性实例包括胞苷、尿苷、腺苷、鸟苷、胸苷和肌苷。相比之下,术语“核苷酸”指包含核碱基、5-碳糖和一个或更多个磷酸基团的糖基胺。在一些实施方案中,核苷可以被激酶磷酸化以产生核苷酸。
如本文使用的,“核苷二磷酸”指包含核碱基(即含氮碱基)、5-碳糖(例如核糖或脱氧核糖)和二磷酸(即焦磷酸)部分的糖基胺。在本文的一些实施方案中,“核苷二磷酸”缩写为“NDP”。核苷二磷酸的非限制性实例包括胞苷二磷酸(CDP)、尿苷二磷酸(UDP)、腺苷二磷酸(ADP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)和肌苷二磷酸。在一些情况下术语“核苷”和“核苷酸”可以被可互换地使用。
如本文使用的,“编码序列”指编码蛋白的氨基酸序列的那部分核酸(例如基因)。
如本文使用的,术语“生物催化”、“生物催化的”、“生物转化”和“生物合成”指使用酶来对有机化合物进行化学反应。
如本文使用的,“糖基转移酶”(GT)指具有将糖基残基从活化的糖供体转移到单体和聚合受体分子的酶促能力的多肽。在一些实施方案中,糖基转移酶被称为“糖基转移酶变体”或“糖基转移酶组合变体”。在一些实施方案中,“糖基转移酶”指分类EC 2.4.1.17的UDP-葡萄糖醛酸基转移酶(glucuronosyltransferase)酶,其催化葡萄糖从UDP-α-D-葡萄糖醛酸(也称为UDP-葡萄糖)转移到受体,释放UDP并形成受体β-D-葡萄糖醛酸苷。碳水化合物活性酶数据库(Carbohydrate-Active Enzymesdatabase,CAZy)提供了糖基转移酶家族的持续更新的列表。在一些实施方案中,糖基转移酶包括但不限于归类到GT1家族中的酶。在一些优选的实施方案中,本发明的糖基转移酶变体优先地利用ADP-葡萄糖。在一些另外的实施方案中,本发明的糖基转移酶不利用UDP-葡萄糖。在一些另外的实施方案中,本发明的糖基转移酶变体利用ADP-葡萄糖、CDP-葡萄糖、TDP-葡萄糖、GDP-葡萄糖和/或IDT-葡萄糖,但不利用UDP-葡萄糖。因此,在一些优选的实施方案中,本发明提供了ADP-葡萄糖依赖性糖基转移酶(ADP-糖基转移酶;AGT)、CDP-葡萄糖依赖性糖基转移酶(CDP-糖基转移酶;CGT)、GDP-葡萄糖依赖性糖基转移酶(GDP-糖基转移酶;GGT)、TDP-葡萄糖依赖性糖基转移酶(TDP-糖基转移酶;TGT)和IDP-葡萄糖依赖性糖基转移酶(IDP-糖基转移酶;IGT)。
如本文使用的,“NDP-糖基转移酶”(NDP-GT)指具有将糖基残基从为NDP的活化的糖供体转移到单体和聚合受体分子的酶促能力的多肽。在一些实施方案中,NDP-糖基转移酶通常被称为“糖基转移酶”。事实上,如本文使用的术语“糖基转移酶”包括NDP-糖基转移酶,NDP-糖基转移酶包括但不限于ADP-葡萄糖依赖性糖基转移酶(ADP-糖基转移酶;AGT)、CDP-葡萄糖依赖性糖基转移酶(CDP-糖基转移酶;CGT)、GDP-葡萄糖依赖性糖基转移酶(GDP-糖基转移酶;GGT)、TDP-葡萄糖依赖性糖基转移酶(TDP-糖基转移酶;TGT)和IDP-葡萄糖依赖性糖基转移酶(IDP-糖基转移酶;IGT)。在一些实施方案中,本发明的糖基转移酶利用ADP-葡萄糖、CDP-葡萄糖、TDP-葡萄糖、GDP-葡萄糖和/或IDT-葡萄糖,但不利用UDP-葡萄糖。在一些另外的实施方案中,酶被称为“变体”或“组合变体”(例如ADP-糖基转移酶变体)。
如本文使用的,“转糖基作用”指其中将糖基残基从二糖、三糖或寡糖供体转移到非糖基化的或糖基化的受体分子的反应。
如本文使用的,“转葡糖基作用”指一种转糖基作用反应,其中被转移的糖基残基是葡萄糖,并且二糖、三糖或寡糖供体含有葡萄糖。
如本文使用的,“糖基化”指糖基残基和受体分子之间糖苷键的形成。
如本文使用的,“葡糖基化”指葡萄糖残基和受体分子之间糖苷键的形成。
如本文使用的,“糖基”指通过将半缩醛羟基基团从单糖、低寡糖或寡糖衍生物的环状形式去除而获得的单价自由基或取代基结构的有机基团。糖基基团与无机酸(例如磷酸)反应形成酯(例如葡萄糖1-磷酸酯)。
如本文使用的,“糖苷”指其中碳水化合物(例如糖)通过糖苷键与另一个官能团结合的分子。糖苷可以被水解产生糖和非糖(即苷元)组分。
如本文使用的,术语“甜菊醇糖苷”指甜菊醇的糖苷,包括但不限于天然存在的甜菊醇糖苷(例如,甜菊苷、甜菊醇单苷、甜菊醇双苷、甜茶苷、杜克苷(dulcoside)B、杜克苷A、莱鲍迪苷B、莱鲍迪苷G、莱鲍迪苷C、莱鲍迪苷F、莱鲍迪苷A、莱鲍迪苷I、莱鲍迪苷E、莱鲍迪苷H、莱鲍迪苷L、莱鲍迪苷K、莱鲍迪苷J、莱鲍迪苷M(也称为莱鲍迪苷X)、莱鲍迪苷D、莱鲍迪苷N、莱鲍迪苷O)和合成的甜菊醇糖苷(例如,酶促葡糖基化的甜菊醇糖苷)及其组合。甜菊醇及其糖苷的化学结构如下(参见WO 2013/176738)。
如本文使用的,“甜菊苷底物”指包括至少一种甜菊醇糖苷的任何合适的材料。
Figure BDA0002229282040002901
Figure BDA0002229282040002911
如本文使用的,“蔗糖合酶”指糖基转移酶(EC 2.4.1.1.13),其可逆地催化化学反应NDP-葡萄糖+D-果糖到NDP和蔗糖。在一些实施方案中,本发明提供了喜温嗜酸硫杆菌(Acidithiobacillus caldus)蔗糖合酶(“AcSuS”)的变体。在一些实施方案中,这些酶被称为“蔗糖合酶变体”、“SuS”、“SUS”、“SuS变体”、“SUS变体”、“蔗糖合酶组合变体”、或“SuS组合变体”、或“SUS组合变体”。在一些实施方案中,这些变体优先地利用除尿苷以外的NDP(即,利用ADP-葡萄糖、CDP-葡萄糖、TDP-葡萄糖、GDP-葡萄糖和/或IDP-葡萄糖,而不是UDP-葡萄糖)。在一些实施方案中,这些变体不利用UDP-葡萄糖。
如本文使用的,术语“一锅反应”指在一个反应容器中产生感兴趣的莱鲍迪苷。在一些实施方案中,该术语用于指从起始材料产生rebM以及其他莱鲍迪苷(例如rebD和/或rebI)的中间产生,起始材料包括但不限于如rebA和/或甜菊苷。在一些实施方案中,甜菊苷向RebA的转化、RebA向RebD和/或RebI的转化、以及RebD和/或RebI向Reb M的转化,在一个反应容器中作为多酶级联反应来进行。
如本文使用的,“野生型”和“天然存在的”指自然界中存在的形式。例如野生型多肽或多核苷酸序列为生物体中存在的序列,所述序列可以从自然界中的来源分离,并且其尚未被通过人为操作有意改变。
如本文使用的,当关于细胞、核酸或多肽使用时,“重组”、“工程化”和“非天然存在的”指已经以自然界中原本不存在的方式改变的材料或对应于该材料的自然或天然形式的材料。在一些实施方案中,细胞、核酸或多肽与天然存在的细胞、核酸或多肽相同,但是由合成材料和/或通过使用重组技术的操作产生或衍生。非限制性实例包括,表达在天然(非重组)形式的细胞中不存在的基因或表达原本以不同水平表达的天然基因的重组细胞,以及其他。
术语“序列同一性百分比(%)”在本文用于指多核苷酸或多肽之间的比较,并通过在比较窗上比较两个最佳比对的序列来确定,其中与用于两个序列的最佳比对的参考序列相比,比较窗中的多核苷酸或多肽序列的部分可以包括添加或缺失(即空位)。百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以产生序列同一性的百分比。可选择地,百分比可以通过如下计算:确定两个序列或具有空位的比对的核酸碱基或氨基酸残基中出现相同的核酸碱基或氨基酸残基的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数,并将结果乘以100以产生序列同一性的百分比。本领域技术人员理解,存在许多可用于比对两个序列的已确立的算法。用于比较的序列的最佳比对可以通过任何合适的方法进行,合适的方法包括但不限于Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981]),通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970]),通过Pearson和Lipman的搜索相似性方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988]),通过计算机化实施这些算法(例如GCGWisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或通过目视检查进行,如本领域已知的。适用于确定序列同一性和序列相似性百分比的算法的实例包括但不限于BLAST和BLAST2.0算法,其由Altschul等人描述(分别参见Altschul等人,J.Mol.Biol.,215:403-410[1990];和Altschul等人,Nucl.Acids Res.,3389-3402[1977])。用于进行BLAST分析的软件可通过美国国家生物技术信息中心(National Center for BiotechnologyInformation)网站公开获得。这个算法包括首先通过鉴定查询序列中长度W的短字(shortwords)来鉴定高评分序列对(HSP),所述长度W的短字在与数据库序列中的相同长度的字比对时,匹配或满足某一正值的阈值评分T。T被称为相邻字评分阈值(neighborhood wordscore threshold)(参见Altschul等人,上文)。这些初始的相邻字击中(word hit)充当种子,用于启动搜索以发现包含它们的更长的HSP。然后,字击中沿每个序列在两个方向上延伸,直至累积比对评分不能增加。对于核苷酸序列,累积评分使用参数M(对于匹配残基对的奖励评分;永远>0)和N(对于错配残基的惩罚评分;永远<0)来计算。对于氨基酸序列,使用评分矩阵来计算累积评分。当累积比对评分从其达到的最大值下降量X时;由于累积一个或更多个负评分的残基比对导致累积评分到达零或以下时;或到达任一序列的末端时,字击中在每个方向上的延伸停止。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)使用以下为默认项(default):字长(W)为11、期望值(E)为10、M=5、N=-4和双链比较。对于氨基酸序列,BLASTP程序使用字长(W)3、期望值(E)10和BLOSUM62评分矩阵作为默认项(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对和序列同一性%的示例性确定可以使用所提供的默认参数,采用GCGWisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序。
如本文使用的,“参考序列”指用作序列和/或活性比较的基础的定义的序列。参考序列可以是更大序列的子集,例如全长基因或多肽序列的区段。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或核酸或多肽的全长。由于两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即完整序列的一部分),和(2)还可以包含两个序列之间不同的序列,因此两个(或更多个)多核苷酸或多肽之间的序列比较通常通过在“比较窗”上比较两个多核苷酸或多肽的序列来鉴定和比较局部区域的序列相似性来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列,其中参考序列是可以在一级序列中具有一个或更多个改变的序列。
如本文使用的,“比较窗”指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列比较,并且其中与参考序列(其不包含添加或缺失)相比,序列在比较窗中的部分可以包含20%或更少的添加或缺失(即空位),以获得两个序列的最佳比对。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。
如本文使用的,当在给定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”、“参考(reference to)”和“相对于”指,当将给定氨基酸或多核苷酸序列与指定参考序列相比时,该参考序列的残基的编号。换言之,给定聚合物的残基编号或残基位置针对参考序列指定,而不是由残基在给定氨基酸或多核苷酸序列内的实际数值位置指定。例如,可以通过引入空位将给定氨基酸序列诸如工程化糖基转移酶的氨基酸序列与参考序列比对,以优化两个序列之间的残基匹配。在这些情况下,尽管存在空位,但是给定氨基酸或多核苷酸序列中残基的编号相对于与其比对的参考序列来进行。
如本文使用的,“基本同一性(substantial identity)”指,在至少20个残基位置的比较窗上、通常在至少30个-50个残基的窗上,与参考序列相比,具有至少80%序列同一性、至少85%同一性、至少89%至95%之间的序列同一性,或更通常地至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性的百分比通过在比较窗上比较参考序列和包括总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的一些具体实施方案中,术语“基本同一性”指,当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共有至少80%序列同一性,优选地至少89%序列同一性、至少95%序列同一性或更高的序列同一性(例如99%序列同一性)。在一些实施方案中,被比较的序列中不相同的残基位置因保守氨基酸取代而不同。
如本文使用的,“氨基酸差异”和“残基差异”指多肽序列的一个位置的氨基酸残基相对于参考序列中对应位置的氨基酸残基的差异。在一些情况下,参考序列具有组氨酸标签,但是相对于没有组氨酸标签的等效参考序列,编号保持不变。本文中氨基酸差异的位置通常被称为“Xn”,其中n指在基于其存在残基差异的参考序列中的对应位置。例如,“与SEQID NO:4相比,在位置X93的残基差异”指在对应于SEQ ID NO:4的位置93的多肽位置的氨基酸残基的差异。因此,如果参考多肽SEQ ID NO:4在位置93处具有丝氨酸,则“与SEQ ID NO:4相比在位置X93处的残基差异”指在对应于SEQ ID NO:4的位置93的多肽位置处除丝氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下,一个位置上的特定氨基酸残基差异表示为“XnY”,其中“Xn”指定如上所述的对应位置,而“Y”是在工程化多肽中存在的氨基酸的单字母标识符(即与参考多肽不同的残基)。在一些情况下(例如在实施例中的表格中),本发明还提供了由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是参考序列中残基位置的编号,而B是工程化多肽序列中残基取代的单字母标识符。在一些情况下,本发明的多肽可以包括相对于参考序列的一个或更多个氨基酸残基差异,所述氨基酸残基差异由相对于参考序列存在残基差异的指定位置的列表指示。在一些实施方案中,当多于一个氨基酸可以在多肽的特定残基位置中使用时,可以使用的多种氨基酸残基由“/”分开(例如X307H/X307P或X307H/P)。斜线也可以用来表示给定变体中的多个取代(即,在给定序列中诸如在组合变体中存在多于一个取代)。在一些实施方案中,本发明包括包含一个或更多个氨基酸差异的工程化多肽序列,所述一个或更多个氨基酸差异包括保守氨基酸取代或非保守氨基酸取代。在一些另外的实施方案中,本发明提供了包含保守和非保守氨基酸取代两者的工程化多肽序列。
如本文使用的,“保守氨基酸取代”指用具有相似侧链的不同残基来取代残基,并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。通过举例且非限制性的方式,在一些实施方案中,具有脂族侧链的氨基酸被另一种脂族氨基酸(例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如丝氨酸和苏氨酸)取代;具有芳族侧链的氨基酸被另一种具有芳族侧链的氨基酸(例如苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如天冬氨酸或谷氨酸)取代;和/或疏水性或亲水性氨基酸分别被另一种疏水性或亲水性氨基酸替换。
如本文使用的,“非保守取代”指用具有显著不同侧链特性的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而非定义的组之内的氨基酸,并影响(a)取代区域中肽骨架的结构(例如用脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链的体积。通过举例且非限制性的方式,示例性非保守取代可以是用碱性或脂族氨基酸取代酸性氨基酸;用小氨基酸取代芳族氨基酸;和用疏水性氨基酸取代亲水性氨基酸。
如本文使用的,“缺失”指通过从参考多肽去除一个或更多个氨基酸来修饰多肽。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或20个或更多个氨基酸、高达构成参考酶的氨基酸总数的10%或高达构成参考酶的氨基酸总数的20%,同时保留酶促活性和/或保留工程化糖基转移酶的改进的特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段,或者可以是不连续的。缺失在氨基酸序列中通常以“-”表示。
如本文使用的,“插入”指通过向参考多肽添加一个或更多个氨基酸来修饰多肽。插入可以在多肽的内部部分,或在羧基或氨基末端。如本文使用的插入包括本领域已知的融合蛋白。插入可以是连续区段的氨基酸,或由天然存在的多肽中的一个或更多个氨基酸隔开。
“功能性片段”和“生物活性片段”在本文中可互换使用,以指如下多肽:所述多肽具有氨基末端和/或羧基末端缺失和/或内部缺失,但是其中剩余的氨基酸序列与和它相比较的序列(例如本发明的全长工程化糖基转移酶)中的对应位置相同,并且保留全长多肽的基本上所有的活性。
如本文使用的,“分离的多肽”指与天然伴随多肽的其他污染物(例如蛋白、脂质和多核苷酸)基本上分离的多肽。该术语包括已经从其天然存在的环境或表达系统(例如宿主细胞内或经由体外合成)取出或纯化的多肽。重组糖基转移酶多肽可以存在于细胞内、存在于细胞培养基中,或以各种形式(诸如裂解物或分离的制品)制备。因此,在一些实施方案中,重组糖基转移酶多肽可以是分离的多肽。
如本文使用的,“基本上纯的多肽”或“纯化的蛋白”指其中多肽物质是存在的主要物质的组合物(即,在摩尔或重量的基础上,其比组合物中的任何其它单独大分子物质更丰富),并且当目标物质按摩尔或重量%计构成存在的大分子物质的至少约50%时,该组合物一般为基本上纯化的组合物。然而,在一些实施方案中,包含糖基转移酶的组合物包含少于50%纯的(例如,约10%、约20%、约30%、约40%、或约50%)糖基转移酶。通常,基本上纯的糖基转移酶组合物按摩尔或重量%计构成组合物中存在的所有大分子物质的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物质纯化至基本的均一性(即,通过常规检测方法不能在组合物中检测到污染物质),其中组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的重组糖基转移酶多肽为基本上纯的多肽组合物。
如本文使用的,“改进的酶特性”指酶的至少一种改进的特性。在一些实施方案中,本发明提供了与参考糖基转移酶多肽和/或野生型糖基转移酶多肽和/或另一种工程化糖基转移酶多肽相比显示出任何酶特性的改进的工程化糖基转移酶多肽。因此,“改进”的水平可以在各种糖基转移酶多肽、包括野生型以及工程化糖基转移酶之间进行确定和比较。改进的特性包括但不限于诸如以下的特性:增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的pH活性、增加的稳定性、增加的酶促活性、增加的底物特异性或亲和力、增加的比活性、增加的对底物或终产物抑制的耐受性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性pH的耐受性、增加的对蛋白水解活性的耐受性(即,减少的对蛋白水解的敏感性)、减少的聚集、增加的溶解度、和改变的温度谱。在另外的实施方案中,该术语用于指蔗糖合酶的至少一种改进的特性。在一些实施方案中,本发明提供了与参考蔗糖合酶多肽和/或野生型蔗糖合酶多肽和/或另一种工程化蔗糖合酶多肽相比显示出任何酶特性的改进的工程化蔗糖合酶多肽。因此,“改进”的水平可以在各种蔗糖合酶多肽、包括野生型以及工程化蔗糖合酶之间进行确定和比较。
如本文使用的,“增加的酶促活性”和“增强的催化活性”指工程化多肽的改进的特性,其可以通过与参考酶相比的比活性(例如,产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如使用指定量的酶,在指定时间段内起始量的底物向产物的转化百分比)的增加来表示。在一些实施方案中,这些术语指本文提供的工程化糖基转移酶多肽的改进的特性,其可以通过与参考糖基转移酶相比的比活性(例如,产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如使用指定量的糖基转移酶,在指定时间段内起始量的底物向产物的转化百分比)的增加来表示。在一些实施方案中,这些术语用于指本文提供的改进的蔗糖合酶。在实施例中提供了确定本发明的工程化糖基转移酶和蔗糖合酶的酶活性的示例性方法。与酶活性相关的任何特性可以被影响,包括经典的酶特性Km、Vmax或kcat,其变化可以导致酶促活性的增加。例如,酶活性的改进可以是从对应野生型酶的酶促活性的约1.1倍至比天然存在的糖基转移酶或糖基转移酶多肽所源自的另一种工程化糖基转移酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶促活性。
如本文使用的,“转化”指底物向对应产物的酶促转化(或生物转化)。“转化百分比”指在指定条件下在一定时间段内转化为产物的底物的百分比。因此,糖基转移酶多肽的“酶促活性”或“活性”可以表示为在指定的时间段内底物向产物的“转化百分比”。
具有“通用性特性(generalist properties)”的酶(或通用性酶(generalistenzymes))指与亲本序列相比对宽范围的底物显示出改进的活性的酶。通用性酶不必对于每种可能的底物表现出改进的活性。在一些实施方案中,本发明提供了具有通用性特性的糖基转移酶变体,因为它们相对于亲本基因对宽范围的空间上和电子上不同的底物表现出相似或改进的活性。另外,本文提供的通用性酶被工程化为跨越宽范围的不同的分子被改进以增加代谢物/产物的产生。
术语“严格杂交条件”在本文中用于指在其下核酸杂合体稳定的条件。如本领域技术人员已知的,杂合体的稳定性反映在杂合体的解链温度(Tm)中。通常,杂合体的稳定性是离子强度、温度、G/C含量和离液剂的存在的函数。多核苷酸的Tm值可以使用已知的用于预测解链温度的方法来计算(参见例如Baldino等人,Meth.Enzymol.,168:761-777[1989];Bolton等人,Proc.Natl.Acad.Sci.USA 48:1390[1962];Bresslauer等人,Proc.Natl.Acad.Sci.USA 83:8893-8897[1986];Freier等人,Proc.Natl.Acad.Sci.USA83:9373-9377[1986];Kierzek等人,Biochem.,25:7840-7846[1986];Rychlik等人,Nucl.Acids Res.,18:6409-6412[1990](勘误,Nucl.Acids Res.,19:698[1991]);Sambrook等人,上文);Suggs等人,1981,在Developmental Biology Using Purified Genes中,Brown等人[eds.],pp.683-693,Academic Press,Cambridge,MA[1981];和Wetmur,Crit.Rev.Biochem.Mol.Biol.26:227-259[1991])。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在定义的条件下,诸如中度严格或高度严格的条件下,与编码本发明的工程化糖基转移酶的序列的互补体杂交。
如本文使用的,“杂交严格性”涉及核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同但严格性更高的洗涤。术语“中度严格性杂交”指允许靶DNA结合互补核酸的条件,所述互补核酸与靶DNA具有约60%同一性、优选地约75%同一性、约85%同一性;与靶多核苷酸具有大于约90%同一性。示例性中度严格条件是相当于在50%甲酰胺、5×Denhart's溶液、5×SSPE、0.2%SDS中在42℃杂交、随后在0.2×SSPE、0.2%SDS中在42℃洗涤的条件。“高严格性杂交”通常指,与在针对指定的多核苷酸序列的溶液条件下确定的热解链温度Tm相差约10℃或更少的条件。在一些实施方案中,高严格性条件指仅允许在65℃在0.018MNaCl中形成稳定杂合体的那些核酸序列杂交的条件(即如本文设想的,如果杂合体在65℃在0.018M NaCl中不稳定,它在高严格性条件下将不稳定)。高严格性条件可以例如通过在相当于在42℃、50%甲酰胺、5×Denhart's溶液、5×SSPE、0.2%SDS的条件中杂交,然后在65℃、在0.1×SSPE和0.1%SDS中洗涤来提供。另一种高严格性条件是在相当于在65℃、在含有0.1%(w/v)SDS的5×SSC中杂交的条件中杂交,并在65℃、在含有0.1%SDS的0.1×SSC中洗涤。其他高严格性杂交条件以及中等严格性条件在以上引用的参考文献中描述。
如本文中使用的,“密码子优化”指,编码蛋白的多核苷酸的密码子向特定生物体中优先地使用的密码子的改变,使得编码的蛋白在感兴趣的生物体中高效表达。尽管遗传密码是简并的,因为大多数氨基酸由被称为“同义(synonym)”或“同义(synonymous)”密码子的数个密码子代表,但熟知的是特定生物体的密码子使用是非随机的,并且偏向于特定的密码子三联体。这种密码子使用偏向对于给定基因、具有共同功能或祖先来源的基因、相比于低拷贝数蛋白的高表达蛋白、以及生物体的基因组的密集蛋白编码区可能更高。在一些实施方案中,编码糖基转移酶的多核苷酸可以被密码子优化以在所选择的用于表达的宿主生物体中最佳产生。
如本文使用的,当“优选的”、“最佳的”、“高密码子使用偏向”密码子被单独或组合使用时,可互换地指在蛋白编码区中以高于编码相同氨基酸的其他密码子的频率使用的密码子。优选的密码子可以根据单个基因、一组具有共同功能或来源的基因、高表达基因中的密码子使用、整个生物体的密集蛋白编码区中的密码子频率、相关生物体的密集蛋白编码区中的密码子频率或其组合来确定。其频率随基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用来确定特定生物体中的密码子频率(例如密码子使用、相对同义密码子使用)和密码子偏好的多种方法是已知的,包括多变量分析,例如使用聚类分析或相应分析(correspondence analysis)和基因中使用的密码子的有效数目(参见例如GCGCodonPreference,Genetics Computer Group Wisconsin Package;CodonW,Peden,University of Nottingham;McInerney,Bioinform.,14:372-73[1998];Stenico等人,Nucl.Acids Res.,222437-46[1994];和Wright,Gene 87:23-29[1990])。可获得许多不同的生物体的密码子使用表(参见例如Wada等人,Nucl.Acids Res.,20:2111-2118[1992];Nakamura等人,Nucl.Acids Res.,28:292[2000];Duret等人,上文;Henaut和Danchin,在Escherichia coli and Salmonella中,Neidhardt等人(eds.),ASM Press,WashingtonD.C.,p.2047-2066[1996])。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集包括实际已知编码表达蛋白的核酸序列(例如完整的蛋白编码序列-CDS)、表达序列标签(ESTS)或基因组序列的预测编码区(参见例如Mount,Bioinformatics:Sequence and Genome Analysis,第8章,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.[2001];Uberbacher,Meth.Enzymol.,266:259-281[1996];和Tiwari等人,Comput.Appl.Biosci.,13:263-270[1997])。
如本文使用的,“控制序列”包括对本发明的多核苷酸和/或多肽的表达必需或有利的所有组分。每个控制序列对于编码多肽的核酸序列可以是天然的或外源的。这样的控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。在最小程度上,控制序列包括启动子和转录及翻译终止信号。控制序列可以设有接头,以用于引入促进控制序列与编码多肽的核酸序列的编码区的连接的特定限制性位点的目的。
“可操作地连接”在本文中定义为控制序列被适当地放置(即,以功能性关系)在相对于感兴趣的多核苷酸的位置处的布置,使得控制序列指导或调控感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”指被宿主细胞识别用于表达感兴趣的多核苷酸(诸如编码序列)的核酸序列。启动子序列含有介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外多肽或胞内多肽的基因获得。
措辞“合适的反应条件”指在酶促转化反应溶液中的那些条件(例如,酶载量、底物载量、温度、pH、缓冲液、助溶剂等的范围),在上述条件下本发明的糖基转移酶多肽能够将底物转化为期望的产物化合物。本文提供了一些示例性“合适的反应条件”。
如本文使用的,诸如在“化合物载量”或“酶载量”中的“载量”指在反应开始时反应混合物中组分的浓度或量。
如本文使用的,在酶促转化反应过程的情况下,“底物”指由本文提供的工程化酶(例如工程化糖基转移酶多肽)作用的化合物或分子。
如本文使用的,术语“生物质”、“生物质底物”、“纤维素生物质”、“纤维素原料”和“纤维素底物”指包含纤维素的任何材料。生物质可以来源自植物、动物或微生物,并且可以包括但不限于农业、工业和林业残渣、工业和城市废物、以及为了能源目的生长的陆地和水生作物。纤维素底物的实例包括但不限于木材、木浆、纸浆、玉米纤维、玉米谷粒、玉米芯、作物残渣诸如玉米外皮、玉米秸秆、草、小麦、小麦秸秆、大麦、大麦秸秆、干草、水稻、水稻秸秆、柳枝稷、废纸、纸和纸浆加工废料、木本或草本植物、水果或蔬菜浆、玉米芯、酒糟、草、稻壳、棉、大麻、亚麻、剑麻、甘蔗渣、高粱、大豆、柳枝稷、由碾磨谷物获得的组分、树、树枝、根、叶、木屑、锯屑、灌木(shrub)和灌木(bush)、蔬菜、水果和花以及其任何合适的混合物。在一些实施方案中,纤维素生物质包括但不限于栽培作物(例如草,包括C4草,诸如柳枝稷、大米草(cord grass)、黑麦草、芒属植物、草芦或其任何组合)、糖加工残渣,例如但不限于甘蔗渣(例如甘蔗渣、甜菜浆[例如甜菜]或其组合)、农业残渣(例如大豆秸秆、玉米秸秆、玉米纤维、水稻秸秆、甘蔗秸秆、水稻、稻壳、大麦秸秆、玉米芯、小麦秸秆、菜籽秸秆、燕麦秸秆、燕麦壳、玉米纤维、大麻、亚麻、剑麻、棉或其任何组合)、水果浆、蔬菜浆、酒糟、林业生物质(例如,木材、木浆、纸浆、回收木浆纤维、锯屑、硬木诸如杨木、软木或其组合)。此外,在一些实施方案中,纤维素生物质包括纤维素废料和/或林业废料,包括但不限于纸和纸浆加工废料、新闻纸、纸板等。在一些实施方案中,纤维素生物质包括一种纤维物质,而在一些可选择的实施方案中,纤维素生物质包括来源自不同纤维素生物质的纤维的混合物。在一些实施方案中,生物质还可以包含表达木质素酶和/或纤维素酶的转基因植物(参见例如US 2008/0104724,通过引用并入本文)。
如本文使用的,术语“浆料”指一种或更多种固体组分诸如纤维素底物分散在其中的水性溶液。
如本文使用的,与在相同条件下用相同底物和其他替代物但不存在感兴趣的组分进行的反应相比,当反应期间存在的特定组分(例如GH酶)引起更多产物产生时,反应产物(例如甜菊醇糖苷)的产率“增加”发生。
如本文使用的,当底物中存在的两种单糖之间的至少一些糖苷键被水解,从而使先前键合的两种单体与彼此分离时,“水解”纤维素或其它多糖发生。
如果与参与催化反应的其它酶相比,特定酶的量少于约2%、约1%或约0.1%(wt/wt),则该反应被称为“基本上不含”特定酶。
如本文使用的,“分级(fractionating)”液体(例如培养肉汤)意指应用分离方法(例如盐沉淀、柱层析、尺寸排阻和过滤)或这些方法的组合来提供一种溶液,其中期望的蛋白(例如莱鲍迪苷)构成该溶液中比大于初始液体产物中更大百分比的总蛋白。
如本文使用的,“起始组合物”指包含至少一种底物的任何组合物。在一些实施方案中,起始组合物包含任何纤维素底物。
在一些可选择的实施方案中,术语“起始组合物”指包含至少一种甜菊醇糖苷的任何组合物,其中一种或更多种甜菊醇糖苷充当用于生物转化的底物。在一些实施方案中,起始组合物以水性溶液提供。在一些实施方案中,起始组合物包含至少一种甜菊醇糖苷,所述甜菊醇糖苷选自甜菊苷、甜菊醇单苷、甜菊醇双苷、甜茶苷、杜克苷B、杜克苷A、莱鲍迪苷B、莱鲍迪苷G、莱鲍迪苷C、莱鲍迪苷F、莱鲍迪苷A、莱鲍迪苷I、莱鲍迪苷E、莱鲍迪苷H、莱鲍迪苷L、莱鲍迪苷K、莱鲍迪苷J、莱鲍迪苷M(也称为莱鲍迪苷X)、莱鲍迪苷D、莱鲍迪苷N、莱鲍迪苷O和合成的甜菊醇糖苷(例如酶促葡糖基化的甜菊醇糖苷)。在一些实施方案中,起始组合物包含两种或更多种甜菊醇糖苷。在一些实施方案中,起始组合物包含从纯化甜菊植物材料(例如叶)获得的提取物。在一些可选择的实施方案中,起始组合物包含商业上可获得的甜菊提取物。另外的起始组合物包含用于分离和纯化甜菊醇糖苷的方法的副产物。在一些实施方案中,起始组合物包含纯化或部分纯化的甜菊醇糖苷底物。在一些实施方案中,起始组合物包含按重量计大于约99%的特定甜菊醇糖苷。
在一些实施方案中,起始组合物包含作为底物的至少一种糖苷和纤维素组分,以产生至少一种甜菊醇糖苷(例如莱鲍迪苷A、D等)。
如本文使用的,在酶促转化过程的情况下,“产物”指从酶多肽对底物的作用产生的化合物或分子。如本文使用的,在一些实施方案中,该术语指从糖基转移酶多肽对底物的作用产生的化合物或分子。在一些实施方案中,本发明提供的产物是甜菊醇糖苷。在一些实施方案中,产物包括至少一种甜菊醇糖苷,所述甜菊醇糖苷选自甜菊苷、甜菊醇单苷、甜菊醇双苷、甜茶苷、杜克苷B、杜克苷A、莱鲍迪苷B、莱鲍迪苷G、莱鲍迪苷C、莱鲍迪苷F、莱鲍迪苷A、莱鲍迪苷I、莱鲍迪苷E、莱鲍迪苷H、莱鲍迪苷L、莱鲍迪苷K、莱鲍迪苷J、莱鲍迪苷M(也称为莱鲍迪苷X)、莱鲍迪苷D、莱鲍迪苷N、莱鲍迪苷O和合成的甜菊醇糖苷(例如酶促葡糖基化的甜菊醇糖苷)。
如本文使用的术语“培养”指微生物细胞群体在任何合适的条件(例如,使用液体、凝胶或固体培养基)下的生长。
重组多肽可以使用本领域已知的任何合适的方法来产生。编码感兴趣的野生型多肽的基因可以克隆在载体诸如质粒中,并在期望的宿主诸如大肠杆菌等中表达。重组多肽的变体可以通过本领域已知的各种方法来产生。事实上,存在本领域技术人员熟知的广泛各种不同的诱变技术。此外,诱变试剂盒还可从许多商业分子生物学供应商获得。可获得方法以进行在指定的氨基酸处的特定取代(位点特异性)、在基因的局部区域中的特定或随机突变(区域特异性)、或在整个基因内的随机诱变(例如,饱和诱变)。本领域技术人员已知许多合适的方法来产生酶变体,包括但不限于使用PCR对单链DNA或双链DNA的位点特异性诱变、盒式诱变、基因合成、易错PCR、重排和化学饱和诱变、或本领域已知的任何其他合适的方法。诱变和定向演化方法可以容易地应用于编码酶的多核苷酸,以产生可以被表达、筛选和测定的变体文库。任何合适的诱变和定向演化方法可用于本发明,并且是本领域熟知的(参见例如美国专利第5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326号和所有相关的美国以及PCT和非美国的对应专利;Ling等人,Anal.Biochem.,254(2):157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri,等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和WO 2009/152336,所有这些通过引用并入本文)。
在一些实施方案中,诱变处理后获得的酶克隆通过使酶制品经受指定的温度(或其他测定条件),并测量热处理或其他合适的测定条件之后剩余的酶活性的量进行筛选。然后将含有编码多肽的多核苷酸的克隆与基因分离、测序以鉴定核苷酸序列改变(如果有)、及用于在宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如,标准生物化学技术,诸如HPLC分析)来进行。
产生变体后,可以对它们筛选任何期望的特性(例如,高或增加的活性、或者低或减少的活性、增加的热活性、增加的热稳定性和/或酸性pH稳定性等)。在一些实施方案中,可使用“重组糖基转移酶多肽”(本文中也称为“工程化糖基转移酶多肽”、“变体糖基转移酶”、“糖基转移酶变体”和“糖基转移酶组合变体”)。在一些实施方案中,可使用“重组蔗糖合酶多肽”(也称为“工程化蔗糖合酶多肽”、“变体蔗糖合酶”、“蔗糖合酶变体”和“蔗糖合酶组合变体”)。
如本文使用的,“载体”是用于将DNA序列引入到细胞中的DNA构建体。在一些实施方案中,载体是被可操作地连接到能够实现DNA序列中编码的多肽在合适宿主中的表达的合适的控制序列的表达载体。在一些实施方案中,“表达载体”具有可操作地连接到DNA序列(例如转基因)以驱动在宿主细胞中表达的启动子序列,并且在一些实施方案中,还包含转录终止子序列。
如本文使用的,术语“表达”包括涉及多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还包括多肽从细胞的分泌。
如本文使用的,术语“产生”指由细胞产生蛋白和/或其他化合物。意图的是该术语包括涉及多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还包括多肽从细胞的分泌。
如本文使用的,如果氨基酸或核苷酸序列(例如启动子序列、信号肽、终止子序列等)与它被可操作地连接到的另一个序列在自然界中不是缔合的,则这两个序列为异源的。例如“异源多核苷酸”是通过实验室技术引入到宿主细胞中的任何多核苷酸,并且包括从宿主细胞中取出、经受实验室操作、并且然后重新引入到宿主细胞中的多核苷酸。
如本文使用的,术语“宿主细胞”和“宿主菌株”指用于包含本文提供的DNA(例如编码糖基转移酶变体的多核苷酸)的表达载体的合适的宿主。在一些实施方案中,宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。
术语“类似物”意指与参考多肽具有多于70%序列同一性,但少于100%序列同一性(例如多于75%、78%、80%、83%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性)的多肽。在一些实施方案中,类似物意指含有一个或更多个非天然存在的氨基酸残基(包括但不限于高精氨酸、鸟氨酸和正缬氨酸)以及天然存在的氨基酸的多肽。在一些实施方案中,类似物还包括一个或更多个D-氨基酸残基和两个或更多个氨基酸残基之间的非肽键。
术语“有效量”意指足以产生期望的结果的量。本领域一般技术人员可以通过使用常规实验来确定有效量是多少。
术语“分离的”和“纯化的”用于指从与其天然缔合的至少一种其他组分分开的分子(例如分离的核酸、多肽等)或其他组分。术语“纯化的”不要求绝对纯度,而是意图作为相对定义。
如本文使用的,“立体选择性”指一种立体异构体相对于另一种立体异构体在化学或酶促反应中的优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种,或者其可以是完全的,其中仅形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即两者的总和中一种对映异构体的分数(通常以百分比报道)。本领域中通常可选择地将其报道(通常为百分比)为根据下式从中计算的对映异构体过量(“e.e.”):[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]。在立体异构体是非对映异构体的情况下,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(通常报道为百分比),通常可选择地报告为非对映异构体过量(“d.e.”)。对映异构体过量和非对映异构体过量是立体异构过量的类型。
如本文使用的,“区域选择性”和“区域选择性反应”指其中键形成或断裂的一个方向优先于所有其它可能的方向发生的反应。如果区别是完全的,则反应可以是完全(100%)区域选择性的,如果在一个位点的反应产物比在其它位点的反应产物占优势,则反应可以是基本上区域选择性的(至少75%),或者部分区域选择性的(x%,其中该百分比设置取决于感兴趣的反应)。
如本文使用的,“热稳定”指与暴露于相同的升高的温度的野生型酶相比,在暴露于升高的温度(例如40-80℃)一定时间段(例如0.5-24h)后,保持相似活性(例如多于60%至80%)的糖基转移酶多肽。
如本文使用的,“溶剂稳定”指与暴露于相同浓度的相同溶剂的野生型酶相比,在暴露于不同浓度(例如5%-99%)的溶剂(乙醇、异丙醇、二甲基亚砜[DMSO]、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)一定时间段(例如0.5h至24h)后,保持相似活性(多于例如60%至80%)的糖基转移酶多肽。
如本文使用的,“热稳定且溶剂稳定”指既热稳定又溶剂稳定的糖基转移酶多肽。
如本文使用的,“还原剂”指能够将Fe+3转化为Fe+2的化合物或剂。示例性还原剂是抗坏血酸,其通常呈L-抗坏血酸的形式。
如本文使用的,“任选的”和“任选地”意指随后描述的事件或情形可以发生或可以不发生,并且意指该描述包括当所述事件或情形发生时的情况和其中所述事件或情形不发生的情况。本领域普通技术人员将理解,对于被描述为含有一个或更多个任选的取代基的任何分子,仅意图包括空间上可实现的和/或合成上可行的化合物。“任选地被取代的”指术语或一系列化学基团中的所有随后修饰对象(modifier)。
糖基化
糖基化可以改变天然和合成产品的许多特性,包括稳定性、药效动力学、溶解度和膜转运。本发明提供了适用于从各种苷元和糖基化底物产生新的糖基化化合物的组合物、方法和酶。在一些实施方案中,本发明提供了从容易获得的前体有效产生已知糖基化化合物的手段。在一些情况下,糖基化通过化学合成方法实现。然而,这些方法通常需要不期望的化学物质和工艺,并且可能导致混合产物(例如具有在不正确的位置中的键和/或具有不期望的异头构型)。此外,碳水化合物化学需要多个保护和去保护步骤。
相比之下,糖基化酶可以在温和的条件下有活性,并且可以在一个步骤中赋予高的位置选择性和立体专一性。许多天然存在的糖基化代谢物是使用将糖部分从各种糖核苷转移的糖基转移酶体内产生的。许多分子,包括许多具有抗菌、抗肿瘤、天然甜味特性等的次生代谢物包含用β-糖苷键修饰的非核糖体肽、聚酮类或类萜骨架。从植物Bertoni甜菊提取的许多二萜糖苷含有β-连接的葡萄糖分子。天然地,这些分子是使用UDP-葡萄糖依赖性糖基转移酶体内糖基化的。本发明提供了方法(参见图1),其中使用新的工程化糖基转移酶以将葡萄糖部分从核苷二磷酸葡萄糖转移到底物(例如莱鲍迪苷D或甜菊苷),以产生一种或更多种β-葡萄糖连接的产物(例如莱鲍迪苷M、莱鲍迪苷A或莱鲍迪苷I)。然而,当体外使用时,UDP-葡萄糖可能过度昂贵和/或难以获得。在一些另外的实施方案中,合酶(例如蔗糖合酶或海藻糖合酶)以相反的方向作用,以从核苷二磷酸和葡萄糖供体(例如蔗糖、海藻糖或淀粉)形成核苷二磷酸葡萄糖化合物。
因此,糖基化可用于产生天然甜味剂,诸如衍生自甜味草本植物Bertoni甜菊的天然甜味剂。如以上指示的,这种植物产生特征为高强度甜味且感官特性优于许多其他高效甜味剂的感官特性的许多二萜糖苷。以上提及的甜味糖苷具有共同的苷元(即甜菊醇),并且在C13和C19位置的碳水化合物残基的数量和类型不同。甜菊醇糖苷不仅在其分子结构方面彼此不同,而且其味觉特性也彼此不同。通常,报道甜菊苷比蔗糖甜89-143倍,而报道莱鲍迪苷A比蔗糖甜85倍和242倍之间(参见例如Kasai等人,Nippon Kagaku Kaishi,1981:726-735[1981])。这些常见化合物中,莱鲍迪苷A具有最少的涩味、最少的苦味和最少的持久性余味。因此,它具有主要甜菊醇糖苷中最有利的感官属性并已被商业化。然而,莱鲍迪苷A仅构成从Bertoni甜菊分离的总糖苷的较小部分(约20%),而甜菊苷(约70%)和次要甜菊醇糖苷构成其余部分(参见例如FAO,Chemical and Technical Assessment,63rd JECFA,Steviol Glycosides[2004])。天然存在但丰度甚至更低的化合物莱鲍迪苷M,也称为莱鲍迪苷X,比蔗糖甜200-350倍,并且相对于莱鲍迪苷A具有减少的余味(参见例如Prakash等人,Food,3:162-175[2014])。因此,存在对莱鲍迪苷M的商业化的兴趣,例如作为天然甜味剂,但是目前没有可行的商业途径来合成这种化合物。
工程化糖基转移酶多肽
本发明提供了糖基转移酶多肽、编码该多肽的多核苷酸、制备该多肽的方法以及用于使用该多肽的方法。在描述涉及多肽的情况下,应当理解,它还描述了编码该多肽的多核苷酸。在一些实施方案中,本发明提供了与野生型GT酶相比具有改进的特性的工程化、非天然存在的GT酶。任何合适的反应条件可用于本发明。在一些实施方案中,使用方法来分析工程化多肽的改进的特性以进行转移酶反应。在一些实施方案中,根据多肽、底物、共底物的浓度或量,缓冲液,助溶剂,pH,包括温度和反应时间的条件,和/或多肽固定在固体支持物上的条件来改变反应条件,如以下和实施例中进一步描述的。
在一些实施方案中,与野生型GT酶相比,本文描述的工程化GT多肽具有改进的特性,诸如在甜菊醇糖苷转化为进一步糖基化的甜菊醇糖苷(例如甜菊苷转化为莱鲍迪苷A或莱鲍迪苷D转化为莱鲍迪苷M)方面以及在使用腺嘌呤二磷酸葡萄糖或其他核苷二磷酸方面。在一些实施方案中,工程化GT酶包含与以下序列相比具有一个或更多个残基差异的氨基酸序列:SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、4256、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、684、7388和/或8088。在一些实施方案中,工程化GT酶是与以下序列相比具有一个或更多个残基差异的β-1,2糖基转移酶变体:SEQ ID NO:758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、7324和/或7784。在一些实施方案中,工程化GT酶是与以下序列相比具有一个或更多个残基差异的β-1,3糖基转移酶变体:SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088。在一些另外的实施方案中,工程化GT多肽是环状排列的蛋白,其中肽接头在基因水平掺入在N-末端和C-末端之间,并选择新的氨基酸位置作为新的N-末端和C-末端的位置。在一些实施方案中,环状排列的GT酶包含与以下序列相比具有一个或更多个残基差异的氨基酸序列:SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088。在一些实施方案中,环状排列的GT酶包含与SEQ ID NO:32相比具有一个或更多个残基差异的氨基酸序列。在一些实施方案中,GT酶包含至少一个本文列出的序列。在一些实施方案中,本发明提供了包含与以下序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列的工程化糖基转移酶:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、22、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974、976、978、980、982、984、986、988、990、992、994、996、998、1000、1002、1004、1006、1008、1010、1012、1014、1016、1018、1020、1022、1024、1026、1028、1030、1032、1034、1036、1038、1040、1042、1044、1046、1048、1050、1052、1054、1056、1058、1060、1062、1064、1066、1068、1070、1072、1074、1076、1078、1290、1292、1294、2596、2598、2600、2602、2604、2606、2608、2610、2612、2614、2616、2618、2620、2622、2624、2626、2628、2630、2632、2634、2636、2638、2640、2642、2644、2646、2648、2650、2652、2654、2656、2658、2660、2662、2664、2666、2668、2670、2672、2674、2676、2678、2680、2682、2684、2686、2688、2690、2692、2694、2696、2698、2700、2702、2704、2706、2708、2710、2712、2714、2716、2718、2720、2722、2724、2726、2728、2730、2732、2734、2736、2738、2740、2742、2744、2746、2748、2750、2752、2754、2756、2758、2760、2762、2764、2766、2768、2770、2772、2774、2776、2778、2780、2782、2784、2786、2788、2790、2792、2794、2796、2798、2800、2802、2804、2806、2808、2810、2812、2814、2816、2818、2820、2822、2824、2826、2828、2830、2832、2834、2836、2838、2840、2842、2844、2846、2848、2850、2852、2854、2856、2858、2860、2862、2864、2866、2868、2870、2872、2874、2876、2878、2880、2882、2884、2886、2888、2890、2892、2894、2896、2898、2900、2902、2904、2906、2908、2910、2912、2914、2916、2918、2920、2922、2924、2926、2928、2830、2932、2934、2936、2938、2940、2942、2944、2946、2948、2950、2952、2954、2956、2958、2960、2962、2964、2966、2968、2970、2972、2974、2976、2978、2980、2982、2984、2986、2988、2990、2992、2994、2996、2998、3000、3002、3004、3006、3008、3010、3012、3014、3016、3018、3020、3022、3024、3026、3028、3030、3032、3034、3036、3038、3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062、3064、3066、3068、3070、3072、3074、3076、3078、3080、3082、3084、3086、3088、3090、3092、3094、3096、3098、3100、3102、3104、3106、3108、3110、3112、3114、3116、3118、3120、3122、3124、3126、3128、3130、3132、3134、3136、3138、3140、3142、3144、3146、3148、3150、3152、3154、3156、3158、3160、3162、3164、3166、3168、3170、3172、3174、3176、3178、3180、3182、3184、3186、3188、3190、3192、3194、3196、3198、3200、3202、3204、3206、3208、3210、3212、3214、3216、3218、3220、3222、3224、3226、3228、3230、3232、3234、3236、3238、3240、3242、3244、3246、3248、3250、3252、3254、3256、3258、3260、3262、3264、3266、3268、3270、3272、3274、3276、3278、3280、3282、3284、3286、3288、3290、3292、3294、3296、3298、3300、3302、3304、3306、3308、3310、3312、3314、3316、3318、3320、3322、3324、3326、3328、3330、3332、3334、3336、3338、3340、3342、3344、3346、3348、3350、3352、3354、3356、3358、3360、3362、3364、3366、3368、3370、3372、3374、3376、3378、3380、3382、3384、3386、3388、3390、3392、3394、3396、3398、3400、3402、3404、3406、3408、3410、3412、3414、3416、3418、3420、3422、3424、3426、3428、3430、3432、3434、3436、3438、3440、3442、3444、3446、3448、3450、3452、3454、3456、3458、3460、3462、3464、3466、3468、3470、3472、3474、3476、3478、3480、3482、3484、3486、3488、3490、3492、3494、3496、3498、3500、3502、3504、3506、3508、3510、3512、3514、3516、3518、3520、3522、3524、3526、3528、3530、3532、3534、3536、3538、3540、3542、3544、3546、3548、3550、3552、3554、3556、3558、3560、3562、3564、3566、3568、3570、3572、3574、3576、3578、3580、3582、3584、3586、3588、3590、3592、3594、3596、3598、3600、3602、3604、3606、3608、3610、3612、3614、3616、3618、3620、3622、3624、3626、3628、3630、3632、3634、3636、3638、3640、3642、3644、3646、3648、3650、3652、3654、3656、3658、3660、3662、3664、3666、3668、3670、3672、3674、3676、3678、3680、3682、3684、3686、3688、3690、3692、3694、3696、3698、3700、3702、3704、3706、3708、3710、3712、3714、3716、3718、3720、3722、3724、3726、3728、3730、3732、3734、3736、3738、3740、3742、3744、3746、3748、3750、3752、3754、3756、3758、3760、3762、3764、3766、3768、3770、3772、3774、3776、3778、3780、3782、3784、3786、3788、3790、3792、3794、3796、3798、3800、3802、3804、3806、3808、3810、3812、3814、3816、3818、3820、3822、3824、3826、3828、3830、3832、3834、3836、3838、3840、3842、3844、3846、3848、3850、3852、3854、3856、3858、3860、3862、3864、3866、3868、3870、3872、3874、3876、3878、3880、3882、3884、3886、3888、3890、3892、3894、3896、3898、3900、3902、3904、3906、3908、3910、3912、3914、3916、3918、3920、3922、3924、3926、3928、3930、3932、3934、3936、3938、3940、3942、3944、3946、3948、3950、3952、3954、3956、3958、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020、4022、4024、4026、4028、4030、4032、4034、4036、4038、4040、4042、4044、4046、4048、4050、4052、4054、4056、4058、4060、4062、4064、4066、4068、4070、4072、4074、4076、4078、4080、4082、4084、4086、4088、4090、4092、4094、4096、4098、4100、4102、4104、4106、4108、4110、4112、4114、4116、4118、4120、4122、4124、4126、4128、4130、4132、4134、4136、4138、4140、4142、4144、4146、4148、4150、4152、4154、4156、4158、4160、4162、4164、4166、4168、4170、4172、4174、4176、4178、4180、4182、4184、4186、4188、4190、4192、4194、4196、4198、4200、4202、4204、4206、4208、4210、4212、4214、4216、4218、4220、4222、4224、4226、4228、4230、4232、4234、4236、4238、4240、4242、4244、4246、4248、4250、4252、4254、4256、4258、4260、4262、4264、4266、4268、4270、4272、4274、4276、4278、4280、4282、4284、4286、4288、4290、4292、4294、4296、4298、4300、4302、4304、4306、4308、4310、4312、4314、4316、4318、4320、4322、4324、4326、4328、4330、4332、4334、4336、4338、4340、4342、4344、4346、4348、4350、4352、4354、4356、4358、4360、4362、4364、4366、4368、4370、4372、4374、4376、4378、4380、4382、4384、4386、4388、4390、4392、4394、4396、4398、4400、4402、4404、4406、4408、4410、4412、4414、4416、4418、4420、4422、4424、4426、4428、4430、4432、4434、4436、4438、4440、4442、4444、4446、4448、4450、4452、4454、4456、4458、4460、4462、4464、4466、4468、4470、4472、4474、4476、4478、4480、4482、4484、4486、4488、4490、4492、4494、4496、4498、4500、4502、4504、4506、4508、4510、4512、4514、4516、4518、4520、4522、4524、4526、4528、4530、4532、4534、4536、4538、4540、4542、4544、4546、4548、4550、4552、4554、4556、4558、4560、4562、4564、4566、4568、4570、4572、4574、4576、4578、4580、4582、4584、4586、4588、4590、4592、4594、4596、4598、4600、4602、4604、4606、4608、4610、4612、4614、4616、4618、4620、4622、4624、4626、4628、4630、4632、4634、4636、4638、4640、4642、4644、4646、4648、4650、4652、4654、4656、4658、4660、4662、4664、4666、4668、4670、4672、4674、4676、4678、4680、4682、4684、4686、4688、4690、4692、4694、4696、4698、4700、4702、4704、4706、4708、4710、4712、4714、4716、4718、4720、4722、4724、4726、4728、4730、4732、4734、4736、4738、4740、4742、4744、4746、4748、4750、4752、4754、4756、4758、4760、4762、4764、4766、4768、4770、4772、4774、4776、4778、4780、4782、4784、4786、4788、4790、4792、4794、4796、4798、4800、4902、4804、4806、4808、4810、4812、4814、4816、4818、4820、4822、4824、4826、4828、4830、4832、4834、4836、4838、4840、4842、4844、4846、4848、4850、4852、4854、4856、4858、4860、4862、4864、4866、4868、4870、4872、4874、4876、4878、4880、4882、4884、4886、4888、4890、4892、4894、4896、4898、4900、4902、4904、4906、4908、4910、4912、4914、4916、4918、4920、4922、4924、4926、4928、4930、4932、4934、4936、4938、4940、4942、4944、4946、4948、4950、4952、4954、4956、4958、4960、4962、4964、4966、4968、4970、4972、4974、4976、4978、4980、4982、4984、4986、4988、4990、4992、4994、4996、4998、5000、5002、5004、5006、5008、5010、5012、5014、5016、5018、5020、5022、5024、5026、5028、5030、5032、5034、5036、5038、5040、5042、5044、5046、5048、5050、5052、5054、5056、5058、5060、5062、5064、5066、5068、5070、5072、5074、5076、5078、5080、5082、5084、5086、5088、5090、5092、5094、5096、5098、5100、5102、5104、5106、5108、5110、5112、5114、5116、5118、5120、5122、5124、5126、5128、5130、5132、5134、5136、5138、5140、5142、5144、5146、5148、5150、5152、5154、5156、5158、5160、5162、5164、5166、5168、5170、5172、5174、5176、5178、5180、5182、5184、5186、5188、5190、5192、5194、5196、5198、5200、5202、5204、5206、5208、5210、5212、5214、5216、5218、5220、5222、5224、5226、5228、5230、5232、5234、5236、5238、5240、5242、5244、5246、5248、5250、5252、5254、5256、5258、5260、5262、5264、5266、5268、5270、5272、5274、5276、5278、5280、5282、5284、5286、5288、5290、5292、5294、5296、5298、5300、5302、5304、5306、5308、5310、5312、5314、5316、5318、5320、5322、5324、5326、5328、5330、5332、5334、5336、5338、5340、5342、5344、5346、5348、5350、5352、5354、5356、5358、5360、5362、5364、5366、5368、5370、5372、5374、5376、5378、5380、5382、5384、5386、5388、5390、5392、5394、5396、5398、5400、5402、5404、5406、5408、5410、5412、5414、5416、5418、5420、5422、5424、5426、5428、5430、5432、5434、5436、5438、5440、5442、5444、5446、5448、5450、5452、5454、5456、5458、5460、5462、5464、5466、5468、5470、5472、5474、5476、5478、5480、5482、5484、5486、5488、5490、5492、5494、5496、5498、5500、5502、5504、5506、5508、5510、5512、5514、5516、5518、5520、5522、5524、5526、5528、5530、5532、5534、5536、5538、5540、5542、5544、5546、5548、5550、5552、5554、5556、5558、5560、5562、5564、5566、5568、5570、5572、5574、5576、5578、5580、5582、5584、5586、5588、5590、5592、5594、5596、5598、5600、5602、5604、5606、5608、5610、5612、5614、5616、5618、5620、5622、5624、5626、5628、5630、5632、5634、5636、5638、5640、5642、5644、5646、5648、5650、5652、5654、5656、5658、5660、5662、5664、5666、5668、5670、5672、5674、5676、5678、5680、5682、5684、5686、5688、5690、5692、5694、5696、5698、5700、5702、5704、5706、5708、5710、5712、5714、5716、5718、5720、5722、5724、5726、5728、5730、5732、5734、5736、5738、5740、5742、5744、5746、5748、5750、5752、5754、5756、5758、5760、5762、5764、5766、5768、5770、5772、5774、5776、5778、5780、5782、5784、5786、5788、5790、5792、5794、5796、5798、5800、5802、5804、5806、5808、5810、5812、5814、5816、5818、5820、5822、5824、5826、5828、5830、5832、5834、5836、5838、5840、5842、5844、5846、5848、5850、5852、5854、5856、5858、5860、5862、5864、5866、5868、5870、5872、5874、5876、5878、5880、5882、5884、5886、5888、5890、5892、5894、5896、5898、5900、5902、5904、5906、5908、5910、5912、5914、5916、5918、5920、5922、5924、5926、5928、5930、5932、5934、5936、5938、5940、5942、5944、5946、5948、5950、5952、5954、5956、5958、5960、5962、5964、5966、5968、5970、5972、5974、5976、5978、5980、5982、5984、5986、5988、5990、5992、5994、5996、5998、6000、6002、6004、6006、6008、6010、6012、6014、6016、6018、6020、6022、6024、6026、6028、6030、6032、6034、6036、6038、6040、6042、6044、6046、6048、6050、6052、6054、6056、6058、6060、6062、6064、6066、6068、6070、6072、6074、6076、6078、6080、6082、6084、6086、6088、6090、6092、6094、6096、6098、6100、6102、6104、6106、6108、6110、6112、6114、6116、6118、6120、6122、6124、6126、6128、6130、6132、6134、6136、6138、6140、6142、6144、6146、6148、6150、6152、6154、6156、6158、6160、6162、6164、6166、6168、6170、6172、6174、6176、6178、6180、6182、6184、6186、6188、6190、6192、6194、6196、6198、6200、6202、6204、6206、6208、6210、6212、6214、6216、6218、6220、6222、6224、6226、6228、6230、6232、6234、6236、6238、6240、6242、6244、6246、6248、6250、6252、6254、6256、6258、6260、6262、6264、6266、6268、6270、6272、6274、6276、6278、6280、6282、6284、6286、6288、6290、6292、6294、6296、6298、6300、6302、6304、6306、6308、6310、6312、6314、6316、6318、6320、6322、6324、6326、6328、6330、6332、6334、6336、6338、6340、6342、6344、6346、6348、6350、6352、6354、6356、6358、6360、6362、6364、6366、6368、6370、6372、6374、6376、6378、6380、6382、6384、6386、6388、6390、6392、6394、6396、6398、6400、6402、6404、6406、6408、6410、6412、6414、6416、6418、6420、6422、6424、6426、6428、6430、6432、6434、6436、6438、6440、6442、6444、6446、6448、6450、6452、6454、6456、6458、6460、6462、6464、6466、6468、6470、6472、6474、6476、6478、6480、6482、6484、6486、6488、6490、6492、6494、6496、6498、6500、6502、6504、6506、6508、6510、6512、6514、6516、6518、6520、6522、6524、6526、6528、6530、6532、6534、6536、6538、6540、6542、6544、6546、6548、6550、6552、6554、6556、6558、6560、6562、6564、6566、6568、6570、6572、6574、6576、6578、6580、6582、6584、6586、6588、6590、6592、6594、6596、6598、6600、6602、6604、6606、6608、6610、6612、6614、6616、6618、6620、6622、6624、6626、6628、6630、6632、6634、6636、6638、6640、6642、6644、6646、6648、6650、6652、6654、6656、6658、6660、6662、6664、6666、6668、6670、6672、6674、6676、6678、6680、6682、6684、6686、6688、6690、6692、6694、6696、6698、6700、6702、6704、6706、6708、6710、6712、6714、6716、6718、6720、6722、6724、6726、6728、6730、6732、6734、6736、6738、6740、6742、6744、6746、6748、6750、6752、6754、6756、6758、6760、6762、6764、6766、6768、6770、6772、6774、6776、6778、6780、6782、6784、6786、6788、6790、6792、6794、6796、6798、6800、6802、6804、6806、6808、6810、6812、6814、6816、6818、6820、6822、6824、6826、6828、6830、6832、6834、6836、6838、6840、6842、6844、6846、6848、6850、6852、6854、6856、6858、6860、6862、6864、6866、6868、6870、6872、6874、6876、6878、6880、6882、6884、6886、6888、6890、6892、6894、6896、6898、6900、6902、6904、6906、6908、6910、6912、6914、6916、6918、6920、6922、6924、6926、6928、6930、6932、6934、6936、6938、6940、6942、6944、6946、6948、6950、6952、6954、6956、6958、6960、6962、6964、6966、6968、6970、6972、6974、6976、6978、6980、6982、6984、6986、6988、6990、6992、6994、6996、6998、7000、7002、7004、7006、7008、7010、7012、7014、7016、7018、7020、7022、7024、7026、7028、7030、7032、7034、7036、7038、7040、7042、7044、7046、7048、7050、7052、7054、7056、7058、7060、7062、7064、7066、7068、7070、7072、7074、7076、7078、7080、7082、7084、7086、7088、7090、7092、7094、7096、7098、7100、7102、7104、7106、7108、7110、7112、7114、7116、7118、7120、7122、7124、7126、7128、7130、7132、7134、7136、7138、7140、7142、7144、7146、7148、7150、7152、7154、7156、7158、7160、7162、7164、7166、7168、7170、7172、7174、7176、7178、7180、7182、7184、7186、7188、7190、7192、7194、7196、7198、7200、7202、7204、7206、7208、7210、7212、7214、7216、7218、7220、7222、7224、7226、7228、7230、7232、7234、7236、7238、7240、7242、7244、7246、7248、7250、7252、7254、7256、7258、7260、7262、7264、7266、7268、7270、7272、7274、7276、7278、7280、7282、7284、7286、7288、7290、7292、7294、7296、7298、7300、7302、7304、7306、7308、7310、7312、7314、7316、7318、7320、7322、7324、7326、7328、7330、7332、7334、7336、7338、7340、7342、7344、7346、7348、7350、7352、7354、7356、7358、7360、7362、7364、7366、7368、7370、7372、7374、7376、7378、7380、7382、7384、7386、7388、7390、7392、7394、7396、7398、7400、7402、7404、7406、7408、7410、7412、7414、7416、7418、7420、7422、7424、7426、7428、7430、7432、7434、7436、7766、7768、7770、7772、7774、7776、7778、7780、7782、7784、7786、7788、7790、7792、7794、7796、7798、7800、7812、7814、7816、7818、7820、7822、7824、7826、7828、7830、7832、7834、7836、7838、7840、7842、7844、7846、7848、7850、7852、7854、7856、7858、7860、7862、7864、7866、7868、7870、7872、7874、7876、7878、7880、7882、7884、7886、7888、7890、7892、7894、7896、7898、7900、7902、7904、7906、7908、7910、7912、7914、7916、7918、7920、7922、7924、7926、7928、7930、7932、7934、7936、7938、7940、7942、7944、7946、7948、7950、7952、7954、7956、7958、7960、7962、7964、7966、7968、7970、7972、7974、7976、7978、7980、7982、7984、7986、7988、7990、7992、7994、7996、7998、8000、8002、8004、8006、8008、8010、8012、8014、8016、8018、8020、8022、8024、8026、8028、8030、8032、8034、8036、8038、8040、8042、8044、8046、8048、8050、8052、8054、8056、8058、8060、8062、8064、8066、8068、8070、8072、8074、8076、8078、8080、8082、8084、8086、8088、8090、8092、8094、8096、8098、8100、8102、8104、8106、8108、8110、8112、8114、8116、8118、8120、8122、8124、8126、8128、8130、8132、8134、8136、8138、8140、8142、8144、8146、8148、8150、8152、8154、8156、8158、8160、8162、8164、8166、8168、8170、8172、8174、8176、8178、8180、8182、8184、8186、8188、8190、8192、8194、8196、8198、8200、8202、8204、8206、8208、8210、8212、8214、8216、8218、8220、8222、8224、8226、8228、8230、8232、8234、8236、8238、8240、8242、8244、8246、8248、8250、8252、8254、8256、8258、8260、8262、8264、8266、8268、8270、8272、8274、8276、8278、8280、8282、8284、8286、8288、8290、8292、8294、8296、8298、8300、8302、8304、8306、8308、8310、8312、8314、8316、8318、8320、8322、8324、8326、8328、8330、8332、8334、8336、8338、8340、8342、8344、8346、8348、8350、8352、8354、8356、8358、8360、8362、8364、8366、8368、8482、8484、8486、8488、8490、8492、8494、8496、8498、8500、8502、8504、8506、8508、8510、8512、8514、8516、8518、8520、8522、8524、8526、8528、8530、8532、8534、8536、8538、8540、8542、8544、8546、8548、8550、8552、8554、8556、8558、8560、8562、8564、8566、8568、8570、8572、8574、8576、8578、8580、8582、8584、8586、8588、8590、8592、8594、8596、8598、8600、8602、8604、8606、8608、8610、8612、8614、8616、8618、8620、8622、8624、8626、8628、8630、8632、8634、8636、8638、8640、8642、8644、8646、8648、8650、8652、8654、8656、8658、8660、8662、8664、8666、8668、8670、8672、8674、8676、8678、8680、8682、8684、8686、8688、8690、8692、8694、8696、8698、8700、8702、8704、8706、8708、8710、8712、8714、8716、8718、8720、8722、8724、8726、8728、8730、8732、8734、8736、8738、8740、8742、8744、8746、8748、8750、8752、8754、8756、8758、8760、8762、8764、8766、8768、8770、8772、8774、8776、8778、8780、8782、8784、8786、8788、8790、8792、8794、8796、9108、9110、9112、9114、9116、9118、9120、9122、9124、9126、9128、9130、9132、9134、9136、9138、9140、9142、9144、9146、9148、9150、9152、9154、9156、9158、9160、9162、9164、9166、9168、9170、9172、9174、9176、9178、9180、9182、9184、9186、9188、9190、9192、9194、9196、9198、9200、9202、9204、9206、9208、9210、9212、9214、9216、9218、9220、9222、9224、9226、9228、9230、9232、9234、9236、9238和/或9240。在一些另外的实施方案中,本发明还提供了包含与以下序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列的工程化蔗糖合酶:SEQ ID NO:1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142、1144、1146、1148、1150、1152、1154、1156、1158、1160、1162、1164、1166、1168、1170、1172、1174、1176、1178、1180、1182、1184、1186、1188、1190、1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218、1220、1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286、1288、1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390、1392、1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564、1566、1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596、1598、1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770、1772、1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818、1820、1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982、1984、1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316、2318、2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500、2502、2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592、2594、7438、7440、7442、7444、7446、7448、7450、7452、7454、7456、7458、7460、7462、7464、7466、7468、7470、7472、7474、7476、7478、7480、7482、7484、7486、7488、7490、7492、7494、7496、7498、7500、7502、7504、7506、7508、7510、7512、7514、7516、7518、7520、7522、7524、7526、7528、7530、7532、7534、7536、7538、7540、7542、7544、7546、7548、7550、7552、7554、7556、7558、7560、7562、7564、7566、7568、7570、7572、7574、7576、7578、7580、7582、7584、7586、7588、7590、7592、7594、7596、7598、7600、7602、7604、7606、7608、7610、7612、7614、7616、7618、7620、7622、7624、7626、7628、7630、7632、7634、7636、7638、7640、7642、7644、7646、7648、7650、7652、7654、7656、7658、7660、7662、7664、7666、7668、7670、7672、7674、7676、7678、7680、7682、7684、7686、7688、7690、7692、7694、7696、7698、7700、7702、7704、7706、7708、7710、7712、7714、7716、7718、7720、7722、7724、7726、7728、7730、7732、7734、7736、7738、7740、7742、7744、7746、7748、7750、7752、7754、7756、7758、7760、7762、7764、8370、8372、8374、8376、8378、8380、8382、8384、8386、8388、8390、8392、8394、8396、8398、8400、8402、8404、8406、8408、8410、8412、8414、8416、8418、8420、8422、8424、8426、8428、8430、8432、8434、8436、8438、8440、8442、8444、8446、8448、8450、8452、8454、8456、8458、8460、8462、8464、8466、8468、8470、8472、8474、8476、8478、8480、8798、8800、8802、8804、8806、8808、8810、8812、8814、8816、8818、8820、8822、8824、8826、8828、8830、8832、8834、8836、8838、8840、8842、8844、8846、8848、8850、8852、8854、8856、8858、8860、8862、8864、8866、8868、8870、8872、8874、8876、8878、8880、8882、8884、8886、8888、8890、8892、8894、8896、8898、8900、8902、8904、8906、8908、8910、8912、8914、8916、8918、8920、8922、8924、8926、8928、8930、8932、8934、8936、8938、8940、8942、8944、8946、8948、8950、8952、8954、8956、8958、8960、8962、8964、8966、8968、8970、8972、8974、8976、8978、8980、8982、8984、8986、8988、8990、8992、8994、8996、8998、9000、9002、9004、9006、9008、9010、9012、9014、9016、9018、9020、9022、9024、9026、9028、9030、9032、9034、9036、9038、9040、9042、9044、9046、9048、9050、9052、9054、9056、9058、9060、9062、9064、9066、9068、9070、9072、9074、9076、9078、9080、9082、9084、9086、9088、9090、9092、9094、9096、9098、9100、9102、9104和9106。
在一些实施方案中,利用了另外的反应组分或另外的技术以补充反应条件。在一些实施方案中,这些包括采取措施来稳定酶或防止酶失活、减少产物抑制、使反应平衡移动到葡糖基化产物形成。
在一些另外的实施方案中,用于将底物化合物转化为产物化合物的任何以上描述的方法还可以包括一个或更多个选自以下的步骤:提取;分离;纯化;和产物化合物的结晶、过滤或冻干。用于从通过以上公开的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶葡糖基化产物的方法、技术和方案是普通技术人员已知的和/或可通过常规实验获得的。此外,在以下实施例中提供了说明性方法。
工程化蔗糖合酶多肽
本发明提供了工程化蔗糖合酶(SuS)多肽、编码该多肽的多核苷酸、制备该多肽的方法以及用于使用该多肽的方法。在描述涉及多肽的情况下,应当理解,它还描述了编码该多肽的多核苷酸。在一些实施方案中,本发明提供了与野生型SuS酶相比具有改进的特性的工程化、非天然存在的SuS酶。任何合适的反应条件可用于本发明。在一些实施方案中,使用方法来分析工程化多肽的改进的特性以进行合酶反应。在一些实施方案中,根据工程化SuS、底物的浓度或量,缓冲液,溶剂,pH,包括温度和反应时间的条件,和/或工程化SuS多肽固定在固体支持物上的条件来改变反应条件,如以下和实施例中进一步描述的。
在一些实施方案中,与野生型SuS酶相比,诸如在本文描述的反应中,本文描述的工程化SuS多肽具有改进的特性。在一些实施方案中,工程化SuS酶包含与以下序列相比具有一个或更多个残基差异的氨基酸序列:SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420。
在一些实施方案中,本发明提供了工程化SuS酶,其中SuS酶的多肽包含与以下序列至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性:SEQ ID NO:1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142、1144、1146、1148、1150、1152、1154、1156、1158、1160、1162、1164、1166、1168、1170、1172、1174、1176、1178、1180、1182、1184、1186、1188、1190、1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218、1220、1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286、1288、1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390、1392、1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564、1566、1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596、1598、1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770、1772、1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818、1820、1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982、1984、1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316、2318、2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500、2502、2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592、2594、7438、7440、7442、7444、7446、7448、7450、7452、7454、7456、7458、7460、7462、7464、7466、7468、7470、7472、7474、7476、7478、7480、7482、7484、7486、7488、7490、7492、7494、7496、7498、7500、7502、7504、7506、7508、7510、7512、7514、7516、7518、7520、7522、7524、7526、7528、7530、7532、7534、7536、7538、7540、7542、7544、7546、7548、7550、7552、7554、7556、7558、7560、7562、7564、7566、7568、7570、7572、7574、7576、7578、7580、7582、7584、7586、7588、7590、7592、7594、7596、7598、7600、7602、7604、7606、7608、7610、7612、7614、7616、7618、7620、7622、7624、7626、7628、7630、7632、7634、7636、7638、7640、7642、7644、7646、7648、7650、7652、7654、7656、7658、7660、7662、7664、7666、7668、7670、7672、7674、7676、7678、7680、7682、7684、7686、7688、7690、7692、7694、7696、7698、7700、7702、7704、7706、7708、7710、7712、7714、7716、7718、7720、7722、7724、7726、7728、7730、7732、7734、7736、7738、7740、7742、7744、7746、7748、7750、7752、7754、7756、7758、7760、7762、7764、8370、8372、8374、8376、8378、8380、8382、8384、8386、8388、8390、8392、8394、8396、8398、8400、8402、8404、8406、8408、8410、8412、8414、8416、8418、8420、8422、8424、8426、8428、8430、8432、8434、8436、8438、8440、8442、8444、8446、8448、8450、8452、8454、8456、8458、8460、8462、8464、8466、8468、8470、8472、8474、8476、8478、8480、8798、8800、8802、8804、8806、8808、8810、8812、8814、8816、8818、8820、8822、8824、8826、8828、8830、8832、8834、8836、8838、8840、8842、8844、8846、8848、8850、8852、8854、8856、8858、8860、8862、8864、8866、8868、8870、8872、8874、8876、8878、8880、8882、8884、8886、8888、8890、8892、8894、8896、8898、8900、8902、8904、8906、8908、8910、8912、8914、8916、8918、8920、8922、8924、8926、8928、8930、8932、8934、8936、8938、8940、8942、8944、8946、8948、8950、8952、8954、8956、8958、8960、8962、8964、8966、8968、8970、8972、8974、8976、8978、8980、8982、8984、8986、8988、8990、8992、8994、8996、8998、9000、9002、9004、9006、9008、9010、9012、9014、9016、9018、9020、9022、9024、9026、9028、9030、9032、9034、9036、9038、9040、9042、9044、9046、9048、9050、9052、9054、9056、9058、9060、9062、9064、9066、9068、9070、9072、9074、9076、9078、9080、9082、9084、9086、9088、9090、9092、9094、9096、9098、9100、9102、9104和9106。
在一些实施方案中,利用了另外的反应组分或另外的技术以补充反应条件。在一些实施方案中,这些包括采取措施来稳定酶或防止酶失活、减少产物抑制、使反应平衡移动到葡糖基化产物形成。
在一些另外的实施方案中,用于将底物化合物转化为产物化合物的任何以上描述的方法还可以包括一个或更多个选自以下的步骤:产物化合物的提取、分离、纯化、结晶、过滤和/或冻干。用于从通过本文提供的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶产物(例如莱鲍迪苷)的方法、技术和方案是普通技术人员已知的和/或可通过常规实验获得的。此外,在下面的实施例中提供了说明性的方法。
编码工程化多肽的多核苷酸、表达载体和宿主细胞
本发明提供了编码本文描述的工程化酶多肽的多核苷酸。在一些实施方案中,多核苷酸被可操作地连接到控制基因表达的一个或更多个异源调控序列,以产生能够表达该多肽的重组多核苷酸。在一些实施方案中,将含有至少一种编码工程化酶多肽的异源多核苷酸的表达构建体引入到适当的宿主细胞中,以表达对应的酶多肽。
如对技术人员将是明显的,蛋白序列的可获得性和对应于各种氨基酸的密码子的知识提供能够编码主题多肽的所有多核苷酸的说明。遗传密码的简并性(其中相同的氨基酸由可替代的密码子或同义密码子编码)允许制备极大数目的核酸,所有这些核酸都编码工程化酶(例如GT或SuS)多肽。因此,本发明提供了用于通过选择基于可能的密码子选择的组合产生编码本文描述的酶多肽的可以制备的酶多核苷酸的每个和每一个可能的变体的方法和组合物,并且所有这些变体都应当被认为是针对本文描述的任何多肽(包括实施例中(例如各种表格中)呈现的氨基酸序列)具体公开的。
在一些实施方案中,优选地针对选择的宿主细胞的利用优化密码子用于蛋白产生。例如,细菌中使用的优选的密码子通常用于在细菌中的表达。因此,编码工程化酶多肽的密码子优化的多核苷酸在全长编码区中的约40%、50%、60%、70%、80%或大于90%的密码子位置包含优选的密码子。
在一些实施方案中,酶多核苷酸编码具有本文公开的特性的酶活性的工程化多肽,其中所述多肽包含与选自本文提供的SEQ ID NO的参考序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列,或任何变体的氨基酸序列(例如实施例中提供的那些),和与参考多核苷酸相比的一个或更多个残基差异,或如实施例中公开的任何变体的氨基酸序列(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中,参考多肽序列选自SEQ ID NO:4、8、32、232、348、548、562、696、758、770、792、954、1002、1054、2600、2718、2814、2884、3016、3082、3244、3346、3502、3696、3956、4256、4550、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、6864、7324、7388、7784和/或8088。在一些可选择的实施方案中,参考多肽序列选自SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420。
在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:3、7、31、231、347、547、561、695、757、769、791、953、1001、1053、2599、2717、2813、2883、3015、3081、3243、3345、3501、3695、3955、4255、4549、4683、4837、4875、5065、5289、5371、5561、5707、5975、6137、6287、6467、6863、7323、7387、7783和/或8087。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:757、769、791、953、1001、1053、2599、2717、2813、2883、3015、3081、3243、3345、3501、3695、3955、4255、4549、7323和/或7783,而在一些替代实施方案中,参考多核苷酸序列选自SEQ ID NO:3、7、31、231、347、547、561、695、4683、4837、4875、5065、5289、5371、5561、5707、5975、6137、6287、6467、6863、7387和/或8087。在又一些另外的实施方案中,参考多核苷酸序列选自SEQ ID NO:73、1079、1157、1221、1391、1455、1581、1763、1803、1839、2063、2431、2509、7505和/或8419。
在一些实施方案中,编码至少一种本文提供的工程化糖基转移酶的工程化多核苷酸包含与以下序列至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性:SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973、975、977、979、981、983、985、987、989、991、993、995、997、999、1001、1003、1005、1007、1009、1011、1013、1015、1017、1019、1021、1023、1025、1027、1029、1031、1033、1035、1037、1039、1041、1043、1045、1047、1049、1051、1053、1055、1057、1059、1061、1063、1065、1067、1069、1071、1073、1075、1077、1289、1291、1293、2595、2597、2599、2601、2603、2605、2607、2609、2611、2613、2615、2617、2619、2621、2623、2625、2627、2629、2631、2633、2635、2637、2639、2641、2643、2645、2647、2649、2651、2653、2655、2657、2659、2661、2663、2665、2667、2669、2671、2673、2675、2677、2679、2681、2683、2685、2687、2689、2691、2693、2695、2697、2699、2701、2703、2705、2707、2709、2711、2713、2715、2717、2719、2721、2723、2725、2727、2729、2731、2733、2735、2737、2739、2741、2743、2745、2747、2749、2751、2753、2755、2757、2759、2761、2763、2765、2767、2769、2771、2773、2775、2777、2779、2781、2783、2785、2787、2789、2791、2793、2795、2797、2799、2801、2803、2805、2807、2809、2811、2813、2815、2817、2819、2821、2823、2825、2827、2829、2831、2833、2835、2837、2839、2841、2843、2845、2847、2849、2851、2823、2855、2857、2859、2861、2863、2865、2867、2869、2871、2873、2875、2877、2879、2881、2883、2885、2887、2889、2891、2893、2895、2897、2899、2901、2903、2905、2907、2909、2911、2913、2915、2917、2919、2921、2923、2925、2927、2829、2931、2933、2935、2937、2939、2941、2943、2945、2947、2949、2951、2953、2955、2957、2959、2961、2963、2965、2967、2969、2971、2973、2975、2977、2979、2981、2983、2985、2987、2989、2991、2993、2995、2997、2999、3001、3003、3005、3007、3009、3011、3013、3015、3017、3019、3021、3023、3025、3027、3029、3031、3033、3035、3037、3039、3041、3043、3045、3047、3049、3051、3053、3055、3057、3059、3061、3063、3065、3067、3069、3071、3073、3075、3077、3079、3081、3083、3085、3087、3089、3091、3093、3095、3097、3099、3101、3103、3105、3107、3109、3111、3113、3115、3117、3119、3121、3123、3125、3127、3129、3131、3133、3135、3137、3139、3141、3143、3145、3147、3149、3151、3153、3155、3157、3159、3161、3163、3165、3167、3169、3171、3173、3175、3177、3179、3181、3183、3185、3187、3189、3191、3193、3195、3197、3199、3201、3203、3205、3207、3209、3211、3213、3215、3217、3219、3221、3223、3225、3227、3229、3231、3233、3235、3237、3239、3241、3243、3245、3247、3249、3251、3253、3255、3257、3259、3261、3263、3265、3267、3269、3271、3273、3275、3277、3279、3281、3283、3285、3287、3289、3291、3293、3295、3297、3299、3301、3303、3305、3307、3309、3311、3313、3315、3317、3319、3321、3323、3325、3327、3329、3331、3333、3335、3337、3339、3341、3343、3345、3347、3349、3351、3353、3355、3357、3359、3361、3363、3365、3367、3369、3371、3373、3375、3377、3379、3381、3383、3385、3387、3389、3391、3393、3395、3397、3399、3401、3403、3405、3407、3409、3411、3413、3415、3417、3419、3421、3423、3425、3427、3429、3431、3433、3435、3437、3439、3441、3443、3445、3447、3449、3451、3453、3455、3457、3459、3461、3463、3465、3467、3469、3471、3473、3475、3477、3479、3481、3483、3485、3487、3489、3491、3493、3495、3497、3499、3501、3503、3505、3507、3509、3511、3513、3515、3517、3519、3521、3523、3525、3527、3529、3531、3533、3535、3537、3539、3541、3543、3545、3547、3549、3551、3553、3555、3557、3559、3561、3563、3565、3567、3569、3571、3573、3575、3577、3579、3581、3583、3585、3587、3589、3591、3593、3595、3597、3599、3601、3603、3605、3607、3609、3611、3613、3615、3617、3619、3621、3623、3625、3627、3629、3631、3633、3635、3637、3639、3641、3643、3645、3647、3649、3651、3653、3655、3657、3659、3661、3663、3665、3667、3669、3671、3673、3675、3677、3679、3681、3683、3685、3687、3689、3691、3693、3695、3697、3699、3791、3703、3705、3707、3709、3711、3713、3715、3717、3719、3721、3723、3725、3727、3729、3731、3733、3735、3737、3739、3741、3743、3745、3747、3749、3751、3753、3755、3757、3759、3761、3763、3765、3767、3769、3771、3773、3775、3777、3779、3781、3783、3785、3787、3789、3791、3793、3795、3797、3799、3801、3803、3805、3807、3809、3811、3813、3815、3817、3819、3821、3823、3825、3827、3829、3831、3833、3835、3837、3839、3841、3843、3845、3847、3849、3851、3853、3855、3857、3859、3861、3863、3865、3867、3869、3871、3873、3875、3877、3879、3881、3883、3885、3887、3889、3891、3893、3895、3897、3899、3901、3903、3905、3907、3909、3911、3913、3915、3917、3919、3921、3923、3925、3927、3929、3931、3933、3935、3937、3939、3941、3943、3945、3947、3949、3951、3953、3955、3957、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017、4019、4021、4023、4025、4027、4029、4031、4033、4035、4037、4039、4041、4043、4045、4047、4049、4051、4053、4055、4057、4059、4061、4063、4065、4067、4069、4071、4073、4075、4077、4079、4081、4083、4085、4087、4089、4091、4093、4095、4097、4099、4101、4103、4105、4107、4109、4111、4113、4115、4117、4119、4121、4123、4125、4127、4129、4131、4133、4135、4137、4139、4141、4143、4145、4147、4149、4151、4153、4155、4157、4159、4161、4163、4165、4167、4169、4171、4173、4175、4177、4179、4181、4183、4185、4187、4189、4191、4193、4195、4197、4199、4201、4203、4205、4207、4209、4211、4213、4215、4217、4219、4221、4223、4225、4227、4229、4231、4233、4235、4237、4239、4241、4243、4245、4247、4249、4251、4253、4255、4257、4259、4261、4263、4265、4267、4269、4271、4273、4275、4277、4279、4281、4283、4285、4287、4289、4291、4293、4295、4297、4299、4301、4303、4305、4307、4309、4311、4313、4315、4317、4319、4321、4323、4325、4327、4329、4331、4333、4335、4337、4339、4341、4343、4345、4347、4349、4351、4353、4355、4357、4359、4361、4363、4365、4367、4369、4371、4373、4375、4377、4379、4381、4383、4385、4387、4389、4391、4393、4395、4397、4399、4401、4403、4405、4407、4409、4411、4413、4415、4417、4419、4421、4423、4425、4427、4429、4431、4433、4435、4437、4439、4441、4443、4445、4447、4449、4451、4453、4455、4457、4459、4461、4463、4465、4467、4469、4471、4473、4475、4477、4479、4481、4483、4485、4487、4489、4491、4493、4495、4497、4499、4501、4503、4505、4507、4509、4511、4513、4515、4517、4519、4521、4523、4525、4527、4529、4531、4533、4535、4537、4539、4541、4543、4545、4547、4549、4551、4553、4555、4557、4559、4561、4563、4565、4567、4569、4571、4573、4575、4577、4579、4581、4583、4585、4587、4589、4591、4593、4595、4597、4599、4601、4603、4605、4607、4609、4611、4613、4615、4617、4619、4621、4623、4625、4627、4629、4631、4633、4635、4637、4639、4641、4643、4645、4647、4649、4651、4653、4655、4657、4659、4661、4663、4665、4667、4669、4671、4673、4675、4677、4679、4681、4683、4685、4687、4689、4691、4693、4695、4697、4699、4701、4703、4705、4707、4709、4711、4713、4715、4717、4719、4721、4723、4725、4727、4729、4731、4733、4735、4737、4739、4741、4743、4745、4747、4749、4751、4753、4755、4757、4759、4761、4763、4765、4767、4769、4771、4773、4775、4777、4779、4781、4783、4785、4787、4789、4791、4793、4795、4797、4799、4801、4803、4805、4807、4809、4811、4813、4815、4817、4819、4821、4823、4825、4827、4829、4831、4833、4835、4837、4839、4841、4843、4845、4847、4849、4851、4853、4855、4857、4859、4861、4863、4865、4867、4869、4871、4873、4875、4877、4879、4881、4883、4885、4887、4889、4891、4893、4895、4897、4899、4901、4903、4905、4907、4909、4911、4913、4915、4917、4919、4921、4923、4925、4927、4929、4931、4933、4935、4937、4939、4941、4943、4945、4947、4949、4951、4953、4955、4957、4959、4961、4963、4965、4967、4969、4971、4973、4975、4977、4979、4981、4983、4985、4987、4989、4991、4993、4995、4997、4999、5001、5003、5005、5007、5009、5011、5013、5015、5017、5019、5021、5023、5025、5027、5029、5031、5033、5035、5037、5039、5041、5043、5045、5047、5059、5051、5053、5055、5057、5059、5061、5063、5065、5067、5069、5071、5073、5075、5077、5079、5081、5083、5085、5087、5089、5091、5093、5095、5097、5099、5101、5103、5105、5107、5109、5111、5113、5115、5117、5119、5121、5123、5125、5127、5129、5131、5133、5135、5137、5139、5141、5143、5145、5147、5149、5151、5153、5155、5157、5159、5161、5163、5165、5167、5169、5171、5173、5175、5177、5179、5181、5183、5185、5187、5189、5191、5193、5195、5197、5199、5201、5203、5205、5207、5209、5211、5213、5215、5217、5219、5221、5223、5225、5227、5229、5231、5233、5235、5237、5239、5241、5243、5245、5247、5249、5251、5253、5255、5257、5259、5261、5263、5265、5267、5269、5271、5273、5275、5277、5279、5281、5283、5285、5287、5289、5291、5293、5295、5297、5299、5301、5303、5305、5307、5309、5311、5313、5315、5317、5319、5321、5323、5325、5327、5329、5331、5333、5335、5337、5339、5341、5343、5345、5347、5349、5351、5353、5355、5357、5359、5361、5363、5365、5367、5369、5371、5373、5375、5377、5379、5381、5383、5385、5387、5389、5391、5393、5395、5397、5399、5401、5403、5405、5407、5409、5411、5413、5415、5417、5419、5421、5423、5425、5427、5429、5431、5433、5435、5437、5439、5441、5443、5445、5447、5449、5451、5453、5455、5457、5459、5461、5463、5465、5467、5469、5471、5473、5475、5477、5479、5481、5483、5485、5487、5489、5491、5493、5495、5497、5499、5501、5503、5505、5507、5509、5511、5513、5515、5517、5519、5521、5523、5525、5527、5529、5531、5533、5535、5537、5539、5541、5543、5545、5547、5549、5551、5553、5555、5557、5559、5561、5563、5565、5567、5569、5571、5573、5575、5577、5579、5581、5583、5585、5587、5589、5591、5593、5595、5597、5599、5601、5603、5605、5607、5609、5611、5613、5615、5617、5619、5621、5623、5625、5627、5629、5631、5633、5635、5637、5639、5641、5643、5645、5647、5649、5651、5653、5655、5657、5659、5661、5663、5665、5667、5669、5671、5673、5675、5677、5679、5681、5683、5685、5687、5689、5691、5693、5695、5697、5699、5701、5703、5705、5707、5709、5711、5713、5715、5717、5719、5721、5723、5725、5727、5729、5731、5733、5735、5737、5739、5741、5743、5745、5747、5749、5751、5753、5755、5757、5759、5761、5763、5765、5767、5769、5771、5773、5775、5777、5779、5781、5783、5785、5787、5789、5791、5793、5795、5797、5799、5801、5803、5805、5807、5809、5811、5813、5815、5817、5819、5821、5823、5825、5827、5829、5831、5833、5835、5837、5839、5841、5843、5845、5847、5849、5851、5853、5855、5857、5859、5861、5863、5865、5867、5869、5871、5873、5875、5877、5879、5881、5883、5885、5887、5889、5891、5893、5895、5897、5899、5901、5903、5905、5907、5909、5911、5913、5915、5917、5919、5921、5923、5925、5927、5929、5931、5933、5935、5937、5939、5941、5943、5945、5947、5949、5951、5953、5955、5957、5959、5961、5963、5965、5967、5969、5971、5973、5975、5977、5979、5981、5983、5985、5987、5989、5991、5993、5995、5997、5999、6001、6003、6005、6007、6009、6011、6013、6015、6017、6019、6021、6023、6025、6027、6029、6031、6033、6035、6037、6039、6041、6043、6045、6047、6049、6051、6053、6055、6057、6059、6061、6063、6065、6067、6069、6071、6073、6075、6077、6079、6081、6083、6085、6087、6089、6091、6093、6095、6097、6099、6101、6103、6105、6107、6109、6111、6113、6115、6117、6119、6121、6123、6125、6127、6129、6131、6133、6135、6137、6139、6141、6143、6145、6147、6149、6151、6153、6155、6157、6159、6161、6163、6165、6167、6169、6171、6173、6175、6177、6179、6181、6183、6185、6187、6189、6191、6193、6195、6197、6199、6201、6203、6205、6207、6209、6211、6213、6215、6217、6219、6221、6223、6225、6227、6229、6231、6233、6235、6237、6239、6241、6243、6245、6247、6249、6251、6253、6255、6257、6259、6261、6263、6265、6267、6269、6271、6273、6275、6277、6279、6281、6283、6285、6287、6289、6291、6293、6295、6297、6299、6301、6303、6305、6307、6309、6311、6313、6315、6317、6319、6321、6323、6325、6327、6329、6331、6333、6335、6337、6339、6341、6343、6345、6347、6349、6351、6353、6355、6357、6359、6361、6363、6365、6367、6369、6371、6373、6375、6377、6379、6381、6383、6385、6387、6389、6391、6393、6395、6397、6399、6401、6403、6405、6407、6409、6411、6413、6415、6417、6419、6421、6423、6425、6427、6429、6431、6433、6435、6437、6439、6441、6443、6445、6447、6449、6451、6453、6455、6457、6459、6461、6463、6465、6467、6469、6471、6473、6475、6477、6479、6481、6483、6485、6487、6489、6491、6493、6495、6497、6499、6501、6503、6505、6507、6509、6511、6513、6515、6517、6519、6521、6523、6525、6527、6529、6531、6533、6535、6537、6539、6541、6543、6545、6547、6549、6551、6553、6555、6557、6559、6561、6563、6565、6567、6569、6571、6573、6575、6577、6579、6581、6583、6585、6587、6589、6591、6593、6595、6597、6599、6601、6603、6605、6607、6609、6611、6613、6615、6617、6619、6621、6623、6625、6627、6629、6631、6633、6635、6637、6639、6641、6643、6645、6647、6649、6651、6653、6655、6657、6659、6661、6663、6665、6667、6669、6671、6673、6675、6677、6679、6681、6683、6685、6687、6689、6691、6693、6695、6697、6699、6701、6703、6705、6707、6709、6711、6713、6715、6717、6719、6721、6723、6725、6727、6729、6731、6733、6735、6737、6739、6741、6743、6745、6747、6749、6751、6753、6755、6757、6759、6761、6763、6765、6767、6769、6771、6773、6775、6777、6779、6781、6783、6785、6787、6789、6791、6793、6795、6797、6799、6801、6803、6805、6807、6809、6811、6813、6815、6817、6819、6821、6823、6825、6827、6829、6831、6833、6835、6837、6839、6841、6843、6845、6847、6849、6851、6853、6855、6857、6859、6861、6863、6865、6867、6869、6871、6873、6875、6877、6879、6881、6883、6885、6887、6889、6891、6893、6895、6897、6899、6901、6903、6905、6907、6909、6911、6913、6915、6917、6919、6921、6923、6925、6927、6929、6931、6933、6935、6937、6939、6941、6943、6945、6947、6949、6951、6953、6955、6957、6959、6961、6963、6965、6967、6969、6971、6973、6975、6977、6979、6981、6983、6985、6987、6989、6991、6993、6995、6997、6999、7001、7003、7005、7007、7009、7011、7013、7015、7017、7019、7021、7023、7025、7027、7029、7031、7033、7035、7037、7039、7041、7043、7045、7047、7049、7051、7053、7055、7057、7059、7061、7063、7065、7067、7069、7071、7073、7075、7077、7079、7081、7083、7085、7087、7089、7091、7093、7095、7097、7099、7101、7103、7105、7107、7109、7111、7113、7115、7117、7119、7121、7123、7125、7127、7129、7131、7133、7135、7137、7139、7141、7143、7145、7147、7149、7151、7153、7155、7157、7159、7161、7163、7165、7167、7169、7171、7173、7175、7177、7179、7181、7183、7185、7187、7189、7191、7193、7195、7197、7199、7201、7203、7205、7207、7209、7211、7213、7215、7217、7219、7221、7223、7225、7227、7229、7231、7233、7235、7237、7239、7241、7243、7245、7247、7249、7251、7253、7255、7257、7259、7261、7263、7265、7267、7269、7271、7273、7275、7277、7279、7281、7283、7285、7287、7289、7291、7293、7295、7297、7299、7301、7303、7305、7307、7309、7311、7313、7315、7317、7319、7321、7323、7325、7327、7329、7331、7333、7335、7337、7339、7341、7343、7345、7347、7349、7351、7353、7355、7357、7359、7361、7363、7365、7367、7369、7371、7373、7375、7377、7379、7381、7383、7385、7387、7389、7391、7393、7395、7397、7399、7401、7403、7405、7407、7409、7411、7413、7415、7417、7419、7421、7423、7425、7427、7429、7431、7433、7435、7765、7767、7769、7771、7773、7775、7777、7779、7781、7783、7785、7787、7789、7791、7793、7795、7797、7799、7811、7813、7815、7817、7819、7821、7823、7825、7827、7829、7831、7833、7835、7837、7839、7841、7843、7845、7847、7849、7851、7853、7855、7857、7859、7861、7863、7865、7867、7869、7871、7873、7875、7877、7879、7881、7883、7885、7887、7889、7891、7893、7895、7897、7899、7901、7903、7905、7907、7909、7911、7913、7915、7917、7919、7921、7923、7925、7927、7929、7931、7933、7935、7937、7939、7941、7943、7945、7947、7949、7951、7953、7955、7957、7959、7961、7963、7965、7967、7969、7971、7973、7975、7977、7979、7981、7983、7985、7987、7989、7991、7993、7995、7997、7999、8001、8003、8005、8007、8009、8011、8013、8015、8017、8019、8021、8023、8025、8027、8029、8031、8033、8035、8037、8039、8041、8043、8045、8047、8049、8051、8053、8055、8057、8059、8061、8063、8065、8067、8069、8071、8073、8075、8077、8079、8081、8083、8085、8087、8089、8091、8093、8095、8097、8099、8101、8103、8105、8107、8109、8111、8113、8115、8117、8119、8121、8123、8125、8127、8129、8131、8133、8135、8137、8139、8141、8143、8145、8147、8149、8151、8153、8155、8157、8159、8161、8163、8165、8167、8169、8171、8173、8175、8177、8179、8181、8183、8185、8187、8189、8191、8193、8195、8197、8199、8201、8203、8205、8207、8209、8211、8213、8215、8217、8219、8221、8223、8225、8227、8229、8231、8233、8235、8237、8239、8241、8243、8245、8247、8249、8251、8253、8255、8257、8259、8261、8263、8265、8267、8269、8271、8273、8275、8277、8279、8281、8283、8285、8287、8289、8291、8293、8295、8297、8299、8301、8303、8305、8307、8309、8311、8313、8315、8317、8319、8321、8323、8325、8327、8329、8331、8333、8335、8337、8339、8341、8343、8345、8347、8349、8351、8353、8355、8357、8359、8361、8363、8365、8367、8481、8483、8485、8487、8489、8491、8493、8495、8497、8489、8501、8503、8505、8507、8509、8511、8513、8515、8517、8519、8521、8523、8525、8527、8529、8531、8533、8535、8537、8539、8541、8543、8545、8547、8549、8551、8553、8555、8557、8559、8561、8563、8565、8567、8569、8571、8573、8575、8577、8579、8581、8583、8585、8587、8589、8591、8593、8595、8597、8599、8601、8603、8605、8607、8609、8611、8613、8615、8617、8619、8621、8623、8625、8627、8629、8631、8633、8635、8637、8639、8641、8643、8645、8647、8649、8651、8653、8655、8657、8659、8661、8663、8665、8667、8669、8671、8673、8675、8677、8679、8681、8683、8685、8687、8689、8691、8693、8695、8697、8699、8701、8703、8705、8707、8709、8711、8713、8715、8717、8719、8721、8723、8725、8727、8729、8731、8733、8735、8737、8739、8741、8743、8745、8747、8749、8751、8753、8755、8757、8759、8761、8763、8765、8767、8769、8771、8773、8775、8777、8779、8781、8783、8785、8787、8789、8791、8793、8795、9107、9109、9111、9113、9115、9117、9119、9121、9123、9125、9127、9129、9131、9133、9135、9137、9139、9141、9143、9145、9147、9149、9151、9153、9155、9157、9159、9161、9163、9165、9167、9169、9171、9173、9175、9177、9179、9181、9183、9185、9187、9189、9191、9193、9195、9197、9199、9201、9203、9205、9207、9209、9211、9213、9215、9217、9219、9221、9223、9225、9227、9229、9231、9233、9235、9237和/或9239。
在一些另外的实施方案中,编码至少一种本文提供的工程化蔗糖合酶的工程化多核苷酸包含与以下序列至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性:SEQ ID NO:1079、1081、1083、1085、1087、1089、1091、1093、1095、1097、1099、1101、1103、1105、1107、1109、1111、1113、1115、1117、1119、1121、1123、1125、1127、1129、1131、1133、1135、1137、1139、1141、1143、1145、1147、1149、1151、1153、1155、1157、1159、1161、1163、1165、1167、1169、1171、1173、1175、1177、1179、1181、1183、1185、1187、1189、1191、1193、1195、1197、1199、1201、1203、1205、1207、1209、1211、1213、1215、1217、1219、1221、1223、1225、1227、1229、1231、1233、1235、1237、1239、1241、1243、1245、1247、1249、1251、1253、1255、1257、1259、1261、1263、1265、1267、1269、1271、1273、1275、1277、1279、1281、1283、1285、1287、1295、1297、1299、1301、1303、1305、1307、1309、1311、1313、1315、1317、1319、1321、1323、1325、1327、1329、1331、1333、1335、1337、1339、1341、1343、1345、1347、1349、1351、1353、1355、1357、1359、1361、1363、1365、1367、1369、1371、1373、1375、1377、1379、1381、1383、1385、1387、1389、1391、1393、1395、1397、1399、1401、1403、1405、1407、1409、1411、1413、1415、1417、1419、1421、1423、1425、1427、1429、1431、1433、1435、1437、1439、1441、1443、1445、1447、1449、1451、1453、1455、1457、1459、1461、1463、1465、1467、1469、1471、1473、1475、1477、1479、1481、1483、1485、1487、1489、1491、1493、1495、1497、1499、1501、1503、1505、1507、1509、1511、1513、1515、1517、1519、1521、1523、1525、1527、1529、1531、1533、1535、1537、1539、1541、1543、1545、1547、1549、1551、1553、1555、1557、1559、1561、1563、1565、1567、1569、1571、1573、1575、1577、1579、1581、1583、1585、1587、1589、1591、1593、1595、1597、1599、1601、1603、1605、1607、1609、1611、1613、1615、1617、1619、1621、1623、1625、1627、1629、1631、1633、1635、1637、1639、1641、1643、1645、1647、1649、1651、1653、1655、1657、1659、1661、1663、1665、1667、1669、1671、1673、1675、1677、1679、1681、1683、1685、1687、1689、1691、1693、1695、1697、1699、1701、1703、1705、1707、1709、1711、1713、1715、1717、1719、1721、1723、1725、1727、1729、1731、1733、1735、1737、1739、1741、1743、1745、1747、1749、1751、1753、1755、1757、1759、1761、1763、1765、1767、1769、1771、1773、1775、1777、1779、1781、1783、1785、1787、1789、1791、1793、1795、1797、1799、1801、1803、1805、1807、1809、1811、1813、1815、1817、1819、1821、1823、1825、1827、1829、1831、1833、1835、1837、1839、1841、1843、1845、1847、1849、1851、1853、1855、1857、1859、1861、1863、1865、1867、1869、1871、1873、1875、1877、1879、1881、1883、1885、1887、1889、1891、1893、1895、1897、1899、1901、1903、1905、1907、1909、1911、1913、1915、1917、1919、1921、1923、1925、1927、1929、1931、1933、1935、1937、1939、1941、1943、1945、1947、1949、1951、1953、1955、1957、1959、1961、1963、1965、1967、1969、1971、1973、1975、1977、1979、1981、1983、1985、1987、1989、1991、1993、1995、1997、1999、2001、2003、2005、2007、2009、2011、2013、2015、2017、2019、2021、2023、2025、2027、2029、2031、2033、2035、2037、2039、2041、2043、2045、2047、2049、2051、2053、2055、2057、2059、2061、2063、2065、2067、2069、2071、2073、2075、2077、2079、2081、2083、2085、2087、2089、2091、2093、2095、2097、2099、2101、2103、2105、2107、2109、2111、2113、2115、2117、2119、2121、2123、2125、2127、2129、2131、2133、2135、2137、2139、2141、2143、2145、2147、2149、2151、2153、2155、2157、2159、2161、2163、2165、2167、2169、2171、2173、2175、2177、2179、2181、2183、2185、2187、2189、2191、2193、2195、2197、2199、2201、2203、2205、2207、2209、2211、2213、2215、2217、2219、2221、2223、2225、2227、2229、2231、2233、2235、2237、2239、2241、2243、2245、2247、2249、2251、2253、2255、2257、2259、2261、2263、2265、2267、2269、2271、2273、2275、2277、2279、2281、2283、2285、2287、2289、2291、2293、2295、2297、2299、2301、2303、2305、2307、2309、2311、2313、2315、2317、2319、2321、2323、2325、2327、2329、2331、2333、2335、2337、2339、2341、2343、2345、2347、2349、2351、2353、2355、2357、2359、2361、2363、2365、2367、2369、2371、2373、2375、2377、2379、2381、2383、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419、2421、2423、2425、2427、2429、2431、2433、2435、2437、2439、2441、2443、2445、2447、2449、2451、2453、2455、2457、2459、2461、2463、2465、2467、2469、2471、2473、2475、2477、2479、2481、2483、2485、2487、2489、2491、2493、2495、2497、2499、2501、2503、2505、2507、2509、2511、2513、2515、2517、2519、2521、2523、2525、2527、2529、2531、2533、2535、2537、2539、2541、2543、2545、2547、2549、2551、2553、2555、2557、2559、2561、2563、2565、2567、2569、2571、2573、2575、2577、2579、2581、2583、2585、2587、2589、2591、2593、7437、7439、7441、7443、7445、7447、7449、7451、7453、7455、7457、7459、7461、7463、7465、7467、7469、7471、7473、7475、7477、7479、7481、7483、7485、7487、7489、7491、7493、7495、7497、7499、7501、7503、7505、7507、7509、7511、7513、7515、7517、7519、7521、7523、7525、7527、7529、7531、7533、7535、7537、7539、7541、7543、7545、7547、7549、7551、7553、7555、7557、7559、7561、7563、7565、7567、7569、7571、7573、7575、7577、7579、7581、7583、7585、7587、7589、7591、7593、7595、7597、7599、7601、7603、7605、7607、7609、7611、7613、7615、7617、7619、7621、7623、7625、7627、7629、7631、7633、7635、7637、7639、7641、7643、7645、7647、7649、7651、7653、7655、7657、7659、7661、7663、7665、7667、7669、7671、7673、7675、7677、7679、7681、7683、7685、7687、7689、7691、7693、7695、7697、7699、7701、7703、7705、7707、7709、7711、7713、7715、7717、7719、7721、7723、7725、7727、7729、7731、7733、7735、7737、7739、7741、7743、7745、7747、7749、7751、7753、7755、7757、7759、7761、7763、8369、8371、8373、8375、8377、8379、8381、8383、8385、8387、8389、8391、8393、8395、8397、8399、8401、8403、8405、8407、8409、8411、8413、8415、8417、8419、8421、8423、8425、8427、8429、8431、8433、8435、8437、8439、8441、8443、8445、8447、8449、8451、8453、8455、8457、8459、8461、8463、8465、8467、8469、8471、8473、8475、8477、8479、8797、8799、8801、8803、8805、8807、8809、8811、8813、8815、8817、8819、8821、8823、8825、8827、8829、8831、8833、8835、8837、8839、8841、8843、8845、8847、8849、8851、8853、8855、8857、8859、8861、8863、8865、8867、8869、8871、8873、8875、8877、8879、8881、8883、8885、8887、8889、8891、8893、8895、8897、8899、8901、8903、8905、8907、8909、8911、8913、8915、8917、8919、8921、8923、8925、8927、8929、8931、8933、8935、8937、8939、8941、8943、8945、8947、8949、8951、8953、8955、8957、8959、8961、8963、8965、8967、8969、8971、8973、8975、8977、8979、8981、8983、8985、8987、8989、8991、8993、8995、8997、8999、9001、9003、9005、9007、9009、9011、9013、9015、9017、9019、9021、9023、9025、9027、9029、9031、9033、9035、9037、9039、9041、9043、9045、9047、9049、9051、9053、9055、9057、9059、9061、9063、9065、9067、9069、9071、9073、9075、9077、9079、9081、9083、9085、9087、9089、9091、9093、9095、9097、9099、9101、9103和/或9105。
在一些实施方案中,多核苷酸能够与选自本文提供的任何多核苷酸序列、或其互补序列、或编码本文提供的任何变体酶多肽的多核苷酸序列的参考多核苷酸序列在高度严格条件下杂交。在一些实施方案中,能够在高度严格条件下杂交的多核苷酸编码包含与参考序列相比具有一个或更多个残基差异的氨基酸序列的酶多肽。
在一些实施方案中,将编码本文的任何工程化酶多肽的分离的多核苷酸以多种方式操作,以促进酶多肽的表达。在一些实施方案中,编码酶多肽的多核苷酸包括表达载体,其中存在一个或更多个控制序列来调控酶多核苷酸和/或多肽的表达。取决于利用的表达载体,在将分离的多核苷酸插入载体前对分离的多核苷酸的操作可以是期望的或必要的。用于利用重组DNA方法改变多核苷酸和核酸序列的技术是本领域熟知的。在一些实施方案中,控制序列包括启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子,以及其他。在一些实施方案中,基于宿主细胞的选择来选择合适的启动子。对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的合适的启动子包括但不限于从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、及原核生物β-内酰胺酶基因(参见例如Villa-Kamaroff等人,Proc.Natl Acad.Sci.USA 75:3727-3731[1978])、以及tac启动子(参见例如DeBoer等人,Proc.Natl Acad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性启动子包括但不限于从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillusnidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见例如WO96/00787)、以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)、及其突变启动子、截短启动子和杂合启动子。示例性酵母细胞启动子可以来自以下的基因:酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如Romanos等人,Yeast 8:423-488[1992])。
在一些实施方案中,控制序列还是合适的转录终止子序列(即,由宿主细胞识别以终止转录的序列)。在一些实施方案中,终止子序列可操作地连接到编码酶多肽的核酸序列的3'末端。在所选择的宿主细胞中有功能的任何合适的终止子可用于本发明。用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如Romanos等,上文)。
在一些实施方案中,控制序列还是合适的前导序列(即,对宿主细胞的翻译重要的mRNA的非翻译区)。在一些实施方案中,前导序列可操作地连接到编码酶多肽的核酸序列的5'末端。在所选择的宿主细胞中有功能的任何合适的前导序列可用于本发明。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列从以下的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
在一些实施方案中,控制序列还是多腺苷酸化序列(即,可操作地连接到核酸序列的3'末端的序列,并且它在转录时被宿主细胞识别为向转录的mRNA添加多腺苷酸残基的信号)。在所选择的宿主细胞中有功能的任何合适的多腺苷酸化序列可用于本发明。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括但不限于用于以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列是已知的(参见例如Guo和Sherman,Mol.Cell.Bio.,15:5983-5990[1995])。
在一些实施方案中,控制序列还是信号肽(即,编码连接到多肽的氨基末端的氨基酸序列并将编码的多肽引导到细胞的分泌途径中的编码区)。在一些实施方案中,核酸序列的编码序列的5'末端固有地包含信号肽编码区,所述信号肽编码区与编码分泌多肽的编码区的区段在翻译阅读框中天然连接。可选择地,在一些实施方案中,编码序列的5'末端包含对于编码序列是外源的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何合适的信号肽编码区可用于工程化多肽的表达。用于细菌宿主细胞的有效信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:芽孢杆菌NClB11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。在一些实施方案中,用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和Humicola lanuginosa脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的信号肽:酿酒酵母α因子和酿酒酵母转化酶。
在一些实施方案中,控制序列还是编码定位于多肽的氨基末端的氨基酸序列的前肽编码区。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或“酶原(zymogen)”。前多肽可以通过催化或自动催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区可以从任何合适的来源获得,包括但不限于以下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见例如WO 95/33836)。当信号肽区和前肽区二者都存在于多肽的氨基末端时,前肽区临靠多肽的氨基末端定位,而信号肽区临靠前肽区的氨基末端定位。
在一些实施方案中,还利用了调控序列。这些序列促进相对于宿主细胞的生长调控多肽的表达。调控系统的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的调控系统。在原核宿主细胞中,合适的调控序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调控系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,合适的调控序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子。
在另一方面,本发明涉及重组表达载体,所述重组表达载体包含编码工程化酶多肽的多核苷酸,以及取决于它们将被引入的宿主的类型,一个或更多个表达调控区,诸如启动子和终止子、复制起点等。在一些实施方案中,将本文描述的各种核酸和控制序列连接在一起以产生重组表达载体,所述重组表达载体包括一个或更多个方便的限制性位点,以允许在这些位点插入或取代编码酶多肽的核酸序列。可选择地,在一些实施方案中,本发明的核酸序列通过将该核酸序列或包含该序列的核酸构建体插入到用于表达的适当的载体中来表达。在一些实施方案中包括创建表达载体,编码序列位于载体中,使得编码序列与适当的控制序列可操作地连接用于表达。
重组表达载体可以是任何合适的载体(例如质粒或病毒),可以方便地经受重组DNA程序并且引起酶多核苷酸序列的表达。载体的选择通常取决于载体与待引入该载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体是自主复制载体(即,作为染色体外实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选择的实施方案中,载体是当被引入到宿主细胞中时,被整合到基因组中并与其被整合进的染色体一起复制的载体。此外,在一些实施方案中,利用了单个载体或质粒,或共同包含待被引入到宿主细胞的基因组中的全部DNA的两个或更多个载体或质粒、和/或转座子。
在一些实施方案中,表达载体包含一个或更多个可选择的标志物,其允许容易选择转化的细胞。“可选择的标志物”是一种基因,其产物提供杀生物剂或病毒耐受性、对于重金属的耐受性、对营养缺陷型提供原养型等。细菌的可选择的标志物的实例包括但不限于来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因或赋予抗生素耐受性诸如氨苄青霉素、卡那霉素、氯霉素或四环素耐受性的标志物。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的可选择的标志物包括但不限于amdS(乙酰胺酶;例如来自构巢曲霉或米曲霉)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶;例如来自吸水链霉菌(S.hygroscopicus))、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶;例如来自构巢曲霉或米曲霉)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))和trpC(邻氨基苯甲酸合酶)以及其等同物。在另一方面,本发明提供了包含编码至少一种本发明的工程化酶多肽的至少一种多核苷酸的宿主细胞,所述多核苷酸被可操作地连接到一个或更多个控制序列用于在宿主细胞中表达工程化酶。适用于在表达本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、河流弧菌(Vibriofluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC访问号201178));昆虫细胞,诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;以及植物细胞。示例性宿主细胞还包括各种大肠杆菌菌株(例如W3110(ΔfhuA)和BL21)。
因此,在另一方面,本发明提供了产生工程化酶多肽的方法,其中该方法包括将能够表达编码工程化酶多肽的多核苷酸的宿主细胞在适用于表达该多肽的条件下培养。在一些实施方案中,该方法还包括如本文描述的分离和/或纯化酶多肽的步骤。
用于宿主细胞的适当的培养基和生长条件是本领域熟知的。设想用于将表达酶多肽的多核苷酸引入到细胞中的任何合适的方法将可用于本发明。合适的技术包括但不限于电穿孔、生物弹道微粒轰击(biolistic particle bombardment)、脂质体介导的转染、氯化钙转染和原生质体融合。
本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例意图说明而非限制。
实验
提供了以下实施例,包括实验和获得的结果,仅用于说明性目的,而不应当被解释为限制本发明。事实上,以下描述的许多试剂和设备有多种合适的来源。不意图本发明受限于任何试剂或设备物品的任何特定来源。
在以下实验公开内容中,以下缩写适用:M(摩尔/升)、mM(毫摩尔/升)、uM和μM(微摩尔/升)、nM(纳摩尔/升)、mol(摩尔)、gm和g(克)、mg(毫克);ug和μg(微克)、L和l(升)、ml和mL(毫升)、cm(厘米)、mm(毫米)、um和μm(微米)、sec.(秒)、min(s)(分钟)、h(s)和hr(s)(小时)、U(单位)、MW(分子量)、rpm(转每分钟)、psi和PSI(磅每平方英寸)、℃(摄氏度)、RT和rt(室温)、CV(变异系数)、CAM和cam(氯霉素)、PMBS(硫酸多粘菌素B)、IPTG(异丙基-β-D-l-硫代吡喃半乳糖苷)、LB(Luria肉汤)、TB(terrific肉汤)、SFP(摇瓶粉末)、CDS(编码序列)、DNA(脱氧核糖核酸)、RNA(核糖核酸)、nt(核苷酸;多核苷酸)、aa(氨基酸;多肽)、大肠杆菌W3110(常用实验室大肠杆菌菌株,可从大肠杆菌遗传资源中心(Coli Genetic StockCenter)[CGSC],New Haven,CT获得)、AcSus(喜温嗜酸硫杆菌蔗糖合酶)、SUS、SuS和SuSy(蔗糖合酶,也称为蔗糖合成酶)、NDP(核苷二磷酸)、腺苷二磷酸(ADP)、胞苷二磷酸(CDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)、尿苷二磷酸(UDP)、肌苷二磷酸(IDP)、GT(糖基转移酶)、UGT(UDP-葡萄糖依赖性糖基转移酶)、NGT(NDP-核苷二磷酸依赖性糖基转移酶)、AGT(ADP-葡萄糖依赖性糖基转移酶)、CGT(CDP-葡萄糖依赖性糖基转移酶)、GGT(GDP-葡萄糖依赖性糖基转移酶)、TGT(TDP-葡萄糖依赖性糖基转移酶)、IGT(IDP-葡萄糖依赖性糖基转移酶)、UGT(UDP-葡萄糖依赖性糖基转移酶)、reb(莱鲍迪苷)、rebA(莱鲍迪苷A)、rebD(莱鲍迪苷D)、rebI(莱鲍迪苷I)、rebM(莱鲍迪苷M)、“RebA60”是甜菊苷和莱鲍迪苷A分别为~1:2的混合物、HTP(高通量)、HPLC(高压液相层析)、HPLC-UV(HPLC-紫外可见检测器)、1HNMR(质子核磁共振波谱术)、HSQC NMR(异核单量子相干波谱术NMR)、COSY NMR(同核相关波谱术NMR)、Acorn(Acorn NMR,Livermore,CA)、FIOPC(相对于阳性对照的改进倍数)、Sigma和Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO)、Difco(Difco Laboratories,BDDiagnostic Systems,Detroit,MI)、Microfluidics(Microfluidics,Westwood,MA)、ChromaDex(ChromaDex,Inc.,Irvine,CA)、Life Technologies(Life Technologies,Fisher Scientific,Waltham,MA的一部分)、Amresco(Amresco,LLC,Solon,OH)、Carbosynth(Carbosynth,Ltd.,Berkshire,UK)、Varian(Varian Medical Systems,PaloAlto,CA)、Agilent(Agilent Technologies,Inc.,Santa Clara,CA)和Thermotron(Thermotron,Inc.,Holland,MI)。
实施例1
合成、优化和测定具有葡糖基化活性的UGT酶
在这个实施例中,描述了用于合成、优化和测定具有葡糖基化活性的UGT酶的方法。
基因合成和优化:
将编码被报告为将甜菊醇双苷葡糖基化为莱鲍迪苷B并将甜菊苷葡糖基化为莱鲍迪苷A的野生型甜菊多肽(SEQ ID NO:2)的多核苷酸序列(SEQ ID NO:1)(参见例如Richman等人,Plant J.,41:56-67[2005])进行密码子优化并合成为SEQ ID NO:3的基因。将这个合成基因(SEQ ID NO:3)克隆到pCK110900载体系统中(参见例如美国专利申请公布第2006/0195947号,其通过引用并入本文)并随后在大肠杆菌W3110(ΔfhuA)中表达。大肠杆菌菌株W3110在lac启动子的控制下表达UGT酶。
产生摇瓶粉末(SFP):
将摇瓶程序用于产生糖基转移酶多肽摇瓶粉末(SFP),以用于在本文描述的生物催化方法中使用的表征测定。与HTP测定中使用的细胞裂解物相比,酶的摇瓶粉末(SFP)制品提供了更纯的酶制品(例如高达>30%的总蛋白),并且还允许使用更浓的酶溶液。将含有编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到含有30μg/ml氯霉素和1%葡萄糖的5mL Luria Bertani肉汤中。使细胞在培养箱中在30℃以250rpm振荡生长过夜(至少16小时)。在1L摇瓶中,在含有30μg/ml CAM的250mL Terrific肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾,pH 7.0,1mM MgSO4)中将培养物稀释至600nm的光密度(OD600)为0.2,并允许在30℃生长。
当培养物的OD600为0.6至0.8时,通过添加IPTG至1mM的终浓度来诱导糖基转移酶基因的表达。然后继续孵育过夜(至少16小时)。通过离心(5000rpm、15min、4℃)来收获细胞并弃去上清液。将细胞沉淀物再悬浮在两体积的pH 7.5的25mM三乙醇胺缓冲液中,并以标准大肠杆菌裂解设置通过
Figure BDA0002229282040003582
高压均质仪(Microfluidics)且保持在4℃。将细胞碎片通过离心(10,000rpm、45分钟、4℃)去除。收集澄清的裂解物上清液并在-80℃冷冻,并且然后His亲和纯化及透析以产生纯化的蛋白或者冻干以产生粗制蛋白的干燥摇瓶粉末。
SFP用于甜菊苷葡糖基化的测定:
将SFP重构以提供20g/L粉末。然后,将50μL的这些储备液稀释于以下200μL总反应体积中:50mM Tris-HCl缓冲液,pH 7.5、和3mM MgSO4及1mM甜菊苷(ChromaDex,>94%纯度)、以及2mM尿苷二磷酸葡萄糖。反应在30℃在
Figure BDA0002229282040003583
滴定板振荡器中以300RPM振荡16-18h来进行。
HPLC-MS/MS分析:
将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用以下仪器和参数通过LC-MS/MS检测上清液中的糖基化甜菊苷产物:
Figure BDA0002229282040003581
Figure BDA0002229282040003591
检测到SEQ ID NO:4的活性。在以上描述的测定样品的LC-MS/MS分析中观察到甜菊苷向莱鲍迪苷A的高转化(即>95%)。
实施例2
SEQ ID NO:4的GT变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:4衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3编码的GT(即SEQ IDNO:4)的定向演化通过构建变体基因文库来进行,其中与酶的某些结构特征相关的位置经受诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第一轮(“第1轮”)的12种工程化GT变体多肽。
HTP生长、表达及裂解物制备
将细胞挑取到96孔板中,并在含有1%葡萄糖和30μg/mL CAM的LB培养基中、30℃、200rpm、85%湿度生长过夜。然后将20μL过夜生长物转移到含有包含30μg/mL CAM的380μLTB生长培养基的深孔板中,用1mM IPTG诱导,并在30℃、200rpm、85%湿度孵育18h。将细胞培养物在4000rpm、4℃离心10m,并弃去培养基。将如此获得的细胞沉淀在-80℃冷冻,并在250μL裂解缓冲液(0.5g/L溶菌酶和0.5g/L PMBS于20mM Tris-HCl缓冲液,pH 7.5中)中在滴定板振荡器上在室温用低速振荡2h裂解。然后将板在4000rpm和4℃离心20min,并将澄清的裂解物上清液用于以下描述的HTP测定反应中。
从ADP-葡萄糖向甜菊苷的葡萄糖转移的HTP测定:
对96孔板的澄清的表达SEQ ID NO:3变体的大肠杆菌培养物裂解物进行了测定,在200μL反应中裂解物载量为50μL裂解物,并且底物载量为来自50%乙醇中的20mM储备溶液的1mM甜菊苷(ChromaDex,>94%纯度),并且共底物载量为0.5mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、30℃、在
Figure BDA0002229282040003601
滴定板振荡器中以300RPM振荡18h。将反应用100μL/孔具有0.2%甲酸的乙腈淬灭,在4℃离心10m,并将上清液通过如实施例1、表1.1中描述的HPLC-MS/MS进行分析。
在野生型UGT76G1(SEQ ID NO:4)的存在下,从甜菊苷和ADP-葡萄糖形成莱鲍迪苷A与无酶对照无法区分。与SEQ ID NO:4的野生型酶相比,糖基转移酶变体多肽被鉴定为从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A。工程化多肽在表2.1中列出。尽管亲本和变体构建体包含用于亲和纯化的N-末端组氨酸标签,但为了清楚起见,将突变相对于未加标签的参考序列进行编号。如实施例1中描述的,生长摇瓶规模的培养物用于蛋白纯化。分析了表2.1中示出的具有相对于SEQ ID NO:4的以下氨基酸突变的变体。
Figure BDA0002229282040003611
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的纯化的蛋白表征测定和分析:
首先,如实施例1中描述的,生长250mL摇瓶培养物,诱导、裂解、组氨酸亲和纯化、透析并用甘油1:1稀释,以产生纯化的蛋白。然后,将50μL的这些蛋白稀释于以下200μL总反应体积中:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、和1mM甜菊苷(ChromaDex,>94%纯度)或莱鲍迪苷D(Sigma,>93%纯度)及0.5mM ADP-葡萄糖。反应在
Figure BDA0002229282040003612
滴定板振荡器中在30℃以300RPM振荡16h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。
Figure BDA0002229282040003621
具有突变R10-和V309R、S361G、V309S、L307V及S283T的变体(SEQ ID NO:8、10、12、14和16)以高于以上阴性对照和SEQ ID NO:2水平的水平从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A。具有突变R10-和V309R的变体(SEQ ID NO:8)和具有突变V309S的变体(SEQ ID NO:12)从莱鲍迪苷D和ADP-葡萄糖产生高于阴性对照和SEQ ID NO:2水平的莱鲍迪苷M。因此,这些工程化的ADP-糖基转移酶提供了新的生物催化试剂,用于在使甜菊苷β-葡糖基化为莱鲍迪苷A,以及使莱鲍迪苷Dβ-葡糖基化为莱鲍迪苷M的新方法中使用。具有突变R10-和V309R的变体(SEQ ID NO:8)具有最高的对以ADP-葡萄糖作为共底物的甜菊苷和莱鲍迪苷D两者的活性。因此,选择编码多核苷酸(SEQ ID NO:7)用于进一步定向演化。
实施例3
SEQ ID NO:8的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:8衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:7编码的GT(即SEQ IDNO:8)的定向演化通过构建变体基因文库来进行,其中将与第1轮中改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用实施例2中描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第二轮(“第2轮”)的20种工程化GT变体多肽。工程化多肽在表3.1中列出。尽管亲本和变体构建体包含用于亲和纯化的N-末端组氨酸标签,但为了清楚起见,将突变相对于未加标签的参考序列进行编号。对于如以下指示的表3.1中示出的具有相对于SEQ ID NO:8的氨基酸突变的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白纯化,进行分析。
Figure BDA0002229282040003641
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的纯化的蛋白表征测定和分析
如实施例2中描述的将蛋白纯化、测定及分析。
Figure BDA0002229282040003651
表3.2中的所有变体(SEQ ID NO:32、34、36和38)以大于SEQ ID NO:8的量从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A,并从莱鲍迪苷D和ADP-葡萄糖产生莱鲍迪苷M。具有突变T283Q、T318E、W337S和S360G的变体(SEQ ID NO:32)具有最高的对以ADP-葡萄糖作为共底物的甜菊苷和莱鲍迪苷D两者的活性。因此,选择编码多核苷酸(SEQ ID NO:31)用于进一步定向演化。
从NDP-葡萄糖向甜菊苷的葡糖基转移的纯化的蛋白表征测定和分析
为了描述相对于SEQ ID NO:32的SEQ ID NO:4的核苷二磷酸特异性,进行了以下实验。首先,将50μL纯化的蛋白稀释于以下200μL总反应体积中:50mM Tris-HCl缓冲液,pH7.5、3mM MgCl2、和1mM甜菊苷(ChromaDex,>94%纯度)、及0.5mM ADP-葡萄糖、UDP-葡萄糖或TDP-葡萄糖。反应在
Figure BDA0002229282040003652
滴定板振荡器中在30℃以300RPM振荡16h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。用ADP-葡萄糖SEQ ID NO:32比SEQ ID NO:4产生的莱鲍迪苷A多13倍,用UDP-葡萄糖SEQID NO:32产生多达SEQ ID NO:4的90%的莱鲍迪苷A,以及用TDP-葡萄糖SEQ ID NO:32产生多达SEQ ID NO:4的22%的莱鲍迪苷A。与由SEQ ID NO:3编码的糖基转移酶(即SEQ ID NO:4)相比,由SEQ ID NO:31编码的糖基转移酶(即SEQ ID NO:32)具有大幅改变的NDP-葡萄糖特异性。
由SEQ ID NO:31编码的GT对莱鲍迪苷D和NDP-葡萄糖的比活性的确定
为了描述SEQ ID NO:32的核苷二磷酸特异性,进行了以下实验。首先,将5μL纯化的蛋白稀释于以下100μL总反应体积中:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、和1mM莱鲍迪苷D(ChromaDex,>93%纯度)、及2mM ADP-葡萄糖、UDP-葡萄糖、TDP-葡萄糖、或GDP-葡萄糖。反应在
Figure BDA0002229282040003661
滴定板振荡器中在30℃以300RPM振荡1-18h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。由SEQ ID NO:31编码的糖基转移酶(即SEQ ID NO:32)用GDP-葡萄糖产生相对于ADP-葡萄糖的50%同样多的莱鲍迪苷M,用UDP-葡萄糖产生相对于ADP-葡萄糖的70%同样多的莱鲍迪苷M,以及用TDP-葡萄糖产生低于检出限的量的莱鲍迪苷M。GT SEQ ID NO:32对莱鲍迪苷D和ADP-葡萄糖的比活性(每mg纯化的蛋白每min形成的μmol RebM)比对UDP-葡萄糖的比活性高1.4倍。因此,由SEQ ID NO:31编码的糖基转移酶(即SEQ ID NO:32)是一种新的腺嘌呤二磷酸葡萄糖依赖性糖基转移酶,或“AGT”。
实施例4
用工程化AGT SEQ ID NO:32将甜菊苷转化为莱鲍迪苷A及原位形成ADP-葡萄糖
在这个实施例中,描述了评估用于葡糖基化甜菊醇糖苷的ADP-葡萄糖的原位形成的实验(参见图1)。
基因合成及优化
将编码报道优先利用ADP-葡萄糖将葡萄糖供至果糖以可逆转化形成蔗糖的野生型喜温嗜酸硫杆菌蔗糖合酶和Thermosynechococcus elongatus蔗糖合酶多肽(分别为SEQID NO:72和74)(参见例如Diricks等人,Appl.Microbiol.Biotechnol.,99:8465-74[2015]和Figueroa等人,FEBS Lett.,587:165-9[2013])的多核苷酸序列进行密码子优化并合成为SEQ ID NO:71和73的基因。将这些合成基因(SEQ ID NO:71和73)分别克隆到pCK110900载体系统中(参见例如美国专利申请公布第2006/0195947号,将其特此通过引用并入本文),并随后在大肠杆菌W3110(ΔfhuA)中表达。大肠杆菌菌株W3110在lac启动子的控制下表达酶。使菌株在摇瓶规模生长并裂解用于His亲和蛋白纯化,这些按实施例1中描述的来进行。
纯化的AGT和蔗糖合酶的偶联测定
为了检查通过将蔗糖合酶(SuS)与由SEQ ID NO:31编码的AGT(即SEQ ID NO:32)偶联来再循环NDP的潜力,进行了以下实验。首先,将20μL纯化的蔗糖合酶多肽(SEQ ID NO:72或74)和30μL纯化的AGT多肽(SEQ ID NO:32)稀释于以下200μL总反应体积中:50mMTris-HCl缓冲液,pH 7.5、5mM MgCl2、和1mM甜菊苷(ChromaDex,>94%纯度)、200mM蔗糖、以及5mM腺苷二磷酸(ADP)、胞苷二磷酸(CDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)或尿苷二磷酸(UDP)(Sigma,所有5种>93%纯度)。反应在
Figure BDA0002229282040003671
滴定板振荡器中在30℃以300RPM振荡16h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。
用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。
对于SEQ ID NO:32和SuS(SEQ ID NO:74),用ADP、UDP和GDP形成了相当的量的莱鲍迪苷A,而用CDP和TDP几乎未形成莱鲍迪苷A。对于SEQ ID NO:32和SuS(SEQ ID NO:72),用ADP形成的莱鲍迪苷A的水平与用SuS(SEQ ID NO:74)和ADP形成的莱鲍迪苷A的水平相当。用UDP形成的莱鲍迪苷A的量少于用ADP形成的莱鲍迪苷A的量的20%,并且用GT(SEQ IDNO:32)和SuS(SEQ ID NO:72)及CDP、GDP或TDP几乎未形成莱鲍迪苷A。这些结果证明,SEQID NO:72和74二者能够从蔗糖原位产生ADP-葡萄糖,并且与AGT(SEQ ID NO:32)一起可用于以蔗糖和ADP作为共底物代替更昂贵的底物ADP-葡萄糖进行甜菊醇糖苷的葡糖基化。此外,SEQ ID NO:72还可以与GDP和UDP一起使用。在一些涉及ADP选择性偶联系统的实施方案中,可使用SEQ ID NO:74。
实施例5
SEQ ID NO:32的ADP-糖基转移酶环状排列的变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的葡糖基化,对从SEQID NO:32衍生的GT多肽的设计、构建及评估的实验。对由SEQ ID NO:31编码的GT的定向演化通过构建变体基因文库来进行,其中将编码序列中的N-末端和C-末端相连接,并且选择与酶的某些结构特征相关的位置作为蛋白的新的N-末端。然后将这个环状排列的变体文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的“第3.2轮”的17种工程化GT的环状排列的变体多肽。全部所述变体不具有高于未排列的SEQ ID NO:32的活性,但表5.1中列出的17种工程化多肽具有高于无酶阴性对照的活性。
从ADP-葡萄糖向甜菊苷的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:31变体的大肠杆菌培养物裂解物进行了测定,在200μL反应中裂解物载量为25μL裂解物,并且底物载量为来自50%乙醇中的20mM储备溶液的1mM甜菊苷(ChromaDex,>94%纯度),并且共底物载量为0.5mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、30℃、在
Figure BDA0002229282040003681
滴定板振荡器中以300RPM振荡4h。将反应用100μL/孔具有0.2%甲酸的乙腈淬灭,在4℃离心10m,并将上清液通过如实施例1、表1.1中描述的HPLC-MS/MS进行分析。
分析的工程化多肽在表5.1中列出。尽管亲本和变体构建体包含用于亲和纯化的N-末端组氨酸标签,但为了清楚起见,将氨基酸相对于未加标签的参考序列进行编号。对于具有相对于SEQ ID NO:32的71、170、259和401的以下第一氨基酸的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白纯化。这些变体代表来自蛋白的最独特区域的环状排列体。
Figure BDA0002229282040003691
纯化的环状排列的GT对莱鲍迪苷D和ADP-葡萄糖的比活性的确定
首先,将10μL纯化的蛋白稀释于以下100μL总反应体积中:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、和1mM莱鲍迪苷D(ChromaDex,>93%纯度)、及2mM ADP-葡萄糖。反应在
Figure BDA0002229282040003692
滴定板振荡器中在30℃以300RPM振荡1-4h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。
用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。四个环状排列体中,SEQ ID NO:106具有最高的比活性(每mg纯化的蛋白每min形成的μmol RebM),随后为SEQ ID NO:100和SEQ ID NO:90。SEQ ID NO:78几乎不具有可检测的活性。因此,由SEQ ID NO:105编码的糖基转移酶(即SEQ ID NO:106)在这些实验中被鉴定为用于进一步定向演化的最佳候选的环状排列的AGT。
实施例6
SEQ ID NO:32的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:32衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:31编码的GT(即SEQID NO:32)的定向演化通过构建变体基因文库来进行,其中与酶的某些结构特征相关的位置经受诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第三轮(“第3.1轮”)的60种工程化GT变体多肽。
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:32变体的大肠杆菌培养物裂解物进行了测定,在200μL反应中裂解物载量为25μL裂解物,并且底物载量为来自50%乙醇中的20mM储备溶液的0.5mM莱鲍迪苷D或1mM甜菊苷(ChromaDex,>94%纯度),且共底物载量为0.5mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM Tris-HCl缓冲液,pH 7.5、3mMMgCl2、30℃、在
Figure BDA0002229282040003701
滴定板振荡器中以300RPM振荡4h。将反应用100μL/孔具有0.2%甲酸的乙腈淬灭,在4℃离心10m,并将上清液通过如实施例1、表1.1中描述的HPLC-MS/MS进行分析。
工程化多肽在表6.1中列出。尽管亲本和变体构建体包含用于亲和纯化的N-末端组氨酸标签,但为了清楚起见,将突变相对于未加标签的参考序列进行编号。对于表6.1中示出的具有相对于SEQ ID NO:32的氨基酸突变的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白纯化。
Figure BDA0002229282040003711
Figure BDA0002229282040003721
Figure BDA0002229282040003731
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的纯化的蛋白表征测定和分析
首先,将1μL纯化的蛋白稀释于以下100μL总反应体积中:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、和1mM甜菊苷(ChromaDex,>94%纯度)或莱鲍迪苷D(ChromaDex,>93%纯度)、及2mM ADP-葡萄糖。反应在
Figure BDA0002229282040003732
滴定板振荡器中在30℃以300RPM振荡1-30h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。表6.2中描述的对甜菊苷和莱鲍迪苷D的比活性按来自反应进程曲线的线性部分的每mg纯化的蛋白每min形成的μmol产物来确定。
Figure BDA0002229282040003741
对由SEQ ID NO:31编码的GT(即SEQ ID NO:32)的定向演化通过构建变体基因文库来继续进行,其中将与以上改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以上描述的高通量(HTP)测定用莱鲍迪苷D筛选,来为第3.3轮提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的59种工程化GT变体多肽。工程化多肽在表6.3中列出。对于具有如表6.3中示出的相对于SEQ ID NO:32的氨基酸突变的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白纯化。
Figure BDA0002229282040003751
Figure BDA0002229282040003761
Figure BDA0002229282040003771
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的纯化的蛋白表征测定和分析
首先,将2μL纯化的蛋白稀释于以下100μL总反应体积中:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、和1mM莱鲍迪苷D(ChromaDex,>93%纯度)、及2mM ADP-葡萄糖。反应在
Figure BDA0002229282040003772
滴定板振荡器中在30℃以300RPM振荡1-18h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。
用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:50稀释后的上清液中的糖基化产物。表6.4中描述的对甜菊苷的比活性按来自反应进程曲线的线性部分的每mg纯化的蛋白每min形成的μmol莱鲍迪苷A产物来确定,并且对莱鲍迪苷D的比活性按来自反应进程曲线的线性部分的每mg纯化的蛋白每min形成的μmol莱鲍迪苷M产物来确定。表6.4中列出的酶催化RebD向RebM的转化至>99%的转化率,并且用0.8g/L甜菊苷或1.3g/L rebD、2摩尔过量的ADP-葡萄糖和35-77mg/L纯化的蛋白在少于18h内以>85%的转化率催化甜菊苷向RebA和RebI的混合物转化。
Figure BDA0002229282040003781
实施例7
用AGT(SEQ ID NO:232)将莱鲍迪苷D转化为莱鲍迪苷M
如实施例1中描述的,生长250mL摇瓶培养物用于多肽SEQ ID NO:232的蛋白纯化。然后,将2.4mL的50%甘油储备液稀释于250mL带挡板的瓶中的60mL总反应体积中,具有50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、2mM ADP-葡萄糖和1mM莱鲍迪苷D(Chromadex,>93%纯度)。反应在30℃在
Figure BDA0002229282040003782
振荡培养器中以250RPM振荡2h来进行,并用0.12mL甲酸淬灭至pH<4。将反应通过在4℃以10,000RPM离心10m来沉淀。将6g XAD-4树脂(Sigma)添加至上清液,并在摇瓶中孵育2h。将树脂过滤并用16.3mL50:24:26的水:ACN:EtOH通过孵育4h来洗脱,并再过滤。第二次洗脱用10mL 50:50的水:EtOH来进行,将其过滤并与第一次洗脱液合并。通过旋转蒸发将洗脱液浓缩至约6mL,过滤通过
Figure BDA0002229282040003791
Figure BDA0002229282040003792
无注射器过滤器,并使用表7.1中描述的仪器和参数通过HPLC来分级。从C18柱将级分以保留时间5.8-6.2m手动收集。将级分汇集,通过旋转蒸发浓缩并冻干。然后将样品在1.5mL乙醇中重悬浮,并在80℃在搅拌板上孵育2h,通过旋转蒸发浓缩,并在40℃在真空下干燥14h。将样品在吡啶-d5中重悬浮,并用于通过Acorn NMR进行的1H、COSY和HSQC NMR谱采集。
Figure BDA0002229282040003793
基于谱与可靠的莱鲍迪苷M标准品(Chromadex,通过HPLC纯度95.6%)的谱的一致性,确定分离的产物为莱鲍迪苷M。通过1H NMR,样品中的可交换质子比标准品中的可交换质子宽,并且样品含有少量甲基污染物。在其他方面,样品和标准品的谱相同。除少量杂质以外,样品和标准品的COSY和HSQC谱相同。从1H和1H-13C HSQC谱[δH 6.44、δH 5.85、δH5.524、δH 5.518、δH 5.49、δH 5.34]明显的六个异头质子的存在证实了结构中六个糖单元的存在,并与标准品一致,表明β-异头构象。糖在C2'和C3'羟基位置的附接由糖I中H-2'(δH4.54)和H-3'(δH 5.15)的相对低场化学位移支持,表明在C-19处的2,3-支链-D-葡糖丙糖基取代基(碳编号参见图2)。峰值分配在表7.2中列出,并从1H、COSY和HSQC谱确定,并与文献(参见例如Prakash等人,Nat.Prod.Comm.,11:1523-6[2013])比较。
Figure BDA0002229282040003811
Figure BDA0002229282040003821
Figure BDA0002229282040003831
实施例8
SEQ ID NO:548的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:232衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:231编码的GT(即SEQID NO:232)的定向演化通过构建文库来进行,其中将与第3轮中改进的活性相关的表面残基突变重组。然后将这个文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第四轮(“第4轮”)的76种工程化GT变体多肽。
从ADP-葡萄糖向莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:232变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为2.5μL裂解物,并且底物载量为来自50%乙醇中的20mM储备溶液的0.5mM莱鲍迪苷D(ChromaDex,>94%纯度),以及共底物载量为0.5mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、30℃、在
Figure BDA0002229282040003832
滴定板振荡器中以300RPM振荡1h。通过将测定物以1:10稀释并且然后用50μL/孔具有0.2%甲酸的乙腈淬灭将反应淬灭,在4℃离心10m,并将上清液在水中以1:10稀释,并通过如实施例1、表1.1中描述的HPLC-MS/MS分析。
工程化多肽在表8.1中列出。尽管亲本和变体构建体包含用于亲和纯化的N-末端组氨酸标签,但为了清楚起见,将突变相对于未加标签的参考序列进行编号。对于具有SEQID NO:348、350、352、354、356、364、408和428的变体,如实施例1中描述的生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040003851
Figure BDA0002229282040003861
Figure BDA0002229282040003871
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的摇瓶粉末表征测定和分析
进行了时间过程实验来表征工程化的第4轮变体对甜菊苷和莱鲍迪苷D的活性。将1g/L摇瓶粉末(SFP)添加到100μL总反应体积中,总反应体积含有50mM Tris-HCl缓冲液,pH7.5、3mM MgCl2、2.5%v/v乙醇和1mM甜菊苷(ChromaDex,>94%纯度)或莱鲍迪苷D(ChromaDex,>93%纯度)及1mM ADP-葡萄糖。反应在
Figure BDA0002229282040003872
滴定板振荡器中在30℃以300RPM振荡0.5-2h来进行。将反应通过添加50μL具有0.2%甲酸的乙腈来淬灭,并通过离心沉淀。将上清液在水中以1:50稀释,并通过如实施例1、表1.1中描述的LC-MS/MS分析甜菊醇糖苷。所有8种变体具有高于SEQ ID NO:232的对甜菊苷和莱鲍迪苷D二者的活性。在1小时时间点,相对于SEQ ID NO:232,由变体从甜菊苷产生的莱鲍迪苷A的水平在表8.2中列出。
Figure BDA0002229282040003881
8种工程化变体对莱鲍迪苷D的活性明确地高于SEQ ID NO:232的活性,但是在时间进程中它们彼此没有明显区别。因此,后续实验如下进行:将0.03-1g/L的剂量响应曲线的摇瓶粉末(SFP)添加到100μL总反应体积中,总反应体积含有50mM Tris-HCl缓冲液,pH7.5、3mM MgCl2、2.5%v/v乙醇和1mM莱鲍迪苷D(ChromaDex,>93%纯度)及1mM ADP-葡萄糖。反应在
Figure BDA0002229282040003882
滴定板振荡器中在30℃以300RPM振荡0.5h来进行。将反应通过添加50μL具有0.2%甲酸的乙腈来淬灭,并通过离心沉淀。将上清液在水中以1:67稀释,并通过如实施例1、表1.1中描述的LC-MS/MS分析甜菊醇糖苷。以0.0625g/L SFP载量,第4轮变体对莱鲍迪苷D的活性在表8.3中列出。
Figure BDA0002229282040003891
实施例9
SEQ ID NO:348的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:348衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:347编码的GT(即SEQID NO:348)的定向演化通过构建文库来进行,其中将与先前轮中改进的活性相关的突变重组,并且其中将从公开可获得的数据库中的同源物鉴定的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第五轮(“第5轮”)的工程化GT变体多肽,6种来自文库5.01(表9.1),并且18种来自该轮中的剩余的文库(表9.2)。
从ADP-葡萄糖向甜菊醇糖苷的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:348变体的大肠杆菌培养物裂解物进行了测定。将裂解缓冲液体积从先前轮中使用的250uL增加至400uL,并将裂解物稀释10倍。对于第5.01轮,测定用10μL裂解物在100μL反应中来进行,并且底物载量为来自50%乙醇中的20mM储备溶液的1mM甜菊苷(ChromaDex,>94%纯度),以及共底物载量为1mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、40℃、在
Figure BDA0002229282040003901
滴定板振荡器中以300RPM振荡1h。通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并在4℃离心10m。将上清液在水中以1:10稀释,并通过如表9.3中描述的RapidFire SPE-MS/MS(Agilent)分析。对于剩余的第5轮文库,将裂解物稀释4倍而不是10倍,使用pH 7的50mM磷酸钾缓冲液而不是Tris-HCl,温度为50℃,反应时间为2h,并且测定用甜菊苷和莱鲍迪苷D(Chromadex,>93%)两者来进行。
工程化多肽在表9.1和表9.2中列出。尽管亲本和变体构建体包含用于亲和纯化的N-末端组氨酸标签,但为了清楚起见,将突变相对于未加标签的参考序列进行编号。对于SEQ ID NO:500,如实施例1中描述的生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040003902
Figure BDA0002229282040003911
Figure BDA0002229282040003921
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验,以表征相对于SEQ ID NO:348,工程化第5轮变体SEQ ID NO:500对甜菊苷和莱鲍迪苷D的活性。将0.03-1g/L水平的摇瓶粉末(SFP)添加到100μL总反应体积中,总反应体积含有50mM Tris-HCl缓冲液,pH 7.5、3mM MgCl2、2.5%v/v乙醇和1mM甜菊苷(ChromaDex,>94%纯度)或莱鲍迪苷D(ChromaDex,>93%纯度)及1mMADP-葡萄糖。使反应在40℃在热循环器中进行0.5h,并将反应用50μL具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。将上清液在水中以1:67稀释,并通过如实施例1、表1.1中描述的LC-MS/MS分析甜菊醇糖苷。以1g/L载量,SEQ ID NO:500从甜菊苷产生的莱鲍迪苷A多达SEQ IDNO:348的>1.2倍,并且从莱鲍迪苷D产生的莱鲍迪苷M多达>1.07倍。随后,将SEQ ID NO:499(即500)重克隆以删除N-末端组氨酸标签,以高通量表达,并且将板在400μL中裂解。将含有变体SEQ ID NO:548的所得粉末相对于SEQ ID NO:500变体进行测定,将2.5μL裂解物添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液,pH 7、3mM MgCl2、2.5%v/v乙醇和1mM甜菊苷(ChromaDex,>94%纯度)或莱鲍迪苷D(ChromaDex,>93%纯度)及1mM ADP-葡萄糖。使反应在50℃在
Figure BDA0002229282040003931
振荡培养器中以300RPM进行4h,并通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并通过离心沉淀。将上清液在水中以1:10稀释,并通过如表9.3中描述的RapidFire SPE-MS/MS分析甜菊醇糖苷。在这些条件下,SEQ ID NO:548变体从甜菊苷产生的莱鲍迪苷A比SEQ ID NO:500变体多近1.5倍,并且从莱鲍迪苷D产生的莱鲍迪苷M多高于1.6倍。
随后,制备含有SEQ ID NO:548变体的摇瓶粉末,并将其相对于SEQ ID NO:348变体进行分析。将0.25-10g/L水平的摇瓶粉末(SFP)添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液,pH 7、3mM MgCl2、2mM ADP-葡萄糖、和1g/L莱鲍迪苷A 60(60%莱鲍迪苷A,>35%甜菊苷)或莱鲍迪苷D(ChromaDex,>93%纯度)。使反应在40℃在热循环器中进行1h,并通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并通过离心沉淀。将上清液在水中以1:10稀释,并通过如实施例1、表1.1中描述的LC-MS/MS分析甜菊醇糖苷。SEQ ID NO:548变体将莱鲍迪苷A 60转化为莱鲍迪苷A和莱鲍迪苷I的混合物达到>65%,并将莱鲍迪苷D几乎完全转化为莱鲍迪苷M。以0.25g/L摇瓶粉末载量,SEQ ID NO:548变体对莱鲍迪苷D的转化达到SEQ ID NO:348变体的1.4倍,并且莱鲍迪苷A 60的转化达到2.2倍。
AGT酶的表达分析
将用于甜菊醇糖苷的β-1,3-葡糖基化的第六轮的工程化AGT多肽通过聚丙烯酰胺凝胶电泳来分析,以确定相对蛋白表达水平。样品用1x LDS加载缓冲液和1x还原剂(LifeTechnologies)来制备。将4-12%Bis-Tris丙烯酰胺凝胶(Life Technologies)每泳道加载5μg来自摇瓶规模培养物的冻干可溶性粗裂解物,并在200V用MES运行缓冲液运行25min,并使用ImageJ分析软件对条带进行定量。相对表达水平在表9.4中列出。SEQ ID NO:547/548、499/500和347/348是显著更佳表达的基因和/或显著更佳折叠/更稳定的蛋白。因此,这些基因比野生型基因产生更多蛋白。
Figure BDA0002229282040003941
实施例10
用AGT(SEQ ID NO:500)将莱鲍迪苷A转化为莱鲍迪苷I
在这个实施例中,描述了使用SEQ ID NO:500变体将莱鲍迪苷A向莱鲍迪苷I转化的反应放大规模,以及莱鲍迪苷I的分离和表征。反应包含5g/L的SEQ ID NO:500变体冻干的摇瓶粉末、50mM磷酸钾缓冲液,pH 7、10.3mM氯化镁、10g/L莱鲍迪苷A(>97%纯度)和10.3mM ADP-葡萄糖(Sigma),将10mL总体积在搅拌板上以300RPM和35℃搅拌89h。当其开始时反应是透明的,并且到反应结束时其为白色乳液。将测定物在水中以1:10稀释,并将10μL稀释的测定物添加到具有0.2%甲酸的90μL乙腈中,并通过离心沉淀。将上清液在水中以1:10稀释,并通过如实施例1、表1.1中描述的LC-MS/MS分析甜菊醇糖苷。这个分析证实了莱鲍迪苷I以高转化率产生。由于它的低溶解度,莱鲍迪苷I沉淀。因此,分离通过去除上清液,用最小体积的水将沉淀重悬浮并离心来进行。将这个洗涤步骤重复两次,并将白色沉淀表面的棕色沉淀刮去。将该材料冻干并通过Acorn NMR分析。将该材料在吡啶-d5中溶解,并用Varian Inova 500NMR波谱仪进行1H 1-D、13C DEPT-135、1H-13C HSQC NMR实验。NMR谱与莱鲍迪苷I的文献报道完全一致(参见表10.1)。具有编号的碳的莱鲍迪苷I的结构参见图3。
Figure BDA0002229282040003951
Figure BDA0002229282040003961
Figure BDA0002229282040003971
实施例11
SEQ ID NO:548的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:548衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:547编码的GT(即SEQID NO:548)的定向演化通过构建文库来进行,其中将与先前轮中改进的活性相关的突变重组。然后将这个文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第六轮(“第6轮”)的66种工程化GT变体多肽(表11.1)。
从ADP-葡萄糖向甜菊醇糖苷的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:548变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400uL,并将裂解物稀释4倍。测定用10μL裂解物在100μL反应中来进行,并且底物载量为来自50%乙醇中的20mM储备溶液的1mM甜菊苷(ChromaDex,>94%纯度),且共底物载量为1mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040003981
滴定板振荡器中以300RPM振荡4h。通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并在4℃离心10m。将上清液在水中以1:10稀释,并通过如表9.3中描述的RapidFire SPE-MS/MS分析。前84种变体用相同条件重新测试,使用1mM甜菊苷(Chromadex,>94%纯度)、1mM莱鲍迪苷A(>97%纯度)或莱鲍迪苷D(Chromadex,>93%纯度)。所得的工程化GT变体多肽在表11.1中列出。对于具有SEQID NO:554、562、568和576的变体,如实施例1中描述的生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040003991
Figure BDA0002229282040004001
Figure BDA0002229282040004011
Figure BDA0002229282040004021
Figure BDA0002229282040004031
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第6轮变体对甜菊苷和莱鲍迪苷D的活性。将0.03-1g/L水平的摇瓶粉末(SFP)添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液、pH 7、3mMMgCl2、2.5%v/v乙醇和1mM甜菊苷(ChromaDex,>94%纯度)或莱鲍迪苷D(ChromaDex,>93%纯度)及1mM ADP-葡萄糖。使反应在50℃在Thermotron滴定板振荡器中以300RPM进行1h,并将反应物用150μL水稀释,并且然后通过将12.5μL转移到87.5μL具有0.2%甲酸的乙腈中来淬灭,并通过离心沉淀。将上清液在水中以1:20稀释,并通过如实施例9、表9.3中描述的RapidFire SPE-MS/MS分析甜菊醇糖苷。酶的相对产率在表11.2中列出。
Figure BDA0002229282040004041
实施例12
SEQ ID NO:562的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:562衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:561编码的GT(即SEQID NO:562)的定向演化通过构建文库来进行,其中将与先前轮中改进的活性相关的突变重组。然后将这个文库铺板、生长并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第七轮(“第7轮”)的37种工程化GT变体多肽(表12.1)。
从ADP-葡萄糖向甜菊醇糖苷的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:562变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400uL,并将裂解物稀释4倍。测定用10μL裂解物在100μL反应中来进行,并且底物载量为来自50%乙醇中的20mM储备溶液的1mM甜菊苷(ChromaDex,>94%纯度),且共底物载量为1mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040004051
滴定板振荡器中以300RPM振荡1h。通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并在4℃离心10m。将上清液在水中以1:10稀释,并通过如表9.3中描述的RapidFire SPE-MS/MS分析。将前84种变体用相同条件重新测试,使用1mM甜菊苷(Chromadex,>94%纯度)、1mM莱鲍迪苷A(>97%纯度)或莱鲍迪苷D(Chromadex,>93%纯度)。所得的工程化GT变体多肽在表12.1中列出。
Figure BDA0002229282040004061
Figure BDA0002229282040004071
Figure BDA0002229282040004081
实施例13
具有葡糖基化活性的糖基转移酶的合成、优化和测定
在这个实施例中,描述了用于合成、优化和测定具有葡糖基化活性的UGT酶的方法。
基因合成及优化
将编码来自粳稻(Oryza sativa Japonica)、马铃薯(Solanum tuberosum)、宁夏枸杞(Lycium barbarum)和番茄(Solanum lycopersicum)的糖基转移酶的多核苷酸序列进行密码子优化并合成为基因SEQ ID NO:755、757、759、761、763、765和767。将这些合成基因克隆到pCK110900载体系统中(参见例如美国专利申请公布第2006/0195947号,特此将其通过引用并入)并随后在大肠杆菌W3110(ΔfhuA)中表达。大肠杆菌菌株W3110在lac启动子的控制下表达UGT酶。
产生摇瓶粉末(SFP)
将摇瓶程序用于产生糖基转移酶多肽摇瓶粉末(SFP),以用于在本文描述的生物催化方法中使用的表征测定。与HTP测定中使用的细胞裂解物相比,酶的摇瓶粉末(SFP)制品提供了更纯的酶制品(例如高达>30%的总蛋白),并且还允许使用更浓的酶溶液。将含有编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到含有30μg/ml氯霉素和1%葡萄糖的5mL Luria Bertani肉汤中。使细胞在培养箱中在30℃以250rpm振荡生长过夜(至少16小时)。在1L摇瓶中,在含有30μg/ml CAM的250mL Terrific肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾,pH 7.0,1mMMgSO4)中将培养物稀释至600nm的光密度(OD600)为0.2,并允许在30℃生长。
当培养物的OD600为0.6至0.8时,通过添加IPTG至1mM的终浓度来诱导糖基转移酶基因的表达。然后继续孵育过夜(至少16小时)。通过离心(5000rpm、15min、4℃)来收获细胞并弃去上清液。将细胞沉淀物再悬浮在两体积的pH 7.5的25mM三乙醇胺缓冲液中,并以标准大肠杆菌裂解设置通过
Figure BDA0002229282040004091
高压均质仪且维持在4℃。将细胞碎片通过离心(10,000rpm、45分钟、4℃)去除。收集澄清的裂解物上清液并在-80℃冷冻,并且然后His亲和纯化及透析以产生纯化的蛋白或者冻干以产生粗制蛋白的干燥摇瓶粉末。
用纯化的蛋白葡糖基化莱鲍迪苷A的测定
首先,将50μL纯化的蛋白在200μL总反应体积中稀释,总反应体积由pH 7.5的50mMTris-HCl缓冲液、3mM氯化镁、1mM莱鲍迪苷A和0.5mM尿苷二磷酸葡萄糖组成。反应在30℃在
Figure BDA0002229282040004092
滴定板振荡器中以300RPM振荡18h来进行。将煮沸的酶反应物用作阴性对照。将10μL的反应用90μL具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。通过如实施例1、表1.1中描述的LC-MS/MS在上清液中检测糖基化莱鲍迪苷A产物。
对SEQ ID NO:756、758、762和768检测从莱鲍迪苷A产生莱鲍迪苷D。一些酶还产生莱鲍迪苷D的区域异构体(regioisomer),可能是6-连接的分子莱鲍迪苷D2。尽管可溶性表达不良,SEQ ID NO:758显示出对在甜菊醇糖苷底物中产生β-1,2-葡萄糖键的高比活性和良好的选择性。
用摇瓶粉末葡糖基化莱鲍迪苷A的测定
将冻干的摇瓶粉末重构为20mg/mL。然后,将10μL的这些储备液稀释于以下100μL总反应体积中:50mM磷酸钾(KPhos)缓冲液、pH 7、和3mM MgCl2、1mM莱鲍迪苷A(>97%纯度)和2mM尿苷二磷酸葡萄糖(UDP-葡萄糖)。反应在40℃在
Figure BDA0002229282040004101
滴定板振荡器中以300RPM振荡16-18h来进行。对比阴性对照检测SEQ ID NO:758的活性。在LC-MS/MS分析中观察到莱鲍迪苷A向莱鲍迪苷D的低转化(即<10%)。
实施例14
SEQ ID NO:758的GT变体
在这个实施例中,描述了为了改进的甜菊醇糖苷的糖基化,对从SEQ ID NO:758衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:757编码的GT(即SEQ ID NO:758)的定向演化通过构建变体基因的组合文库来进行,其中与酶的表面残基相关的位置经受诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对甜菊醇糖苷具有β-1,2-葡糖基转移酶活性的第一轮(“第1轮”)的10种工程化GT变体多肽。
HTP生长、表达及裂解物制备
将细胞挑取到96孔板中,并在含有1%葡萄糖和30μg/mL CAM的LB培养基中、30℃、200rpm、85%湿度生长过夜。然后将20μL过夜生长物转移到含有包含30μg/mL CAM的380μLTB生长培养基的深孔板中,用1mM IPTG诱导,并在30℃、200rpm、85%湿度孵育18h。将细胞培养物在4000rpm、4℃离心10m,并弃去培养基。将如此获得的细胞沉淀在-80℃冷冻,并在250μL裂解缓冲液(0.5g/L溶菌酶和0.5g/L PMBS于20mM Tris-HCl缓冲液、pH 7.5中)中在滴定板振荡器上在室温用低速振荡2h裂解。然后将板在4000rpm和4℃离心20min,并将澄清的裂解物上清液用于以下描述的HTP测定反应中。
莱鲍迪苷A葡糖基化的HTP测定
对96孔板的澄清的表达SEQ ID NO:757变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,并且底物载量为来自50%乙醇中的20mM储备溶液的1mM莱鲍迪苷A(Sigma,>96%纯度),且共底物载量为0.5mM UDP-葡萄糖(Sigma,>98%纯度)。使用了以下反应条件:50mM Tris-HCl缓冲液、pH 7.5、3mM MgCl2、30℃、在
Figure BDA0002229282040004111
滴定板振荡器中以300RPM振荡4h。将反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过在4℃离心10m来沉淀。用实施例1、表1.1中描述的仪器和参数通过LC-MS/MS检测在水中以1:20稀释后的上清液中的糖基化产物。鉴定以大于SEQ ID NO:758的量从莱鲍迪苷A产生莱鲍迪苷D的糖基转移酶变体多肽。工程化多肽在表14.1中列出。如实施例1中描述的生长摇瓶规模的培养物用于冻干粉末产生,用于分析表14.1中示出的具有相对于SEQ ID NO:758的以下氨基酸突变的变体。
Figure BDA0002229282040004112
莱鲍迪苷A葡糖基化的摇瓶裂解物表征测定和分析
首先,生长250mL摇瓶培养物、诱导及裂解。如实施例1中描述的,将细胞碎片通过离心去除,并收集澄清的裂解物上清液。然后,将10μL裂解物稀释于以下100μL总反应体积中:50mM Tris-HCl缓冲液、pH 7.5、3mM MgCl2、1mM莱鲍迪苷A(Sigma,>96%纯度)和2mMUDP-葡萄糖(Sigma,>98%纯度)。反应在
Figure BDA0002229282040004121
滴定板振荡器中在30℃以300RPM振荡0-18h来进行。将以上描述的反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:20稀释后的上清液中的糖基化产物。
Figure BDA0002229282040004122
对应于SEQ ID NO:770和772的变体以大于SEQ ID NO:758的变体的量从莱鲍迪苷A产生莱鲍迪苷D。SEQ ID NO:770的变体表现出最高的对RebA的活性。因此,选择编码多核苷酸(SEQ ID NO:769)用于进一步定向演化。
实施例15
SEQ ID NO:770的ADP-糖基转移酶变体
在这个实施例中,描述了为了甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:770变体衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:769编码的GT(即SEQ ID NO:770)的定向演化通过构建变体基因文库来进行。文库重组了实施例14(第1轮)中鉴定出的有益突变,组合掺入了来自公开可获得的数据库中的同源物的多样性,或使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第二轮(“第2轮”)的工程化GT变体多肽。从重组的有益突变鉴定出10种工程化变体(表15.1),从饱和诱变鉴定出19种(表15.2),以及从表面残基和同源物多样性鉴定出53种(表15.3)。
从ADP-葡萄糖向莱鲍迪苷A的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:769变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,并且底物载量为1mM莱鲍迪苷A(Sigma,>96%纯度),且共底物载量为4mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mMTris-HCl缓冲液、pH 7.5、3mM MgCl2、30℃、在
Figure BDA0002229282040004131
滴定板振荡器中以300RPM振荡18h。将反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过在4℃离心10m来沉淀。用实施例1、表1.1中描述的仪器和参数通过LC-MS/MS检测在水中以1:10稀释后的上清液中的糖基化产物。鉴定以大于SEQ ID NO:770的量从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D的糖基转移酶变体多肽。来自重组的有益突变的工程化多肽在表15.1中列出。来自饱和诱变文库的工程化多肽在表15.2中列出。
Figure BDA0002229282040004141
Figure BDA0002229282040004142
Figure BDA0002229282040004151
莱鲍迪苷A的葡糖基化的HTP测定
对剩余的组合第2轮文库如下筛选:对96孔板的澄清的表达SEQ ID NO:769变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,或在100μL反应中10μL 4倍稀释的裂解物,并且底物载量为1mM莱鲍迪苷A(Sigma,>96%纯度),且共底物载量为1mM UDP-葡萄糖(Sigma,>98%纯度)。使用了以下反应条件:50mM Tris-HCl缓冲液、pH 7.5、3mMMgCl2、40℃、在
Figure BDA0002229282040004152
滴定板振荡器中以300RPM振荡1-2h。将反应用0.5体积/体积的具有0.2%甲酸的乙腈淬灭,或者将10μL的反应用90μL具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:100或1:10稀释后的上清液中的糖基化产物。鉴定以大于SEQ ID NO:770的量从莱鲍迪苷A产生莱鲍迪苷D的糖基转移酶变体多肽。工程化多肽在表15.3中列出。
Figure BDA0002229282040004161
Figure BDA0002229282040004171
莱鲍迪苷I的葡糖基化的HTP测定
对来自第2轮饱和诱变文库的88种变体如下筛选:对96孔板的澄清的表达SEQ IDNO:769变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,并且底物载量为1mM莱鲍迪苷I(如实施例10中描述的从莱鲍迪苷A制备),且共底物载量为1mM UDP-葡萄糖(Sigma,>98%纯度)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、40℃、在Thermotron滴定板振荡器中以300RPM振荡66h。通过将10μL的反应物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并通过离心沉淀。用表15.5中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。鉴定以大于SEQ IDNO:770的量从莱鲍迪苷I产生莱鲍迪苷M的糖基转移酶变体多肽。前两种工程化多肽是SEQID NO:1292和1294,它们分别具有相对于SEQ ID NO:770的突变F156R和G199H。
如实施例1中描述的生长摇瓶规模的培养物用于SFP产生,用于分析表15.4中示出的具有氨基酸突变(相对于SEQ ID NO:770)的变体。
从ADP-葡萄糖向莱鲍迪苷A的葡糖基转移的SFP表征测定和分析
将摇瓶粉末重构以提供20g/L粉末。然后,将10μL的这些储备液稀释于以下100μL总反应体积中:50mM Tris-HCl缓冲液、pH 7.5、和3mM MgCl2、1mM莱鲍迪苷A(Sigma,>96%纯度)及4mM ADP-葡萄糖(Sigma,>93%纯度)。反应在30℃在
Figure BDA0002229282040004181
滴定板振荡器中以300RPM振荡0-19h来进行。如实施例14中描述的将反应淬灭并沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:100稀释后的上清液中的糖基化产物。
Figure BDA0002229282040004182
表15.4中的所有变体(即SEQ ID NO:790、792、794和796的变体)以大于SEQ IDNO:770的量从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D。因此,这些工程化ADP-糖基转移酶为将莱鲍迪苷Aβ-葡糖基化为莱鲍迪苷D提供了新的生物催化试剂。在这些实验中,SEQ IDNO:792的变体具有最高的对以ADP-葡萄糖作为共底物的莱鲍迪苷A的初始活性。因此,选择编码多核苷酸(SEQ ID NO:791)用于进一步定向演化。
Figure BDA0002229282040004191
Figure BDA0002229282040004201
实施例16
SEQ ID NO:792的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:792衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:791编码的GT(即SEQID NO:792)的定向演化通过构建变体基因文库来进行,其中将与以上先前轮中改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第三轮(“第3轮”)的工程化GT变体多肽。
从ADP-葡萄糖向莱鲍迪苷A的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:792变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,并且底物载量为1mM莱鲍迪苷A(>97%纯度),且共底物载量为1mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM KPhos缓冲液、pH 7、3mM MgCl2、40℃、在
Figure BDA0002229282040004202
滴定板振荡器中以300RPM振荡5-6h。然后将10μL的反应用90μL具有0.2%甲酸的乙腈淬灭,在4℃离心10m,并将上清液通过如实施例9、表9.3中描述的RapidFire-MS/MS分析。鉴定以大于SEQ ID NO:792的量从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D的糖基转移酶变体多肽。工程化多肽在表16.1中列出。如实施例1中描述的生长摇瓶规模的培养物用于SFP产生,用于分析表16.1中示出的相对于SEQ ID NO:792的变体。
Figure BDA0002229282040004211
从ADP-葡萄糖向莱鲍迪苷A的葡糖基转移的SFP表征测定和分析
将摇瓶粉末重构以提供20g/L粉末。然后,将10μL的这些储备液稀释于以下100μL总反应体积中:50mM KPhos缓冲液、pH 7、和3mM MgCl2、1mM莱鲍迪苷A(>97%纯度)及2mMADP-葡萄糖(Sigma,>93%纯度)。
反应在40℃在
Figure BDA0002229282040004221
滴定板振荡器中以300RPM振荡0-21h来进行。将反应淬灭并如以上描述的沉淀。用实施例1、表1.1中描述的仪器和参数,通过LC-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。
Figure BDA0002229282040004222
在这些实验中,表16.2中的所有变体(即SEQ ID NO:954、956和990)以大于SEQ IDNO:792的量从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D。在这些实验中,SEQ ID NO:954的变体具有最高的对以ADP-葡萄糖作为共底物的莱鲍迪苷A的活性。因此,选择编码多核苷酸(SEQ ID NO:953)用于进一步定向演化。
实施例17
用于甜菊醇糖苷葡糖基化,包括将莱鲍迪苷I葡糖基化为莱鲍迪苷M的SEQ ID NO:954的ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:954衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:953编码的GT(即SEQID NO:954)的定向演化通过构建变体基因文库来进行,其中将与以上先前轮中改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第四轮(“第4轮”)的工程化GT变体多肽。
从ADP-葡萄糖向莱鲍迪苷A的葡萄糖转移的HTP测定
如实施例13中描述的,将细胞用400μL裂解缓冲液裂解。对96孔板的澄清的表达SEQ ID NO:954变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为20μL裂解物,并且底物载量为1mM莱鲍迪苷A(>97%纯度),且共底物载量为1mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM KPhos缓冲液、pH 7、3mM MgCl2、40℃、在
Figure BDA0002229282040004231
滴定板振荡器中以300RPM振荡4h。如实施例16中描述的将反应淬灭,并将上清液通过如实施例9、表9.3中描述的RapidFire-MS/MS分析。鉴定以大于SEQ ID NO:954的量从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D的糖基转移酶变体多肽。工程化多肽在表17.1中列出。如实施例1中描述的生长摇瓶规模的培养物用于SFP产生,用于分析表17.1中示出的具有以下氨基酸突变(相对于SEQ ID NO:150)的变体。
Figure BDA0002229282040004241
Figure BDA0002229282040004251
从ADP-葡萄糖向莱鲍迪苷A的葡糖基转移的SFP表征测定和分析
将摇瓶粉末重构以提供50g/L粉末。然后,将1μL的这些储备液稀释于以下100μL总反应体积中:50mM KPhos缓冲液、pH 7、和3mM MgCl2、1mM莱鲍迪苷A(>97%纯度)及2mMADP-葡萄糖(Sigma,>93%纯度)。反应在
Figure BDA0002229282040004252
滴定板振荡器中在40℃以300RPM振荡2h来进行。然后将反应在水中以1:5稀释,并将25μL稀释的反应用75μL具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例9、表9.3中描述的仪器和参数,通过RapidFire-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。
Figure BDA0002229282040004261
在这些实验中,除SEQ ID NO:1030以外,表17.2中的所有其他变体(SEQ ID NO:1054、1032、1028、1052、1058、1014和1002)以大于SEQ ID NO:954的量从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D。在这些实验中,具有相对于SEQ ID NO:954的突变H97G、Q202G和N367W的变体(SEQ ID NO:1054)具有最高的对以ADP-葡萄糖作为共底物的莱鲍迪苷A的活性。因此,选择编码多核苷酸(SEQ ID NO:1053)用于进一步定向演化。
从UDP-葡萄糖向莱鲍迪苷I的葡糖基转移的SFP表征测定和分析
将摇瓶粉末重构以提供50g/L粉末。然后,将2μL的这些储备液稀释于以下100μL总反应体积中:50mM KPhos缓冲液、pH 7、和3mM MgCl2、1mM莱鲍迪苷A(>97%纯度)及2mMUDP-葡萄糖(Sigma,>98%纯度)。反应在Thermotron滴定板振荡器中在40℃以300RPM振荡20h来进行。然后将反应用0.5体积/体积具有0.2%甲酸的乙腈淬灭,并通过离心沉淀。用实施例15、表15.5中描述的仪器和参数,通过LC-MS/MS检测在水中1:20稀释后的上清液中的糖基化产物。
Figure BDA0002229282040004271
SEQ ID NO:954和表17.3中的所有变体(SEQ ID NO:1054、1032、1028、1052、1014、1002和1030)以高于阴性对照的水平从莱鲍迪苷I和UDP-葡萄糖产生莱鲍迪苷M。SEQ IDNO:1002、1032和1058以等于或高于SEQ ID NO:954的水平从莱鲍迪苷I和UDP-葡萄糖产生莱鲍迪苷M。相对于SEQ ID NO:954,具有突变P175S、T211E、S264A、V279L、I316V和L323V的变体(SEQ ID NO:1002)具有最高的对以UDP-葡萄糖作为共底物的莱鲍迪苷I的活性。因此,选择编码多核苷酸(SEQ ID NO:1001)用于进一步定向演化,用于莱鲍迪苷I向莱鲍迪苷M的转化。
实施例18
SEQ ID NO:74的蔗糖合酶变体
在这个实施例中,描述了为了改进的从蔗糖和ADP产生ADP-葡萄糖,对从SEQ IDNO:73衍生的蔗糖合酶(SuS)多肽的演化和筛选的实验。对由SEQ ID NO:73编码的SuS(即SEQ ID NO:74)的定向演化通过构建变体基因文库来实现,其中使与酶的某些结构特征相关的位置经受了饱和诱变,并且将来自公开可获得的数据库中的同源物的多样性重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对合成ADP-葡萄糖具有改进的活性的第一轮(“第1轮”)的37种工程化SuS变体多肽。
从蔗糖向ADP的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:73变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,并且底物载量为来自水中的60%储备溶液的30%w/v蔗糖(Sigma),且共底物载量为2mM ADP(Sigma,>95%)。使用了以下反应条件:50mMTris-HCl缓冲液、pH 7.5、3mMMgCl2、30℃、在热循环器中持续2h。将反应在95℃持续10分钟来热淬灭,并且然后通过改编自文献的比色D-果糖脱氢酶测定(参见例如Ameyama等人,J.Bacteriol.,145:814-823[1981];和Ameyama,Meth.Enzymol.,89:20-29[1982])进行分析。简言之,过夜酶偶联测定在96孔板中来进行,用稀释的使得果糖浓度<1g/L的20μL样品、20μL 100mM铁氰化钾(Sigma P-8131)和溶解于具有0.1%Triton X-100的pH 4.6的McIlvaine缓冲液中的160μL 0.8单位/mL果糖脱氢酶(SigmaF4892)。该反应将果糖定量地转化为K4Fe(CN)6,然后将K4Fe(CN)6通过以下步骤来比色定量:将67μL过夜反应物添加到33μL停止溶液(0.3%w/v十二烷基硫酸钠,Sigma L-4509;8.1%v/v磷酸,Sigma P-6560和0.5%w/v硫酸铁,Sigma F-1135)中,并振荡20分钟,以允许K4Fe(CN)6完全转化为普鲁士蓝,普鲁士蓝的吸光度在读板器上以690nm的波长来读取。
初步测定后,将具有高于SEQ ID NO:74的果糖形成活性、并因此具有高于SEQ IDNO:74的化学计量ADP-葡萄糖形成活性的84种工程化蔗糖合酶(SuS)变体多肽以2%w/v蔗糖(Sigma)的较低底物载量和1mM ADP(Sigma,>95%)的共底物载量以一式三份来筛选。工程化多肽在表18.1中列出。
Figure BDA0002229282040004291
Figure BDA0002229282040004301
Figure BDA0002229282040004311
实施例19
SEQ ID NO:1080的蔗糖合酶变体
对由SEQ ID NO:1079编码的SuS(即SEQ ID NO:1080)的定向演化通过构建变体基因文库来继续进行,其中将与以上改进的活性相关的突变重组;并通过构建文库,其中将另外的同源物多样性重组。然后将这些文库铺板、生长、并使用实施例18中描述的高通量(HTP)测定用较低的底物载量筛选,以提供对ADP-葡萄糖的产生具有活性的第二轮(“第2轮”)的34种工程化SuS变体多肽。
初步筛选后,在具有以下改变的相同条件下,将42种变体以一式两份来重新测试,并将56种变体以一式三份来重新测试:将pH 7.5的50mM Tris-HCl改变为pH 7的50mM磷酸钾缓冲液,并将温度增加至50℃。将实施例18中描述的果糖脱氢酶测定用于定量作为化学计量ADP-葡萄糖的代表的果糖产量。所得的工程化多肽在表19.1中列出。对于表19.1中示出的具有氨基酸突变(相对于SEQ ID NO:1080)的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004321
Figure BDA0002229282040004331
使用由SuS从蔗糖和ADP产生的ADP-葡萄糖,莱鲍迪苷A的葡糖基化的偶联测定的SuS摇瓶粉末的表征
首先,将SuS冻干摇瓶粉末在水中重构,并以从0.025-1g/L蛋白的终浓度范围添加到总反应体积中。反应条件如下:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、和1mM莱鲍迪苷A(>97%纯度)、10mM蔗糖(Sigma)及1mM ADP(Sigma)。为了催化葡糖基从ADP-葡萄糖转移到莱鲍迪苷A而添加的GT是SEQ ID NO:548,在100μL总反应体积中终浓度为2g/L。反应在
Figure BDA0002229282040004341
滴定板振荡器中在50℃以300RPM振荡0.5h来进行。通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将以上描述的反应淬灭,并通过离心沉淀。用实施例9、表9.3中描述的仪器和参数,通过RapidFire SPE-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。偶联摇瓶粉末测定中从莱鲍迪苷A产生的莱鲍迪苷I的相对水平在表19.2中列出。
Figure BDA0002229282040004342
实施例20
SEQ ID NO:1158的蔗糖合酶变体
对由SEQ ID NO:1157编码的SuS(即SEQ ID NO:1158)的定向演化通过构建变体基因文库来继续进行,其中将与以上改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有活性的第三轮(“第3轮”)的34种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将文库使用以下高通量(HTP)酶偶联测定来筛选:在100μL反应体积中,10μL SuS裂解物和2g/L GT SEQ ID NO:548、并且底物载量为1mM莱鲍迪苷A(>97%纯度)、且共底物载量为1mM ADP(Sigma,>95%)和10mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040004351
滴定板振荡器中以300RPM振荡1h。通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将以上描述的反应淬灭,并通过离心沉淀。将上清液在水中以1:10稀释,并且甜菊醇糖苷产物用实施例9、表9.3中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,将显示出与GT偶联的对莱鲍迪苷A的活性的56种工程化SuS变体多肽用相同的条件和2.5倍减少的裂解物载量以一式三份重新测试。所得的工程化多肽在表20.1中列出。
对于表20.1中示出的具有氨基酸突变(相对于SEQ ID NO:1158)的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004361
Figure BDA0002229282040004371
使用由SuS从蔗糖和ADP产生的ADP-葡萄糖,莱鲍迪苷A的葡糖基化的偶联测定的SuS摇瓶粉末的表征
首先,将SuS冻干摇瓶粉末在水中重构,并以从0.025-5g/L蛋白的终浓度范围添加到总反应体积中。反应条件如下:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、和1g/L莱鲍迪苷D、10mM蔗糖(Sigma)及1mM ADP(Sigma)。为了催化葡糖基从ADP-葡萄糖转移到莱鲍迪苷A而添加的GT是SEQ ID NO:561/562,在100μL总反应体积中终浓度为1g/L。反应在
Figure BDA0002229282040004381
滴定板振荡器中在50℃以300RPM振荡1h来进行。通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将以上描述的反应淬灭,并通过离心沉淀。用实施例9、表9.3中描述的仪器和参数,通过RapidFire SPE-MS/MS检测在水中1:10稀释后的上清液中的糖基化产物。偶联摇瓶粉末测定中从莱鲍迪苷D产生的莱鲍迪苷M的相对水平在表20.2中列出。
Figure BDA0002229282040004382
SuS酶的表达分析
将用于用蔗糖的ADP再循环的第三轮的工程化SuS多肽通过聚丙烯酰胺凝胶电泳来分析,以确定相对蛋白表达水平。样品用1x LDS加载缓冲液和1x还原剂(LifeTechnologies)来制备。将4-12%Bis-Tris丙烯酰胺凝胶(Life Technologies)每泳道加载5μg来自摇瓶规模培养物的冻干可溶性粗裂解物,并在200V用MES运行缓冲液运行25min,并使用ImageJ分析软件对条带进行定量。相对表达水平在表20.3中列出。SEQ ID NO:1079/1080、1157/1158和1221/1222是显著更佳表达的基因和/或显著更佳折叠/更稳定的蛋白。这些比野生型基因产生更多的蛋白。
Figure BDA0002229282040004383
Figure BDA0002229282040004391
实施例21
用AGT和ACSuS将甜菊苷转化为莱鲍迪苷A
在这个实施例中,描述了为了使用AGT和ACSuS来产生莱鲍迪苷A而进行的实验。使用的缓冲液为50mM pH 7.0磷酸钾和3mM MgSO4。酶和蔗糖储备溶液(400g/L)在缓冲液中制备。“Reb A 60”是甜菊苷和莱鲍迪苷A分别为~1:2的混合物。向空气下的小瓶中添加250μL的8g/Lβ-1,3-GT SEQ ID NO:1290储备溶液、250μL的2g/L SuS SEQ ID NO:1158储备溶液、以及500μL的400g/L的蔗糖中的50g/L Reb A 60和2.6g/L ADP储备溶液。最终组成为25g/LReb A 60、200g/L蔗糖、2g/L SEQ ID NO:1290、0.5g/L SEQ ID NO:1158和1.3g/L(3mM)的ADP。将所得澄清均匀的溶液在空气下搅拌(随沉淀的形成,反应物逐渐变浑浊)。反应进程随后为取等分试样,并用1:1乙腈/水来淬灭。以4000rpm/r.t./5min离心后,澄清均匀的上清液使用表21.1和表21.2中列出的仪器和参数通过HPLC来分析。48h后,反应混合物由>90%的Reb A组成(表21.3)。
Figure BDA0002229282040004392
Figure BDA0002229282040004401
Figure BDA0002229282040004402
Figure BDA0002229282040004403
Figure BDA0002229282040004411
实施例22
用AGT和ACSuS将甜菊苷转化为莱鲍迪苷A及将莱鲍迪苷A转化为莱鲍迪苷D
在这个实施例中,描述了为了产生莱鲍迪苷A和莱鲍迪苷D而进行的实验。向空气下的小瓶中添加250μL的20g/Lβ-1,3-GT SEQ ID NO:1290储备溶液、250μL的40g/Lβ-1,2-GT SEQ ID NO:954储备溶液、以及500μL的400g/L的蔗糖中的20g/L Reb A 60、2.6g/L ADP和1g/L SuS SEQ ID NO:1158储备溶液。使用的缓冲液为50mM pH 7.0磷酸钾和3mM MgSO4。酶和蔗糖储备溶液(400g/L)在缓冲液中制备。最终组成为10g/L Reb A 60、200g/L蔗糖、5g/L SEQ ID NO:1290、10g/L SEQ ID NO:954、0.5g/L SEQ ID NO:1158和1.3g/L(3mM)的ADP。将所得澄清均匀的溶液在空气下搅拌(随沉淀的形成,反应物逐渐变浑浊)。反应进程随后为取等分试样,并用1:1乙腈/水来淬灭。以4000rpm/r.t./5min离心后,澄清均匀的上清液使用表21.1和表21.2中列出的仪器和参数通过HPLC来分析。24h后,没有甜菊苷剩余,并观察到16%的Reb D的形成(表22.1)。
Figure BDA0002229282040004412
实施例23
用AGT和ACSuS将莱鲍迪苷D转化为莱鲍迪苷M
在这个实施例中,描述了为了使用AGT和ACSuS变体从莱鲍迪苷D产生莱鲍迪苷M而进行的实验。向空气下的小瓶中添加100mg的Reb D、250μL的80g/Lβ-1,3-GT SEQ ID NO:548储备溶液、250μL的10g/L SuS SEQ ID NO:1158储备溶液、以及500μL的400g/L的蔗糖中的2.6g/L ADP储备溶液。使用的缓冲液为50mM pH 7.0磷酸钾和3mM MgSO4。酶和蔗糖储备溶液(400g/L)在缓冲液中制备。最终组成为100g/L Reb D、200g/L蔗糖、20g/L SEQ ID NO:548、2.5g/L SEQ ID NO:1158和1.3g/L(3mM)的ADP。将所得稠浆液在空气中搅拌。反应进程随后为取等分试样,并用1:1乙腈/水来淬灭。以4000rpm/r.t./5min离心后,澄清均匀的上清液使用表21.1和表21.2中列出的仪器和参数通过HPLC来分析。48h后,反应混合物由>90%的Reb M组成(表23.1)。
Figure BDA0002229282040004421
实施例24
用AGT和ACSuS将甜菊苷转化为莱鲍迪苷A、莱鲍迪苷A转化为莱鲍迪苷D、及莱鲍迪苷D转化为莱鲍迪苷M
在这个实施例中,描述了为了从甜菊苷产生莱鲍迪苷A、从莱鲍迪苷A产生莱鲍迪苷D、及从莱鲍迪苷D产生莱鲍迪苷M而进行的实验。向空气下的小瓶中添加250μL的20g/Lβ-1,3-GT SEQ ID NO:1290储备溶液、250μL的40g/Lβ-1,2-GT SEQ ID NO:954储备溶液、以及500μL的400g/L的蔗糖中的50g/L Reb A 60、2.6g/L ADP、5g/Lβ-1,3-GT SEQ ID NO:548和1g/L SuS SEQ ID NO:1158储备溶液。使用的缓冲液为50mM pH 7.0磷酸钾和3mM MgSO4。酶和蔗糖储备溶液(400g/L)在缓冲液中制备。最终组成为25g/L Reb A 60、200g/L蔗糖、5g/LSEQ ID NO:1290、10g/L SEQ ID NO:954、2.5g/L SEQ ID NO:548、0.5g/L SEQ ID NO:1158和1.3g/L(3mM)ADP。将所得澄清均匀的溶液在空气下搅拌(随沉淀的形成,反应物逐渐变浑浊)。反应进程随后为取等分试样,并用1:1乙腈/水来淬灭。以4000rpm/r.t./5min离心后,澄清均匀的上清液使用表21.1和表21.2中列出的仪器和参数通过HPLC来分析。24h后,剩余<5%的甜菊苷,并观察到9%的Reb M的形成(表24.1)。
Figure BDA0002229282040004431
实施例25
AGT和/或ACSuS的固定化
在这个实施例中,描述了为固定AGT(例如SEQ ID NO:1290、954和/或548的变体)和/或ACSuS变体(例如SEQ ID NO:1158)而进行的实验。向容器中添加单独的或作为酶的组合(即AGT酶和/或ACSuS酶)的酶溶液和固体支持物。固体支持物是阳离子的、阴离子的、疏水的、亲水的,具有或没有形成共价键的官能团诸如硫醇、醇、胺、烯烃、卤代烷和/或环氧化物的存在。固体支持物是离散的聚合树脂或无定形(纳米)粘土或活性炭。当合适时磁性颗粒被用于产物分离/酶再循环。反应在戊二醛的存在或不存在下进行。固体支持物吸收酶的进展通过Bradford测定来追踪。可选择地,将固体支持物填充在柱中,并使酶溶液流过柱,如果必要则进行再循环,直至达到期望的酶捕获程度。在一些实施方案中,将所有感兴趣的酶固定在同一反应容器中的同一固体支持物上,而在一些可选择的实施方案中,将酶单独固定在单独的容器中,或其组合。在一些实施方案中,固定化酶经由过滤来分离或通过向固定化反应混合物添加缓冲液、蔗糖、ADP和底物来立即使用。
实施例26
用固定化AGT和/或ACSuS将甜菊苷转化为莱鲍迪苷A及糖溶液的再循环
在这个实施例中,描述了使用固定化AGT(例如SEQ ID NO:1290)和ACSuS(例如SEQID NO:158)将甜菊苷转化为莱鲍迪苷A及糖溶液再循环。向容器中添加固定化β-1,3-GT(例如SEQ ID NO:1290)和固定化SuS(例如SEQ ID NO:1158)。可选择地,在一些实施方案中,酶中的一种以固定化形式来使用,而另一种酶以溶液形式来使用。添加缓冲液、蔗糖、ADP和底物(即甜菊苷或Reb A 60)后,监测反应,直至达到期望的转化率。在一些实施方案中,产物和固定化酶通过过滤来分离。在一些实施方案中,固定化酶经由离心、粒度过滤或磁性回收被从产物进一步分离,并被重新使用。将糖滤液返回容器进行下次重复。
实施例27
用固定化AGT和/或ACSuS将莱鲍迪苷A转化为莱鲍迪苷D及糖溶液的再循环
在这个实施例中,描述了为了用固定化AGT和ACSuS从莱鲍迪苷A产生莱鲍迪苷D以及糖溶液再循环而进行的实验。向容器中添加固定化β-1,2-GT(例如SEQ ID NO:954)和固定化SuS(例如SEQ ID NO:1158)。可选择地,在一些实施方案中,酶中的一种以固定化形式来使用,而另一种酶以溶液形式来使用。添加缓冲液、蔗糖、ADP和底物(甜菊苷或Reb A 60)后,监测反应,直至达到期望的转化率。在一些实施方案中,产物和固定化酶通过过滤来分离。在一些实施方案中,固定化酶经由离心、粒度过滤或磁性回收被从产物进一步分离,并被重新使用。将糖滤液返回容器进行下次重复。
实施例28
用固定化AGT和/或ACSuS将莱鲍迪苷D转化为莱鲍迪苷M及糖溶液的再循环
在这个实施例中,描述了为了用固定化AGT和ACSuS从莱鲍迪苷D产生莱鲍迪苷M以及糖溶液再循环而进行的实验。向容器中添加固定化β-1,3-GT(例如SEQ ID NO:548)和固定化SuS(例如SEQ ID NO:1158)。可选择地,在一些实施方案中,酶中的一种以固定化形式来使用,而另一种酶以溶液形式来使用。添加缓冲液、蔗糖、ADP和Reb D后,监测反应,直至达到期望的转化率。在一些实施方案中,产物和固定化酶通过过滤来分离。在一些另外的实施方案中,固定化酶经由离心、粒度过滤或磁性回收被从产物进一步分离,并被重新使用。将糖滤液返回容器进行下次重复。
实施例29
用固定化AGT和ACSuS将甜菊苷转化为莱鲍迪苷A并将莱鲍迪苷A转化为莱鲍迪苷D及糖溶液的再循环
在这个实施例中,描述了为了用固定化AGT和ACSuS从甜菊苷产生莱鲍迪苷A并从莱鲍迪苷A产生莱鲍迪苷D以及糖溶液再循环而进行的实验。向容器中添加固定化β-1,3-GT(例如SEQ ID NO:1290)和β-1,2-GT(例如SEQ ID NO:954)及固定化SuS(例如SEQ ID NO:1158)。可选择地,这些酶中的一种或两种以固定化形式来使用,而其他酶以溶液形式来使用。添加缓冲液、蔗糖、ADP和底物(甜菊苷或Reb A 60)后,监测反应,直至达到期望的转化率。在一些实施方案中,产物和固定化酶通过过滤来分离。在一些实施方案中,固定化酶经由离心、粒度过滤或磁性回收被从产物进一步分离,并被重新使用。将糖滤液返回容器进行下次重复。
实施例30
用固定化AGT和ACSuS将甜菊苷转化为莱鲍迪苷A、将莱鲍迪苷A转化为莱鲍迪苷D并将莱鲍迪苷D转化为莱鲍迪苷M及糖溶液的再循环
向容器中添加固定化β-1,3-GT(例如SEQ ID NO:1290)、β-1,2-GT(例如SEQ IDNO:954)、β-1,3-GT(例如SEQ ID NO:548)和固定化SuS(例如SEQ ID NO:1158)。可选择地,在一些实施方案中,这些酶中的一种、两种或三种以固定化形式来使用,而其他酶以溶液形式来使用。添加缓冲液、蔗糖、ADP和底物(甜菊苷或Reb A 60)后,监测反应,直至达到期望的转化率。在一些实施方案中,产物和固定化酶通过过滤来分离。在一些实施方案中,固定化酶经由离心、粒度过滤或磁性回收被从产物进一步分离,并被重新使用。将糖滤液返回容器进行下次重复。
实施例31
SEQ ID NO:1222的蔗糖合酶变体
对由SEQ ID NO:1222编码的SuS的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有活性的第四轮(“第4轮”)的49种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷D的葡萄糖转移的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用250μL的pH7.5的Tris-HCl、和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 7.5的Tris-HCl中稀释20x。然后,将10μL稀释的SuS裂解物和2g/LGT SEQ ID NO:696(Rd8BB)在100μL反应体积中混合,并且底物载量为~1mM莱鲍迪苷D,且共底物载量为1mM ADP(Sigma,>95%)和10mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040004461
滴定板振荡器中以300RPM振荡2h。通过将10μL测定混合物添加到90μL具有0.2%甲酸的乙腈中将以上描述的反应淬灭,并通过离心沉淀。将上清液在水中稀释10x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。
Figure BDA0002229282040004462
Figure BDA0002229282040004471
分析后,鉴定出49种显示出与GT偶联的对莱鲍迪苷D的改进的活性的工程化SuS变体多肽。所得的工程化多肽在表31.2中列出。对于表31.3中示出的具有氨基酸突变的变体,如以下中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004481
Figure BDA0002229282040004491
Figure BDA0002229282040004501
产生摇瓶粉末(SFP)
将摇瓶程序用于产生糖基转移酶多肽摇瓶粉末(SFP),以用于在本文描述的生物催化方法中使用的表征测定。与HTP测定中使用的细胞裂解物相比,酶的摇瓶粉末(SFP)制品提供了更纯化的酶的制品(例如,多达总蛋白的30%),并且还允许使用更浓缩的酶溶液。将含有编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到含有30μg/ml氯霉素和1%葡萄糖的5mL Luria Bertani肉汤中。使细胞在培养箱中在30℃以250rpm振荡生长过夜(至少16小时)。在1L摇瓶中,在含有30μg/ml CAM的250mL Terrific肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾,pH 7.0,1mM MgSO4)中将培养物稀释至600nm的光密度(OD600)为0.2,并允许在30℃生长。
从蔗糖向莱鲍迪苷D的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第4轮SUS变体对蔗糖和ADP促进从莱鲍迪苷D形成莱鲍迪苷M的活性。将摇瓶粉末(SFP)以0.125g/L的浓度添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液、pH 7、3mM氯化镁、1g/L莱鲍迪苷D、10mM蔗糖、1mM ADP和2g/L GTSEQ ID NO:734。反应在
Figure BDA0002229282040004502
滴定板振荡器中在50℃以300RPM振荡1h来进行。通过将10μL的反应混合物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并通过离心沉淀。将上清液在水中稀释10x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。变体中的至少3种具有高于SEQ ID NO:1222的活性。相对于SEQ ID NO:1222,由变体从莱鲍迪苷D产生的莱鲍迪苷M的水平在表31.3中列出。相对于SEQ ID NO:1222,具有突变H47L、R93V、P358E、I372V、W375Y、R440P和K724H的变体(SEQ ID NO:1392)具有最高的活性。因此,选择编码多核苷酸(SEQ ID NO:1391)用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004511
实施例32
SEQ ID NO:1392的蔗糖合酶变体
对由SEQ ID NO:1391编码的SuS的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有活性的第五轮(“第5轮”)的86种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷D的葡萄糖转移的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 7.5的Tris-HCl中稀释25-60x。10μL稀释的SuS裂解物和2g/L GTSEQ ID NO:4684(Rd9BB)在100μL反应体积中,并且底物载量为~1mM莱鲍迪苷D,且共底物载量为1mM ADP(Sigma,>95%)和10mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040004521
滴定板振荡器中以300RPM振荡1h。通过将10μL测定物添加到90μL具有0.2%甲酸的乙腈中将以上描述的反应淬灭,并通过离心沉淀。将上清液在水中稀释10x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFireSPE-MS/MS来检测。
分析后,鉴定出86种显示出与GT偶联的对莱鲍迪苷D的改进的活性的工程化SuS变体多肽。所得的工程化多肽在表32.1中列出。对于表32.2中示出的具有氨基酸突变的变体,如以下中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004531
Figure BDA0002229282040004541
Figure BDA0002229282040004551
从蔗糖向莱鲍迪苷D的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第4轮SUS变体对蔗糖和ADP促进从莱鲍迪苷D形成莱鲍迪苷M的活性。将摇瓶粉末(SFP)以0.05g/L的浓度添加到100μL总反应混合物体积中,总反应混合物体积含有50mM磷酸钾缓冲液、pH 7、3mM氯化镁、1g/L莱鲍迪苷D、10mM蔗糖、1mMADP和2g/L GT SEQ ID NO:4684。反应在
Figure BDA0002229282040004561
滴定板振荡器中在50℃以300RPM振荡1-2h来进行。通过在水中稀释2.5x使反应物溶解,通过将10μL稀释的反应物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并通过离心沉淀。将上清液在水中稀释3.33x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。表32.2中的所有变体具有高于SEQ ID NO:1392的活性。相对于SEQ ID NO:1392,由变体从莱鲍迪苷D产生的莱鲍迪苷M的水平在表32.2中列出。选择具有相对于SEQ ID NO:1392的突变V68A、L98V、R129E、R154H和A635S的变体(SEQ ID NO:1455)用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004562
实施例33
SEQ ID NO:1456的蔗糖合酶变体
对由SEQ ID NO:1455编码的SuS的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有活性的第六轮(“第6轮”)的16种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 7.5的Tris-HCl中稀释30x。然后,将10μL稀释的SuS裂解物和1g/LGT SEQ ID NO:2814(Rd8BB)在100μL反应体积中混合,并且底物载量为4.5mM莱鲍迪苷A97,且共底物载量为0.25mM ADP(Sigma,>95%)和10mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6.5、50℃、在
Figure BDA0002229282040004571
滴定板振荡器中以300RPM振荡1h。以上描述的反应通过将10μL测定混合物添加到90μL水中来溶解,通过将10μL溶解的测定混合物添加到90μL具有0.2%甲酸的乙腈中来淬灭,并通过离心沉淀。将上清液在水中稀释7.3x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。
分析后,鉴定出16种显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽。所得的工程化多肽在表33.1中列出。对于表33.2中示出的具有氨基酸突变的变体,如实施例31中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004581
从蔗糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第6轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。将摇瓶粉末(SFP)以0.01g/L的浓度添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液、pH 6.5、4.5mM莱鲍迪苷A 97、30mM蔗糖、0.25mM ADP和1g/L GTSEQ ID NO:2814。反应在
Figure BDA0002229282040004582
滴定板振荡器中在50℃以300RPM振荡1-2h来进行。通过在水中稀释2.5x使反应物溶解,通过将10μL稀释的反应物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并通过离心沉淀。将上清液在水中稀释4.4x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。变体中的至少4种具有高于SEQ IDNO:1456的活性。相对于SEQ ID NO:1456,由变体从莱鲍迪苷A产生的莱鲍迪苷D的水平在表33.2中列出。选择具有相对于SEQ ID NO:1456的突变Y17D、G54D、S161T、F519T、L727E和A738E的变体(SEQ ID NO:1582)用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004591
实施例34
SEQ ID NO:1582的蔗糖合酶变体
对由SEQ ID NO:1581编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有活性的第七轮(“第7轮”)的87种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将组合文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH 7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 7.5的Tris-HCl中稀释~90x。然后,将10μL稀释的SuS裂解物和1g/L GT SEQ ID NO:2884(Rd9BB)在100μL反应体积中混合,并且底物载量为4.5-7.5mM莱鲍迪苷A 97,且共底物载量为0.2-0.25mM ADP(Sigma,>95%)和30mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、55℃、在
Figure BDA0002229282040004601
滴定板振荡器中以300RPM振荡2h。以上描述的反应通过将10μL测定物添加到90-190μL水中来溶解,通过将10μL溶解的测定物添加到90μL具有0.2%甲酸的乙腈中来淬灭,并通过离心沉淀。将上清液在水中稀释4.4-6.7x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。
分析后,鉴定出87种显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽。所得的工程化多肽在表34.1中列出。对于表34.2中示出的具有氨基酸突变的变体,如实施例31中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004611
Figure BDA0002229282040004621
Figure BDA0002229282040004631
从蔗糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第7轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。将摇瓶粉末(SFP)以0.02g/L的浓度添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液、pH 6、7.5mM莱鲍迪苷A 97、30mM蔗糖、0.2mM ADP和1g/L GT SEQID NO:2884。反应在
Figure BDA0002229282040004641
滴定板振荡器中在50℃以300RPM振荡1h来进行。通过在水中稀释20x使反应物溶解,通过将10μL稀释的反应物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭,并通过离心沉淀。将上清液在水中稀释4.4x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。变体中的至少3种具有高于SEQ ID NO:1582的活性。相对于SEQ ID NO:1582,由变体从莱鲍迪苷A产生的莱鲍迪苷D的水平在表34.2中列出。选择具有相对于SEQ ID NO:1582的突变F160W、Q381S、R550Q、L636Q和A681V的变体(SEQ ID NO:1764)用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004642
实施例35
SEQ ID NO:1764的蔗糖合酶变体
对由SEQ ID NO:1763编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有活性的第八轮和第九轮(“第8轮”和“第9轮”)的24种工程化SuS变体多肽。
第8轮的从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将组合文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH 7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 7.5的Tris-HCl中稀释15x。然后,将10μL稀释的SuS裂解物和1g/LGT SEQ ID NO:2884(Rd9BB)在100μL反应体积中混合,并且底物载量为15mM莱鲍迪苷A 97,且共底物载量为0.2mM ADP(Sigma,>93%)和45mM蔗糖(sucrose)(蔗糖(cane sugar))。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、55℃、在
Figure BDA0002229282040004651
滴定板振荡器中以300RPM振荡2h。以上描述的反应通过将10μL测定物添加到390μL水中来溶解,通过将20μL溶解的测定物添加到180μL具有0.2%甲酸的乙腈中来淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。相对于SEQ ID NO:1764,未鉴定出大幅改进的组合变体,因此使用相同的骨架产生了另一组组合及饱和诱变文库,并且将这一组称为“第9轮”。
第9轮的从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将组合文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH 7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将未稀释的裂解物(饱和诱变文库)或32x(第9轮组合文库)添加到pH 7.5的Tris-HCl中。将第9轮文库裂解物在62℃预孵育1h(组合文库)或3.75h(饱和诱变文库),以热挑战酶。然后,将10μL稀释的SuS裂解物和1g/L GT SEQ ID NO:3244(Rd12B)在100μL反应体积中混合,并且底物载量为15mM莱鲍迪苷A 97,共底物载量为0.2mM ADP(Sigma,>95%)和45mM蔗糖(蔗糖)及9mM果糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040004652
滴定板振荡器中以300RPM振荡2-3h。以上描述的反应通过将10μL测定物添加到390μL水中来溶解,通过将20μL溶解的测定物添加到180μL具有0.2%甲酸的乙腈中来淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出24种显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽。所得的工程化多肽在表35.1中列出。对于表35.2中示出的具有氨基酸突变的变体,如实施例31中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004661
Figure BDA0002229282040004671
从蔗糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第9轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。将摇瓶粉末(SFP)以0.006-0.2g/L的浓度添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液、pH 6、15mM莱鲍迪苷A(>97%纯度)、45mM蔗糖、9mM果糖、0.2mMADP和1g/L GT SEQ ID NO:3244。反应在
Figure BDA0002229282040004681
滴定板振荡器中在50℃以300RPM振荡2h来进行,无预孵育,或者在60℃反应2h之前将SFP在pH 6的磷酸钾缓冲液中在62℃以10x终浓度预孵育1h。通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释10x将反应淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。表35.2中列出的所有8种变体具有高于SEQ ID NO:1764的活性。具有相对于SEQ ID NO:1764的突变G181N、A548P、H705P的变体(SEQ ID NO:1804)具有最有益的突变,并被选择用于催化将葡糖基从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004682
实施例36
SEQ ID NO:1804的蔗糖合酶变体
对由SEQ ID NO:1803编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有增加的活性的第十轮(“第10轮”)的82种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 6.0的磷酸钾缓冲液中稀释20x,并在64℃(组合文库)或65℃(饱和诱变文库)预孵育15分钟。然后,将10μL稀释的SuS裂解物和0.5-1g/L GT SEQ ID NO:3696或3502分别用于具有15mM莱鲍迪苷A(>97%纯度)、0.2mM ADP(Sigma,>93%)、45mM蔗糖(蔗糖)和9mM果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040004691
滴定板振荡器中以300RPM振荡3h。以上描述的反应通过在水中稀释40x来溶解,通过在具有0.2%甲酸的乙腈中稀释10x来淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽,并在表36.1中列出。对于表36.2中示出的具有氨基酸突变的变体,如实施例31中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004701
Figure BDA0002229282040004711
Figure BDA0002229282040004721
Figure BDA0002229282040004731
从蔗糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第10轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。使摇瓶粉末(SFP)在pH 6的磷酸钾缓冲液中达到0.06-2g/L,并且将等分试样在热循环器中在64℃预孵育15分钟。然后,将10μL的预孵育的或未预孵育的这些SFP稀释液添加到含有pH 6的50mM磷酸钾缓冲液、15mM莱鲍迪苷A(>97%纯度)、45mM蔗糖、9mM果糖、0.2mM ADP和1g/L GT SEQ ID NO:3696的100μL总反应体积中。对于未预孵育的SFP样品,反应在55℃在
Figure BDA0002229282040004732
滴定板振荡器中以300RPM振荡3h来进行,并且对于预孵育的SFP,反应在60℃在
Figure BDA0002229282040004733
滴定板振荡器中以300RPM振荡3h来进行。通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释10x将反应淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。在预孵育的条件下,表36.2中列出的所有7种变体具有高于SEQ ID NO:1804的活性,并且除一种以外,所有变体在55℃条件下也具有更高的活性。相对于SEQ IDNO:1804,具有突变P517A和V681A的变体(SEQ ID NO:1840)在两种条件下改进最大,因此选择它用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004741
实施例37
SEQ ID NO:1840的蔗糖合酶变体
对由SEQ ID NO:1839编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有增加的活性的第十一轮(“第11轮”)的167种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 6.0的磷酸钾缓冲液中稀释10-20x,并在66℃预孵育15分钟。然后,将10μL稀释的预孵育的SuS裂解物和0.5g/L GT SEQ ID NO:3696或3956用于具有15mM莱鲍迪苷A(>97%纯度)、0.2mM ADP(Amresco,>93%)、45mM蔗糖(蔗糖)和9mM果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040004751
滴定板振荡器中以300RPM振荡4h。以上描述的反应通过在水中稀释40x来溶解,通过在具有0.2%甲酸的乙腈中稀释5-10x来淬灭,并通过离心沉淀。将上清液在水中稀释至~10μM甜菊醇糖苷,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽,并在表37.1和表37.2中列出。对于表37.3中示出的具有氨基酸突变的变体,如实施例31中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004761
Figure BDA0002229282040004771
Figure BDA0002229282040004781
Figure BDA0002229282040004782
Figure BDA0002229282040004791
Figure BDA0002229282040004801
Figure BDA0002229282040004811
从蔗糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第11轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。使摇瓶粉末(SFP)在pH 6的磷酸钾缓冲液中达到0.03-1g/L,并且将等分试样在热循环器中在66℃预孵育15分钟。然后,将10μL的预孵育的或未预孵育的这些SFP稀释液添加到含有pH 6的50mM磷酸钾缓冲液、15mM莱鲍迪苷A(>97%纯度)、45mM蔗糖、9mM果糖、0.2mM ADP和0.5g/L GT SEQ ID NO:3956的100μL总反应体积中。对于未预孵育的SFP样品,反应在55℃在
Figure BDA0002229282040004821
滴定板振荡器中以300RPM振荡4h来进行,并且对于预孵育的SFP,反应在60℃在
Figure BDA0002229282040004822
滴定板振荡器中以300RPM振荡4h来进行。通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释10x将反应淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。在预孵育的条件下,表37.3中列出的所有8种变体具有高于SEQ ID NO:1840的活性,并且除三种以外,所有变体在55℃条件下也具有更高的活性。相对于SEQ IDNO:1840,在两种条件下改进最大的具有突变D17R、D52P、L388K、G589S、E738S和D765S的变体(SEQ ID NO:2064)被选择用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004831
实施例38
SEQ ID NO:2064的蔗糖合酶变体
对由SEQ ID NO:2063编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有增加的活性的第十二轮(“第12轮”)的92种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在pH 6.0的磷酸钾缓冲液中稀释10x,并在68℃预孵育15分钟。然后,将10μL稀释的预孵育的SuS裂解物和0.5g/L GT SEQ ID NO:3956或4256用于具有15mM莱鲍迪苷A(>97%纯度)、0.2mM ADP(Amresco,>93%)、37.5mM蔗糖(蔗糖)和9mM果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040004841
滴定板振荡器中以300RPM振荡4h。以上描述的反应通过在水中稀释40x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释7.5x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽,并在表38.1和表38.2中列出。对于表38.3中示出的具有氨基酸突变的变体,如实施例31中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004842
Figure BDA0002229282040004851
Figure BDA0002229282040004861
Figure BDA0002229282040004862
Figure BDA0002229282040004871
从蔗糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第12轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。使摇瓶粉末(SFP)在pH 6的磷酸钾缓冲液中达到0.03-1g/L,并且将等分试样在热循环器中在68℃预孵育15分钟。然后,将10μL的预孵育的或未预孵育的这些SFP稀释液添加到含有pH 6的50mM磷酸钾缓冲液、15mM莱鲍迪苷A(>97%纯度)、37.5mM蔗糖、9mM果糖、0.2mM ADP和0.5g/L GT SEQ ID NO:4256的100μL总反应体积中。对于未预孵育的SFP样品,反应在55℃在
Figure BDA0002229282040004881
滴定板振荡器中以300RPM振荡4h来进行,并且对于预孵育的SFP,反应在60℃在
Figure BDA0002229282040004882
滴定板振荡器中以300RPM振荡4h来进行。通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释10x将反应淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。进一步的热稳定性表征用冻干之前的澄清摇瓶裂解物来如下进行:将裂解物在缓冲液中稀释400x,并在热循环器中以55-70℃的梯度孵育16-18h。为了确定剩余的活性%,如以上描述的将预孵育的裂解物在55℃用甜菊苷或莱鲍迪苷D孵育4h来测定。剩余活性百分比表示为在高温度的活性除以在最低预孵育温度的活性。在预孵育的条件下,表38.3中列出的所有7种变体具有高于SEQ ID NO:2064的活性,并且两种在55℃条件下也不太受损。相对于SEQ ID NO:2064,在所有条件下有改进并且包含来自第10轮饱和诱变筛选的最高的(top)突变的具有突变P57W、L562I和R711K的变体(SEQ ID NO:2432)被选择用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的进一步定向演化。
Figure BDA0002229282040004891
实施例39
SEQ ID NO:2432的蔗糖合酶变体
对由SEQ ID NO:2431编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的活性相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有增加的活性的第十三轮(“第13轮”)的46种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。对于组合文库,将裂解物在pH 6.0的磷酸钾缓冲液中稀释10x,并在73℃预孵育15分钟。对于饱和诱变文库,将裂解物在pH 6.0的磷酸钾缓冲液中稀释20x,并在62℃预孵育17.5小时。然后,将10μL稀释的、预孵育的SuS裂解物和0.5g/L GT SEQ ID NO:4256或4550用于具有15mM莱鲍迪苷A(>97%纯度)、0.2mM ADP(Amresco,>93%)、37.5mM蔗糖(蔗糖)和9mM果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040004901
滴定板振荡器中以300RPM振荡3-4h。以上描述的反应通过在水中稀释40x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释7.5x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽,并在表39.1和表39.2中列出。对于表39.3中示出的具有氨基酸突变的变体,如实施例31中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004911
Figure BDA0002229282040004921
Figure BDA0002229282040004931
从蔗糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了实验以表征工程化第13轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。使摇瓶粉末(SFP)在pH 6的磷酸钾缓冲液中达到0.03-1g/L,并且将等分试样在热循环器中在73℃预孵育15分钟。然后,将10μL的预孵育的或未预孵育的这些SFP稀释液添加到含有pH 6的50mM磷酸钾缓冲液、15mM莱鲍迪苷A(>97%纯度)、37.5mM蔗糖、9mM果糖、0.2mM ADP和0.5g/L GT SEQ ID NO:4550的100μL总反应体积中。对于未预孵育的SFP样品,反应在55℃在
Figure BDA0002229282040004932
滴定板振荡器中以300RPM振荡4h来进行,并且对于预孵育的SFP,反应在60℃在
Figure BDA0002229282040004933
滴定板振荡器中以300RPM振荡4h来进行。通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,并通过离心沉淀。将上清液在水中稀释3.3x,并且用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS分析甜菊醇糖苷。进一步的热稳定性表征用冻干之前的澄清摇瓶裂解物来如下进行:将裂解物在缓冲液中稀释400x,并在热循环器中以62-78℃的梯度孵育16.7h。为了确定剩余活性百分比,如以上描述的将预孵育的裂解物在60℃用甜菊苷或莱鲍迪苷D孵育4h来测定。剩余活性百分比表示为在高温度的活性除以在最低预孵育温度的活性。在至少一种条件下,表39.3中列出的所有8种变体具有高于SEQ ID NO:2432的活性,并且五种在所有条件下有改进。相对于SEQ ID NO:2432,在所有条件下有改进的具有突变Q33H、L47P、E59A、P81L、S175G、P530F、E534W、Q550I和R606M的变体(SEQ ID NO:2510)被选择作为用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的最佳的酶。
Figure BDA0002229282040004951
实施例40
SEQ ID NO:2510的蔗糖合酶变体
对由SEQ ID NO:2509编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有增加的活性的第十四轮(“第14轮”)的164种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A 60的葡萄糖转移以形成莱鲍迪苷M的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在具有14.5g/L RebA60的pH 6.0的磷酸钾缓冲液中稀释35x,并在73℃预孵育15分钟。然后,将10μL稀释的、预孵育的SuS裂解物、0.08g/Lβ1,2GT SFP SEQ ID NO:4550和0.2g/Lβ1,3GT SFP SEQ ID NO:6864用于具有20g/L RebA60、0.1g/L ADP(Amresco,超纯级)、40g/L蔗糖(蔗糖)和9.6g/L果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040004961
滴定板振荡器中以300RPM振荡16-18h。以上描述的反应通过在水中稀释40x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释15x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽,并在表40.1和表40.2中列出。对于表40.3中示出的具有氨基酸突变的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040004971
Figure BDA0002229282040004981
Figure BDA0002229282040004991
Figure BDA0002229282040005001
Figure BDA0002229282040005002
Figure BDA0002229282040005011
Figure BDA0002229282040005021
Figure BDA0002229282040005031
从蔗糖向莱鲍迪苷A 60的葡糖基转移以形成莱鲍迪苷M的摇瓶粉末表征测定和分析
进行了实验以表征工程化第14轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。使摇瓶粉末(SFP)在pH 6的磷酸钾缓冲液中的14.5g/L RebA60中达到0.03-1g/L,并且将等分试样在热循环器中在73℃预孵育15分钟。然后,将10μL稀释的、预孵育的SuS裂解物、0.08g/Lβ1,2GT SFP SEQ ID NO:4550和0.2g/Lβ1,3GT SFP SEQ ID NO:6864用于具有20g/L RebA60、0.1g/L ADP(Amresco,超纯级)、40g/L蔗糖(蔗糖)和9.6g/L果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005032
滴定板振荡器中以300RPM振荡16-18h。以上描述的反应通过在水中稀释40x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释15x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。表40.3中列出的所有8种变体具有高于SEQ ID NO:2510的活性。相对于SEQ ID NO:2510改进最大的具有突变A41K、G112Q、G485S和F684H的变体(SEQ ID NO:7506)被选择作为用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的最佳的酶。
Figure BDA0002229282040005041
实施例41
SEQ ID NO:7506的蔗糖合酶变体
对由SEQ ID NO:7505编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有增加的活性的第十五轮(“第15轮”)的56种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A 60的葡萄糖转移以形成莱鲍迪苷M的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在具有14.5g/L RebA60的pH 6.0的磷酸钾缓冲液中稀释50x,并在73℃预孵育15分钟。然后,将10μL稀释的、预孵育的SuS裂解物、0.08g/Lβ1,2GT SFP SEQ ID NO:4550和0.2g/Lβ1,3GT SFP SEQ ID NO:6864用于具有20g/L RebA60、0.1g/L ADP(Amresco,超纯级)、40g/L蔗糖(蔗糖)和9.6g/L果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005051
滴定板振荡器中以300RPM振荡16-18h。以上描述的反应通过在水中稀释20x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释20x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽,并在表41.1中列出。对于表41.2中示出的具有氨基酸突变的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040005061
Figure BDA0002229282040005071
Figure BDA0002229282040005081
从蔗糖向莱鲍迪苷A 60的葡糖基转移以形成莱鲍迪苷M的摇瓶粉末表征测定和分析
进行了实验以表征工程化第15轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷D的活性。使摇瓶粉末(SFP)在pH 6的磷酸钾缓冲液中的14.5g/L RebA60中达到0.03-1g/L,并且将等分试样在热循环器中在73℃预孵育15分钟。将10μL稀释的、预孵育的SuS裂解物、0.08g/Lβ1,2GT SFP SEQ ID NO:4550和0.2g/Lβ1,3GT SFP SEQ ID NO:6864用于具有20g/L RebA60、0.1g/L ADP(Amresco,超纯级)、40g/L蔗糖(蔗糖)和9.6g/L果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005082
滴定板振荡器中以300RPM振荡16-18h。以上描述的反应通过在水中稀释20x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释20x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。表41.2中列出的所有8种变体具有高于SEQ ID NO:7506的活性。相对于SEQ ID NO:7506改进最大的具有突变D42T、I480V、L561I和H724K的变体(SEQ ID NO:8420)被选择作为用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的最佳的酶。
Figure BDA0002229282040005091
实施例42
SEQ ID NO:8420的蔗糖合酶变体
对由SEQ ID NO:8419编码的蔗糖合酶的定向演化通过构建变体基因文库来继续进行,其中将与演化的早先轮中的改进的产量相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖的产生具有增加的活性的第十六轮(“第16轮”)的155种工程化SuS变体多肽。
从蔗糖向ADP向莱鲍迪苷A 60的葡萄糖转移以形成莱鲍迪苷M的HTP偶联测定
将文库使用以下HTP酶偶联测定来筛选。将沉淀的大肠杆菌培养物用400μL的pH7.5的Tris-HCl和1mM硫酸镁及0.5mg/mL溶菌酶以及硫酸多粘菌素B(PMBS)裂解,并通过离心澄清。将裂解物在具有14.5g/L RebA60的pH 6.0的磷酸钾缓冲液中稀释30x,并在75℃预孵育1小时。然后,将10μL稀释的、预孵育的SuS裂解物、0.08g/Lβ1,2GT SFP SEQ ID NO:7784和0.2g/Lβ1,3GT SFP SEQ ID NO:8088用于具有20g/L RebA60、0.025g/LADP(Amresco,超纯级)、40g/L蔗糖(蔗糖)和9.6g/L果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005101
滴定板振荡器中以300RPM振荡16-18h。以上描述的反应通过在水中稀释20x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释20x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。分析后,鉴定出显示出与GT偶联的对莱鲍迪苷A的改进的活性的工程化SuS变体多肽,并在表42.1中列出。对于表42.2中示出的具有氨基酸突变的变体,如实施例1中描述的生长摇瓶规模的培养物用于蛋白表征。
Figure BDA0002229282040005111
Figure BDA0002229282040005121
Figure BDA0002229282040005131
Figure BDA0002229282040005141
Figure BDA0002229282040005151
Figure BDA0002229282040005161
从蔗糖向莱鲍迪苷A 60的葡糖基转移以形成莱鲍迪苷M的摇瓶粉末表征测定和分析
进行了实验以表征工程化第16轮SUS变体对蔗糖和ADP促进从莱鲍迪苷A形成莱鲍迪苷M的活性。使摇瓶粉末(SFP)在pH 6的磷酸钾缓冲液中的14.5g/L RebA60中达到0.03-1g/L,并且将等分试样在75℃预孵育1小时。将10μL稀释的预孵育或未预孵育的SuS裂解物、0.08g/Lβ1,2GT SFP SEQ ID NO:7784和0.2g/Lβ1,3GT SFP SEQ ID NO:8088用于具有20g/L RebA60、0.025g/L ADP(Amresco,超纯级)、40g/L蔗糖(蔗糖)和9.6g/L果糖的100μL反应体积。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005162
滴定板振荡器中以300RPM振荡16-18h。以上描述的反应通过在水中稀释20x来溶解,通过在具有0.2%甲酸的乙腈中稀释5x来淬灭,并通过离心沉淀。将上清液在水中稀释20x,并且甜菊醇糖苷产物用表31.1中描述的仪器和参数通过RapidFire SPE-MS/MS来检测。表42.2中列出的所有8种变体在预孵育后具有高于SEQ ID NO:8420的产量。相对于SEQ ID NO:8420改进最大的具有突变D12S、R136Q、R139K、A517P、G603Q、L630M、A642V和V756C的变体(SEQ ID NO:8910)被选择作为用于催化将葡萄糖从蔗糖转移到ADP的再循环反应的最佳的酶。
Figure BDA0002229282040005171
实施例43
SEQ ID NO:1054的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:1054衍生的GT多肽(β1,2GT)的演化和筛选的实验。对由SEQ ID NO:1053编码的GT的定向演化通过构建文库来进行,其中将与先前轮中改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第五轮(“第5轮”)的26种工程化GT变体多肽。
从ADP-葡萄糖向莱鲍迪苷A的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:1053变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释4倍。测定用10μL稀释的裂解物在100μL反应体积中来进行,并且底物载量为1mM莱鲍迪苷A(>97%纯度),以及共底物载量为1mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040005181
滴定板振荡器中以300RPM振荡1h。将反应在水中以1:5稀释,并且然后通过将25μL稀释的测定物添加到75μL具有0.2%甲酸的乙腈中来淬灭。所得的混合物通过在4℃离心10m来沉淀。将上清液在水中以1:5稀释,并且通过如表31.1中描述的RapidFireSPE-MS/MS分析。鉴定了从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D的糖基转移酶变体多肽,并且工程化多肽在表43.1中列出。对于表43.2中列出的变体,如实施例31中描述的生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005191
Figure BDA0002229282040005201
从ADP-葡萄糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第5轮变体对莱鲍迪苷A的活性。将0.006-0.2g/L水平的摇瓶粉末(SFP)添加到100μL总反应体积中,总反应体积含有50mM磷酸钾缓冲液、pH 7、3mM MgCl2、1mM莱鲍迪苷A和1mM ADP-葡萄糖。反应在
Figure BDA0002229282040005202
滴定板振荡器中在50℃以300RPM持续1h来进行。将反应在水中以1:5稀释,并且然后通过将25μL稀释的测定物添加到75μL具有0.2%甲酸的乙腈中来淬灭,并通过在4℃离心10m来沉淀。将上清液在水中以1:5稀释,并通过RapidFire SPE-MS/MS分析甜菊醇糖苷。第5轮变体以0.05g/L SFP载量对莱鲍迪苷A的活性在表43.2中列出。表43.2中列出的所有6种变体具有高于SEQ ID NO:1054的活性。选择具有突变E24L、N162R、E198P、M201G、T211E、W226V、L323V和L351M的变体(SEQ ID NO:2600)及其编码多核苷酸(SEQ ID NO:2599)用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005211
实施例44
用于将莱鲍迪苷I葡糖基化为莱鲍迪苷M的SEQ ID NO:1002的糖基转移酶变体
在这个实施例中,描述了为了甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:1002衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:1001编码的GT的定向演化通过构建变体基因文库来进行,其中将与先前轮中改进的对莱鲍迪苷I的糖基转移酶活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对UDP-葡萄糖和莱鲍迪苷I具有葡糖基转移酶活性的一轮(第5轮RebI)工程化GT变体多肽。
从UDP-葡萄糖向莱鲍迪苷I的葡萄糖转移的HTP测定
将细胞用250μL裂解缓冲液裂解。对96孔板的澄清的表达SEQ ID NO:1002变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,并且底物载量为1mM莱鲍迪苷I,以及共底物载量为1mM UDP-葡萄糖(Sigma,>98%纯度)。使用了以下反应条件:50mM KPhos缓冲液、pH 7、3mM MgCl2、40℃、在
Figure BDA0002229282040005212
滴定板振荡器中以300RPM振荡18h。通过将10μL的测定物添加到90μL具有0.2%甲酸的乙腈中将反应淬灭。所得混合物通过在4℃离心10m来沉淀。将上清液在水中以1:5稀释,并且通过如表44.1中描述的LC-MS/MS分析。鉴定以大于SEQ ID NO:1002的量从莱鲍迪苷I和UDP-葡萄糖产生莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表44.2中列出。
Figure BDA0002229282040005221
Figure BDA0002229282040005231
Figure BDA0002229282040005232
实施例45
SEQ ID NO:2600的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:2600衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:2599编码的GT的定向演化通过构建变体基因文库来进行。文库重组了与酶的表面残基相关的突变和与先前轮中改进的活性相关的有益突变,组合掺入了来自公开可获得的数据库中的同源物的多样性,或使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第六轮(“第6轮”)的工程化GT变体多肽。从重组的有益突变和同源物多样性鉴定出二十四种工程化变体(表45.1),并从饱和诱变鉴定出21种(表45.2)。
从ADP-葡萄糖向莱鲍迪苷A的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:2600变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释40倍。测定用10μL稀释的裂解物在100μL反应体积中来进行,并且底物载量为1mM莱鲍迪苷A(>97%纯度),以及共底物载量为1mM ADP-葡萄糖(Sigma,>93%纯度)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 7、3mM MgCl2、45℃、在
Figure BDA0002229282040005241
滴定板振荡器中以300RPM振荡1h。将反应在水中以1:5稀释,并且然后通过将25μL稀释的测定物添加到75μL具有0.2%甲酸的乙腈中来淬灭。所得混合物通过在4℃离心10m来沉淀。将上清液在水中以1:5稀释,并通过RapidFire SPE-MS/MS分析。从莱鲍迪苷A和ADP-葡萄糖产生莱鲍迪苷D并从组合文库鉴定出的工程化变体在表45.1中列出。将来自饱和诱变文库的前84种变体如以上描述的在50℃以一式三份重新测试。所得的工程化GT变体多肽在表45.2中列出。对于表45.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005251
Figure BDA0002229282040005261
从ADP-葡萄糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验,以表征工程化第6轮变体对莱鲍迪苷A的活性。实验按实施例40中描述的以0.003-0.1g/L的水平的SFP来进行。第6轮变体以0.025g/LSFP载量对莱鲍迪苷A的转化在表45.3中列出。表45.3中列出的所有5种变体具有高于SEQID NO:2600的活性。选择具有突变H2-、H7E、A12S、R15K、P175S、T260V和E318D的变体(SEQID NO:2718)及其编码多核苷酸(SEQ ID NO:2717)用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005271
实施例46
SEQ ID NO:2718的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:2718衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:2717编码的GT的定向演化通过构建变体基因的组合文库来进行,其中将与先前轮中改进的活性或表达相关的有益突变重组。另一个文库使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第七轮(“第7轮”)的工程化GT变体多肽。从重组的有益突变鉴定出二十五种工程化变体(表46.1),并从饱和诱变鉴定出29种工程化变体(表46.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:2717变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释10倍。为了筛选其中重组了来自先前轮的有益突变的文库,用10μL稀释的裂解物和0.2g/L SUS SFP SEQ ID NO:1392在100μL反应体积中进行了测定,并且底物载量为7.5mM莱鲍迪苷A,以及共底物载量为1mM ADP(Sigma,>95%)和15mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6.5、50℃、在
Figure BDA0002229282040005281
滴定板振荡器中以300RPM振荡2h。将反应在水中以1:10稀释,并且然后通过将10μL稀释的测定物添加到90μL具有0.2%甲酸的乙腈中来淬灭。所得混合物通过在4℃离心10m来沉淀。将上清液在水中以1:10稀释,并且通过如表31.1中描述的RapidFire SPE-MS/MS分析。对于剩余的两个第7轮文库,除了使用0.2g/L SUS SFP SEQ ID NO:1456SFP和30mM蔗糖以外,筛选按以上描述的来进行。具有来自重组的有益突变的与SuS偶联的对莱鲍迪苷A的葡糖基转移酶活性的工程化变体在表46.1中列出。除了使用0.8mM ADP以外,使用以上描述的程序,将来自饱和诱变文库的最高的变体以一式三份来重新测试,并将反应在水中以1:20稀释,并且然后通过将20μL稀释的测定物添加到向80μL具有0.2%甲酸的乙腈中来淬灭。所得的工程化GT变体多肽在表46.2中列出。对于表46.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005291
Figure BDA0002229282040005301
Figure BDA0002229282040005311
Figure BDA0002229282040005321
从ADP-葡萄糖向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第7轮变体对莱鲍迪苷A的活性。将0.002-0.2g/L水平的摇瓶粉末(SFP)添加到含有50mM磷酸钾缓冲液、pH 6.5、2mM莱鲍迪苷A和2mM ADP-葡萄糖的100μL总反应体积中。反应在
Figure BDA0002229282040005322
滴定板振荡器中在50℃以300RPM持续1h来进行。将反应在水中以1:5稀释,并且然后通过将25μL稀释的测定物添加到75μL具有0.2%甲酸的乙腈中来淬灭,并通过在4℃离心10m来沉淀。将上清液在水中以1:10稀释,并通过RapidFire SPE-MS/MS分析甜菊醇糖苷。第7轮变体以0.025g/L SFP载量对莱鲍迪苷A的转化在表46.3中示出。表46.3中列出的所有7种变体具有高于SEQ ID NO:2718的活性。选择具有突变K14R、I56K、R194P、I238M、I315V、F325M、A326V、P329A、R330H和E399Q的变体(SEQ ID NO:2814)及其编码多核苷酸(SEQ ID NO:2813)用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005331
实施例47
SEQ ID NO:2814的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:2814衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:2813编码的GT的定向演化通过构建变体基因的组合文库来进行,其中将与先前轮中改进的活性相关的有益突变重组,并且其中使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第八轮(“第8轮”)的工程化GT变体多肽。从重组的有益突变鉴定出十六种工程化变体(表47.1),并从饱和诱变鉴定出18种(表47.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:2813变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释20倍。为了筛选其中重组了来自先前轮的有益突变的文库,用10μL稀释的裂解物和0.2g/L SUS SFP SEQ ID NO:1456在100μL反应体积中进行了测定,并且底物载量为7.5mM莱鲍迪苷A,以及共底物载量为0.4mM ADP(Sigma,>95%)和30mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6.5、50℃、在
Figure BDA0002229282040005341
滴定板振荡器中以300RPM振荡1h。将反应在水中以1:20稀释,并且然后通过将20μL稀释的测定物添加到80μL具有0.2%甲酸的乙腈中来淬灭。所得混合物通过在4℃离心10m来沉淀。将上清液在水中以1:10稀释,并通过RapidFire SPE-MS/MS分析。具有与SuS偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表47.1中列出。对于第8轮饱和诱变文库,筛选按以上描述的来进行,除了使用0.2g/L SUS SFP SEQ ID NO:1582、0.2mMADP和以下反应条件以外:50mM磷酸钾缓冲液、pH 6、55℃、在
Figure BDA0002229282040005342
滴定板振荡器中以300RPM振荡2h。除了使用0.15g/L SUS SFP SEQ ID NO:1582以外,使用相同的测定条件,对来自这个文库的前56种变体以一式三份重新测试。所得的工程化GT变体多肽在表47.2中列出。对于表47.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005351
Figure BDA0002229282040005361
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第8轮变体对莱鲍迪苷A的活性。将0.002-0.2g/L水平的摇瓶粉末(SFP)添加到含有50mM磷酸钾缓冲液、pH 6.5、8mM莱鲍迪苷A、0.4mM ADP、30mM蔗糖和0.2g/L SUS SFP SEQ ID NO:1456的100μL总反应体积中。反应在
Figure BDA0002229282040005371
滴定板振荡器中在50℃以300RPM持续1h来进行。将反应在水中以1:20稀释,并且然后通过将20μL稀释的测定物添加到80μL具有0.2%甲酸的乙腈中来淬灭,并通过在4℃离心10m来沉淀。将上清液在水中以1:10稀释,并通过RapidFire SPE-MS/MS分析甜菊醇糖苷。第8轮变体以0.1g/L SFP载量对莱鲍迪苷A的转化在表47.3中示出。表47.3中列出的所有8种变体具有高于SEQ ID NO:2814的活性。选择具有突变N31R和D388E的变体(SEQID NO:2884)及其编码多核苷酸(SEQ ID NO:2883)用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005372
实施例48
SEQ ID NO:2884的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:2884衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:2883编码的GT的定向演化通过构建变体基因的组合文库来进行,其中将与先前轮中改进的活性相关的有益突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第九轮(“第9轮”)的33种工程化GT变体多肽。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:2883变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释20倍。用10μL稀释的裂解物和0.15g/L SUSSFP SEQ ID NO:1582在100μL反应体积中进行了测定,并且底物载量为7.5mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和24mM蔗糖(Sigma)。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、55℃、在
Figure BDA0002229282040005381
滴定板振荡器中以300RPM振荡2h。将反应按以上描述的稀释、淬灭及分析。具有与SuS偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表48.1中列出。对于表48.2中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005382
Figure BDA0002229282040005391
Figure BDA0002229282040005401
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第9轮变体对莱鲍迪苷A的活性。将0.002-0.2g/L水平的摇瓶粉末(SFP)添加到含有50mM磷酸钾缓冲液、pH 6、8mM莱鲍迪苷A、0.4mM ADP、24mM蔗糖和0.15g/L SUS SFP SEQ ID NO:1582的100μL总反应体积中。反应在55℃在
Figure BDA0002229282040005402
滴定板振荡器中以300RPM持续1h来进行。将反应按以上描述的稀释、淬灭及分析。第9轮变体以0.05g/L SFP载量对莱鲍迪苷A的转化在表48.2中示出。表48.2中列出的所有6种变体具有高于SEQ ID NO:2884的活性。具有突变S11Q、E65N、H132Q、N135L、N138G、S223T和N391R的变体(SEQ ID NO:3016)及其编码多核苷酸(SEQ ID NO:3015)改进最大,并被选择用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005411
实施例49
SEQ ID NO:3016的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:3016衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3015编码的GT的定向演化通过构建变体基因文库来进行。文库重组了与先前轮中改进的活性相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十轮(“第10轮”)的工程化GT变体多肽。从重组的有益突变鉴定出四十种工程化变体(表49.1),并从饱和诱变鉴定出40种(表49.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:3015变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释20倍。为了筛选其中重组了来自先前轮的有益突变的文库,用10μL稀释的裂解物和0.15g/L SUS SFP SEQ ID NO:1764在100μL反应体积中进行了测定,并且底物载量为8mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和24mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、55℃、在
Figure BDA0002229282040005421
滴定板振荡器中以300RPM振荡1h。将反应在水中以1:20稀释,并且然后通过将20μL稀释的测定物添加到80μL具有0.2%甲酸的乙腈中来淬灭。所得混合物通过在4℃离心10m来沉淀。将上清液在水中以1:10稀释,并通过RapidFire SPE-MS/MS分析。具有与SuS偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表49.1中列出。对于第10轮饱和诱变文库,除了将裂解物稀释10倍以外,筛选按以上描述的来进行,并使用了以下反应条件:60℃、在
Figure BDA0002229282040005422
滴定板振荡器中以300RPM振荡2h。所得的工程化GT变体多肽在表49.2中列出。对于表49.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005423
Figure BDA0002229282040005431
Figure BDA0002229282040005441
Figure BDA0002229282040005442
Figure BDA0002229282040005451
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第10轮变体对莱鲍迪苷A的活性。将0.002-0.2g/L水平的摇瓶粉末(SFP)添加到含有50mM磷酸钾缓冲液、pH 6、8mM莱鲍迪苷A、0.4mM ADP、24mM蔗糖和0.15g/L SUS SFP SEQ ID NO:1764的100μL总反应体积中。反应在
Figure BDA0002229282040005461
滴定板振荡器中在60℃以300RPM持续1h来进行。将反应在水中以1:20稀释,并且然后通过将20μL稀释的测定物添加到80μL具有0.2%甲酸的乙腈中来淬灭,并通过在4℃离心10m来沉淀。将上清液在水中以1:10稀释,并通过RapidFire SPE-MS/MS分析甜菊醇糖苷。第10轮变体以0.25g/L SFP载量对莱鲍迪苷A的活性在表49.3中示出。表49.3中列出的所有5种变体具有高于SEQ ID NO:3016的活性。具有突变K58R、I122L、V176R、T400V、K425R、S426A、I427R和S446R的变体(SEQ ID NO:3082)及其编码多核苷酸(SEQ ID NO:3081)改进最大,并被选择用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005462
实施例50
SEQ ID NO:3082的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:3082衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3081编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了与先前轮中改进的活性相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十一轮(“第11轮”)的工程化GT变体多肽。从重组的有益突变鉴定出五十种工程化变体(表50.1),并从饱和诱变鉴定出53种(表50.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:3081变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释20倍。为了筛选其中重组了来自先前轮的有益突变的文库,用10μL稀释的裂解物和0.15g/L SUS SFP SEQ ID NO:1764在100μL反应体积中进行了测定,并且底物载量为8mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和24mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005471
滴定板振荡器中以300RPM振荡2h。将反应按以上描述的稀释、淬灭及分析。具有与SuS偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表50.1中列出。对于第11轮饱和诱变文库,除了使用的底物载量为10mM莱鲍迪苷A以外,筛选按以上描述的来进行。所得的工程化GT变体多肽在表50.2中列出。对于若干变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005481
Figure BDA0002229282040005491
Figure BDA0002229282040005501
Figure BDA0002229282040005502
Figure BDA0002229282040005511
Figure BDA0002229282040005521
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第11轮变体对莱鲍迪苷A的活性。将0.006-0.2g/L水平的摇瓶粉末(SFP)添加到含有50mM磷酸钾缓冲液、pH 6、10mM莱鲍迪苷A、0.2mM ADP、24mM蔗糖和0.15g/L SUS SFP SEQ ID NO:1764的100μL总反应体积中。反应在60℃在
Figure BDA0002229282040005522
滴定板振荡器中以300RPM持续2h来进行。将反应按以上描述的稀释、淬灭及分析。以0.025g/L SFP载量,作用于莱鲍迪苷A的第11轮变体改进最大是具有相对于SEQ ID NO:1764的突变G8S、G252D、D255P、V322L、M325L和K448A的SEQ ID NO:3244。将这种变体SEQ ID NO:3244用于进一步定向演化。
从蔗糖向ADP向莱鲍迪苷I的葡萄糖转移的HTP偶联测定
对由SEQ ID NO:3081编码的GT的定向演化通过构建变体基因文库来进行,其中将与先前轮中改进的对莱鲍迪苷I的糖基转移酶活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和莱鲍迪苷I具有葡糖基转移酶活性的一轮(“第11.04轮”)工程化GT变体多肽。将细胞用400μL裂解缓冲液裂解。对96孔板的澄清的表达SEQ ID NO:3081变体的大肠杆菌培养物裂解物进行了测定,在100μL反应中裂解物载量为25μL裂解物,并且底物载量为1mM莱鲍迪苷I,以及共底物载量为1mM ADP-葡萄糖。使用了以下反应条件:50mM KPhos缓冲液、pH 6、40℃、在
Figure BDA0002229282040005531
滴定板振荡器中以300RPM振荡18h。将反应在水中以1:4稀释,并且然后通过将25μL稀释的测定物添加到75μL具有0.2%甲酸的乙腈中来淬灭。所得混合物通过在4℃离心10m来沉淀。将上清液在水中以1:5稀释,并且通过如表44.1中描述的LC-MS/MS分析。具有对莱鲍迪苷I的葡糖基转移酶活性的所得的52种工程化变体在表50.3中列出。
Figure BDA0002229282040005541
Figure BDA0002229282040005551
从蔗糖向ADP向莱鲍迪苷I的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第11.04轮变体对莱鲍迪苷I的活性。将0.16-5g/L水平的摇瓶粉末(SFP)添加到含有50mM磷酸钾缓冲液、pH 6、1mM莱鲍迪苷I和1mM ADP-葡萄糖的100μL总反应体积中。反应在50℃在
Figure BDA0002229282040005561
滴定板振荡器中以300RPM持续4h来进行。将反应按以上描述的稀释、淬灭及分析。第11.04轮变体以0.3g/L SFP载量产生莱鲍迪苷M的水平在表50.4中示出。表50.4中列出的所有5种变体具有高于SEQ ID NO:3082的对RebI的活性。具有突变L126Q、P128A、F155R、K160S、R161T和N199A的变体(SEQ ID NO:3346)及其编码多核苷酸(SEQ ID NO:3345)改进最大,并被选择用于莱鲍迪苷I的葡糖基化的进一步定向演化。
Figure BDA0002229282040005562
实施例51
SEQ ID NO:3244的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:3244衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3243编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了与先前轮中改进的活性相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十二轮(“第12轮”)的工程化GT变体多肽。从重组的有益突变鉴定出五十种工程化变体(表51.1),并从饱和诱变鉴定出31种(表51.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:3243变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释40倍。为了筛选其中重组了来自先前轮中的有益突变的文库,将稀释的裂解物在Eppendorf热循环器中在62℃预孵育0.5h。然后用10μL稀释的裂解物和0.15g/L SUS SFP SEQ ID NO:1764在100μL反应体积中进行了测定,并且底物载量为15mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和37.5mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005571
滴定板振荡器中以300RPM振荡4.5h。将反应按以上描述的稀释、淬灭及分析。具有与SUS SEQ ID NO:1764偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表51.1中列出。对于第12轮饱和诱变文库,除了将稀释的裂解物在65℃预孵育0.5h以外,筛选按以上描述的来进行。所得的工程化GT变体多肽在表51.2中列出。对于表51.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005581
Figure BDA0002229282040005591
Figure BDA0002229282040005601
Figure BDA0002229282040005602
Figure BDA0002229282040005611
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第12轮变体对莱鲍迪苷A的活性。将0.006-0.2g/L水平的摇瓶粉末(SFP)在62℃预孵育0.5h,并且然后添加到含有50mM磷酸钾缓冲液、pH 6、15mM莱鲍迪苷A、0.2mM ADP、37.5mM蔗糖和0.15g/L SUS SFP SEQ IDNO:1764的100μL总反应体积中。反应在50℃和60℃在
Figure BDA0002229282040005612
滴定板振荡器中以300RPM持续4.5h来进行。将反应按以上描述的稀释、淬灭及分析。第12轮变体以0.025g/LSFP载量对莱鲍迪苷A的转化在表51.3中列出。表51.3中列出的所有7种变体在60℃具有高于SEQ ID NO:3244的活性,并且4种在50℃不损失显著的活性。选择具有突变K106A、V164H、G200A、E210V和G415A的变体(SEQ ID NO:3502)及其编码多核苷酸(SEQ ID NO:3501)用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005621
实施例52
用于从莱鲍迪苷I产生莱鲍迪苷M的SEQ ID NO:3346的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:3346衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3345编码的GT的定向演化通过构建使酶的某些结构特征经受了饱和诱变的文库来进行。然后将文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和莱鲍迪苷I具有葡糖基转移酶活性的一轮(“第12轮RebI”)工程化GT变体多肽。
从蔗糖向ADP向莱鲍迪苷M的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:3345变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并且然后用25μL裂解物和0.1g/L SUS SFP SEQ ID NO:1804在100μL反应体积中进行了测定,并且底物载量为1mM莱鲍迪苷I,以及共底物载量为1mMADP(Sigma,>95%)和15mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、50℃、在
Figure BDA0002229282040005631
滴定板振荡器中以300RPM振荡4h。将反应按实施例50中描述的稀释、淬灭及分析。具有与SuS偶联的对莱鲍迪苷I的葡糖基转移酶活性的所得工程化变体在表52.1中示出。
Figure BDA0002229282040005641
Figure BDA0002229282040005651
实施例53
SEQ ID NO:3502的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:3502衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3501编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了与先前轮中改进的活性相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十三轮(“第13轮”)的工程化GT变体多肽。从重组的有益突变鉴定出53种工程化变体(表53.1),并从饱和诱变鉴定出24种(表53.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:3501变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释40倍。为了筛选其中重组了来自先前轮中的有益突变的文库,将稀释的裂解物在Eppendorf热循环器中在69℃预孵育0.8h。然后用10μL稀释的裂解物和0.15g/L SUS SFP SEQ ID NO:1764在100μL反应体积中进行了测定,并且底物载量为15mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和37.5mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005661
滴定板振荡器中以300RPM振荡4h。将反应按以上描述的稀释、淬灭及分析。具有与SUS SEQ ID NO:1764偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表53.1中列出。对于第13轮饱和诱变文库,除了将稀释的裂解物在68℃预孵育0.5h、使用0.1g/L SUS SFP SEQ ID NO:1804并使用0.1mM或0.2mM ADP以外,筛选按以上描述的来进行。所得的工程化GT变体多肽在表53.2中列出。对于表53.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005671
Figure BDA0002229282040005681
Figure BDA0002229282040005691
Figure BDA0002229282040005692
Figure BDA0002229282040005701
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第13轮变体对莱鲍迪苷A的活性。将0.006-0.2g/L水平的摇瓶粉末(SFP)在69℃预孵育50min,并且然后添加到含有50mM磷酸钾缓冲液、pH 6、15mM莱鲍迪苷A、0.2mM ADP、37.5mM蔗糖和0.1g/L SUS SFP SEQ IDNO:1804的100μL总反应体积中。反应在60℃在
Figure BDA0002229282040005702
滴定板振荡器中以300RPM持续4h来进行。将反应按以上描述的稀释、淬灭及分析。第13轮变体以0.025g/L SFP载量对莱鲍迪苷A的转化在表53.3中列出。表53.3中列出的所有10种变体具有高于SEQ ID NO:3502的活性。具有突变H73P、N172R、N240E、A242I和E408P的变体(SEQ ID NO:3696)及其编码多核苷酸(SEQ ID NO:3695)改进最大,并被选择用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005711
实施例54
SEQ ID NO:3696的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:3696衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3695编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了与先前轮中改进的活性相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十四轮(“第14轮”)的工程化GT变体多肽。从重组的有益突变鉴定出七十五种工程化变体(表54.1),并从饱和诱变鉴定出49种(表54.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:3695变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释40倍。为了筛选其中重组了来自先前轮中的有益突变的文库,将稀释的裂解物在Eppendorf热循环器中在72℃预孵育0.5h。然后用10μL稀释的裂解物和0.1g/L蔗糖合酶(SUS)SFP SEQ ID NO:1804在100μL反应体积中进行了测定,并且底物载量为20mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和50mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005721
滴定板振荡器中以300RPM振荡4h。将反应按以上描述的稀释、淬灭及分析。具有与SuS偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表54.1中列出。对于第14轮饱和诱变文库,除了将裂解物稀释80倍并在70℃预孵育0.5h以外,筛选按以上描述的来进行。所得的工程化GT变体多肽在表54.2中列出。对于表54.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005731
Figure BDA0002229282040005741
Figure BDA0002229282040005751
Figure BDA0002229282040005761
Figure BDA0002229282040005771
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第14轮变体对莱鲍迪苷A的活性。将0.006-0.2g/L水平的摇瓶粉末(SFP)在72℃预孵育0.5h,并且然后添加到含有50mM磷酸钾缓冲液、pH 6、20mM莱鲍迪苷A、0.2mM ADP、50mM蔗糖和0.1g/L SUS SFP SEQ ID NO:1804的100μL总反应体积中。反应在60℃用预孵育的SFP在
Figure BDA0002229282040005781
滴定板振荡器中以300RPM持续4h来进行,或者在55℃用未经受预孵育的SFP在
Figure BDA0002229282040005782
滴定板振荡器中以300RPM持续4h来进行。将反应按以上描述的稀释、淬灭及分析。第14轮变体以0.05g/LSFP载量产生莱鲍迪苷D的水平在表54.3中示出。在两种条件下,表54.3中列出的8种变体中的三种具有高于SEQ ID NO:3696的活性。考虑两种条件,具有突变I26V、L42V、C46V、L49A和V134A的变体(SEQ ID NO:3956)及其编码多核苷酸(SEQ ID NO:3955)改进最大,并被选择用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005783
实施例55
SEQ ID NO:3956的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:3956衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:3955编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了与先前轮中改进的活性相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十五轮(“第15轮”)的工程化GT变体多肽。从重组的有益突变鉴定出六十二种工程化变体(表55.1),并从饱和诱变鉴定出113种(表55.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:3956变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释40倍。为了筛选其中重组了来自先前轮中的有益突变的文库,将稀释的裂解物在Eppendorf热循环器中在76℃预孵育0.5h。然后用10μL稀释的裂解物和0.1g/L SUS SFP SEQ ID NO:1840在100μL反应体积中进行了测定,并且底物载量为20mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和50mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005791
滴定板振荡器中以300RPM振荡4h。将反应按以上描述的稀释、淬灭及分析。具有与SUS SEQ ID NO:1840偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表55.1中列出。对于第15轮饱和诱变文库,除了将稀释的裂解物在65℃预孵育16h并使用0.1g/L的SUS SFP SEQ ID NO:2064以外,筛选按以上描述的来进行。所得的工程化GT变体多肽在表55.2中列出。对于表55.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005801
Figure BDA0002229282040005811
Figure BDA0002229282040005821
Figure BDA0002229282040005822
Figure BDA0002229282040005831
Figure BDA0002229282040005841
Figure BDA0002229282040005851
Figure BDA0002229282040005861
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第15轮变体对莱鲍迪苷A的活性。将0.006-0.2g/L水平的摇瓶粉末(SFP)在76℃预孵育0.5h,并且然后添加到含有50mM磷酸钾缓冲液、pH 6、20mM莱鲍迪苷A、0.2mM ADP、50mM蔗糖和0.1g/L SUS SFP SEQ ID NO:2064的100μL总反应体积中。反应在60℃用预孵育的SFP在
Figure BDA0002229282040005862
滴定板振荡器中以300RPM持续4h来进行,或者在55℃用未预孵育的SFP在
Figure BDA0002229282040005863
滴定板振荡器中以300RPM持续4h来进行。将反应按以上描述的稀释、淬灭及分析。第15轮变体以0.025g/L SFP载量产生的莱鲍迪苷D在表55.3中列出。在两种条件下,表55.3中列出的9种变体中的五种具有高于SEQ ID NO:3956的活性。考虑两种条件,具有突变P73A、K143P、I144V、V179D、E186G、K187T、K373R和N423R的变体(SEQ ID NO:4256)及其编码多核苷酸(SEQ ID NO:4255)改进最大,并被选择用于莱鲍迪苷A的葡糖基化的进一步定向演化。
Figure BDA0002229282040005871
实施例56
SEQ ID NO:4256的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:4256衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:4255编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了与先前轮中改进的活性相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十六轮(“第16轮”)的工程化GT变体多肽。从重组的有益突变鉴定出二十七种工程化变体(表56.1),并从饱和诱变鉴定出66种(表56.2)。
从蔗糖向ADP向莱鲍迪苷A的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:4255变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物稀释40倍。为了筛选其中重组了来自先前轮中的有益突变的文库,将稀释的裂解物在Eppendorf热循环器中在79℃预孵育0.5h。然后用10μL稀释的裂解物和0.05g/L蔗糖合酶(SUS)SFP SEQ ID NO:2064在100μL反应体积中进行了测定,并且底物载量为20mM莱鲍迪苷A,以及共底物载量为0.2mM ADP(Sigma,>95%)和50mM蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005881
滴定板振荡器中以300RPM振荡4h。将反应按以上描述的稀释、淬灭及分析。具有与SUS SEQ ID NO:2064偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表56.1中列出。对于第16轮饱和诱变文库,除了使用0.05g/L蔗糖合酶SFP SEQ ID NO:2510以外,筛选按以上描述的来进行。所得的工程化GT变体多肽在表56.2中列出。对于表56.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005891
Figure BDA0002229282040005901
Figure BDA0002229282040005902
Figure BDA0002229282040005911
Figure BDA0002229282040005921
从蔗糖向ADP向莱鲍迪苷A的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验来表征工程化第16轮变体对莱鲍迪苷A的活性。将0.003-0.1g/L水平的摇瓶粉末(SFP)在79℃预孵育0.5h,并且然后添加到含有50mM磷酸钾缓冲液、pH 6、20mM莱鲍迪苷A、0.2mMADP、50mM蔗糖和0.05g/L SUS SFP SEQ ID NO:2432的100μL总反应体积中。反应在60℃在
Figure BDA0002229282040005931
滴定板振荡器中以300RPM持续4h来进行。将反应按以上描述的稀释、淬灭及分析。第16轮变体以0.0125g/L SFP载量产生莱鲍迪苷D的水平在表56.3中示出。SEQ ID NO:4550改进最大,并被选择作为用于催化从ADP-葡萄糖向莱鲍迪苷A的糖基转移以形成莱鲍迪苷D的最佳的酶。
Figure BDA0002229282040005932
实施例57
SEQ ID NO:4550的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:4550衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:4549编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了在开发本发明期间鉴定出的与改进的产量相关的突变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十七轮(“第17轮”)的工程化GT变体多肽。从重组的有益突变鉴定出七十三种工程化变体(表57.1)。
从蔗糖向ADP向莱鲍迪苷A 60的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:4549变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物在20g/L莱鲍迪苷A 60%中稀释50倍或100倍,并在75℃预孵育2h。然后用10μL稀释的裂解液、0.1g/L SUS SFP SEQ ID NO:2510和0.2g/Lβ-1,3-糖基转移酶(β1,3GT)SFP SEQ ID NO:6864在100μL反应体积中进行了测定,并且底物载量为20g/L莱鲍迪苷A 60%(RebA60),以及共底物载量为0.1g/L ADP(Amresco,超纯级)和40g/L蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005941
滴定板振荡器中以300RPM振荡16-18h。通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来沉淀,并在水中稀释10x用于如以上描述的分析。具有与SuS偶联的对莱鲍迪苷A的葡糖基转移酶活性的所得工程化变体在表57.1中列出。对于表57.2中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040005951
Figure BDA0002229282040005961
Figure BDA0002229282040005971
从蔗糖向ADP向莱鲍迪苷A 60的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验,以表征工程化第17轮变体对莱鲍迪苷A 60%的活性。将0.0003-0.04g/L水平的摇瓶粉末(SFP)在含有50mM磷酸钾缓冲液、pH 6、20g/LRebA60、0.1g/L ADP、40g/L蔗糖、0.1g/L SUS SFP SEQ ID NO:2510和0.2g/Lβ-1,3-糖基转移酶(β1,3GT)SFP SEQ ID NO:6864的100μL总反应体积中进行了测定。反应在60℃在
Figure BDA0002229282040005981
滴定板振荡器中以300RPM持续16-18h来进行。将反应按以上描述的稀释、淬灭及分析。第17轮变体以0.005g/L SFP载量在一锅反应中产生莱鲍迪苷M的结果在表57.2中示出。SEQ ID NO:7324被鉴定为改进最大,并被选择作为用于催化从ADP-葡萄糖向莱鲍迪苷A的糖基转移以形成莱鲍迪苷D的最佳的酶。
Figure BDA0002229282040005982
实施例58
SEQ ID NO:7324的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:7324衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:7323编码的GT的定向演化通过构建变体基因的组合文库来进行。文库重组了在开发本发明期间鉴定出的与改进的产量相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十八轮(“第18轮”)的工程化GT变体多肽。从重组的有益突变鉴定出九十种工程化变体(表58.1),并从饱和诱变鉴定出124种(表58.2)。
从蔗糖向ADP向莱鲍迪苷A 60的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:7323变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物在20g/L莱鲍迪苷A 60%中稀释80倍,并在75℃预孵育1.5h。然后用10μL稀释的裂解液、0.05g/L SUS SFP SEQ ID NO:7506和0.1g/Lβ-1,3-糖基转移酶(β1,3GT)SFP SEQ ID NO:7388在100μL反应体积中进行了测定,并且底物载量为20g/L莱鲍迪苷A 60%(RebA60),以及共底物载量为0.05g/L ADP(Amresco,超纯级)和40g/L蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040005991
滴定板振荡器中以300RPM振荡16-18h。通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来沉淀,并在水中稀释10x用于如以上描述的分析。具有与SuS偶联的对RebA60的葡糖基转移酶活性的所得工程化变体在表58.1中列出。对于第18轮饱和诱变文库,除了将裂解物在pH 6的50mM Kphos中稀释100倍并在75℃预孵育1h以外,筛选按先前描述的来进行。所得的工程化GT变体多肽在表58.2中列出。对于表58.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040006001
Figure BDA0002229282040006011
Figure BDA0002229282040006021
Figure BDA0002229282040006031
Figure BDA0002229282040006032
Figure BDA0002229282040006041
Figure BDA0002229282040006051
Figure BDA0002229282040006061
Figure BDA0002229282040006071
从蔗糖向ADP向莱鲍迪苷A 60的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验,以表征工程化第18轮变体对莱鲍迪苷A 60%的活性。将0.0013-0.04g/L水平的摇瓶粉末(SFP)在含有50mM磷酸钾缓冲液、pH 6、20g/LRebA60、0.05g/L ADP、40g/L蔗糖、0.05g/L SUS SFP SEQ ID NO:7506和0.15g/Lβ-1,3-糖基转移酶(β1,3GT)SFP SEQ ID NO:7388的100μL总反应体积中进行了测定。反应在60℃在
Figure BDA0002229282040006081
滴定板振荡器中以300RPM持续16-18h来进行。将反应按以上描述的稀释、淬灭及分析。第18轮变体以0.005g/L SFP载量在一锅反应中产生莱鲍迪苷M的水平在表57.2中示出。具有SEQ ID NO:7784的变体是改进最大的变体。因此,它被选择作为用于催化从ADP-葡萄糖向莱鲍迪苷A的糖基转移以形成莱鲍迪苷D的最佳的酶。
Figure BDA0002229282040006082
实施例59
SEQ ID NO:7784的β-1,2-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:7784衍生的GT多肽的演化和筛选的实验。对由SEQ ID NO:7783编码的GT的定向演化通过构建变体基因文库来进行。文库重组了在开发本发明期间鉴定出的与改进的产量相关的突变,并使酶的某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的HTP测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十九轮(“第19轮”)的工程化GT变体多肽。从重组文库鉴定出八十七种工程化变体(表59.1),并从饱和诱变文库鉴定出五十八种(表59.2)。
从蔗糖向ADP向莱鲍迪苷A 60的葡萄糖转移的HTP偶联测定
对96孔板的澄清的表达SEQ ID NO:7783变体的大肠杆菌培养物裂解物进行了测定。裂解缓冲液体积为400μL,并将裂解物在pH6.0的50mM磷酸钾中稀释100倍,并在75℃预孵育1h。然后用10μL稀释的裂解液、0.04g/L SUS SFP SEQ ID NO:8420和0.1g/Lβ-1,3-糖基转移酶(β1,3GT)SFP SEQ ID NO:8088在100μL反应体积中进行了测定,并且底物载量为20g/L莱鲍迪苷A 60%(RebA60),以及共底物载量为0.025g/L ADP(Amresco,超纯级)和40g/L蔗糖。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040006091
滴定板振荡器中以300RPM振荡16-18h。通过在水中稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来沉淀,并在水中稀释20x用于如以上描述的分析。具有与SuS偶联的对RebA60的葡糖基转移酶活性的所得工程化变体在表59.1和表59.2中列出。对于表59.3中列出的变体,生长摇瓶规模的培养物,裂解并冻干成粉末。
Figure BDA0002229282040006101
Figure BDA0002229282040006111
Figure BDA0002229282040006121
Figure BDA0002229282040006131
Figure BDA0002229282040006132
Figure BDA0002229282040006141
Figure BDA0002229282040006151
从蔗糖向ADP向莱鲍迪苷A 60的葡糖基转移的摇瓶粉末表征测定和分析
进行了摇瓶粉末加载剂量响应实验,以表征工程化第19轮变体对莱鲍迪苷A 60%的活性。将0.0013-0.04g/L水平的摇瓶粉末(SFP)在100μL总反应体积中进行了测定,总反应体积含有50mM磷酸钾缓冲液、pH 6、20g/L RebA60或RebA97、0.025g/L ADP、20g/L蔗糖(单一底物)或40g/L蔗糖(一锅)、0.04g/L SUS SFP SEQ ID NO:8420,并且仅对于一锅反应、0.15g/Lβ-1,3-糖基转移酶(β1,3GT)SFP SEQ ID NO:8088。反应在60℃在
Figure BDA0002229282040006161
滴定板振荡器中以300RPM持续16-18h来进行。将反应按以上描述的稀释、淬灭及分析。第19轮变体分别以0.0025g/L和0.005g/L SFP载量在单一底物反应中产生莱鲍迪苷D的水平和在一锅反应中产生莱鲍迪苷M的水平在表59.3中示出。具有SEQ ID NO:9180的变体是改进最大的变体。因此,它被选择作为用于催化从ADP-葡萄糖向莱鲍迪苷A的糖基转移以形成莱鲍迪苷D的最佳的酶。
Figure BDA0002229282040006162
实施例60
SEQ ID NO:696的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:696衍生的β-1,3-糖基转移酶(GT)多肽的演化和筛选的实验。对由SEQ IDNO:695编码的GT(即SEQ ID NO:696)的定向演化通过构建变体基因文库来进行,其中将与以上先前轮中的改进的活性相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第八轮(“第8轮”)的65种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:695变体的大肠杆菌培养物裂解物进行了测定。将沉淀用具有在pH 7.5的25mM Tris-HCl中的0.5mg/mL溶菌酶和0.5mg/mL PMBS的400μL裂解缓冲液裂解1.5h,并通过离心来澄清。用10μL裂解物并用5mM莱鲍迪苷D底物、0.2mMADP(Sigma,>93%纯度)共底物、0.1g/L SUS SFP SEQ ID NO:1222和15mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM KPhos缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040006171
滴定板振荡器中以300RPM振荡4-5h。然后通过在水中稀释20x将反应物溶解,在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,在4℃离心10m,并将上清液在水中稀释5x用于分析。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:696的量从莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷M的糖基转移酶变体多肽。将大多数对甜菊苷(95%纯度)以一式三份重新测试。工程化多肽在表60.1中列出。如实施例31中描述的生长摇瓶规模的培养物用于SFP产生,用于分析表60.2中示出的相对于SEQ ID NO:696的变体。
Figure BDA0002229282040006181
Figure BDA0002229282040006191
Figure BDA0002229282040006201
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.002-5g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 7、具有3mM MgCl2、1mM甜菊苷(95%纯度)或莱鲍迪苷D和1mM ADP-葡萄糖(Sigma,>93%纯度)。将反应在50℃在
Figure BDA0002229282040006211
滴定板振荡器中以300RPM振荡孵育1小时。通过用水稀释5x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释4x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006212
在这些实验中,表60.2中的所有变体(即SEQ ID NO:4684、4686和4694)以大于SEQID NO:696的量从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A,和/或从莱鲍迪苷D和ADP-葡萄糖产生莱鲍迪苷M。选择变体SEQ ID NO:4684用于进一步定向演化。
实施例61
SEQ ID NO:4684的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:4684衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:4684编码的GT(即SEQ ID NO:4683)的定向演化通过构建变体基因文库来进行,其中将与先前轮中改进的活性相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第九轮(“第9轮”)的31种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:4684变体的大肠杆菌培养物裂解物进行了测定。如实施例60中描述的,将沉淀裂解,并使裂解物澄清。用10μL裂解物并用5mM甜菊苷(>95%纯度)底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.1g/L SUS SFP SEQ ID NO:1222和15mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM KPhos缓冲液、pH 7、3mM MgCl2、50℃、在
Figure BDA0002229282040006221
滴定板振荡器中以300RPM振荡4-5h。如实施例60中描述的将反应溶解、淬灭及稀释。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:4684的量从甜菊苷和原位合成的ADP-葡萄糖产生莱鲍迪苷A的糖基转移酶变体多肽。工程化多肽在表61.1中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表61.2中示出的相对于SEQ ID NO:4684的变体。
Figure BDA0002229282040006231
Figure BDA0002229282040006241
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.002-5g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 7、具有3mM MgCl2、1mM甜菊苷(95%纯度)或莱鲍迪苷D和1mM ADP-葡萄糖(Sigma,>93%纯度)。将反应在50℃在
Figure BDA0002229282040006242
滴定板振荡器中以300RPM振荡孵育1小时。通过用水稀释5x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释4x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006251
在这些实验中,表61.2中的所有变体(即SEQ ID NO:4822、4824、4826、4834和4838)以大于SEQ ID NO:4684的量从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A,并从莱鲍迪苷D和ADP-葡萄糖产生莱鲍迪苷M。在这些实验中,SEQ ID NO:4838的变体具有最高的对以ADP-葡萄糖作为共底物的甜菊苷和莱鲍迪苷D两者的活性。因此,选择编码多核苷酸(SEQ IDNO:4837)用于进一步定向演化。
实施例62
SEQ ID NO:4838的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:4838衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:4837编码的GT(即SEQ ID NO:4838)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十轮(“第10轮”)的123种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:4838变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6.5的磷酸钾缓冲液中稀释4x。用10μL裂解物并用5mM甜菊苷(>95%纯度)底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.2g/L SUS SFP SEQ ID NO:1222和15mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6.5、50℃、在
Figure BDA0002229282040006261
滴定板振荡器中以300RPM振荡1h。将反应如实施例60中描述的溶解、淬灭及稀释。将样品通过如实施例1、表1.1中描述的RapidFire-MS/MS来分析。将选择的变体以10x裂解物稀释、4mM甜菊苷或莱鲍迪苷D、0.375mM ADP、0.5g/L蔗糖合酶SEQ ID NO:1392、30mM蔗糖及2h孵育以相似的测定重新测试。鉴定以大于SEQ ID NO:4838的量从莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表62.1中列出。如实施例1中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表62.2中示出的相对于SEQ ID NO:4838的变体。
Figure BDA0002229282040006271
Figure BDA0002229282040006281
Figure BDA0002229282040006291
从ADP-葡萄糖向甜菊苷或莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH6.5、1mM甜菊苷(95%纯度)或莱鲍迪苷D和1mM ADP-葡萄糖(Sigma,>93%纯度)。将反应在50℃在
Figure BDA0002229282040006301
滴定板振荡器中以300RPM振荡孵育1小时。通过用水稀释5x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释4x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006302
在这些实验中,表62.2中的一种变体(即SEQ ID NO:4876)以大于SEQ ID NO:4838的量从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A,并从莱鲍迪苷D和ADP-葡萄糖产生莱鲍迪苷M。因此,选择编码多核苷酸(SEQ ID NO:4875)用于进一步定向演化。
实施例63
SEQ ID NO:4876的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:4876衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:4875编码的GT(即SEQ ID NO:4876)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十一轮(“第11轮”)的122种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:4875变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6.5的磷酸钾缓冲液中稀释10x。用10μL裂解物并用4mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.2g/L SUS SFP SEQ ID NO:1456和24mM蔗糖(蔗糖)在100μL反应中进行了对组合文库的测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6.5、50℃、在
Figure BDA0002229282040006311
滴定板振荡器中以300RPM振荡1h。将反应如实施例60中描述的溶解、淬灭及稀释。将样品通过如实施例1、表1.1中描述的RapidFire-MS/MS来分析。对于饱和诱变文库,进行了相同的测定,但是用5x稀释的裂解物、pH 6的磷酸钾缓冲液及在55℃的1-2次孵育。在这些条件下,还对选择的变体以一式三份重新测试。鉴定以大于SEQ ID NO:4876的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表63.1中列出。如实施例1中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表63.2中示出的相对于SEQ ID NO:4876的变体。
Figure BDA0002229282040006321
Figure BDA0002229282040006331
Figure BDA0002229282040006341
Figure BDA0002229282040006351
Figure BDA0002229282040006361
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH6.5、4mM甜菊苷(95%纯度)或莱鲍迪苷D、0.2mM ADP(Sigma,>93%纯度)共底物、0.2g/L SUS SFP SEQ ID NO:1456和24mM蔗糖(蔗糖)。将反应在50℃在
Figure BDA0002229282040006371
滴定板振荡器中以300RPM振荡孵育1小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006372
在这些实验中,表63.2中的六种变体(即SEQ ID NO:5076、5042、5026、5066、5074和5044)以大于SEQ ID NO:4876的量从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A,和/或从莱鲍迪苷D和ADP-葡萄糖产生莱鲍迪苷M。SEQ ID NO:5066在初步筛选中表现最佳(表63.1),并且具有最多有益突变。因此,选择编码多核苷酸(SEQ ID NO:5065)用于进一步定向演化。由于其RebD至RebM活性高,具有SEQ ID NO:5076的变体被用于方法开发。
实施例64
SEQ ID NO:5066的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:5066衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:5065编码的GT(即SEQ ID NO:5066)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十二轮(“第12轮”)的40种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:5066变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的磷酸钾缓冲液中稀释10x。用10μL裂解物并用4mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ ID NO:1582和24mM蔗糖(蔗糖)在100μL反应中进行了对组合文库的测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、55℃、在
Figure BDA0002229282040006381
滴定板振荡器中以300RPM振荡2h。将反应如实施例63中描述的溶解、淬灭及稀释。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQID NO:5066的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表64.1中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表64.2中示出的相对于SEQ ID NO:5066的变体。
Figure BDA0002229282040006391
Figure BDA0002229282040006401
Figure BDA0002229282040006411
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、4mM甜菊苷(95%纯度)或莱鲍迪苷D、0.4mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ ID NO:1582和24mM蔗糖(蔗糖)。将反应在55℃在
Figure BDA0002229282040006412
滴定板振荡器中以300RPM振荡孵育1小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006421
在这些实验中,表64.2中的六种变体(即SEQ ID NO:5280、5290、5302、5314、5324)以大于SEQ ID NO:5066的量从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A,和/或从莱鲍迪苷D和ADP-葡萄糖产生莱鲍迪苷M。SEQ ID NO:5290对莱鲍迪苷D表现最佳,并且具有最多有益突变。因此,选择编码多核苷酸(SEQ ID NO:5289)用于进一步定向演化。
实施例65
SEQ ID NO:5290的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:5290衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:5289编码的GT(即SEQ ID NO:5290)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十三轮(“第13轮”)的100种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:5289变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的磷酸钾缓冲液中稀释5x。用10μL裂解物并用4mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ ID NO:1764和24mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、55℃、在
Figure BDA0002229282040006431
滴定板振荡器中以300RPM振荡2h。将反应如实施例33中描述的溶解、淬灭及稀释。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:5290的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表65.1中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表65.2中示出的相对于SEQ ID NO:5290的变体。
Figure BDA0002229282040006441
Figure BDA0002229282040006451
Figure BDA0002229282040006461
Figure BDA0002229282040006471
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、4mM甜菊苷(95%纯度)、莱鲍迪苷D或莱鲍迪苷A(97%纯度)、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ IDNO:1764和24mM蔗糖(蔗糖)。将反应在50℃和55℃在
Figure BDA0002229282040006472
滴定板振荡器中以300RPM振荡孵育1小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006481
在这些实验中,表65.2中的五种变体(即SEQ ID NO:5348、5356、5364、5372和5386)以大于SEQ ID NO:5290的量从甜菊苷和ADP-葡萄糖产生莱鲍迪苷A,和/或从莱鲍迪苷D和ADP-葡萄糖产生莱鲍迪苷M。选择SEQ ID NO:5372用于进一步定向演化。
实施例66
SEQ ID NO:5372的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖对甜菊醇糖苷的改进的葡糖基化,对从SEQ ID NO:5372衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:5371编码的GT(即SEQ ID NO:5372)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十四轮(“第14轮”)的74种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:5371变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的磷酸钾缓冲液中稀释10x。用10μL裂解物并用10mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ ID NO:1764和40mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040006491
滴定板振荡器中以300RPM振荡2h。将反应如实施例60中描述的溶解、淬灭及稀释至~10μM甜菊醇糖苷。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:5372的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表66.1中列出。如实施例1中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表66.2中示出的相对于SEQ ID NO:5372的变体。
Figure BDA0002229282040006501
Figure BDA0002229282040006511
Figure BDA0002229282040006521
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH6、4mM甜菊苷(95%纯度)、莱鲍迪苷D、莱鲍迪苷E或莱鲍迪苷A(97%纯度)、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFPSEQ ID NO:1764和24mM蔗糖(蔗糖)。将反应在55℃和60℃在
Figure BDA0002229282040006522
滴定板振荡器中以300RPM振荡孵育2小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006531
在这些实验中,表66.2中的六种变体(即SEQ ID NO:5552、5562、6675、5578、5582和5590)用ADP-葡萄糖以大于SEQ ID NO:5372的量从甜菊苷产生较多的莱鲍迪苷A,从莱鲍迪苷A产生较少的莱鲍迪苷I,从莱鲍迪苷E产生较多的莱鲍迪苷M,和/或从莱鲍迪苷D产生较多的莱鲍迪苷M。对于所有四种反应SEQ ID NO:5562改进最大,因此它被选择用于进一步定向演化。
实施例67
SEQ ID NO:5562的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:5562衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:5561编码的GT(即SEQ ID NO:5562)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的活性相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十五轮(“第15轮”)的62种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:5562变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释5x。用10μL裂解物并用10mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.1-0.2mMADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ ID NO:1764和24-40mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、50℃或60℃、在
Figure BDA0002229282040006541
滴定板振荡器中以300RPM振荡2h。将反应如实施例60中描述的溶解、淬灭及稀释至~10μM甜菊醇糖苷。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:5562的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。来自组合文库的工程化多肽在表67.1中列出,并且来自饱和诱变文库的工程化多肽在表67.2中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表67.3中示出的相对于SEQ ID NO:5562的变体。
Figure BDA0002229282040006551
Figure BDA0002229282040006561
Figure BDA0002229282040006571
Figure BDA0002229282040006572
Figure BDA0002229282040006581
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、10mM甜菊苷(95%纯度)或莱鲍迪苷D、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ ID NO:1764和24mM蔗糖(蔗糖)。将反应在50℃和60℃在
Figure BDA0002229282040006582
滴定板振荡器中以300RPM振荡孵育2小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释5x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006591
在这些实验中,在50℃和/或60℃,表67.3中的八种变体比SEQ ID NO:5562从甜菊苷产生更多的莱鲍迪苷A和/或从莱鲍迪苷D产生更多的莱鲍迪苷M。对于两种温度,SEQ IDNO:5708将甜菊苷转化为莱鲍迪苷A的改进最大,并且在60℃将莱鲍迪苷D转化为莱鲍迪苷M也有改进,因此它被选择用于进一步定向演化。
实施例68
SEQ ID NO:5708的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:5708衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:5707编码的GT(即SEQ ID NO:5708)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十六轮(“第16轮”)的100种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:5708变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释20x。用10μL裂解物并用10mM甜菊苷(>95%纯度)、莱鲍迪苷D、莱鲍迪苷A(>97%纯度)或莱鲍迪苷E底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUS SFP SEQ IDNO:1764和24mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040006601
滴定板振荡器中以300RPM振荡3h。将反应如实施例60中描述的溶解、淬灭及稀释至~10μM甜菊醇糖苷。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:5562的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表68.1中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表68.2中示出的相对于SEQ ID NO:5708的变体。
Figure BDA0002229282040006611
Figure BDA0002229282040006621
Figure BDA0002229282040006631
Figure BDA0002229282040006641
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、10mM甜菊苷(>95%纯度)、莱鲍迪苷D、莱鲍迪苷E或莱鲍迪苷A(>97%纯度)、0.2mM ADP(Sigma,>93%纯度)共底物、0.15g/L SUSSFP SEQ ID NO:1764和24mM蔗糖(蔗糖)。将反应在50℃和60℃在
Figure BDA0002229282040006651
滴定板振荡器中以300RPM振荡孵育3小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释10x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006652
在这些实验中,在50℃和/或60℃,表68.2中的十三种变体比SEQ ID NO:5708从甜菊苷产生更多的莱鲍迪苷A和/或从莱鲍迪苷D产生更多的莱鲍迪苷M。对于两种温度,SEQID NO:5976具有将甜菊苷转化为莱鲍迪苷A的最大改进,而将莱鲍迪苷D转化为莱鲍迪苷M的活性没有损失,因此选择这个变体用于进一步定向演化。
实施例69
SEQ ID NO:5976的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:5976衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:5975编码的GT(即SEQ ID NO:5976)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十七轮(“第17轮”)的123种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:5976变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在缓冲液中稀释20x。为了热挑战裂解物,将它们在热循环器中在65.5℃预孵育15分钟。用10μL预孵育的裂解物并用10mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.1g/L SUS SFP SEQ ID NO:1804和24mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040006661
滴定板振荡器中以300RPM振荡4h。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,并用水稀释10x用于分析。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:5976的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表69.1中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表69.2中示出的相对于SEQID NO:5976的变体。
Figure BDA0002229282040006681
Figure BDA0002229282040006691
Figure BDA0002229282040006701
Figure BDA0002229282040006711
Figure BDA0002229282040006721
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、10mM甜菊苷(95%纯度)或莱鲍迪苷D、0.2mM ADP(Sigma,>93%纯度)共底物、0.1g/L SUS SFP SEQ ID NO:1804和24mM蔗糖(蔗糖)。将反应不预孵育、在55℃在
Figure BDA0002229282040006722
滴定板振荡器中以300RPM振荡孵育4小时,或者将反应在65.5℃预孵育15分钟后、在60℃在
Figure BDA0002229282040006723
滴定板振荡器中以300RPM振荡孵育4小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释10x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006731
在这些实验中,在55℃和/或60℃,表69.2中的八种变体比SEQ ID NO:5976从甜菊苷产生更多的莱鲍迪苷A和/或从莱鲍迪苷D产生更多的莱鲍迪苷M。在预孵育随后60℃测定的条件下,对于甜菊苷向莱鲍迪苷A的转化,SEQ ID NO:6138具有最大的改进,并且在其他条件下也有改进,因此选择这个变体用于进一步定向演化。
实施例70
SEQ ID NO:6138的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:6138衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:6137编码的GT(即SEQ ID NO:6138)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十八轮(“第18轮”)的100种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:6137变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释20-40x。为了热挑战裂解物,将它们在热循环器中在68.6℃预孵育15分钟。用10μL预孵育的裂解物并用10mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.1g/L SUS SFP SEQ ID NO:1840和24mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040006741
滴定板振荡器中以300RPM振荡4h。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,并用水稀释10x用于分析。
将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:6138的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表70.1中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表70.2中示出的相对于SEQ ID NO:6138的变体。
Figure BDA0002229282040006751
Figure BDA0002229282040006761
Figure BDA0002229282040006771
Figure BDA0002229282040006781
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH6、10mM甜菊苷(95%纯度)或莱鲍迪苷D、0.2mM ADP(Sigma,>93%纯度)共底物、0.1g/L SUS SFP SEQ ID NO:1804和24mM蔗糖(蔗糖)。将反应不预孵育、在55℃在
Figure BDA0002229282040006791
滴定板振荡器中以300RPM振荡孵育4小时,或者将反应在68.6℃预孵育15分钟后、在60℃在
Figure BDA0002229282040006792
滴定板振荡器中以300RPM振荡孵育4小时。通过在水中稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并在水中稀释10x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。
Figure BDA0002229282040006793
在这些实验中,在具有预孵育的60℃,表70.2中的五种变体(SEQ ID NO:6262、6268、6288、6300和6334)比SEQ ID NO:6138从甜菊苷产生更多的莱鲍迪苷A并从莱鲍迪苷D产生更多的莱鲍迪苷M。在预孵育随后60℃测定的条件下,对于甜菊苷向莱鲍迪苷A的转化,SEQ ID NO:6288具有最大的改进;并且对于莱鲍迪苷D向莱鲍迪苷M的转化,SEQ ID NO:6288改进第二大,因此选择这个变体用于进一步定向演化。
实施例71
SEQ ID NO:6288的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:6288衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:6287编码的GT(即SEQ ID NO:6288)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第十九轮(“第19轮”)的108种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:6288变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释40x。为了热挑战裂解物,将它们在热循环器中在73.5℃预孵育15分钟,或者在65℃在
Figure BDA0002229282040006801
滴定板振荡器中以300RPM振荡预孵育16h。用10μL预孵育的裂解物并用10mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.2mM ADP(Sigma,>93%纯度)共底物、0.05g/L SUS SFP SEQ ID NO:2064和24mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040006802
滴定板振荡器中以300RPM振荡4h。通过在水中稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,并用水稀释10x用于分析。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:6288的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。来自用15分钟预孵育筛选的组合文库的工程化多肽在表71.1中列出,并且来自用16h预孵育筛选的饱和诱变文库的工程化多肽在表71.2中列出。如实施例1中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表71.3中示出的相对于SEQ ID NO:6288的变体。
Figure BDA0002229282040006821
Figure BDA0002229282040006831
Figure BDA0002229282040006841
Figure BDA0002229282040006842
Figure BDA0002229282040006851
Figure BDA0002229282040006861
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、10mM甜菊苷(95%纯度)或莱鲍迪苷D、0.2mM ADP(Sigma,>93%纯度)共底物、0.05g/L SUS SFP SEQ ID NO:2064和24mM蔗糖(蔗糖)。将反应不预孵育、在55℃在
Figure BDA0002229282040006862
滴定板振荡器中以300RPM振荡孵育4小时,或者将反应在73.5℃预孵育15分钟后、在60℃在
Figure BDA0002229282040006863
滴定板振荡器中以300RPM振荡孵育4小时。通过在水中稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释10x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。进一步的热稳定性表征用冻干之前的澄清摇瓶裂解物来如下进行:将裂解物在缓冲液中稀释400x,并在热循环器中以55-70℃的梯度孵育16h。为了确定剩余活性百分比,如以上描述的将预孵育的裂解物在60℃用甜菊苷或莱鲍迪苷D孵育4h来测定。剩余活性百分比表示为在高温度的产量除以在最低预孵育温度的产量。
Figure BDA0002229282040006871
在这些实验中,在具有预孵育的60℃,表71.3中的八种变体比SEQ ID NO:6288从甜菊苷产生更多的莱鲍迪苷A并从莱鲍迪苷D产生更多的莱鲍迪苷M。在预孵育随后60℃测定的条件下,对于莱鲍迪苷D向莱鲍迪苷M的转化,SEQ ID NO:6468具有最大的改进;并且在16h热挑战后具有最大的剩余活性百分比,因此选择这个变体用于进一步定向演化。
实施例72
SEQ ID NO:6468的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:6468衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:6467编码的GT(即SEQ ID NO:6468)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第二十轮(“第20轮”)的269种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:6467变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释40x。为了热挑战裂解物,将它们在热循环器中在79℃预孵育15分钟,或者在65℃在
Figure BDA0002229282040006881
滴定板振荡器中以300RPM振荡预孵育16h。用10μL预孵育的裂解物并用15mM甜菊苷(>95%纯度)或莱鲍迪苷D底物、0.1g/L ADP(Sigma,>93%纯度)共底物、0.05g/L SUS SFP SEQ ID NO:2432和37.5mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040006882
滴定板振荡器中以300RPM振荡4h。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,并用水稀释15x用于分析。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:6468的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。来自用15分钟预孵育筛选的组合文库的工程化多肽在表72.1中列出,并且来自用16h预孵育筛选的饱和诱变文库的工程化多肽在表72.2中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表72.3中示出的相对于SEQ ID NO:6468的变体。
Figure BDA0002229282040006891
Figure BDA0002229282040006901
Figure BDA0002229282040006911
Figure BDA0002229282040006921
Figure BDA0002229282040006931
Figure BDA0002229282040006941
Figure BDA0002229282040006942
Figure BDA0002229282040006951
Figure BDA0002229282040006961
Figure BDA0002229282040006971
Figure BDA0002229282040006981
Figure BDA0002229282040006991
Figure BDA0002229282040007001
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.006-0.2g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH6、15mM甜菊苷(>95%纯度)或莱鲍迪苷D、0.2mM ADP(Amresco,超纯级)共底物、0.05g/L SUS SFP SEQ ID NO:2432和37.5mM蔗糖(蔗糖)。将反应不预孵育、在55℃在
Figure BDA0002229282040007002
滴定板振荡器中以300RPM振荡孵育4小时,或者将反应在79℃预孵育15分钟后、在60℃在
Figure BDA0002229282040007003
滴定板振荡器中以300RPM振荡孵育4小时。通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释15x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。进一步的热稳定性表征用冻干之前的澄清摇瓶裂解物来如下进行:将裂解物在缓冲液中稀释400x,并在热循环器中以60-75℃的梯度孵育16h。为了确定剩余活性百分比,如以上描述的将预孵育的裂解物用甜菊苷或莱鲍迪苷D并在60℃孵育4h来测定。剩余活性的百分比表示为在高温度的产量除以在最低预孵育温度的产量。
Figure BDA0002229282040007011
Figure BDA0002229282040007021
在这些实验中,在具有预孵育的60℃,表72.3中的十四种变体比SEQ ID NO:6468从甜菊苷产生更多的莱鲍迪苷A并从莱鲍迪苷D产生更多的莱鲍迪苷M,并且除四种以外,所有变体还在未预孵育的55℃表现更佳。选择SEQ ID NO:6864作为用于催化从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的糖基转移以分别形成莱鲍迪苷A和莱鲍迪苷M的最佳的酶。
实施例73
SEQ ID NO:6864的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:6864衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:6863编码的GT(即SEQ ID NO:6864)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第二十一轮(“第21轮”)的37种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向莱鲍迪苷A 60的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:6863变体的大肠杆菌培养物裂解物进行了测定。按实施例34中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释40x。为了热挑战裂解物,将它们在75℃在
Figure BDA0002229282040007031
滴定板振荡器中以300RPM振荡预孵育1h。用10μL预孵育的裂解物并用20g/L莱鲍迪苷A 60%底物、0.1g/L ADP(Amresco,超纯级)共底物、0.05g/L SUS SFP SEQ ID NO:2510、0.1g/Lβ-1,2-糖基转移酶(β1,2GT)SEQ ID NO:4550和37.5mM蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040007032
滴定板振荡器中以300RPM振荡4h。通过用水稀释20x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释5x将反应淬灭,并用水稀释15x用于分析。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:6864的量从甜菊苷/莱鲍迪苷D和原位合成的ADP-葡萄糖产生莱鲍迪苷A/莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表73.1中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表73.2中示出的相对于SEQ IDNO:6864的变体。
Figure BDA0002229282040007041
Figure BDA0002229282040007051
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.003-0.1g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、15mM甜菊苷(>95%纯度)或莱鲍迪苷D、0.2mM ADP(Amresco,超纯级)共底物、0.05g/L SUS SFP SEQ ID NO:2510和37.5mM蔗糖(蔗糖)。将反应在60℃在
Figure BDA0002229282040007061
滴定板振荡器中以300RPM振荡孵育4小时。通过用水稀释20x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释5x将反应淬灭,通过离心来澄清,并用水稀释15x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。进一步的热稳定性表征用冻干之前的澄清摇瓶裂解物来如下进行:将裂解物在pH 6的50mM磷酸钾缓冲液中稀释400x,并在热循环器中以60-75℃的梯度孵育16h。为了确定剩余活性百分比,如以上描述的将预孵育的裂解物在60℃用甜菊苷或莱鲍迪苷D孵育4h来测定。剩余活性百分比表示为在高温度的产量除以在最低预孵育温度的产量。
Figure BDA0002229282040007062
在这些实验中,在60℃,表73.2中的五种变体比SEQ ID NO:6864从甜菊苷产生更多的莱鲍迪苷A并从莱鲍迪苷D产生更多的莱鲍迪苷M。选择SEQ ID NO:7388作为用于催化从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的糖基转移以分别形成莱鲍迪苷A和莱鲍迪苷M的最佳的酶。
实施例74
SEQ ID NO:7388的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:7388衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:7387编码的GT(即SEQ ID NO:7388)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第二十二轮(“第22轮”)的88种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向莱鲍迪苷A 60的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:7387变体的大肠杆菌培养物裂解物进行了测定。按实施例60中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释20x。为了热挑战裂解物,将它们在75℃在
Figure BDA0002229282040007071
滴定板振荡器中以300RPM振荡预孵育1h。用10μL预孵育的裂解物并用20g/L莱鲍迪苷A 60%底物、0.05g/LADP(Amresco,超纯级)共底物、0.05g/L SUS SFP SEQ ID NO:2510、0.08g/Lβ-1,2-糖基转移酶(β1,2GT)SEQ ID NO:7324和40g/L蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040007072
滴定板振荡器中以300RPM振荡16h。通过用水稀释20x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释5x将反应淬灭,并用水稀释20x用于分析。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:7388的量从莱鲍迪苷A 60和原位合成的ADP-葡萄糖产生莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表74.1和表74.2中列出。如实施例31中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表74.3中示出的相对于SEQ ID NO:7388的变体。
Figure BDA0002229282040007091
Figure BDA0002229282040007101
Figure BDA0002229282040007111
Figure BDA0002229282040007112
Figure BDA0002229282040007121
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.005-0.15g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、15mM甜菊苷(>95%纯度)或莱鲍迪苷D、0.1g/L ADP(Amresco,超纯级)共底物、0.05g/L SUS SFP SEQ ID NO:2510和37.5mM蔗糖(蔗糖)。将反应在60℃在
Figure BDA0002229282040007122
滴定板振荡器中以300RPM振荡孵育4小时。通过用水稀释20x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释5x将反应淬灭,通过离心来澄清,并用水稀释15x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。进一步的热稳定性表征用冻干之前的澄清摇瓶裂解物来如下进行:将裂解物在磷酸盐缓冲液中稀释20x,并在热循环器中以60-75℃的梯度孵育24h。为了确定剩余活性百分比,将预孵育的裂解物用20g/L莱鲍迪苷A 60、0.05g/L ADP、40g/L蔗糖、0.05g/L SUS SFP SEQID NO:2510和0.08g/Lβ1,2GT SFP SEQ ID NO:7324,在pH 6的50mM磷酸钾缓冲液中,并在60℃、在
Figure BDA0002229282040007123
滴定板振荡器中以300RPM振荡孵育16h来测定。如高通量测定描述的,将反应溶解、淬灭及稀释。剩余活性百分比表示为在高温度的产量除以在最低预孵育温度的产量。
Figure BDA0002229282040007141
在这些实验中,表74.3中的所有十一种变体比SEQ ID NO:7388从莱鲍迪苷A 60产生更多的莱鲍迪苷M,并且八种变体还从甜菊苷产生更多的莱鲍迪苷A以及从莱鲍迪苷D产生更多的莱鲍迪苷M。总体上SEQ ID NO:8034和8088表现最佳。因为SEQ ID NO:8088在一锅测定中的优越表现,选择SEQ ID NO:8088作为用于催化从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的糖基转移以分别形成莱鲍迪苷A和莱鲍迪苷M的最佳的酶。
实施例75
SEQ ID NO:8088的β-1,3-ADP-糖基转移酶变体
在这个实施例中,描述了为了使用原位合成的ADP-葡萄糖的改进的甜菊醇糖苷葡糖基化,对从SEQ ID NO:8088衍生的β-1,3-糖基转移酶(β1,3GT)多肽的演化和筛选的实验。对由SEQ ID NO:8087编码的GT(即SEQ ID NO:8088)的定向演化通过构建变体基因文库来进行,其中将开发本发明期间鉴定出的与改进的产量相关的突变重组,并且其中使某些结构特征经受了饱和诱变。然后将这些文库铺板、生长、并使用以下描述的高通量(HTP)测定筛选,以提供对ADP-葡萄糖和甜菊醇糖苷具有葡糖基转移酶活性的第二十三轮(“第23轮”)的80种工程化GT变体多肽。
从蔗糖向ADP并且然后从ADP-葡萄糖向莱鲍迪苷A 60的葡萄糖转移的HTP测定
对96孔板的澄清的表达SEQ ID NO:8087变体的大肠杆菌培养物裂解物进行了测定。按实施例34中描述的,将沉淀裂解,并使裂解物澄清,并且然后在pH 6的50mM磷酸钾缓冲液中稀释10x。为了热挑战裂解物,将它们在75℃在
Figure BDA0002229282040007151
滴定板振荡器中以300RPM振荡预孵育1h。用10μL预孵育的裂解物并用20g/L莱鲍迪苷A 60%底物、0.025g/LADP(Amresco,超纯级)共底物、0.05g/L SUS SFP SEQ ID NO:8420、0.08g/Lβ-1,2-糖基转移酶(β1,2GT)SEQ ID NO:7784和40g/L蔗糖(蔗糖)在100μL反应中进行了测定。使用了以下反应条件:50mM磷酸钾缓冲液、pH 6、60℃、在
Figure BDA0002229282040007152
滴定板振荡器中以300RPM振荡16h。通过用水稀释20x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释5x将反应淬灭,并用水稀释20x用于分析。将样品通过如实施例31、表31.1中描述的RapidFire-MS/MS来分析。鉴定以大于SEQ ID NO:8088的量从莱鲍迪苷A 60和原位合成的ADP-葡萄糖产生莱鲍迪苷M的糖基转移酶变体多肽。工程化多肽在表75.1和表75.2中列出。如实施例1中描述的生长摇瓶规模的培养物,裂解、澄清并冻干成粉末,用于分析表75.3中示出的相对于SEQ ID NO:8088的变体。
Figure BDA0002229282040007171
Figure BDA0002229282040007181
Figure BDA0002229282040007191
Figure BDA0002229282040007192
Figure BDA0002229282040007201
从蔗糖向ADP并且然后从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的葡糖基转移的SFP表征测定和分析
将摇瓶粉末(SFP)重构为20g/L的浓度,并在100μL总反应体积中稀释至0.005-0.15g/L SFP,总反应体积为50mM磷酸钾缓冲液、pH 6、15mM甜菊苷(>95%纯度)或莱鲍迪苷D、0.1g/L ADP(Amresco,超纯级)共底物、0.05g/L SUS SFP SEQ ID NO:8420和37.5mM蔗糖(蔗糖)。将反应在60℃在
Figure BDA0002229282040007202
滴定板振荡器中以300RPM振荡孵育4小时。通过用水稀释20x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释5x将反应淬灭,通过离心来澄清,并用水稀释15x用于分析。将糖基化产物通过如实施例31、表31.1中描述的SPE-QQQ来检测。一锅反应用0.01-0.3g/L SFP在100μL总反应体积中来进行,总反应体积为50mM磷酸钾缓冲液、pH 6、20g/L RebA60、0.025g/L ADP(Amresco,超纯级)共底物、0.05g/L SUS SFPSEQ ID NO:8420、0.12g/Lβ1,2GT SFP SEQ ID NO:7784和40g/L蔗糖(蔗糖)。将反应在60℃在
Figure BDA0002229282040007203
滴定板振荡器中以300RPM振荡孵育16小时。通过用水稀释20x将反应物溶解,通过用具有0.2%甲酸的乙腈稀释5x将反应淬灭,通过离心来澄清,并用水稀释20x用于分析。
Figure BDA0002229282040007211
在这些实验中,表75.3中的所有十一种变体比SEQ ID NO:8088从莱鲍迪苷A 60产生更多的莱鲍迪苷M,并且八种变体还从甜菊苷产生更多的莱鲍迪苷A以及从莱鲍迪苷D产生更多的莱鲍迪苷M。因为SEQ ID NO:8598在一锅测定中的优越表现,选择SEQ ID NO:8088作为用于催化从ADP-葡萄糖向甜菊苷和莱鲍迪苷D的糖基转移以分别形成莱鲍迪苷A和莱鲍迪苷M的最佳的酶。
实施例76
工程化糖基转移酶和再循环酶的热耐受性
使用摇瓶粉末(SFP)进行了三种测定以确定工程化β-1,3-糖基转移酶(β1,3GT,SEQ ID NO:6864)、β-1,2-糖基转移酶(β1,2GT,SEQ ID NO:4550)和蔗糖合酶再循环酶(SUS,SEQ ID NO:2510)的热耐受性。
首先,通过将每种酶SFP在pH 6的50mM磷酸钾(β1,3GT,0.5g/L;β1,2GT,0.25g/L;SUS,0.1g/L)中稀释,并在距测定前0-48h孵育不同时间,在60℃进行了多日稳定性测定。剩余活性的量通过在这个实施例中描述的条件下测定来确定。对于β1,3GT,将10μL的0-48h预孵育的摇瓶粉末用于100μL总反应体积中,总反应体积为50mM磷酸钾缓冲液、pH 6、15mM甜菊苷(>95%纯度)或莱鲍迪苷D、0.2mM ADP(Amresco,超纯级)共底物、0.05g/L SUS SFPSEQ ID NO:2432和37.5mM蔗糖(蔗糖)。将反应在60℃在
Figure BDA0002229282040007221
滴定板振荡器中以300RPM振荡孵育4小时,然后通过用水稀释20x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,通过离心来澄清,并用水稀释15x,用于通过如实施例31、表31.1中描述的SPE-QQQ分析。在28h时、剩余60%的对于莱鲍迪苷D至莱鲍迪苷M的未预孵育的活性,并且在48h时、剩余39%活性;对于甜菊苷至莱鲍迪苷A,28h后剩余34%,并且48h后剩余19%。因此,β1,3GT SEQ ID NO:6864在60℃具有20-40h的半衰期。对于β1,2GT,测定用20mM莱鲍迪苷A(>97%纯度)和50mM蔗糖来相似地进行。在24h时,剩余50-74%的未预孵育的活性,并且在46h时,剩余33%的活性。因此,β1,2GT SEQ ID NO:4550在60℃具有29-58h的半衰期。对于SUS,测定用15mM莱鲍迪苷A(>97%纯度)、37.5mM蔗糖、9mM果糖、和0.5g/L作为偶联的酶的β1,2GT SEQ ID NO:4550来相似地进行。在24h时,剩余89%的未预孵育的活性,并且在48h时,剩余86%的活性。因此,SUS SEQ ID NO:2510在60℃具有>100h的半衰期。这些在60℃的半衰期中的所有三种表现出与野生型酶的较大差异,野生型酶在高于环境的温度不具有显著的稳定性。
其次,在热循环器中,将三种酶中的每一种的相同储备液跨60-69.1℃(SUS)、59.9-79.9℃(β1,2GT)或59.7-75.1℃的温度梯度预孵育24h,并且将酶如以上描述的进行测定,以确定相对于最低预孵育温度(对于所有三种~60℃)的剩余活性。对于β1,3GT,在73.5℃预孵育后,相对于在59.7℃预孵育,剩余20%的活性。对于β1,2GT,在73.6℃预孵育后,剩余17%的活性。对于SUS,在69.1℃预孵育后,剩余85%的活性。在24h高达>70℃的温度的稳定性允许宽范围的发酵下游加工温度,并允许宽范围的甜菊醇糖苷转化温度。通过将甜菊醇糖苷转化反应加热,降低了微生物污染的风险,并且增强了甜菊醇糖苷底物和产物的溶解度,提高了转化率。此外,通过增加温度,固有反应速率略微增加。
第三,将β1,3GT,0.1g/L;β1,2GT,0.025g/L;和SUS,0.01g/L在如以上描述的单一底物转化测定中不预孵育而在55-65℃孵育来测定,以确定酶在这个温度范围内是否将稳健。对于所有三种酶,相对于55℃,在65℃4h后测量的转化率存在<36%的增加或减少。
实施例77
用另外的NDP和NDP-葡萄糖测定工程化糖基转移酶和再循环酶
多种核苷二磷酸(NDP)和核苷二磷酸-葡萄糖(NDP-葡萄糖)可以与工程化糖基转移酶和再循环系统一起使用。
为了确定工程化β-1,3-糖基转移酶(β1,3GT,SEQ ID NO:6864)和β-1,2-糖基转移酶(β1,2GT,SEQ ID NO:4550)对替代的NDP-葡萄糖供体的无选择性(promiscuity),用酶摇瓶粉末(SFP)测试了三种商业上可获得的NDP-葡萄糖:ADP-葡萄糖(Amresco,超高级)、GDP-葡萄糖(Sigma,>97%纯度)和TDP-葡萄糖(Carbosynth,>95%纯度)。对于β1,3GT,将反应用0.025g/L SFP在1mM甜菊苷(>95%纯度)、1mM NDP-葡萄糖、pH 6的50mM磷酸钾缓冲液中进行。在1h、2h和3h时,通过在水中稀释4x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,并在水中稀释5x用于分析。对于β1,2GT,将反应用0.0025g/L SFP在1mM莱鲍迪苷A(>97%纯度)中进行,但在其他方面与以上描述的方法相同。结果在表68.1中总结为第一小时内甜菊醇糖苷底物的转化率百分比(%)。
Figure BDA0002229282040007231
Figure BDA0002229282040007241
为了确定工程化β-1,2-糖基转移酶(β1,2GT,SEQ ID NO:4550)和蔗糖合酶再循环酶(SUS,SEQ ID NO:2510)对替代的NDP辅因子的无选择性,测试了四种商业上可获得的NDP:ADP(Sigma,>95%)、CDP(Sigma,>95%)、GDP(Sigma,>96%)、IDP(Sigma,>96%)。将反应用0.001g/L SUS SFP和0.1g/Lβ1,2GT SFP在10mM莱鲍迪苷A(>97%纯度)、0.2mM NDP、pH6的50mM磷酸钾缓冲液中进行。在1h、2h和3h时,通过在水中稀释40x将反应物溶解,通过在具有0.2%甲酸的乙腈中稀释5x将反应淬灭,并在水中稀释5x用于分析。在100μL反应中使用10μL纯化的蛋白甘油储备液对第二种蔗糖合酶(SEQ ID NO:72)也进行了测试。结果在表77.2中总结为第一小时内的NDP周转率(mmol莱鲍迪苷D/mmol辅因子)。如这些数据表明的,ADP/ADP-葡萄糖的使用提供了有用的反应条件。此外,与其他选择(例如UDP/UDP-葡萄糖)相比,这些化合物从经济角度来看是有益的。
Figure BDA0002229282040007242
实施例78
将莱鲍迪苷A 60%转化为莱鲍迪苷M的方法
Reb A 60(按质量计甜菊苷和莱鲍迪苷A[reb A]的~1:2的混合物)在水和蔗糖溶液中具有未预期的高溶解度。报道甜菊苷和Reb A的单独的水溶解度在3-5g/L的范围内。惊人地,在水中或在200g/L的蔗糖中制备了100-200g/L的Reb A 60溶液,并且在室温放置一周后,在所述溶液中没有沉淀产生。值得注意的是,在反应的过程中,Reb D中间物和Reb M产物都以远超其被报告的溶解度限值(分别为~0.3-0.5g/L和3-5g/L)的水平(约30-50g/L)保持可溶(如通过均匀反应混合物明显的)。Reb A 60起始材料和Reb D中间物的未预测的高溶解度大幅增强了该方法的效率。
用工程化β-1,3-糖基转移酶(β1,3GT,SEQ ID NO:6138)、β-1,2-糖基转移酶(β1,2GT,SEQ ID NO:3696)和蔗糖合酶(SUS,SEQ ID NO:1846)开发了将Reb A 60转化为莱鲍迪苷M的方法。制备由pH 6的50mM磷酸钾缓冲液中的0.2g/L SUS、0.1g/L ADP和200g/L蔗糖组成的再循环储备溶液。将β1,2GT在该溶液中溶解至1.6g/L,并将β1,3GT的单独储备液在再循环储备溶液中溶解至2.0g/L。然后,将100mg的Reb A 60放置在一打兰小瓶中,并添加1.6g/Lβ1,2GT储备液和2.0g/Lβ1,3GT储备液每种0.5mL。将所得均匀溶液在55℃搅拌。沉淀物逐渐产生,并且在24h时,反应混合物为稠的白色浆液。HPLC分析显示出存在90-94%的Reb M(~120-130g/L Reb M)。
在另一个实验中,将以上反应在0.5g/L ADP和10mM EDTA的存在下进行。在这些条件下,β1,2GT和β1,3GT两者的载量均减少至0.4g/L,同时仍达到>90%转化为Reb M。当以10-15L规模发酵产生冻干的酶粉末,并以60℃热处理及超滤来下游加工时,在β1,2GT储备液对β1,3GT储备液的某些比率,95%的甜菊苷和Reb A 60中的莱鲍迪苷A转化为莱鲍迪苷M。
用另一组工程化β-1,3-糖基转移酶(β1,3GT,SEQ ID NO:6864)、β-1,2-糖基转移酶(β1,2GT,SEQ ID NO:4550)和蔗糖合酶(SUS,SEQ ID NO:2510)酶开发了将Reb A 60转化为莱鲍迪苷M的方法。制备由pH 6的50mM磷酸钾缓冲液和10mM EDTA中的0.2g/L SUS、0.5g/L ADP和200g/L蔗糖组成的再循环储备溶液。将β1,2GT在该溶液中溶解至0.6g/L,并将β1,3GT的单独储备液在再循环储备溶液中溶解至1.2g/L。然后,将100mg的Reb A 60放置在一打兰小瓶中,并添加0.6g/Lβ1,2GT储备液和1.2g/Lβ1,3GT储备液每种0.5mL。将所得均匀溶液在60℃搅拌。沉淀物逐渐产生,并且在24h时,反应混合物为稠的白色浆液。HPLC分析显示出存在90-92%的Reb M(~120-130g/L Reb M)。在60℃将该反应放大规模至20mL中的2克Reb A 60、和0.6g/Lβ1,2GT、0.2g/L SUS、及1.2g/Lβ1,3GT、以及0.5g/L ADP和10mM EDTA,并且使用JECFA方法通过曲线下面积确定获得了87.1%的RebM。对于纯化,将反应混合物在40℃离心,弃去上清液,并用1体积去离子水将沉淀重悬浮,在20℃离心,并弃去上清液。将该洗液重复进行共四次洗涤,并将沉淀冻干,如使用JECFA方法通过曲线下面积确定的产生了94.3%的RebM。
为了所有目的,本申请中引用的所有公布物、专利、专利申请和其他文件特此通过引用以其整体并入,其程度如同每个单独的公布物、专利、专利申请或其他文件被单独指出为了所有目的通过引用并入一样。
虽然已说明并描述了多种具体实施方案,但是应当理解,可以进行各种改变,而不偏离本发明的精神和范围。

Claims (131)

1.一种工程化糖基转移酶,所述工程化糖基转移酶包含与SEQ ID NO:2具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
2.如权利要求1所述的工程化糖基转移酶,其中所述工程化糖基转移酶包含与SEQ IDNO:4、8、32、232、348、548、562、696、758、696、770、792、954、696、1002、1054、2600、2718、2814、2884、3016、3082、3244、3502、3346、3502、3696、4256、4684、4838、4876、5066、5290、5372、5562、5708、5976、6138、6288、6468、684、7388和/或8088具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽。
3.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶优先地使用除尿苷二磷酸以外的糖供体。
4.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:10、262、10/262、278/284/311/339/360、283、307、309、339/361、344/361和361,其中所述位置参照SEQ ID NO:4来编号。
5.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:112/172/283/318、112/261/318、112/282/283/431、137/283、137/283/431、163/318、261/283/306/337、261/283/337、261/337、269/318、282/283、282/283/431、283、283/306/308/360、283/306/337/426、283/318/337/360、283/360、318、360和431,其中所述位置参照SEQ ID NO:8来编号。
6.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:4、6、22、22/84/87/154/198/199/356、22/84/87/154/198/199/306/356、22/84/87/154/199/306/356、22/84/87/154/356、22/84/87/154/198/199/306/356、22/84/87/154/199/306/356、22/84/87/198/199/306/356、22/84/87/198/199/356、22/84/87/198/199/306/356、22/84/87/198/199/356、22/84/87/199/306/356、22/84/87/199/356、22/84/154/198/199/207/306、22/84/154/198/199/306、22/84/154/198/199/356、22/84/154/198/199/356、22/84/154/198/199/356、22/84/154/199/356、22/84/154/199/207、22/84/154/199/356、22/84/154/207/306/356、22/84/154/306/356、22/84/154/198/199/306/356、22/84/154/198/199、22/84/154/198/199/306/356、22/84/154/199/306/356、22/84/154/199/356、22/84/154/199/356、22/84/198/199/306/356、22/84/199/356、22/84/207/356、22/84/356、22/84/154/198/199/306/356、22/87/154/198/199/356、22/87/154/199/306/356、22/87/154/322/356、22/87/154/198/199/356、22/87/154/199/356、22/87/154/198/199/207/306/356、22/87/154/199/207/356、22/87/154/199/356、22/87/154/199/306/356、22/87/198/199/306/356、22/87/198/199/306/356、22/87/198/199/207/356、22/87/198/199/356、22/87/199/356、22/87/199/356、22/154/198/199/207/306/356、22/154/198/199/356、22/154/199/356、22/154/198/199/306/356、22/154/199/356、22/154/199/207/306/356、22/198/199/356、22/198/199/207/329/356、22/199/356、22/207/356、22/356、64、74、84、84/154/198/199、87、97、106、110、112、137、139、154、159、169、179、191、195、198、199、207、233、259、261、262、306、347、356、396、417、421、427和435,其中所述位置参照SEQ ID NO:32编号。
7.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:64/106/109/112/131/159/233/421/427/431、64/106/109/112/417/421/427/431、64/106/109/139/179/417/421/427/431、64/106/109/233/347/427/431、64/106/112/347/417/421、64/106/139/179/233/417/427/431、64/106/417/421、64/106/431、64/106/109/112/131/179/417/427/431、64/106/109/417/421/427/431/439、64/106/112/139/159/179/204/396/417、64/106/112/159/179/417/421、64/106/204/417/421/427、64/109/112/139/159/179/417/431、64/109/112/139/417、64/109/139/233/417/421、64/109/159/179/204/233/417/421、64/109/417/421、64/109/417/421、64/139/233/417/427/431/439、64/139/347/417/421/427/431、64/417/421/431、106/109/112/131/159/179/417/421、106/109/112/131/159/204/347/417/421/427、106/109/112/204/347/421/439、106/109/112/261/417/431、106/109/112/347/427、106/109/139/427/431、106/109/417/421/427、106/112/159/204/233/417/421/427/431、106/112/233/417、106/112/396/417/421、106/139/159/233/347/417/421/427/431、106/233/421/427、106/417、106/109/139/347/417/421/427、106/109、106/109/139/233/417/421、106/109/139/417、106/109/233/427/431、106/112/159/179/204/417/421、106/112/159/179/233/417/421/427/439、106/131/179/233/421/427/431、106/139/421、106/347/417/427/431、109/112/131/159/179/439、109/112/131/159/417/421、109/112/139/179/417/427、109/112/159/179/417/421、109/112/159/417/427、109/112/179/204/233/417/421/427、109/112/179/347/417、109/112/204/233/417、109/112/204/427、109/112/233/417/431、109/112/417/421/427、109/112/417/427/431、109/131/139/179/261/396/421、109/131/204、109/139/179/417/421/427、109/139/179/417/427、109/179/233/421、109/204/417/431、109/417/421、109/417/427/431、112/131/179/204/417/421/427、112/131/179/347/417/421、112/139/179/204/233/347/427、112/159/417/421、112/417/421、131/179/233/417/427、139/233/417、159/347/417/421/431、179/417/421、233/417/421/427/431和347/417,其中所述位置参照SEQ ID NO:232来编号。
8.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/100、28/44/365/407、38/118/290/351/375/401/422、38/178/401、38/290/351/401/422、54/413、74/102/137/161/259/289、92/118、98/233、102/161/250/435、106/112/204/347/396/417、106/112/204/347/396/417/427、106/112/204/347/396/417/427/431、110/222/250/259/435、112/204/347/396/417/427、112/204/347/396/417/427/431、118/156/178/290/375/401/422、137/161/435、137/169、159/169/173/300/424/438、185/290/401/422、204/347/396/417/431、290/351/401和435/438,其中所述位置参照SEQ ID NO:348来编号。
9.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/28/38/74/100/102/118/161/169/178/233/250/407/422/438、14/28/38/74/102/156/159/233/250/289/413/422/424/435/438、14/28/38/100/102/110/159/161/233/259/290/300/351/435、14/28/38/110/137/161/222/289/401、14/28/44/74/98/102/137/159/161/185/222/250、14/28/44/92、14/28/44/161/169、14/28/44/375、14/28/54/161/185/413、14/28/54/365、14/28/74/98/100/102/161/173/178/233/250/259/290/407、14/28/92/100/102/159/161/169/233、14/28/92/100/102/159/161/233/351/422、14/28/92/100/102/422/424/435、14/28/92/100/161/222/233/289/300、14/28/100/137/156/161/222/259/289/365/401/435/438、14/28/100/156/161/250、14/28/102/118/137/161/185/222/250/259/401、14/28/159/289/290/300、14/28/159/365/435、14/28/35、14/38/74/110/156/161/173/178/222/300、14/38/100/102/161/173/178/222/250/375/401/413、44/74/100/102/161/233/365/435/438、14/74/110/159/161/169/173/250/259/290/375/407/422、14/74/161/375/401、14/92/98/100/159/161/259/365/422/424/435、14/110/156/161/375/401/435/438、14/159/161/365/435/438、14/161/222/250/259/289/375/401/413、14/161/222/250/435/438、14/161/300、28、28/38/92/98/100/102/156/161、28/44/74/401、28/44/92/161/222/300/413、28/44/98/100/102/118、28/44/118/156/161/222/289/435/M438、28/44/289/290/351/422、28/44/435/438、28/54/92/159/161/290、28/54/159/290/438、28/54/250/439、28/74/156/159/161/178/300/365/435/438、28/74/156/161/365/407、28/74/161/290/365、28/92/100/102/110/161/185/250/300/375/435、28/92/98/100/110/156/161/401、28/92/118/159/222/250/259/300/407、28/156/161/185/435/438、28/156/161/233/259/300/435、28/98/100/102/161/185/351/401/435/438、38/161/300/438、74/98/100/102/110/118/161/178/250/289/290/300/435/438、74/98/100/102/118/156/159/161/435/438、74/156/161/173/178/424/435、74/375/435、98/100/118/159/161/300、98/100/156/159/161/178/259/289/290/351/422、102/137/159/161/422/424、118、137/159/161/185/300/351/365/435、156/159/161/169、159/161/222/290/375/407、159/161/401和161/259/289/435/438,其中所述位置参照SEQ ID NO:548来编号。
10.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:19/44/110/191/198/199/208/300/365、19/75/76/87/92/199/207/208、19/87/92/191/199/209/413/435、44/76/197/199/208/351、44/87/92/137/159/199/209、44/87/137/159/169/191/199/208、44/87/137/191/197/209/289/401、44/87/199/208、75/76/87/92、75/76/87/92/290/300、75/76/87/191、75/76/87/191/197/199/209/300、75/87/92/169/207/208/300/413/435、75/87/110/137/169/191/199/208/209/289/435、75/87/110/191/197/198/207/208/289/290/300/401/413、75/87/300、75/110/197/199/208/290/300/401/413、76/92/199/209、87/92/197/198/199/208/300、87/137/435、87/169/191/199/207/209/401/413、87/191/198/199/222/244/289/300/435、87/92/110/169/199/207/209/290/300、87/92/159/169/191/198/290/413/435、87/92/159/191/199/208/209/289/290、87/92/208/401、87/435、92/137/191/199/209、92/197/199/207/208/401、137/198/199/207/208/426/435、137/199/208/209/290/435、137/365、159/197/199/207/209、169/191/197/199/207/208、169/197/199/207/209/222/300/413/435、191/207/208/289/290/413/435和197/198/199/208/209,其中所述位置参照SEQ ID NO:562来编号。
11.如权利要求2的工程化NDP-糖基转移酶,其中所述工程化NDP-糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:69/173/175/243/246/354/365/383/399、69/173/243/383/399、56/191/354/383/399、70/225/246/409/413、70/115/225/409、70/225/413、70/225/247、74/310/396/424、74/396和173/175/191/365/383/399,其中所述位置参照SEQ ID NO:758来编号。
12.如权利要求2的工程化NDP-糖基转移酶,其中所述工程化NDP-糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24、24/28、24/28/262、24/28/262/264、24/28/262/264/423、24/264/294、28、28/262/264、28/423、32、56/69/70/175/191/246、56/69/70/175/191/246/354、56/69/70/175/354、56/69/70/191/246/354/365、56/69/70/246/354、56/69/175/191/246/354、56/69/175/246/354、56/69/175/246/354/365、56/69/246/354、56/69/246/365、56/70/175/191/246、56/70/175/191/246/354、56/70/175/191/354/365、56/70/175/246/354、56/70/175/246/365、56/70/191/246/354/365、56/70/191/354、56/175/246、56/175/354、56/175/354/365、56/191/246/354、56/191/354/383/399、56/246、56/246/354/365、56/354、69、69/70/175/191/246/354/365、69/70/191/246/354/365、69/70/246、69/70/354/365、69/173/175/243/246/354/365/383/399、69/173/243/383/399、69/175/191/246/354、69/175/354、69/246/354/365、69/354、70、70/115/225/409、70/175/191/246/354/365、70/175/191/354/365、70/191/246/354/365、70/191/246/365、70/225/246/409/413、70/225/247、70/225/413、74/310/396/424、74/396、126、126/220、126/403、173/175/191/365/383/399、175、175/191、175/191/246/354/365、175/191/354、175/191/354/365、175/246/354、175/246/354/365、175/354、191/246/354、246/354、262/264、264、264/29、269、325、341、351、354、354/365和366,其中所述位置参照SEQ ID NO:770来编号。
13.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24/32/264/269/330/402/403、24/32/264/269/382/403/406、24/32/264/330、24/32/269、24/32/269/382/385/389/402/406、24/32/269/403、24/32/330、24/264/269/389/402/406、70/126/175/191/246/325/354/366、70/126/175/325/330/351/354/366、70/126/191/246/325/351/354/366/423、70/126/191/246/325/351/354/423、70/126/191/246/325/351/366/423、70/126/191/246/354/366、70/126/246/330/366、70/126/246/354/366、126/211/220/253/316/342、126/211/220/275/279/323、126/211/260/423、126/220/260、126/220/316、56/220/260/423、220/260和220/260/423,其中所述位置参照SEQ ID NO:792来编号。
14.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24/32/97/162/202、24/32/126/198/201/367、24/32/126/198/202/220/226/260/269S、24/32/146/226、24/32/198/201/220/226、24/32/198/201/226、24/97/260/367、32/97/198/202/226/260、32/202/367、32/226/367、56/175/197/211/330/382/385、56/175/197/253/385/389、56/175/264/382/385/389/402/406、56/197/264/279/330/382/389/402/403/406、56/211/253/316/323、56/211/264/316/389、56/211/279/323/330/402、56/264/385/389、97/202/367、162/220/226/367、175/197/211/264/330、175/211/264/279/316/323、175/211/279/323/330/402/403/406、175/211/323/382/402/403/406、175/211/403/406、175/264/316/323/330/403/406、175/264/316/389/402、175/264/323/330、197/211/316/342/406、197/211/316/382/389/402/403、197/211/402、197/279/323、198/201/367、198/202/220/269/367、201/202/367、211/382/406、211/385/389、211/402/403和389,其中所述位置参照SEQ ID NO:954来编号。
15.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:24/32/175/211/260/330/403/406、24/32/175/226/253/275/316、24/32/201/226/260/264/330/402/406、24/162/175/198/211/226/275/316/323/389、24/162/175/201/275/316、24/162/198/201/211/226/323/351、24/162/198/201/226/351、24/162/201/253/264/351/402/406、24/175/198/211/226/253/316、24/175/201/275/316/351、24/175/201/316、24/175/211/220/260/275/330/389、24/175/211/253/316、24/175/211/316/330、24/175/226/323/351、24/198/201、24/198/201/211、24/198/201/211/220/260、24/198/201/220/275/389/402/406、24/198/201/226/330/389、24/198/201/351、24/201/211/253/323/351/366/389/402/403、24/201/226/253/402/403/406、24/226/330/351/403、175/198/201/211/226/260/264/323/402/406和175/198/226/260/351/402/403/406,其中所述位置参照SEQ ID NO:1054来编号。
16.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21/127/129/161、21/127/129/161/162、21/127/129/162/199/200、127/129/161/162/199、127/129/161/199/200、127/129/162、156、156/161、156/161/162、156/162/199和156/199/200,其中所述位置参照SEQ ID NO:1002来编号。
17.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/7/12/15/175/260/318、7/12/400/435、7/318/451、12/15/57/71/175/260/400/402、12/15/57/220/254/260/318/402、12/15/57/318/402/435、12/15/318/400/402/406、12/57/175/451、12/175/260/264/318/400、12/175/400/402/406、12/318/402/404/406/451、12/318/402/404/451、15/175/318/400/402、32、57/175/220/260/264/402、57/175/404、57/220/260/400/402/406、57/260/400/402/404、57/400/402、57/402、135、148、152、152/192/195、160/186/195、186、195、260、237、239、240、323、325、326、327、330、331、356和400/402,其中所述位置参照SEQID NO:2600来编号。
18.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11、14/23/274/326/329、14/31/184/274/322/326/329/330、14/56/184/185/194/238/239/274/329/399、14/56/184/194/234/315/326/329/399/401、14/56/194/238/315/325/326/329/330/399、14/56/252/274/315/326/329/330/401、14/184/185/194/234/325/326/329、14/184/185/194/388/399/401、14/184/194/355/399、14/185/194/238/399、14/185/236/238/239/274/322/326/329/355/399/401、14/194、14/322/326/330、14/326/330、14/355、14/355/399、23/31/147/184/185/238/252/325/329/330/388/401、31/56/315/329/330、45、55、56、58、65、65/114/132/238、65/238/240、104、113、114、132、135、138、147/236/238/243/315/329/330/399/401、165、185/194/236/239/325/326、223/412、238、256、273、286、309、391、422、430和449,其中所述位置参照SEQ ID NO:2718来编号。
19.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:23/31/185/324/401、23/31/185/355、31/134/185/252/274/324/388、31/134/238/252/322/324/388、31/134/252/324、31/184/185/238/239/322、31/236、31/322、31/388、122、134/184/185/234/236/239/274/324/388、164、176、177、184/185/322、234/236/238/322/324/355、236、238/324/329/355、316、322/324、324/329/355/401、325、400、425、426、427、440和446,其中所述位置参照SEQ ID NO:2814来编号。
20.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11、11/45/58/132/138/286、11/58、11/58/65/104/107/138/286、11/58/65/107/135/223/286/391/430、11/58/65/135/138、11/58/104/107/114/138/223/391、11/58/114/286/309/391、11/58/132/165/286/391/422/430、11/58/138/309、11/65/104/107/138/165/286/391/430、11/65/107/135/165/391/430、11/65/132/135/138/223/391、11/65/132/135/252、11/65/132/391/430、11/65/135/138、11/104/132/138/309/391、11/104/132/138/391、11/107/114/223/309/430、11/107/138、11/114/135/138/223、11/114/223/252/286/391、11/132/135/138/223/286、11/132/138/223/286/391、11/138/165/223/309、58/65/138、58/65/138/165、58/65/165/309/430、58/104/114/165/391、107/114/132/138、107/430、135/138/165/309/430和223/309,其中所述位置参照SEQ ID NO:2884来编号。
21.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/448、9、58/107/122/176/236/324/325/400/426/427、58/107/122/236/324/400/425/446、58/107/122/322/400/425/427/440/446、58/107/164/400、58/107/236/400、58/107/400、58/122/164/236/446、58/122/176/236/400/446、58/122/176/322/324/426/427、58/122/176/400/425/426/427/446、58/122/322/325、58/122/325、58/122/440、58/164/176、58/164/324/425/427、58/176/236、58/236、65、106、107/122/236/425/426/446、107/164/236/400/446、107/176/322/325/440/446、107/176/400/425/427/440、107/236、107/440、115、116、122/164/176/324/400、122/164/400/440、122/164/400/440/446、122/176/236/400、122/176/324/400/440、122/400、122/425/426/446、122/440/446、139、139/252、164、164/271/425/426、164/322/324/325/400/425/440/446、164/400、172、176/400、178、189、200、210、213、240、242、245、255、324/400/425/426/440/446、324/423、385、408、409、411、412、415、416、423、447和448,其中所述位置参照SEQ ID NO:3016来编号。
22.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、3、8、8/107/139/164/415/416/440/448、8/107/139/255/322/325/415/416/440/448、8/107/164/255、8/107/164/423/440、8/139、8/139/164/200/236/240/322/440/448、8/139/164/236/416/423/440、8/139/189/240/325/416、8/139/200/236/240/255/423、8/139/255/415/416、8/164、8/164/189/200/322/324/325/416/448、8/164/240/423、8/164/252/255/448、8/164/448、8/236/240/252/448、8/240/423、8/252/255/322/325/448、12/164/440、20/126/128/155/161、20/126/128/160/161、20/126/128/160/161/198、20/126/128/161、20/126/128/161/198/199、20/126/155/160/198、20/126/155/161、20/126/160、20/126/160/161、20/126/161、20/128/155/160/161/198、20/128/155/161/199、20/128/155/199、20/128/160/161/198、20/155/160、20/155/160/161、20/155/161、20/155/161/199、20/160/161/198、34、72、73、75、107/139、107/139/200/240/322/324/325/448、107/236/240/325/440、107/240/252/423/448、107/423、113、114、121/126/128/161/369、126/128/155/160/161、126/128/155/160/161/199、126/128/155/161/199、126/128/160/161/369、126/128/160/198/369、126/128/160/199/369、126/128/160/369、126/128/161/199/369、126/128/161/369、126/128/369、126/160/161/199/369、126/160/198/369、126/196/198/369、126/198/369、126/199/369、126/369、128/155/160/161、128/155/160/161/199、128/155/160/198、128/155/199、128/160/161/369、128/161/199/369、128/198/199/369、128/199/369、128/369、139、139/164/236/240、139/255/325/415/440、155/161/198/199、155/199、160/161/369、161/198/369、161/369、164/189、164/189/236/240、164/189/240/252/415/423、164/200/236、164/200/236/240/324/416/440、164/200/236/255/322/324/423/440、164/236、164/236/240/440、164/236/423、164/322/325、164/322/325/416/423、164/416/448、186、189、199/369、200/236/322/325/416、200/322/325/415/448、221、235、236/415/416、237、239、240、240/252/255/322/415/416、240/252/255/415/448、255/423、256、286、299、305、309、312、313、323、325、355、389、406、415/416/448、422、438和446,其中所述位置参照SEQ ID NO:3082来编号。
23.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14、35、42、46、49、105、106/164/172/200/409、106/164/172/210/240/415、106/164/172/242/409/416、106/164/200/210/242、106/164/200/210/415、106/164/200/240/408/409/416、106/164/210/240/408/409/416、106/164/210/408/409、106/164/240/415、106/164/409/415/423、106/172/200/210/240/242/408/415/416/423、106/172/200/210/242、106/172/240、106/172/240/242/409/415、106/172/242、106/172/242/416/423、106/172/408/409、106/172/409/423、106/200/210/409、106/210/240、106/210/240/408/415、106/240/242、106/240/242/409、106/242/408/409、134、143、164/172/200/210/242/409、164/172/240/242/415、164/172/242/408、164/200/408/415/416、164/240/242/408、164/240/242/415/423、164/423、172/200/210/240/408、172/200/240、172/200/408/416、172/210/415、172/240、172/240/242/415、172/240/409、179、181、200/210/240/242/409、200/240/242/407、200/242/415/416/423、200/408/409、210/240、232、240、240/242、240/242/408/416、240/242/415/423、240/408、240/415、278、290、336、373、381、401、409/415和441,其中所述位置参照SEQ ID NO:3244来编号。
24.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21、91、125、127、130/187、143、143/150、145、152、156、186、187、195、197、200、201、202、264、268、364、365和415,其中所述位置参照SEQ ID NO:3346来编号。
25.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/5/113/186/237/406、2/73/186/237、2/189/286、2/286/355/416/422、5/34/73/113/406、5/73/186/406、5/113/237/406、5/186/237/245/256/406、5/186/237/406、5/256/406、34/113/186/237/406、72/73/172/235/240/242/438、72/172/239/240/242/408、72/172/240/242、73/172、73/172/235/239/240、73/172/235/239/242、73/172/239/240、73/172/239/240/242、73/172/240/242/408、73/172/240/408、73/186/237/406、73/235/240/323、73/235/240/408、73/237、73/239/242、96、113/186/406、127、132、144、153、155、156、172、172/188/323、172/235、172/235/239/240/242、172/235/239/408、172/235/240、172/235/240/242/438、172/239/240/242/323/408、172/240、172/240/299/323、186、186/237、186/237/286、186/406、187、189/333/355/421,196、199、200、235/239/240、235/240/242、237、239/240、239/240/242/256/323、239/240/242/323/408、239/240/408、239/242/408、240/242/256/438和242/408,其中所述位置参照SEQ ID NO:3502来编号。
26.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/5/35/105/143/237/373/416/422、2/5/35/143/232/237/416/422/441、2/5/35/232/278/373/416、2/5/105/143/232/373/416/422、2/5/278、2/105/143/232/237/278/373/441、2/143/232/373/441、2/143/373/441、3、5/35/232/373/416/422、5/105/232/237/373/416/441、5/105/237/278/422/441、5/105/237/416/422/441、5/143/189/232/237/441、5/143/232/237/278、5/143/232/237/416/422、5/143/232/373/422/441、5/143/237/278/373/416/422、5/143/373、5/189/237/278/373/416/422/441、5/232/416/422、5/237/373/422、5/373/416、8、26/42、26/42/46/49、26/42/46/49/134、26/42/46/49/134/186、26/42/46/134、26/42/49/134、26/42/49/134/186/355、26/42/49/134/401、26/42/134/401、26/49/134、26/134、26/134/186/355/401、26/134/355、26/134/401、26/355/401、35、35/105/189/232/373/416、42/46/49/97/134/401、42/46/49/134、42/46/49/134/186、42/46/49/134/186/355、42/46/49/134/235/355/401、42/46/49/134/401、42/46/49/186、42/49/134/186/355、42/49/134/186/401、42/49/134/355/401、42/134/186、42/186/355、46/49/134、49/134/355、50、61、62、101、105/143/232/237/373/416/422/441、105/143/278/373、105/189/237、105/237/278/373/416/422、105/237/373/422/441、105/373、105/373/441、134/401、137、143、143/189、143/189/232/422/441、143/189/237/373/416/422、143/232、143/237、143/237/422/441、158、161、164、176、186/355、189/232/373/416/422/441、189/237/278/416/441、193、223、223/243、232/237、237/373、235、237、237/373/441和239、240、243、244、248、249、301、323、330、352、364、426和427,其中所述位置参照SEQ ID NO:3696来编号。
27.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5/73/113/186/187/373/423、5/73/143/144/179/186/187/422、5/73/144/179/186/373/423、5/73/144/187/373/422、5/143/144/179/181/186/187/373、5/144/179/181/373/422、5/144/373/422、11、12、41、44、44/187、45、49/96/127/132/156/196、49/96/127/153/278、49/96/132/153/155/156/237/278/406、49/96/132/153/199/200、49/96/132/155、49/96/132/155/237/278、49/96/155/199/200/406、49/153/155、55、56、57、65、66、70、72、73、73/113/143/179/181/422、73/113/179/181/186/187、73/143/144/179/186/187/373/423、73/179/181/186/187/373、73/179/181/186/373/422、73/181/186/187、74/238、82、83、85、96/127/132/153/278、96/127/153/155、96/132/153/155、96/132/153/155/156、96/132/153/155/156/200、96/132/153/156、96/132/196/199、96/132/278、96/153/155/156、96/153/155/199/200/237、96/153/406、103、111、113、113/143/179/186/187、113/144/186/423、113/144/373、113/181/186/373/422、113/373/422、114、117、127/132、127/132/153/156、127/132/155/156/406、127/153/155/199/200/237、127/406、132、132/153/155、132/153/237/406、132/155、132/237、135、138、140、143/144/179/181/186/187/422、143/179/181/186/187/422/423、144/179/181/186/187/373、144/179/186/187/373、153/155/156/237、153/155/196/199/237、153/199/406、153/237、155/199、159、160、162、167、179/181/186、179/181/186/187/423、179/186/187、179/187/373/422、181/186/187/422/423、182、214、220、222、223、226、236、238、256、286、299、309、373/423、387、388、389、391、393、406、408、412、418、422、429、430、449和450及373/423,其中所述位置参照SEQ ID NO:3956来编号。
28.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7、8/375、9、10、12、50/137/189/375、53、62/153/155/156/159、62/153/155/156/159/427、62/153/155/199/406、65、68、99、106、110、115、116、131、132、136、137/164/375、153、153/155/156、153/155/156/159/199/238/406、153/155/237/238/239/406、153/155/238/239、153/155/427、153/156/159、153/156/199/237/427、153/156/427、153/159/237/238/352、153/176/181/427、155/156、155/156/176/181/199、155/156/176/238/427、155/181/199/238/406、156/199、156/199/427、164/375/433、170、178、190、192、194、200、220、223/375、238、242、245、257、272、280、302、304、335、375、385、395、399、402、408、412、416、423、427、445、447和449,其中所述位置参照SEQ ID NO:4256来编号。
29.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:11/41/44/127/132/406、11/41/44/127/278/406、11/41/45/73/127/278/406/408、11/41/45/127/278/406、11/41/132/278、11/44/45/127、11/44/73/127/132/135、11/44/73/127/132/135/406/408、11/44/127、11/44/132/278/406、11/45/73/127/135、11/45/127/132/135/138/182、11/45/406、11/73/127/132/135/182/278、11/73/127/132/278/406/408、11/73/127/132/406/408、11/73/132、11/73/132/135/408、11/127/132/135、11/127/132/135/182、11/127/132/135/406、11/127/132/138/182、11/127/132/182、11/132/135/406、11/182/406、41/44/45/73/127/132/278、41/45/127/132/135/278/406、41/73/132/135/406、44/45/73/132/135/406、44/45/127/132/135/138/182/406/408、44/45/127/132/278、44/73/127/135、44/73/127/135/182/278/406/408、44/73/132/135/406/408、45/73/127/132/135/406/408、45/73/132、45/73/132/135/182、45/73/278/406/408、45/127/132、45/127/132/135/182、45/127/132/135/182/406/408、45/127/135、45/132/408、45/406、56/309/449、57、65/114/422/427、65/114/427、65/143、65/143/235/427、73/127、73/127/132、127、127/132/135/182、127/132/135/182/406、132/135、132/135/182、132/135/406、132/406、164、164/220/309/449、164/220/449、164/449、182、220/449、309、309/449、406、418/427、427、427/429和449,其中所述位置参照SEQ ID NO:4550来编号。
30.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、4、7/10/73/127/132/385/423、10、10/53/73/99、10/53/272/423/427、10/53/423、10/73、10/73/127、10/127/132/385、10/132/302/385、11/44、11/71、11/287、11/441、37、40、42、42/138、42/141、43、46、47、48/398、49、49/406/408、51、53/73/200/423、53/127/132/385、53/127/136/385、53/132/136/302/423/427、53/132/302/385/423/427、64、65/106/445/447/449、65/143/220、65/220/309/445/447、65/220/445/449、65/399/406/447/449、65/402/406/445/449、65/445/447/449、65/447/449、71、73、73/127/427、73/132/136/385/427、73/385、73/385/427、76、97、100、106/220/399/402/406、108、108/172、109、112、115/116/278、115/170/190/238/412、115/190/194、115/245/278、116/170/190、116/190/406/408、116/238、116/238/245、116/416、117/157/301、118、118/406/408、119、119/172、127、130、132、133、134、141、143/220/445/447、143/309/402、143/309/445/447/449、157、169、170、170/190/192/194、170/192、170/192/194/278、170/192/194/335、170/194、170/194/335/416、170/238、170/335、170/335/416、172/420、172/437、179、181、190、190/192/194、190/194、190/194/238/245、190/194/335/416、190/194/412、190/245/412、192/194、192/194/242/406/408、194、200、200/385、220/399、220/445、220/445/447、257/385、259、272/302、272/385、274、275、278、287、288、302/385、309/399/449、309/445/447/449、333/398、333/406/408、338、356、357、376、381、385、394/420、396、397/406/408、398、401、385、385/427、399/406、399/406/449、402/445/449、406/408、406/445/447/449、406/445/449、410、417、420、423/427、434、437、441、445/447/449、445/449、447和449,其中所述位置参照SEQ ID NO:7324来编号。
31.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:10、10/144、10/199、11、11/64/109、11/445、13、14、15、15/394、16、22、36、42/43、42/44/71/73/116、43/73/141、46/47/51、46/51、47/49、47/51、64、64/65/109、64/65/112、64/112、64/134、64/445、65/112、65/112/445、71、71/73、71/73/141、71/141、71/302、73、73/116/141、73/141、73/302、89、93、96、109、109/112、109/115/118、109/134、109/406、112、112/445、116、116/123、116/287、116/143、116/350、123、125、127、127/169/172、127/169/287、127/169/376/398/399、127/169/398/399、127/287、127/376、141、141/302、143、144、149、156、169/172/287、169/172/288、169/172/288/398/399/420/423/427、169/172/398/399、169/287、169/398、169/398/399、186、187、197、198、199、201、202、203、268、287、287/288、287/376、287/398、287/399、287/420/423/427、288、288/376/398、288/398、288/399、302、324、331、350、376、376/398、376/399、398、398/399、398/399/420、398/427、399和420,其中所述位置参照SEQ IDNO:7784来编号。
32.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:22、25、51、56、71、78、80、81、88、157、185/208/230/252/255/290/365、189/206/208/365、200、208/365/435、243、245、249、259、262/401、279、282、284、304/322/365/401、308、338、339、352、362、364、365/401/413/435、366和374,其中所述位置参照SEQ ID NO:696来编号。
33.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:51/56、51/56/243/249/282/353/362/366、51/56/243/249/308/362/364、51/56/249/353、51/56/249/362/364、51/56/249/362/366、51/243/249/308/353、51/243/249/348/362/366、51/249、51/249/282/284/364、51/249/282/353/366、51/249/284/308/362/366、51/249/353/362/364、51/353/362、56、56/243/249/282/364/366、56/243/364/366、56/249、56/249/284/353、56/249/353、56/284/366、243/249/282/284/362/364/366、243/249/308/353/366、243/249/353/362/366、243/282/353/362/364、243/282/362/364/366、243/308/353、249/353/362/366、282、308/366和362/366,其中所述位置参照SEQ ID NO:4684来编号。
34.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:25、25/56/353、25/243/249/259/366、25/243/249/362、25/362/366、51、51/56/200/243/249/259/338、51/56/362、51/71/249/279/284/362/366、56/243/249、56/362/366、70/198/259/313、85、88、88/173、110、159、163、171、174、175、177、198、198/313、198/313/428、200/243/249/259、208、208/320、209、209/234、222、226、234、234/408、243/338/362/366、253、256、259、265、272、289、322、336、353/362、405、411、428和439,其中所述位置参照SEQ ID NO:4838来编号。
35.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8、9、25、25/198/209、25/200/209/338、25/200/243/249、25/209/243、25/209/243/249、25/209/243/259、25/209/249/259/366、25/209/259、25/209/279/366、25/209/289/366、25/249、25/259/279、25/259/279/289、25/279/284、25/279/284/289、25/289、34、53、54、55、61、69、70、73、79、87、91、107、108、111、141、153、158、174、190、194、198、198/200/209/243/249/289、198/249/338、200/209/366、201、205、209、209/249/259/279/338/366、209/249/259/289、209/249/279/284/289、209/249/338、209/279/289、209/366、234/297、238、247、249/259、252、253、254、256、259/366、279、279/338、289、297、308、321、322、327、336、338、341、342、364、366、388、392、411、412、414、426、430、432、446和449,其中所述位置参照SEQ ID NO:4876来编号。
36.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:88、88/110、88/110/159/198/200、88/110/159/198/234/259/265、88/110/159/198/259、88/110/198、88/110/234、88/159/198、88/198、88/198/200/259、88/198/259、88/259、88/259/265、110/259/265/411、159/198/411、159/259/411、171/174/175/177/208/320/428/439、171/175/177/208/320/428、171/177、171/177/226/428/439、171/208/320、171/208/320/428、171/208/428、174/175/177/208/320/428、174/175/428、174/320、198、198/200、198/200/234、198/234、198/259、208、208/320/331/428、208/320/428、208/428、234、259、320/428和428,其中所述位置参照SEQ ID NO:5066来编号。
37.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、7、25/61/208/252/253、25/61/428、25/107/208/320/428、25/208/247/252/253/364/428、25/247/249/252/364/428、38、53/54/55/153/201、53/54/308/392、53/171/308/392、54、61/107/208/252/253/254/364/428、61/208/252/254/428、64、68、73/87/201、91/201/439/444、99、106、107、107/208/320/364/428、107/247/249/252/254/364、107/247/252、107/247/428、109、159、169、171、172、177、179、190、190/208/247/252/428、222、233、233/269、247/249/252/254/320/428、249/252/253/254、249/252/254/428、251、252/253/254、253/320、259、264、289、296、300、308、308/327/439、317、318、320、320/364/428、320/428、347、404、408、417、424、427、428、428/434、431、435和438,其中所述位置参照SEQ ID NO:5290来编号。
38.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、49、73、87、87/88、87/88/94/159/177/208、87/88/159/198、87/88/177/198/249、87/88/208、87/159/177、87/159/320、87/177/249、87/198、87/198/199、87/198/208/320、87/208、87/208/320、87/320、88、88/177、88/177/208、88/177/320、88/198、88/199、88/199/208、88/208、88/208/249/320、88/320、113、134、135、158、159/177/198、159/177/208、159/198/208/320、171、173、177/198、177/208、195、214、222、253、256、257、268、272、289、300、302、330、348、374、392、399、408、411、412、437、439、445和453,其中所述位置参照SEQ ID NO:5372来编号。
39.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/7/107/233/252/253/320、2/7/107/233/252/253/320/408/428、2/7/233/252/253/320/427/428、2/233/252/317/320、7/107/190/233/252/253/317/408/427、7/107/233/252/253、7/107/233/252/317/320、7/107/233/252/317/408、7/190/233/252/253/320/427、7/190/233/252/317/320/427/428、7/190/233/252/408/427、7/233/252/253/317/408/427、7/233/252/253/408、7/233/252/317/320/427、7/233/252/317/428、14、55、56、64/169/201/347/392、64/172/264/268/347/392/417、91/94/171/172/201/264/347、91/201/264/347/392、94/201/264/347/435、107/190/233/252、107/190/233/252/317/320、107/233/252/253、107/252/317、169/171/172/264/392/435、169/171/201/264/392/435、169/172/201/264/347、169/172/201/264/347/392/435、169/172/201/347/392、169/172/201/417/435、171/172/201/264/392/417/435、171/201/392/417、190/233/252、190/233/252/253/317/320/408/428、190/233/252/317/408、190/233/252/320/408、201/264/347/392/417/435、201/264/347/392/435、201/264/347/417/435、233/252/253/317/320/427/428、233/252/253/408/427、233/252/317/408、233/252/317/427、233/252/320、233/252/320/408/428、255、282、308、336、342、348/374/435、364、374、391、407和422,其中所述位置参照SEQ ID NO:5562来编号。
40.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/4/113/158/163/302/364/399/449、2/4/113/158/163/330/449、2/4/113/163/449、2/4/158/163/364/449、2/4/158/222/257/302/330、2/4/158/330、2/4/163/222/302/330/364/449、2/4/163/257、2/4/163/257/330/399/449、2/4/163/330/449、2/4/163/364、2/4/163/364/453、2/4/302、2/113、2/113/163、2/113/163/449、2/113/330/399、2/113/449、2/158/163、2/158/163/364/399、2/163/364/453、2/364/449、4/113/158/163/330/364/399、4/113/158/302/330/364、4/113/163/364/399、4/158/163/364/399、4/364/449、87、87/95/198、87/198、87/266、87/322、107/134/135/195/412/417、107/195/268/322/439、107/195/272、107/195/417/439、107/374/417/439、113/158/163/364/399、134、134/135/195/268/317、158/163/257/330/364/449、158/163/302/330/364/399、158/163/364、163/257/302/364、163/302/330/364/449、163/364、173、173/190/233/252/427/437、173/190/252/257/347/427/437、173/190/257/374/437、173/190/257/427/437、173/233/252/257/427、173/233/437、173/252、173/252/268/437、173/252/347/411、173/257/374/437、173/374/437、173/427/437、190/233/252/257/347/411/437、190/252、190/252/257/285/427、190/252/257/411/437、190/252/257/427、190/374/427/437、195/272/320/439、195/317/320、198、198/244、198/292、233/252、233/252/257、233/252/257/347、233/252/257/347/411/437、233/252/257/427/437、233/252/285、233/252/285/437、233/252/411/437、233/252/437、233/374、233/374/437、252/257、252/257/347/437、257/347/411/437、268/417、285/347/437、302/364、330/364、347/411/437、347/427/437、364/399、374、374/411/437、408/417、411/437和437,其中所述位置参照SEQ ID NO:5708来编号。
41.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/4/14/158/282/364/449、2/4/14/158/282/407、2/4/14/163/198、2/4/14/163/282/399、2/4/14/198/308/407、2/4/14/282/308/364、2/4/14/282/308/407、2/4/14/282/364、2/4/158/163/364/399/407、2/4/158/198/282/364/407、2/4/163/198/282/308/342、2/4/163/282/342/364、2/4/163/364/399/449、2/4/198/282/449、2/4/198/364/391/449、2/4/282/342/364/407、2/14/158/198/407/449、2/14/163/308/364、2/14/163/364/407、2/14/282、2/14/282/308、2/14/282/308/364、2/14/282/399、2/14/308、2/14/308/364、2/158/163/407/449、2/163/282、2/163/282/308/364、2/198/282/308/342、2/198/282/399、2/282、2/282/308/342/407、2/282/308/391/407、2/282/399、2/282/399/407、2/308、2/308/364/399、4/14/158/163/198/282/407、4/14/158/282/364/391/407、4/14/163/282、4/14/163/282/308/342/407/449、4/14/198/308/364、4/14/282、4/14/282/308/364/407/449、4/14/282/342/399/407、4/14/364/391、4/158/282/364/399、4/163/282/308/407、4/198/399/407、4/282/342/364/407、4/282/364/407、4/364、12、14/158/163/198/364、14/158/163/282/364、14/158/198/282/342/364/449、14/158/364、14/163/198/282/342/364/449、14/163/282/308、14/282、14/282/308、14/282/342/364/391、14/282/364、14/282/364/391/407/449、14/282/399/407/449、14/407、37、44、70、71/331、74、75、90、106、108、112、114、115、131、138、139、156、158/282/407、158/282/407/449、158/364/399/407/449、158/364/449、162、163/198/282/342、163/282/308/364/399、163/282/399/407、163/282/407/449、174、198/282/308/342、198/282/407、198/308、247、248、254、258、282/308/342/364/449、282/308/449、365、389、401/402、416、427、429、432、433和456,其中所述位置参照SEQ ID NO:5976来编号。
42.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/113/158、14/113/158/163、14/113/158/163/190/257/308/342、14/113/158/163/437、14/113/158/308/317/330/449、14/113/163/190/308/317、14/113/163/257/308/342/437/449、14/113/163/257/437、14/113/163/308/317/320/322/330/449、14/113/320/437/449、14/158、14/158/163/190/257/308/317/330/437、14/158/163/190/342/437、14/158/163/257、14/158/163/257/308/449、14/158/257/308/437/449、14/158/317/320/330/437、14/163/317/320、14/190、14/190/257/317/320/322、14/257/308/320/322/330、14/257/308/322/330/437、14/317、14/330、14/449、19、29/375、41、45、46、71、72、80、81、83、84、85、88、95、105、113/158/163/190/257/437、113/158/163/190/308/317/322、113/158/163/190/308/320、113/158/163/257/308/317/322/437/449、113/158/190/257/320、113/158/190/320/322/449、113/158/320/322/437、113/257/308、113/257/317/322/437、155、158/163、158/163/190/257/308/342/449、158/163/308、158/163/322/437、158/308/320/437、158/320/437/449、163/308/330/437/449、168、190/449、197、199、202、209、243、249、263、273、317/320/322/330、322/330、366、375和383,其中所述位置参照SEQ ID NO:6138来编号。
43.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5/449、6、10、25、25/449、37/71/125/174/247/248/427、37/71/247/331/365/389/401/429、37/139/329/365/427/433/449、37/139/427/432/433/449、37/139/429/432/433、37/174/401/402/433/449、37/248/331/389/427/433、37/248/389/401/429、37/331/432/433、69、69/449、71/139/389/427/429/432/433/449、71/174/329/427/429/432/433、71/174/365/427/432、71/248/365/389/401、71/248/449、71/254/433/449、71/427/432/433/449、71/432/433、87、87/449、91、91/449、139/156/174/389/401/427/433/449、139/156/247/365/401/433/449、139/156/247/389/401/427/433/449、139/156/248/389、139/156/248/389/401/416/427/429/433、139/156/365、139/174/248/331/389/401/449、139/174/254、139/174/365/401/402/427/433/449、139/247/248/331/401/417/432/449、139/248/254/449、139/248/402/416/427/433/449、139/248/432/433、139/254/401/416/427/433/449、139/401/449、144/449、153、153/449、156/248/256、156/254/331/365/427/432/449、156/389/401/402/416/432/433、159、159/449、172、172/449、174/247/248/389/401/432/433、174/329/432/449、174/365、174/389/429/432/433/449、212/449、233、233/449、247/248/401、247/248/449、247/331/401/427/432/449、247/401、247/427/432、248/331/427/429/433、248/365/389/427/429/432/449、248/401/429/432/433、248/416、248/416/449、248/449、254/365、254/427/433、288/449、303、317、331/365/429/432/433/449、347/449、361、365/401/402/429/432/433、369、389/401/416/432/449、389/401/427/432、401/427、416/427/433/449、416/432/433、416/432/433/449、421、427/432、427/432/449、432和433/449,其中所述位置参照SEQ IDNO:6288来编号。
44.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2、3、4、9、37/41/45/72/81/83/84/88/155/163/168/190/331/375、37/41/45/72/81/83/84/88/155/263/273/331/375/432、37/41/45/72/81/83/84/88/155/331/366/375、37/41/45/72/81/83/84/88/155/331/375、37/41/45/72/81/83/84/88/248/375、37/41/45/72/81/83/84/88/331/366/432/433、37/41/45/72/88/155/168/190/331/366/375/432、37/41/45/72/88/155/168/190/331/375、37/41/45/72/88/190/263/273/331/366、37/41/45/72/155/163/168/190/243/263/273/331/366/432、37/41/45/72/155/163/168/243/248/273/331/366/432/433、37/41/45/72/155/163/168/263/366/432/433、37/41/45/72/155/163/331/366/375、37/41/45/72/155/190/243/248/273/331/432/433、37/41/45/72/155/190/248/263/331、37/41/45/72/155/190/263/331/366、37/41/45/72/155/190/273/331/366/375、37/41/45/72/155/190/273/366、37/41/45/72/155/190/273/366/375/432、37/41/45/72/155/248/263/273/366、37/41/45/72/155/263/331/375、37/41/45/72/155/263/375、37/41/45/72/155/273/366、37/41/45/72/155/331/366/375/432/433、37/41/45/72/190/263/273/331、37/41/45/72/190/331/366、37/41/45/72/190/366、37/41/45/72/263/331/366、37/41/45/72/263/366/432/433、37/41/45/72/331/366、37/41/45/81/83/84/88/155/168/190/243/331/366、37/41/45/81/83/84/88/155/168/331/375、37/41/45/81/83/84/88/155/263/273/331/366、37/41/45/81/83/84/88/163/168/263/273/331/366/375、37/41/45/155/163/168/263/331/375、37/41/45/155/168/248/273/331/375、37/41/45/155/190/331/366/375、37/41/45/155/366、37/41/45/155/366/432/433、37/41/45/155/375、37/41/45/243/248/273/331、37/41/45/263/331/375/432、37/41/45/331/366/432/433、37/72/81/83/88/155/190、37/72/197/273/331/375/432、37/83/263/365/366/375、37/190/202、41/45/72/155/263/331/366/375/432/433、41/45/163/168/243/248/273/366/432、45/72/84/88/197/375、45/72/88/366、45/72/163/202/365/366/375、45/72/168/243/331/365/366/429/432、45/84/168/190/199/254/273/365/366、45/163/168/190/199/366/429/432、45/163/168/197/263/331/365/366、53/437、61、64、72/81/83/84/88/155/163/168/190/366、72/81/83/84/88/155/190、72/81/83/84/88/155/190/273/331/366/432、72/81/83/84/88/155/273/331/375、72/81/83/84/88/155/366、72/81/83/84/88/163/168/190/243/263/331/366、72/81/83/84/88/163/168/263/331/375、72/81/84/190/248、72/83/84/88/202/254/273/366/375、72/83/84/197/202/243/263/365/366、72/83/88/243/263/331/365/366、72/155/163/168/190/366/432/433、72/155/190、72/155/190/263/331/366、72/155/190/366、72/155/273/331/375/432、72/243/248/263/366/432/433、72/243/248/273/366/432/433、72/243/248/366/432/433、72/248、72/170、72/405、81/83/84/88/155/163/168/273/331/375、81/83/84/88/155/190/263/331/366、81/83/84/88/155/263/366/375、81/83/84/88/155/366、81/83/84/88/190/263/375、81/83/84/88/263/273/331/366/432、81/83/169/190/263、81/83/190/263/365/366、81/83/202/365/366/402、81/88/375/402、83/88/155/273/366/375、84/155/168/197/199/331/366/375/383/402、84/168/197/202/263/366、84/197/366/402、94、96、98、113、118、118/120、120、129、134/158、155/168/190/197/199/366、155/168/375、155/263/366/432/433、158、165、170、171、173、183、190/199/202/331/366、193、197/199/202、197/202/248、197/248、199/263/331/365/366、214、214/222、222、226、229、234、248/375、253、265、269、272、289、296、300、302、304、322、322/407、330、365/366、365/375/402、390、395/439、396、398、399、403、405、408、411、412、423、428、434、435、438、439、442、444、448、449、452和454,其中所述位置参照SEQ ID NO:6468来编号。
45.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:5/6/25/317、5/6/69/288/303、5/6/91/288/317、5/25/91/212/303/317、5/25/91/263、5/25/288、5/69/91/212/288、5/69/91/212/303、5/91/288/303、5/91/303、5/91/317/421、5/288、6/91/212/288/303/369/421、6/212/288/303、6/288、25/91/212/288、25/91/263/288/303、25/91/303/317/369、25/91/317/369、25/263/317、87/144、87/144/159/361、87/144/159/361/433、87/433、88/144、88/144/159、91/263/317/369、91/288/303/317/369、91/288/317/369/421、91/303、91/317、91/317/369、109/144/153/155/159/433、144、212/288、263/288/303/317和288,其中所述位置参照SEQ ID NO:6864来编号。
46.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:2/3/433/435/442、2/81、9/37/113/396、9/87、9/144/331、37/113/144/396、37/233、41、53/144/233/269/331/428、53/233/269/390/395/396、53/234、61、56、61/120/156/163/165/197/303/308、61/120/159/300/308/407、61/120/300/303/407、61/156/159/163/165/243/248/253/300/303/308、61/156/163/243/248/300/303/308/407、61/156/163/300/365/411、61/156/197/253、61/163/300/303/308/405/407/411、61/165/248/253/407/411、61/214、61/214/300/308、61/243/300/308/407/411、61/300/303/308、61/300/303/405、61/365/405、69、69/81、69/134、69/263、69/263/434/438/439、69/439、72、76、81、81/134、81/222、81/222/263/322/435/442、81/433/435/438/442、85/156/159/243/248/253/308/405/407/411、87、87/144、87/144/396、88、107、113/233/234、120/156/159/169/197/214/303/308/365/405/407、120/156/159/248/300/308、120/156/248/303/308/411、120/159、120/159/165/197、120/159/197/308/407/411、120/159/197/365/411、120/197/253/300/308、120/253/300/303/308/407、120/308/407/411、134/222/263、139、144/234/269、156、156/165/248/300/303/308、156/197/248/300/411、156/214/308/411、156/248/253/308、159/163/165/197/214/243/300/303/308/407、163/197/253/300/303/308/365、171/263、183/233/234/331/428、197/253/308/407、197/300/303/308/365、197/300/308/411、222、222/263/435/442、233/396/399、263、269、269/428/437、300/303/308、300/308/405/411、308、322、338和407,其中所述位置参照SEQ ID NO:7388来编号。
47.如权利要求2所述的工程化糖基转移酶,其中所述工程化糖基转移酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:37/72/76/81、37/72/76/107/156/331、37/72/195/331、53/81/195/197、55、69/72/76/107、72/76/107/156、72/76/107/195/197、72/269、81/107/195、87、87/91、87/91/94、87/91/94/120、87/91/94/233、87/91/94/233/259、87/91/94/263/389、87/91/120/233、87/91/120/233/411/431/435/437、87/91/144/259、87/91/163、87/91/163/233、87/91/163/233/263、87/91/163/389、87/91/233、87/91/233/389、87/91/259/263/389/428/431/435/437、87/91/263/389、87/91/322、87/91/389、87/94、87/94/144/263/428/435、87/94/263、87/163/233、87/233、87/233/259、87/233/322/389/411、87/233/389、87/259、87/263、87/428/431/435、87/435、91、91/94、91/94/120/233、91/94/120/233/389/431/438、91/94/233/259、91/120、91/120/233、91/233、91/233/259/389、91/233/389、94/233/411、111、144/389、163/233、195/197、197、233、233/259/263、233/259/389、233/438、252、255、259、263、263/389、322、324、328、389、413、428/431/435和451,其中所述位置参照SEQ ID NO:8088来编号。
48.如权利要求2-47中任一项所述的工程化糖基转移酶,其中所述工程化糖基转移酶选自β-1,2-糖基转移酶和β-1,3-糖基转移酶。
49.如权利要求1-48中任一项所述的工程化糖基转移酶,其中所述工程化糖基转移酶是选自ADP-葡萄糖依赖性糖基转移酶(AGT)、CDP-葡萄糖依赖性糖基转移酶(CGT)、GDP-葡萄糖依赖性糖基转移酶(GGT)、TDP-葡萄糖依赖性糖基转移酶(TGT)和IDP-葡萄糖依赖性糖基转移酶(IGT)的NDP-糖基转移酶。
50.如权利要求48所述的工程化糖基转移酶,其中所述工程化糖基转移酶是ADP-葡萄糖依赖性糖基转移酶。
51.一种工程化多核苷酸,所述工程化多核苷酸编码至少一种权利要求1-50的任一项中提供的工程化糖基转移酶多肽。
52.一种载体,所述载体包含至少一种权利要求51所述的工程化多核苷酸。
53.如权利要求52所述的载体,其中所述载体还包含至少一种控制序列。
54.一种宿主细胞,所述宿主细胞包含至少一种权利要求51所述的工程化多核苷酸。
55.一种宿主细胞,所述宿主细胞包含至少一种权利要求52和/或53所述的载体。
56.如权利要求54或55所述的宿主细胞,其中所述宿主细胞选自真核生物体和原核生物体。
57.一种用于产生至少一种权利要求1-50的任一项中提供的工程化糖基转移酶的方法,所述方法包括在使得所述宿主细胞产生所述工程化糖基转移酶的条件下培养权利要求54-56的任一项所述的宿主细胞。
58.如权利要求57所述的方法,还包括回收所述工程化糖基转移酶的步骤。
59.一种组合物,所述组合物包含至少一种权利要求1-50的任一项所述的工程化糖基转移酶。
60.一种工程化蔗糖合酶,所述工程化蔗糖合酶包含与SEQ ID NO:72具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
61.一种工程化蔗糖合酶,所述工程化蔗糖合酶包含与SEQ ID NO:74、1080、1158、1222、1392、1456、1582、1764、1804、1840、2064、2432、2510、7506和/或8420具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
62.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:4/9/349/532、4/13/113/343/532、4/13/113/532、4/33/47/52/343/532、4/47/52/532、4/113/532、4/13/113、4/13/532、4/33/113、4/343、7、8、44、95、117/440、136、221、343/532、440、444、478、532、583、611、615、615/789、695、722和788,其中所述位置参照SEQ ID NO:74来编号。
63.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/221、47/221、68/129/248、68/129/248/595/600/756、68/146/248/387/506/550、68/189/272/316/477/719/756、75/105/154/215/264/345、75/105/345/410/769、75/105/530、75/345/530、85/170/225/266/534、87/125/230/267/375/464/708、93/129/506/550/595/719/756、93/477/635、95/136/788、95/201/478/583/724/788、95/385/478/583/788、95/440/478/724/788/792、95/444/478/603/792、95/444/478/724/788、95/478/724、98/250、113/225/266/415、126/314/499/549/589/755、136/440/444/478/603、136/440/444/478/583/788、136/444/478/583/788/792、225/372/534、266、306/358/703/776、358/636/737、440/444/583/724/788、440/478和466,其中所述位置参照SEQ ID NO:1080来编号。
64.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/68/95/98/358/478/595/724/792、8/68/98/221/248/250/440/477/534/595/724、8/68/788、8/93/95/98/136/221/595/600/788、8/93/95/113/250/440/595/600/724/788、8/95/98/440/478/534/600/788、8/136/248/478/788、47/75/85/105/125/129/170/635、47/75/85/105/375/756/776、47/75/85/264/267/372/415/635、47/75/85/87/129/375/776、47/75/85/87/170/372/756、47/85/105/129/201/230/267/583、47/85/125/372/583/635/756、47/85/170/756、47/85/87/105/125/635、47/85/87/154/756、47/125/129/375/756/776、47/129/170/635、47/154/372/375/583/635/708/756、68/93/95/358/440/444/478/534/595/603、68/93/95/444/788、68/93/98/136/248/250/358/440/534/724、75/85/87/105/264/267/583/708、75/85/129/154/264/375、85/125/215/375/415/635/776、85/87/105/215/267/756、85/87/129/375/756/776、87/125/129/170/230/756、87/154/306/375/756、93/95/98/534/792、95/440/444/724/788、129/215/372/756和170/264/267,其中所述位置参照SEQ ID NO:1158来编号。
65.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:47/68/93/98/358/440、47/68/154/372/375、47/93/98/136/154/772/776、47/93/98/154/372/375/776、47/93/98/358/583/635、47/93/129/136/154/250/372/534/635/724、47/93/129/136/375/534/583、47/93/358/372/375/440/724、47/93/358/372/375/776、47/98/129/358/372/375/438/534、47/98/129/375/534/635/724/776、47/98/372/375、47/125/154、47/129/136/372/375/534、47/129/248/250/372/375/534/724、47/136/583/776、47/358/440/724、47/358/635/776、47/372/635/776、68/93/98/129/358/375/724、68/93/154/358/372/440/776、68/129/440、68/129/583/724、68/136/724、68/154/358/375、68/154/534/635、68/375/440/534/724/776、93/98/125/154/248、93/98/125/154/250/440、93/98/129/154/248、93/98/154/250/358/375/534、93/98/154/635/776、93/98/534、93/125/154/440/534、93/129/250/358/372/375/583、93/154/248/724、93/358/534/635、98/129/375/583、98/534/583/635、129/136/154/248/250/372/375/534、129/136/375、129/154/248/250/358/375/534/635、129/358/372/635、154/250/358/375/583、154/358/375/534/776、154/534/635/724、372/375/776、375/635和534/583,其中所述位置参照SEQ ID NO:1222来编号。
66.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17/357/364/434/519/684、17/357/434/519/684、17/434/684、17/684、54/97/118/307/694/727/738、68/98/129/136、68/98/129/136/154、68/98/129/136/154/534、68/98/129/154/534、68/98/129/154/635、68/98/136/154/534/635、68/98/136/154/635、68/98/154、68/98/154/534、68/98/154/534/635、68/129/136、68/129/136/154、68/129/136/154/464/635、68/129/136/534/635、68/129/154、68/129/154/765、68/136/154/534/635、68/136/534/635、68/136/635、68/154、68/154/534/635、68/154/635、97/118/442/694/727/738、98/129/136/154、98/129/136/154/635、98/129/136/534、98/129/136/635、98/129/154、98/129/154/534/635、98/129/534/635、98/136/154/635、98/136/534/635、98/136/635、98/154、98/154/534、122、129/136、129/136/154/635、129/136/534、129/136/635、129/154/534、129/154/635、129/635、132/136/154/534/635、136/154/635、136/534/635、136/603、136/635、154、154/635、157、160、161、167、253、285、381、519、550、563、564、635和785,其中所述位置参照SEQ IDNO:1392来编号。
67.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:17/54/97/136/329/550/684/738、17/54/97/329/524/684、17/54/161/519/727/738、17/54/524/550/727、17/161/434/524/766、17/434/524/684、17/434/738、17/442/524/550/684/721、17/727、17/738、54/97/161/434/442、54/97/434/524/550/684/727、54/136/442/550、54/434/524/738、97/136/519/550/727/738和329/550/684/727/738,其中所述位置参照SEQ ID NO:1456来编号。
68.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14/137/356/745、14/570、14/570/745、26/117/365、26/164/165/213/586、71/158/222/356、71/222/236、71/319/356/606、117/158/213/332/608、117/164/707、117/213/365/517、117/311/332、117/608、122、122/160/161/167/550、122/160/161/282/381/550、122/160/161/282/381/550/636、122/160/161/282/550、122/160/161/550/636、122/160/167/282/381/550/636、122/160/282/381、122/160/282/381/550、122/160/282/550、122/160/381/550、122/160/381/550/636、122/160/550、122/160/550/636、122/161/550、122/167、122/167/550、122/282/381/550、122/282/550、122/282/550/636、122/381/706、122/550、137/319/570、157/253/519、160/161、160/161/282/381/550、160/161/282/550、160/161/550/636/735、160/167/282/381/636、160/282、160/282/381/550、160/282/550/636、160/381/550/636/681、161/282/550/636、161/381/550、165/311、167/282/636、167/550、213/365/517/707、236、253/519、253/519/563、253/519/635、253/563/635、270/322/517、270/367/452/517/613/700/750、270/452/517/700/750、270/570、282/381/550、282/550、356/570、381/550、517、517/562/750、517/640、519/563、550、550/636和562,其中所述位置参照SEQ ID NO:1582来编号。
69.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:63/536、117/122/270/540/681、181/536/548、181/536/548/705、181/548/705、270/681、347/532、347/536/548/705、407/570/681、407/681、536、536/548、536/548/699、536/705、548、548/580、548/705、580、681、699和705,其中所述位置参照SEQ ID NO:1764来编号。
70.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:13、17、18、30、37、52、57、60、71、85、87、90、98、99、118、129、164、180、183、347/434/517/562/640/681、347/434/532/562/640/681、347/434/550/562/681、347/434/681、347/517/532/681、347/532/550/640/681/699、347/536/562/681、347/550/580/681、347/550/681、347/681、365、388、389、415、433、434/517/532/681、517/681、531、532/681、535、536/580/681、539、562/681、589、606、608、707、711、727、738、748、765、769和789,其中所述位置参照SEQ ID NO:1804来编号。
71.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:14、15、17/52/87/118/129/388/589/738/765、17/52/87/118/129/589/738、17/52/87/118/129/589/738/765、17/52/87/118/129/589/765、17/52/87/129/388/589、17/52/87/129/388/589/738、17/52/87/129/738、17/52/87/388/589/765、17/52/87/589/738/765、17/52/118/129/265/589/765、17/52/118/129/388/589/738/765、17/52/118/129/589/738/765、17/52/118/129/738/765、17/52/118/388/589/738、17/52/118/388/589/738/765、17/52/118/388/738/765、17/52/129/388/589/738、17/52/129/388/589/738/765、17/52/129/589、17/52/129/589/738、17/52/129/589/765、17/52/129/653/738/765、17/52/129/738、17/52/129/738/765、17/52/388/589/738、17/52/388/589/738/765、17/52/589/738/765、17/52/589/765、17/87/118/388/738、17/87/129/388/738、17/118/129/388/738/765、17/129/589、17/129/589/738、17/129/589/738/765、17/129/738/765、17/388/589/738、17/589/738、17/589/765、17/738/765、18/362、20、24、26、33、33/154、46、50、52/84/129/388/738/765、52/87/118/129/388/765、52/87/118/388/589/738、52/87/118/589/738/765、52/87/129/388/738/765、52/87/129/765、52/87/589/738、52/87/738、52/118/129/589/738、52/118/129/765、52/118/388/589/738、52/118/388/738/765、52/129/589/738/765、52/129/589/765、52/129/738、52/388/738/765、52/589/738、52/589/738/765、52/738/765、54、58、59、59/72、79、81、84/129/589/738/765、87/118/129/765、87/129/388/589、92、93、97/154、104、105、130、134、154、165、175、185、212、213、218、241、256、263、316、319、349、360、362、364、390、393、434、480、498、530、534、534/739、542、589/738/765、603和652,其中所述位置参照SEQID NO:1840来编号。
72.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:21、25/112、41、57/71/87/347/434/562/606、57/71/129/180/434/536/562、57/71/129/434/531/536/562、57/71/129/531/532/536/539/606、57/71/562/606/711/789、57/71/789、57/87/180/531/532/562/606/612/711、57/87/347/562、57/90/129/562、57/90/129/562/711、57/96/129/180/531/532/550/562、57/129/347/531/532/539/562/711/747、57/129/347/536/550/562/711/789、57/129/347/550/711、57/129/531/539/562/789、57/129/536/606/789、57/129/606、57/180/562、57/180/562/606/612、57/347/434/531/532/539/789、57/434/550/562/606/612/789、57/531/532/536/562、57/562/606/711、57/562/711、71/129/180/347/531/539/550、71/129/180/434/532/536/539/711/789、71/129/531、71/129/606、71/347/532/550/562/711、71/347/536/562/612/789、71/536/539/562、87/189/532/536/562/711/789、87/347/531/606/789、87/347/536/539/550、89、90/129/539/550/606、91、112、129/180/434/562/711/789、129/180/606/711/789、129/347/562、129/536/539/562、129/539/562/789、129/550、129/550/562、129/562/606/711、180/532、180/550/606、186、200、226、259、318、330、347/531/550/711、347/536/539/550/711/789、347/536/562/606/612、347/550/562/606、434/531/539/550/562/711、434/550、485、487、531/532/536/539/562/711/789、531/532/536/550/562/606/789、531/532/562/606/711、532/539/550、562/711、641、674、684、688、763和764,其中所述位置参照SEQ ID NO:2064来编号。
73.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:25、33/47/59/81/175/530/534/550/606、33/58/59/81/130/480/530/534/550/652、33/58/59/480/530/534/550、33/58/154/480/534/550/603/606、33/59/480/530/534/550/606、33/79/81/175/530/534、33/79/81/175/530/534/603、33/79/154/480/530/534/550、33/81/130/480/530/534/550、33/81/175/530/534/542/550/652、33/130/530/534/550、33/154/480/530/534/603/606、33/154/534、33/530/534/550、42、58/59/79/175/480/534/550/652、59/154/530/534/550、70、75、77、79/81/480/530/534/550/603/606/652、81/480/530/534/550、106、130/480/530/534/550/603/606、199、265、267、380、410、561、642和758,其中所述位置参照SEQ ID NO:2432来编号。
74.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:7/12、12、27、29、41、41/71、41/71/112、41/71/112/259/485/487/684/688、41/71/112/259/485/688、41/71/259/485/532、41/71/485、41/71/485/532/684、41/71/487、41/71/487/532/684、41/71/532、41/71/532/684、41/71/684、41/84/259/485/487、41/91/112/485、41/91/112/485/487/532/684、41/91/112/485/532/684、41/91/485、41/112、41/112/259/485/487、41/112/259/487/532/684、41/112/485/684、41/112/487/684、41/112/532、41/112/684/688、41/259/485、41/259/485/487、41/259/485/487/532/684、41/259/485/487/684/688、41/259/532、41/485、41/485/487、41/485/487/684/688、41/485/532、41/485/532/688、41/485/684/688、41/487/684、41/532、41/684、41/684/688、44、44/112/684/688、45、47、48、51、55、71/112/259/485/487/684、71/112/485/688、71/485/684/688、71/532、71/684/688、72、95、100、112、112/259、112/259/532/684/688、112/259/684/688、112/485/684、112/485/684/688、116、136、139、176、178、198、201、205、205/485、207、208、226/487/684/688、259/485/487/684、259/485/532、259/487/684/688、259/532、280、303、317、343、358、361、440、478、485、485/487、485/487/532、485/487/532/684、485/487/684、485/487/684/688、485/532、485/684、485/684/688、532、532/684/688、611、615、630、675、684、684/688、724、756和788,其中所述位置参照SEQ ID NO:2510来编号。
75.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:8/25/55/95/208/358/440/517/788、12/45/47、12/45/47/48/51/136/142/630、12/45/47/51/136/139/630/758、12/45/47/136/139/142/675/758、12/45/51/136/139/630/675/756/758、12/45/51/630/756、12/48/51/136/139/758、12/136/139/142/756/758、12/136/142、12/630/756、25/29/208/440、25/100/154/208/440/517/705/788、25/517、29/208/361/517/788、42/198/199/480/532/539/561、42/198/532/561、42/198/532/561/724、42/199/480/532/561、42/259/480/561、42/259/480/652、42/480/561、42/480/561/724、42/561、47/51/136/756/758、55、55/410/440/603/788、55/517、55/517/788、70、70/642、77/176/487/615/642、95/603、106/199/539/561/652、116、136/139/142、154/361/440/517/603/788、176、198/199/480/561、198/199/480/561/724、198/199/561/724、198/480/561、198/480/724、199/532/539/561/652/724、259/480、267/611/642、280/440/517、380、480/561/652、480/561/652/724/764、480/724、517、532/539/561、532/561/724、603和642,其中所述位置参照SEQ ID NO:7506来编号。
76.如权利要求61所述的工程化蔗糖合酶,其中所述工程化蔗糖合酶的所述多肽序列在选自以下的一个或更多个位置包含至少一个突变或突变集:12/45/95/136/139/199/517/630/756、12/45/95/136/756、12/45/136/139/199/517/603、12/45/136/139/208/603/630/756、12/45/136/139/517/603/756、12/45/136/139/517/630/642/756、12/45/136/139/517/756、12/45/136/139/603/756、12/45/136/139/642/756、12/45/136/176/517/603/630/642、12/45/136/208/517/630/756、12/45/136/517/603/642/756/789、12/45/136/517/630/642/756、12/45/136/603/756、12/45/136/630/642、12/45/139/176/208/517/603/630、12/45/139/199/208/603、12/45/139/517/756、12/45/139/756、12/45/176/603/630/642/756、12/45/199/208/517/603/630/756、12/45/208/517/603/642/756、12/95/136/139/517/603/756、12/95/139/517/630/756、12/95/139/517/642、12/95/139/630/642、12/95/199/517/642、12/95/517/630/756、12/95/630/756、12/136、12/136/139/176/517/603/630、12/136/139/176/517/603/756、12/136/139/176/630/756、12/136/139/176/642、12/136/139/176/756、12/136/139/199/208/517/603/756、12/136/139/199/208/517/630/642/756、12/136/139/208/517、12/136/139/517、12/136/139/517/603/630/642/756、12/136/139/517/603/630/756、12/136/139/517/603/756、12/136/139/517/630、12/136/139/517/630/642、12/136/139/517/630/642/756、12/136/139/517/756、12/136/139/603/630、12/136/139/603/630/642、12/136/139/603/630/756、12/136/139/603/642/756、12/136/139/630、12/136/139/630/642/756、12/136/139/630/756、12/136/139/642/756、12/136/176/208/517/603/630/756、12/136/176/517/642、12/136/176/603/756、12/136/199/208/517/603/642/756、12/136/199/208/630/642、12/136/199/517/756、12/136/208、12/136/208/603/642、12/136/517/603/630/642、12/136/517/603/630/756、12/136/517/630、12/136/517/630/642、12/136/517/642、12/136/517/642/756、12/136/517/756、12/136/603/630/642/756、12/136/603/630/756、12/136/603/642、12/136/603/642/756、12/136/603/756、12/136/630、12/136/630/756、12/139/176/517/603/630/756、12/139/176/630/756、12/139/199/208/642、12/139/199/517/630/756、12/139/208/517、12/139/208/642、12/139/517/603/642/756、12/139/517/630/642/756、12/139/517/642、12/139/603/642/756、12/139/603/756、12/139/630/642、12/139/630/642/756、12/139/630/756、12/176/517/603/630、12/176/517/630/642/756、12/176/517/756、12/176/603/630/756、12/176/603/756、12/199/208/517/642、12/199/630/642/756、12/199/642/756、12/199/756、12/208/517/603/623/630/642、12/208/603/630/756、12/208/630/756、12/517/603/630/642/756、12/517/603/630/756、12/517/603/756、12/517/630/642/756、12/517/642/756、12/603/630/756、12/603/642/756、12/603/756、12/630/642/756、12/630/756、25/176/198/532/539、116/142/198/434/440、136/139/176/199/208/517/630/642、136/139/176/517/630/642/756、136/139/199/517/603/756、136/139/208/517/630/756、136/139/208/603/630/756、136/139/517/603/630/642/756、136/139/517/603/642/756、136/139/517/603/756、136/139/517/756、136/139/603、136/139/630/642/756、136/517/756、136/603/756、136/630/642、136/630/756、136/642、136/642/756、136/756、139/199/208/517/630/756、139/199/517/642、139/208/517/630/642/756、139/517/603/756、139/517/630/756、139/642/756、154/532/652/788、199/517/603/630/756、208/517/630/642/756、517/603/630/642/756、517/630/756、603/630/756和603/756,其中所述位置参照SEQ ID NO:8420来编号。
77.一种工程化多核苷酸,所述工程化多核苷酸编码至少一种权利要求60-76的任一项中提供的工程化蔗糖合酶多肽。
78.一种载体,所述载体包含至少一种权利要求77所述的工程化多核苷酸。
79.如权利要求78所述的载体,还包含至少一种控制序列。
80.一种宿主细胞,所述宿主细胞包含至少一种权利要求78所述的工程化多核苷酸。
81.一种宿主细胞,所述宿主细胞包含权利要求78或权利要求79所述的载体。
82.如权利要求80和/或81所述的宿主细胞,其中所述宿主细胞选自真核生物体和原核生物体。
83.一种用于产生至少一种权利要求60-76提供的工程化蔗糖合酶变体的方法,所述方法包括在使得所述宿主细胞产生所述工程化蔗糖合酶变体的条件下培养权利要求80-82的任一项所述的宿主细胞。
84.如权利要求83所述的方法,还包括回收所述工程化蔗糖合酶变体的步骤。
85.一种组合物,所述组合物包含至少一种权利要求60-75的任一项所述的工程化蔗糖合酶变体。
86.一种用于底物糖基化的方法,所述方法包括提供至少一种底物、至少一种权利要求1-50的任一项所述的工程化糖基转移酶,并在使得所述底物被糖基化以产生至少一种糖基化产物的条件下使所述底物与所述糖基转移酶接触。
87.如权利要求86所述的方法,其中所述底物包含至少一种甜菊醇糖苷。
88.如权利要求86所述的方法,其中所述糖基化产物包含至少一种单糖基化产物和/或多糖基化产物。
89.一种用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D和/或莱鲍迪苷I底物、NDP-葡萄糖、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将所述莱鲍迪苷D和莱鲍迪苷I底物、NDP-葡萄糖和所述糖基转移酶组合。
90.一种用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将所述甜菊苷底物、NDP-葡萄糖和糖基转移酶组合。
91.一种用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、NDP-葡萄糖、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷D的条件下将所述甜菊苷底物、NDP-葡萄糖和糖基转移酶组合。
92.如权利要求86-91中任一项所述的方法,其中所述NDP-葡萄糖选自ADP-葡萄糖、CDP-葡萄糖、TDP-葡萄糖、GDP-葡萄糖和/或IDT葡萄糖。
93.如权利要求86-92中任一项所述的方法,其中所述NDP-葡萄糖不是UDP-葡萄糖。
94.如权利要求86-93中任一项所述的方法,其中所述糖基转移酶包含权利要求48-50的任一项所述的糖基转移酶。
95.一种用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D和/或莱鲍迪苷I底物、ADP-葡萄糖、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将所述莱鲍迪苷D和/或莱鲍迪苷I底物、ADP-葡萄糖和糖基转移酶组合。
96.一种用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种权利要求1-50所述的工程化ADP-糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将所述甜菊苷底物、ADP-葡萄糖和糖基转移酶组合。
97.一种用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、ADP-葡萄糖、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷D的条件下将所述甜菊苷底物、ADP-葡萄糖和糖基转移酶组合。
98.一种用于产生莱鲍迪苷M的方法,所述方法包括提供莱鲍迪苷D和/或莱鲍迪苷I底物、NDP、蔗糖、蔗糖合酶、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将所述莱鲍迪苷D底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。
99.一种用于产生莱鲍迪苷A和/或莱鲍迪苷I的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷A和/或莱鲍迪苷I的条件下将所述甜菊苷底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。
100.一种用于产生莱鲍迪苷D的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷D的条件下将所述甜菊苷底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。
101.一种用于产生莱鲍迪苷M的方法,所述方法包括提供包含至少一种甜菊苷和/或甜菊苷与rebA的混合物的甜菊苷底物、NDP、蔗糖、蔗糖合酶、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得产生莱鲍迪苷M的条件下将所述甜菊苷底物、NDP、蔗糖、蔗糖合酶和糖基转移酶组合。
102.一种产生莱鲍迪苷M的方法,所述方法包括提供甜菊苷底物、NDP、蔗糖、至少一种蔗糖合酶、和至少一种权利要求1-50所述的工程化糖基转移酶,在使得首先产生莱鲍迪苷A、然后产生莱鲍迪苷D和/或莱鲍迪苷I、且最后产生莱鲍迪苷M的条件下,将所述甜菊苷底物、NDP和糖基转移酶组合。
103.如权利要求98-102中任一项所述的方法,其中所述蔗糖合酶是权利要求60-76的任一项中提供的工程化蔗糖合酶。
104.如权利要求86-103中任一项所述的方法,其中所述方法以一锅反应来进行。
105.如权利要求86-104中任一项所述的方法,其中所述方法相继地进行。
106.如权利要求86-104中任一项所述的方法,还包括重复所述方法的步骤。
107.如权利要求106所述的方法,其中所述蔗糖在重复步骤期间被再循环。
108.如权利要求106和/或101所述的方法,其中所述工程化糖基转移酶和/或其他反应组分被再循环。
109.如权利要求86-108中任一项所述的方法,其中所述甜菊苷底物是从甜菊(Steviarebaudiana)提取的。
110.如权利要求86-108中任一项所述的方法,其中所述甜菊苷底物是合成产生的。
111.如权利要求86-110中任一项所述的方法,其中所述糖基转移酶和/或所述蔗糖合酶是被固定的。
112.如权利要求86-110中任一项所述的方法,其中所述方法产生包含果糖的反应产物。
113.如权利要求112所述的方法,其中从所述反应产物去除所述果糖。
114.如权利要求86-113中任一项所述的方法,其中所述方法还包括洗涤步骤。
115.如权利要求86-114中任一项所述的方法,其中所述方法还包括至少一个柱层析步骤。
116.如权利要求86-115中任一项所述的方法,其中所述至少一种工程化糖基转移酶是选自权利要求11-31的任一项所述的糖基转移酶的β-1,2糖基转移酶。
117.如权利要求86-116中任一项所述的方法,其中所述至少一种工程化糖基转移酶是选自权利要求4-10和32-47的任一项所述的糖基转移酶的β-1,3糖基转移酶。
118.如权利要求86-117中任一项所述的方法,其中所述至少一种工程化糖基转移酶是选自权利要求11-31的任一项所述的糖基转移酶的β-1,2糖基转移酶,并且还包括至少一种工程化糖基转移酶是选自权利要求4-10和31-47的任一项所述的糖基转移酶的β-1,3糖基转移酶。
119.如权利要求86-118所述的方法,还包括至少一种权利要求60-76的任一项所述的工程化蔗糖合酶。
120.至少一种莱鲍迪苷,所述至少一种莱鲍迪苷根据权利要求86-119的任一项所述的方法产生。
121.一种组合物,所述组合物包含权利要求120所述的莱鲍迪苷。
122.莱鲍迪苷M,所述莱鲍迪苷M根据权利要求86-89、92-95、98和/或101-121的任一项所述的方法产生。
123.一种组合物,所述组合物包含权利要求122所述的莱鲍迪苷M。
124.莱鲍迪苷A,所述莱鲍迪苷A根据权利要求86-94、96、99和/或101-121的任一项所述的方法产生。
125.一种组合物,所述组合物包含权利要求124所述的莱鲍迪苷A。
126.莱鲍迪苷I,所述莱鲍迪苷I根据权利要求86-94、96、99和/或101-121的任一项所述的方法产生。
127.一种组合物,所述组合物包含权利要求126所述的莱鲍迪苷I。
128.莱鲍迪苷D,所述莱鲍迪苷D根据权利要求86-94、97和/或100-121的任一项所述的方法产生。
129.一种组合物,所述组合物包含权利要求128所述的莱鲍迪苷D。
130.一种组合物,所述组合物包含至少两种权利要求122、124、126和/或128中提供的莱鲍迪苷。
131.一种组合物,所述组合物包含至少两种权利要求123、125、127和/或129中提供的组合物的混合物。
CN201880024548.6A 2017-02-03 2018-02-01 工程化糖基转移酶和甜菊醇糖苷葡糖基化方法 Pending CN110914445A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762454417P 2017-02-03 2017-02-03
US62/454,417 2017-02-03
US201762479262P 2017-03-30 2017-03-30
US62/479,262 2017-03-30
PCT/US2018/016359 WO2018144679A2 (en) 2017-02-03 2018-02-01 Engineered glycosyltransferases and steviol glycoside glucosylation methods

Publications (1)

Publication Number Publication Date
CN110914445A true CN110914445A (zh) 2020-03-24

Family

ID=63038689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880024548.6A Pending CN110914445A (zh) 2017-02-03 2018-02-01 工程化糖基转移酶和甜菊醇糖苷葡糖基化方法

Country Status (14)

Country Link
US (4) US20180223264A1 (zh)
EP (3) EP3577229A4 (zh)
JP (4) JP7248302B2 (zh)
KR (2) KR102606350B1 (zh)
CN (1) CN110914445A (zh)
AU (4) AU2018215335B2 (zh)
BR (1) BR112019015992A2 (zh)
CA (3) CA3175070A1 (zh)
IL (2) IL268121B2 (zh)
MX (4) MX2019009233A (zh)
PH (1) PH12019501698A1 (zh)
SG (1) SG11201906480QA (zh)
TW (3) TWI797103B (zh)
WO (2) WO2018144675A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112626047A (zh) * 2021-01-08 2021-04-09 中国科学院华南植物园 一组亚精胺衍生物糖基转移酶及其编码基因和应用
CN112704731A (zh) * 2021-01-13 2021-04-27 中国农业科学院哈尔滨兽医研究所(中国动物卫生与流行病学中心哈尔滨分中心) 蛋白酶s273r抑制细胞焦亡的用途及方法
CN112805295A (zh) * 2018-07-30 2021-05-14 科德克希思公司 工程化糖基转移酶和甜菊醇糖苷葡糖基化方法
CN113462670A (zh) * 2021-08-23 2021-10-01 南京工业大学 一种糖基转移酶突变体及其催化合成莱鲍迪苷m的方法
WO2022253282A1 (zh) 2021-06-01 2022-12-08 弈柯莱生物科技(上海)股份有限公司 一种糖基转移酶及其应用
CN115449514A (zh) * 2021-06-08 2022-12-09 弈柯莱生物科技(上海)股份有限公司 一种β-1,2-糖基转移酶及其应用

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL268121B2 (en) 2017-02-03 2024-01-01 Codexis Inc Transgenic glycosyltransferases and steviol glycoside glucosylation methods
BR112021000876A2 (pt) * 2018-07-16 2021-04-13 Manus Bio, Inc. Produção de glicosídeos de esteviol através da biotransformação com células inteiras
CN111378631B (zh) * 2019-01-28 2021-08-24 江南大学 一种海藻糖合成酶突变体及其在海藻糖生产中的应用
WO2020237226A1 (en) * 2019-05-23 2020-11-26 Arzeda Corp. Compositions and methods for producing steviol glycosides
CA3144658A1 (en) 2019-06-25 2020-12-30 Manus Bio, Inc. Uridine diphosphate-dependent glycosyltransferase enzyme
CA3164769A1 (en) * 2019-12-16 2021-06-24 Manus Bio, Inc. Microbial production of mogrol and mogrosides
CN111662942A (zh) * 2020-05-25 2020-09-15 安徽金禾实业股份有限公司 一种双酶发酵催化生产莱鲍迪苷a的方法
US20230304055A1 (en) 2020-07-03 2023-09-28 C-Lecta Gmbh One-pot cell-free glycosylation process
WO2022084482A1 (en) 2020-10-22 2022-04-28 Dsm Ip Assets B.V. Microorganisms for diterpene production
KR102546737B1 (ko) * 2020-11-25 2023-06-22 씨제이제일제당 주식회사 포도당 전이 스테비아를 포함하는 감미질이 개선된 조성물
US20240102068A1 (en) * 2021-01-27 2024-03-28 Korea Advanced Institute Of Science And Technology C-glycosyltransferase variants and use thereof
WO2023044368A1 (en) * 2021-09-17 2023-03-23 Doublerainbow Biosciences Inc. Method for producing glycosylated therapeutics by using an immobilized enzyme preparation
AR127393A1 (es) * 2021-10-19 2024-01-17 Cj Cheiljedang Corp Métodos para preparar rebaudiósido d y rebaudiósido m
KR20230098495A (ko) * 2021-12-24 2023-07-04 주식회사 삼양사 당전이 효소 변이체 및 이를 이용한 스테비올 배당체의 제조방법
WO2024050533A2 (en) * 2022-09-02 2024-03-07 Arzeda Corp. Compositions and methods for producing rebaudioside m
WO2024121721A1 (en) 2022-12-05 2024-06-13 Tate & Lyle Solutions Usa Llc Methods for obtaining steviol glycosides
CN116426506B (zh) * 2023-03-10 2024-01-30 云南师范大学 低温活性提高的β-木糖苷酶突变体D259G及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130171328A1 (en) * 2010-06-02 2013-07-04 Ganesh M. Kishore Production of steviol glycosides in microorganisms
CN105051195A (zh) * 2013-02-06 2015-11-11 埃沃尔瓦公司 用于提高莱鲍迪苷d和莱鲍迪苷m之产生的方法
US20160264980A1 (en) * 2002-10-02 2016-09-15 Monsanto Company, LLC Transgenic plants with enhanced agronomic traits

Family Cites Families (177)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58149697A (ja) 1982-02-27 1983-09-06 Dainippon Ink & Chem Inc β−1,3グリコシルステビオシドの製造方法
US5928905A (en) 1995-04-18 1999-07-27 Glaxo Group Limited End-complementary polymerase reaction
US6406855B1 (en) 1994-02-17 2002-06-18 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6995017B1 (en) 1994-02-17 2006-02-07 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US20060257890A1 (en) 1996-05-20 2006-11-16 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6165793A (en) 1996-03-25 2000-12-26 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6309883B1 (en) 1994-02-17 2001-10-30 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
WO1995033836A1 (en) 1994-06-03 1995-12-14 Novo Nordisk Biotech, Inc. Phosphonyldipeptides useful in the treatment of cardiovascular diseases
WO1996000787A1 (en) 1994-06-30 1996-01-11 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
US6506602B1 (en) 1996-03-25 2003-01-14 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
DK1717322T3 (da) 1997-01-17 2012-10-22 Codexis Mayflower Holdings Llc Udvikling af hele celler og organismer ved rekursiv sekvensrekombination
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US7148054B2 (en) 1997-01-17 2006-12-12 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6265201B1 (en) 1997-01-17 2001-07-24 Regents Of The University Of Minnesota DNA molecules and protein displaying improved triazine compound degrading ability
KR20010032861A (ko) 1997-12-08 2001-04-25 캘리포니아 인스티튜트 오브 테크놀로지 폴리뉴클레오티드 및 폴리펩티드 서열을 형성하는 방법
KR20010034731A (ko) 1998-04-02 2001-04-25 텔루스 제너틱 리소시즈, 인크. 유전자 서열 중에 유전자 병변이 있는 식물을 얻는 방법
EP1073670A1 (en) 1998-05-01 2001-02-07 Maxygen, Inc. Optimization of pest resistance genes using dna shuffling
AU4441699A (en) 1998-06-17 2000-01-05 Maxygen, Inc. Method for producing polynucleotides with desired properties
US6365408B1 (en) 1998-06-19 2002-04-02 Maxygen, Inc. Methods of evolving a polynucleotides by mutagenesis and recombination
JP2002522072A (ja) 1998-08-12 2002-07-23 マキシジェン, インコーポレイテッド 工業用化学薬品の製造のためのモノオキシゲナーゼ遺伝子のdnaシャッフリング。
US6500639B2 (en) 1998-10-07 2002-12-31 Maxygen, Inc. DNA shuffling to produce nucleic acids for mycotoxin detoxification
WO2000028018A1 (en) 1998-11-10 2000-05-18 Maxygen, Inc. Modified adp-glucose pyrophosphorylase for improvement and optimization of plant phenotypes
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6917882B2 (en) 1999-01-19 2005-07-12 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
EP1062614A1 (en) 1999-01-19 2000-12-27 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US20070065838A1 (en) 1999-01-19 2007-03-22 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US8457903B1 (en) 1999-01-19 2013-06-04 Codexis Mayflower Holdings, Llc Method and/or apparatus for determining codons
US6961664B2 (en) 1999-01-19 2005-11-01 Maxygen Methods of populating data structures for use in evolutionary simulations
US7873477B1 (en) 2001-08-21 2011-01-18 Codexis Mayflower Holdings, Llc Method and system using systematically varied data libraries
US7702464B1 (en) 2001-08-21 2010-04-20 Maxygen, Inc. Method and apparatus for codon determining
CA2361384A1 (en) 1999-02-11 2000-08-17 Sun Ai Raillard High throughput mass spectrometry
CA2362737A1 (en) 1999-03-05 2000-09-08 Maxygen, Inc. Recombination of insertion modified nucleic acids
US6703240B1 (en) 1999-04-13 2004-03-09 Maxygar, Inc. Modified starch metabolism enzymes and encoding genes for improvement and optimization of plant phenotypes
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
US6519065B1 (en) 1999-11-05 2003-02-11 Jds Fitel Inc. Chromatic dispersion compensation device
US6686515B1 (en) 1999-11-23 2004-02-03 Maxygen, Inc. Homologous recombination in plants
CA2396320A1 (en) 2000-01-11 2001-07-19 Maxygen, Inc. Integrated systems and methods for diversity generation and screening
EP1272967A2 (en) 2000-03-30 2003-01-08 Maxygen, Inc. In silico cross-over site selection
EP1287123B1 (en) 2000-04-03 2011-03-02 Maxygen, Inc. Subtilisin variant
AU2002211798A1 (en) 2000-10-20 2002-05-06 Michigan State University Transgenic plants containing ligninase and cellulase which degrade lignin and cellulose to fermentable sugars
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
US7747391B2 (en) 2002-03-01 2010-06-29 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
DK2390803T3 (da) 2002-03-01 2014-01-27 Codexis Mayflower Holdings Llc Fremgangsmåder, systemer og software til identificering af funktionelle biomolekyler
JP4851687B2 (ja) 2002-03-09 2012-01-11 マキシジェン, インコーポレイテッド 定向進化のための交叉点の最適化
WO2005017135A1 (en) 2003-08-11 2005-02-24 Codexis, Inc. Improved ketoreductase polypeptides and related polynucleotides
US7923552B2 (en) 2004-10-18 2011-04-12 SGF Holdings, LLC High yield method of producing pure rebaudioside A
US9386797B2 (en) 2011-02-17 2016-07-12 Purecircle Sdn Bhd Glucosyl stevia composition
CN101679960B (zh) 2007-05-30 2013-01-16 丹尼斯科美国公司 在发酵过程中具有改良生产水平的α-淀粉酶的变体
WO2009102899A1 (en) 2008-02-12 2009-08-20 Codexis, Inc. Method of generating an optimized diverse population of variants
US8768871B2 (en) 2008-02-12 2014-07-01 Codexis, Inc. Method of generating an optimized, diverse population of variants
HUE041367T2 (hu) 2008-06-13 2019-05-28 Codexis Inc Eljárás polinukleotid-változatok szintézisére
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
US8546085B2 (en) 2008-06-13 2013-10-01 Givaudan Sa Methods of identifying modulators of the bitter taste receptor TAS2R44
US8383346B2 (en) 2008-06-13 2013-02-26 Codexis, Inc. Combined automated parallel synthesis of polynucleotide variants
KR102061165B1 (ko) 2008-10-03 2019-12-31 모리타 가가쿠 고교 가부시키가이샤 신규 스테비올 배당체
CA2743302A1 (en) 2008-11-11 2010-05-20 Danisco Us Inc. Proteases comprising one or more combinable mutations
EP2544538B1 (en) 2010-03-12 2022-06-15 PureCircle USA Inc. High-purity steviol glycosides
WO2016049315A1 (en) 2014-09-26 2016-03-31 Purecircle Usa Inc. Stevia composition, production method and uses
US20150344512A1 (en) 2011-12-19 2015-12-03 Purecircle Usa Inc. Methods of purifying steviol glycosides and uses of the same
WO2012082587A2 (en) 2010-12-13 2012-06-21 Purecircle Usa Highly soluble rebaudioside d
US20140030381A1 (en) 2011-02-17 2014-01-30 Purecircle Usa Inc. Glucosyl stevia composition
US8783566B1 (en) 2011-06-14 2014-07-22 Norman J. Drew Electronic registration kiosk for managing individual healthcare information and services
EP2726651B1 (en) 2011-06-28 2018-11-07 Codexis, Inc. Protein variant generation by region shuffling
KR102114493B1 (ko) * 2011-08-08 2020-05-26 에볼바 에스아 스테비올 글리코시드의 재조합 생산
TR201802109T4 (tr) 2011-12-19 2018-03-21 Coca Cola Co Steviol glikositlerini içeren içecek.
DK2806754T3 (en) 2012-01-23 2019-02-18 Dsm Ip Assets Bv Diterpene PREPARATION
CA2867112C (en) 2012-03-16 2021-04-20 Suntory Holdings Limited Steviol glucosyltransferases and genes encoding the same
JP6346174B2 (ja) 2012-05-22 2018-06-20 ピュアサークル スンディリアン ブルハド 高純度ステビオールグリコシド
US9752174B2 (en) 2013-05-28 2017-09-05 Purecircle Sdn Bhd High-purity steviol glycosides
TW201402599A (zh) 2012-05-30 2014-01-16 Suntory Holdings Ltd 甜菊糖苷糖苷轉化酵素及編碼該酵素之基因
PE20151411A1 (es) 2012-09-25 2015-09-23 Cargill Inc Mezclas de esteviosidos
US20150342234A1 (en) 2012-12-05 2015-12-03 Evolva Sa Steviol Glycoside Compositions Sensory Properties
US20140171519A1 (en) 2012-12-19 2014-06-19 Indra Prakash Compositions and methods for improving rebaudioside x solubility
KR20150128705A (ko) 2013-02-11 2015-11-18 에볼바 에스아 재조합 숙주에서 스테비올 글리코시드의 효율적인 생성
KR101404728B1 (ko) 2013-02-28 2014-06-09 씨제이제일제당 (주) 스테비오사이드로부터 리바우디오사이드 a를 제조하는 방법
US20150050410A1 (en) 2013-03-14 2015-02-19 Chromocell Corporation Compounds, compositions, and methods for modulating sweet taste
US20140322389A1 (en) 2013-03-14 2014-10-30 Indra Prakash Beverages containing rare sugars
US20140272068A1 (en) 2013-03-14 2014-09-18 Indra Prakash Beverages containing rare sugars
US9717267B2 (en) 2013-03-14 2017-08-01 The Coca-Cola Company Beverages containing rare sugars
US10570164B2 (en) 2013-03-15 2020-02-25 The Coca-Cola Company Steviol glycosides, their compositions and their purification
EP2986149B1 (en) 2013-03-15 2019-08-21 The Coca-Cola Company Novel glucosyl steviol glycosides, their compositions and their purification
US20140342044A1 (en) 2013-05-14 2014-11-20 Pepsico, Inc. Compositions and Comestibles
US20140342043A1 (en) 2013-05-14 2014-11-20 Pepsico, Inc. Rebaudioside Sweetener Compositions and Food Products Sweetened with Same
AU2014273054A1 (en) 2013-05-31 2015-12-03 Dsm Ip Assets B.V. Extracellular diterpene production
US10039834B2 (en) 2013-07-12 2018-08-07 The Coca-Cola Company Compositions and methods using rebaudioside X to provide sweetness enhancement
US10905146B2 (en) 2013-07-12 2021-02-02 The Coca-Cola Company Compositions for improving rebaudioside M solubility
WO2015007748A1 (en) 2013-07-15 2015-01-22 Dsm Ip Assets B.V. Diterpene production
EP3024941B1 (en) 2013-07-23 2019-07-03 DSM IP Assets B.V. Diterpene production in yarrowia
AU2014298420B2 (en) 2013-07-31 2018-10-04 Dsm Ip Assets B.V. Recovery of steviol glycosides
CN103397064B (zh) 2013-08-14 2015-04-15 苏州汉酶生物技术有限公司 一种酶法制备瑞鲍迪甙m的方法
WO2015042137A1 (en) 2013-09-23 2015-03-26 Almendra Americas, LLC Sweetener composition, sweetener products, and methods of sweetening
US20160251635A1 (en) 2013-11-01 2016-09-01 Conagen Inc. Recombinant production of steviol glycosides
KR102115640B1 (ko) 2014-01-28 2020-05-26 페푸시코인코포레이팃드 효소 방법을 사용하여 레바우디오사이드 m을 제조하기 위한 방법
US20150223505A1 (en) 2014-02-12 2015-08-13 Purecircle Usa Inc. Stevia composition, production method and uses
US10609942B2 (en) 2015-01-06 2020-04-07 James and Carol May Family, LLLP Compositions and methods for sweeteners
WO2015127297A1 (en) 2014-02-21 2015-08-27 James and Carol May Family, LLLP Compositions and methods for the solubilization of stevia glycosides
WO2015152707A1 (en) 2014-04-02 2015-10-08 Purecircle Sdn Bhd Compounds produced from stevia and process for producing the same
US20180020709A1 (en) 2014-04-16 2018-01-25 Purecircle Usa Inc. Rebaudioside m biosynthetic production and recovery methods
US9522929B2 (en) 2014-05-05 2016-12-20 Conagen Inc. Non-caloric sweetener
US10264811B2 (en) 2014-05-19 2019-04-23 Epc Natural Products Co., Ltd. Stevia sweetener with improved solubility
GB2526383B (en) 2014-05-20 2018-01-31 Tate & Lyle Ingredients Americas Llc Improved sweetener
US10357052B2 (en) 2014-06-16 2019-07-23 Sweet Green Fields USA LLC Rebaudioside A and stevioside with improved solubilities
US10485256B2 (en) 2014-06-20 2019-11-26 Sweet Green Fields International Co., Limited Stevia sweetener with improved solubility with a cyclodextrin
CN104151378A (zh) 2014-08-12 2014-11-19 济南汉定生物工程有限公司 一种甜菊糖甙rm的提纯方法
CN114052237A (zh) 2014-08-19 2022-02-18 谱赛科有限责任公司 制备莱鲍迪苷i的方法以及用途
EP3188728A4 (en) 2014-09-03 2018-02-28 Chromocell Corporation Compounds, compositions, and methods for modulating sweet taste
IL234525B (en) 2014-09-08 2018-05-31 Unavoo Food Tech Ltd The composition containing a filler and a flavoring agent and its use
CA2960693A1 (en) 2014-09-09 2016-03-17 Evolva Sa Production of steviol glycosides in recombinant hosts
JP6691536B2 (ja) 2014-09-11 2020-04-28 ペプシコ, インコーポレイテッドPepsiCo Inc. 甘味増強剤
KR101765369B1 (ko) 2014-09-19 2017-08-08 한국과학기술원 돌외 유래의 신규한 당전이효소 및 이의 용도
MX2017003666A (es) 2014-09-19 2018-02-01 Purecircle Sdn Bhd Esteviol glicosidos de alta pureza.
MX2017004248A (es) 2014-10-03 2017-05-19 Conagen Inc Edulcorantes no caloricos y metodos para sintetizar.
WO2016055578A1 (en) 2014-10-08 2016-04-14 Dsm Ip Assets B.V. Steviol glycoside production
MY182396A (en) 2014-11-05 2021-01-23 Manus Biosynthesis Inc Microbial production of steviol glycosides
US20160165941A1 (en) 2014-11-21 2016-06-16 Flipn'Sweet, LLC Sugar substitute compositions comprising digestion resistent soluble fiber
JP6783232B2 (ja) 2014-11-24 2020-11-11 カーギル インコーポレイテッド グリコシド組成物
CN107249356B (zh) 2014-12-17 2021-08-06 嘉吉公司 用于口服摄入或使用的甜菊醇糖苷化合物、组合物以及用于增强甜菊醇糖苷溶解度的方法
CN107428714A (zh) 2015-01-13 2017-12-01 卓莫赛尔公司 用于调节甜味的化合物、组合物和方法
CA2973674A1 (en) 2015-01-30 2016-08-04 Evolva Sa Production of steviol glycosides in recombinant hosts
AU2016230587B2 (en) 2015-03-11 2020-06-25 Morita Kagaku Kogyo Co., Ltd. Sweetener composition and food containing same
EP3271457B1 (en) 2015-03-16 2021-01-20 DSM IP Assets B.V. Udp-glycosyltransferases
BR112017020308A2 (pt) * 2015-03-23 2018-07-10 Dsm Ip Assets Bv udp-glicosiltransferases
HUE051977T2 (hu) 2015-04-14 2021-04-28 Conagen Inc Kalóriamentes édesítõk elõállítása mesterséges egész sejtes katalizátorok használatával
US20180289050A1 (en) 2015-05-20 2018-10-11 Cargill, Incorporated Glycoside compositions
JP2018516081A (ja) 2015-05-29 2018-06-21 カーギル・インコーポレイテッド 配糖体を産生するための熱処理
CA2987630A1 (en) 2015-05-29 2016-12-08 Cargill, Incorporated Fermentation methods for producing steviol glycosides with multi-phase feeding
US10815513B2 (en) 2015-05-29 2020-10-27 Cargill, Incorporated Fermentation methods for producing steviol glycosides using high pH and compositions obtained therefrom
CN105200098A (zh) 2015-06-30 2015-12-30 苏州汉酶生物技术有限公司 一种利用酿酒酵母酶法制备瑞鲍迪甙m的方法
CA2991662A1 (en) 2015-07-10 2017-01-19 Dsm Ip Assets B.V. Steviol glycoside composition
US10517321B2 (en) 2015-07-10 2019-12-31 Sweet Green Fields USA LLC Compositions of steviol multiglycosylated derivatives and stevia components
EP4043579A1 (en) 2015-07-10 2022-08-17 DSM IP Assets B.V. Method for preparing a steviol glycoside compostion
JP2018521680A (ja) 2015-08-06 2018-08-09 カーギル・インコーポレイテッド ステビオール配糖体を生成するための発酵法
WO2017031424A1 (en) 2015-08-20 2017-02-23 Pepsico, Inc. Preparation of rebaudioside m in a single reaction vessel
CN108289485B (zh) 2015-09-25 2023-03-10 可口可乐公司 甜菊醇糖苷共混物、组合物和方法
EP3766362B1 (en) 2015-10-02 2022-12-28 The Coca-Cola Company Method of production of steviol glycoside sweeteners with improved flavor profiles
US20170105432A1 (en) 2015-10-16 2017-04-20 Senomyx, Inc. Sweetener and flavor enhancer formulations
EP3364766A1 (en) 2015-10-23 2018-08-29 DSM IP Assets B.V. Low sugar flavoured yogurt
ES2970118T3 (es) 2015-10-26 2024-05-27 Purecircle Usa Inc Composiciones de glicósido de esteviol
WO2017093895A1 (en) 2015-11-30 2017-06-08 Purecircle Sdn Bhd Process for producing high purity steviol glycosides
AU2016367317A1 (en) 2015-12-10 2018-05-24 Evolva Sa Production of steviol glycosides in recombinant hosts
BR112018012950B1 (pt) 2015-12-24 2022-06-14 Danone Us, Llc Produtos lácteos adoçados com glicosídeos de esteviol e enzima lactase
WO2017120480A1 (en) 2016-01-07 2017-07-13 Purecircle Usa Inc. Highly soluble steviol glycosides
RU2733441C2 (ru) 2016-03-01 2020-10-01 Вм. Ригли Джр. Компани Составы подсластителя с длительным подслащивающим эффектом
US20170258120A1 (en) 2016-03-09 2017-09-14 Merisant US, Inc. Liquid sweetener compositions
WO2017156432A1 (en) 2016-03-10 2017-09-14 Chromocell Corporation Steviol glycoside esters
RU2768009C2 (ru) 2016-03-14 2022-03-22 ПЬЮРСЁРКЛ ЮЭсЭй ИНК. Высокорастворимые стевиолгликозиды
WO2017172766A1 (en) 2016-03-28 2017-10-05 The Coca-Cola Company Sweetness and taste improvement of steviol glycoside or mogroside sweeteners with flavonids
CN109152392A (zh) 2016-03-31 2019-01-04 三得利控股株式会社 含有甜菊的饮料
JP6257863B1 (ja) 2016-03-31 2018-01-10 サントリーホールディングス株式会社 ステビア含有飲料
CN109219355B (zh) 2016-04-06 2023-03-07 可口可乐公司 甜菊醇糖苷或罗汉果苷甜味剂的甜度和味道改善
WO2017178632A1 (en) 2016-04-13 2017-10-19 Evolva Sa Production of steviol glycosides in recombinant hosts
WO2017189778A1 (en) 2016-04-26 2017-11-02 Chromocell Corporation Methods, compounds, and compositions, for modulating sweet taste
US20190124953A1 (en) 2016-04-29 2019-05-02 Pepsico, Inc. Novel steviol glycosides blends
AU2017263377B2 (en) 2016-05-10 2021-07-29 The Coca-Cola Company Methods of freeze drying compositions containing rebaudioside M and rebaudioside D
WO2017207484A1 (en) * 2016-05-31 2017-12-07 Universiteit Gent Mutant sucrose synthases and their uses
US20170352267A1 (en) 2016-06-02 2017-12-07 GM Global Technology Operations LLC Systems for providing proactive infotainment at autonomous-driving vehicles
BR112018076109B1 (pt) 2016-06-14 2022-11-01 Purecircle Usa Inc Processo para produzir uma composição de glicosídeos de esteviol, composição adoçante, composição de paladar, ingrediente alimentar e alimento, bebida, produto cosmético e farmacêutico
US20180255815A1 (en) 2016-08-04 2018-09-13 Pepsico, Inc. Sweetening compositions
BR112019002417B1 (pt) 2016-08-09 2023-05-02 Dsm Ip Assets B.V. Cristalização de glicosídeos de esteviol
US20190169220A1 (en) 2016-08-09 2019-06-06 Dsm Ip Assets B.V. Crystallization of steviol glycosides
BR112018074999A2 (pt) 2016-08-12 2019-03-12 Amyris, Inc. glicosiltransferase dependente de udp para a produção de alta eficiência de rebaudiosídeo
US10085472B2 (en) 2016-08-29 2018-10-02 Pepsico, Inc. Compositions comprising rebaudioside J
IL268121B2 (en) 2017-02-03 2024-01-01 Codexis Inc Transgenic glycosyltransferases and steviol glycoside glucosylation methods
CN106866757B (zh) 2017-03-16 2020-06-26 诸城市浩天药业有限公司 甜菊糖m苷晶型及制备方法和用途
US20170354175A1 (en) 2017-05-15 2017-12-14 Senomyx, Inc. Sweetener composition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160264980A1 (en) * 2002-10-02 2016-09-15 Monsanto Company, LLC Transgenic plants with enhanced agronomic traits
US20130171328A1 (en) * 2010-06-02 2013-07-04 Ganesh M. Kishore Production of steviol glycosides in microorganisms
CN105051195A (zh) * 2013-02-06 2015-11-11 埃沃尔瓦公司 用于提高莱鲍迪苷d和莱鲍迪苷m之产生的方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112805295A (zh) * 2018-07-30 2021-05-14 科德克希思公司 工程化糖基转移酶和甜菊醇糖苷葡糖基化方法
CN112626047A (zh) * 2021-01-08 2021-04-09 中国科学院华南植物园 一组亚精胺衍生物糖基转移酶及其编码基因和应用
CN112626047B (zh) * 2021-01-08 2022-05-17 中国科学院华南植物园 一组亚精胺衍生物糖基转移酶及其编码基因和应用
CN112704731A (zh) * 2021-01-13 2021-04-27 中国农业科学院哈尔滨兽医研究所(中国动物卫生与流行病学中心哈尔滨分中心) 蛋白酶s273r抑制细胞焦亡的用途及方法
CN112704731B (zh) * 2021-01-13 2023-08-25 中国农业科学院哈尔滨兽医研究所(中国动物卫生与流行病学中心哈尔滨分中心) 蛋白酶s273r抑制细胞焦亡的用途及方法
WO2022253282A1 (zh) 2021-06-01 2022-12-08 弈柯莱生物科技(上海)股份有限公司 一种糖基转移酶及其应用
CN115449514A (zh) * 2021-06-08 2022-12-09 弈柯莱生物科技(上海)股份有限公司 一种β-1,2-糖基转移酶及其应用
CN115449514B (zh) * 2021-06-08 2023-09-29 弈柯莱生物科技(上海)股份有限公司 一种β-1,2-糖基转移酶及其应用
CN113462670A (zh) * 2021-08-23 2021-10-01 南京工业大学 一种糖基转移酶突变体及其催化合成莱鲍迪苷m的方法

Also Published As

Publication number Publication date
SG11201906480QA (en) 2019-08-27
EP3878967A2 (en) 2021-09-15
IL268121A (en) 2019-09-26
MX2022003824A (es) 2022-05-25
EP3878967A3 (en) 2021-12-08
AU2020289865B2 (en) 2022-12-01
JP2022163224A (ja) 2022-10-25
EP3577229A2 (en) 2019-12-11
WO2018144675A1 (en) 2018-08-09
BR112019015992A2 (pt) 2020-05-26
IL268121B1 (en) 2023-09-01
CA3175100A1 (en) 2018-08-09
KR102606350B1 (ko) 2023-11-23
KR20230162160A (ko) 2023-11-28
WO2018144679A2 (en) 2018-08-09
JP7176786B2 (ja) 2022-11-22
JP2020506704A (ja) 2020-03-05
WO2018144679A3 (en) 2018-12-13
MX2021005861A (es) 2021-08-11
CA3175070A1 (en) 2018-08-09
EP3882354A3 (en) 2021-12-15
US20180223264A1 (en) 2018-08-09
AU2020289868B2 (en) 2022-12-01
MX2021005862A (es) 2021-08-11
TW201837171A (zh) 2018-10-16
AU2020289868A1 (en) 2021-01-28
JP2021036911A (ja) 2021-03-11
US20220306998A1 (en) 2022-09-29
US20210054349A1 (en) 2021-02-25
EP3577229A4 (en) 2020-12-23
US20210054348A1 (en) 2021-02-25
US11920167B2 (en) 2024-03-05
KR20190124723A (ko) 2019-11-05
AU2018215335B2 (en) 2020-10-01
AU2018215335A1 (en) 2019-08-01
MX2019009233A (es) 2019-09-19
CA3050310A1 (en) 2018-08-09
JP7248322B2 (ja) 2023-03-29
TW202237833A (zh) 2022-10-01
TWI797103B (zh) 2023-04-01
EP3882354A2 (en) 2021-09-22
AU2022268390A1 (en) 2022-12-15
IL304833A (en) 2023-09-01
TW202237834A (zh) 2022-10-01
IL268121B2 (en) 2024-01-01
JP7248302B2 (ja) 2023-03-29
AU2020289865A1 (en) 2021-01-28
PH12019501698A1 (en) 2019-11-04
JP2021087447A (ja) 2021-06-10

Similar Documents

Publication Publication Date Title
JP7248322B2 (ja) 操作されたグリコシルトランスフェラーゼおよびステビオール配糖体グルコシル化方法
CN112805295A (zh) 工程化糖基转移酶和甜菊醇糖苷葡糖基化方法
CN109715182A (zh) 工程化β-葡糖苷酶和葡糖基化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231216

Address after: Illinois, USA

Applicant after: Taylor solutions USA LLC

Address before: California, USA

Applicant before: CODEXIS, Inc.

TA01 Transfer of patent application right