CN109563493A - 甜菊醇糖苷类和其他化合物用葡萄糖-1-磷酸酯的酶促糖基化 - Google Patents

甜菊醇糖苷类和其他化合物用葡萄糖-1-磷酸酯的酶促糖基化 Download PDF

Info

Publication number
CN109563493A
CN109563493A CN201780050203.3A CN201780050203A CN109563493A CN 109563493 A CN109563493 A CN 109563493A CN 201780050203 A CN201780050203 A CN 201780050203A CN 109563493 A CN109563493 A CN 109563493A
Authority
CN
China
Prior art keywords
leu
ala
asp
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780050203.3A
Other languages
English (en)
Inventor
乔纳森·弗罗姆
斯蒂芬妮·苏·加兰妮
奥斯卡·阿尔维左
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of CN109563493A publication Critical patent/CN109563493A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01007Sucrose phosphorylase (2.4.1.7)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了糖基转移酶(GT)酶、具有GT活性的多肽和编码这些酶的多核苷酸,以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了使用这些GT酶产生具有β‑葡萄糖键(linkage)的产物的方法。

Description

甜菊醇糖苷类和其他化合物用葡萄糖-1-磷酸酯的酶促糖 基化
本申请要求2016年6月15日提交的美国临时专利申请系列号62/350,450的优先权,在此为了所有目的通过引用以其整体并入。
发明领域
本发明提供了糖基转移酶(GT)酶、具有GT活性的多肽和编码这些酶的多核苷酸,以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了使用这些GT酶产生具有β-葡萄糖键(linkage)的产物的方法。
对作为ASCII文本文件提交的“序列表”、表或计算机程序列表附录的引用序列表的正式副本作为ASCII格式化文本文件经由EFS-Web与说明书同时提交,文件名为“CX8-155USP1_ST25.txt”,创建日期为2016年6月14日,且大小为98,304字节。经由EFS-Web提交的序列表为说明书的一部分并且通过引用以其整体并入本文。
发明背景
糖基转移酶(GT)是在翻译后将糖基残基从活化的核苷酸糖转移到单体和聚合物受体分子(例如,其他糖、蛋白质、脂质和其他有机底物)的酶。这些糖基化分子参与各种代谢途径和过程。葡糖基部分的转移可以改变受体的生物活性、溶解度和细胞内的转运性质。
发明概述
本发明提供了糖基转移酶、具有GT活性的多肽和编码这些酶的多核苷酸,以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了使用这些GT酶产生具有β-葡萄糖键的产物的方法。
本发明提供了用于使底物糖基化以产生β-糖基化产物的方法,所述方法包括以下步骤:提供至少一种糖基基团供体、至少一种糖基基团受体和至少一种糖基转移酶(glycosyltransferase enzyme);使糖基基团供体和糖基基团受体与糖基转移酶在使得糖基基团受体被糖基化以产生至少一种具有β-葡萄糖键的产物的条件下接触。在方法的一些实施方案中,糖基基团供体是糖基磷酸酯(glycosylphosphate)。在方法的一些另外的实施方案中,糖基基团供体是葡萄糖-1-磷酸酯(glucose-1-phosphate)。在方法的一些另外的实施方案中,糖基基团受体选自糖基基团、烷氧基基团、羧基基团、氨基羰基基团、杂烷基基团、杂烯基基团、杂炔基基团、羧基烷基基团、氨基烷基基团、卤代烷基基团、烷硫基烷基基团、杂环烷基基团、杂芳基基团和杂芳基烷基基团。在方法的一些又另外的实施方案中,具有β-葡萄糖键的产物是甜菊醇糖苷(steviol glycoside)。在方法的一些另外的实施方案中,糖基基团受体是甜菊苷(stevioside),所述糖基基团供体是α-葡萄糖-1-磷酸酯(alpha-glucose-1-phosphate),并且具有β-葡萄糖键的所述产物是莱鲍迪苷(rebaudioside)A。在方法的一些另外的实施方案中,糖基转移酶选自SEQ ID NO:2、4、6、8、10、12和14中列出的多肽。
本发明还提供了用于产生葡萄糖-1-磷酸酯的方法,所述方法包括以下步骤:提供磷酸化酶、无机磷酸和磷酸化酶的二糖、三糖或寡糖底物;使所述磷酸化酶、无机磷酸和糖在使得所述糖被裂解以产生单糖和葡萄糖-1-磷酸酯的条件下接触。在方法的一些实施方案中,将该方法与先前描述的方法组合。在方法的一些另外的实施方案中,葡糖基基团受体选自糖基基团、烷氧基基团、羧基基团、氨基羰基基团、杂烷基基团、杂烯基基团、杂炔基基团、羧基烷基基团、氨基烷基基团、卤代烷基基团、烷硫基烷基基团、杂环烷基基团、杂芳基基团和杂芳基烷基基团。在方法的仍一些另外的实施方案中,磷酸化酶是蔗糖磷酸化酶,所述糖是蔗糖,产生的所述单糖是蔗糖,并且产生的所述葡萄糖-1-磷酸酯是α-葡萄糖-1-磷酸酯。在方法的一些另外的实施方案中,磷酸化酶包含选自SEQ ID NO:16、18、20、22、24、26、28、30和32的多肽序列。
附图描述
图1提供了酶促反应方案,其中糖基转移酶催化糖基基团从糖基磷酸酯例如葡萄糖-1-磷酸酯转移到受体例如R-OH,其中R是任何糖基基团、烷氧基基团、羧基基团、氨基羰基基团、杂烷基基团、杂烯基基团、杂炔基基团、羧基烷基基团、氨基烷基基团、卤代烷基基团、烷硫基烷基基团、杂环烷基基团、杂芳基基团或杂芳基烷基基团。
图2提供了本发明的一个实施方案的示意图,其中将图1中描述的酶促反应应用于底物甜菊苷,并且糖基磷酸酯是α-葡萄糖-1-磷酸酯,并催化β-葡萄糖键的形成以产生产物莱鲍迪苷A。
图3提供了本发明的一个实施方案的示意图,其中两个酶促反应被配对(paired)用于原位生成葡萄糖-1-磷酸酯。在一个反应中,蔗糖磷酸化酶使用无机磷酸来裂解蔗糖,提供α-葡萄糖-1-磷酸酯和果糖,并且在另一个反应中,来自α-葡萄糖-1-磷酸酯的糖基基团被转移到受体。R是任何糖基基团、烷氧基基团、羧基基团、氨基羰基基团、杂烷基基团、杂烯基基团、杂炔基基团、羧基烷基基团、氨基烷基基团、卤代烷基基团、烷硫基烷基基团、杂环烷基基团、杂芳基基团或杂芳基烷基基团。
发明描述
本发明提供了糖基转移酶(GT)酶、具有GT活性的多肽和编码这些酶的多核苷酸,以及包含这些多核苷酸和多肽的载体和宿主细胞。本发明还提供了使用这些GT酶产生具有β-葡萄糖键的产物的方法。
除非另外定义,否则本文使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同的含义。通常,本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学的实验室程序是本领域熟知且常用的那些。这样的技术是熟知的并被描述于本领域技术人员熟知的许多教科书和参考著作中。对于化学合成和化学分析,使用了标准技术或其修改形式。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物,在此通过引用明确并入本文。
尽管本发明的实践中可使用类似于或等同于本文描述那些方法和材料的任何合适的方法和材料,本文描述了一些方法和材料。应理解本发明不限于所描述的特定方法论、方案和试剂,因为这些可取决于本领域技术人员使用其的背景而变化。因此,下文即将定义的术语通过参考本发明作为整体而被更充分地描述。
应理解,上文的一般描述和下文的详细描述仅是示例性的和说明性的,而不限制本发明。本文使用的章节标题仅用于组织目的,并且不被解释为限制所描述的主题。数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图涵盖落在此类较宽数值范围内的每一较窄数值范围,如同此类较窄数值范围在本文被全部明确地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制,如同此类较低(或较高)的数值限制在本文中被明确地写出。
缩写
用于遗传编码的氨基酸的缩写是常规的并且如下所示:
当使用三字母缩写时,除非前面明确有“L”或“D”,或者从使用缩写的上下文清楚看出,否则氨基酸可以关于α-碳(Cα)是L-构型或D-构型。例如,“Ala”表示丙氨酸而不指定关于α-碳的构型,而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,并且小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列以单字母缩写或三字母缩写(或其混合物)串表示时,根据常规惯例将序列呈现为氨基(N)至羧基(C)方向。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非具体阐明,否则缩写的核苷可以是核糖核苷或2'-脱氧核糖核苷。核苷可以基于个体或基于集合体被指明为核糖核苷或2'-脱氧核糖核苷。当核酸序列以单字母缩写串呈现时,根据常规惯例将序列呈现为5'至3'方向,并且不示出磷酸根。
定义
参考本发明,本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另外具体定义。因此,以下术语意图具有以下含义。
除非上下文另外清楚地指明,如本文使用的单数形式"一(a)"、"一(an)"和"该(the)"包括复数指代物。因此,例如对“多肽(a polypeptide)”的提及包括多于一个多肽。
类似地,“包括/包含(comprise、comprises、comprising)”、“包括/包含(include、includes和including)”是可互换的,并且不意图是限制性的。因此,如本文使用的,术语“包括/包含(comprising)”及其同根词以它们的包含性含义被使用(即,等同于术语“包括/包含(including)”及其相应的同根词)。
还应理解,在各种实施方案的描述中使用术语“包括/包含(comprising)”的情况下,本领域技术人员将理解,在一些特定情况下,可以可选择地使用语言“主要由...组成(consisting essentially of)”或“由...组成(consisting of)”描述实施方案。
术语“约”意指特定值的可接受误差。在一些情况下,“约”意指在给定值范围的0.05%、0.5%、1.0%或2.0%以内。在一些情况下,“约”意指在给定值的1个、2个、3个或4个标准差以内。
“EC”编号指的是生物化学和分子生物学国际联合命名委员会(NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology)(NC-IUBMB)的酶命名法。该IUBMB生物化学分类是基于酶催化的化学反应的酶的数字分类系统。
“ATCC”指的是美国典型培养物保藏中心(American Type Culture Collection),其生物保藏收集物包括基因和菌株。
“NCBI”指的是美国国家生物技术信息中心(National Center for BiologicalInformation)和在其中提供的序列数据库。
“蛋白”、“多肽”和“肽”在本文可互换使用,以表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而无论长度或翻译后修饰(例如,糖基化或磷酸化)如何。该定义中包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物、以及包含D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物的聚合物。
“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文被提及。同样地,核苷酸可以通过其通常可接受的单字母代码被提及。
如本文使用的,“多核苷酸”和“核酸”指的是共价连接在一起的两个或更多个核苷。多核苷酸可以完全包含核糖核苷酸(即,RNA)、完全包含2'脱氧核糖核苷酸(即,DNA)或包含核糖核苷酸和2'脱氧核糖核苷酸的混合物。虽然核苷典型地将经由标准磷酸二酯键连接在一起,但多核苷酸可以包括一个或更多个非标准键。多核苷酸可以是单链或双链的,或者可以包括单链区域和双链区域二者。此外,虽然多核苷酸典型地将包含天然存在的编码核苷碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),它可以包含一种或更多种修饰的和/或合成的核苷碱基,诸如例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中,这样的修饰的或合成的核苷碱基是编码氨基酸序列的核苷碱基。
“编码序列”指的是编码蛋白质的氨基酸序列的核酸部分(例如,基因)。
如本文使用的,术语“生物催化(biocatalysis)”、“生物催化(biocatalytic)”、“生物转化”和“生物合成”指的是使用酶来对有机化合物进行化学反应。
“糖基转移酶”指的是具有将糖基残基从活化的糖(例如核苷酸二磷酸糖(nucleotide diphosphate sugar)或磷酸糖(phosphosugar))转移到单体受体分子和聚合物受体分子的酶促能力的多肽。
“磷酸化酶”指的是具有使用无机磷酸裂解糖苷键、释放磷酸糖苷和单体产物或聚合物产物的酶促能力的多肽。在相反的方向,磷酸化酶可以通过将糖基残基从磷酸糖苷例如葡萄糖-1-磷酸酯转移到单体受体和聚合物受体来充当糖基转移酶。
如本文使用的,“糖基化”指的是在糖基残基和受体分子之间形成糖苷键。
如本文使用的,“葡糖基化”指的是在葡萄糖残基和受体分子之间形成糖苷键。
如本文使用的,“糖基(glycosyl)”指的是一种有机基团,其是通过从环状形式的单糖、低级寡糖或寡糖衍生物去除半缩醛羟基基团而获得的单价自由基或取代基结构。糖基基团与无机酸(例如,磷酸)反应以形成酯(例如,葡萄糖1-磷酸酯)。
如本文使用的,“糖苷(glycoside)”指的是其中碳水化合物(例如糖)通过糖苷键与另一官能团结合的分子。糖苷类可以被水解以产生糖和非糖(即糖苷配基)组分。
如本文使用的,术语“甜菊醇糖苷(steviol glycoside)”指的是甜菊醇的糖苷,包括但不限于天然存在的甜菊醇糖苷类(例如,甜菊苷(stevioside)、甜菊醇单苷(steviolmonoside)、甜菊醇双苷(steviolbioside)、甜茶苷、杜克苷(dulcoside)B、杜克苷A、莱鲍迪苷B、莱鲍迪苷G、莱鲍迪苷C、莱鲍迪苷F、莱鲍迪苷A、莱鲍迪苷I、莱鲍迪苷E、莱鲍迪苷H、莱鲍迪苷L、莱鲍迪苷K、莱鲍迪苷J、莱鲍迪苷M(也被称为莱鲍迪苷X)、莱鲍迪苷D、莱鲍迪苷N、莱鲍迪苷O)和合成的甜菊醇糖苷类(例如,酶促葡糖基化的甜菊醇糖苷类)及其组合。甜菊醇及其糖苷类的化学结构如下(参见WO2013/176738)。
甜菊醇及其糖苷类的化学结构
如本文使用的,“野生型”和“天然存在的”指的是在自然界中发现的形式。例如野生型多肽或多核苷酸序列为生物体中存在的序列,其可以从天然来源分离且未通过人为操作被有意识地修饰。
如本文使用的,当提及细胞、核酸或多肽使用时,“重组”、“工程化”和“非天然存在的”指的是已经以自然中原本不存在的方式被修饰的材料或已经以自然中原本不存在的方式被修饰的与该材料的天然或原生形式相对应的材料。在一些实施方案中,细胞、核酸或多肽与天然存在的细胞、核酸或多肽相同,但由合成材料和/或通过使用重组技术操作产生或衍生。非限制性实例包括,除其他以外,表达在原生(非重组)形式的细胞中未发现的基因或表达原本以不同水平表达的原生基因的重组细胞。
术语“序列同一性百分比(%)”在本文中被使用以指多核苷酸或多肽之间的比较,并通过跨比较窗比较两条最佳比对的序列来确定,其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包括添加或缺失(即,空位),以用于两个序列的最佳比对。百分比可以如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。可选择地,百分比可以如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目或者核酸碱基或氨基酸残基与空位对齐的位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解,存在许多可用于比对两个序列的已建立的算法。如本领域已知的,用于比较的序列的最佳比对可以通过任何合适的方法进行,所述合适的方法包括但不限于,Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981])、通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970])、通过Pearson和Lipman的相似度检索方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988])、通过这些算法的计算机实现(例如,在GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)或通过目测。适合于确定序列同一性百分比和序列相似性的算法的实例包括但不限于BLAST和BLAST 2.0算法,其由Altschul等人描述(分别参见,Altschul等人,J.Mol.Biol.,215:403-410[1990];和Altschul等人,Nucl.Acids Res.,3389-3402[1977])。用于进行BLAST分析的软件为通过美国国家生物技术信息中心网站公共可得的。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP),当所述短字与数据库序列中相同长度的字比对时匹配或满足一些正值的阈值评分T。T被称为邻近字评分阈值(参见,Altschul等人,同上)。这些最初的邻近字击中(word hit)充当用于启动检索的种子以找到更长的包含它们的HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数M(对于匹配残基对的奖励评分;始终>0)和N(对于错配残基的惩罚评分;始终<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。当:累积比对评分从其最大达到值下降了量X;由于累积一个或更多个负评分残基比对,累积评分达到0或以下;或到达任一序列末端时,每一个方向中的字击中的延伸被终止。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为缺省值:字长(W)为11、期望值(E)为10、M=5、N=-4、以及两个链的比较。对于氨基酸序列,BLASTP程序使用以下作为缺省值:字长(W)为3,期望值(E)为10和BLOSUM62评分矩阵(参见,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与序列同一性%的示例性确定可以使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用提供的缺省参数。
如本文使用的,“参考序列”指的是用作序列和/或活性比较的基础的指定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或核酸或多肽的全长。因为两个多核苷酸或多肽各自可以(1)包括在两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包括在两个序列之间趋异的(divergent)序列,所以两个(或更多个)多核苷酸或多肽之间的序列比较典型地通过比较两个多核苷酸或多肽在“比较窗”上的序列以鉴定和比较局部序列区域的相似性来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列,其中参考序列是可以在一级序列中具有一个或更多个变化的序列。
如本文使用的,“比较窗”指的是至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中序列在比较窗中的部分与参考序列(其不包含添加或缺失)相比,可以包括20%或更少的添加或缺失(即,空位)以用于两个序列的最佳比对。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。
如本文使用的,当在给定的氨基酸或多核苷酸序列的编号的情况中使用时,“对应于”、“参考”或“相对于”指的是当给定的氨基酸或多核苷酸序列与参考序列相比较时指定的参考序列残基的编号。换言之,给定的聚合物的残基数目或残基位置关于参考序列被指定,而不是通过给定的氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,给定的氨基酸序列,诸如工程化糖基转移酶的氨基酸序列可以通过引入空位以与参考序列比对而优化两个序列之间的残基匹配。在这些情况下,尽管存在空位,在给定的氨基酸或多核苷酸序列中的残基的编号关于与其比对的参考序列做出。
如本文使用的,“实质同一性(substantial identity)”指的是跨至少20个残基位置的比较窗、通常跨至少30个-50个残基的窗口与参考序列相比,具有至少80%序列同一性、至少85%同一性、至少89%至95%之间的序列同一性,或更通常至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性的百分比通过跨比较窗比较参考序列和包含总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的一些具体的实施方案中,术语“实质同一性”意指当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共享至少80%的序列同一性,优选地至少89%的序列同一性、至少95%的序列同一性或更高(例如99%的序列同一性)。在一些实施方案中,在被比较的序列中不相同的残基位置因保守氨基酸取代而不同。
如本文使用的,“氨基酸差异”和“残基差异”指的是在多肽序列的一个位置处氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。氨基酸差异的位置通常在本文中被称为“Xn”,其中n指的是残基差异所基于的参考序列中的对应位置。例如,“与SEQ IDNO:4相比在位置X93处的残基差异”指的是在对应于SEQ ID NO:4的位置93的多肽位置处的氨基酸残基的差异。因此,如果SEQ ID NO:4的参考多肽在位置93处具有丝氨酸,则“与SEQID NO:4相比在位置X93处的残基差异”指的是在对应于SEQ ID NO:4的位置93的多肽位置处除了丝氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下,在一个位置处的特定氨基酸残基差异指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是在工程化多肽中发现的氨基酸(即,与参考多肽中的不同的残基)的单字母标识符。在一些情况下,本发明还提供由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是参考序列中的残基位置的编号,并且B是工程化多肽的序列中残基取代的单字母标识符。在一些情况下,本发明的多肽相对于参考序列可以包含一个或更多个氨基酸残基差异,其由其中相对于参考序列存在残基差异的一列指定位置指示。在一些实施方案中,在多于一个氨基酸可以在多肽的特定残基位置中使用的情况下,可以使用的多种氨基酸残基由“/”分开(例如,X307H/X307P或X307H/P)。斜线还可以用于指示给定变体内的多于一个取代(即,在给定的序列中存在多于一个取代)。在一些实施方案中,本发明包括包含一个或更多个氨基酸差异的工程化多肽序列,所述氨基酸差异包括保守氨基酸取代或非保守氨基酸取代。在一些另外的实施方案中,本发明提供了包含保守氨基酸取代和非保守氨基酸取代两者的工程化多肽序列。
如本文使用的,“保守氨基酸取代”指的是将残基用具有相似侧链的不同残基来取代,并且因此典型地包括将多肽中的氨基酸用相同或相似的定义的氨基酸类别中的氨基酸取代。例如但不限于,具有脂肪族侧链的氨基酸被另一个脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一个具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳香族侧链的氨基酸被另一个具有芳香族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一个具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一个具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水性氨基酸或亲水性氨基酸分别被另一个疏水性氨基酸或亲水性氨基酸取代。
如本文使用的,“非保守取代”指的是将多肽中的氨基酸用具有显著不同的侧链性质的氨基酸取代。非保守取代可以使用定义的组之间而不是定义的组之内的氨基酸,并且影响:(a)取代区域中的肽骨架的结构(例如,用脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。例如但不限于,示例性非保守取代可以是用碱性氨基酸或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳香族氨基酸;和用疏水性氨基酸取代亲水性氨基酸。
如本文使用的,“缺失(deletion)”指的是通过从参考多肽去除一个或更多个氨基酸的多肽修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10%、或多达组成参考酶的氨基酸总数的20%,同时保留酶促活性和/或保留工程化糖基转移酶的改进的性质。缺失可以涉及多肽的内部和/或端部。在各种实施方案中,缺失可以包括连续区段的缺失或可以是不连续的。
如本文使用的,“插入(insertion)”指的是通过从参考多肽添加一个或更多个氨基酸的多肽修饰。插入可以在多肽的内部或插入至羧基或氨基末端。如本文使用的插入物包括如本领域已知的融合蛋白。插入物可以是氨基酸的连续区段或由天然存在的多肽中的一个或更多个氨基酸分开。
“功能片段”或“生物活性片段”在本文可互换使用,指的是这样的多肽:所述多肽具有氨基末端和/或羧基末端缺失和/或内部缺失,但其中剩余的氨基酸序列与和它相比较的序列(例如,本发明的全长工程化糖基转移酶)中的对应位置相同,并且保留全长多肽的基本上所有的活性。
如本文使用的,“分离的多肽”指的是这样的多肽:所述多肽与天然伴随其的其他污染物(例如,蛋白、脂质和多核苷酸)基本上分开。该术语包括已经从它们天然存在的环境或表达系统(例如,宿主细胞内或经由体外合成)中取出或纯化的多肽。重组糖基转移酶多肽可以存在于细胞内、存在于细胞培养基中,或以多种形式(诸如裂解物或分离的制品)制备。因此,在一些实施方案中,重组糖基转移酶多肽可以是分离的多肽。
如本文使用的,“基本上纯的多肽”指的是这样的组合物,在所述组合物中多肽物类是存在的优势物类(即,基于摩尔或重量,它比在该组合物中的任何其他个体大分子物类更丰富),并且当目标物类构成存在的大分子物类的按摩尔或%重量计至少约50%时,通常是基本上纯化的组合物。然而,在一些实施方案中,包含糖基转移酶的组合物包含少于50%纯(例如,约10%、约20%、约30%、约40%、或约50%)的糖基转移酶。通常,基本上纯的糖基转移酶组合物构成该组合物中存在的所有大分子物类的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物类纯化至基本同质(即,通过常规检测方法不能在组合物中检测出污染物物类),其中该组合物基本上由单一大分子物类组成。溶剂物类、小分子(<500道尔顿)和元素离子物类不被认为是大分子物类。在一些实施方案中,分离的重组糖基转移酶多肽是基本上纯的多肽组合物。
如本文使用的,“改进的酶性质”指的是酶的至少一种改进的性质。在一些实施方案中,本发明提供了与参考糖基转移酶多肽和/或野生型糖基转移酶多肽和/或另外的工程化糖基转移酶多肽相比表现出在任何酶性质中的改进的工程化糖基转移酶多肽。因此,可以确定“改进”的水平并在各种糖基转移酶多肽,包括野生型以及工程化糖基转移酶之间比较。改进的性质包括但不限于诸如以下的性质:增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的pH活性、增加的稳定性、增加的酶活性、增加的底物特异性或亲和力、增加的比活性、增加的对底物或终产物抑制的耐受性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性pH的耐受性、增加的对蛋白水解活性的耐受性(即,降低的对蛋白水解的敏感性)、降低的聚集、增加的溶解度、和改变的温度曲线(temperature profile)。
如本文使用的,“增加的酶促活性”和“增强的催化活性”指的是工程化糖基转移酶多肽的改进的性质,其可以被表示为与参考糖基转移酶相比,比活性(例如产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如在指定的时间段使用指定量的糖基转移酶,起始量的底物向产物的转化百分比)的增加。确定酶活性的示例性方法被提供在实施例中。与酶活性相关的任何性质,包括经典酶性质Km、Vmax或kcat可以受到影响,它们的改变可以导致增加的酶促活性。酶活性的改进可以是从对应野生型酶的酶活性的约1.1倍至天然存在的糖基转移酶或糖基转移酶多肽所源自的另外的工程化糖基转移酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶促活性。
如本文使用的,“转化”指的是底物向对应的产物的酶促转化(或生物转化)。“转化百分比”指的是在指定条件下在一定时间段内被转化为产物的底物的百分比。因此,糖基转移酶多肽的“酶促活性”或“活性”可以被表示为在指定的时间段内底物向产物的“转化百分比”。
具有“通用性性质(generalist properties)”的酶(或“通用性酶”)指的是与亲本序列相比,对宽范围的底物表现出改进的活性的酶。通用性酶不必对于每种可能的底物表现出改进的活性。在一些实施方案中,本发明提供了具有通用性性质的糖基转移酶变体,因为它们相对于亲本基因对宽范围的空间上和电子上不同的底物表现出相似或改进的活性。此外,本文提供的通用性酶被工程化为跨越宽范围的不同分子被改进以增加代谢物/产物的产生。
术语“严格杂交条件”在本文中用于指核酸杂合体在其下是稳定的条件。如本领域技术人员已知的,杂合体的稳定性反映在杂合体的解链温度(Tm)中。通常,杂合体的稳定性是离子强度、温度、G/C含量和离液剂的存在的函数。多核苷酸的Tm值可以使用用于预测解链温度的已知方法来计算(参见例如Baldino等人,Meth.Enzymol.,168:761-777[1989];Bolton等人,Proc.Natl.Acad.Sci.USA 48:1390[1962];Bresslauer等人,Proc.Natl.Acad.Sci.USA 83:8893-8897[1986];Freier等人,Proc.Natl.Acad.Sci.USA83:9373-9377[1986];Kierzek等人,Biochem.,25:7840-7846[1986];Rychlik等人,1990,Nucl.Acids Res.,18:6409-6412[1990](勘误,Nucl.AcidsRes.,19:698[1991]);Sambrook等人,同上);Suggs等人,1981,in Developmental Biology Using Purified Genes,Brown等人[编著],第683-693页,Academic Press,Cambridge,MA[1981];和Wetmur,Crit.Rev.Biochem.Mol.Biol.,26:227-259[1991])。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在限定的条件下,诸如中度严格或高度严格的条件下,与编码本发明的工程化糖基转移酶的序列的互补物杂交。
如本文使用的,“杂交严格度”指的是在核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格度的条件下进行,随后是不同的但较高严格度的洗涤。术语“中度严格杂交”指的是允许靶DNA结合与靶DNA具有约60%同一性,优选地约75%同一性,约85%同一性,与靶多核苷酸具有大于约90%同一性的互补核酸的条件。示例性中度严格度条件是等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中杂交,随后是在42℃于0.2×SSPE、0.2%SDS中洗涤的条件。“高严格度杂交”通常指的是与如对于定义的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小的条件。在一些实施方案中,高严格度条件指的是仅允许在65℃于0.018M NaCl中形成稳定的杂合体的那些核酸序列的杂交的条件(即,如果杂合体在65℃于0.018M NaCl中是不稳定的,它在如本文考虑的高严格度条件下将是不稳定的)。可以例如通过在等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中杂交,随后是在65℃于0.1×SSPE和0.1%SDS中洗涤的条件来提供高严格度条件。另外的高严格度条件是在等同于在65℃于包含0.1%(w:v)SDS的5×SSC中杂交并且在65℃于包含0.1%SDS的0.1×SSC中洗涤的条件。其他高严格度杂交条件,以及中度严格度条件在上文引用的参考文献中被描述。
如本文使用的,“密码子优化”指的是编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子,使得编码的蛋白在感兴趣的生物体中有效地表达。尽管遗传密码是简并的,即大多数氨基酸由被称为“同义(synonyms)”或“同义(synonymous)”密码子的几个密码子表示,但熟知的是,特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏好的。就给定的基因、具有共同功能或祖先起源的基因、高表达的蛋白相对于低拷贝数蛋白和生物体基因组的聚集蛋白编码区域而言,这种密码子使用偏好可能更高。在一些实施方案中,可以对编码糖基转移酶的多核苷酸进行密码子优化,用于在选择用于表达的宿主生物体中的优化产生。
如本文使用的,“优选的”、“优化的”和“高密码子使用偏好的”密码子当单独使用或组合使用时可互换地指在蛋白编码区域中的使用频率高于编码相同氨基酸的其他密码子的密码子。优选的密码子可以根据单个基因、具有共同功能或起源的一组基因、高表达的基因中的密码子使用、整个生物体的聚集蛋白编码区域中的密码子频率、相关生物体的聚集蛋白编码区域中的密码子频率或其组合来确定。其频率随着基因表达的水平而增加的密码子典型地是用于表达的优化密码子。用于确定特定生物体中密码子频率(例如,密码子使用、相对同义密码子使用)和密码子偏好的多种方法是已知的,包括多变量分析,例如使用聚类分析或相关性分析和基因中使用的密码子的有效数目(参见例如,GCG CodonPreference,Genetics Computer Group Wisconsin Package;CodonW,Peden,University ofNottingham;McInerney,Bioinform.,14:372-73[1998];Stenico等人,Nucl.Acids Res.,222437-46[1994];Wright,Gene 87:23-29[1990])。许多不同生物体的密码子使用表是可以获得的(参见例如,Wada等人,Nucl.Acids Res.,20:2111-2118[1992];Nakamura等人,Nucl.Acids Res.,28:292[2000];Duret,等人,同上;Henaut和Danchin,in Escherichia coli and Salmonella,Neidhardt,等人(编著),ASM Press,Washington D.C.,第2047-2066页[1996])。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集包括实际已知编码表达蛋白(例如完整的蛋白编码序列-CDS)、表达序列标签(ESTS)或基因组序列的预测编码区域的核酸序列(参见例如,Mount,Bioinformatics:Sequence and Genome Analysis,第8章,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.[2001];Uberbacher,Meth.Enzymol.,266:259-281[1996];和Tiwari等人,Comput.Appl.Biosci.,13:263-270[1997])。
如本文使用的,“控制序列”包括对本发明的多核苷酸和/或多肽的表达是必需或有利的所有组分。每一个控制序列可以是对于编码多肽的核酸序列是原生的或外来的。这样的控制序列包括,但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。在最小程度上,控制序列包括启动子和转录及翻译终止信号。控制序列可以与接头一起被提供,以用于引入促进控制序列与编码多肽的核酸序列的编码区域的连接的特定限制性位点的目的。
“可操作地连接”在本文被定义为其中控制序列被适当地放置(即,以功能关系)在相对于感兴趣的多核苷酸的位置处,使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达的配置。
“启动子序列”指的是被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变、截短的和杂合启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因来获得。
短语“合适的反应条件”指的是在酶促转化反应溶液中的那些条件(例如,酶载量、底物载量、温度、pH、缓冲液、共溶剂等的范围),在上述条件下本发明的糖基转移酶多肽能够将底物转化为期望的产物化合物。一些示例性的“合适的反应条件”被提供在本文中。
如本文使用的,“载量”,诸如在“化合物载量”或“酶载量”中的“载量”,指的是在反应起始时组分在反应混合物中的浓度或量。
如本文使用的,在酶促转化反应过程的情况下,“底物”指的是糖基转移酶多肽对其发挥作用的化合物或分子。
如本文使用的,在酶促转化过程的情况下,“产物”指的是糖基转移酶多肽对底物发挥作用产生的化合物或分子。
如本文使用的术语“培养”指的是微生物细胞群体在任何合适的条件(例如,使用液体、凝胶或固体培养基)下的生长。
重组多肽可以使用本领域已知的任何合适的方法来产生。编码感兴趣的野生型多肽的基因可以被克隆到载体诸如质粒中,并且在期望的宿主诸如大肠杆菌等中被表达。重组多肽的变体可以通过本领域已知的多种方法来产生。事实上,存在本领域技术人员熟知的各种各样不同的诱变技术。此外,诱变试剂盒还从许多商业分子生物学供应商可获得。在定义的氨基酸(定点)处进行特定取代、在基因的局部区域(区域特异性)中进行特定或随机突变、或在整个基因内进行随机诱变(例如,饱和诱变)的方法是可获得的。本领域的技术人员已知生成酶变体的许多合适的方法,包括但不限于,使用PCR对单链DNA或双链DNA进行定点诱变、盒式诱变(cassette mutagenesis)、基因合成、易错PCR(error-prone PCR)、改组(shuffling)、和化学饱和诱变或本领域已知的任何其他合适的方法。用于DNA和蛋白工程化的方法的非限制性实例被提供在以下专利中:美国专利第6,117,679号;美国专利第6,420,175号;美国专利第6,376,246号;美国专利第6,586,182号;美国专利第7,747,391号;美国专利第7,747,393号;美国专利第7,783,428号;和美国专利第8,383,346号。在变体产生之后,可以对它们进行筛选以获得任何期望的性质(例如,高或增加的活性或低或降低的活性、增加的热活性、增加的热稳定性和/或酸性pH稳定性等)。在一些实施方案中,可使用“重组糖基转移酶多肽”(在本文中还被称为“工程化糖基转移酶多肽”、“变体糖基转移酶”和“糖基转移酶变体”)。
如本文使用的,“载体”是用于将DNA序列引入到细胞中的DNA构建体。在一些实施方案中,载体是被可操作地连接至能够影响DNA序列中编码的多肽在合适宿主中的表达的合适的控制序列的表达载体。在一些实施方案中,“表达载体”具有可操作地连接至DNA序列(例如,转基因)以驱动在宿主细胞中表达的启动子序列,并且在一些实施方案中,还包含转录终止子序列。
如本文使用的,术语“表达”包括参与多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,术语“产生”指的是蛋白和/或其他化合物从细胞的产生。意图是,该术语涵盖参与多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,如果氨基酸或核苷酸序列(例如,启动子序列、信号肽、终止子序列等)与它被可操作地连接至其的另一个序列在自然界中未缔合,则这两个序列是异源的。例如“异源多核苷酸”是通过实验室技术被引入到宿主细胞的任何多核苷酸,并且包括从宿主细胞中去除、经历实验室操作并且然后重新引入到宿主细胞的多核苷酸。
如本文使用的,术语“宿主细胞”和“宿主菌株”指的是用于包含本文提供的DNA(例如,编码糖基转移酶变体的多核苷酸)的表达载体的合适的宿主。在一些实施方案中,宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。
术语“类似物(analogue)”意指与参考多肽具有多于70%序列同一性,但少于100%序列同一性(例如,多于75%、78%、80%、83%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性)的多肽。在一些实施方案中,类似物意指包含一个或更多个非天然存在的氨基酸残基以及天然存在的氨基酸的多肽,所述一个或更多个非天然存在的氨基酸残基包括但不限于高精氨酸、鸟氨酸和正缬氨酸。在一些实施方案中,类似物还包括一个或更多个D-氨基酸残基和两个或更多个氨基酸残基之间的非肽键。
术语“有效量”意指足以产生期望的结果的量。本领域一般技术人员可以通过使用常规实验确定有效量是多少。
术语“分离的”和“纯化的”用于指从与其天然缔合的至少一种其他组分取出的分子(例如,分离的核酸、多肽等)或其他组分。术语“纯化的”不要求绝对纯度,而是意图作为相对定义。
“立体选择性”指的是在化学或酶促反应中一种立体异构体相对于另一种立体异构体的优先形成。立体选择性可以是部分的,此时一种立体异构体的形成优于其他立体异构体,或者其可以是完全的,此时只形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即两者的总和中一种对映异构体的分数(典型地被报告为百分比)。可选择地,本领域通常报告其为根据下式从中计算的对映异构体过量(e.e.)(典型地为百分比):[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映体]。在立体异构体是非对映异构体的情况下,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(典型地被报告为百分比),通常可选择地报告为非对映异构体过量(d.e.)。对映异构体过量和非对映体过量是立体异构体过量的类型。
如本文使用的,术语“区域选择性”和“区域选择性反应”指的是其中键形成或断裂的一个方向优先于所有其他可能的方向发生的反应。如果区别是彻底的,则反应可以是完全(100%)区域选择性的,如果在一个位点的反应产物优于在其他位点的反应产物,例如优先形成产物化合物(2)(即,2S,3S0-羟基哌可酸超过不期望的产物(2S,5S)-羟基哌可酸),则反应可以是大体上区域选择性的(至少75%),或部分区域选择性的(x%,其中百分比依赖于感兴趣的反应设置)。
如本文使用的,“热稳定”指的是与暴露于高温(例如40℃至80℃)的野生型酶相比,在暴露于相同高温持续一定时间段(例如0.5h-24h)后,保持相似活性(例如大于60%至80%)的糖基转移酶多肽。
如本文使用的,“溶剂稳定”指的是与暴露于变化浓度(例如5%-99%)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯,乙酸丁酯、甲基叔丁基醚等)的野生型酶相比,在暴露于相同浓度的相同溶剂持续一定时间段(例如0.5h-24h)后,保持相似活性(大于例如60%至80%)的糖基转移酶多肽。
如本文使用的,“热稳定且溶剂稳定”指的是既是热稳定的又是溶剂稳定的糖基转移酶多肽。
如本文使用的,“还原剂(reductant)”指的是能够将Fe+3转化为Fe+2的化合物或剂。示例性还原剂是抗坏血酸,其通常呈L-抗坏血酸的形式。
“烷基”指的是具有从1个至18个碳原子(包括端点)的,直链的或支链的,更优选地从1个至8个碳原子(包括端点),并且最优选地1个至6个碳原子(包括端点)的饱和烃基团。具有指定数目的碳原子的烷基在括号中表示(例如(C1-C6)烷基指的是1个至6个碳原子的烷基)。
“烯基”指的是具有从2个至12个碳原子(包括端点)的、直链的或支链的、含有至少一个双键但任选地含有多于一个双键的烃基团。
“炔基”指的是具有从2个至12个碳原子(包括端点)的、直链的或支链的、含有至少一个三键但任选地含有多于一个三键,并且另外任选地含有一个或更多个双键键合部分的烃基团。
“亚烷基”指的是具有从1个至18个碳原子(包括端点)、更优选地从1个至8个碳原子(包括端点)、并且最优选地1个至6个碳原子(包括端点)的,任选地被一个或更多个合适的取代基取代的直链或支链的二价烃基团。示例性“亚烷基”包括但不限于亚甲基、亚乙基、亚丙基、亚丁基等。
“亚烯基”指的是具有2个至12个碳原子(包括端点)和一个或更多个碳-碳双键、更优选地从2个至8个碳原子(包括端点)、并且最优选地2个至6个碳原子(包括端点)的,任选地被一个或更多个合适的取代基取代的直链或支链的二价烃基团。
“杂烷基”、“杂烯基”和“杂炔基”分别指的是其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团替代的如本文定义的烷基、烯基和炔基。可以替代碳原子的杂原子和/或杂原子基团包括但不限于-O-、-S-、-S-O-、-NRγ-、-PH-、-S(O)-、-S(O)2-、-S(O)NRγ-、-S(O)2NRγ-等,包括其组合,其中每个Rγ独立地选自氢、烷基、环烷基、杂环烷基、芳基和杂芳基。
“芳基”指的是具有单环(例如苯基)或多个稠环(例如萘基或蒽基)的具有从6个至12个碳原子(包括端点)的不饱和的芳香族碳环基团。示例性的芳基包括苯基、吡啶基、萘基等。
“芳基烷基”指的是被芳基取代的烷基(即芳基-烷基-基团),优选地在烷基部分具有从1个至6个碳原子(包括端点)且在芳基部分具有从6个至12个碳原子(包括端点)。这样的芳基烷基基团通过苄基、苯乙基等例示。
“芳氧基”指的是–ORλ基团,其中Rλ是可以任选地被取代的芳基基团。
“环烷基”指的是具有从3个至12个碳原子(包括端点)的、具有单个环状环或多个稠环的环状烷基基团,其可以任选地被从1个至3个烷基基团取代。示例性环烷基基团包括但不限于单环结构或多环结构,所述单环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基等,所述多环结构包括桥环体系诸如金刚烷基等。
“环烷基烷基”指的是被环烷基取代的烷基(即环烷基-烷基-基团),优选地在烷基部分具有从1个至6个碳原子(包括端点)并且在环烷基部分具有从3个至12个碳原子(包括端点)。这样的环烷基烷基基团通过环丙基甲基、环己基乙基等例示。
“氨基”指的是基团-NH2。被取代的氨基指的是基团–NHRη、NRηRη和NRηRηRη,其中每个Rη独立地选自被取代的或未被取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、氢硫基、亚磺酰基、磺酰基等。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
“氨基烷基”指的是其中一个或更多个氢原子被一个或更多个氨基基团(包括被取代的氨基基团)替代的烷基基团。
“氨基羰基”指的是-C(O)NH2。被取代的氨基羰基指的是–C(O)NRηRη,其中氨基基团NRηRη如本文定义的。
“氧基”指的是二价基团-O-,其可以具有各种取代基以形成不同的氧基基团,包括醚和酯。
“烷氧基”或“烷基氧基”在本文中可互换使用以指的是基团–ORζ,其中Rζ是烷基基团,包括任选地被取代的烷基基团。
“羧基”指的是-COOH。
“羰基”指的是-C(O)-,其可以具有多种取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。
“羧基烷基”指的是其中一个或更多个氢原子被一个或更多个羧基基团替代的烷基。
“氨基羰基烷基”指的是被如本文定义的氨基羰基基团取代的烷基。
“卤素(halogen)”或“卤代(halo)”指的是氟、氯、溴和碘。
“卤代烷基”指的是其中一个或更多个氢原子被卤素替代的烷基基团。因此,术语“卤代烷基”意指包括单卤代烷基、二卤代烷基、三卤代烷基等直到全卤代烷基。例如,表述“(C1-C2)卤代烷基”包括1-氟甲基、二氟甲基、三氟甲基、1-氟乙基、1,1-二氟乙基、1,2-二氟乙基、1,1,1-三氟乙基、全氟乙基等。
“羟基”指的是-OH。
“羟基烷基”指的是其中一个或更多个氢原子被一个或更多个羟基基团替代的烷基基团。
“巯基(thiol)”或“氢硫基(sulfanyl)”指的是-SH。被取代的巯基或氢硫基指的是–S-Rη,其中Rη是烷基、芳基或其他合适的取代基。
“烷硫基”指的是–SRζ,其中Rζ是可以任选地被取代的烷基。典型的烷硫基基团包括但不限于甲硫基、乙硫基、正丙硫基等。
“烷硫基烷基”指的是被烷硫基基团–SRζ取代的烷基,其中Rζ是可以任选地被取代的烷基。
“磺酰基”指的是-SO2-。被取代的磺酰基指的是–SO2-Rη,其中Rη是烷基、芳基或其他合适的取代基。
“烷基磺酰基”指的是–SO2-Rζ,其中Rζ是可以任选地被取代的烷基。典型的烷基磺酰基基团包括但不限于甲基磺酰基、乙基磺酰基、正丙基磺酰基等。
“烷基磺酰基烷基”指的是被烷基磺酰基基团–SO2-Rζ取代的烷基,其中Rζ是可以任选地被取代的烷基。
“杂芳基”指的是具有从1个至10个碳原子(包括端点)和在环内的选自氧、氮和硫的1个至4个杂原子(包括端点)的芳香族杂环基团。这样的杂芳基基团可以具有单环(例如吡啶基或呋喃基)或多个稠环(例如吲嗪基(indolizinyl)或苯并噻吩基)。
“杂芳基烷基”指的是被杂芳基取代的烷基(即杂芳基-烷基-基团),优选地在烷基部分具有从1个至6个碳原子(包括端点)并且在杂芳基部分具有从5个至12个环原子(包括端点)。这样的杂芳基烷基基团通过吡啶基甲基等例示。
“杂环”、“杂环的”和可互换的“杂环烷基”指的是具有单环或多个稠环的、具有从2个至10个碳环原子(包括端点)和在环内的选自氮、硫或氧的从1个至4个杂环原子(包括端点)的饱和的或不饱和的基团。这样的杂环基团可以具有单环(例如哌啶基或四氢呋喃基)或多个稠环(例如,二氢吲哚基、二氢苯并呋喃或奎宁环基(quinuclidinyl))。杂环的实例包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪(quinolizine)、异喹啉、喹啉、酞嗪(phthalazine)、萘基吡啶、喹喔啉、喹唑啉、噌啉、蝶啶、咔唑(carbazole)、咔啉(carboline)、菲啶(phenanthridine)、吖啶、菲咯啉(phenanthroline)、异噻唑、吩嗪(phenazine)、异噁唑、酚噁嗪(phenoxazine)、吩噻嗪(phenothiazine)、咪唑烷、咪唑啉(imidazoline)、哌啶、哌嗪、吡咯烷、吲哚啉等。
“杂环烷基烷基”指的是被杂环烷基取代的烷基(即杂环烷基-烷基-基团),优选在烷基部分具有从1个至6个碳原子(包括端点)并且在杂环烷基部分具有从3个至12个环原子(包括端点)。
“元环(membered ring)”意指包括任何环状结构。术语“元”之前的数字表示构成环的骨架原子的数目。因此,例如环己基、吡啶、吡喃和噻喃是6元环,并且环戊基、吡咯、呋喃和噻吩是5元环。
如本文使用的“稠合双环(Fused bicyclic ring)”指的是在每个环中具有5个或8个原子的未被取代的和被取代的碳环和/或杂环的环部分两者,所述环具有2个共用原子。
除非另外指明,否则在上述基团中被氢占据的位置可以被例如但不限于以下的取代基进一步取代:羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、被取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤素、甲基、乙基、丙基、丁基、烷基、烯基、炔基、被取代的烷基、三氟甲基、卤代烷基、羟基烷基、烷氧基烷基、硫基、烷硫基、酰基、羧基、烷氧基羰基、甲酰氨基、被取代的甲酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰氨基、被取代的磺酰氨基、氰基、氨基、被取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰基氨基、脒基、脒肟基(amidoximo)、羟基甲酰基(hydroxamoyl)、苯基、芳基、被取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、被取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、被取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂环)烷基;并且优选的杂原子是氧、氮和硫。应理解,当在这些取代团上存在开放化合价的情况下,它们可以进一步被烷基、环烷基、芳基、杂芳基和/或杂环基团取代,当在碳上存在这些开放化合价的情况下,它们可以进一步被卤素和氧-、氮-、或硫-键合的取代基取代,并且在存在多个这样的开放化合价的情况下,这些基团可以通过直接形成键或通过与新的杂原子(优选地氧、氮或硫)形成键而连接形成环。还应理解,可以进行上文的取代,条件是用取代基替代氢不会对本发明的分子带来不可接受的不稳定性,并且以其他方式在化学上是合理的。
如本文使用的,“任选的”和“任选地”意指随后描述的事件或情形可以发生或可以不发生,并且意指该描述包括当该事件或情形发生时的情况和其中该事件或情形没有发生的情况。本领域普通技术人员将理解,对于被描述为包含一个或更多个任选的取代基的任何分子,仅意在包括空间上可实现的和/或合成上可行的化合物。“任选地被取代的”指的是一种或一系列化学基团中的所有后续修饰对象(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基基团、环烷基基团、芳基基团和杂芳基基团彼此独立地可以被取代或可以不被取代。
糖基化
糖基化可以改变天然产物和合成产物的许多性质,包括稳定性、药效动力学、溶解度和膜转运。许多分子,包括具有抗微生物、抗肿瘤、天然甜味性质等的许多次级代谢物,包含被β-糖苷键修饰的非核糖体肽、多聚乙酰或萜类骨架。从植物甜菊(Stevia rebaudianaBertoni)提取的许多二萜糖苷类包含β-连接的葡萄糖分子。天然地,这些分子使用UDP-葡萄糖依赖性糖基转移酶在体内被糖基化。然而,当在体外使用时,UDP-葡萄糖可以是过分昂贵的和/或不可用的。在本发明中,提供了新的反应方案(参见图2),其中使用两种不同的酶类将葡萄糖部分从α-葡萄糖-1-磷酸酯转移到样品底物(例如甜菊苷),以产生一种或更多种β-葡萄糖连接的产物。在一些实施方案中,天然甜菊苷UDP-葡萄糖依赖性糖基转移酶显示出具有活性,使用α-葡萄糖-1-磷酸酯形成莱鲍迪苷A(参见图1)。在一些另外的实施方案中,昆布二糖磷酸化酶以相反的方向发挥作用,以由α-葡萄糖-1-磷酸酯和甜菊苷形成β-葡萄糖连接的甜菊苷化合物和无机磷酸。
因此,糖基化可用于产生天然甜味剂,诸如来源于甜味草本甜菊的那些甜味剂。如上文指示的,这种植物产生许多二萜糖苷类,其特征为优于许多其他高效甜味剂的高强度甜度和感官性质。上文提及的甜的糖苷类具有共同的糖苷配基(即甜菊醇),并且在C13和C19位置的碳水化合物残基的数目和类型不同。甜菊醇糖苷类不仅在其分子结构方面不同,而且其口感也不同。通常,甜菊苷被报告为比蔗糖甜110倍-270倍,而莱鲍迪苷A被报告为比蔗糖甜150倍和320倍之间,并且莱鲍迪苷C被报告为比蔗糖甜40倍-60倍之间。在这些常见的化合物中,莱鲍迪苷A具有最少的涩味、最少的苦味和最少的持久余味。因此,它具有主要的甜菊醇糖苷类最有利的感官属性。然而,莱鲍迪苷A仅构成从甜菊分离的总糖苷类的一小部分(2%-10%),而包括甜菊苷(2%-10%)和莱鲍迪苷C(1%-2%)的其他化合物构成剩余部分。
改变一些底物的糖基化模式可用于简化纯化和/或将不太期望的分子(例如甜菊苷)转化为更期望的化合物(例如莱鲍迪苷A)。在一些情况下,糖基化是通过化学合成方法来实现的。然而,这些方法典型地需要使用不期望的化学品和工艺的多个合成步骤,并且可以导致混合产物(例如,在不正确的位置具有键和/或具有不期望的异头物构型)。
相比之下,糖基化酶在温和的条件下可以是有活性的,并且可以在单个步骤中赋予高的位置选择性和立体特异性。许多天然来源的糖基化代谢物是使用糖基转移酶(GT)酶在体内产生的,GT酶从各种糖核苷酸转移糖部分。然而,当在体外方法中使用时,这些酶需要的糖核苷酸供体可以是过分昂贵的,并且可能无法大规模获得。因此,对能够使用较不昂贵和/或更方便的糖供体产生糖基化分子的酶存在需求。
工程化糖基转移酶多肽
本发明提供了具有糖基转移酶活性的多肽、编码所述多肽的多核苷酸;制备所述多肽的方法以及用于使用所述多肽的方法。在描述涉及多肽的情况下,应理解,它还描述了编码多肽的多核苷酸。
上文描述的性质被改进的工程化多肽在其下进行转移酶反应的合适的反应条件可以根据多肽、底物、共底物的浓度或量,过渡金属辅因子、还原剂、缓冲液、共溶剂、pH、包括温度和反应时间的条件和/或多肽固定于固体支持物上的条件来确定,如下文和实施例中进一步描述的。
在一些实施方案中,具有改进的性质,特别地在甜菊醇糖苷类转化为进一步糖基化的甜菊醇糖苷类中具有改进的性质的具有糖基转移酶活性的示例性工程化多肽,包含与SEQ ID NO:2、4、6和/或8相比具有一个或更多个残基差异的氨基酸序列。
这些其他残基位置处的残基差异可以提供氨基酸序列的另外的变化,而不会不利地影响多肽进行转移酶反应的能力。在一些实施方案中,序列还包含与SEQ ID NO:2、4、6和/或8相比在其他氨基酸残基位置处的1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-11个、1个-12个、1个-14个、1个-15个、1个-16个、1个-18个、1个-20个、1个-22个、1个-24个、1个-26个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个残基差异。在一些实施方案中,与参考序列相比的氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个残基位置。在一些实施方案中,与参考序列相比的氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个残基位置。在这些其他位置处的残基差异可以是保守变化或非保守变化。在一些实施方案中,与SEQ ID NO:2、4、6和/或8的天然存在的糖基转移酶多肽相比,残基差异可以包括保守取代和非保守取代。
在一些实施方案中,本发明还提供了包含保持本文描述的任何工程化糖基转移酶的功能活性和/或改进的性质的该工程化糖基转移酶多肽的片段的工程化多肽。因此,在一些实施方案中,本发明提供了在合适的反应条件下能够进行转移酶反应的多肽片段,其中该片段包含本发明的糖基转移酶多肽(诸如SEQ ID NO:2、4、6和/或8的天然存在的糖基转移酶多肽)的全长氨基酸序列的至少约80%、90%、95%、96%、97%、98%或99%。
在一些实施方案中,工程化糖基转移酶多肽可以具有包含本文描述的糖基转移酶多肽(诸如SEQ ID NO:2、4、6和/或8的天然存在的糖基转移酶多肽)的任一个的缺失的氨基酸序列。
因此,对于本发明的工程化糖基转移酶多肽的每一个(each and every)实施方案,氨基酸序列可以包括1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达糖基转移酶多肽的氨基酸总数的10%、多达糖基转移酶多肽的氨基酸总数的10%、多达糖基转移酶多肽的氨基酸总数的20%、或多达糖基转移酶多肽的氨基酸总数的30%的氨基酸的缺失,其中本文描述的工程化糖基转移酶的相关的功能活性和/或改进的性质被保持。在一些实施方案中,缺失可以包括1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-15个、1个-20个、1个-21个、1个-22个、1个-23个、1个-24个、1个-25个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个氨基酸残基的缺失。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基的缺失。
在一些实施方案中,本文的工程化糖基转移酶多肽可以具有与本文描述的糖基转移酶多肽(诸如SEQ ID NO:2、4、6和/或8的天然存在的糖基转移酶多肽)的任一个相比包含插入的氨基酸序列。因此,在本发明的糖基转移酶多肽的一些实施方案中,插入物可以包含1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸或50个或更多个氨基酸,其中本文描述的工程化糖基转移酶的相关功能活性和/或改进的性质被保持。插入可以是插入至糖基转移酶多肽的氨基末端或羧基末端,或插入至糖基转移酶多肽的内部部分。
在一些实施方案中,氨基酸序列任选地具有1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-15个、1个-20个、1个-21个、1个-22个、1个-23个、1个-24个、1个-25个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有数目为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个的氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在上文的实施方案中,用于工程化多肽的合适的反应条件被提供在实施例中。
在一些实施方案中,本发明的多肽是融合多肽,其中工程化多肽与其他多肽融合,所述其他多肽诸如例如但不限于抗体标签(例如myc表位)、纯化序列(例如用于结合金属的His标签)和细胞定位信号(例如,分泌信号)。因此,本文描述的工程化多肽可以与其他多肽融合或不与其他多肽融合使用。
应理解,本文描述的多肽不限于遗传编码的氨基酸。除了遗传编码的氨基酸之外,本文描述的多肽可以全部或部分地包含天然存在的和/或合成的非编码氨基酸。本文描述的多肽可以包含的某些常见的非编码氨基酸,包括但不限于:遗传编码的氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘代苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(styrylkalanine)(sAla);蒽基丙氨酸(aAla);3,3-二苯基丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu)、高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰基亮氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可以包含的另外的非编码氨基酸对于本领域技术人员将是明显的(参见例如Fasman,CRC Practical Handbook ofBiochemistry and Molecular Biology,CRC Press,Boca Raton,FL,第3-70页[1989]以及其中引用的参考文献中提供的各种氨基酸,其全部通过引用并入)。这些氨基酸可以呈L-构型或D-构型。
本领域技术人员将认识到,携带侧链保护基团的氨基酸或残基还可以构成本文描述的多肽。这样的受保护的氨基酸(其在此情况下属于芳香族类)的非限制性实例包括但不限于(保护基团列于括号中):Arg(tos)、Cys(甲基苄基)、Cys(硝基吡啶亚磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可以构成本文描述的多肽的构象约束的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro)和1-氨基环戊烷-3-羧酸。
在一些实施方案中,工程化多肽呈各种形式,例如诸如分离的制品、作为基本上纯化的酶、用编码该酶的基因转化的完整细胞和/或作为这样的细胞的细胞提取物和/或裂解物。酶可以被冻干、喷雾干燥、沉淀或呈粗制糊状物的形式,如下文进一步讨论的。
在一些实施方案中,工程化多肽被提供在固体支持物诸如膜、树脂、固体载体或其他固相材料上。固体支持物可以包含有机聚合物诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的构型可以呈珠、球、颗粒(particle)、小粒(granule)、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特性。固体支持物可以被配置为孔、凹陷或其他容器(container)、器皿(vessel)、特征或位置的形式。
在一些实施方案中,本发明的具有糖基转移酶活性的工程化多肽可以被固定在固体支持物上,使得它们相对于SEQ ID NO:2、4、6和/或8的参考多肽保持其改进的活性、立体选择性和/或其他改进的性质。在这样的实施方案中,固定的多肽可以促进底物化合物或其他合适的底物向产物的生物催化转化,并且在反应完成后容易保留(例如通过保留固定有多肽的珠)并然后在随后的反应中重新使用或再循环。这样的固定化酶方法允许进一步提高效率和降低成本。因此,还设想,使用本发明的糖基转移酶多肽的任何方法可以使用结合或固定在固体支持物上的相同的糖基转移酶多肽来进行。
酶固定化的方法是本领域熟知的。工程化多肽可以被非共价地或共价地结合。用于将酶缀合和固定到固体支持物(例如树脂、膜、珠、玻璃等)的各种方法是本领域熟知的(参见例如,Yi等人,Proc.Biochem.,42(5):895-898[2007];Martin等人,Appl.Microbiol.Biotechnol.,76(4):843-851[2007];Koszelewski等人,J.Mol.Cat.B:Enzymatic,63:39-44[2010];Truppo等人,Org.Proc.Res.Dev.,在线出版:dx.doi.org/10.1021/op200157c;Hermanson,Bioconjugate Techniques,第2版,Academic Press,Cambridge,MA[2008];Mateo等人,Biotechnol.Prog.,18(3):629-34[2002];和“Bioconjugation Protocols:Strategies and Methods,”In Methods in MolecularBiology,Niemeyer(编著),Humana Press,New York,NY[2004];其每一个的公开内容通过引用并入本文)。用于固定本发明的工程化糖基转移酶的固体支持物包括但不限于包含具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、苯乙烯/DVB共聚物或具有十八烷基官能团的聚甲基丙烯酸酯的珠或树脂。可用于固定本发明的工程化糖基转移酶多肽的示例性固体支持物包括但不限于壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,本文描述的多肽以试剂盒的形式提供。试剂盒中的酶可以单独存在或作为多于一种酶存在。试剂盒还可以包括用于进行酶促反应的试剂、用于评估酶的活性的底物以及用于检测产物的试剂。试剂盒还可以包括试剂分配器和试剂盒的使用说明。
在一些实施方案中,本发明的试剂盒包括包含在不同可寻址位置上的多于一种不同糖基转移酶多肽的阵列,其中不同的多肽是参考序列的不同变体,其各自具有至少一种不同的改进的酶性质。在一些实施方案中,固定在固体支持物上的多于一种多肽被配置在阵列的多个位置上,所述位置对于试剂的自动递送可寻址或通过检测方法和/或仪器可寻址。阵列可以被用于测试各种底物化合物通过多肽的转化。包含多于一种工程化多肽的这样的阵列及其使用方法是本领域已知的(参见例如,WO2009/008908A2)。
编码工程化糖基转移酶的多核苷酸、表达载体和宿主细胞
在另一个方面中,本发明提供了编码本文描述的工程化糖基转移酶多肽的多核苷酸。多核苷酸可以被可操作地连接至控制基因表达的一个或更多个异源调控序列,以产生能够表达该多肽的重组多核苷酸。包含编码工程化糖基转移酶的异源多核苷酸的表达构建体被引入到适当的宿主细胞以表达相应的糖基转移酶多肽。
如对技术人员将是明显的,蛋白序列的可得性和对应于多种氨基酸的密码子的知识提供了能够编码本申请多肽的所有多核苷酸的描述。遗传密码子的简并性(其中相同的氨基酸由可选择的密码子或同义密码子编码)允许制备极大数目的核酸,所有这些核酸编码改进的糖基转移酶。因此,知道了特定的氨基酸序列后,本领域技术人员可以以不改变蛋白的氨基酸序列的方式通过简单改变一个或更多个密码子的序列来制备任何数目的不同核酸。在此方面,本发明具体地预期了基于可能的密码子选择,通过选择组合可以制备的编码本文描述的多肽的每一个可能的多核苷酸变化形式,并且认为对于本文描述的任一多肽,包括在通过引用并入本文的序列表中作为SEQ ID NO:1-32中的偶数编号的序列公开的氨基酸序列具体地公开所有这样的变化形式。
在多种实施方案中,密码子被优选地选择为适应在其中产生蛋白的宿主细胞。例如,在细菌中使用的优选的密码子被用于在细菌中表达基因;在酵母中使用的优选的密码子被用于酵母中的表达;并且在哺乳动物中使用的优选的密码子被用于哺乳动物细胞中的表达。在一些实施方案中,所有密码子不需要被替代以优化糖基转移酶的密码子使用,因为天然序列将包含优选的密码子并且因为可以不需要对所有氨基酸残基使用优选的密码子。因此,编码糖基转移酶的密码子优化的多核苷酸可以在全长编码区域的约40%、50%、60%、70%、80%或大于90%的密码子位置包含优选的密码子。
在一些实施方案中,多核苷酸包含编码如由SEQ ID NO:2、4、6和/或8表示的天然存在的糖基转移酶多肽氨基酸序列的密码子优化的核苷酸序列。在一些实施方案中,多核苷酸具有包含与编码SEQ ID NO:1-32中的偶数编号的序列的密码子优化的核酸序列至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性的核酸序列。在一些实施方案中,多核苷酸具有包含与SEQ ID NO:1-32中的奇数编号的序列中的密码子优化的核酸序列至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性的核酸序列。SEQ ID NO:1-32中的奇数编号的序列的密码子优化的序列增强了编码的野生型糖基转移酶的表达,提供能够具有本文描述的转移酶活性的酶的制品。在一些实施方案中,与来自甜菊、拒霉素链霉菌(Streptomyces resistomycificus)、抗菌素链霉菌(Streptomyces antibioticus)和/或类芽孢杆菌属(Paenibacillus)种YM1的天然存在的多核苷酸序列相比,密码子优化的多核苷酸序列使糖基转移酶的表达增强至少1.2倍、1.5倍或2倍或更大。
在一些实施方案中,多核苷酸能够与选自SEQ ID NO:1-32中奇数编号的序列的参考序列或其互补物在高严格度条件下杂交,并编码具有糖基转移酶活性的多肽。
在一些实施方案中,如上文描述的,多核苷酸编码与SEQ ID NO:2、4、6和/或8相比具有改进的性质的具有糖基转移酶活性的工程化多肽,其中该多肽包含与参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性并且具有与选自SEQ ID NO:1-32中偶数编号的序列的序列相比的一个或更多个残基差异的氨基酸序列。在一些实施方案中,参考氨基酸序列选自SEQ ID NO:1-32中偶数编号的序列。在一些实施方案中,参考氨基酸序列是SEQ ID NO:2。在一些实施方案中,参考氨基酸序列是SEQ ID NO:4。在一些另外的实施方案中,参考氨基酸序列是SEQID NO:8。
在一些实施方案中,多核苷酸编码能够进行本文提供的转移酶反应的、与SEQ IDNO:2、4、6和/或8相比具有改进的性质的糖基转移酶多肽,其中该多肽包含与参考序列SEQID NO:2、4、6和/或8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性并且具有与SEQ ID NO:2、4、6和/或8相比的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,多核苷酸编码能够进行本文提供的转移酶反应的、与SEQ IDNO:2、4、6和/或8相比具有改进的性质的糖基转移酶多肽,其中该多肽包含与参考序列SEQID NO:2、4、6和/或8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性并且具有与SEQ ID NO:2、4、6和/或8相比的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,多核苷酸编码能够进行本文提供的转移酶反应的、与SEQ IDNO:2、4、6和/或8相比具有改进的性质的糖基转移酶多肽,其中该多肽包含与参考序列SEQID NO:2、4、6和/或8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性并且具有与SEQ ID NO:2、4、6和/或8相比的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,编码工程化糖基转移酶的多核苷酸包含选自SEQ ID NO:1-32中奇数编号的序列的多核苷酸序列。
在一些实施方案中,多核苷酸能够与选自SEQ ID NO:1-32中奇数编号的序列的参考多核苷酸序列或其互补物在高严格度条件下杂交,并且编码本文描述的具有一种或更多种改进的性质的具有糖基转移酶活性的多肽。在一些实施方案中,能够在高严格度条件下杂交的多核苷酸编码糖基转移酶多肽,该糖基转移酶多肽包含与SEQ ID NO:2、4、6和/或8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的同一性的氨基酸序列,该糖基转移酶多肽具有包含与SEQ ID NO:2、4、6和/或8相比的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,编码本文提供的工程化糖基转移酶多肽中的任一个的分离的多核苷酸以多种方式被操作,以提供多肽的表达。在一些实施方案中,编码多肽的多核苷酸作为表达载体来提供,其中存在一个或更多个控制序列来调节多核苷酸和/或多肽的表达。取决于表达载体,在分离的多核苷酸插入载体之前对分离的多核苷酸的操作可以是期望的或必要的。利用重组DNA方法修改多核苷酸和核酸序列的技术是本领域熟知的。
在一些实施方案中,控制序列包括,除了其他序列以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。如本领域已知的,合适的启动子可以基于使用的宿主细胞来选择。对于细菌宿主细胞,用于指导本申请的核酸构建体的转录的合适启动子包括,但不限于从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌(Bacilluslicheniformis)青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因以及原核β-内酰胺酶基因(参见例如,Villa-Kamaroff等人,Proc.Natl Acad.Sci.USA 75:3727-3731[1978]),以及tac启动子(参见例如,DeBoer等人,Proc.Natl Acad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性启动子包括从以下的基因获得的启动子:米曲霉(Aspergillusoryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusariumoxysporum)胰蛋白酶样蛋白酶(参见例如WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶的基因的启动子的杂合体),和其突变体启动子、截短的启动子和杂合启动子。示例性酵母细胞启动子可以来自任何合适的来源。在一些实施方案中,基因包括以下的基因:酿酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸酯激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast 8:423-488[1992])。
在一些实施方案中,控制序列是合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3'末端。在选择的宿主细胞中有功能的任何终止子可用于本发明中。例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的各种其他有用的终止子是本领域已知的(参见例如,Romanos等人,同上)。
在一些实施方案中,控制序列是合适的前导序列,前导序列是一种对由宿主细胞的翻译重要的mRNA的非翻译区域。前导序列被可操作地连接至编码多肽的核酸序列的5'末端。可以使用在选择的宿主细胞中有功能的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列包括,但不限于,从以下的基因获得的那些前导序列:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸酯激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列也可以是多腺苷酸化序列,多腺苷酸化序列是一种可操作地连接至核酸序列的3'末端的序列,并且其在转录时,被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号。在选择的宿主细胞中有功能的任何多腺苷酸化序列可以用于本发明中。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括,但不限于来自以下的基因的那些多腺苷酸化序列:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡萄糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列也是本领域已知的(参见例如,Guo和Sherman,Mol.Cell.Bio.,15:5983-5990[1995])。
在一些实施方案中,控制序列是信号肽编码区域,其编码连接至多肽的氨基末端的氨基酸序列并将编码的多肽引导到细胞的分泌途径中。核酸序列的编码序列的5'末端可以固有地包含信号肽编码区域,其符合翻译阅读框地(in translation reading frame)与编码分泌的多肽的编码区域的区段天然地连接。可选择地,编码序列的5'末端可以包含对编码序列而言外来的信号肽编码区域。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何信号肽编码区域可用于本文提供的工程化糖基转移酶多肽的表达。用于细菌宿主细胞的有效的信号肽编码区域包括但不限于从以下的基因获得的信号肽编码区域:芽孢杆菌(Bacillus)NClB 11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如,Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。对于丝状真菌宿主细胞有效的信号肽编码区域包括但不限于从以下的基因获得的信号肽编码区域:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和胎毛腐质霉(Humicola lanuginosa)脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的那些信号肽:酿酒酵母α因子和酿酒酵母转化酶。
在一些实施方案中,控制序列是前肽编码区域,其编码定位在多肽的氨基末端处的氨基酸序列。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或在一些情况下被称为“酶原(zymogen)”。前多肽可以通过催化或自动催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区域包括但不限于以下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见,例如WO95/33836)。在信号肽和前肽区域两者均存在于多肽的氨基末端的情况下,前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。
在一些实施方案中,还利用了调节序列。这些序列促进多肽的表达相对于宿主细胞的生长的调节。调节系统的实例是引起基因的表达响应于化学或物理刺激(包括调节性化合物的存在)被开启或关闭的那些调节系统。在原核宿主细胞中,合适的调节序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调节系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,合适的调节序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
在另一个方面中,本发明还提供了重组表达载体,所述重组表达载体包含编码工程化糖基转移酶多肽的多核苷酸和取决于多核苷酸被引入到其中的宿主的类型的一个或更多个表达调节区域,诸如启动子和终止子、复制起点等。在一些实施方案中,将上文描述的各种核酸和控制序列连接在一起以产生重组表达载体,其包含一个或更多个方便的限制性位点以允许编码变体糖基转移酶多肽的核酸序列在这样的位点插入或取代。可选择地,本发明的多核苷酸序列通过将多核苷酸序列或包含该多核苷酸序列的核酸构建体插入到用于表达的适当的表达载体来表达。在创建表达载体时,编码序列位于载体中使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经历重组DNA程序并且可以导致变体糖基转移酶多核苷酸序列的表达。载体的选择典型地将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体是自主复制载体(即,作为染色体外的实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选择的实施方案中,载体可以是当被引入到宿主细胞中时,被整合到基因组中并与其被整合进入其中的染色体一起复制的载体。此外,可以使用单一载体或质粒或者两种或更多种载体或质粒或者转座子,所述两种或更多种载体或质粒一起包含待引入到宿主细胞的基因组中的总DNA。
在一些实施方案中,表达载体优选地包含一个或更多个可选择的标志物,其允许容易选择转化的细胞。“可选择的标志物”是其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等的基因。细菌的可选择的标志物的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的可选择的标志物包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))和trpC(邻氨基苯甲酸合成酶),以及其等同物。在另一个方面中,本发明提供了一种宿主细胞,所述宿主细胞包含编码本申请的至少一种工程化糖基转移酶多肽的多核苷酸,所述多核苷酸被可操作地连接至一个或更多个控制序列,以用于在宿主细胞中表达工程化糖基转移酶。用于在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonellatyphimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母和巴斯德毕赤酵母(Pichiapastoris)[ATCC保藏号201178]);昆虫细胞,诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。示例性宿主细胞是大肠杆菌(Escherichia coli)菌株(例如,W3110(ΔfhuA)和BL21)。
因此,在另一个方面中,本发明提供了用于产生工程化糖基转移酶多肽的方法,其中所述方法包括将能够表达编码工程化糖基转移酶多肽的多核苷酸的宿主细胞在适合于该多肽表达的条件下培养。在一些实施方案中,方法还包括分离和/或纯化如本文描述的糖基转移酶多肽的步骤。
用于上文描述的宿主细胞的适当的培养基和生长条件是本领域熟知的。用于表达糖基转移酶多肽的多核苷酸可以通过本领域已知的多种方法被引入到细胞中。技术包括,除了其他以外,电穿孔、生物颗粒轰击法、脂质体介导的转染、氯化钙转染和原生质体融合。
具有本文公开的性质的工程化糖基转移酶可以通过使编码天然存在的或工程化糖基转移酶多肽的多核苷酸经历本领域已知的和如本文描述的诱变和/或定向进化方法来获得。示例性的定向进化技术是诱变和/或DNA改组(参见例如,Stemmer,Proc.Natl.Acad.Sci.USA 91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746)。可以使用的其他定向进化程序包括,除了其他以外,交错延伸过程(StEP)、体外重组(参见例如,Zhao等人,Nat.Biotechnol.,16:258–261[1998])、诱变PCR(参见例如,Caldwell等人,PCR MethodsAppl.,3:S136-S140[1994])和盒式诱变(参见例如,Black等人,Proc.Natl.Acad.Sci.USA93:3525-3529[1996])。
例如,诱变和定向进化方法可以容易地应用于多核苷酸,以生成可以被表达、筛选和测定的变体文库。诱变和定向进化方法是本领域熟知的(参见例如美国专利第5,605,793号、第5,830,721号、第6,132,970号、第6,420,175号、第6,277,638号、第6,365,408号、第6,602,986号、第7,288,375号、第6,287,861号、第6,297,053号、第6,576,467号、第6,444,468号、第5,811238号、第6,117,679号、第6,165,793号、第6,180,406号、第6,291,242号、第6,995,017号、第6,395,547号、第6,506,602号、第6,519,065号、第6,506,603号、第6,413,774号、第6,573,098号、第6,323,030号、第6,344,356号、第6,372,497号、第7,868,138号、第5,834,252号、第5,928,905号、第6,489,146号、第6,096,548号、第6,387,702号、第6,391,552号、第6,358,742号、第6,482,647号、第6,335,160号、第6,653,072号、第6,355,484号、第6,303,344号、第6,319,713号、第6,613,514号、第6,455,253号、第6,579,678号、第6,586,182号、第6,406,855号、第6,946,296号、第7,534,564号、第7,776,598号、第5,837,458号、第6,391,640号、第6,309,883号、第7,105,297号、第7,795,030号、第6,326,204号、第6,251,674号、第6,716,631号、第6,528,311号、第6,287,862号、第6,335,198号、第6,352,859号、第6,379,964号、第7,148,054号、第7,629,170号、第7,620,500号、第6,365,377号、第6,358,740号、第6,406,910号、第6,413,745号、第6,436,675号、第6,961,664号、第6,537,746号、第7,430,477号、第7,873,499号、第7,702,464号、第7,783,428号、第7,747,391号、第7,747,393号、第7,751,986号、第6,376,246号、第6,426,224号、第6,423,542号、第6,479,652号、第6,319,714号、第6,521,453号、第6,368,861号、第7,421,347号、第7,058,515号、第7,024,312号、第7,620,502号、第7,853,410号、第7,957,912号、第7,904,249号、第8,383,346号、第8,504,498号、第8,768,871号、第8,762,066号、第8,849,575号,以及所有相关的非美国对应申请(counterparts);Ling等人,Anal.Biochem.,254:157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri,等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767;WO 2009/152336;WO 2009/102901;WO2009/102899;WO 2011/035105;WO 2013/138339;WO 2013/003290;WO 2014/120819;WO2014/120821;WO 2015/0134315和WO 2015/048573;其全部通过引用并入本文)。
在一些实施方案中,诱变处理后获得的酶克隆通过使酶经历指定的温度(或其他测定条件,诸如测试酶对宽范围的底物的活性),并测量热处理或其他测定条件之后剩余的酶活性的量来筛选。然后包含编码糖基转移酶多肽的多核苷酸的克隆被测序以鉴定核苷酸序列改变(如果有),并且用于在宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如,标准生物化学技术,诸如HPLC分析)来进行。
在一些实施方案中,在诱变处理后获得的克隆可以被筛选以获得具有一种或更多种期望的改进的酶性质(例如,改进的转移酶活性)的工程化糖基转移酶。测量来自表达文库的酶活性可以使用诸如以下的标准生物化学技术进行:HPLC分析、LC-MS/MS分析、和/或产物的衍生化(分离前或分离后),如本领域已知的(例如,使用丹磺酰氯或OPA;参见例如,Yaegaki等人,J Chromatogr.356(1):163-70[1986])。
对于具有已知序列的工程化多肽,编码酶的多核苷酸可以根据已知的合成方法通过标准的固相方法来制备。在一些实施方案中,多达约100个碱基的片段可以被单独地合成,然后进行连接(例如,通过酶促或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,本文公开的多核苷酸和寡核苷酸可以使用经典的亚磷酰胺方法(参见例如,Beaucage等人,Tetra.Lett.,22:1859-69[1981]和Matthes等人.,EMBO J.,3:801-05[1984]),如典型地在自动合成方法中所实践的,通过化学合成制备。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动的DNA合成仪中)、纯化、退火、连接并克隆入适当的载体。
在已知工程化多肽的序列的情况下,编码酶的多核苷酸可以根据已知的合成方法通过标准固相方法来制备。在一些实施方案中,多达约100个碱基的片段可以被单独地合成,然后进行连接(例如,通过酶促或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,编码糖基转移酶的部分的多核苷酸和寡核苷酸可以通过如本领域已知的化学合成(例如,Beaucage等人,Tet.Lett.22:1859-69[1981]的经典的亚磷酰胺方法或由Matthes等人,EMBO J.3:801-05[1984]描述的方法)来制备,如典型地在自动合成方法中所实践的。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动的DNA合成仪中)、纯化、退火、连接并克隆入适当的载体。此外,可以从各种商业来源中的任一个获得基本上任何核酸。在一些实施方案中,通过合成含有缺失、插入和/或取代的寡核苷酸并且以各种排列方式组合寡核苷酸可以产生另外的变化,以产生具有改进的性质的工程化糖基转移酶。
因此,在一些实施方案中,用于制备工程化糖基转移酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含与选自SEQ ID NO:2、4、6和/或8的氨基酸序列具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性并且具有与SEQ ID NO:2、4、6和/或8相比的一个或更多个残基差异的氨基酸序列;和(b)表达由该多核苷酸编码的糖基转移酶多肽。
因此,在一些实施方案中,用于制备工程化糖基转移酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含与选自SEQ ID NO:2、4、6和/或8的氨基酸序列具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性并且具有与SEQ ID NO:2、4、6和/或8相比的一个或更多个残基差异的氨基酸序列;和(b)表达由该多核苷酸编码的糖基转移酶多肽。
在方法的一些实施方案中,多核苷酸编码任选地具有一个或若干个(例如多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的工程化糖基转移酶。在一些实施方案中,氨基酸序列任选地具有1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-15个、1个-20个、1个-21个、1个-22个、1个-23个、1个-24个、1个-25个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在一些实施方案中,在宿主细胞中表达的工程化糖基转移酶的任一种可以使用用于蛋白纯化的熟知技术中的任一种或更多种从细胞和/或培养基回收,用于蛋白纯化的熟知技术除了其他以外包括,溶菌酶处理、超声处理、过滤、盐析、超离心和色谱法。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是可商购的(例如,CelLytic BTM,Sigma-Aldrich,St.Louis MO)。
用于分离糖基转移酶多肽的色谱技术,除了其他以外,包括,反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分地取决于诸如以下的因素:净电荷、疏水性、亲水性、分子量、分子形状等,并且对本领域技术人员将是明显的。
在一些实施方案中,亲和技术可以被用于分离改进的糖基转移酶。对于亲和色谱纯化,可以使用特异性结合糖基转移酶多肽的任何抗体。为了产生抗体,可以通过注射糖基转移酶多肽或其片段免疫各种宿主动物,包括但不限于兔、小鼠、大鼠等。糖基转移酶多肽或片段可以借助于侧链官能团或附接至侧链官能团的接头附接至合适的载体诸如BSA。在一些实施方案中,亲和纯化可以使用糖基转移酶结合的特异配体诸如聚(L-脯氨酸)或染料亲和柱(参见例如EP0641862;Stellwagen,“Dye Affinity Chromatography,”In CurrentProtocols in Protein Science,Unit 9.2-9.2.16[2001])。
使用糖基转移酶使感兴趣的化合物β-糖基化的方法
在一些实施方案中,本文提供的方法、工艺和系统促进底物向β-糖基化产物的转化。在一些实施方案中,底物甜菊苷被转化为β-葡糖基化产物莱鲍迪苷A。在一些实施方案中,该糖基化反应由酶催化。在一些实施方案中,酶是糖基转移酶,而在一些可选择的实施方案中,酶是磷酸化酶。在一些另外的实施方案中,糖基转移酶或磷酸化酶使用葡萄糖-1-磷酸酯(例如,α-葡萄糖-1-磷酸酯)作为糖基供体。在一些另外的实施方案中,底物的某些部分(例如羟基基团)充当糖基(例如葡糖基)受体。可用于本发明的糖基转移酶的一些非限制性实例包括混杂细菌UDP-葡萄糖依赖性糖基转移酶(例如,SEQ NO:4、6或12的糖基转移酶)和具有β-糖基裂解活性以产生α-葡萄糖-1-磷酸酯的磷酸化酶(例如,昆布二糖磷酸化酶诸如SEQ NO:8或14的昆布二糖磷酸化酶)。在一些实施方案中,酶在体外接触底物,而在一些可选择的实施方案中,酶在体内接触底物。在仍一些另外的实施方案中,底物和酶在工程化宿主细胞中产生并且接触。
本领域技术人员可以确定多肽进行转化的合适的反应条件。实施例提供了示例性反应条件,包括多肽、底物、共底物(例如葡萄糖-1-磷酸酯)的浓度或量,缓冲液、共溶剂、pH、温度和反应时间。例如,在一些实施方案中,在25mM-100mM具有0%-20%乙醇的缓冲液中,在pH 5-8在30℃-65℃,以多达5mM的底物浓度或底物的溶解度极限、多达5mM的共底物或共底物的溶解度极限进行反应持续5m-18h。在一些实施方案中,可以用辅酶和第二共底物另外地进行反应,以便原位再生葡萄糖-1-磷酸酯,这可用于以更廉价的方式进行反应。例如,辅酶可以是保留磷酸化酶,诸如蔗糖磷酸化酶(例如,偶数编号的SEQ NO:16-32),并且另外的共底物可以是适当的α-连接的二糖、三糖或寡糖酶底物,诸如蔗糖。辅酶可以是倒位磷酸化酶,诸如纤维二糖磷酸化酶(E.C.2.4.1.20),并且另外的共底物可以是适当的β-连接的二糖、三糖或寡糖酶底物,诸如纤维二糖。然而,并不意图本发明限于实施例中阐述的具体的反应和条件。本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例意图说明而非限制。
实验
提供以下实施例,包括实验和获得的结果,仅用于说明的目的,而不应被解释为限制本发明。
在下文的实验公开内容中,应用以下缩写:M(摩尔/升);mM(毫摩尔/升),uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(s)(分钟);h(s)和hr(s)(小时);U(单位);MW(分子量);rpm(转数/分钟);psi和PSI(磅/平方英寸);℃(摄氏度);RT和rt(室温);CAM和cam(氯霉素);PMBS(硫酸多粘菌素B);IPTG(异丙基β-D-1-硫代吡喃半乳糖苷);UGT(尿苷5’-二磷酸葡萄糖糖基转移酶);LB(Luria肉汤);TB(terrific肉汤);SFP(摇瓶粉末);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);大肠杆菌(E.coli)W3110(常用的实验室大肠杆菌菌株,从Coli Genetic Stock Center[CGSC],New Haven,CT可获得);HTP(高通量);HPLC(高效液相色谱);MS(质谱);FIOPC(相对于阳性对照的倍数增加);Sigma-Aldrich(密苏里州圣路易斯西格玛奥德里奇(Sigma-Aldrich,St.Louis,MO));Difco(密歇根州底特律BD诊断系统Difco实验室(Difco Laboratories,BD DiagnosticSystems,Detroit,MI));Microfluidics(马萨诸塞州韦斯特伍德Microfluidics(Microfluidics,Westwood,MA));ChromaDex(加州欧文ChromaDex公司(ChromaDex,Inc.,Irvine,CA))和Thermotron(密歇根州荷兰市热测(Thermotron,Holland,MI))。
实施例1
具有葡糖基化活性的UGT酶的合成、优化和测定
在该实施例中,描述了用于合成、优化和测定具有葡糖基化活性的UGT酶的方法。
基因合成和优化:
将编码被报告为将甜菊醇双苷葡糖基化为莱鲍迪苷B并将甜菊苷葡糖基化为莱鲍迪苷A的野生型甜菊(Stevia rebaudiana)多肽(SEQ ID NO:2)的多核苷酸序列(SEQ IDNO:1)进行密码子优化并合成作为SEQ ID NO:9的基因。将编码野生型拒霉素链霉菌(Streptomyces resistomycificus)糖基转移酶多肽(SEQ ID NO:4)的多核苷酸序列(SEQID NO:3)进行类似地密码子优化并合成(SEQ ID NO:11),所述编码野生型拒霉素链霉菌(Streptomyces resistomycificus)糖基转移酶多肽(SEQ ID NO:4)的多核苷酸序列(SEQID NO:3)是被报告为将竹桃霉素葡糖基化并且对其他核苷酸糖供体和针对其他底物具有混杂活性的野生型抗菌素链霉菌(Streptomyces antibioticus)竹桃霉素糖基转移酶(SEQID NO:5)序列的同源物(具有82%序列同一性)。将这些合成的基因(SEQ ID NO:9和11)单独地克隆到pCK110900载体系统中(参见例如美国专利申请公布第2006/0195947号,其在此通过引用并入本文),并且随后在大肠杆菌W3110(ΔfhuA)中表达。大肠杆菌菌株W3110在lac启动子的控制下表达UGT酶。
摇瓶粉末(SFP)的生产:
将摇瓶程序用于产生糖基转移酶多肽摇瓶粉末(SFP),以用于在本文描述的生物催化方法中使用的表征测定。与HTP测定中使用的细胞裂解物相比,酶的摇瓶粉末(SFP)制品提供了更纯化的酶的制品(例如,总蛋白多达>30%),并且还允许使用更浓缩的酶溶液。将含有编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到含有30μg/ml氯霉素和1%葡萄糖的5mL Luria Bertani肉汤中。将细胞在培养箱中在30℃以250rpm振荡生长过夜(至少16小时)。在1L烧瓶中,在含有30μg/ml CAM的250mL Terrific肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾,pH 7.0,1mM MgSO4)中将培养物稀释至600nm的光密度(OD600)为0.2,并允许在30℃生长。当培养物的OD600为0.6至0.8时,通过添加IPTG至1mM的终浓度来诱导糖基转移酶基因的表达。然后继续孵育过夜(至少16小时)。通过离心(5000rpm,15min,4℃)来收获细胞并弃去上清液。将细胞沉淀物再悬浮在2体积的25mM三乙醇胺缓冲液,pH 7.5中,并且在标准大肠杆菌裂解环境下通过高压均质仪(Microfluidics),并保持在4℃。通过离心(10,000rpm、45分钟、4℃)去除细胞碎片。收集澄清的裂解物上清液并在-80℃冷冻,并且然后冻干以产生粗制多肽的干燥摇瓶粉末。
用于甜菊苷葡糖基化的SFP测定:
将SFP重构以提供20g/L原液。然后,将50μL的这些原液在200μL总反应体积的具有3mM MgSO4和1mM甜菊苷(ChromaDex,>94%纯度)、具有或没有5mMα-葡萄糖-1-磷酸酯的50mM Tris-HCl缓冲液pH 7.5中稀释。反应在30℃在Thermotron滴定板振荡器中以300RPM振荡进行持续16h-18h。
HPLC-MS/MS分析:
将上文描述的反应用0.5体积/体积的具有2%甲酸的乙腈猝灭,并通过离心沉淀。用以下仪器和参数通过LC-MS/MS检测上清液中的糖基化甜菊苷产物:
检测到由SEQ ID NO:9和11编码的多肽的新的活性。对于由SEQ ID NO:9编码的葡糖基转移酶多肽,检测到两种产物,一种与莱鲍迪苷A共洗脱并且另一种在2.22m洗脱。这些产物在α-葡萄糖-1-磷酸酯的存在下检测到,但在α-葡萄糖-1-磷酸酯的不存在下未被检测到。这些产物不存在于阴性对照样品中。对于由SEQ ID NO:11编码的葡糖基转移酶多肽,在保留时间1.76m和2.18m检测到两种产物。这些产物在α-葡萄糖-1-磷酸酯的存在下检测到,并且在α-葡萄糖-1-磷酸酯的不存在下以降低的水平检测到。这些产物不存在于阴性对照样品中。因此,本发明提供了用于将甜菊醇糖苷底物葡糖基化的新方法。此外,本发明提供了该类别中的第一类酶,包括由SEQ ID NO:2和4编码的野生型酶,所述酶与α-葡萄糖-1-磷酸酯而不是尿苷5’-二磷酸葡萄糖一起用于将甜菊醇底物糖基化。
实施例2
葡萄糖-1-磷酸酯的原位形成
在该实施例中,描述了评估底物的UDP-葡萄糖不依赖的葡糖基化的葡萄糖-1-磷酸酯的原位形成的实验(参见图3)。基因合成和优化以及摇瓶粉末的产生如实施例1中描述的进行。
SFP的测定:
将SFP重构为20g/L原液。然后,将20μL的来自表达SEQ ID NO:9或11的大肠杆菌的SFP和10μL的来自表达奇数编号的SEQ ID NO:15-31的大肠杆菌的SFP或另一种二糖磷酸化酶或阴性对照在200μL总反应体积的具有3mM MgSO4、0.3M蔗糖(或对应于二糖磷酸化酶的二糖)、5mM无机磷酸和1mM甜菊苷(ChromaDex,>94%纯度)、具有0mM-5mMα-葡萄糖-1-磷酸酯的50mM Tris-HCl缓冲液pH 7.5中稀释。反应在30℃在Thermotron滴定板振荡器中以300RPM振荡进行持续16h-18h。
HPLC-MS/MS分析:
如实施例1中描述的,猝灭反应并通过LC-MS/MS分析。α-葡萄糖-1-磷酸酯的原位形成通过以下被证明:相对于在来自表达阴性对照的大肠杆菌的SFP的存在下的相同样品,在来自表达奇数编号的SEQ NO:15-31的大肠杆菌的SFP或另一种二糖磷酸化酶的存在下在保留时间1.76m、2.18m、2.22m和2.35m甜菊苷向葡糖基化产物的转化增加。
实施例3
变体的进化和筛选
该实施例描述了在衍生自SEQ ID NO:9和11的工程化多肽的进化和筛选期间进行的实验,以获得改进的使用α-葡萄糖-1-磷酸酯的底物葡糖基化。
定向进化开始于SEQ ID NO:9或11的多核苷酸作为起始“骨架”基因序列,SEQ IDNO:9或11的多核苷酸分别编码SEQ ID NO:10或12的多肽。工程化多肽文库使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)来产生,并且使用HTP测定和分析方法来筛选,所述HTP测定和分析方法测量工程化多肽使用葡萄糖-1-磷酸酯或葡萄糖-1-磷酸酯的再循环系统(recycling system)对期望的底物进行葡糖基化的能力,该葡萄糖-1-磷酸酯的再循环系统由廉价的二糖、无机磷酸和野生型或工程化二糖磷酸化酶组成,如实施例1和实施例2中描述的。
在筛选后,相对于起始骨架序列显示出最大改进的工程化多肽被用作用于构建进一步的文库的骨架序列,并且重复筛选过程以使多肽进化获得期望的活性。由于酶对多种底物的混杂性,可以重复该过程来开发使用廉价的共底物用于许多感兴趣的底物的葡糖基化的生物催化剂。
实施例4
具有葡糖基化活性的磷酸化酶的合成、优化和测定
在该实施例中,描述了被进行以合成、优化和测定具有葡糖基化活性的磷酸化酶的实验。
基因合成和优化:
将编码被报告为将昆布二糖磷酸化以释放葡萄糖并形成α-葡萄糖-1-磷酸酯的野生型类芽孢杆菌属种(Paenibacillus sp.)YM1昆布二糖磷酸化酶多肽(SEQ ID NO:8)的多核苷酸序列(SEQ ID NO:7)进行密码子优化并合成为SEQ ID NO:13的基因。将SEQ ID NO:13的合成基因克隆到pCK110900载体系统中(参见例如,美国专利申请公布第20060195947号,其在此通过引用并入本文),并且随后在大肠杆菌W3110(ΔfhuA)中表达。大肠杆菌菌株W3110在lac启动子的控制下表达酶。
高通量(HTP)裂解物的产生:
将表达感兴趣的多肽基因的大肠杆菌细胞在96孔板中生长和诱导,沉淀,在250μL裂解缓冲液(在20mM Tris-HCl缓冲液pH 7.5中的0.5g/L溶菌酶和0.5g/L PMBS)中、在滴定板振荡器上于室温低速振荡持续2h裂解。然后将板在4000rpm和4℃离心持续20m,并且将澄清的裂解物上清液用于本文描述的测定反应中。
甜菊苷的葡糖基化的测定:
在该测定中,将50μL澄清的裂解物在具有1.65mMα-葡萄糖-1-磷酸酯和0.5mM甜菊苷(ChromaDex,>94%纯度)的200μL总反应体积的50mM乙酸钠缓冲液pH 5.5中稀释。反应在40℃在Thermotron滴定板振荡器中以300RPM振荡进行持续18h。
HPLC-MS/MS分析:
如实施例1中描述的,猝灭反应并通过LC-MS/MS分析。观察到在存在昆布二糖磷酸化酶的情况下在保留时间为2.18m的葡糖基化甜菊苷产物,但对于阴性对照样品未观察到。该结果指示,昆布二糖磷酸化酶可以与α-葡萄糖-1-磷酸酯一起使用,作为用于甜菊苷和其他底物的α-葡糖基化的新方法。如实施例3中描述的,α-葡萄糖-1-磷酸酯可以使用廉价的二糖、无机磷酸和二糖磷酸化酶再循环。
序列表
<110> 科德克希思公司
乔纳森·弗罗姆
斯蒂芬妮·苏·加兰妮
奥斯卡·阿尔维左
<120> 甜菊醇糖苷类和其他化合物用葡萄糖-1-磷酸酯的酶促糖基化
<130> CX8-155USP1
<140> 尚未分配
<141> 2016-06-15
<160> 32
<210> 1
<211> 1326
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自甜菊属(Stevia)的野生型UDP-糖基转移酶76G1
<400> 1
atggaaaata aaacggagac caccgttcgc cggcgccgga gaataatatt attcccggta 60
ccatttcaag gccacattaa cccaattctt cagctagcca atgtgttgta ctctaaagga 120
ttcagtatca ccatctttca caccaacttc aacaaaccca aaacatctaa ttaccctcac 180
ttcactttca gattcatcct cgacaacgac ccacaagacg aacgcatttc caatctaccg 240
actcatggtc cgctcgctgg tatgcggatt ccgattatca acgaacacgg agctgacgaa 300
ttacgacgcg aactggaact gttgatgtta gcttctgaag aagatgaaga ggtatcgtgt 360
ttaatcacgg atgctctttg gtacttcgcg caatctgttg ctgacagtct taacctccga 420
cggcttgttt tgatgacaag cagcttgttt aattttcatg cacatgtttc acttcctcag 480
tttgatgagc ttggttacct cgatcctgat gacaaaaccc gtttggaaga acaagcgagt 540
gggtttccta tgctaaaagt gaaagacatc aagtctgcgt attcgaactg gcaaatactc 600
aaagagatat tagggaagat gataaaacaa acaagagcat cttcaggagt catctggaac 660
tcatttaagg aactcgaaga gtctgagctc gaaactgtta tccgtgagat cccggctcca 720
agtttcttga taccactccc caagcatttg acagcctctt ccagcagctt actagaccac 780
gatcgaaccg tttttcaatg gttagaccaa caaccgccaa gttcggtact gtatgttagt 840
tttggtagta ctagtgaagt ggatgagaaa gatttcttgg aaatagctcg tgggttggtt 900
gatagcaagc agtcgttttt atgggtggtt cgacctgggt ttgtcaaggg ttcgacgtgg 960
gtcgaaccgt tgccagatgg gttcttgggt gaaagaggac gtattgtgaa atgggttcca 1020
cagcaagaag tgctagctca tggagcaata ggcgcattct ggactcatag cggatggaac 1080
tctacgttgg aaagcgtttg tgaaggtgtt cctatgattt tctcggattt tgggctcgat 1140
caaccgttga atgctagata catgagtgat gttttgaagg taggggtgta tttggaaaat 1200
gggtgggaaa gaggagagat agcaaatgca ataagaagag ttatggtgga tgaagaagga 1260
gaatacatta gacagaatgc aagagttttg aaacaaaagg cagatgtttc tttgatgaag 1320
ggtggt 1326
<210> 2
<211> 442
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自甜菊属的野生型UDP-糖基转移酶76G1
<400> 2
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly
435 440
<210> 3
<211> 1203
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链霉菌属(Streptomyces)的野生型大环内酯糖基转移酶
<400> 3
atgaccagtc gctcgcacat cgccatgttc tccatcgccg cccacgggca cgtgaacccg 60
agcctcgagg tgatccgcga gctcgtcgcg cgcgggcacc gggtgacgta cgcgattccg 120
cccgtcttcg ccgggaaggt cgccgaggcc ggcgccgagg tgaagctctg gaactccacc 180
ctgccctcgc ccgacgacga cccacaggca tggggcacga ccctgctgga caacgtggag 240
ccgttcctgg ccgacgcgat ccaggcgctc ccgcagctga tcgaggcgta cgaaggggac 300
gagcccgacc tcgtgctgca cgacatcacc tcctacccgg cccgcgtcct ggcccaccgc 360
tggggcgtgc ccgcggtctc cctgtcgccg aacctcgtcg cctgggaggg ctacgagaag 420
gaggtggccg agccgatgtg ggcggagccg aagcggaccg agcgcgggcg ggcctactac 480
gcccgcttcc acgcctggct ggaggagaac ggcgtcaccc tgcacccgga cgacttcgtg 540
ggccgccccg cccgctgtct cgtcctgatc ccgaaggcgc tgcagcccaa cgccgaccgg 600
gtggacgagg gcgtgtactc cttcgtgggc gcctgccagg gtgaccgcgg cgcggagggg 660
gagtggcggc ggcccgccgg cgccgagaag gtcgccctgg tctcgctcgg gtcctccttc 720
accaagcagc cggacttcta ccgggagtgc gtcagggcgt tcggcgagct gccgggctgg 780
cacctggtgc tccagatcgg caggcacgtc gacccggccg acctggggga cgtaccggag 840
aacgtcgaag tgcgctcctg ggtaccccag ttggcgatcc tcaaggaggc cgatctgttc 900
gtcacgcacg ccggcgcggg cggcagccag gagggtctgg ccacggccac gccgatgatc 960
gccgtaccgc aggccgtgga ccagttcggc aacgcggaca tgctccaggg gctcggtgtc 1020
gcccgccgcc tcgacaccga ggaggcgacc gccgaggccc tcagggcggc cgccctcgct 1080
ctcgtcgacg accccgaagt ggcccgtcgg gcgcgggaca tccaggctca gatggcgggg 1140
gagggcggca cgcgccgggc ggccgacctg atcgaggccg agctgccggt acggcaggcg 1200
tag 1203
<210> 4
<211> 400
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链霉菌属的野生型大环内酯糖基转移酶
<400> 4
Met Thr Ser Arg Ser His Ile Ala Met Phe Ser Ile Ala Ala His Gly
1 5 10 15
His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val Ala Arg Gly
20 25 30
His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Gly Lys Val Ala
35 40 45
Glu Ala Gly Ala Glu Val Lys Leu Trp Asn Ser Thr Leu Pro Ser Pro
50 55 60
Asp Asp Asp Pro Gln Ala Trp Gly Thr Thr Leu Leu Asp Asn Val Glu
65 70 75 80
Pro Phe Leu Ala Asp Ala Ile Gln Ala Leu Pro Gln Leu Ile Glu Ala
85 90 95
Tyr Glu Gly Asp Glu Pro Asp Leu Val Leu His Asp Ile Thr Ser Tyr
100 105 110
Pro Ala Arg Val Leu Ala His Arg Trp Gly Val Pro Ala Val Ser Leu
115 120 125
Ser Pro Asn Leu Val Ala Trp Glu Gly Tyr Glu Lys Glu Val Ala Glu
130 135 140
Pro Met Trp Ala Glu Pro Lys Arg Thr Glu Arg Gly Arg Ala Tyr Tyr
145 150 155 160
Ala Arg Phe His Ala Trp Leu Glu Glu Asn Gly Val Thr Leu His Pro
165 170 175
Asp Asp Phe Val Gly Arg Pro Ala Arg Cys Leu Val Leu Ile Pro Lys
180 185 190
Ala Leu Gln Pro Asn Ala Asp Arg Val Asp Glu Gly Val Tyr Ser Phe
195 200 205
Val Gly Ala Cys Gln Gly Asp Arg Gly Ala Glu Gly Glu Trp Arg Arg
210 215 220
Pro Ala Gly Ala Glu Lys Val Ala Leu Val Ser Leu Gly Ser Ser Phe
225 230 235 240
Thr Lys Gln Pro Asp Phe Tyr Arg Glu Cys Val Arg Ala Phe Gly Glu
245 250 255
Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg His Val Asp Pro
260 265 270
Ala Asp Leu Gly Asp Val Pro Glu Asn Val Glu Val Arg Ser Trp Val
275 280 285
Pro Gln Leu Ala Ile Leu Lys Glu Ala Asp Leu Phe Val Thr His Ala
290 295 300
Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr Pro Met Ile
305 310 315 320
Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp Met Leu Gln
325 330 335
Gly Leu Gly Val Ala Arg Arg Leu Asp Thr Glu Glu Ala Thr Ala Glu
340 345 350
Ala Leu Arg Ala Ala Ala Leu Ala Leu Val Asp Asp Pro Glu Val Ala
355 360 365
Arg Arg Ala Arg Asp Ile Gln Ala Gln Met Ala Gly Glu Gly Gly Thr
370 375 380
Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Val Arg Gln Ala
385 390 395 400
<210> 5
<211> 1248
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链霉菌属的野生型大环内酯糖基转移酶
<400> 5
atgaccaccc agaccactcc cgcccacatc gccatgttct ccatcgccgc ccacggccat 60
gtgaacccca gcctggaggt gatccgtgaa ctcgtcgccc gcggccaccg ggtcacgtac 120
gccattccgc ccgtcttcgc cgacaaggtg gccgccaccg gcgcccggcc cgtcctctac 180
cactccaccc tgcccggccc cgacgccgac ccggaggcat ggggaagcac cctgctggac 240
aacgtcgaac cgttcctgaa cgacgcgatc caggcgctcc cgcagctcgc cgatgcctac 300
gccgacgaca tccccgatct cgtcctgcac gacatcacct cctacccggc ccgcgtcctg 360
gcccgccgct ggggcgtccc ggcggtctcc ctctccccga acctcgtcgc ctggaagggt 420
tacgaggagg aggtcgccga gccgatgtgg cgcgaacccc ggcagaccga gcgcggacgg 480
gcctactacg cccggttcga ggcatggctg aaggagaacg ggatcaccga gcacccggac 540
acgttcgcca gtcatccgcc gcgctccctg gtgctcatcc cgaaggcgct ccagccgcac 600
gccgaccggg tggacgaaga cgtgtacacc ttcgtcggcg cctgccaggg agaccgcgcc 660
gaggaaggcg gctggcagcg gcccgccggc gcggagaagg tcgtcctggt gtcgctcggc 720
tcggcgttca ccaagcagcc cgccttctac cgggagtgcg tgcgcgcctt cgggaacctg 780
cccggctggc acctcgtcct ccagatcggc cggaaggtga cccccgccga actgggggag 840
ctgccggaca acgtggaggt gcacgactgg gtgccgcagc tcgcgatcct gcgccaggcc 900
gatctgttcg tcacccacgc gggcgccggc ggcagccagg aggggctggc caccgcgacg 960
cccatgatcg ccgtaccgca ggccgtcgac cagttcggca acgccgacat gctccaaggg 1020
ctcggcgtcg cccggaagct ggcgaccgag gaggccaccg ccgacctgct ccgcgagacc 1080
gccctcgctc tggtggacga cccggaggtc gcgcgccggc tccggcggat ccaggcggag 1140
atggcccagg agggcggcac ccggcgggcg gccgacctca tcgaggccga actgcccgcg 1200
cgccacgagc ggcaggagcc ggtgggcgac cgacccaacg gtgggtga 1248
<210> 6
<211> 415
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链霉菌属的野生型大环内酯糖基转移酶
<400> 6
Met Thr Thr Gln Thr Thr Pro Ala His Ile Ala Met Phe Ser Ile Ala
1 5 10 15
Ala His Gly His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val
20 25 30
Ala Arg Gly His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Asp
35 40 45
Lys Val Ala Ala Thr Gly Ala Arg Pro Val Leu Tyr His Ser Thr Leu
50 55 60
Pro Gly Pro Asp Ala Asp Pro Glu Ala Trp Gly Ser Thr Leu Leu Asp
65 70 75 80
Asn Val Glu Pro Phe Leu Asn Asp Ala Ile Gln Ala Leu Pro Gln Leu
85 90 95
Ala Asp Ala Tyr Ala Asp Asp Ile Pro Asp Leu Val Leu His Asp Ile
100 105 110
Thr Ser Tyr Pro Ala Arg Val Leu Ala Arg Arg Trp Gly Val Pro Ala
115 120 125
Val Ser Leu Ser Pro Asn Leu Val Ala Trp Lys Gly Tyr Glu Glu Glu
130 135 140
Val Ala Glu Pro Met Trp Arg Glu Pro Arg Gln Thr Glu Arg Gly Arg
145 150 155 160
Ala Tyr Tyr Ala Arg Phe Glu Ala Trp Leu Lys Glu Asn Gly Ile Thr
165 170 175
Glu His Pro Asp Thr Phe Ala Ser His Pro Pro Arg Ser Leu Val Leu
180 185 190
Ile Pro Lys Ala Leu Gln Pro His Ala Asp Arg Val Asp Glu Asp Val
195 200 205
Tyr Thr Phe Val Gly Ala Cys Gln Gly Asp Arg Ala Glu Glu Gly Gly
210 215 220
Trp Gln Arg Pro Ala Gly Ala Glu Lys Val Val Leu Val Ser Leu Gly
225 230 235 240
Ser Ala Phe Thr Lys Gln Pro Ala Phe Tyr Arg Glu Cys Val Arg Ala
245 250 255
Phe Gly Asn Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg Lys
260 265 270
Val Thr Pro Ala Glu Leu Gly Glu Leu Pro Asp Asn Val Glu Val His
275 280 285
Asp Trp Val Pro Gln Leu Ala Ile Leu Arg Gln Ala Asp Leu Phe Val
290 295 300
Thr His Ala Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr
305 310 315 320
Pro Met Ile Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp
325 330 335
Met Leu Gln Gly Leu Gly Val Ala Arg Lys Leu Ala Thr Glu Glu Ala
340 345 350
Thr Ala Asp Leu Leu Arg Glu Thr Ala Leu Ala Leu Val Asp Asp Pro
355 360 365
Glu Val Ala Arg Arg Leu Arg Arg Ile Gln Ala Glu Met Ala Gln Glu
370 375 380
Gly Gly Thr Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Ala
385 390 395 400
Arg His Glu Arg Gln Glu Pro Val Gly Asp Arg Pro Asn Gly Gly
405 410 415
<210> 7
<211> 894
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自类芽孢杆菌属(Paenibacillus)的野生型昆布二糖磷酸化酶
<400> 7
atgtacccat ttggaaaagg ctttgcccgt tacgttcctt ttctgctgct gttgattccg 60
ctggcgttat acgtcgtttt ttatttcgga ccatcggtgt tgaccgtgat ttattcgttt 120
acggatgtga aaaacatccc cggcagctcc atgaacttcg tcgggctcga taattataaa 180
gacttgtttt ttgccggaaa ttccggggaa cgctgggttt ccatcaaaaa cacgttaatt 240
ttcatgttta tcgtcaccat cgtgcagaac ggagtggcgt tgtttgtggc tgtgctgatc 300
aaccaacggc tgcgcggcga ttatttttac cgggccgtat tttttcttcc ggtcgtgctt 360
ggggtggccg ttgttgcgct cgtttggggc atgatgttcg atccgatgag cgggccggtt 420
aacatgctgt atcaatcgct gttcggatat aaagacatgt ttttctccag ctttacgcat 480
gcgttcggct acattatttt cgttcaaatc tggatgtaca tgggctattc aatgctgatt 540
tttctcgccg gcctacaatc cgtgccaaaa gatctgtacg aagcggggta catcgacggt 600
acgaaccgct ggcaatcgtt caagaatatt acgttcccgc tgatcgcccc gtcttttacg 660
gtcaatatgc tgctttcgat catcggggcg atgtccacgt tcgatattat cctcgccacg 720
acggacggca agttcaacac cagaacgatg gcttacgacg tatataagga aacgttccgc 780
ggcagtctgg aaatgggctt gccttcggcg ctgtccgtgg tccagttcct gatcattttg 840
gtgtttgtta tcgtggccgt cagacagacg cgtaagagag aggtggaata ttaa 894
<210> 8
<211> 297
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自类芽孢杆菌属的野生型昆布二糖磷酸化酶
<400> 8
Met Tyr Pro Phe Gly Lys Gly Phe Ala Arg Tyr Val Pro Phe Leu Leu
1 5 10 15
Leu Leu Ile Pro Leu Ala Leu Tyr Val Val Phe Tyr Phe Gly Pro Ser
20 25 30
Val Leu Thr Val Ile Tyr Ser Phe Thr Asp Val Lys Asn Ile Pro Gly
35 40 45
Ser Ser Met Asn Phe Val Gly Leu Asp Asn Tyr Lys Asp Leu Phe Phe
50 55 60
Ala Gly Asn Ser Gly Glu Arg Trp Val Ser Ile Lys Asn Thr Leu Ile
65 70 75 80
Phe Met Phe Ile Val Thr Ile Val Gln Asn Gly Val Ala Leu Phe Val
85 90 95
Ala Val Leu Ile Asn Gln Arg Leu Arg Gly Asp Tyr Phe Tyr Arg Ala
100 105 110
Val Phe Phe Leu Pro Val Val Leu Gly Val Ala Val Val Ala Leu Val
115 120 125
Trp Gly Met Met Phe Asp Pro Met Ser Gly Pro Val Asn Met Leu Tyr
130 135 140
Gln Ser Leu Phe Gly Tyr Lys Asp Met Phe Phe Ser Ser Phe Thr His
145 150 155 160
Ala Phe Gly Tyr Ile Ile Phe Val Gln Ile Trp Met Tyr Met Gly Tyr
165 170 175
Ser Met Leu Ile Phe Leu Ala Gly Leu Gln Ser Val Pro Lys Asp Leu
180 185 190
Tyr Glu Ala Gly Tyr Ile Asp Gly Thr Asn Arg Trp Gln Ser Phe Lys
195 200 205
Asn Ile Thr Phe Pro Leu Ile Ala Pro Ser Phe Thr Val Asn Met Leu
210 215 220
Leu Ser Ile Ile Gly Ala Met Ser Thr Phe Asp Ile Ile Leu Ala Thr
225 230 235 240
Thr Asp Gly Lys Phe Asn Thr Arg Thr Met Ala Tyr Asp Val Tyr Lys
245 250 255
Glu Thr Phe Arg Gly Ser Leu Glu Met Gly Leu Pro Ser Ala Leu Ser
260 265 270
Val Val Gln Phe Leu Ile Ile Leu Val Phe Val Ile Val Ala Val Arg
275 280 285
Gln Thr Arg Lys Arg Glu Val Glu Tyr
290 295
<210> 9
<211> 1374
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自甜菊属的UDP-糖基转移酶76G1的变体
<400> 9
atggagaaca aaaccgaaac caccgtgcgt cgtcgtcgtc gtatcattct gtttccggtt 60
ccgttccagg gccacatcaa cccgattctg caactggcga acgtgctgta cagcaagggt 120
tttagcatca ccatttttca caccaacttc aacaagccga aaaccagcaa ctatccgcac 180
ttcacctttc gtttcatcct ggacaacgat ccgcaggacg agcgtattag caacctgccg 240
acccatggtc cgctggcggg tatgcgtatc ccgatcatta acgagcacgg cgcggatgaa 300
ctgcgtcgtg agctggaact gctgatgctg gcgagcgagg aagacgagga agttagctgc 360
ctgattaccg atgcgctgtg gtacttcgcg caaagcgtgg cggacagcct gaacctgcgt 420
cgtctggttc tgatgaccag cagcctgttt aacttccacg cgcacgtgag cctgccgcag 480
tttgacgagc tgggctacct ggatccggac gataaaaccc gtctggagga acaagcgagc 540
ggtttcccga tgctgaaggt taaagatatc aagagcgcgt atagcaactg gcagatcctg 600
aaagaaattc tgggcaagat gatcaagcag acccgtgcga gcagcggtgt gatttggaac 660
agctttaaag agctggagga aagcgagctg gaaaccgtta tccgtgaaat tccggcgccg 720
agcttcctga ttccgctgcc gaagcacctg accgcgagca gcagcagcct gctggaccac 780
gatcgtaccg tgttccagtg gctggaccag caaccgccga gcagcgtgct gtacgttagc 840
tttggcagca ccagcgaggt ggacgaaaag gatttcctgg agattgcgcg tggtctggtt 900
gacagcaaac aaagctttct gtgggtggtt cgtccgggct tcgtgaaggg tagcacctgg 960
gttgagccgc tgccggatgg ttttctgggc gaacgtggtc gtatcgtgaa gtgggttccg 1020
caacaagaag tgctggcgca cggcgcgatt ggtgcgttct ggacccacag cggttggaac 1080
agcaccctgg agagcgtgtg cgaaggcgtt ccgatgatct ttagcgactt cggtctggat 1140
cagccgctga acgcgcgtta catgagcgat gttctgaaag tgggcgttta tctggagaac 1200
ggctgggagc gtggtgaaat cgcgaacgcg attcgtcgtg tgatggttga cgaggaaggt 1260
gagtacatcc gtcagaacgc gcgtgttctg aagcaaaaag cggatgttag cctgatgaag 1320
ggtggcagca gctacgagag cctggaaagc ctggttagct atattagcag cctg 1374
<210> 10
<211> 458
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自甜菊属的UDP-糖基转移酶76G1的变体
<400> 10
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 11
<211> 1203
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链霉菌属的大环内酯糖基转移酶的变体
<400> 11
atgaccagtc gttcccatat tgccatgttt agtatcgcgg cccatggtca cgtgaacccg 60
tccctggaag tcattcgtga actggtggcg cgtggtcacc gtgttaccta tgccatcccg 120
ccggttttcg ccggtaaagt tgctgaagcg ggcgccgaag tgaaactgtg gaacagcacg 180
ctgccgtctc cggatgacga tccgcaggcg tggggtacca cgctgctgga taatgttgaa 240
ccgtttctgg cagacgctat tcaggctctg ccgcaactga tcgaagcgta tgaaggcgac 300
gaaccggatc tggtcctgca tgatatcacc tcatatccgg ctcgtgttct ggcccatcgc 360
tggggtgtcc cggccgtgtc actgtcgccg aatctggttg cctgggaagg ctacgaaaaa 420
gaagtcgctg aaccgatgtg ggcggaaccg aaacgtaccg aacgtggtcg cgcctattac 480
gcacgctttc atgcctggct ggaagaaaac ggtgttacgc tgcatccgga tgattttgtt 540
ggtcgtccgg cacgttgcct ggtgctgatt ccgaaagccc tgcagccgaa tgcagaccgt 600
gtggatgaag gtgtttatag ctttgtcggc gcctgtcaag gcgatcgcgg tgcagagggt 660
gaatggcgtc gcccggcggg tgcagaaaaa gttgccctgg tctctctggg cagctctttt 720
accaaacagc cggatttcta ccgtgaatgc gtgcgcgcct tcggtgaatt accgggctgg 780
catctggtcc tgcaaattgg tcgccatgtg gacccggccg atctgggtga tgtgccggaa 840
aacgtggaag ttcgctcatg ggttccgcag ctggctatcc tgaaagaagc ggacctgttt 900
gtgacgcatg caggtgctgg cggttcgcaa gaaggcctgg ccaccgcaac gccgatgatt 960
gcagtgccgc aggcagttga tcaattcggt aatgcagaca tgctgcaggg tctgggtgtt 1020
gcccgtcgcc tggataccga agaagcaacc gctgaagcgc tgcgtgcagc ggcgctggcg 1080
ctggttgatg atccggaagt tgctcgtcgc gcgcgcgata ttcaggcgca gatggcgggt 1140
gaaggcggta cccgtcgcgc agcagacctg atcgaagctg aactgccggt gcgtcaggca 1200
taa 1203
<210> 12
<211> 400
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链霉菌属的大环内酯糖基转移酶的变体
<400> 12
Met Thr Ser Arg Ser His Ile Ala Met Phe Ser Ile Ala Ala His Gly
1 5 10 15
His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val Ala Arg Gly
20 25 30
His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Gly Lys Val Ala
35 40 45
Glu Ala Gly Ala Glu Val Lys Leu Trp Asn Ser Thr Leu Pro Ser Pro
50 55 60
Asp Asp Asp Pro Gln Ala Trp Gly Thr Thr Leu Leu Asp Asn Val Glu
65 70 75 80
Pro Phe Leu Ala Asp Ala Ile Gln Ala Leu Pro Gln Leu Ile Glu Ala
85 90 95
Tyr Glu Gly Asp Glu Pro Asp Leu Val Leu His Asp Ile Thr Ser Tyr
100 105 110
Pro Ala Arg Val Leu Ala His Arg Trp Gly Val Pro Ala Val Ser Leu
115 120 125
Ser Pro Asn Leu Val Ala Trp Glu Gly Tyr Glu Lys Glu Val Ala Glu
130 135 140
Pro Met Trp Ala Glu Pro Lys Arg Thr Glu Arg Gly Arg Ala Tyr Tyr
145 150 155 160
Ala Arg Phe His Ala Trp Leu Glu Glu Asn Gly Val Thr Leu His Pro
165 170 175
Asp Asp Phe Val Gly Arg Pro Ala Arg Cys Leu Val Leu Ile Pro Lys
180 185 190
Ala Leu Gln Pro Asn Ala Asp Arg Val Asp Glu Gly Val Tyr Ser Phe
195 200 205
Val Gly Ala Cys Gln Gly Asp Arg Gly Ala Glu Gly Glu Trp Arg Arg
210 215 220
Pro Ala Gly Ala Glu Lys Val Ala Leu Val Ser Leu Gly Ser Ser Phe
225 230 235 240
Thr Lys Gln Pro Asp Phe Tyr Arg Glu Cys Val Arg Ala Phe Gly Glu
245 250 255
Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg His Val Asp Pro
260 265 270
Ala Asp Leu Gly Asp Val Pro Glu Asn Val Glu Val Arg Ser Trp Val
275 280 285
Pro Gln Leu Ala Ile Leu Lys Glu Ala Asp Leu Phe Val Thr His Ala
290 295 300
Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr Pro Met Ile
305 310 315 320
Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp Met Leu Gln
325 330 335
Gly Leu Gly Val Ala Arg Arg Leu Asp Thr Glu Glu Ala Thr Ala Glu
340 345 350
Ala Leu Arg Ala Ala Ala Leu Ala Leu Val Asp Asp Pro Glu Val Ala
355 360 365
Arg Arg Ala Arg Asp Ile Gln Ala Gln Met Ala Gly Glu Gly Gly Thr
370 375 380
Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Val Arg Gln Ala
385 390 395 400
<210> 13
<211> 2733
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自类芽孢杆菌属的昆布二糖磷酸化酶的变体
<400> 13
atgggccaga agggttggaa atttcagggc gaacaaggcg agttccgtct ggaacaaccg 60
gagcacaaca gctacctgta ttttccgctg gtgaacgaag cgggtatgat gagcgcggtt 120
accccgaacc tgcacggcga gatcaccagc ggtcacaaca ccttcctgat ggaaccggtg 180
agcgcggaga gcctgcacaa cagcaaggcg agccgtaact tttgggtgtt cattgaaggt 240
tatggtgcgt ggagcgttag cggcaacagc gcgcgtcaga acgcggcgcg ttttaccggt 300
gaggaagagc gtagcgcggt ggaggcgggt ttcctgtggc acgcggttac ccgtgaaaac 360
gagaaggcgg gtctgaaagc gcgtaccgtg agcttcgtgc cggttaccga cgataagatc 420
gaactgatgc gtgttaccct gaccaacacc ggcaacgcgc cgctgaaact gaccccgacc 480
gcggcgattc cgctgtatgg tcgtagcgcg gacgatctgc gtgatcaccg tcacgtgacc 540
agcctgctgc accgtatctt taccagcgaa tacggcattg aggttcagcc ggcgctgagc 600
ttcgacgaac gtggtcaccg tgtgaacaag gttacctatg gcgtgtttgg tgcggaggcg 660
ggtggcaccg cgccggcggg cttctttccg gttaccgaag atttcattgg cgagggtggc 720
gcgctggact ggccggaagc ggtggttgcg aaccgtgagc cggatgcgca ggcgggcacc 780
gcggtggaag gttatgaggc ggttggcgcg ctgcgttttg cgccggtgga gctggcgccg 840
ggcaaaagcg tgagctatgt ggttgcgatg gttatcagcg gcgaccgtat tgatgttggt 900
cgttacgcgg cggattatct ggcggcgggt cgttttgacg cgctgctgga gcagaaccgt 960
gcgtactggc gtgacaagct ggataccgtg cgtttcagca gcggtgatgg cgagcaggac 1020
ctgtggatga aatgggttac cctgcaaccg attctgcgtc gtctgtatgg taacagcttc 1080
ctgccgtacc acgattatgg tcgtggtggc cgtggctggc gtgatctgtg gcaagactgc 1140
ctggcgctga tggtgatgga accggcggaa gtgcgtcacc tgctgctgaa caactacgcg 1200
ggtgtgcgta tggacggcag caacgcgacc atcattggtg cgggcccggg tgaatttgtg 1260
gcggatcgta acaacatccc gcgtgtttgg atggaccatg gtgcgtggcc gctgatgacc 1320
accctgctgt acctgcacca gagcggtgac ctggatctgc tgttccagcc gcaaagctat 1380
tttcgtgatg tgttcgttaa gcgttgccgt gagcgtgatg cgagctggac cccggagcag 1440
ggtaacaaac tgctgaccgc ggacggtcaa atttacgaag gcaccatcct ggagcacatt 1500
ctgctgcaaa acatcgtgcc gttctttaac gttggcgaac acggtaacat taaactggag 1560
ggcgcggact ggaacgatgg tctggacctg gcgccggaac gtggtgagag cgttgcgttt 1620
accgcgttct acgcgagcaa cctgatggaa ctgagcgagc tgctgctgga gctgcagaag 1680
cgtaccggca aagatagcct ggacatcgcg gaagagatgg cgctgctgct ggataccctg 1740
ggcaagccga tcagctatga cagcattcaa gaaaaacgta gcctgctgga tcgttactat 1800
gacgcggtga ccccgcgtgt tagcggcaag aaactgctgc tggatatccg taaggtggcg 1860
gaggatctga agcgtaaagc ggactgggcg gttgcgcacc tgcgtggtag cgaatggatt 1920
cagagcaaag agggctacgc gtggtttaac ggttactata acaacgacgg tgaacgtgtg 1980
gagggcgatc acccggacgg tgttcgtatg accctgaccg gtcaagtgtt cgcgatcatg 2040
ggtggcgttg cgaccgatga acagaccgag aagattagcc aagcggtgaa ccgttacctg 2100
aaagacgaac gtatcggcta tcgtctgaac agccgttttg gtggcattca gcaaaacctg 2160
ggtcgtgcgt tcggctttgc gttcggtcac aaggagaacg gtgcgatgtt cagccacatg 2220
accgtgatgt acgcgaacgc gctgtataaa cgtggctttg tgcaggaagg tttcgaggtt 2280
ctggatagca tctaccgtct gagcgcggac tttgaaaaca gccgtatcta cccgggcgtt 2340
ccggaatata ttaacgagcg tggccgtggc atgtacacct atctgaccgg tagcgcgagc 2400
tggctgctgc tgacccaact gaccgaagtg tatggcgtta agggtcgttt cggcgatctg 2460
cgtctggagc cgaaactggt gcaggcgcaa tttgacggca gcggtgaagc ggcggttgag 2520
accctgttcg cgggtcgtat gctgcgtgtg gtttatcgta acccgcaggc ggcggagcat 2580
ggtcaatatc gtgtggatag cgttagcctg aacggtcaga gcgttgattg ccaaaacgac 2640
ggcgcgggtt gcctgatcgg tcgtagcctg attgaagcgc tgccggcgga tggtgtgcat 2700
gagctgatcg ttaccctggg tcgtaacatt agc 2733
<210> 14
<211> 911
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自类芽孢杆菌属的昆布二糖磷酸化酶的变体
<400> 14
Met Gly Gln Lys Gly Trp Lys Phe Gln Gly Glu Gln Gly Glu Phe Arg
1 5 10 15
Leu Glu Gln Pro Glu His Asn Ser Tyr Leu Tyr Phe Pro Leu Val Asn
20 25 30
Glu Ala Gly Met Met Ser Ala Val Thr Pro Asn Leu His Gly Glu Ile
35 40 45
Thr Ser Gly His Asn Thr Phe Leu Met Glu Pro Val Ser Ala Glu Ser
50 55 60
Leu His Asn Ser Lys Ala Ser Arg Asn Phe Trp Val Phe Ile Glu Gly
65 70 75 80
Tyr Gly Ala Trp Ser Val Ser Gly Asn Ser Ala Arg Gln Asn Ala Ala
85 90 95
Arg Phe Thr Gly Glu Glu Glu Arg Ser Ala Val Glu Ala Gly Phe Leu
100 105 110
Trp His Ala Val Thr Arg Glu Asn Glu Lys Ala Gly Leu Lys Ala Arg
115 120 125
Thr Val Ser Phe Val Pro Val Thr Asp Asp Lys Ile Glu Leu Met Arg
130 135 140
Val Thr Leu Thr Asn Thr Gly Asn Ala Pro Leu Lys Leu Thr Pro Thr
145 150 155 160
Ala Ala Ile Pro Leu Tyr Gly Arg Ser Ala Asp Asp Leu Arg Asp His
165 170 175
Arg His Val Thr Ser Leu Leu His Arg Ile Phe Thr Ser Glu Tyr Gly
180 185 190
Ile Glu Val Gln Pro Ala Leu Ser Phe Asp Glu Arg Gly His Arg Val
195 200 205
Asn Lys Val Thr Tyr Gly Val Phe Gly Ala Glu Ala Gly Gly Thr Ala
210 215 220
Pro Ala Gly Phe Phe Pro Val Thr Glu Asp Phe Ile Gly Glu Gly Gly
225 230 235 240
Ala Leu Asp Trp Pro Glu Ala Val Val Ala Asn Arg Glu Pro Asp Ala
245 250 255
Gln Ala Gly Thr Ala Val Glu Gly Tyr Glu Ala Val Gly Ala Leu Arg
260 265 270
Phe Ala Pro Val Glu Leu Ala Pro Gly Lys Ser Val Ser Tyr Val Val
275 280 285
Ala Met Val Ile Ser Gly Asp Arg Ile Asp Val Gly Arg Tyr Ala Ala
290 295 300
Asp Tyr Leu Ala Ala Gly Arg Phe Asp Ala Leu Leu Glu Gln Asn Arg
305 310 315 320
Ala Tyr Trp Arg Asp Lys Leu Asp Thr Val Arg Phe Ser Ser Gly Asp
325 330 335
Gly Glu Gln Asp Leu Trp Met Lys Trp Val Thr Leu Gln Pro Ile Leu
340 345 350
Arg Arg Leu Tyr Gly Asn Ser Phe Leu Pro Tyr His Asp Tyr Gly Arg
355 360 365
Gly Gly Arg Gly Trp Arg Asp Leu Trp Gln Asp Cys Leu Ala Leu Met
370 375 380
Val Met Glu Pro Ala Glu Val Arg His Leu Leu Leu Asn Asn Tyr Ala
385 390 395 400
Gly Val Arg Met Asp Gly Ser Asn Ala Thr Ile Ile Gly Ala Gly Pro
405 410 415
Gly Glu Phe Val Ala Asp Arg Asn Asn Ile Pro Arg Val Trp Met Asp
420 425 430
His Gly Ala Trp Pro Leu Met Thr Thr Leu Leu Tyr Leu His Gln Ser
435 440 445
Gly Asp Leu Asp Leu Leu Phe Gln Pro Gln Ser Tyr Phe Arg Asp Val
450 455 460
Phe Val Lys Arg Cys Arg Glu Arg Asp Ala Ser Trp Thr Pro Glu Gln
465 470 475 480
Gly Asn Lys Leu Leu Thr Ala Asp Gly Gln Ile Tyr Glu Gly Thr Ile
485 490 495
Leu Glu His Ile Leu Leu Gln Asn Ile Val Pro Phe Phe Asn Val Gly
500 505 510
Glu His Gly Asn Ile Lys Leu Glu Gly Ala Asp Trp Asn Asp Gly Leu
515 520 525
Asp Leu Ala Pro Glu Arg Gly Glu Ser Val Ala Phe Thr Ala Phe Tyr
530 535 540
Ala Ser Asn Leu Met Glu Leu Ser Glu Leu Leu Leu Glu Leu Gln Lys
545 550 555 560
Arg Thr Gly Lys Asp Ser Leu Asp Ile Ala Glu Glu Met Ala Leu Leu
565 570 575
Leu Asp Thr Leu Gly Lys Pro Ile Ser Tyr Asp Ser Ile Gln Glu Lys
580 585 590
Arg Ser Leu Leu Asp Arg Tyr Tyr Asp Ala Val Thr Pro Arg Val Ser
595 600 605
Gly Lys Lys Leu Leu Leu Asp Ile Arg Lys Val Ala Glu Asp Leu Lys
610 615 620
Arg Lys Ala Asp Trp Ala Val Ala His Leu Arg Gly Ser Glu Trp Ile
625 630 635 640
Gln Ser Lys Glu Gly Tyr Ala Trp Phe Asn Gly Tyr Tyr Asn Asn Asp
645 650 655
Gly Glu Arg Val Glu Gly Asp His Pro Asp Gly Val Arg Met Thr Leu
660 665 670
Thr Gly Gln Val Phe Ala Ile Met Gly Gly Val Ala Thr Asp Glu Gln
675 680 685
Thr Glu Lys Ile Ser Gln Ala Val Asn Arg Tyr Leu Lys Asp Glu Arg
690 695 700
Ile Gly Tyr Arg Leu Asn Ser Arg Phe Gly Gly Ile Gln Gln Asn Leu
705 710 715 720
Gly Arg Ala Phe Gly Phe Ala Phe Gly His Lys Glu Asn Gly Ala Met
725 730 735
Phe Ser His Met Thr Val Met Tyr Ala Asn Ala Leu Tyr Lys Arg Gly
740 745 750
Phe Val Gln Glu Gly Phe Glu Val Leu Asp Ser Ile Tyr Arg Leu Ser
755 760 765
Ala Asp Phe Glu Asn Ser Arg Ile Tyr Pro Gly Val Pro Glu Tyr Ile
770 775 780
Asn Glu Arg Gly Arg Gly Met Tyr Thr Tyr Leu Thr Gly Ser Ala Ser
785 790 795 800
Trp Leu Leu Leu Thr Gln Leu Thr Glu Val Tyr Gly Val Lys Gly Arg
805 810 815
Phe Gly Asp Leu Arg Leu Glu Pro Lys Leu Val Gln Ala Gln Phe Asp
820 825 830
Gly Ser Gly Glu Ala Ala Val Glu Thr Leu Phe Ala Gly Arg Met Leu
835 840 845
Arg Val Val Tyr Arg Asn Pro Gln Ala Ala Glu His Gly Gln Tyr Arg
850 855 860
Val Asp Ser Val Ser Leu Asn Gly Gln Ser Val Asp Cys Gln Asn Asp
865 870 875 880
Gly Ala Gly Cys Leu Ile Gly Arg Ser Leu Ile Glu Ala Leu Pro Ala
885 890 895
Asp Gly Val His Glu Leu Ile Val Thr Leu Gly Arg Asn Ile Ser
900 905 910
<210> 15
<211> 1476
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自明串珠菌属(Leuconostoc)的蔗糖磷酸化酶
<400> 15
atggaaatcc agaacaaagc gatgttcatt acctacgcgg atagcctggg taaaaacctg 60
aaggacgttc gtaaagtgct gaaagaggac atcggcgatg cgattggtgg cgttcacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta cacccgtgtt 180
gatagcgcgt ttggtgactg gagcgatgtg gaagcgctgg gcgaggaata ctatctgatg 240
ttcgacttta tgatcaacca cattagccgt gaaagcgtta tgtaccagga cttcaagaaa 300
aaccacgatg agagcaagta taaagacttc tttatccgtt gggagaaatt ttgggcgaaa 360
gcgggtgaaa accgtccgac ccaggcggac gtggatctga tctacaagcg taaagataag 420
gcgccgaccc aagagattac cttcgacgat ggtaccaccg aaaacctgtg gaacaccttt 480
ggcgacgagc aaatcgacat tgatgttaac agcgcgatcg cgaaagagtt cattaagacc 540
accctggaag atatggtgaa acacggtgcg aacctgatcc gtctggacgc gtttgcgtac 600
gcggttaaga aagtggacac caacgatttc tttgttgagc cggaaatctg ggacaccctg 660
aacgaagtgc gtgaaattct gaccccgctg aaggcggaga tcctgccgga gattcacgaa 720
cactatagca tcccgaagaa aattaacgat cacggttact tcacctatga ctttgcgctg 780
ccgatgacca ccctgtacac cctgtatagc ggcaaaacca accagctggc gaaatggctg 840
aagatgagcc cgatgaagca attcaccacc ctggacaccc acgatggtat cggcgtggtt 900
gacgcgcgtg atgtgctgac cgacgaggaa attgattacg cgagcgagga actgtataag 960
gttggcgcga acgtgaagaa aacctacagc agcgcgagct ataacgacct ggatatctac 1020
caaattaaca gcacctacta tagcgcgctg ggtaacgacg atgcggcgta tctgctgagc 1080
cgtatcttcc aggtttttgc gccgggcatc ccgcaaattt actatgtggg tctgctggcg 1140
ggcgaaagcg atatcgagct gctggaaagc agcaaagagg gtcgtaacat taaccgtcac 1200
tactatagcg ttgacgaagt gaaagaggaa gttaagcgtc cggtggttgc gaaactgctg 1260
aagctgctga gctggcgtaa caacttcgcg gcgtttgacc tggatggtag cattgatgtg 1320
gaaaccccga gcgacaccac catcaagatt acccgtaaag ataagagcgg cgagaacgtg 1380
gcggttctgg tggcgaacgc ggcggacaaa acctttacca tcaccgcgaa cggcgaggaa 1440
attctggcga acaccgaggc ggacaagcag caactg 1476
<210> 16
<211> 492
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自明串珠菌属的蔗糖磷酸化酶
<400> 16
Met Glu Ile Gln Asn Lys Ala Met Phe Ile Thr Tyr Ala Asp Ser Leu
1 5 10 15
Gly Lys Asn Leu Lys Asp Val Arg Lys Val Leu Lys Glu Asp Ile Gly
20 25 30
Asp Ala Ile Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Arg Val Asp Ser Ala Phe
50 55 60
Gly Asp Trp Ser Asp Val Glu Ala Leu Gly Glu Glu Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Val Met Tyr Gln
85 90 95
Asp Phe Lys Lys Asn His Asp Glu Ser Lys Tyr Lys Asp Phe Phe Ile
100 105 110
Arg Trp Glu Lys Phe Trp Ala Lys Ala Gly Glu Asn Arg Pro Thr Gln
115 120 125
Ala Asp Val Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Thr Gln
130 135 140
Glu Ile Thr Phe Asp Asp Gly Thr Thr Glu Asn Leu Trp Asn Thr Phe
145 150 155 160
Gly Asp Glu Gln Ile Asp Ile Asp Val Asn Ser Ala Ile Ala Lys Glu
165 170 175
Phe Ile Lys Thr Thr Leu Glu Asp Met Val Lys His Gly Ala Asn Leu
180 185 190
Ile Arg Leu Asp Ala Phe Ala Tyr Ala Val Lys Lys Val Asp Thr Asn
195 200 205
Asp Phe Phe Val Glu Pro Glu Ile Trp Asp Thr Leu Asn Glu Val Arg
210 215 220
Glu Ile Leu Thr Pro Leu Lys Ala Glu Ile Leu Pro Glu Ile His Glu
225 230 235 240
His Tyr Ser Ile Pro Lys Lys Ile Asn Asp His Gly Tyr Phe Thr Tyr
245 250 255
Asp Phe Ala Leu Pro Met Thr Thr Leu Tyr Thr Leu Tyr Ser Gly Lys
260 265 270
Thr Asn Gln Leu Ala Lys Trp Leu Lys Met Ser Pro Met Lys Gln Phe
275 280 285
Thr Thr Leu Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Arg Asp
290 295 300
Val Leu Thr Asp Glu Glu Ile Asp Tyr Ala Ser Glu Glu Leu Tyr Lys
305 310 315 320
Val Gly Ala Asn Val Lys Lys Thr Tyr Ser Ser Ala Ser Tyr Asn Asp
325 330 335
Leu Asp Ile Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asn
340 345 350
Asp Asp Ala Ala Tyr Leu Leu Ser Arg Ile Phe Gln Val Phe Ala Pro
355 360 365
Gly Ile Pro Gln Ile Tyr Tyr Val Gly Leu Leu Ala Gly Glu Ser Asp
370 375 380
Ile Glu Leu Leu Glu Ser Ser Lys Glu Gly Arg Asn Ile Asn Arg His
385 390 395 400
Tyr Tyr Ser Val Asp Glu Val Lys Glu Glu Val Lys Arg Pro Val Val
405 410 415
Ala Lys Leu Leu Lys Leu Leu Ser Trp Arg Asn Asn Phe Ala Ala Phe
420 425 430
Asp Leu Asp Gly Ser Ile Asp Val Glu Thr Pro Ser Asp Thr Thr Ile
435 440 445
Lys Ile Thr Arg Lys Asp Lys Ser Gly Glu Asn Val Ala Val Leu Val
450 455 460
Ala Asn Ala Ala Asp Lys Thr Phe Thr Ile Thr Ala Asn Gly Glu Glu
465 470 475 480
Ile Leu Ala Asn Thr Glu Ala Asp Lys Gln Gln Leu
485 490
<210> 17
<211> 1512
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自双歧杆菌属(Bifidobacterium)的蔗糖磷酸化酶
<400> 17
atgaagaaca aagttcaact gatcacctac gcggaccgtc tgggtgatgg caccatcaag 60
agcatgaccg atattctgcg tacccgtttc gacggtgttt atgatggcgt gcacatcctg 120
ccgttcttta ccccgttcga cggtgcggat gcgggctttg acccgattga tcacaccaag 180
gttgacgagc gtctgggtag ctgggacgat gtggcggaac tgagcaaaac ccacaacatc 240
atggttgatg cgattgtgaa ccacatgagc tgggagagca agcagtttca agacgttctg 300
gcgaaaggcg aggaaagcga atactatccg atgttcctga ccatgagcag cgtgtttccg 360
aacggtgcga ccgaggaaga cctggcgggt atctatcgtc cgcgtccggg tctgccgttc 420
acccactata agtttgcggg taaaacccgt ctggtgtggg ttagcttcac cccgcagcaa 480
gttgatattg acaccgatag cgacaagggc tgggagtacc tgatgagcat ctttgatcaa 540
atggcggcga gccacgttag ctacattcgt ctggacgcgg tgggttatgg cgcgaaagaa 600
gcgggtacca gctgcttcat gaccccgaag acctttaaac tgatcagccg tctgcgtgag 660
gaaggtgtga agcgtggcct ggagatcctg attgaagttc acagctacta taagaaacag 720
gtggagattg cgagcaaagt ggaccgtgtt tatgattttg cgctgccgcc gctgctgctg 780
catgcgctga gcaccggtca tgtggaaccg gttgcgcact ggaccgatat ccgtccgaac 840
aacgcggtga ccgttctgga cacccacgat ggtattggcg ttatcgacat tggtagcgac 900
caactggatc gtagcctgaa gggtctggtg ccggatgagg acgttgataa cctggtgaac 960
accatccacg cgaacaccca cggtgaaagc caagcggcga ccggcgcggc ggcgagcaac 1020
ctggatctgt accaagttaa cagcacctac tatagcgcgc tgggttgcaa cgaccagcac 1080
tatattgcgg cgcgtgcggt gcagttcttt ctgccgggcg tgccgcaagt ttactatgtg 1140
ggtgcgctgg cgggcaagaa cgacatggag ctgctgcgta aaaccaacaa cggtcgtgat 1200
atcaaccgtc actactatag caccgcggag attgacgaaa acctgaagcg tccggtggtt 1260
aaagcgctga acgcgctggc gaagttccgt aacgaactgg acgcgttcga tggtaccttt 1320
agctacacca ccgacgatga caccagcatc agcttcacct ggcgtggcga gaccagccag 1380
gcgaccctga cctttgaacc gaaacgtggt ctgggcgttg acaacaccac cccggtggcg 1440
atgctggagt gggaagacag cgcgggtgat caccgtagcg atgacctgat tgcgaacccg 1500
ccggtggttg cg 1512
<210> 18
<211> 504
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自双歧杆菌属的蔗糖磷酸化酶
<400> 18
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys
130 135 140
Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser
165 170 175
Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys
210 215 220
Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro
245 250 255
Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala
260 265 270
His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn
305 310 315 320
Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu
420 425 430
Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr
435 440 445
Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr
450 455 460
Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala
465 470 475 480
Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu
485 490 495
Ile Ala Asn Pro Pro Val Val Ala
500
<210> 19
<211> 1479
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自未培养的细菌的蔗糖磷酸化酶
<400> 19
atgaagaaca aagtgcagct gattgcgtac gttgaccgta tcagcggtgg cggtttccgt 60
aagctgcatg cgctgctgac cggtccgctg gcggagattt ttggcggtgc gcacctgctg 120
ccgttcttta ccccgattga tggtgcggat gcgggttttg atccgagcga tcacacccaa 180
gtggacccgc gtctgggtac ctgggacgat gttcgtatcc tgggcggtgc gattgaactg 240
gtggcggatc tgattgtgaa ccacgttagc agcagcagcc cgcaatttat cgactacagc 300
aagaaaggca gcgatagcct gtacgcgggc atgttcctga cctatgaccg tgtttttccg 360
gagggtgcgc gtgaagcgga tatcctgcgt atttatcgtc cgcgtccgac cctgccgttt 420
agcccggtga ccctgagcag ccgtgagcgt aaactgctgt ggaccacctt taacccggaa 480
caggtggaca ttgatgttcg tcacccggag gcggaagcgt acctgcacag catcctgaag 540
aaattccaag cggcgggcat ccgtatgatt cgtctggacg cggttggcta tgcgatcaag 600
aaaccgggtg cgagctgctt tatgattccg gagaccttcg attttatcgc ggagctgacc 660
gaaaaggcgc gtgcgctggg tattgaggtg ctggttgaaa tccacagcca ctaccgtaaa 720
cagatcgaaa ttgcgcgtca agtggactgg gtttatgatt ttgcgctgcc gccgctggtg 780
ctgcatgcgc tgtttgcgag cgacccgcac ccgctggcgc agtggctgag catcagcccg 840
cgtaacgcgg tgaccgttct ggacacccac gatggcatcg gtgtgattga tgttggtgcg 900
gatgcggaag gtaacccggg tctgctgagc ccggcggcga ttgacagcct ggttgagacc 960
atccacagcc gtagccaagg tcaaagccgt gaagcgaccg gtgcggcggc gaacaacctg 1020
gatctgtacc aagtgaactg caccttcctg gatgcgctgg gcggtcgtga accggattat 1080
ctgattgcgc gtgcgctgca gttctttgcg ccgggcatcc cgcaagtgta ctatgttggt 1140
ctgctgggcg gtaccaacga catggatctg ctgggtcgta gcggtgtggg tcgtgacatt 1200
aaccgtcact actataccga cgcggagatt gatgcggcgc tggcgcgtcc gctggtgcgt 1260
accctgatcg cgctgattcg tctgcgtaac acccacccgg cgttcgcggg tgaatttgat 1320
gtgagcgttc cggcggcgac ccagattcgt ctgcgttggc agcgtcaaga gcactggatc 1380
gaactgcacg ttgacctgag catcccgaag gcgagcatta ccggcaccgg tatccacccg 1440
atcaccattc cgggtgcggc ggatgcgggt gcgccgagc 1479
<210> 20
<211> 493
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自未培养的细菌(uncultured bacterium)的蔗糖磷酸化酶
<400> 20
Met Lys Asn Lys Val Gln Leu Ile Ala Tyr Val Asp Arg Ile Ser Gly
1 5 10 15
Gly Gly Phe Arg Lys Leu His Ala Leu Leu Thr Gly Pro Leu Ala Glu
20 25 30
Ile Phe Gly Gly Ala His Leu Leu Pro Phe Phe Thr Pro Ile Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ser Asp His Thr Gln Val Asp Pro Arg
50 55 60
Leu Gly Thr Trp Asp Asp Val Arg Ile Leu Gly Gly Ala Ile Glu Leu
65 70 75 80
Val Ala Asp Leu Ile Val Asn His Val Ser Ser Ser Ser Pro Gln Phe
85 90 95
Ile Asp Tyr Ser Lys Lys Gly Ser Asp Ser Leu Tyr Ala Gly Met Phe
100 105 110
Leu Thr Tyr Asp Arg Val Phe Pro Glu Gly Ala Arg Glu Ala Asp Ile
115 120 125
Leu Arg Ile Tyr Arg Pro Arg Pro Thr Leu Pro Phe Ser Pro Val Thr
130 135 140
Leu Ser Ser Arg Glu Arg Lys Leu Leu Trp Thr Thr Phe Asn Pro Glu
145 150 155 160
Gln Val Asp Ile Asp Val Arg His Pro Glu Ala Glu Ala Tyr Leu His
165 170 175
Ser Ile Leu Lys Lys Phe Gln Ala Ala Gly Ile Arg Met Ile Arg Leu
180 185 190
Asp Ala Val Gly Tyr Ala Ile Lys Lys Pro Gly Ala Ser Cys Phe Met
195 200 205
Ile Pro Glu Thr Phe Asp Phe Ile Ala Glu Leu Thr Glu Lys Ala Arg
210 215 220
Ala Leu Gly Ile Glu Val Leu Val Glu Ile His Ser His Tyr Arg Lys
225 230 235 240
Gln Ile Glu Ile Ala Arg Gln Val Asp Trp Val Tyr Asp Phe Ala Leu
245 250 255
Pro Pro Leu Val Leu His Ala Leu Phe Ala Ser Asp Pro His Pro Leu
260 265 270
Ala Gln Trp Leu Ser Ile Ser Pro Arg Asn Ala Val Thr Val Leu Asp
275 280 285
Thr His Asp Gly Ile Gly Val Ile Asp Val Gly Ala Asp Ala Glu Gly
290 295 300
Asn Pro Gly Leu Leu Ser Pro Ala Ala Ile Asp Ser Leu Val Glu Thr
305 310 315 320
Ile His Ser Arg Ser Gln Gly Gln Ser Arg Glu Ala Thr Gly Ala Ala
325 330 335
Ala Asn Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Phe Leu Asp Ala
340 345 350
Leu Gly Gly Arg Glu Pro Asp Tyr Leu Ile Ala Arg Ala Leu Gln Phe
355 360 365
Phe Ala Pro Gly Ile Pro Gln Val Tyr Tyr Val Gly Leu Leu Gly Gly
370 375 380
Thr Asn Asp Met Asp Leu Leu Gly Arg Ser Gly Val Gly Arg Asp Ile
385 390 395 400
Asn Arg His Tyr Tyr Thr Asp Ala Glu Ile Asp Ala Ala Leu Ala Arg
405 410 415
Pro Leu Val Arg Thr Leu Ile Ala Leu Ile Arg Leu Arg Asn Thr His
420 425 430
Pro Ala Phe Ala Gly Glu Phe Asp Val Ser Val Pro Ala Ala Thr Gln
435 440 445
Ile Arg Leu Arg Trp Gln Arg Gln Glu His Trp Ile Glu Leu His Val
450 455 460
Asp Leu Ser Ile Pro Lys Ala Ser Ile Thr Gly Thr Gly Ile His Pro
465 470 475 480
Ile Thr Ile Pro Gly Ala Ala Asp Ala Gly Ala Pro Ser
485 490
<210> 21
<211> 1467
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自酒球菌属(Oenococcus)的蔗糖磷酸化酶
<400> 21
atgccggtga agaacaaagc gatgctgatc acctacagcg atagcatggg taaaaacatc 60
aaggaactgc agtacattct ggacaaatat atcggcgatg cgattggtgg cgttcacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta tacccgtgtg 180
aacccggact ttggtgattg ggaggacgtt gaggaactgg gcaagaaata ctatctgatg 240
ttcgacttta tgatcaacca cattagccgt gaaagcatta tgtaccagga cttcaaagag 300
aagaaagatg cgagcagcta taaggacttc tttatccgtt gggaaaaatt ttggccgaag 360
ggtcgtccga ccaaggcgga catcgatctg atttacaagc gtaaagataa ggcgccgatc 420
cagggtatta ccttcgcgga cggcagccaa gaacacctgt ggaacacctt tggtgacgag 480
caaatcgata ttaacgtgaa aagcaaggtt gcgcaggagt tctttaaaga taccctgcaa 540
agcatggtga agcacggcgc ggacctgatt cgtctggatg cgttcgcgta cgcgatcaag 600
aaaattgata ccaacgactt ctttatcgaa ccggagattt gggatctgct ggaaagcgtt 660
cgtaaaattc tggacccgct gcatgcggag atcctgccgg aaatttacga gcactatacc 720
atcccggcga agattaacga atacggttat ttcacctacg actttgtgct gccgctggtt 780
atcctgtaca ccctgtatag cggcaacccg aaacagctgg cgaaatggct gaagatgagc 840
ccgaagaaac aattcaccac cctggatacc cacgacggta tcggcgtggt tgatgcgcgt 900
gacatcctga ccgacgagga aattgattac accagcagcg agctgtataa agtgggtgcg 960
aacgttaagc gtacctacag cagcgcggcg tataacaacc tggacatcta ccagattaac 1020
agcacctact atagcgcgct gggtaacgac gataaagcgt atctgctggc gcgtgcgatc 1080
cagatttttg cgccgggcat cccgcaaatt tactatgcgg gtctgctggc gggcgaaaac 1140
gacctggatc tgctggaaaa aaccaaagag ggtcgtaaca ttaaccgtca ctactatagc 1200
gaggaagagg tggcgaacga ggttcaacgt ccgatcgttg cgtgcctgct gaagctgctg 1260
gcgtggcgta accgtagcgc ggcgttcgac ctgcagggtg atattcaagt tagcgcgacc 1320
gataaaaacg aaatcaagat cattcgtacc agcaccaacg gtcaagacac cgcggagctg 1380
accgcgaacg tggcgctgaa aacctttacc atcaaagaaa acgacaagat cattctgatt 1440
gaggatcaaa ccgacaccaa ggatatc 1467
<210> 22
<211> 489
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自酒球菌属的蔗糖磷酸化酶
<400> 22
Met Pro Val Lys Asn Lys Ala Met Leu Ile Thr Tyr Ser Asp Ser Met
1 5 10 15
Gly Lys Asn Ile Lys Glu Leu Gln Tyr Ile Leu Asp Lys Tyr Ile Gly
20 25 30
Asp Ala Ile Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Arg Val Asn Pro Asp Phe
50 55 60
Gly Asp Trp Glu Asp Val Glu Glu Leu Gly Lys Lys Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Ile Met Tyr Gln
85 90 95
Asp Phe Lys Glu Lys Lys Asp Ala Ser Ser Tyr Lys Asp Phe Phe Ile
100 105 110
Arg Trp Glu Lys Phe Trp Pro Lys Gly Arg Pro Thr Lys Ala Asp Ile
115 120 125
Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Ile Gln Gly Ile Thr
130 135 140
Phe Ala Asp Gly Ser Gln Glu His Leu Trp Asn Thr Phe Gly Asp Glu
145 150 155 160
Gln Ile Asp Ile Asn Val Lys Ser Lys Val Ala Gln Glu Phe Phe Lys
165 170 175
Asp Thr Leu Gln Ser Met Val Lys His Gly Ala Asp Leu Ile Arg Leu
180 185 190
Asp Ala Phe Ala Tyr Ala Ile Lys Lys Ile Asp Thr Asn Asp Phe Phe
195 200 205
Ile Glu Pro Glu Ile Trp Asp Leu Leu Glu Ser Val Arg Lys Ile Leu
210 215 220
Asp Pro Leu His Ala Glu Ile Leu Pro Glu Ile Tyr Glu His Tyr Thr
225 230 235 240
Ile Pro Ala Lys Ile Asn Glu Tyr Gly Tyr Phe Thr Tyr Asp Phe Val
245 250 255
Leu Pro Leu Val Ile Leu Tyr Thr Leu Tyr Ser Gly Asn Pro Lys Gln
260 265 270
Leu Ala Lys Trp Leu Lys Met Ser Pro Lys Lys Gln Phe Thr Thr Leu
275 280 285
Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Arg Asp Ile Leu Thr
290 295 300
Asp Glu Glu Ile Asp Tyr Thr Ser Ser Glu Leu Tyr Lys Val Gly Ala
305 310 315 320
Asn Val Lys Arg Thr Tyr Ser Ser Ala Ala Tyr Asn Asn Leu Asp Ile
325 330 335
Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asn Asp Asp Lys
340 345 350
Ala Tyr Leu Leu Ala Arg Ala Ile Gln Ile Phe Ala Pro Gly Ile Pro
355 360 365
Gln Ile Tyr Tyr Ala Gly Leu Leu Ala Gly Glu Asn Asp Leu Asp Leu
370 375 380
Leu Glu Lys Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser
385 390 395 400
Glu Glu Glu Val Ala Asn Glu Val Gln Arg Pro Ile Val Ala Cys Leu
405 410 415
Leu Lys Leu Leu Ala Trp Arg Asn Arg Ser Ala Ala Phe Asp Leu Gln
420 425 430
Gly Asp Ile Gln Val Ser Ala Thr Asp Lys Asn Glu Ile Lys Ile Ile
435 440 445
Arg Thr Ser Thr Asn Gly Gln Asp Thr Ala Glu Leu Thr Ala Asn Val
450 455 460
Ala Leu Lys Thr Phe Thr Ile Lys Glu Asn Asp Lys Ile Ile Leu Ile
465 470 475 480
Glu Asp Gln Thr Asp Thr Lys Asp Ile
485
<210> 23
<211> 1446
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自肠球菌属(Enterococcus)的蔗糖磷酸化酶
<400> 23
atgaagatta aaaacgaggc gatgctgatc acctactgcg acagcctggg taacaacctg 60
aaagacctga accaggtgct ggatcagcac ctgcaaggcg tggttggtgg catccacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta taccgtggtt 180
gatagcgcgt ttggtacctg gcaagaggtt gaagcgctgg gcgagaagta ctacctgatg 240
ttcgacttca tgatcaacca catcagccgt gaaagcaaat tctttcagga tttcaagcaa 300
aaccacgagg cgagcccgta caaggaaatg tttattcgta tccacgagtt ctttccggaa 360
aaccgtccga ccccggagga cattgatctg atctataagc gtaaagacaa ggcgccgttc 420
caggaagtga cctttgcgga tggtaccacc gaacaggttt ggaacacctt cggcgaggaa 480
caaattgacc tggatgtgaa caaagaagtt accaagcaat tcatcaagga caccctgaag 540
gatatggcga gccacggttg cagcctgatt cgtctggacg cgttcgcgta cgcgatcaag 600
aaactggaca ccaacgattt ctttgtggag ccggaaattt gggacctgct ggatgaggtt 660
cgtgaggaag cggcgaaata caactgcgaa ctgctgccgg agatccacga acactatacc 720
attcagatga agatcgcgga ccacgattac tatgtgtacg acttcgcgct gccgatgatc 780
accctgtaca gcctgtatag cggtaaaacc aaccgtctgg cgaactggct gaaaatgagc 840
ccgatgaagc aatttaccac cctggacacc cacgatggta ttggcgtggt tgacgcgaaa 900
gatctgctga ccgacgagga actggattac accagcgagg aactgtataa agtgggcgcg 960
aacgttaaga aaatctacag cagcgcgagc tataacaacc tggacattta ccagatcaac 1020
agcacctact atagcgcgct gggtgacaac gatcgtagct atctgctggc gcgtgcgatt 1080
cagtgctttg cgccgggcat tccgcaaatc tactatgtgg gtctgctggc gggcaaaaac 1140
gacctggagc tgctggaaag caccaaagag ggtcgtaaca ttaaccgtca ctactatagc 1200
ctgaccgaaa tcgatgagga agttaaccgt ccggtggtta aggcgctgtt cgacctgctg 1260
cgttttcgta accgtgcggc ggcgtttgat ctggcgggcg agatcaccgt ggaaaccccg 1320
agcgaggaaa ccatcattat cacccgtaaa gacgcgaacg gtgatcgtgc ggttctgacc 1380
gcgaacctgc agaccaagga ctttaccgtg acccacaacg gcgaactggt tctgcagcaa 1440
ctggat 1446
<210> 24
<211> 482
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自肠球菌属的蔗糖磷酸化酶
<400> 24
Met Lys Ile Lys Asn Glu Ala Met Leu Ile Thr Tyr Cys Asp Ser Leu
1 5 10 15
Gly Asn Asn Leu Lys Asp Leu Asn Gln Val Leu Asp Gln His Leu Gln
20 25 30
Gly Val Val Gly Gly Ile His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Val Val Asp Ser Ala Phe
50 55 60
Gly Thr Trp Gln Glu Val Glu Ala Leu Gly Glu Lys Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Lys Phe Phe Gln
85 90 95
Asp Phe Lys Gln Asn His Glu Ala Ser Pro Tyr Lys Glu Met Phe Ile
100 105 110
Arg Ile His Glu Phe Phe Pro Glu Asn Arg Pro Thr Pro Glu Asp Ile
115 120 125
Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Phe Gln Glu Val Thr
130 135 140
Phe Ala Asp Gly Thr Thr Glu Gln Val Trp Asn Thr Phe Gly Glu Glu
145 150 155 160
Gln Ile Asp Leu Asp Val Asn Lys Glu Val Thr Lys Gln Phe Ile Lys
165 170 175
Asp Thr Leu Lys Asp Met Ala Ser His Gly Cys Ser Leu Ile Arg Leu
180 185 190
Asp Ala Phe Ala Tyr Ala Ile Lys Lys Leu Asp Thr Asn Asp Phe Phe
195 200 205
Val Glu Pro Glu Ile Trp Asp Leu Leu Asp Glu Val Arg Glu Glu Ala
210 215 220
Ala Lys Tyr Asn Cys Glu Leu Leu Pro Glu Ile His Glu His Tyr Thr
225 230 235 240
Ile Gln Met Lys Ile Ala Asp His Asp Tyr Tyr Val Tyr Asp Phe Ala
245 250 255
Leu Pro Met Ile Thr Leu Tyr Ser Leu Tyr Ser Gly Lys Thr Asn Arg
260 265 270
Leu Ala Asn Trp Leu Lys Met Ser Pro Met Lys Gln Phe Thr Thr Leu
275 280 285
Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Lys Asp Leu Leu Thr
290 295 300
Asp Glu Glu Leu Asp Tyr Thr Ser Glu Glu Leu Tyr Lys Val Gly Ala
305 310 315 320
Asn Val Lys Lys Ile Tyr Ser Ser Ala Ser Tyr Asn Asn Leu Asp Ile
325 330 335
Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asp Asn Asp Arg
340 345 350
Ser Tyr Leu Leu Ala Arg Ala Ile Gln Cys Phe Ala Pro Gly Ile Pro
355 360 365
Gln Ile Tyr Tyr Val Gly Leu Leu Ala Gly Lys Asn Asp Leu Glu Leu
370 375 380
Leu Glu Ser Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser
385 390 395 400
Leu Thr Glu Ile Asp Glu Glu Val Asn Arg Pro Val Val Lys Ala Leu
405 410 415
Phe Asp Leu Leu Arg Phe Arg Asn Arg Ala Ala Ala Phe Asp Leu Ala
420 425 430
Gly Glu Ile Thr Val Glu Thr Pro Ser Glu Glu Thr Ile Ile Ile Thr
435 440 445
Arg Lys Asp Ala Asn Gly Asp Arg Ala Val Leu Thr Ala Asn Leu Gln
450 455 460
Thr Lys Asp Phe Thr Val Thr His Asn Gly Glu Leu Val Leu Gln Gln
465 470 475 480
Leu Asp
<210> 25
<211> 1440
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链球菌属(Streptococcus)的蔗糖磷酸化酶
<400> 25
atgagcatcc agaacaagac catgctgatt acctacagcg atagcctggg taacaacctg 60
aaggacctgt acgagaacct ggaaaaatat ttcggcgatg cggtgggtgg cgttcacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cggtggatta tgaccaggtt 180
gacccggcgt ttggtgattg ggaggacgtg aagcgtctgg gcgataagta ctacctgatg 240
ttcgacttca tgatcaacca cattagccgt caaagcaagt actataaaaa ctaccaggag 300
aagcacgacc aaagcgcgta taaagacctg ttcctgaact gggacaagtt ttggccggaa 360
aaccgtccga cccaggcgga tgttgacctg atctacaagc gtaaagatcg tgcgccgaaa 420
caagagatta ccttcgcgga cggtaccacc gaacacctgt ggaacacctt tggcgaggaa 480
caaatcgatc tggacgtgac caaagaggtg accatggact tcatccgtaa aaccattgaa 540
cacctggtta gcaacggttg cgacctgatt cgtctggatg cgtttgcgta cgcggtgaag 600
aaactggata ccaacgactt ctttgttgag ccggatatct gggacctgct ggataaggtt 660
cgtgatatgg cggcgagcta cggcgcggaa ctgctgccgg agattcacga acactatagc 720
atccagttca aaattgcgga tcacgactac tatgtgtacg actttgcgct gccgatggtt 780
accctgtaca ccctgtatag cagcaaggtg gagcgtctgg cgaagtggct gaaaatgagc 840
ccgatgaaac aattcaccac cctggacacc cacgatggta tcggcgtggt tgacgttaag 900
gatatcctga ccgacgagga aattgattac gcgagcaacg agctgtataa agtgggtgcg 960
aacgttaagc gtaaatacag caccgcggaa tataacaacc tggatatcta ccagattaac 1020
agcacctact atagcgcgct gggtgacgat gacagcaagt atttcctggc gcgtctgatc 1080
caggcgtttg cgccgggcat tccgcaagtg tactatgttg gttttctggc gggcaagaac 1140
gacctggagc tgctggaaaa caccaaagaa ggtcgtaaca tcaaccgtca ctactatagc 1200
aacgaggaaa ttgcgcagga agtggaacgt ccggtggtta agagcctgct gaaactgttc 1260
agctttcgta acaacagcca agcgttcgat ctggagggca gcatcgaggt ggaaaccccg 1320
gacgaacaca ccatcgttat tacccgtcag aacaaagacc aaaccgcgac cgcggtggcg 1380
cgtatcaacc tggcggatgg tacctaccag gttaccgaga acggccaaga cattgaattt 1440
<210> 26
<211> 480
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自链球菌属的蔗糖磷酸化酶
<400> 26
Met Ser Ile Gln Asn Lys Thr Met Leu Ile Thr Tyr Ser Asp Ser Leu
1 5 10 15
Gly Asn Asn Leu Lys Asp Leu Tyr Glu Asn Leu Glu Lys Tyr Phe Gly
20 25 30
Asp Ala Val Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Val Asp Tyr Asp Gln Val Asp Pro Ala Phe
50 55 60
Gly Asp Trp Glu Asp Val Lys Arg Leu Gly Asp Lys Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Gln Ser Lys Tyr Tyr Lys
85 90 95
Asn Tyr Gln Glu Lys His Asp Gln Ser Ala Tyr Lys Asp Leu Phe Leu
100 105 110
Asn Trp Asp Lys Phe Trp Pro Glu Asn Arg Pro Thr Gln Ala Asp Val
115 120 125
Asp Leu Ile Tyr Lys Arg Lys Asp Arg Ala Pro Lys Gln Glu Ile Thr
130 135 140
Phe Ala Asp Gly Thr Thr Glu His Leu Trp Asn Thr Phe Gly Glu Glu
145 150 155 160
Gln Ile Asp Leu Asp Val Thr Lys Glu Val Thr Met Asp Phe Ile Arg
165 170 175
Lys Thr Ile Glu His Leu Val Ser Asn Gly Cys Asp Leu Ile Arg Leu
180 185 190
Asp Ala Phe Ala Tyr Ala Val Lys Lys Leu Asp Thr Asn Asp Phe Phe
195 200 205
Val Glu Pro Asp Ile Trp Asp Leu Leu Asp Lys Val Arg Asp Met Ala
210 215 220
Ala Ser Tyr Gly Ala Glu Leu Leu Pro Glu Ile His Glu His Tyr Ser
225 230 235 240
Ile Gln Phe Lys Ile Ala Asp His Asp Tyr Tyr Val Tyr Asp Phe Ala
245 250 255
Leu Pro Met Val Thr Leu Tyr Thr Leu Tyr Ser Ser Lys Val Glu Arg
260 265 270
Leu Ala Lys Trp Leu Lys Met Ser Pro Met Lys Gln Phe Thr Thr Leu
275 280 285
Asp Thr His Asp Gly Ile Gly Val Val Asp Val Lys Asp Ile Leu Thr
290 295 300
Asp Glu Glu Ile Asp Tyr Ala Ser Asn Glu Leu Tyr Lys Val Gly Ala
305 310 315 320
Asn Val Lys Arg Lys Tyr Ser Thr Ala Glu Tyr Asn Asn Leu Asp Ile
325 330 335
Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asp Asp Asp Ser
340 345 350
Lys Tyr Phe Leu Ala Arg Leu Ile Gln Ala Phe Ala Pro Gly Ile Pro
355 360 365
Gln Val Tyr Tyr Val Gly Phe Leu Ala Gly Lys Asn Asp Leu Glu Leu
370 375 380
Leu Glu Asn Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser
385 390 395 400
Asn Glu Glu Ile Ala Gln Glu Val Glu Arg Pro Val Val Lys Ser Leu
405 410 415
Leu Lys Leu Phe Ser Phe Arg Asn Asn Ser Gln Ala Phe Asp Leu Glu
420 425 430
Gly Ser Ile Glu Val Glu Thr Pro Asp Glu His Thr Ile Val Ile Thr
435 440 445
Arg Gln Asn Lys Asp Gln Thr Ala Thr Ala Val Ala Arg Ile Asn Leu
450 455 460
Ala Asp Gly Thr Tyr Gln Val Thr Glu Asn Gly Gln Asp Ile Glu Phe
465 470 475 480
<210> 27
<211> 1509
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自Scardovia的蔗糖磷酸化酶
<400> 27
atgaagaaca aagttcagct gattacctac gcggatcgtc tgggtgaagg taccctggcg 60
agcctgaccg atgtgctgcg tacccgtttc gatggcgttt atgaaggtgt gcacattctg 120
ccgttcttta ccccgttcga cggcgcggat gcgggttttg acccgatcga tcacaccaag 180
gttgacccgc gtctgggtag ctgggacgat gtggcggagc tgagcaaaac ccacgacatc 240
atggttgatg cgattgtgaa ccacatgagc tggcaaagcg aacagtttca agatgttatg 300
aagaaaggtg aaggcagcga atactatccg atgttcctga ccatgagcgc ggtgtttccg 360
gagggtgcga ccgaggaaga cctggcgggt atttatcgtc cgcgtccggg tctgccgttc 420
acccactata cctggggtgg caagacccgt ctggtttgga ccacctttac cccgcagcaa 480
gtggacatcg ataccgcgag cgacgaaggt tgggcgtacc tgatgagcat cctggatcag 540
atgagcaaaa gccacgttag cttcattcgt ctggacgcgg tgggttatgg cgcgaagcgt 600
gcgaaaacca gctgcttcat gaccccggac acctttgatc tgatcagccg tattaaagag 660
gagagcgcgc gtcgtggcat ggagaccctg atcgaagttc acagctacta taagaaacaa 720
gtggagattg cgaacaaggt ggaccgtgtt tacgattttg cgatcccggc gctgctgctg 780
catgcgctga gcaccggtaa aaccggtccg ctggcgcact ggctgggtgt gcgtccggtt 840
aacgcggtga acgttctgga cacccacgat ggtatcggcg tgattgatgt tggcagcgac 900
cagatggatc gtagcctgaa gggtctggtt ccggacgatg aagttgacca actggtggag 960
accattaaag aaaacagcca tggtgaaagc gcggaagcga ccggtgcggc ggcgagcaac 1020
ctggatctgt accaggttaa ctgcacctac tatagcgcgc tgggctgcga cgatcaaaaa 1080
tacatcgcga gccgtgcggt gcagttctat atgccgggtg tgccgcaagt ttactatgtg 1140
ggcgcgctgg cgggcaagaa cgacatggag ctgctgaaac gtaccaacgt tggtcgtgat 1200
atcaaccgtc actactatac cgtggcggag attgacgaaa acctgcgtcg tccggtggtt 1260
caggcgctga acgcgctggg ccgtttccgt aacaccctgg aggcgtttga cggtgatttc 1320
agctttaccg aaaacggtgg cagcctggcg atgacctgga ccggtcaaag caccagcacc 1380
accctgacct ttgcgccggg caagggtgcg ggtagcagcg gcgtgccggt ttgcaccatc 1440
gcgtggaaag acgcgagcgg tgaacacgtg accgacgata tcattgcgaa cccgccggcg 1500
gcggcgcag 1509
<210> 28
<211> 503
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自Scardovia的蔗糖磷酸化酶
<400> 28
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Glu
1 5 10 15
Gly Thr Leu Ala Ser Leu Thr Asp Val Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Pro Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asp Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Gln Ser Glu Gln Phe
85 90 95
Gln Asp Val Met Lys Lys Gly Glu Gly Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ala Val Phe Pro Glu Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Thr
130 135 140
Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Ala Ser Asp Glu Gly Trp Ala Tyr Leu Met Ser
165 170 175
Ile Leu Asp Gln Met Ser Lys Ser His Val Ser Phe Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Arg Ala Lys Thr Ser Cys Phe Met Thr
195 200 205
Pro Asp Thr Phe Asp Leu Ile Ser Arg Ile Lys Glu Glu Ser Ala Arg
210 215 220
Arg Gly Met Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Asn Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro
245 250 255
Ala Leu Leu Leu His Ala Leu Ser Thr Gly Lys Thr Gly Pro Leu Ala
260 265 270
His Trp Leu Gly Val Arg Pro Val Asn Ala Val Asn Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Val Gly Ser Asp Gln Met Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Asp Glu Val Asp Gln Leu Val Glu
305 310 315 320
Thr Ile Lys Glu Asn Ser His Gly Glu Ser Ala Glu Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asp Asp Gln Lys Tyr Ile Ala Ser Arg Ala Val Gln
355 360 365
Phe Tyr Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Lys Arg Thr Asn Val Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Thr Val Ala Glu Ile Asp Glu Asn Leu Arg
405 410 415
Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr
420 425 430
Leu Glu Ala Phe Asp Gly Asp Phe Ser Phe Thr Glu Asn Gly Gly Ser
435 440 445
Leu Ala Met Thr Trp Thr Gly Gln Ser Thr Ser Thr Thr Leu Thr Phe
450 455 460
Ala Pro Gly Lys Gly Ala Gly Ser Ser Gly Val Pro Val Cys Thr Ile
465 470 475 480
Ala Trp Lys Asp Ala Ser Gly Glu His Val Thr Asp Asp Ile Ile Ala
485 490 495
Asn Pro Pro Ala Ala Ala Gln
500
<210> 29
<211> 1506
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自Parascardovia的蔗糖磷酸化酶
<400> 29
atgaagaaca aagttcagct gatcacctac gcgaaccgtt tcggcgaggg caccattcgt 60
agcctgaccg acgtgctgcg tacccgtttt gatggtgttt acgaaggcgt gcacattctg 120
ccgttcttta ccccgttcga cggtgcggat gcgggctttg acccgattga tcacaccaag 180
gttgatccgc gtctgggtac ctgggacgat atcgcggagc tgagcaaaac ccacgacatc 240
atggttgatg cgattgtgaa ccacatgagc tgggagagca agcagttcca agacgttatg 300
aaaaacggtg aagcgagccc gtactatggc atgttcctga ccatgagcgc ggtgtttccg 360
gatggtgcga ccgaggaaga tctggcgggt atctatcgtc cgcgtccggg tctgccgttc 420
acccactata actggggtgg caagacccgt ctggtttgga ccacctttac cccgcagcaa 480
gtggacatca acaccgatag cattgaaggc tgggactacc tgatgagcat cctggatcag 540
atgagccaaa gccacgttag cttcattcgt ctggacgcgg tgggttatgg cgcgaagcag 600
gcgaaaacca cctgcttcat gaccccgaag acctttgagc tgatcggtcg tattaaagag 660
gagagcgcga aacgtggcat ggagaccctg atcgaagttc acagccacta catgaagcaa 720
gtggaaattg cgggtaaagt ggaccgtgtt tatgattttg cgattccggg tctgctgctg 780
catgcgctga ccaccggtaa aaccggtccg ctggcgcgtt ggatggaagt gcgtccgggt 840
aacgcggtga acgttctgga cacccacgat ggtattggcg ttatcgatat tggtagcgac 900
cagatggatc gtagcctgaa gggtctggtg ccggacgagg aagttgatca actggtggag 960
accatcaaag aaaacagcca cggtgaaagc gcggcggcga ccggcgcggc ggcgagcaac 1020
ctggacctgt accaggttaa ctgcacctac tatagcgcgc tgggttgcga cgatcaaaaa 1080
tatattgcgg cgcgtgcggt gcagttcttt atgccgggcg tgccgcaagt ttactatgtg 1140
ggtgcgctgg cgggcgagaa cgacatgcag ctgctgaagg aaaccaacgt tggtcgtgat 1200
atcaaccgtc actactatag cctggaggaa attgaccaaa acctggagcg tccggtggtt 1260
aaagcgctga acgcgctgtg ccgtttccgt aacggtctgg aagcgtttga cggcgatttc 1320
agctttgcgc agaacggtga tagcctgacc ttcgcgtgga ccggcaagga gaccgaagcg 1380
accctgacct ttaccccggc gcaaggtgtt ggcaaagatg aggcgccggt gtgcagcctg 1440
cgttggaagg acagcgcggg tgatcacaaa accgatgatc tgattgcgga accgccggcg 1500
gtggcg 1506
<210> 30
<211> 502
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自Parascardovia的蔗糖磷酸化酶
<400> 30
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asn Arg Phe Gly Glu
1 5 10 15
Gly Thr Ile Arg Ser Leu Thr Asp Val Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Pro Arg
50 55 60
Leu Gly Thr Trp Asp Asp Ile Ala Glu Leu Ser Lys Thr His Asp Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Met Lys Asn Gly Glu Ala Ser Pro Tyr Tyr Gly Met Phe
100 105 110
Leu Thr Met Ser Ala Val Phe Pro Asp Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn
130 135 140
Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asn Thr Asp Ser Ile Glu Gly Trp Asp Tyr Leu Met Ser
165 170 175
Ile Leu Asp Gln Met Ser Gln Ser His Val Ser Phe Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Gln Ala Lys Thr Thr Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Glu Leu Ile Gly Arg Ile Lys Glu Glu Ser Ala Lys
210 215 220
Arg Gly Met Glu Thr Leu Ile Glu Val His Ser His Tyr Met Lys Gln
225 230 235 240
Val Glu Ile Ala Gly Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro
245 250 255
Gly Leu Leu Leu His Ala Leu Thr Thr Gly Lys Thr Gly Pro Leu Ala
260 265 270
Arg Trp Met Glu Val Arg Pro Gly Asn Ala Val Asn Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Glu Val Asp Gln Leu Val Glu
305 310 315 320
Thr Ile Lys Glu Asn Ser His Gly Glu Ser Ala Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Glu Asn Asp Met Gln Leu Leu Lys Glu Thr Asn Val Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Leu Glu Glu Ile Asp Gln Asn Leu Glu
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Cys Arg Phe Arg Asn Gly
420 425 430
Leu Glu Ala Phe Asp Gly Asp Phe Ser Phe Ala Gln Asn Gly Asp Ser
435 440 445
Leu Thr Phe Ala Trp Thr Gly Lys Glu Thr Glu Ala Thr Leu Thr Phe
450 455 460
Thr Pro Ala Gln Gly Val Gly Lys Asp Glu Ala Pro Val Cys Ser Leu
465 470 475 480
Arg Trp Lys Asp Ser Ala Gly Asp His Lys Thr Asp Asp Leu Ile Ala
485 490 495
Glu Pro Pro Ala Val Ala
500
<210> 31
<211> 1500
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自Alloscardovia的蔗糖磷酸化酶
<400> 31
atgaagaaca aagttcaact gattacctac gcggatcgtc tgggtgacgg caccctgaag 60
agcatgaccg agaccctgcg taaacacttc gagggtgttt atgaaggcgt gcacatcctg 120
ccgttcttta ccccgttcga tggtgcggac gcgggctttg atccggttga ccacaccaaa 180
gtggacccgc gtctgggtag ctgggacgat gtggcggaac tgagcaccac ccacgatatc 240
atggttgaca ccattgtgaa ccacatgagc tgggagagcg aacagttcca agatgttatg 300
gcgaagggcg aggacagcga atactatccg atgttcctga ccatgagcag catttttccg 360
gatggtgtga ccgaggaaga cctgaccgcg atctatcgtc cgcgtccggg tctgccgttc 420
acccactata actggggtgg caaaacccgt ctggtttgga ccacctttac cccgcagcaa 480
gtggacattg ataccgacag cgagatgggt tggaactacc tgctgagcat cctggatcag 540
ctgagccaaa gccacgttag ccaaattcgt ctggacgcgg tgggttatgg cgcgaaggag 600
aaaaacagca gctgcttcat gaccccgaag acctttaaac tgatcgaacg tattaaggcg 660
gagggtgaaa aacgtggcct ggagaccctg atcgaagttc acagctacta taagaaacag 720
gtggagattg cgagcaaggt ggatcgtgtt tacgactttg cgatcccggg tctgctgctg 780
catgcgctgg aatttggcaa aaccgatgcg ctggcgcaat ggattgacgt tcgtccgaac 840
aacgcggtga acgttctgga tacccacgac ggtatcggcg ttatcgatat tggtagcgat 900
cagatggacc gtagcctggc gggtctggtg ccggatgagg aagttgacgc gctggttgag 960
agcatccacc gtaacagcaa gggtgaaagc caggaagcga ccggcgcggc ggcgagcaac 1020
ctggacctgt accaagttaa ctgcacctac tatgcggcgc tgggtagcga cgatcagaaa 1080
tatattgcgg cgcgtgcggt gcagttcttt atgccgggcg tgccgcaagt ttactatgtg 1140
ggtgcgctgg cgggcagcaa cgatatggac ctgctgaagc gtaccaacgt gggtcgtgat 1200
atcaaccgtc actactatag cgcggcggaa gtggcgagcg aggtggaacg tccggtggtt 1260
caggcgctga acgcgctggg ccgtttccgt aacaccctga gcgcgttcga tggtgaattt 1320
agctacagca acgcggacgg cgttctgacc atgacctggg cggatgatgc gacccgtgcg 1380
accctgacct ttgcgccgaa ggcgaacagc aacggtgcga gcgtggcgcg tctggagtgg 1440
accgatgcgg cgggtgaaca tgcgaccgac gatctgatcg cgaacccgcc ggtggttgcg 1500
<210> 32
<211> 500
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自Alloscardovia的蔗糖磷酸化酶
<400> 32
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Leu Lys Ser Met Thr Glu Thr Leu Arg Lys His Phe Glu Gly
20 25 30
Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Val Asp His Thr Lys Val Asp Pro Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Thr Thr His Asp Ile
65 70 75 80
Met Val Asp Thr Ile Val Asn His Met Ser Trp Glu Ser Glu Gln Phe
85 90 95
Gln Asp Val Met Ala Lys Gly Glu Asp Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Ile Phe Pro Asp Gly Val Thr Glu Glu Asp Leu
115 120 125
Thr Ala Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn
130 135 140
Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Glu Met Gly Trp Asn Tyr Leu Leu Ser
165 170 175
Ile Leu Asp Gln Leu Ser Gln Ser His Val Ser Gln Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Lys Asn Ser Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Glu Arg Ile Lys Ala Glu Gly Glu Lys
210 215 220
Arg Gly Leu Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro
245 250 255
Gly Leu Leu Leu His Ala Leu Glu Phe Gly Lys Thr Asp Ala Leu Ala
260 265 270
Gln Trp Ile Asp Val Arg Pro Asn Asn Ala Val Asn Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg
290 295 300
Ser Leu Ala Gly Leu Val Pro Asp Glu Glu Val Asp Ala Leu Val Glu
305 310 315 320
Ser Ile His Arg Asn Ser Lys Gly Glu Ser Gln Glu Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ala
340 345 350
Ala Leu Gly Ser Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Ser Asn Asp Met Asp Leu Leu Lys Arg Thr Asn Val Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Ala Ala Glu Val Ala Ser Glu Val Glu
405 410 415
Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr
420 425 430
Leu Ser Ala Phe Asp Gly Glu Phe Ser Tyr Ser Asn Ala Asp Gly Val
435 440 445
Leu Thr Met Thr Trp Ala Asp Asp Ala Thr Arg Ala Thr Leu Thr Phe
450 455 460
Ala Pro Lys Ala Asn Ser Asn Gly Ala Ser Val Ala Arg Leu Glu Trp
465 470 475 480
Thr Asp Ala Ala Gly Glu His Ala Thr Asp Asp Leu Ile Ala Asn Pro
485 490 495
Pro Val Val Ala
500

Claims (12)

1.一种用于使底物糖基化以产生β-糖基化产物的方法,所述方法包括以下步骤:提供至少一种糖基基团供体、至少一种糖基基团受体和至少一种糖基转移酶;使所述糖基基团供体和所述糖基基团受体与所述糖基转移酶在使得所述糖基基团受体被糖基化以产生至少一种具有β-葡萄糖键的产物的条件下接触。
2.如权利要求1所述的方法,其中所述糖基基团供体是糖基磷酸酯。
3.如权利要求2所述的方法,其中所述糖基基团供体是葡萄糖-1-磷酸酯。
4.如权利要求1所述的方法,其中所述糖基基团受体选自糖基基团、烷氧基基团、羧基基团、氨基羰基基团、杂烷基基团、杂烯基基团、杂炔基基团、羧基烷基基团、氨基烷基基团、卤代烷基基团、烷硫基烷基基团、杂环烷基基团、杂芳基基团和杂芳基烷基基团。
5.如权利要求1所述的方法,其中具有β-葡萄糖键的所述产物是甜菊醇糖苷。
6.如权利要求1所述的方法,其中所述糖基基团受体是甜菊苷,所述糖基基团供体是α-葡萄糖-1-磷酸酯,并且具有β-葡萄糖键的所述产物是莱鲍迪苷A。
7.如权利要求1-6中任一项所述的方法,其中所述糖基转移酶选自SEQ ID NO:2、4、6、8、10、12和14中列出的多肽。
8.一种用于产生葡萄糖-1-磷酸酯的方法,所述方法包括以下步骤:提供磷酸化酶、无机磷酸和所述磷酸化酶的二糖、三糖或寡糖底物;使所述磷酸化酶、无机磷酸和糖在使得所述糖被裂解以产生单糖和葡萄糖-1-磷酸酯的条件下接触。
9.如权利要求8所述的方法,其中将如权利要求8所述的方法与如权利要求1所述的方法组合。
10.如权利要求9所述的方法,其中所述葡糖基基团受体选自糖基基团、烷氧基基团、羧基基团、氨基羰基基团、杂烷基基团、杂烯基基团、杂炔基基团、羧基烷基基团、氨基烷基基团、卤代烷基基团、烷硫基烷基基团、杂环烷基基团、杂芳基基团和杂芳基烷基基团。
11.如权利要求9所述的方法,其中所述磷酸化酶是蔗糖磷酸化酶,所述糖是蔗糖,产生的所述单糖是蔗糖,并且产生的所述葡萄糖-1-磷酸酯是α-葡萄糖-1-磷酸酯。
12.如权利要求8-11所述的方法,其中所述磷酸化酶包含选自SEQ IDNO:16、18、20、22、24、26、28、30和32的多肽序列。
CN201780050203.3A 2016-06-15 2017-06-09 甜菊醇糖苷类和其他化合物用葡萄糖-1-磷酸酯的酶促糖基化 Pending CN109563493A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662350450P 2016-06-15 2016-06-15
US62/350,450 2016-06-15
PCT/US2017/036701 WO2017218324A1 (en) 2016-06-15 2017-06-09 Enzymatic glycosylation of steviol glycosides and other compounds with glucose-1-phosphate

Publications (1)

Publication Number Publication Date
CN109563493A true CN109563493A (zh) 2019-04-02

Family

ID=60664213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780050203.3A Pending CN109563493A (zh) 2016-06-15 2017-06-09 甜菊醇糖苷类和其他化合物用葡萄糖-1-磷酸酯的酶促糖基化

Country Status (14)

Country Link
US (1) US20190127772A1 (zh)
EP (1) EP3472308A4 (zh)
JP (1) JP2019517807A (zh)
KR (1) KR20190017045A (zh)
CN (1) CN109563493A (zh)
AU (1) AU2017284103B2 (zh)
BR (1) BR112018075816A2 (zh)
CA (1) CA3027180A1 (zh)
EA (1) EA201990034A1 (zh)
IL (1) IL263596A (zh)
MX (1) MX2018015517A (zh)
PH (1) PH12018502655A1 (zh)
SG (1) SG11201810864QA (zh)
WO (1) WO2017218324A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114072165A (zh) * 2019-07-02 2022-02-18 科德克希思公司 工程化蔗糖磷酸化酶变体酶
CN114231509A (zh) * 2021-12-31 2022-03-25 南京诺云生物科技有限公司 一种蔗糖磷酸化酶及葡萄糖基甘油生产工艺
CN114317476A (zh) * 2021-12-30 2022-04-12 南京诺云生物科技有限公司 葡萄糖基甘油的生物催化生产工艺及其蔗糖磷酸化酶
CN114317477A (zh) * 2021-12-30 2022-04-12 南京诺云生物科技有限公司 一种蔗糖磷酸化酶及葡萄糖-1-磷酸生产工艺
CN116096248A (zh) * 2020-11-25 2023-05-09 Cj第一制糖株式会社 包含葡萄糖基化的甜叶菊的具有改进的甜度质量的组合物

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020028039A1 (en) * 2018-07-30 2020-02-06 Codexis, Inc. Engineered glycosyltransferases and steviol glycoside glucosylation methods
CN114350737B (zh) * 2022-01-14 2023-09-15 台州仙琚药业有限公司 5α,6α-环氧-11β,17α-二羟基孕甾-3,20-二乙二醇缩酮的制备方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176738A1 (en) * 2012-05-22 2013-11-28 Purecircle Sdn Bhd High-purity steviol glycosides

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2815023B2 (ja) * 1989-10-17 1998-10-27 農林水産省食品総合研究所長 セロビオースの製造方法
US8093028B2 (en) * 2007-07-24 2012-01-10 Wisconsin Alumni Research Foundation Engineered glycosyltransferases with expanded substrate specificity
US20130004979A1 (en) * 2010-06-11 2013-01-03 Wisconsin Alumni Research Foundation Glycosyltransferase reversibility for sugar nucleotide synthesis and microscale scanning
JP6033632B2 (ja) * 2012-10-15 2016-11-30 国立大学法人 新潟大学 セロビオン酸ホスホリラーゼを用いた酸性βグルコシル二糖の製造方法
AU2014213918B2 (en) * 2013-02-11 2017-11-09 Danstar Ferment Ag Efficient production of steviol glycosides in recombinant hosts
KR101404728B1 (ko) * 2013-02-28 2014-06-09 씨제이제일제당 (주) 스테비오사이드로부터 리바우디오사이드 a를 제조하는 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176738A1 (en) * 2012-05-22 2013-11-28 Purecircle Sdn Bhd High-purity steviol glycosides

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JAMES B. THODEN AND HAZEL M. HOLDEN: "The molecular architecture of glucose-1-phosphate uridylyltransferase", 《PROTEIN SCIENCE》 *
JIN-HA LEE ET AL.: "Molecular cloning of a gene encoding the sucrose phosphorylase from Leuconostoc mesenteroides B-1149 and the expression in Escherichia coli", 《ENZYME AND MICROBIAL TECHNOLOGY》 *
KATHRYN M. KOELLER AND CHI-HUEY WONG: "Synthesis of Complex Carbohydrates and Glycoconjugates: Enzyme-Based and Programmable One-Pot Strategies", 《CHEMICAL REVIEWS》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114072165A (zh) * 2019-07-02 2022-02-18 科德克希思公司 工程化蔗糖磷酸化酶变体酶
CN116096248A (zh) * 2020-11-25 2023-05-09 Cj第一制糖株式会社 包含葡萄糖基化的甜叶菊的具有改进的甜度质量的组合物
CN114317476A (zh) * 2021-12-30 2022-04-12 南京诺云生物科技有限公司 葡萄糖基甘油的生物催化生产工艺及其蔗糖磷酸化酶
CN114317477A (zh) * 2021-12-30 2022-04-12 南京诺云生物科技有限公司 一种蔗糖磷酸化酶及葡萄糖-1-磷酸生产工艺
CN114317477B (zh) * 2021-12-30 2023-07-14 南京诺云生物科技有限公司 一种蔗糖磷酸化酶及葡萄糖-1-磷酸生产工艺
CN114317476B (zh) * 2021-12-30 2023-07-14 南京诺云生物科技有限公司 葡萄糖基甘油的生物催化生产工艺及其蔗糖磷酸化酶
CN114231509A (zh) * 2021-12-31 2022-03-25 南京诺云生物科技有限公司 一种蔗糖磷酸化酶及葡萄糖基甘油生产工艺
CN114231509B (zh) * 2021-12-31 2023-07-25 南京诺云生物科技有限公司 一种蔗糖磷酸化酶及葡萄糖基甘油生产工艺

Also Published As

Publication number Publication date
US20190127772A1 (en) 2019-05-02
SG11201810864QA (en) 2019-01-30
PH12018502655A1 (en) 2019-10-07
BR112018075816A2 (pt) 2019-04-02
CA3027180A1 (en) 2017-12-21
EA201990034A1 (ru) 2019-06-28
EP3472308A4 (en) 2020-07-29
EP3472308A1 (en) 2019-04-24
WO2017218324A1 (en) 2017-12-21
JP2019517807A (ja) 2019-06-27
KR20190017045A (ko) 2019-02-19
MX2018015517A (es) 2019-03-18
AU2017284103B2 (en) 2019-07-11
AU2017284103A1 (en) 2018-12-13
IL263596A (en) 2019-02-03

Similar Documents

Publication Publication Date Title
CN109563493A (zh) 甜菊醇糖苷类和其他化合物用葡萄糖-1-磷酸酯的酶促糖基化
CN104428313B (zh) 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法
US11845968B2 (en) Engineered deoxyribose-phosphate aldolases
CA3103718A1 (en) Engineered purine nucleoside phosphorylase variant enzymes
CN106232619A (zh) 工程化的亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CN107002050A (zh) 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CN109715817A (zh) 用于化合物的羟基化的生物催化剂和方法
CN109863162A (zh) 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CN109715182A (zh) 工程化β-葡糖苷酶和葡糖基化方法
CN115175997A (zh) 用于化学化合物的羟基化的生物催化剂和方法
US11913037B2 (en) Engineered adenylate kinase variant enzymes
US20230183663A1 (en) Engineered terminal deoxynucleotidyl transferase variants
US20240209408A1 (en) Engineered 3-o-kinase variants and methods of use
CN117157397A (zh) 工程化环状GMP-AMP合酶(cGAS)变体酶
CN117120599A (zh) 工程化鸟苷酸激酶变体酶
CN117222735A (zh) 工程化乙酸激酶变体酶
CN117813376A (zh) 工程化核苷脱氧核糖基转移酶变体酶
CN116710558A (zh) 工程化磷酸戊糖变位酶变体酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190402