CN113646427A - 工程化芳基硫酸酯依赖性酶 - Google Patents
工程化芳基硫酸酯依赖性酶 Download PDFInfo
- Publication number
- CN113646427A CN113646427A CN202080021311.XA CN202080021311A CN113646427A CN 113646427 A CN113646427 A CN 113646427A CN 202080021311 A CN202080021311 A CN 202080021311A CN 113646427 A CN113646427 A CN 113646427A
- Authority
- CN
- China
- Prior art keywords
- seq
- sulfotransferase
- amino acid
- glucosamine
- acid sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/13—Transferases (2.) transferring sulfur containing groups (2.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/04—Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/64—Preparation of S-glycosides, e.g. lincomycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y208/00—Transferases transferring sulfur-containing groups (2.8)
- C12Y208/02—Sulfotransferases (2.8.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y208/00—Transferases transferring sulfur-containing groups (2.8)
- C12Y208/02—Sulfotransferases (2.8.2)
- C12Y208/02008—[Heparan sulfate]-glucosamine N-sulfotransferase (2.8.2.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y208/00—Transferases transferring sulfur-containing groups (2.8)
- C12Y208/02—Sulfotransferases (2.8.2)
- C12Y208/02023—[Heparan sulfate]-glucosamine 3-sulfotransferase 1 (2.8.2.23)
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明提供几种非天然存在的磺基转移酶,它们设计成与作为磺基供体的芳基硫酸酯化合物而不是天然底物3′‑磷酸腺苷5′‑磷酸硫酸酯,以及与作为磺基受体的基于肝素前体的多糖、特别是硫酸乙酰肝素反应。每种工程化磺基转移酶都具有生物活性,其特征在于基于肝素前体的多糖中接受磺基的位置,包括氨基葡萄糖N‑磺基转移酶活性、己糖醛酸2‑O磺基转移酶活性、氨基葡萄糖6‑O磺基转移酶活性或氨基葡萄糖3‑O磺基转移酶活性。还提供使用工程化磺基转移酶来生产基于硫酸化肝素前体的多糖、包括具有抗凝活性的多糖的方法。
Description
技术领域
本发明涉及非天然的磺基转移酶,其设计为与作为磺基供体的芳基硫酸酯化合物3′-磷酸腺苷5′-磷酸硫酸酯反应。
序列表参考
本申请与电子格式的序列表一起提交。序列表以名称为“OPT-001X PCT_Sequence_Listing.txt”的文件形式提供,该文件创建于2019年12月30日,大小为390921字节。序列表的电子格式信息通过引用整体并入。
背景技术
磺基转移酶是催化磺基从磺基供体转移到磺基受体的一类重要的酶。磺基转移酶在自然界中几乎无处不在,它们存在于几乎所有类型的生物体中,包括细菌、酵母和动物,包括人类。类似地,磺基转移酶在多种磺基受体(包括多种类固醇、多糖、蛋白质、异生素和其他分子)的硫酸化中发挥着不可或缺的作用。
有几种多糖可用作磺基受体,包括例如皮肤素、角质素、肝素前体和软骨素。特别地,肝素前体包含1→4个糖苷连接的重复二糖单元、葡萄糖醛酸和N-乙酰化葡萄糖胺([β(1,4)GlcA-α(1,4)GlcNAc]n)残基,其中任何一个都可进一步被一个或多于一个酶催化的脱乙酰化、硫酸化或差向异构化反应修饰。基于肝素前体的多糖的硫酸化可通过至多四种磺基转移酶进行催化,并且当以特定顺序与一个或多于一个葡萄糖胺残基的脱乙酰化和一个或多于一个葡萄糖醛酸残基的差向异构化一起进行时,可用于形成具有抗凝活性的硫酸乙酰肝素(HS)多糖。
然而,尽管磺基受体范围广泛并且数量庞大,但只有少数分子可被磺基转移酶用作磺基供体。包括用于四种HS磺基转移酶中每一种的几乎无处不在的磺基供体,都是3′-磷酸腺苷5′-磷酸硫酸酯。这些体内系统已经进化到专门利用3′-磷酸腺苷5′-磷酸硫酸酯,因为它的半衰期短并且可容易地根据需要通过生物体合成和代谢。然而,同样短的半衰期使3′-磷酸腺苷5′-磷酸硫酸酯不适用于大多数体外合成,特别是在利用磺基转移酶的大规模合成中,因为它可容易地分解成腺苷3′,5′-二磷酸酯,其可积极抑制磺基转移酶的生物活性。因此,磺基转移酶专门利用3′-磷酸腺苷5′-磷酸硫酸酯作为磺基供体的天然活性,为体外化学酶促合成抗凝多糖造成很大的障碍。
芳基硫酸酯化合物,例如对硝基苯硫酸酯(PNS)和4-甲基伞形酮硫酸酯(MUS)被认为是便宜、广泛可用的化合物,其可以作为磺基供体与数量非常有限的磺基转移酶来合成某些小分子产品(参见Malojcic,G.等人,(2008)Proc.Nat.Acad.Sci.105(49):19217-19222和Kaysser,L.等人,(2010)J.Biol.Chem.285(17):12684-12694,其公开内容通过引用整体并入)。然而,只有少数细菌磺基转移酶显示与作为磺基供体的芳基硫酸酯化合物反应,并且这些酶都不与多糖反应,更不用说作为磺基受体的基于肝素前体的多糖了。因此,当磺基转移酶用于体外合成硫酸化多糖时,反应混合物中必须包括3′-磷酸腺苷5′-磷酸硫酸酯以有效催化磺基转移,并且芳基硫酸酯化合物仅可间接用于用3′-磷酸腺苷5′-磷酸硫酸酯重新填充系统(参见美国专利第6255088号,其公开内容通过引用整体并入)。
因此,需要开发与作为磺基供体的芳基硫酸酯化合物以及作为磺基受体的多糖反应的磺基转移酶。特别地,开发既能够与作为磺基供体的芳基硫酸酯化合物反应又能够与作为磺基受体的基于肝素前体的多糖反应的磺基转移酶,将使体外大规模合成抗凝多糖的发展迈出一大步。
发明内容
本发明提供几种工程化的具有生物活性的酶,其能够识别、结合作为底物的芳基硫酸酯化合物并能与其反应。根据本发明,工程化酶可具有硫酸酯酶活性。根据本发明,工程化酶可具有磺基转移酶活性。
根据本发明,具有硫酸酯酶和/或磺基转移酶活性的工程化酶可与选自如下的芳基硫酸酯化合物反应:对硝基苯硫酸酯(PNS)、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2-萘基硫酸酯(2NapS)和4-硝基儿茶酚硫酸酯(NCS)。根据本发明,工程化磺基转移酶可识别、结合作为磺基供体的PNS并能与其反应。根据本发明,工程化磺基转移酶可识别、结合作为磺基供体的NCS并能与其反应。根据本发明,工程化磺基转移酶可识别、结合作为磺基供体的PNS或NCS并能与其反应。
在本发明的一个方面,本发明的工程化酶可具有硫酸酯酶生物活性。根据本发明,硫酸酯酶活性包括芳基硫酸酯化合物内的硫原子的亲核攻击,导致硫酸酯基水解并且从活性位点释放芳香族部分。根据本发明,硫原子的亲核攻击可由工程化酶活性位点内的氨基酸残基、特别是组氨酸残基引发。根据本发明,与芳基硫酸酯化合物的反应可产生磺基组氨酸中间体,其中硫酸酯基与氨基酸亲核基、特别是组氨酸残基共价结合。
根据本发明,本发明具有硫酸酯酶活性的工程化酶不同于其他已知硫酸酯酶,其通常包含大于500个氨基酸残基,翻译后修饰以变为α-甲酰甘氨酸的至少一个半胱氨酸或丝氨酸残基,和一个或多于一个特征指纹序列C/S-X-P-S/X-R-X-X-X-L/X-T/X-G/X-R/X或G-Y/V-X-S/T-X-X-X-G-K-X-X-H,其指导半胱氨酸或丝氨酸翻译后修饰成α-甲酰甘氨酸。因此,根据本发明,具有硫酸酯酶活性的工程化酶可包含小于500个氨基酸残基。根据本发明,具有硫酸酯酶活性的工程化酶可具有零个α-甲酰甘氨酸残基。根据本发明,具有硫酸酯酶活性的工程化酶可不具有包含如下的氨基酸序列基序:C/S-X-P-S/X-R-X-X-X-L/X-T/X-G/X-R/X或G-Y/V-X-S/T-X-X-X-G-K-X-X-H。
根据本发明,具有硫酸酯酶活性的本发明的工程化酶可包含任何氨基酸序列,只要芳基硫酸酯化合物的亲核攻击由活性位点氨基酸残基、优选组氨酸残基引发即可。根据本发明,具有硫酸酯酶活性的工程化酶可具有选自如下的氨基酸序列:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ IDNO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ ID NO:149,和SEQ ID NO:151。
根据本发明,具有硫酸酯酶活性的工程化酶可具有选自如下的氨基酸序列:
SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:66,SEQ ID NO:68,SEQID NO:69,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,和SEQ ID NO:160。
根据本发明,具有硫酸酯酶活性的工程化酶可包含与上述任何氨基酸序列生物等效的任何氨基酸序列。
在本发明的另一方面,本发明的工程化酶可具有磺基转移酶生物活性。根据本发明,磺基转移酶活性包括将磺基从芳基硫酸酯化合物酶促转移至磺基受体。根据本发明,磺基受体可以是多糖。根据本发明,磺基受体多糖可以是基于肝素前体的多糖。根据本发明,基于肝素前体的多糖可以是N-脱乙酰肝素前体。根据本发明,基于肝素前体的多糖可以是N-硫酸化肝素前体。根据本发明,基于肝素前体的多糖可以是N-硫酸化、2-O硫酸化硫酸乙酰肝素(N,2O-HS)。根据本发明,基于肝素前体的多糖可以是N-硫酸化、2-O硫酸化、6-O硫酸化硫酸乙酰肝素(N,2O,6O-HS)。根据本发明,基于肝素前体的多糖可以是N-硫酸化、2-O硫酸化、3-O硫酸化、6-O硫酸化硫酸乙酰肝素(N,2O,3O,6O-HS)。根据本发明,基于肝素前体的多糖可在任何包含基于肝素前体的多糖的二糖单元内的任何N-、2-O、3-O和/或6-O位置进行硫酸化。根据本发明,基于肝素前体的多糖可包含一个或多于一个艾杜糖醛酸残基,其替代葡萄糖醛酸残基。根据本发明,一个或多于一个艾杜糖醛酸残基可被2-O硫酸化。
根据本发明,由工程化磺基转移酶催化的磺基转移反应可通过以下反应机制进行,其中在酶与芳基硫酸酯化合物反应时,首先形成磺基组氨酸中间体,随后在活性位点内结合基于肝素前体的多糖,随后将磺基从磺基组氨酸中间体转移至多糖。或者,根据本发明,由工程化磺基转移酶催化的磺基转移反应可通过以下反应机制进行,其中芳基硫酸酯化合物和基于肝素前体的多糖均在活性位点内结合,并且酶催化磺基从芳基硫酸酯化合物直接转移至多糖。
根据本发明,工程化磺基转移酶可具有特征在于在基于肝素前体的多糖内接受磺基的位置的生物活性,包括氨基葡萄糖N-磺基转移酶活性、己糖醛酸2-O磺基转移酶活性、氨基葡萄糖6-O磺基转移酶活性或氨基葡萄糖3-O磺基转移酶活性。每种磺基转移酶生物活性在下文中进一步详述。
在本发明的一个方面,工程化磺基转移酶可具有氨基葡萄糖N-磺基转移酶活性,包括磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖内未经取代的氨基葡萄糖残基的N-位置。根据本发明,工程化氨基葡萄糖N-磺基转移酶可包含任何氨基酸序列,只要磺基供体是芳基硫酸酯化合物并且磺基受体是基于肝素前体的多糖即可。
根据本发明,工程化氨基葡萄糖N-磺基转移酶可以是具有HS葡糖胺N-磺基转移酶活性的天然磺基转移酶的突变体,其为酶类(EC)2.8.2.8的成员。与本发明的工程化氨基葡萄糖N-磺基转移酶相反的是,EC 2.8.2.8内的天然酶不与芳基硫酸酯化合物反应,而仅与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应。然而,工程化氨基葡萄糖N-磺基转移酶可保留与作为磺基受体的基于肝素前体的多糖结合的与EC 2.8.2.8内天然酶相同的生物活性。根据本发明,可用作与任何工程化氨基葡萄糖N-磺基转移酶结合的磺基受体的基于肝素前体的多糖可包含一个或多于一个具有下式II的结构的二糖单元:
其中n是整数并且R选自氢原子或磺基。根据本发明,二糖单元内的两个R基团都可以是氢原子。根据本发明,同一多糖分子内的所有R基团都可以是氢原子。当磺基受体多糖包含式II的结构时,在磺基从芳基硫酸酯化合物转移后,硫酸化多糖产物包含下式III的结构:
其中n是整数并且R选自氢原子或磺基。
根据本发明,虽然接受磺基的氨基葡萄糖残基是N-未经取代的,如上式II和式III所示,但同一多糖分子内的其他氨基葡萄糖残基可以是N-乙酰化、N-硫酸化、或N-未经取代、3-O硫酸化和/或6-O硫酸化的。类似地,在多糖内与接受磺基的氨基葡萄糖残基不相邻的其他位置的己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸残基,其中任何一个可以任选地被2-O硫酸化。根据本发明,并且在一些优选实施方案中,基于肝素前体的多糖可以是N-脱乙酰肝素前体,其中所有的氨基葡萄糖残基都是N-未经取代的,或以N-乙酰氨基葡萄糖和N-未经取代的氨基葡萄糖的混合物形式存在。
根据本发明,工程化氨基葡萄糖N-磺基转移酶可以由单个N-基转移酶结构域组成,该结构域能够结合作为磺基供体的芳基硫酸酯化合物并且与其反应。然而,EC 2.8.2.8内的大多数天然酶具有双重N-脱乙酰酶/N-磺基转移酶活性,其中一个结构域结构上配置为N-脱乙酰酶活性并且另一个结构域结构上配置为N-磺基转移酶活性。因此,根据本发明,工程化氨基葡萄糖N-磺基转移酶还可包含N-脱乙酰酶结构域,其具有与任何EC 2.8.2.8酶的N-脱乙酰酶结构域相同或突变的氨基酸序列。
为了促进其与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯的排他性反应性,EC2.8.2.8天然酶通常包含高度保守或相同的氨基酸序列,这些氨基酸序列定义活性位点并且控制酶的识别,从而与3′-磷酸腺苷5′-磷酸硫酸酯结合并且与其反应。根据本发明,工程化氨基葡萄糖N-磺基转移酶的氨基酸序列可包含一种或多于一种相对于EC 2.8.2.8天然酶的突变,以便促进与芳基硫酸酯化合物而不是3′-磷酸腺苷5′-磷酸硫酸酯的结合。根据本发明,工程化氨基葡萄糖N-磺基转移酶可包含的氨基酸序列具有相对于EC 2.8.2.8内天然酶的N-磺基转移酶结构域的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、二十、三十、四十、五十、至至少一百个氨基酸突变。根据本发明,工程化氨基葡萄糖N-磺基转移酶可在已知定义酶的活性位点的区域中包含相对于EC2.8.2.8内任何天然酶的氨基酸序列的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四或十五个氨基酸突变,至至少二十个氨基酸突变。
根据本发明,工程化氨基葡萄糖N-磺基转移酶的氨基酸序列可表示为相对于EC2.8.2.8内一种或多于一种天然酶的氨基酸序列,特别是相对于EC 2.8.2.8内一种或多于一种天然酶的N-磺基转移酶结构域,包括其生物功能片段的“同一性百分比”或“同一性%”。根据本发明,工程化氨基葡萄糖N-磺基转移酶可与EC 2.8.2.8内任何酶的N-磺基转移酶结构域具有至少50%的序列同一性,和至至少97%的序列同一性。根据本发明,这种工程化氨基葡萄糖N-磺基转移酶也可具有与EC 2.8.2.8内的任何酶相同的或包含相对于EC2.8.2.8内的任何酶的一个或多于一个氨基酸突变的N-脱乙酰酶结构域。
根据本发明,工程化氨基葡萄糖N-磺基转移酶可包含相对于EC 2.8.2.8内一种或多于一种天然酶中发现的保守氨基酸序列基序的一个或多于一个突变的氨基酸序列基序。每个突变的氨基酸序列基序,当存在时,可具有相对于EC 2.8.2.8内天然酶的相应保守氨基酸序列基序的至少一个氨基酸突变。根据本发明,工程化氨基葡萄糖N-磺基转移酶可包含相对于以下保守的氨基葡萄糖N-磺基转移酶氨基酸序列基序的一、二、三、四或五个突变的氨基酸序列基序:(Q-K-T-G-T-T-A-L-Y-L)、(T-F-E-E)、(F-E-K-S-A)、(S-W-Y-Q-H)和(C-L-G-K/R-S-K-G-R)。突变的氨基酸序列基序的非限制性实例在下文中进一步详述。
根据本发明,工程化氨基葡萄糖N-磺基转移酶可包含选自如下的氨基酸序列:SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24和SEQ ID NO:25,每个都包含相对于高度保守氨基酸序列产生的几个氨基酸突变,这些氨基酸序列定义EC 2.8.2.8内天然酶的N-磺基转移酶结构域。根据本发明,根据本文所述任何方法使用的工程化氨基葡萄糖N-磺基转移酶还可包含选自SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQID NO:25的氨基酸序列的生物等价物和/或功能片段的任何氨基酸序列。
根据本发明,与选自SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25的氨基酸序列所公开的氨基酸序列相比,上述任何工程化氨基葡萄糖N-磺基转移酶可具有一个或多于一个残基差异或突变。这种残基差异残基差异的非限制性实例包括氨基酸插入、缺失、置换或这些变化的任何组合。根据本发明,与选自SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25的氨基酸序列中所公开的氨基酸序列的差异可包含非保守置换、保守置换以及保守和非保守氨基酸置换的组合。根据本发明,氨基酸突变可在SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQID NO:23、SEQ ID NO:24和SEQ ID NO:25内的任何位置处产生,只要突变的酶保留其与作为磺基供体的芳基硫酸酯化合物和作为磺基受体、包含式II结构的基于肝素前体的多糖结合的氨基葡萄糖N-磺基转移酶活性即可。
根据本发明,工程化氨基葡萄糖N-磺基转移酶可包含SEQ ID NO:18的氨基酸序列。在SEQ ID NO:18内,具有名称“Xaa”的残基说明其中在SEQ ID NO:5、SEQ ID NO:7和SEQID NO:15的氨基酸序列内的特定位置缺乏同一性的已知情况。因此,“Xaa”名称表示在此位置的氨基酸可选自两种或多于两种氨基酸,如SEQ ID NO:18所定义的。
根据本发明,工程化氨基葡萄糖N-磺基转移酶可包含SEQ ID NO:19的氨基酸序列。在SEQ ID NO:19内,具有名称“Xaa”的残基说明其中在SEQ ID NO:9、SEQ ID NO:11和SEQ ID NO:13的氨基酸序列内的特定位置缺乏同一性的已知情况。因此,“Xaa”名称表示在此位置的氨基酸可选自两种或多于两种氨基酸,如SEQ ID NO:19所定义的。
另外,根据本发明,氨基酸突变可在SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25内的一个或多于一个位置处产生,只要突变的酶保留其与作为磺基供体的芳基硫酸酯化合物结合的氨基葡萄糖N-磺基转移酶活性即可。根据本发明,包含SEQ ID NO:18或SEQ ID NO:19的氨基酸序列的芳基硫酸酯依赖性酶可任选地在未指定为“Xaa”的位置处包含一个或多于一个氨基酸突变,同时仍保留其与作为磺基供体的芳基硫酸酯化合物结合的氨基葡萄糖N-磺基转移酶活性。
在本发明的一个方面,工程化磺基转移酶可具有己糖醛酸2-O磺基转移酶活性,包括磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖内的己糖醛酸残基的2-O位置。根据本发明,工程化己糖醛酸2-O磺基转移酶可包含任何氨基酸序列,只要磺基供体是芳基硫酸酯化合物并且磺基受体是基于肝素前体的多糖即可。
根据本发明,工程化己糖醛酸2-O磺基转移酶可以是具有HS己糖醛酸2-O磺基转移酶活性的天然磺基转移酶的突变体,其为酶类(EC)2.8.2.-的成员。与本发明的工程化己糖醛酸2-O磺基转移酶相反的是,EC 2.8.2.-内的天然己糖醛酸2-O磺基转移酶不与芳基硫酸酯化合物反应,而仅与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应。然而,工程化己糖醛酸2-O磺基转移酶可与保留与作为磺基受体的基于肝素前体的多糖结合的与EC 2.8.2.-内的天然己糖醛酸2-O磺基转移酶相同的生物活性。根据本发明,可用作与任何工程化己糖醛酸2-O磺基转移酶结合的磺基受体的基于肝素前体的多糖可包含一个或多于一个具有下式IV结构的结构基序:
如式IV所示,己糖醛酸残基是葡萄糖醛酸。根据本发明,并且在另一个非限制性实例中,当己糖醛酸残基是艾杜糖醛酸时,基于肝素前体的多糖包含下式V的结构:
根据本发明,当基于肝素前体的多糖包含式IV的结构时,2-O硫酸化多糖产物包含下式VI的结构:
根据本发明,当基于肝素前体的多糖包含式V的结构时,2-O硫酸化多糖产物包含下式VII的结构:
根据本发明,包含式IV或式V结构的基于肝素前体的多糖可以是N-硫酸化肝素前体。根据本发明,工程化己糖醛酸2-O磺基转移酶的磺基受体可包含含有式IV和/或式V的结构的多个基序,其任何一个或全部都可以通过酶进行硫酸化。根据本发明,并且如上式IV和式V所示,与接受磺基的己糖醛酸残基相邻的氨基葡萄糖残基都进行N-硫酸化。根据本发明,工程化己糖醛酸2-O磺基转移酶的磺基受体可以是上述工程化氨基葡萄糖N-磺基转移酶的硫酸化多糖产物。根据本发明,通过工程化己糖醛酸2-O磺基转移酶形成并且包含式VI和/或式VII的结构的硫酸化多糖产物是N,2O-HS产物。
根据本发明,多糖内不与接受磺基的己糖醛酸残基相邻的氨基葡萄糖残基可任选地是N-、3-O和/或6-O硫酸化的,N-乙酰化的或N-未经取代的。类似地,在多糖内不与接受磺基的氨基葡萄糖残基相邻的其他位置中的己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸残基,其任一种可任选地被2-O硫酸化。
根据本发明,包含式IV和/或式V结构的多糖可与葡糖醛酸C5-差向异构酶反应以可逆地转化C5-碳的立体化学以从葡萄糖醛酸形成艾杜糖醛酸,反之亦然。然而,一旦己糖醛酸残基已进行2-O硫酸化,其不能再与葡糖醛酸C5-差向异构酶反应。在一些优选的实施方案中,在与己糖醛酸2-O磺基转移酶反应之前,葡糖醛酸C5-差向异构酶可用于反转包含式III结构的N-硫酸化肝素前体多糖中己糖醛酸残基的立体化学,并且形成包含式V结构的结构基序。根据本发明,葡糖醛酸C5-差向异构酶可包含SEQ ID NO:67的氨基酸序列,优选SEQ ID NO:67的残基34-617。根据本发明,在与工程化己糖醛酸2-O磺基转移酶反应之前,葡糖醛酸C5-差向异构酶可用于催化N-硫酸化肝素前体内的一个或多于一个葡萄糖醛酸残基转化至艾杜糖醛酸残基。
为了促进其与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯的排他性反应性,EC2.8.2.-内的天然己糖醛酸2-O磺基转移酶通常包含高度保守或相同的氨基酸序列,其定义活性位点并且控制酶的识别、结合3′-磷酸腺苷5′-磷酸硫酸酯和与其的反应性。根据本发明,工程化己糖醛酸2-O磺基转移酶的氨基酸序列可包含相对于EC 2.8.2.-内一种或多于一种天然己糖醛酸2-O磺基转移酶的一个或多于一个突变,以便促进与芳基硫酸酯化合物而不是3′-磷酸腺苷5′-磷酸硫酸酯的结合。根据本发明,工程化己糖醛酸2-O磺基转移酶可包含的氨基酸序列具有相对于EC 2.8.2.-内任何天然己糖醛酸2-O磺基转移酶的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、二十、三十、四十、五十、至至少一百个氨基酸突变。根据本发明,工程化己糖醛酸2-O磺基转移酶可在已知定义酶活性位点的区域中包含相对于EC 2.8.2.-内任何天然己糖醛酸2-O磺基转移酶的氨基酸序列的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四或十五个氨基酸突变,至至少二十个氨基酸突变。
根据本发明,工程化己糖醛酸2-O磺基转移酶的氨基酸序列可表示为相对于EC2.8.2.-内一种或多于一种天然己糖醛酸2-O磺基转移酶的氨基酸序列,包括其生物功能片段的“同一性百分比”或“同一性%”。根据本发明,工程化己糖醛酸2-O磺基转移酶可具有EC2.8.2.-内的任何己糖醛酸2-O磺基转移酶的至少50%的序列同一性,并且至至少97%的序列同一性。
根据本发明,工程化己糖醛酸2-O磺基转移酶可包含相对于EC 2.8.2.-内一种或多于一种天然己糖醛酸2-O磺基转移酶中发现的保守氨基酸序列基序的一个或多于一个突变的氨基酸序列基序。每个突变的氨基酸序列基序,当存在时,可具有相对于EC 2.8.2.-内天然己糖醛酸2-O磺基转移酶内相应保守氨基酸序列基序的至少一个氨基酸突变。根据本发明,工程化己糖醛酸2-O磺基转移酶可包含相对于以下保守己糖醛酸2-O磺基转移酶氨基酸序列基序的一、二、三、四、五或六个突变的氨基酸序列基序:(R-V-P-K-T-A/G-S-T)、(N-T-S/T-K-N)、(Y-H-G-H)、(F-L-R-F/H-G-D-D/N-F/Y)、(R-R-K/R-Q-G)和(S-H-L-R-K/R-T)。突变的氨基酸序列基序的非限制性实例在下文中进一步详述。
根据本发明,工程化己糖醛酸2-O磺基转移酶可包含选自如下的氨基酸序列:SEQID NO:63、SEQ ID NO:65、SEQ ID NO:68和SEQ ID NO:69,其各自包含相对于定义EC2.8.2.-内天然己糖醛酸2-O磺基转移酶的高度保守氨基酸序列产生的几个氨基酸突变。根据本发明,根据本文所述任何方法使用的工程化己糖醛酸2-O磺基转移酶还可包含选自SEQID NO:63、SEQ ID NO:65、SEQ ID NO:68和SEQ ID NO:69的氨基酸序列的生物等价物和/或功能片段的任何氨基酸序列。
根据本发明,与选自SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:68和SEQ ID NO:69的氨基酸序列所公开的氨基酸序列相比,上述任何工程化己糖醛酸2-O磺基转移酶可具有一个或多于一个残基差异或突变。这种残基差异的非限制性实例包括氨基酸插入、缺失、置换或这种变化的任何组合。根据本发明,与选自SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:68和SEQ ID NO:69的氨基酸序列中所公开的氨基酸序列的差异,可包含非保守置换、保守置换以及保守和非保守氨基酸置换的组合。根据本发明,氨基酸突变可在SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:68或SEQ ID NO:69内的任何位置处产生,只要突变的酶保留其与作为磺基供体的芳基硫酸酯化合物和作为磺基受体、包含式IV和/或式V的结构的基于肝素前体的多糖结合的己糖醛酸2-O磺基转移酶活性即可。
在本发明的一个方面,工程化磺基转移酶可具有氨基葡萄糖6-O磺基转移酶活性,包括磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖内氨基葡萄糖残基的6-O位置。根据本发明,工程化氨基葡萄糖6-O磺基转移酶可包含任何氨基酸序列,只要磺基供体是芳基硫酸酯化合物并且磺基受体是基于肝素前体的多糖即可。
根据本发明,工程化氨基葡萄糖6-O磺基转移酶可以是具有氨基葡萄糖6-O磺基转移酶活性的天然磺基转移酶的突变体,其为EC 2.8.2.-的成员。与本发明的工程化氨基葡萄糖6-O磺基转移酶相反的是,EC 2.8.2.-内的天然氨基葡萄糖6-O磺基转移酶不与芳基硫酸酯化合物反应,而仅与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应。然而,工程化氨基葡萄糖6-O磺基转移酶可保留与EC 2.8.2.-内天然氨基葡萄糖6-O磺基转移酶相同的生物活性,与作为磺基受体的基于肝素前体的多糖结合。
根据本发明,在与酶反应之前,在6-O位置接受磺基的氨基葡萄糖残基可以是N-硫酸化、N-未经取代和/或3-O硫酸化的。根据本发明,磺基受体多糖内任何其他氨基葡萄糖残基可任选地是N-、3-O和/或6-O硫酸化的,N-乙酰化的或N-未经取代的。根据本发明,基于肝素前体的多糖内的任何己糖醛酸残基,包括与接受磺基的氨基葡萄糖残基相邻的己糖醛酸残基,可任选地是艾杜糖醛酸或葡萄糖醛酸,并且在与氨基葡萄糖6-O磺基转移酶反应之前,可任选地进行2-O硫酸化。
可用作与任何工程化氨基葡萄糖6-O磺基转移酶结合的磺基受体的基于肝素前体的多糖的一个非限制性实例是包含一个或多于一个结构基序的基于肝素前体的多糖,所述结构基序具有下式VIII的结构:
其中X包括上式VIII中描述的任何己糖醛酸残基。当磺基受体多糖包含式VIII的结构时,在从芳基硫酸酯化合物转移磺基后,硫酸化多糖产物包含下式IX的结构:
其中X包括上式IX中描述的任何己糖醛酸残基。
根据本发明,工程化氨基葡萄糖6-O磺基转移酶的磺基受体可包含多个包含式VIII的结构的结构基序,其任何一个或所有都可通过工程化氨基葡萄糖6-O磺基转移酶进行硫酸化。根据本发明,磺基受体可以是N-脱乙酰肝素前体。根据本发明,磺基受体可以是N-硫酸化肝素前体。根据本发明,工程化氨基葡萄糖6-O磺基转移酶的磺基受体可以是N,2O-HS。根据本发明,工程化氨基葡萄糖6-O磺基转移酶的磺基受体可以是通过上述工程化氨基葡萄糖N-磺基转移酶形成的硫酸化多糖产物。根据本发明,工程化氨基葡萄糖6-O磺基转移酶的磺基受体可以是通过如上所述工程化己糖醛酸2-O磺基转移酶形成的硫酸化多糖产物。根据本发明,工程化氨基葡萄糖6-O磺基转移酶的硫酸化多糖产物是N,2O,6O-HS产物。
为了促进其与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯的排他性反应性,EC2.8.2.-内天然氨基葡萄糖6-O磺基转移酶通常包含高度保守或相同的氨基酸序列,其定义活性位点并且控制酶的识别、与3′-磷酸腺苷5′-磷酸硫酸酯的结合和与其的反应性。根据本发明,工程化氨基葡萄糖6-O磺基转移酶的氨基酸序列可包含相对于EC 2.8.2.-内天然氨基葡萄糖6-O磺基转移酶的一个或多于一个突变,以便促进与芳基硫酸酯化合物而不是3′-磷酸腺苷5′-磷酸硫酸酯的结合。根据本发明,工程化氨基葡萄糖6-O磺基转移酶可包含的氨基酸序列具有相对于EC 2.8.2.-内任何天然氨基葡萄糖6-O磺基转移酶的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、二十、三十、四十、五十、至至少一百个氨基酸突变。根据本发明,工程化氨基葡萄糖6-O磺基转移酶在已知定义酶活性位点的区域内可包含相对于EC 2.8.2.-内任何天然氨基葡萄糖6-O磺基转移酶的氨基酸序列的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四或十五个氨基酸突变,至至少二十个氨基酸突变。
根据本发明,工程化氨基葡萄糖6-O磺基转移酶的氨基酸序列可表示为,相对于EC2.8.2.-内一种或多于一种天然氨基葡萄糖6-O磺基转移酶、特别是相对于EC 2.8.2.-内一种或多于一种天然氨基葡萄糖6-O磺基转移酶的氨基酸序列,包括其生物功能片段的“同一性百分比”或“同一性%”。根据本发明,工程化氨基葡萄糖6-O磺基转移酶可具有EC2.8.2.-内任何天然氨基葡萄糖6-O磺基转移酶的至少50%的序列同一性,并且至至少97%的序列同一性。
根据本发明,工程化氨基葡萄糖6-O磺基转移酶可包含相对于EC 2.8.2.-内一种或多于一种天然氨基葡萄糖6-O磺基转移酶中发现的保守氨基酸序列基序的一个或多于一个突变的氨基酸序列基序。每个突变的氨基酸序列基序,当存在时,可具有相对于EC2.8.2.-内天然氨基葡萄糖6-O磺基转移酶内相应保守氨基酸序列基序的至少一个氨基酸突变。根据本发明,工程化氨基葡萄糖6-O磺基转移酶可包含相对于以下保守氨基葡萄糖6-O磺基转移酶氨基酸序列基序的一、二、三、四或五个突变的氨基酸序列基序:(Q-K-T-G-G-T)、(C-G-L-H-A-D)、(L-R-D-V-P-S)、(S-E-W-R/K-H-V-Q-R-G-A-T-W-K)或(L-T-E-F/Y Q)。突变的氨基酸序列基序的非限制性实例在下文中进一步详述。
根据本发明,工程化氨基葡萄糖6-O磺基转移酶可包含选自如下的氨基酸序列:SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ IDNO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122,其各自包含相对于EC 2.8.2.-内天然氨基葡萄糖6-O磺基转移酶的高度保守氨基酸序列产生的几个氨基酸突变。根据本发明,根据本文所述任何方法使用的工程化氨基葡萄糖6-O磺基转移酶还可包含选自SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ IDNO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122的氨基酸序列的生物等价物和/或功能片段的任何氨基酸序列。
根据本发明,与选自SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122的氨基酸序列所公开的氨基酸序列相比,上述任何工程化氨基葡萄糖6-O磺基转移酶可具有一个或多于一个残基差异或突变。这种残基差异残基差异的非限制性实例包括氨基酸插入、缺失、置换或这种变化的任何组合。根据本发明,与选自SEQ ID NO:104、SEQ ID NO:106、SEQ IDNO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ IDNO:122的氨基酸序列中所公开的氨基酸序列的差异可包含非保守置换、保守置换以及保守和非保守氨基酸置换的组合。根据本发明,氨基酸突变可在SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122内的任何位置处产生,只要突变的酶保留其与作为磺基供体的芳基硫酸酯化合物和作为磺基受体的上述任何基于肝素前体的多糖结合的氨基葡萄糖6-O磺基转移酶活性即可。
根据本发明,工程化氨基葡萄糖6-O磺基转移酶可包含SEQ ID NO:112的氨基酸序列。在SEQ ID NO:112内,具有名称“Xaa”的残基说明其中在SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108的氨基酸序列内的特定位置缺乏同一性的已知情况。因此,“Xaa”名称表示在此位置的氨基酸可选自两种或多于两种氨基酸,如SEQ ID NO:112所定义的。
根据本发明,工程化氨基葡萄糖6-O磺基转移酶可包含SEQ ID NO:113的氨基酸序列。根据本发明,在SEQ ID NO:113内,具有名称“Xaa”的残基说明其中在SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108的氨基酸序列内的特定位置缺乏同一性的已知情况。根据本发明,SEQ ID NO:113还包含EC 2.8.2.-内几个全长氨基葡萄糖6-O磺基转移酶(包括作为非限制性实例的小鼠、人和猪氨基葡萄糖6-O磺基转移酶)的N-末端残基1-66和C-末端残基378-411。因此,“Xaa”名称表示在此位置的氨基酸可选自两种或多于两种氨基酸,如SEQID NO:113所定义的。
另外,根据本发明,氨基酸突变可在SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122内的一个或多于一个位置处产生,只要突变的酶保留其与作为磺基供体的芳基硫酸酯化合物结合的氨基葡萄糖6-O磺基转移酶活性即可。根据本发明,包含SEQ ID NO:132或SEQID NO:133氨基酸序列的芳基硫酸酯依赖性酶可任选地在未指定为“Xaa”的位置处包含一个或多于一个氨基酸突变,同时仍保留其与作为磺基供体的芳基硫酸酯化合物结合的氨基葡萄糖6-O磺基转移酶活性。
在本发明的一个方面,工程化磺基转移酶可具有氨基葡萄糖3-O磺基转移酶活性,包括磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖内氨基葡萄糖残基的3-O位置。根据本发明,工程化氨基葡萄糖3-O磺基转移酶可包含任何氨基酸序列,只要磺基供体是芳基硫酸酯化合物并且磺基受体是基于肝素前体的多糖即可。
根据本发明,工程化氨基葡萄糖3-O磺基转移酶可以是具有HS氨基葡萄糖3-O磺基转移酶活性的天然磺基转移酶的突变体,其为EC 2.8.2.23的成员。与本发明的工程化氨基葡萄糖3-O磺基转移酶相反的是,EC 2.8.2.23内的天然氨基葡萄糖3-O磺基转移酶不与芳基硫酸酯化合物反应,而仅与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应。然而,工程化氨基葡萄糖3-O磺基转移酶可保留与EC 2.8.2.23内天然氨基葡萄糖3-O磺基转移酶相同的生物活性,与作为磺基受体的基于肝素前体的多糖结合。
根据本发明,基于肝素前体的多糖内可在3-O位置接受磺基的氨基葡萄糖残基进行N-硫酸化,并且也可任选地包含6-O磺基。根据本发明,磺基受体多糖内任何其他氨基葡萄糖残基可任选地是N-、3-O和/或6-O硫酸化、N-乙酰化或N-未经取代的。根据本发明,基于肝素前体的多糖内的一个或多于一个氨基葡萄糖残基,包括进行3-O硫酸化的氨基葡萄糖残基,都可N-硫酸化和6-O硫酸化。根据本发明,进行3-O硫酸化的氨基葡萄糖残基可与在非还原端的未硫酸化葡萄糖醛酸残基和在还原端的艾杜糖醛酸残基相邻。根据本发明,进行3-O硫酸化的氨基葡萄糖残基的在还原端的艾杜糖醛酸残基可任选地进行2-O硫酸化。根据本发明,基于肝素前体的多糖内充当氨基葡萄糖3-O磺基转移酶的磺基受体的任何其他己糖醛酸残基可任选地是艾杜糖醛酸或葡萄糖醛酸,并且可任选地进行2-O硫酸化。可用作与任何工程化氨基葡萄糖3-O磺基转移酶结合的磺基受体的基于肝素前体的多糖的一个非限制性实例是基于肝素前体的多糖,其包含一个或多于一个具有下式X的结构的结构基序:
其中X是磺基或乙酸酯基团(acetate group),并且Y是磺基或羟基。根据本发明,在一些优选实施方案中,X可以是磺基,并且Y可以是磺基。当基于肝素前体的多糖包含式X的结构时,3-O硫酸化多糖产物包含下式I的结构:
其中X是磺基或乙酸酯基团,并且Y是磺基或羟基。根据本发明,在一些优选实施方案中,X可以是磺基,并且Y可以是磺基。根据本发明,包含式I的结构并且在与工程化氨基葡萄糖3-O磺基转移酶反应后形成的N,2O,3O,6O-HS产物可具有抗凝活性。N,2O,3O,6O-HS多糖的抗凝活性在下文中进一步详述。
根据本发明,工程化氨基葡萄糖3-O磺基转移酶的磺基受体可包含多个包含式X的结构的结构基序,其任何一个或所有都可被工程化氨基葡萄糖3-O磺基转移酶硫酸化。根据本发明,工程化氨基葡萄糖3-O磺基转移酶的磺基受体可以是N,2O,6O-HS。根据本发明,工程化氨基葡萄糖3-O磺基转移酶的磺基受体可以是通过上述工程化氨基葡萄糖6-O磺基转移酶形成的硫酸化多糖产物。
为了促进其与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯的排他性反应性,EC2.8.2.23内的天然氨基葡萄糖3-O磺基转移酶通常包含高度保守或相同的氨基酸序列,其定义活性位点并且控制酶的识别、与3′-磷酸腺苷5′-磷酸硫酸酯的结合和与其的反应性。根据本发明,工程化氨基葡萄糖3-O磺基转移酶的氨基酸序列可包含相对于EC 2.8.2.23内天然氨基葡萄糖3-O磺基转移酶的一个或多于一个突变,以便促进与芳基硫酸酯化合物而不是3′-磷酸腺苷5′-磷酸硫酸酯的结合。根据本发明,工程化氨基葡萄糖3-O磺基转移酶可包含的氨基酸序列具有相对于EC 2.8.2.23内任何天然氨基葡萄糖3-O磺基转移酶的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、二十、三十、四十、五十、至至少一百个氨基酸突变。根据本发明,工程化氨基葡萄糖3-O磺基转移酶可在已知定义酶活性位点的区域内包含相对于EC 2.8.2.23内任何天然氨基葡萄糖3-O磺基转移酶氨基酸序列的至少一个氨基酸突变,包括至少二、三、四、五、六、七、八、九、十、十一、十二、十三、十四或十五个氨基酸突变,至至少二十个氨基酸突变。
根据本发明,工程化氨基葡萄糖3-O磺基转移酶的氨基酸序列可表示为相对于EC2.8.2.23内一种或多于一种天然氨基葡萄糖3-O磺基转移酶、特别是相对于EC 2.8.2.23内一种或多于一种天然氨基葡萄糖3-O磺基转移酶的氨基酸序列,包括其生物功能片段的“同一性百分比”或“同一性%”。根据本发明,工程化氨基葡萄糖3-O磺基转移酶可具有与EC2.8.2.23内任何天然氨基葡萄糖3-O磺基转移酶的至少50%的序列同一性,并且至至少97%的序列同一性。
根据本发明,工程化氨基葡萄糖3-O磺基转移酶可包含相对于EC 2.8.2.23内一种或多于一种天然氨基葡萄糖3-O磺基转移酶中发现的保守氨基酸序列基序的一个或多于一个突变的氨基酸序列基序。每个突变的氨基酸序列基序,当存在时,可具有相对于EC2.8.2.23内天然氨基葡萄糖3-O磺基转移酶的相应保守氨基酸序列基序的至少一个氨基酸突变。根据本发明,工程化氨基葡萄糖3-O磺基转移酶可包含相对于以下保守的氨基葡萄糖3-O磺基转移酶氨基酸序列基序的一、二、三或四个突变的氨基酸序列基序:(G-V-R-K-G-G)、(P-A/G-Y-F)、(S-D-Y-T-Q-V)或(Y-K-A)。突变的氨基酸序列基序的非限制性实例在下文中进一步详述。
根据本发明,工程化氨基葡萄糖3-O磺基转移酶可包含选自如下的氨基酸序列:SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ IDNO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160,其各自包含相对于EC 2.8.2.23内天然氨基葡萄糖3-O磺基转移酶的高度保守氨基酸序列产生的几个氨基酸突变。根据本发明,根据本文所述任何方法使用的工程化氨基葡萄糖3-O磺基转移酶还可包含选自SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160的氨基酸序列的生物等价物和/或功能片段的任何氨基酸序列。
根据本发明,与选自SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160的氨基酸序列所公开的氨基酸序列相比,上述任何工程化氨基葡萄糖3-O磺基转移酶可具有一个或多于一个残基差异或突变。这种残基差异残基差异的非限制性实例包括氨基酸插入、缺失、置换或这种变化的任何组合。根据本发明,与选自EQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ IDNO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160的氨基酸序列中所公开的氨基酸序列的差异,可包含非保守置换、保守置换以及保守和非保守氨基酸置换的组合。根据本发明,氨基酸突变可在SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160内的任何位置处产生,只要突变的酶保留其与作为磺基供体的芳基硫酸酯化合物和作为磺基受体的上述任何基于肝素前体的多糖结合的氨基葡萄糖3-O磺基转移酶活性即可。
根据本发明,工程化氨基葡萄糖3-O磺基转移酶可包含SEQ ID NO:154的氨基酸序列。在SEQ ID NO:154内,具有名称“Xaa”的残基说明其中在SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151的氨基酸序列内的特定位置缺乏同一性的已知情况。因此,“Xaa”名称表示在此位置的氨基酸可选自两种或多于两种氨基酸,如SEQ ID NO:112所定义的。
另外,并且根据本发明,氨基酸突变可在SEQ ID NO:147、SEQ ID NO:149、SEQ IDNO:151、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160内的一个或多于一个位置处产生,只要突变的酶保留其与作为磺基供体的芳基硫酸酯化合物结合的氨基葡萄糖3-O磺基转移酶活性即可。根据本发明,包含SEQ IDNO:154氨基酸序列的芳基硫酸酯依赖性酶可任选地在未指定为“Xaa”的位置处包含一个或多于一个氨基酸突变,同时仍保留其与作为磺基供体的芳基硫酸酯化合物结合的氨基葡萄糖3-O磺基转移酶活性。
另一方面,本发明提供将磺基从芳基硫酸酯化合物酶促转移至多糖以形成硫酸化多糖产物的方法。根据本发明,多糖可以是基于肝素前体的多糖。根据本发明,将磺基从芳基硫酸酯化合物酶促转移至基于肝素前体的多糖的方法可包括以下步骤:(a)提供芳基硫酸酯化合物;(b)提供上述任何工程化磺基转移酶,其中工程化磺基转移酶具有与作为磺基供体的芳基硫酸酯化合物结合的生物活性;(c)提供基于肝素前体的多糖;(d)将芳基硫酸酯化合物、磺基转移酶和基于肝素前体的多糖组合成反应混合物;和(e)使用磺基转移酶,将磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖,由此形成硫酸化多糖产物。根据本发明,芳基硫酸酯化合物可选自PNS、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2NapS和NCS。根据本发明,芳基硫酸酯化合物可以是PNS。根据本发明,芳基硫酸酯化合物可以是NCS。
根据本发明,工程化磺基转移酶可以是上述任何工程化氨基葡萄糖N-磺基转移酶,优选包含选自SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25的氨基酸序列的工程化氨基葡萄糖N-磺基转移酶。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可以是N-脱乙酰肝素前体。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可包含一个或多于一个包含式II的结构的二糖单元。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,硫酸化多糖产物包含式III的结构。
根据本发明,工程化磺基转移酶可以是上述任何工程化己糖醛酸2-O磺基转移酶,优选包含选自SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67和SEQ ID NO:69的氨基酸序列的工程化己糖醛酸2-O磺基转移酶。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可以是N-硫酸化肝素前体。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可包含一个或多于一个包含式IV和/或式V的结构的结构基序,并且优选至少一个包含式V的结构的结构基序。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,方法还可包括提供葡糖醛酸C5-差向异构酶、优选包含SEQ ID NO:67的氨基酸序列并且更优选SEQ IDNO:67的残基34-617的葡糖醛酸C5-差向异构酶的步骤。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,硫酸化多糖产物包含式VI和/或式VII的结构。
根据本发明,工程化磺基转移酶可以是上述任何工程化氨基葡萄糖6-O磺基转移酶,优选包含选自SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ IDNO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122的氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可以是为合适的工程化氨基葡萄糖6-O磺基转移酶的磺基受体的上述任何基于肝素前体的多糖。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可以是N,2O-HS。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可包含一个或多于一个包含式VIII的结构的结构基序。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,硫酸化多糖产物包含式IX的结构。
根据本发明,工程化磺基转移酶可以是上述任何工程化氨基葡萄糖3-O磺基转移酶,优选包含选自SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ IDNO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160的氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可以是N,2O,6O-HS。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,基于肝素前体的多糖可包含一个或多于一个包含式X的结构的结构基序。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,硫酸化多糖产物包含式I的结构。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,包含式I的结构的硫酸化多糖产物可具有抗凝活性。
根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,在包含用作原料的基于肝素前体的多糖或硫酸化多糖产物的任何反应混合物或组合物内,多糖可以作为具有可变链长、分子量、N-乙酰化和/或N-、2-O、6-O或3-O硫酸化的多糖的多分散混合物存在。或者,根据本发明,上述任何多糖可以作为由具有相同链长、分子量、N-乙酰化和/或N-、2-O、6-O或3-O硫酸化的多糖组成的均质组合物存在。
根据本发明,并且可与一个或多于一个上述方面和实施方案组合使用,与作为底物的芳基硫酸酯化合物结合的具有硫酸酯酶和/或磺基转移酶活性的本发明的工程化酶可以从核酸表达,所述核酸包含编码具有如下氨基酸序列的多肽的任何核苷酸序列:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,SEQ ID NO:160。
根据本发明,这种核苷酸序列可选自
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,和SEQ ID NO:152,
其分别编码氨基酸序列
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ IDNO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ ID NO:149,或SEQ ID NO:151。
本领域技术人员基于上述列举的核苷酸序列和所需工程酶的同一性,可确定编码具有如下氨基酸序列的多肽的适当核苷酸序列:
SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:66,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ ID NO:115,SEQ IDNO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ IDNO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
根据本发明,并且可与一个或多于一个上述方面和实施方案组合使用,包含编码上述任何工程化酶的核苷酸序列的核酸可以插入到表达载体中,所述表达载体被工程化以插入到配置为保留表达载体并且过表达所需酶的生物宿主细胞中。根据本发明,插入表达载体的核酸可包含编码上述任何工程化酶的任何核苷酸序列,特别是包含如下氨基酸序列的那些:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
根据本发明,插入表达载体的核酸可包含选自如下的任何核苷酸序列:
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO 126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,和SEQ ID NO:152.。
根据本发明,并且可与一个或多于一个上述方面和实施方案组合使用,表达载体可任选地还包含一种或多于一种编码蛋白质或宿主识别位点的核酸序列或基因,所述蛋白质或宿主识别位点补充本发明的工程化酶的产生。非限制性实例包括启动子序列、抗生素抗性基因和编码有助于工程化磺基转移酶折叠和稳定性的融合蛋白的基因。根据本发明,上述任何表达载体还可包含来自大肠杆菌(Escherichia coli)的malE基因,其编码麦芽糖结合蛋白(MBP)。根据本发明,上述任何表达载体还可包含编码小泛素相关修饰物(SUMO)蛋白的基因、优选SUMO1基因,其编码SUMO1蛋白。结果,并且根据本发明,一旦蛋白表达开始,就可以形成融合蛋白,所述融合蛋白包含MBP或SUMO以及具有选自如下氨基酸序列的工程化酶:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:181,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160.。
表达载体通常转化到宿主细胞中,酶可从其中过表达和提取。根据本发明,并且可与一个或多于一个上述方面和实施方案组合使用,宿主细胞可以用表达载体转化,所述表达载体包含如下中阐述的核酸序列:
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,SEQ ID NO:152,
或编码具有如下氨基酸序列的酶的任何序列:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO 129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
根据本发明,转化到宿主细胞中的任何上述载体还可包含malE或SUMO1基因。根据本发明,转化的宿主细胞可以是细菌、酵母、昆虫或哺乳动物细胞。根据本发明,宿主细胞可以是细菌细胞。根据本发明,细菌细胞可以来自大肠杆菌(E.coli)的非致病菌株。
在本发明的另一方面,提供用于根据上述任何方法形成硫酸化多糖产物、特别是抗凝剂N,2O,3O,6O-HS产物的试剂盒。根据本发明,试剂盒可包含至少一种工程化芳基硫酸酯依赖性磺基转移酶和至少一种芳基硫酸酯化合物,优选PNS或NCS。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,试剂盒可包含工程化氨基葡萄糖N-磺基转移酶、工程化己糖醛酸2-O磺基转移酶、工程化氨基葡萄糖6-O磺基转移酶,和/或工程化氨基葡萄糖3-O磺基转移酶,其中每一种依赖于与作为磺基供体的芳基硫酸酯化合物反应以催化磺基转移至多糖、优选基于肝素前体的多糖。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,试剂盒还可包含作为磺基供体的任何上述基于肝素前体的多糖。根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,试剂盒还可包含葡糖醛酸C5-差向异构酶,优选包含SEQ ID NO:67的氨基酸序列的差向异构酶,并且更优选包含SEQ ID NO:67的氨基酸残基34-617的差向异构酶。
根据本发明,并且可与任何一个或多于一个上述方面和实施方案组合使用,根据上述任何方法制备的任何硫酸化多糖产物、包括抗凝剂N,2O,3O,6O-HS产物,可以制备为药学上可接受的盐,特别是碱金属盐或碱土金属盐,包括但不限于钠盐、锂盐或钙盐。
对于本领域技术人员来说,通过以下详细描述,本发明的这些和其他实施方案将是明显的。
附图说明
图1显示当PNS是底物时,通过本发明的工程化酶之一所催化的硫酸酯酶活性。
图2显示硫酸酯键水解和磺基组氨酸中间体形成的理论反应机制。
图3A和图3B显示使用α-甲酰甘氨酸残基催化的天然硫酸酯酶的两种提出的反应机制。
图4A、图4B和图4C显示关于天然人类氨基葡萄糖3-O磺基转移酶、3′-磷酸腺苷5′-磷酸硫酸酯和基于肝素前体的多糖之间的磺基转移反应所提出的反应机制、过渡态以及形成的产物。
图5显示基于肝素前体的多糖的一个非限制性实例,所述基于肝素前体的多糖可用作与本发明的工程化氨基葡萄糖N-磺基转移酶结合的磺基受体。
图6A、图6B和图6C显示15个野生型EC 2.8.2.8酶的N-磺基转移酶结构域的多序列比对,说明无论整体序列同一性如何都存在的保守氨基酸序列基序。
图7A、图7B和图7C显示关于天然氨基葡萄糖N-磺基转移酶、3′-磷酸腺苷5′-磷酸硫酸酯和N-脱乙酰肝素前体之间的磺基转移反应所提出的反应机制、过渡态以及形成的产物。
图8显示一个三维模型,其中PNS结合在工程化氨基葡萄糖N-磺基转移酶的活性位点内,叠加在来自EC.2.8.2.8酶类的天然酶的N-磺基转移酶结构域的晶体结构上。
图9显示图8中建模的工程化酶的三维模型,说明存在于活性位点内的氨基酸突变。
图10显示另一个三维模型,其中PNS结合在工程化氨基葡萄糖N-磺基转移酶的活性位点内,叠加在来自EC.2.8.2.8酶类的天然酶的N-磺基转移酶结构域的晶体结构上。
图11显示图10中建模的工程化酶的三维模型,说明存在于活性位点内的氨基酸突变。
图12显示分别包含SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:15的氨基酸序列的多肽的序列比对,描述每个所示序列之间氨基酸残基差异的位置和同一性。
图13显示基于肝素前体的多糖的一个非限制性实例,所述基于肝素前体的多糖可用作与本发明的工程化己糖醛酸2-O磺基转移酶结合的磺基受体。
图14显示基于肝素前体的多糖的另一个非限制性实例,所述基于肝素前体的多糖可用作与本发明的工程化己糖醛酸2-O磺基转移酶结合的磺基受体,其中磺基转移至基于肝素前体的多糖内葡萄糖醛酸残基的2-O位置。
图15显示基于肝素前体的多糖的另一个非限制性实例,所述基于肝素前体的多糖可用作与本发明的工程化己糖醛酸2-O磺基转移酶结合的磺基受体,其中磺基转移至多糖内艾杜糖醛酸残基的2-O位置。
图16显示基于肝素前体的多糖的另一个非限制性实例,所述基于肝素前体的多糖可用作与本发明的工程化己糖醛酸2-O磺基转移酶结合的磺基受体,其中硫酸酯基转移至多糖内的葡萄糖醛酸残基的2-O位置和艾杜糖醛酸残基的2-O位置。
图17A、图17B、图17C和图17D显示EC 2.8.2.-内十二个野生型己糖醛酸2-O磺基转移酶的多序列比对,说明无论整体序列同一性如何都存在的保守氨基酸序列基序。
图18A、图18B和图18C显示关于天然己糖醛酸2-O磺基转移酶内的保守残基、3′-磷酸腺苷5′-磷酸硫酸酯和基于肝素前体的多糖之间的磺基转移反应所提出的反应机制、过渡态以及形成的产物。
图19显示突变的氨基酸序列基序的三维模型,该基序使NCS能够结合在工程化己糖醛酸2-O磺基转移酶的活性位点内,叠加在天然2-O磺基转移酶的晶体结构上。
图20显示基于肝素前体的多糖的一个非限制性实例,所述基于肝素前体的多糖可用作与本发明的工程化氨基葡萄糖6-O磺基转移酶结合的磺基受体,其中多个氨基葡萄糖残基的6-O位置可接受磺基。
图21A、图21B和图21C显示EC 2.8.2.-内十五个野生型氨基葡萄糖6-O磺基转移酶的多序列比对,说明无论整体序列同一性如何都存在的保守氨基酸序列基序。
图22A、图22B和图22C显示关于天然氨基葡萄糖6-O磺基转移酶内的保守残基、3′-磷酸腺苷5′-磷酸硫酸酯和基于肝素前体的多糖之间的磺基转移反应所提出的反应机制、过渡态以及形成的产物。
图23显示突变的氨基酸序列基序的三维模型,该基序使PNS能够结合在工程化氨基葡萄糖6-O磺基转移酶的活性位点内,叠加在天然氨基葡萄糖6-O磺基转移酶的晶体结构上。
图24显示分别包含SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108氨基酸序列的多肽的序列比对,描述每个所示序列之间氨基酸残基差异的位置和同一性。
图25显示基于肝素前体的多糖的一个非限制性实例,所述基于肝素前体的多糖可用作与本发明工程化氨基葡萄糖3-O磺基转移酶结合的磺基受体以形成包含式I的结构的N,2O,3O,6O-HS产物。
图26A、图26B和图26C显示EC 2.8.2.23内十五个野生型氨基葡萄糖3-O磺基转移酶的多序列比对,说明无论整体序列同一性如何都存在的保守氨基酸序列基序。
图27显示突变的氨基酸序列基序的三维模型,该基序使PNS能够结合在工程化氨基葡萄糖3-O磺基转移酶的活性位点内,叠加在天然氨基葡萄糖3-O磺基转移酶的晶体结构上。
图28显示分别包含SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151氨基酸序列的多肽的序列比对,描述每个所示序列之间氨基酸残基差异的位置和同一性。
图29显示与商业标准相比,使用工程化氨基葡萄糖N-磺基转移酶合成的N-硫酸化多糖产物的一系列重叠SAX-HPLC色谱图。
图30A和图30B显示使用分别具有SEQ ID NO:63和SEQ ID NO:65氨基酸序列的工程化己糖醛酸2-O磺基转移酶合成的2-O硫酸化多糖产物的LCMS色谱图。
图31A、图31B和图31C显示使用分别具有氨基酸序列SEQ ID NO 104、SEQ ID NO:106和SEQ ID NO:108的工程化氨基葡萄糖6-O磺基转移酶合成的6-O硫酸化多糖产物的LCMS色谱图。
图32A和图32B显示与一系列二糖和多糖标准相比,使用工程化氨基葡萄糖3-O磺基转移酶合成的硫酸化多糖产物的一系列六幅LCMS色谱图。
图33显示用于核磁共振(NMR)研究的感兴趣质子的氘标记的反应方案。
图34显示通过本发明的工程化氨基葡萄糖3-O磺基转移酶在与PNS或NCS反应后形成的硫酸化多糖产物的1H-NMR光谱。
图35显示图34中1H-NMR光谱的3.5ppm至4.5ppm区域的放大视图。
图36显示与商业标准相比,化学N-硫酸化多糖产物的SAX-HPLC色谱图。
图37显示与商业标准相比,使用实施例8的化学N-硫酸化多糖产物制备的作为磺基受体多糖的酶促2-O硫酸化多糖产物的SAX-HPLC色谱图。
图38显示与商业标准相比,使用实施例8的化学N-硫酸化多糖产物制备作为磺基受体的多糖并且在反应混合物中包含C5-己糖醛酸差向异构酶制备的酶促2-O硫酸化多糖产物的SAX-HPLC色谱图。
图39显示与商业标准相比,使用实施例9的2-O硫酸化多糖产物制备的作为磺基受体的酶促6-O硫酸化多糖产物的SAX-HPLC色谱图。
定义
术语“活性位点”是指催化蛋白中发生催化的位点,可包括一个或多于一个底物结合位点。活性位点在鉴定与特定多肽特异性相互作用并且调节其活性的化合物方面具有重要效用。天然配体或底物与其相应受体或酶的活性位点的结合是许多生物学作用机制的基础。类似地,许多化合物通过与受体和酶的活性位点结合发挥其生物学作用。这种结合可发生在活性位点的全部或任何部分。对这种结合的理解有助于设计磺基转移酶内的工程化活性位点,所述磺基转移酶能够结合芳基硫酸酯化合物并且与其反应,而不是3′-磷酸腺苷5′-磷酸硫酸酯。
术语“氨基酸”是指具有这样结构的分子,其中中心碳原子(α-碳原子)与氢原子、羧酸基团(其碳原子在本文中称为“羧基碳原子”)、氨基(其氮原子在本文中称为“氨基氮原子”)和侧链基团R连接。当结合到肽、多肽或蛋白质中时,氨基酸在将一个氨基酸连接到另一个氨基酸的脱水反应中失去其氨基和羧基的一个或多于一个原子。因此,当氨基酸结合到蛋白质中时,其称为“氨基酸残基”。在天然存在的蛋白质的情况下,氨基酸残基的R基团区分合成蛋白质的20个氨基酸,尽管蛋白质中的一个或多于一个氨基酸残基在结合到生物系统中的蛋白质后可进行衍生或修饰(例如,通过糖基化和/或通过两个不相邻的半胱氨酸氨基酸残基的硫醇侧链氧化形成半胱氨酸,导致形成经常对稳定蛋白质的折叠构象起重要作用的二硫键共价键,等等)。此外,当一个α-碳原子具有四个不同的基团时(就如生物系统用于合成蛋白质的20个氨基酸的情况,甘氨酸除外,甘氨酸具有两个与碳原子键合的氢原子),每个氨基酸存在两种不同对映体形式,指定为D和L。哺乳动物中,仅有L-氨基酸结合到天然存在的多肽中。本发明利用的工程酶可结合一种或多种D-氨基酸和L-氨基酸,或者可仅由D-氨基酸残基或L-氨基酸残基组成。
非天然存在的氨基酸也可以结合到本发明的任何工程酶、特别是具有芳基硫酸酯依赖性活性的工程化磺基转移酶中。这种氨基酸的非限制性实例包括:α-氨基异丁酸、4-氨基丁酸、L-氨基丁酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、鸟氨酸、正亮氨酸、正缬氨酸、羟脯氨酸、肌氨酸、瓜氨酸、半胱氨酸、叔丁基甘氨酸、叔丁基丙氨酸、苯基甘氨酸、环己基丙氨酸、β-丙氨酸、氟代氨基酸、设计氨基酸(例如,β-甲基氨基酸、α-甲基氨基酸、α-甲基氨基酸)和一般的氨基酸类似物。
术语“和/或”在实体列举名单上下文中使用时,是指实体单独或组合存在。因此,例如,短语“A、B、C和/或D”单独包括A、B、C和D,而且包括A、B、C和D的任何和所有组合和子组合。
术语“芳基硫酸酯”或“芳基硫酸酯化合物”是指衍生自芳环的任何化合物、官能团或取代基,所述芳环中的一个或多于一个直接键合到芳环的氢原子被硫酸酯官能团替代。通常,硫酸酯官能团通过硫酸酯键与芳基硫酸酯化合物的芳香族部分共价结合。可与本发明的任何工程酶用作底物的芳基硫酸酯化合物的非限制性实例包括但不限于PNS、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2NapS和NCS。
术语“芳基硫酸酯依赖性磺基转移酶”是指具有与作为磺基供体的芳基硫酸酯化合物结合的生物或催化活性的工程化磺基转移酶的集合。磺基转移酶的生物活性可依赖的芳基硫酸酯化合物的非限制性实例包括PNS和NCS。如本文所述,具有与作为磺基供体的芳基硫酸酯化合物结合的生物活性的工程化磺基转移酶可具有与作为磺基受体的多糖、特别是基于肝素前体的多糖结合的生物活性。“芳基硫酸酯依赖性磺基转移酶”还包括核酸和编码任何芳基硫酸酯依赖性磺基转移酶的多肽两者,包括衍生自本文公开的序列的突变体。
术语“平均分子量”,对于根据本发明的任何方法使用或产生的任何多糖原料、中间体和/或产品,除非另有说明,否则可以指测定具有不同聚合度、官能化度和摩尔质量的聚合物混合物的摩尔质量分布或摩尔质量平均值的任何可接受的量度,包括但不限于“数均分子量”、“质均分子量”、“重均分子量”、“Z(离心)平均摩尔质量”或“黏度平均摩尔质量”。
术语“数均分子量”是指报告混合物中多糖平均分子量的方法,将样品中所有多糖的总重量除以样品中多糖数量,使用方程(其中Ni是摩尔质量Mi的多糖数量)计算。因此,对应于样品中比相同混合物中其他多糖大的多糖,重均分子量必然偏向较高值,并且将总是大于数均分子量除了当样品是单分散的,等于如果样品中多糖的某一特定样品的实际重量有很大的离散性,则将远大于相反,随着样品中多糖的重量分布变窄,接近
术语“相对分子量”或“相对摩尔质量”(Mr),是指将混合物中多糖的平均分子量报告为无单位量的另一种方法,最广泛地通过将分子的平均质量除以原子质量常数例如1原子质量单位(amu)或1道尔顿(Da)来确定。对于多糖,Mr不考虑样品中多糖的不同链长、官能化和/或重量分布,而只是以类似于小分子的方式简单地表示样品中多糖的真实平均质量。
术语“生物活性”或“催化活性”是指酶通过特定底物的特异性识别来催化特定化学反应以产生特定产物的能力。在一些实施方案中,本发明的工程化酶具有生物或催化活性,其依赖于结合作为底物的芳基硫酸酯化合物、特别是PNS或NCS并且与其反应。另外,除了PNS之外,一些工程酶还能够具有与一种或多于一种替代的芳基硫酸酯化合物结合的混杂的催化活性,所述一种或多于一种替代的芳基硫酸酯化合物包括但不限于MUS、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基酯和2NapS。
术语“编码序列”是指核酸的一部分,例如编码蛋白质的氨基酸序列的基因。
术语“密码子优化”是指将编码蛋白质的多核苷酸的密码子改变为优先用于特定生物体使得所编码的蛋白质在感兴趣的生物体中有效表达的密码子。尽管遗传密码是简并的,因为大多数氨基酸由几个密码子表示,但公知的是,特定生物体的密码子使用是非随机的,并且偏向于特定的密码子三联体。在本发明的一些实施方案中,多核苷酸编码工程化酶可以进行密码子优化以从选择用于表达的宿主生物中进行最佳生产。
当在给定氨基酸或多核苷酸序列编号的上下文中使用时,术语“对应于”、“参考”或“相对于”是指当将给定氨基酸或多核苷酸序列与参考序列进行比较时,特定参考序列的残基编号。换句话说,给定聚合物的残基编号或残基位置是相对于参考序列指定的,而不是通过给定氨基酸或多核苷酸序列中残基的实际数字位置来指定的。
术语“缺失”是指通过从参考多肽中去除一个或多于一个氨基酸来修饰多肽。缺失可包括去除1个或多于1个氨基酸,其最终结果是保留参考多肽的催化活性。缺失可以针对多肽的内部部分和/或末端部分。另外,缺失可包含连续片段,或它们可以是不连续的。
术语“二糖单元”,是指许多多糖、包括线性多糖中最小的重复骨架单元,其中最小的重复单元由两个糖残基组成。对于基于肝素前体的多糖,二糖单元由己糖醛酸残基和氨基葡萄糖残基组成,其任一都可官能化并且其中己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸。基于肝素前体的多糖内的每个二糖单元可通过其骨架结构以及存在磺基的数量和位置来描述。此外,在相同多糖、和/或在多糖的相同样品中具有相同结构的二糖单元的相对丰度可进行表征以确定作为与本文所述任何磺基转移酶反应产生的在特定位置处硫化的量。
术语“片段”(fragment)或“片段”(segment)是指具有氨基或羧基末端缺失的多肽,但是其中剩余的氨基酸序列与参考序列中的相应位置相同。片段可以是至少50个氨基酸或更长和包含酶的至多70%、80%、90%、95%、98%和99%的氨基酸序列。
术语“功能位点”或“功能域”通常是指蛋白质中赋予蛋白质功能的任何位点。代表性实例包括活性位点(即催化蛋白质中发生催化作用的那些位点)和配体结合位点。配体结合位点包括但不限于金属结合位点、辅因子结合位点、抗原结合位点、底物通道和隧道以及底物结合域。在酶中,作为底物结合域的配体结合位点也可以是活性位点。功能性位点也可以是多个功能性位点的复合物,其中包含复合物的一个或多于一个位点的缺失导致功能丧失。作为一个非限制性实例,特定磺基转移酶的活性位点可包括多个结合位点或裂隙,包括磺基供体的一个位点和磺基受体的一个位点。
术语“基因”、“基因序列”和“基因片段”是指编码功能性蛋白质、多肽或肽的核酸单元的功能单元。如本领域技术人员将理解的,该功能术语包括基因组序列和cDNA序列。术语“基因”、“基因序列”和“基因片段”另外指与本文公开的编码工程酶基因产物、蛋白质或多糖的多核苷酸序列基本上相同的任何DNA序列,并且可包含相关控制序列的任何组合。该术语还指与这种DNA序列互补的RNA或反义序列。如本文所用,术语“DNA片段”包括已分离的不含重组载体的分离的DNA分子,包括但不限于质粒、黏粒、噬菌体和病毒。
术语“糖胺聚糖”是指由重复的二糖单元组成的长的线性多糖。糖胺聚糖(GAG)的实例包括软骨素、皮肤素、肝素前体、透明质酸和角质素。GAG在质量、长度、二糖单元结构和功能化、硫酸化程度方面通常是异质的。
术语“肝素前体”是指特定的GAG,其具有重复的[β(1,4)GlcA-α(1,4)GlcNAc]n二糖单元,其中GlcA是葡萄糖醛酸,GlcNAc是N-乙酰氨基葡萄糖。
术语“基于肝素前体的多糖”是指具有与肝素前体相同骨架结构的多糖,其中二糖单元包含1→4糖苷连接的己糖醛酸和氨基葡萄糖残基。己糖醛酸残基可以是葡萄糖醛酸,如在肝素前体中,或艾杜糖醛酸,并且可任选地在2-O位置具有磺基。氨基葡萄糖残基可以是N-乙酰化,如在肝素前体中,N-硫酸化或N-未经取代的,并且可任选地在N-、3-O或6-O位置硫酸化。如本文所用,术语“N-未经取代”对于氨基葡萄糖残基相当于“N-脱乙酰化”氨基葡萄糖残基,并且是指能够化学地或酶促使用氨基葡萄糖N-磺基转移酶接收磺基的胺官能团。根据本发明,基于肝素前体的多糖可用作原料、形成为中间体、充当磺基受体和/或根据本文所述的任何方法合成为产物。
术语“插入”是指通过向参考多肽添加一个或多于一个氨基酸来对多肽进行修饰。插入可以在多肽的内部,或多肽的C-末端或N-末端。插入可以包括本领域已知和如下所述的融合蛋白。插入可包括氨基酸的连续片段或被参考多肽中的一个或多于一个氨基酸隔开的多个插入。
本文所用的术语“分离的核酸”相对于源自天然存在的序列的核酸来说是指核糖核酸或脱氧核糖核酸,其包含天然存在的核苷酸序列并且可以通过标准重组DNA技术进行操作,但不共价连接至核苷酸序列,这些核苷酸序列在其衍生自的生物体的天然存在的基因组中的5′和3′末端紧邻。如本文所用,对于合成核酸,术语“分离的核酸”是指核糖核酸或脱氧核糖核酸,其包含在自然界中不存在的核苷酸序列,并且可以通过标准重组DNA技术进行操作。当分离的核酸可用于例如聚合酶链式反应(PCR)扩增、体外翻译、与其他核酸的连接(例如克隆或表达载体)、来自其他核酸限制(例如克隆或表达载体)、细胞转化、杂交筛选试验等时,分离的核酸可以通过标准重组DNA技术进行操作。
术语“天然存在”或“野生型”是指在自然界中发现的酶的形式。例如,天然存在或野生型多肽或多核苷酸序列是存在于生物体中的序列,其可从自然界的来源中分离并且未经人为操作有意修饰。野生型多肽或多核苷酸序列也可指可在体外合成、扩增、和/或表达的重组蛋白质或核酸,其具有与体内产生的酶相同的序列和生物活性。与天然存在或野生型转移酶相比,根据本发明方法所用的工程化磺基转移酶具有独特的氨基酸和核酸序列,具有与作为磺基供体的芳基硫酸酯化合物而不是3′-磷酸腺苷5′-磷酸硫酸酯结合的生物活性并且在自然界中不可能发现。
术语“寡糖”是指每个分子内含有少量、通常为三至九个糖残基的糖聚合物。
术语“同一性百分比”是指对两个或多于两个核酸或氨基酸序列之间的相似性的定量测量。作为一个非限制性实例,同一性百分比可在本发明的两种或多于两种工程化酶、两种或多于两种天然存在的酶之间、或一种或多于一种工程化酶与一种或多于一种天然存在的酶之间进行评估。同一性百分比可相对于两个或多于两个全长序列、两个或多于两个截短序列、或者全长序列和截短序列的组合进行评估。
术语“多糖”是指由重复单元形成的聚合碳水化合物结构,通常是单糖或二糖单元,通过糖苷键连接在一起,其结构范围可以从线性链到高度支化的三维结构。虽然本领域所用的术语“多糖”可以指每分子具有大于十个糖残基的糖聚合物,但本申请中使用“多糖”来描述具有大于一个糖残基的糖聚合物,包括具有三到九个糖残基的糖聚合物,其在本领域中可定义为“寡糖”。根据本发明,术语“多糖”也用于一般地描述GAG和基于GAG的化合物,包括软骨素、皮肤素、肝素前体、透明质酸和角质素化合物。
术语“蛋白质”、“基因产物”、“多肽”和“肽”可以互换使用以描述由一个或多于一个氨基酸残基链组成的生物分子。此外,包含多个多肽子单元(例如二聚体、三聚体或四聚体)以及其他非蛋白质催化分子的蛋白质也将理解为包括在如本文所用的“蛋白质”的含义内。类似地,“蛋白质片段”,即,包含比蛋白质的所有氨基酸残基更少的氨基酸残基的延伸,也在本发明的范围之内,并且在本文中可称为“蛋白质”。另外,“蛋白质结构域”也包括在术语“蛋白质”内。“蛋白质结构域”代表蛋白质的一部分,由其自身的半独立折叠区域组成,所述折叠区域具有自身有疏水核心和极性外部的特征球形几何形状。
术语“重组”在用于参考例如细胞、核酸或多肽时,是指已以自然界中不会以其他形式存在的方式进行修饰的物质。非限制性实例中包括表达在天然(非重组)形式的细胞中未发现的基因或表达以不同水平另外表达的天然基因的重组细胞。
术语“参考序列”是指用作序列比较基础的公开或定义的序列。参考序列可以是较大序列的子集,例如全长基因或多肽序列的片段。通常,参考序列是指全长序列的至少一部分,通常至少20个氨基酸,或核酸或多肽的全长序列。
术语“糖”是指碳水化合物,也称为糖,是由碳、氢和氧组成的化合物的广义术语,其中氢原子数是氧原子数的基本上两倍。通常,糖中的重复单元数目可不同。因此,二糖、寡糖和多糖都是由糖单元组成的链的实例,它们被本发明的工程化磺基转移酶识别为磺基受体。
对于用作原料、形成为中间体、充当磺基受体和/或根据本文所述任何方法合成为产物的多糖来说,术语“基本上等同”是指多糖样品的一种或多于一种性质与现有技术中表征的多糖样品中发现的性质相同。这种性质可包括但不限于化学结构、硫酸化频率和位置、二糖单元组成、分子量分布和/或抗凝活性。即使两种多糖样品具有可能不同的另外性质,这种差异也不会显著影响它们的基本等同性。在一个非限制性实例中,根据本发明的方法使用工程化氨基葡萄糖3-O磺基转移酶合成的抗凝剂N,2O,3O,6O-HS产物可在化学结构、分子量分布和/或抗凝活性方面基本上等同于美国药典(USP)参考标准(CAS号:9041-08-1),但可以与USP参考标准不同的纯度生产,其是从天然来源中分离出来的,并且可在相同样品中包含非痕量的其他GAG。
对于蛋白质制剂,术语“基本上纯的”是指含有至少60%(按干重计)感兴趣的蛋白质的制剂,不包括其他有意包含的化合物的重量。特别地,制剂中感兴趣的蛋白质的干重为至少75%、更特别地为至少90%和最特别地为至少99%,不包括其他有意包含的化合物的重量。纯度可通过任何合适的方法测量,所述方法例如柱色谱、凝胶电泳或高效液相色谱(HPLC)分析。如果制剂有意包含两种或多于两种不同的本发明的蛋白质,则“基本上纯的”制剂是指其中本发明蛋白质的总干重占制剂总干重的至少60%的制剂,不包括其他有意包含的化合物的重量。特别地,对于含有两种或多于两种本发明蛋白质的这种制剂,本发明蛋白质的总重量可以是制剂总干重的至少75%、更特别地至少90%和最特别地至少99%,不包括其他有意包含的化合物的重量。
术语“磺基”或“硫酰”是指具有化学式SO3H-的官能团、取代基或部分,其可以从芳基硫酸酯化合物中去除和/或从供体化合物转移至受体化合物。在一些实施方案中,本发明的工程化磺基转移酶催化磺基从芳基硫酸酯化合物转移至多糖、特别是肝素前体和/或基于肝素前体的多糖。
术语“磺基转移酶”是指在体内或体外过程中用于催化磺基从磺基供体化合物转移至磺基受体化合物的任何酶。“磺基转移酶”可以互换使用以描述在体内催化磺基转移反应的酶或描述在体外催化磺基转移反应的本发明的工程化酶。
术语“转化”是指将外源核酸引入细胞的任何方法,包括但不限于转化、转染、电穿孔、显微注射、裸核酸的直接注射、粒子介导的递送、病毒介导的转导或将核酸递送到宿主细胞中的任何其他方式,其导致所述核酸的瞬时或稳定表达或所述核酸整合到所述宿主细胞或其后代的基因组中。
具体实施方式
本公开描述工程化酶,其配置为识别、结合作为底物的芳基硫酸酯化合物并且与其反应。本发明的酶是特别有用的,因为作为体内细菌和真核生物酶(包括硫酸酯酶和磺基转移酶)的常见底物的许多含硫酸酯的化合物,对于用作体外这些相同反应的底物来说通常是不切实际的。芳基硫酸酯化合物无处不在、便宜、稳定并且在实验室环境中相对容易使用,但它们在体内仅能与很少的酶反应。特别地,真核磺基转移酶不能与作为磺基供体的芳基硫酸酯化合物结合或反应,相反仅可与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应。因此,磺基转移酶几乎普遍依赖于3′-磷酸腺苷5′-磷酸硫酸酯已成为大规模化学酶法或酶法体外合成硫酸化产物、特别是硫酸化多糖产物的不可逾越的障碍。
以下公开的本发明的工程化酶是天然磺基转移酶的突变体,其排他性识别、结合3′-磷酸腺苷5′-磷酸硫酸酯并且与其反应,或者被工程化以结合作为底物的芳基硫酸酯化合物并且与其反应。在本发明的一个实施方案中,许多工程化酶具有硫酸酯酶活性,其中酶催化来自芳基硫酸酯化合物的磺基水解。不限于特定理论,认为硫酸酯酶的反应机理相对于已知天然硫酸酯酶是独特的,所述天然硫酸酯酶具有保守信号序列和翻译后修饰的氨基酸。天然酶和本发明的工程化酶的硫酸酯酶活性在下文中进一步详述。
在本发明的另一个实施方案中,几种工程化酶具有磺基转移酶活性,其中酶催化磺基从芳基硫酸酯化合物转移至磺基受体。在另一个实施方案中,磺基受体是多糖、特别是基于肝素前体的多糖。不受特定理论限制,认为识别多糖为磺基受体,而且结合作为磺基供体的芳基硫酸酯化合物并且与其反应的磺基转移酶在自然界中并未观察到,并且先前也未描述过。本领域技术人员将理解,与不能结合芳基硫酸酯化合物并且与其反应以便催化磺基转移的体外和体内反应机制相比,本发明的工程化芳基硫酸酯依赖性磺基转移酶具有一些优势。
应该理解,虽然参考示例性实施方案并且使用特定语言来描述它们,但并不意在限制本发明的范围。相关领域的技术人员会想到并且拥有本公开内容的本文所述方法的进一步修改以及所描述那些发明的原理的其他应用,都认为在本发明的范围内。此外,除非另外定义,否则本文使用的所有技术和科学术语具有与本特定发明的实施方案所属领域的普通技术人员通常理解的相同含义。所使用的术语仅为了描述那些实施例的目的,并不旨在限制,除非如此指定。提供标题只是为了方便,不应解释为以任何方式限制本发明。另外,在整个说明书和权利要求中,给定的化学式或名称应包括所有光学异构体和立体异构体,以及存在这种异构体和混合物的外消旋混合物。
芳基硫酸酯依赖性硫酸酯酶
在本发明的一个实施方案中,本文公开的几种工程化酶具有硫酸酯酶活性,并且能够水解芳基硫酸酯化合物中的硫酸酯(参见Recksiek等人,(1998)J.Biol.Chem.273(11):6096-6103,其公开内容通过引用整体并入)。与芳基硫酸酯化合物在水溶液中结合后,具有硫酸酯酶活性的工程化酶可催化芳基硫酸酯化合物的水解,以生成芳香族化合物和硫酸根离子。芳基硫酸酯化合物的非限制性实例包括对硝基苯硫酸酯(PNS)、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2-萘基硫酸酯(2NapS)和4-硝基儿茶酚硫酸酯(NCS)。作为一个非限制性实例并且如图1所示,当芳基硫酸酯化合物是PNS时,产物为对硝基苯酚和硫酸根离子。在pH大于对硝基苯酚的pKa下进行的反应中,芳香族产物是对硝基苯酚离子。
不受任何特定理论的限制,由本发明的工程化酶催化的硫酸酯水解可在芳基硫酸酯化合物在酶的活性位点内结合时发生。如图2中所示,活性位点组氨酸残基咪唑环内碱性氮原子的孤对电子引发PNS内硫原子的亲核攻击,引起相邻C-O键水解并且形成磺基组氨酸中间体。第二步,磺基组氨酸中间体本身可在活性位点内被水分子亲核攻击,导致磺基从组氨酸侧链释放,并且使酶恢复到其反应前的状态。
通过利用组氨酸残基在活性位点内水解硫酸酯的反应机制,为本发明的工程化酶相对于其他已知硫酸酯酶创造独特的生态位。实际上,硫酸酯酶包括一类酶(EC 3.1.5.6),其在原核和真核物种中是顺序地、结构地和机械地高度保守的,具有细胞发育和解毒、硫清除、化合物降解和渗透保护等功能。天然硫酸酯酶中的这种相似性包括含有共有序列基序的高度保守N-末端序列区域,以及独特、翻译后修饰的活性位点醛基残基、α-甲酰甘氨酸,其是天然硫酸酯酶活性所必需的(参见Hanson,S.R.等人,(2004)Agnew.Chem.Int.Ed.43:5736-5763,其公开内容通过引用整体并入)。另外,天然硫酸酯酶是典型的大蛋白质,对于一些真核硫酸酯酶,通常包含大于500个氨基酸残基、包括至多约800个氨基酸残基。
不受特定理论限制,认为所有已知的天然水解硫酸酯酶都含有两个高度同源的氨基酸基序,它们先前已鉴定为硫酸酯酶指纹序列I和II,两者都发现于N-端序列区域(参见Hanson,S.R.等人,如上)。指纹序列I包含氨基酸C/S-X-P-S/X-R-X-X-X-L/X-T/X-G/X-R/X,然而指纹序列II包含氨基酸G-Y/V-X-S/T-X-X-X-G-K-X-X-H。两种指纹序列在天然硫酸酯酶的酶活性方面起着至关重要的作用。指纹序列I是指导活性位点的翻译后修饰以包含α-甲酰甘氨酸残基所必需的(下面进一步详述),和指纹序列II包含重要的结合接触,所述结合接触对于优化在包含α-甲酰甘氨酸的活性位点内的硫酸酯催化是重要的。
特别地,活性位点内存在α-甲酰基甘氨酸是天然硫酸酯酶中最显著的特征,迄今已在每个表征的原核和真核硫酸酯酶中发现(参见Uhlhorn-Dierls,G.等人,(1998)Agnew.Chem.37:2453,和Uhlhorn-Dierls,G.等人,(1998)Agnew.Chem.110:2591,其公开内容通过引用整体并入)。α-甲酰甘氨酸残基可以由半胱氨酸(最常见)或丝氨酸残基在活性位点内形成,其修饰已确定由指纹序列I指导。在指纹序列I内,鉴定五肽序列基序C/S-X-P-S/X-R不仅指导α-甲酰甘氨酸的形成,而且在催化过程中稳定活性位点内的α-甲酰甘氨酸残基。
基于几种天然硫酸酯酶的晶体结构,提出两种主要利用α-甲酰甘氨酸残基进行催化的反应机制。图3A所示的第一种机制提出,醛形式的α-甲酰甘氨酸残基受到底物中的其中一种硫酸酯基氧原子的亲核攻击,以形成硫酸二酯。然后通过亲核试剂(例如活化的水分子)的作用释放醇缀合物以形成硫酸酯半缩醛。随后醇对硫酸酯半缩醛内亲核中心的攻击导致从活性位点释放硫酸酯分子,使酶再生用于未来的催化。第二种机制,如图3B所示,水合形式的α-甲酰甘氨酸可以通过SN2反应亲核攻击硫酸酯原子,以形成硫酸酯半缩醛,最终从活性位点释放硫酸酯基,类似于图3A中的机制。随后加入水使α-甲酰基甘氨酸醛再水合以重新形成水合的α-甲酰基甘氨酸残基。
然而,并且在另一个实施方案中,本发明的工程化酶可以在不存在特征序列I、特征序列II和/或任何α-甲酰甘氨酸残基的情况下合成。在另一个实施方案中,不包含指纹序列I、指纹序列II和/或任何α-甲酰甘氨酸残基并且显示具有硫酸酯酶活性的酶(参见如下实施例)可选自:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:1S,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ IDNO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ ID NO:149,或SEQ ID NO:151。
在另一个实施方案中,具有硫酸酯酶活性的工程化酶可以包含与具有硫酸酯酶活性的任何上述多肽的氨基酸序列基本上相同或生物等同的氨基酸序列,如以下“核酸和多肽制备”部分中所定义。
因此,在另一个实施方案中,本发明提供酶促水解芳基硫酸酯化合物的方法,其包括以下步骤:提供芳基硫酸酯化合物;提供具有活性位点的工程化酶,所述活性位点配置为与芳基硫酸酯化合物和多糖、优选基于肝素前体的多糖结合;将芳基硫酸酯化合物和工程化酶组合到反应混合物中;和使用工程化酶催化芳基硫酸酯化合物的水解。在另一个实施方案中,芳基硫酸酯化合物选自PNS、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2NapS和NCS。在另一个实施方案中,芳基硫酸酯化合物是PNS。在另一个实施方案中,芳基硫酸酯化合物是NCS。在另一个实施方案中,芳基硫酸酯化合物是2NapS。在另一个实施方案中,芳基硫酸酯化合物的水解通过包括芳基硫酸盐化合物内硫原子的亲核攻击的机制进行,导致相邻的C-O键水解并且形成磺基组氨酸中间体。在另一个实施方案中,亲核攻击由组氨酸残基引发。
芳基硫酸酯依赖性磺基转移酶
在另一个实施方案中,并且如上所述,本发明的几种工程化酶具有与作为磺基供体的芳基硫酸酯化合物结合的磺基转移酶活性。在另一个实施方案中,磺基供体是多糖、优选基于肝素前体的多糖。在每个磺基转移反应中,芳基硫酸酯化合物作为磺基供体参与,同时多糖作为磺基受体参与。磺基转移酶识别多糖为磺基受体,而且与作为磺基供体的芳基硫酸酯化合物结合并且与其反应,这在自然界中并未观察到,并且先前也未描述过。
一种特定多糖,肝素前体,是体内合成大量硫酸化多糖的原料,特别是在真核生物中。通常,肝素前体由高尔基体内的生物体合成为糖胺聚糖(GAG),并且包含[β(1,4)GlcA-α(1,4)GlcNAc]n二糖单元的重复共聚物,其中GlcA是葡萄糖醛酸,GlcNAc是N-乙酰氨基葡萄糖。然后可以修饰肝素前体GAG,特别是通过一种或多于一种硫酸乙酰肝素(HS)-磺基转移酶,以形成功能化的基于肝素前体的多糖产物、特别是HS。肝素前体的这种修饰包括葡糖胺的N-脱乙酰化和N-硫酸化,形成艾杜糖醛酸的葡萄糖醛酸的C5-差向异构化、艾杜糖醛酸和/或葡萄糖醛酸的2-O硫酸化以及氨基葡萄糖残基的6-O硫酸化和3-O硫酸化。在体内催化肝素前体和基于肝素前体的多糖的N-乙酰化和N-硫酸化、2-O硫酸化、6-O硫酸化和3-O硫酸化的天然磺基转移酶排他性地识别并且与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯结合。不受特定理论限制,认为四种HS磺基转移酶中没有一种具有与任何作为磺基供体的芳基硫酸酯化合物结合的活性。
四种天然HS磺基转移酶中的每一种通常在单个步骤中催化磺基从3′-磷酸腺苷5′-磷酸硫酸酯盐直接转移至基于肝素前体的多糖。图4A、图4B和图4C说明由HS磺基转移酶催化的典型磺基转移反应机制的一个实例,其共同显示提出的机制、过渡态和在人氨基葡萄糖3-O磺基转移酶、3′-磷酸腺苷5′-磷酸硫酸酯盐和基于肝素前体的多糖之间的反应中形成的产物。特别地,在43位的谷氨酸残基从基于肝素前体的多糖内的N-、6-O硫酸化磺基氨基葡萄糖残基的3-O位提取质子,能够实现亲核攻击并且从3′-磷酸腺苷5′-磷酸硫酸酯中去除磺基,然而在从活性位点释放硫酸化多糖产物之前,His-45和Asp-48配位以稳定酶的过渡态。
然而,尽管3′-磷酸腺苷5′-磷酸硫酸酯是真核生物中唯一的磺基供体,但它的半衰期短并且可容易地分解成腺苷3′,5′-二磷酸,其在磺基转移反应中充当竞争性抑制剂。动物可有效利用3′-磷酸腺苷5′-磷酸硫酸酯,因为它们可代谢腺苷3′,5′-二磷酸以防止竞争性抑制,而且还根据需要为每个磺基转移反应补充3′-磷酸腺苷5′-磷酸硫酸酯。另一方面,可在有限数量的细菌系统中用作磺基供体的芳基硫酸酯化合物(参见Malojcic,G.等人,如上),不能与真核生物中任何已知的原生磺基转移酶反应,包括参与体内合成HS和其他基于肝素前体的多糖的那些。不受特定理论限制,认为真核磺基转移酶的活性位点内3′-磷酸腺苷5′-磷酸硫酸酯的结合口袋对芳基硫酸酯化合物没有足够高的亲和力来促进结合,和/或芳基硫酸酯化合物在空间上完全受阻无法进入活性位点。
硫酸乙酰肝素和其他基于肝素前体的多糖在体内各种重要的生物过程中发挥着关键作用,包括协助病毒感染、调节血液凝固和胚胎发育、抑制肿瘤生长以及通过与特异性调节蛋白相互作用来控制实验对象的饮食行为。根据作用,肝素前体多糖可包含一种或多于一种独特的模式或基序,其可被特定生物过程中涉及的特异性蛋白质识别。特别地,具有抗凝活性的硫酸乙酰肝素多糖,以及在体外合成这种多糖的途径,是制药行业非常感兴趣的话题。
本公开包括工程化磺基转移酶,在下文中进一步详细描述,其具有与作为磺基供体的芳基硫酸酯化合物和作为磺基受体的基于肝素前体多糖结合的活性。每种工程化磺基转移酶设计为相应的如下天然HS磺基转移酶的突变体:氨基葡萄糖N-磺基转移酶、己糖醛酸2-O磺基转移酶、氨基葡萄糖6-O磺基转移酶和氨基葡萄糖3-O磺基转移酶。在每种情况下,工程化磺基转移酶具有与作为磺基供体的一种或多于一种芳基硫酸酯化合物(而不是3′-磷酸腺苷5′-磷酸硫酸酯)结合的活性,但对于特定作为磺基受体的基于肝素前体的多糖保留原生HS-磺基转移酶的亲和力。作为一个非限制性实例,工程化己糖醛酸2-O磺基转移酶可具有与作为磺基供体的芳基硫酸酯化合物和作为磺基受体的N-硫酸化肝素前体结合的磺基转移酶活性。每种工程化磺基转移酶,包括它们的序列、结构和生物活性将在下面进一步详述。使用工程化磺基转移酶和芳基硫酸酯化合物体外合成基于硫酸化的基于肝素前体的多糖的方法也在下文中进行描述。在本发明的一些实施方案中,可体外合成具有抗凝活性的硫酸乙酰肝素多糖。
工程化氨基葡萄糖N-磺基转移酶
实际上,HS氨基葡萄糖N-磺基转移酶具有双重N-脱乙酰酶和N-磺基转移酶活性,其中相同酶首先催化从肝素前体内的氨基葡萄糖残基去除N-乙酰基,然后催化磺基从3′-磷酸腺苷5′-磷酸硫酸酯转移至第一步中N-脱乙酰化的相同氨基葡萄糖残基。酶的双重N-脱乙酰酶和N-磺基转移酶活性通过两个独立的结构域N-脱乙酰酶结构域和N-磺基转移酶结构域来实现。然而,一个结构域的活性不是另一个结构域活性的先决条件,并且可表达和纯化包含N-脱乙酰酶或N-磺基转移酶活性的重组单结构域酶。类似地,并且在本发明的一个实施方案中,具有氨基葡萄糖N-磺基转移酶活性的工程化酶可被表达并且纯化为单个N-磺基转移酶结构域,而不另外包含N-脱乙酰酶结构域。
利用3′-磷酸腺苷5′-磷酸硫酸酯作为磺基供体而具有N-磺基转移酶活性的天然存在的酶是EC 2.8.2.8酶类的成员。一般来说,N-脱乙酰酶结构域EC 2.8.2.8酶将使肝素前体内的一种或多于一种N-乙酰氨基葡萄糖残基脱乙酰以形成N-脱乙酰肝素前体,然后其可被酶的N-磺基转移酶结构域识别为磺基受体。然而,EC 2.8.2.8酶的N-磺基转移酶结构域显示具有与基于肝素前体的多糖结合的磺基转移酶活性,所述基于肝素前体的多糖包含一个或多于一个包含下式II结构的二糖单元:
其中n是整数并且R选自氢原子或磺基。此外,尽管多糖的与酶反应的部分包含式II的结构,但多糖内的其他氨基葡萄糖残基可以是N-硫酸化、N-乙酰化、3-O硫酸化和/或6-O硫酸化的,并且己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸,其任一都可2-O硫酸化。通常,包含式II结构的N-脱乙酰肝素前体和其他基于肝素前体的多糖包含至少四个二糖单元,或总共至少八个糖残基。其中利用N-脱乙酰肝素前体作为磺基受体的磺基转移反应讨论于Sheng,J.等人,(2011)J.Biol.Chem.286(22):19768-76以及Gesteira,T.F.等人,(2013)PLoS One 8(8):e70880中,其公开内容通过引用整体并入。
在成功结合3′-磷酸腺苷5′-磷酸硫酸酯和包含式II结构的基于肝素前体的多糖后,具有氨基葡萄糖N-磺基转移酶活性的天然EC 2.8.2.8酶可催化磺基转移至未经取代的氨基葡萄糖,形成包含下式III结构的N-硫酸化肝素前体产物:
其中n是整数并且R选自氢原子或磺基。
在另一个实施方案中,基于肝素前体的多糖内与任何工程化芳基硫酸酯依赖性氨基葡萄糖N-磺基转移酶反应的每个重复二糖单元都包含式II的结构。在进一步的实施方案中,在氨基葡萄糖残基的6-O位和葡萄糖醛酸残基的2-O位的R基团在多糖内的一个或多于一个(包括所有)二糖单元中都是氢原子。在另一个实施方案中,在多糖内的一些位置中,至少一部分氨基葡萄糖残基仍是N-乙酰化的,如图5中所示,尽管聚合物内N-乙酰化的氨基葡萄糖残基不能作为与本发明的工程化磺基转移酶结合的磺基受体直接参与。然而,多糖内N-乙酰化残基的存在不影响工程化磺基转移酶具有的对于相同多糖内非乙酰化残基的结合亲和力。在另一个实施方案中,无论基于肝素前体的多糖的结构如何,包含式II结构的二糖单元可用作与工程化氨基葡萄糖N-磺基转移酶和芳基硫酸酯化合物结合的磺基受体以生成包含式III结构的N-硫酸化产物。
在另一个实施方案中,当基于肝素前体的多糖中存在多个包含式II结构的二糖单元时,这些二糖单元任一个中的氨基葡萄糖残基都可被N-硫酸化。类似地,并且在另一个实施方案中,在包含多个具有式II结构的二糖单元的多糖中,多个氨基葡萄糖残基可被N-硫酸化,包括多糖内可用的所有氨基葡萄糖残基,和至多所有可用的所有氨基葡萄糖残基。
野生型EC 2.8.2.8酶的N-磺基转移酶结构域通常包含大约300个至350个氨基酸残基,它们的序列可相差很大,但最终具有完全相同的功能,即催化N-脱乙酰肝素前体内未经取代的氨基葡萄糖残基的N-硫酸化。不受特定理论限制,认为每种野生型EC 2.8.2.8酶都可催化相同的化学反应,因为在所有物种中存在多个相同或高度保守的氨基酸序列基序和二级结构。
此外,认为几个保守的氨基酸序列基序直接参与3′-磷酸腺苷5′-磷酸硫酸酯和/或多糖的结合或参与化学反应本身。天然酶的N-磺基转移酶结构域之间保守的氨基酸序列基序的同一性可通过如下表明:比较人EC 2.8.2.8酶的N-磺基转移酶结构域的氨基酸序列(其具有其中已鉴定活性位点内的氨基酸残基的已知晶体结构(PDB代码:1NST))和EC2.8.2.8酶类内其他天然磺基转移酶的N-磺基转移酶结构域的氨基酸序列。图6A、图6B和图6C显示15种酶的N-磺基转移酶结构域的多序列比对,包括几种真核生物和人酶的几种同工型,以及相对于人N-磺基转移酶的同一性百分比(UniProtKB登录号P52848)。如图6A、图6B和图6C中所示,序列范围从与大鼠N-磺基转移酶结构域的P52848参考序列具有98.4%序列同一性(条目sp|Q02353|NDST1_RAT)一直到果蝇N-磺基转移酶结构域的55.6%序列同一性(条目sp|Q9V3L1|NDST_DROME)。本领域技术人员将理解,为了清楚起见,多序列比对限于十五个序列,有编码其他野生型EC 2.8.2.8酶的N-磺基转移酶结构域的数百个氨基酸序列已进行鉴定的并且也具有高度保守的活性位点和/或结合区域。
在图6A、图6B和图6C中,在特定位置在黑色背景下以白色显示的氨基酸在所有序列中是100%同一性。高度保守的氨基酸,意指相同或在化学或结构上相似的氨基酸,在特定位置用黑色轮廓包围。在高度保守的区域内,大多数序列中存在的共有氨基酸以粗体显示。在特定位置不相同或高度保守的氨基酸通常是可变的。序列内的句点表示已插入序列中的间隙,以促进与在高度保守或相同区域之间具有另外残基的其他序列的序列比对。最后,基于比对中氨基酸的同一性并且使用野生型人N-磺基转移酶的结构作为参考,在每个序列块上方是一系列箭头和线圈,它们表示在所有序列中保守的二级结构。与箭头相邻的β符号是指β折叠,然而与α符号或η符号相邻的线圈是指螺旋二级结构。
在图6A、图6B和图6C中的15个比对序列中,基于人N-磺基转移酶结构域的晶体结构,有几个保守的氨基酸基序,这些基序包括一个或多于一个构成活性位点的氨基酸。这些保守的氨基酸序列基序,基于图6A、图6B和图6C内氨基酸残基的编号,包括残基40-46(Q-K-T-G-T-T-A);残基66-69(T-F-E-E);残基101-105(F-E-K-S-A);残基139-143(S-W-Y-Q-H);和残基255-262(C-L-G-K/R-S-K-G-R)。在进一步的实施方案中,EC 2.8.2.8内野生型磺基转移酶包含保守的氨基酸序列基序Q-K-T-G-T-T-A的一些同工型还包含来自残基40-49的扩展的保守氨基酸序列基序Q-K-T-G-T-T-A-L-Y-L。
不受特定理论限制,认为这些残基促进或参与化学反应,或能够在活性位点内结合3′-磷酸腺苷5′-磷酸硫酸酯或多糖。特别地并且如图7A、图7B和图7C中所示,在143位(对应于还包括N-脱乙酰酶结构域的全长天然磺基转移酶的氨基酸序列中的位置716)的组氨酸残基处于提取多糖内未经取代的氨基葡萄糖残基的胺官能团内的两个质子之一的位置,使氮原子能够引发3′-磷酸腺苷5′-磷酸硫酸酯的亲核攻击并且去除硫酰基。另外,在41位和260位的赖氨酸残基也普遍是保守的,认为与硫酰基部分配位,驱动活性位点内3′-磷酸腺苷5′-磷酸硫酸酯的结合,以及稳定反应过程中的过渡态(参见上述Gesteira,T.F.等人,以及Sueyoshi,T.等人,(1998)FEBS Letters 433:211-214,其公开内容通过引用整体并入)。
然而,如上所述,EC 2.8.2.8内天然磺基转移酶不能够催化硫酸酯基从芳基硫酸酯化合物转移至多糖,因为认为天然磺基转移酶的活性位点内3′-磷酸腺苷5′-磷酸硫酸酯的结合口袋对芳基硫酸酯化合物没有足够高的亲和力来促进结合和/芳基硫酸酯化合物在空间上被阻碍进入活性位点。因此,并且在另一个实施方案中,EC 2.8.2.8酶可在其氨基酸序列内的多个位置发生突变,以实现芳基硫酸酯化合物在活性位点内的结合和/或优化芳基硫酸酯化合物的定位,从而可使硫酸酯基转移至多糖。
因此,并且在另一个实施方案中,本发明的工程化氨基葡萄糖N-磺基转移酶可包含相对于EC 2.8.2.8内任何天然酶的N-磺基转移酶结构域突变的单个N-磺基转移酶结构域,包括具有图6A、图6B和图6C中所示氨基酸序列的酶。在其他实施方案中,本发明的工程化氨基葡萄糖N-磺基转移酶还可包含N-脱乙酰酶结构域,其具有与EC 2.8.2.8内任何天然酶的N-脱乙酰酶结构域相同或突变的氨基酸序列。
在另一个实施方案中,工程化为工程化氨基葡萄糖N-磺基转移酶的氨基酸序列的突变促进生物活性,其中芳基硫酸酯化合物可以结合作为磺基供体的酶并且与其反应。在另一个实施方案中,尽管工程化氨基葡萄糖N-磺基转移酶可结合作为磺基供体的芳基硫酸酯化合物并且与其反应,但它们保留天然EC2.8.2.8酶与作为磺基受体的基于肝素前体的多糖结合的生物活性,所述基于肝素前体的多糖包含具有式II结构的二糖单元的,包括但不限于N-脱乙酰肝素前体。不受特定理论限制,认为由于插入工程化氨基葡萄糖N-磺基转移酶的氨基酸序列的突变,它们的磺基转移酶活性可包括磺基从芳基硫酸酯化合物直接转移至磺基受体多糖,其使用与上图7A至图7C中所述的类似机制,不同之处在于3′-磷酸腺苷5′-磷酸硫酸酯被芳基硫酸酯化合物取代。在其他方面,认为突变可导致磺基转移酶活性包括两步过程,包括芳基硫酸酯化合物的水解和磺基组氨酸中间体的形成,然后是N-脱乙酰肝素前体中的N-未经取代的氨基葡萄糖对磺基组氨酸中间体的亲核攻击以形成N-硫酸化产物。通过任一机制,工程化氨基葡萄糖N-磺基转移酶能够实现磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖,如下面的实施例中所述。
在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶可包含相对于EC 2.8.2.8内天然酶的N-磺基转移酶结构域中发现的保守的氨基酸序列基序突变的一个或多于一个氨基酸序列基序,如上所述并且表示于图6A、图6B和图6C的多序列比对中。在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶的氨基酸序列中存在的每个突变的氨基酸序列基序包含相对于EC 2.8.2.8内天然酶的N-磺基转移酶结构域内相应保守的氨基酸序列基序的至少一个氨基酸突变。在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶包含一个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶包含两个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶包含三个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶包含四个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶包含五个突变的氨基酸序列基序。在另一个实施方案中,包括相对于EC 2.8.2.8内任何天然氨基葡萄糖N-磺基转移酶的N-磺基转移酶结构域的至少一个突变的氨基酸序列基序的工程化氨基葡萄糖N-磺基转移酶,可具有选自如下的氨基酸序列:
SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ IDNO:15,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ IDNO:23,SEQ ID NO:24,和SEQ ID NO:25。
在另一个实施方案中,在3D分子可视化系统(包括作为非限制性实例的开源软件PyMOL)中查看人N-脱乙酰酶/N-磺基转移酶(PDB代码:1NST)的N-磺基转移酶结构域的晶体结构后,相关序列的结构,例如含有相对于人N-磺基转移酶结构域的一个或多于一个突变的氨基酸序列基序的工程化氨基葡萄糖N-磺基转移酶的结构,可以建模用于比较,如图8至图11中所示。在一个非限制性实例中,图8显示人N-磺基转移酶结构域的活性位点的放大视图,所述人N-磺基转移酶结构域与包含SEQ ID NO:13的氨基酸序列的工程化氨基葡萄糖N-磺基转移酶重叠,其中在相对于人N-磺基转移酶结构域氨基酸序列产生突变后计算工程化酶的结构。活性位点内也表明了腺苷3′,5′-二磷酸,其为3′-磷酸腺苷5′-磷酸硫酸酯作为磺基供体的磺基转移反应的产物,并且与人N-磺基转移酶结构域共结晶。PNS也建模到工程化酶活性位点,其使用设计为计算多糖结合位点(未示出)相邻的酶活性位点内配体的优化位置和取向的分子动力学(MD)模拟的共有解决方案,如果这样的解决方案是可能的话。
如图8所示,尽管在SEQ ID NO:13内有相对于图6A、图6B和图6C中所示的人N-磺基转移酶结构域(UniProtKB登录号P52848)的序列的几个突变,但各自的蛋白质骨架彼此几乎处于相同的位置,从而能够对活性位点进行一对一的比较。在包含SEQ ID NO:13序列的工程化酶的结构内,来自MD模拟的共有解决方案表明PNS内的硫酸酯部分有利于与组氨酸残基His-45相邻结合,其相对于EC 2.8.2.8内也普遍保守的天然氨基酸残基苏氨酸已突变。另一方面,在人N-磺基转移酶结构域内,腺苷3′,5′-二磷酸位于上述保守His-143附近。尽管未显示3′-磷酸腺苷5′-磷酸硫酸酯底物内会包含的磺基,但本领域技术人员会理解,如果存在3′-磷酸腺苷5′-磷酸硫酸酯,则硫酸酯基会在紧邻His-143并且与PNS内的硫酸酯基部分重叠的位置中取向。不受特定理论限制,认为硫酸酯基的几乎重叠位置说明工化酶通过使用His-143作为碱基来促进磺基转移,以从多糖内的氨基葡萄糖残基中去除质子的能力。
然而,即使硫酸酯基可在活性位点内几乎相同的位置结合,芳基硫酸酯化合物也不能与天然EC 2.8.2.8酶一起使用以促进磺基转移至多糖。如上所述,天然酶活性位点内的氨基酸残基进化为对3′-磷酸腺苷5′-磷酸硫酸酯具有强的结合亲和力,并认为酶可能对芳基硫酸酯化合物没有足够的亲和力来驱动结合和磺基转移酶活性。因此,工程化酶中必须存在其他突变,以驱动芳基硫酸酯化合物在活性位点内的结合。图9说明包含SEQ ID NO:13氨基酸序列的工程化酶内围绕PNS的其他突变,包括Trp-106、His-69和His-40。PNS碳原子以白色表示,以帮助在视觉上区分PNS和Trp-106和His-69,它们的位置提供π-π堆积与PNS内的芳香族部分的结合接触。另外,His-69和His-40内的ε2氮原子与硫酰基直接配位。从天然酶序列中保留的赖氨酸残基,Lys-41(为了清楚起见,未示出)和Lys-103在转移过程中与硫酸酯基配位以便稳定过渡态。值得注意的是,还与3′-磷酸腺苷5′-磷酸硫酸酯中的硫酸酯基配位的天然氨基酸残基Lys-260,在工程化酶序列中突变为缬氨酸残基。不受特定理论限制,认为与PNS反应所必需的His-45,将显示出与在260位的赖氨酸残基的电荷排斥,并且缬氨酸残基的突变在结合位点内保留一些空间体积同时消除电荷排斥。尽管如此,Lys-103仍处于与硫酰基配位的位置,特别是当硫酰基与His-45联结或结合时,如图9中所示。
在另一个非限制性实例中,图10显示人N-磺基转移酶结构域(UniProtKB登录号P52848)的活性位点的放大视图,所述人N-磺基转移酶结构域与不同工程化氨基葡萄糖N-磺基转移酶重叠,其包含SEQ ID NO:5的氨基酸序列。PNS建模到工程化酶活性位点中,如上所述。与包含氨基酸序列SEQ ID NO:13的工程化酶一样,包含SEQ ID NO:5的氨基酸序列的工程化酶的蛋白质骨架也具有与人酶的N-磺基转移酶结构域几乎相同的结构。然而,来自MD模拟的共有解决方案表明,PNS中的硫酸酯部分有利于与不同组氨酸突变(His-49)相邻结合,该组氨酸突变是从几种EC 2.8.2.8酶的N-磺基转移酶结构域活性位点中保守的天然亮氨酸残基突变而来的。因此,SEQ ID NO:13内与PNS形成结合接触的突变未必存在于SEQID NO:5中。如图11中所示并且类似于SEQ ID NO:13,在SEQ ID NO:5中存在两个突变,它们形成围绕PNS、Trp-45和His-67的芳香族部分的π-π堆积结合接触。包含与PNS配位的侧链的其他突变包括Ser-69(与PNS的硝基官能团配位)和His-260(与硫酸酯部分配位)。类似于SEQ ID NO:13,因为在260位的天然赖氨酸残基发生突变,所以在SEQ ID NO:5中利用天然Lys-103残基与PNS中的硫酸酯部分配位。
本领域技术人员会理解,任何其他氨基酸序列的工程化氨基葡萄糖N-磺基转移酶,包括但不限于SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24和SEQ ID NO:25所述的那些,可能表现出与人N-磺基转移酶结构域和具有SEQ IDNO:5和SEQ ID NO:13氨基酸序列的工程化氨基葡萄糖N-磺基转移酶类似的结构。不受特定理论的限制,还认为NCS将在与PNS类似的位置结合在任何工程化氨基葡萄糖N-磺基转移酶的活性位点内,因为两种芳基硫酸酯化合物的结构非常相似,不同之处在于硫酸酯基位于芳环上相对于硝基的邻位,而不是硝基的对位。
此外,本发明的工程化氨基葡萄糖N-磺基转移酶可包括突变的氨基酸序列基序,其包含一个或多于一个上述突变以及促进底物结合、磺基转移反应或蛋白质表达过程中酶稳定性的其他突变。在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶可包括突变的氨基酸序列基序X1-K-T-G-A-W/F-A/L-L-X2-H,其从EC 2.8.2.8内保守的氨基酸序列Q-K-T-G-T-T-A-L-Y-L突变而来,其中X1选自谷氨酰胺、丝氨酸和丙氨酸;X2选自酪氨酸、苏氨酸和组氨酸。包括突变的氨基酸序列基序X1-K-T-G-A-W/F-A/L-L-X2-H的工程化氨基葡萄糖N-磺基转移酶包括但不限于SEQ ID NO:5(如上所述)以及SEQ ID NO:7、SEQ ID NO:15;SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:21和SEQ ID NO:25。在进一步的实施方案中,工程化氨基葡萄糖N-磺基转移酶还可包括突变的氨基酸序列基序T-X3-X4-S,其从保守的氨基酸序列T-F-E-E突变而来,其中X3是相对于EC 2.8.2.8内天然磺基转移酶的突变,选自组氨酸和甘氨酸:X4是相对于EC 2.8.2.8内天然磺基转移酶的突变,其选自甘氨酸、组氨酸和丝氨酸;其中X3和X4中至少一个是组氨酸残基。在一些更进一步的实施方案中,X1是谷氨酰胺,X2是酪氨酸,X3是组氨酸,X4是甘氨酸,并且工程化氨基葡萄糖N-磺基转移酶还包含突变的氨基酸序列基序C-L-G-K/R-S-H-G-R。在其他更进一步的实施方案中,X1是丝氨酸,X2是苏氨酸,X3是甘氨酸,X4是组氨酸,和工程化氨基葡萄糖N-磺基转移酶还包含突变的氨基酸序列基序C-H-G-K/R-R-W-G-R。还在其他更进一步的实施方案中,X1是丙氨酸,X2是组氨酸,X3是组氨酸,X4是丝氨酸,并且工程化氨基葡萄糖N-磺基转移酶还包含突变的氨基酸序列基序C-A-H-K/R-G-L-G-R。
在另一个实施方案中,工程化氨基葡萄糖N-磺基转移酶可包括突变的氨基酸序列基序H-X5-T-G-X6-H-A,其从保守的氨基酸序列Q-K-T-G-T-T-A突变而来,其中X5选自赖氨酸和甘氨酸;X6是相对于EC 2.8.2.8内天然磺基转移酶的突变,其选自甘氨酸和缬氨酸。包括突变的氨基酸序列基序H-X5-T-G-X6-H-A的工程化氨基葡萄糖N-磺基转移酶,包括但不限于SEQ ID NO:13(如上所述)以及SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:23和SEQ ID NO:24。在进一步的实施方案中,X5是甘氨酸和X6是甘氨酸。在一些更进一步的实施方案中,工程化氨基葡萄糖N-磺基转移酶还包含突变的氨基酸序列基序C-G-G-K/R-H-L-G-R。在其他更进一步的实施方案中,工程化氨基葡萄糖N-磺基转移酶还包含突变的氨基酸序列基序F-E-H-S-G。
在另一个实施方案中,包括突变的氨基酸序列基序H-X5-T-G-X6-H-A的任何工程化氨基葡萄糖N-磺基转移酶内,X5选自赖氨酸和甘氨酸;X6是相对于EC 2.8.2.8内天然磺基转移酶的突变,其选自甘氨酸和缬氨酸。在进一步的实施方案中,选择X5为赖氨酸,选择X6为缬氨酸,并且工程化氨基葡萄糖N-磺基转移酶还包含突变的氨基酸序列基序T-G-N-H。
此外,实验确定对作为磺基供体的芳基硫酸酯化合物具有活性(参见如下实施例3)的六种工程化氨基葡萄糖N-磺基转移酶的氨基酸序列(SEQ ID NO:5、SEQ ID NO:7 SEQID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15),可在多序列比对中与人氨基葡萄糖N-脱乙酰酶/N-磺基转移酶的N-磺基转移酶结构域的氨基酸序列(条目sp|P52848|NDST1_HUMAN)进行比较以确定每种酶中的突变之间是否存在关系。工程化酶的氨基酸序列中的句点表示在特定位置与人N-磺基转移酶结构域的同一性。如图12中所示,序列比对表明,虽然六个磺基转移酶序列中超过90%的氨基酸残基是相同的,但有几个位置可选择多个氨基酸。不受特定理论限制,这些酶与包含EC 2.8.2.8的N-脱乙酰酶/N-磺基转移酶的N-磺基转移酶结构域具有彼此相似的关系。因此,并且在另一个实施方案中,包含其中可在定义的位置选择多个氨基酸的氨基酸序列的工程化氨基葡萄糖N-磺基转移酶公开为SEQ IDNO:18和SEQ ID NO:19。可以从可能残基的选择中选择氨基酸同一性的位置用术语“Xaa”、“Xn”或“n位”表示,其中n是指残基位置。
在另一个实施方案中,在包含SEQ ID NO:18或SEQ ID NO:19氨基酸序列的工程化氨基葡萄糖N-磺基转移酶内,在41位的氨基酸残基是赖氨酸,在44位的氨基酸残基是丙氨酸,在45位的氨基酸残基是芳香族氨基酸残基,优选酪氨酸或苯丙氨酸,并且在49位的氨基酸残基是组氨酸。在另一个实施方案中,当工程化氨基葡萄糖N-磺基转移酶包含来自位置41-49的上述残基时,在67位的氨基酸残基是甘氨酸或组氨酸,在68位的氨基酸残基选自甘氨酸、组氨酸和丝氨酸,并且在69位的氨基酸残基是丝氨酸。
在另一个实施方案中,在包含SEQ ID NO:18或SEQ ID NO:19的氨基酸序列的工程化氨基葡萄糖N-磺基转移酶内,在40位的氨基酸残基是组氨酸,在45位的氨基酸残基是组氨酸。在进一步的实施方案中,在41位的氨基酸残基是甘氨酸,在44位的氨基酸残基是甘氨酸。在其他进一步的实施方案中,在41位的氨基酸残基是赖氨酸,在44位的氨基酸残基是缬氨酸。在更进一步的实施方案中,在67位的氨基酸残基是甘氨酸,在69位的氨基酸残基是组氨酸。还在进一步的实施方案中,在106位的氨基酸残基是色氨酸。还在更进一步的实施方案中,在260位的氨基酸残基是缬氨酸。
在另一个实施方案中,在包含SEQ ID NO:18或SEQ ID NO:19的氨基酸序列的工程化氨基葡萄糖N-磺基转移酶内,氨基酸序列可任选地在未由“Xn”或“Xaa”指定的残基位置包括一个或多于一个突变,只要任何这种突变不消除氨基葡萄糖N-磺基转移酶和/或该酶的芳基硫酸酯依赖性活性即可。在另一个实施方案中,在未由“Xn”或“Xaa”指定的位置未消除芳基硫酸酯依赖性活性的这种突变可包括置换、缺失和/或添加。
因此,在另一个实施方案中,根据本发明的任何方法使用的工程化氨基葡萄糖N-磺基转移酶可包含选自如下的氨基酸序列:SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25。在另一个实施方案中,包含如下氨基酸序列的工程化氨基葡萄糖N-磺基转移酶可与任何芳基硫酸酯化合物反应:SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24和SEQ ID NO:25。在进一步的实施方案中,芳基硫酸酯化合物选自PNS、MUS、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2NapS和NCS。在一些更进一步的实施方案中,芳基硫酸酯化合物是PNS。在其他更进一步的实施方案中,芳基硫酸酯化合物是NCS。
工程化己糖醛酸2-O磺基转移酶
实际上,HS己糖醛酸2-O磺基转移酶识别、结合N-硫酸化为磺基受体的基于肝素前体的多糖并且与其反应。一般来说,大多数氨基葡萄糖残基N-硫酸化并且磺基转移至己糖醛酸残基、通常葡萄糖醛酸或艾杜糖醛酸的2-O位置。如上述野生型氨基葡萄糖N-磺基转移酶,野生型己糖醛酸2-O磺基转移酶在与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应时将磺基转移至多糖。然而,野生型己糖醛酸2-O磺基转移酶是EC 2.8.2.-酶类的成员。由野生型HS己糖醛酸2-O磺基转移酶识别的基于肝素前体的多糖通常包含两个不同结构基序中的至少一个。在第一非限制性实例中,天然己糖醛酸2-O磺基转移酶可识别、结合具有下式IV结构的多糖并且与其反应:
在另一个非限制实例中,天然HS己糖醛酸2-O磺基转移酶可识别、结合具有下式V结构的多糖并且与其反应:
在两种情况下,己糖醛酸残基(式IV中的葡萄糖醛酸,式V中的艾杜糖醛酸)在两侧是N-硫酸化氨基葡萄糖残基,其在3-O和6-O位是未经取代的。野生型HS己糖醛酸2-O磺基转移酶,及它们与包含式IV或式V结构的多糖结合的生物活性由Rong,J.等人,(2001)Biochemistry 40(18):5548-5555进行了描述,其公开内容通过引用整体并入。
如上所述,虽然与酶反应的基于肝素前体的多糖的部分包含式IV或式V的结构,但多糖内的其他氨基葡萄糖残基可以是N-硫酸化、N-乙酰化、3-O硫酸化和/或6-O硫酸化的,并且己糖醛酸残基可以是葡糖醛酸或艾杜糖醛酸,其任何一个都可以进行2-O硫酸化。类似地,基于肝素前体的多糖可在相同多糖中包含一个或多于一个包含式IV结构和/或式V结构的结构基序,其任一都可被相同酶2-O硫酸化。通常,包含式IV和/或式V结构的基于N-硫酸化肝素前体的多糖包含至少八个单糖残基。在另一个实施方案中,本发明的工程化己糖醛酸2-O磺基转移酶具有如EC 2.8.2.-内野生型己糖醛酸2-O磺基转移酶一样的与作为磺基受体的基于肝素前体的多糖、特别是包含式IV和式V结构的那些结合的相同生物活性。
包含式IV或式V结构的基于肝素前体的多糖中己糖醛酸残基的立体化学可通过葡糖醛酸C5-差向异构酶的存在来控制,所述葡糖醛酸C5-差向异构酶可逆地反转己糖醛酸残基C5碳的立体化学。然而,一旦包含式IV或式V结构的多糖内的己糖醛酸残基进行2-O硫酸化,则醛酸残基不能再差向异构。一般来说,可在体内与己糖醛酸2-O磺基转移酶反应的N-硫酸化多糖几乎完全合成为N-磺基氨基葡萄糖和葡萄糖醛酸的二糖单元。这些葡萄糖醛酸残基中的一个或多于一个在与己糖醛酸2-O磺基转移酶反应之前经常差向异构化为艾杜糖醛酸残基以形成2-O硫酸化艾杜糖醛酸残基。然而,并且不受特定理论限制,认为野生型己糖醛酸2-O磺基转移酶通常优先与包含式V结构的基于肝素前体的多糖结合和反应,并且体内产生的大多数N,2O-HS多糖通常包含2-O硫酸化艾杜糖醛酸。
在成功结合3′-磷酸腺苷5′-磷酸硫酸酯和包含式IV结构的基于肝素前体的多糖后,具有己糖醛酸2-O磺基转移酶活性的天然酶可催化磺基转移至葡萄糖醛酸残基的2-O位,形成包含下式VI结构的N,2O-HS产物:
在成功结合3′-磷酸腺苷5′-磷酸硫酸酯和包含式V结构的基于肝素前体的多糖后,具有己糖醛酸2-O磺基转移酶活性的天然酶可催化磺基转移至艾杜糖醛酸残基的2-O位置,形成包含下式VII结构的N,2O-HS产物:
在另一个实施方案中,为了进行2-O硫酸化,葡萄糖醛酸或艾杜糖醛酸残基必须与如式IV和式V中所示的两个N-硫酸化氨基葡萄糖残基相邻。一种这样的多糖的一个非限制性实例示于图13中。在图13中,多糖40内的己糖醛酸残基10的两侧分别是N-硫酸化、N-乙酰化或未经取代的氨基葡萄糖残基20、21和22。在另一个实施方案中,在多糖40与工程化己糖醛酸2-O磺基转移酶反应后,只有两侧是两个N-硫酸化氨基葡萄糖残基20的己糖醛酸残基10可进行2-O硫酸化,最终在产物多糖41内形成2-O硫酸化己糖醛酸残基110。
在另一个非限制实例中,包含式IV和式V结构的基于肝素前体的多糖的部分通过图14、图15和图16各自的多糖50来说明。在图14、图15和图16中,己糖醛酸残基10和差向异构化己糖醛酸残基30在多糖50内的三个N-磺基氨基葡萄糖残基20之间交替。尽管己糖醛酸残基10和30以椅式构象表示,但本领域技术人员可以理解,较长的寡糖或多糖链中的这种单糖残基可采用几种不同构象,包括椅式、半椅式、船式、扭式和扭船型构象,为了清楚起见,省略那些另外的构象。
在另一个实施方案中,在多糖50与工程化芳基硫酸酯依赖性己糖醛酸2-O磺基转移酶反应后,酶可催化磺基转移至己糖醛酸残基10以在产物多糖51内形成硫酸化己糖醛酸残基110(图14),转移至差向异构化己糖醛酸残基30以在产物多糖52内形成硫酸化差向异构化己糖醛酸残基130(图15),或转移至己糖醛酸残基10和差向异构化己糖醛酸残基30两者以在产物多糖53内分别形成硫酸化己糖醛酸残基110和硫酸化差向异构化己糖醛酸残基130(图16)。
EC 2.8.2.-内天然己糖醛酸2-O磺基转移酶通常包含大约325个至375个氨基酸残基,在一些情况下它们的序列相差很大,但最终具有完全相同的功能,即催化磺基从3′-磷酸腺苷5′-磷酸硫酸酯转移至基于肝素前体的多糖、特别是包含式IV和/或式V结构的那些内己糖醛酸残基的2-O位置。不受特定理论限制,认为EC 2.8.2.-内每种天然己糖醛酸2-O磺基转移酶可催化相同的化学反应,因为在所有物种中存在相同或高度保守的多个氨基酸序列基序和二级结构。
此外,认为几个保守的氨基酸序列基序直接参与3′-磷酸腺苷5′-磷酸硫酸酯和/或多糖的结合或参与化学反应本身。天然己糖醛酸2-O磺基转移酶之间的同一性可通过如下表明:比较鸡己糖醛酸2-O磺基转移酶的氨基酸序列(其具有其中已鉴定活性位点内的氨基酸残基的已知晶体结构(PDB代码:3F5F和4NDZ))与EC 2.8.2.-内其他己糖醛酸2-O磺基转移酶的氨基酸序列。十二种酶,包括鸡、人和其他真核HS己糖醛酸2-O磺基转移酶的多序列比对,连同相对于鸡己糖醛酸2-O磺基转移酶参考序列(UniProtKB登录号Q76KB1)的同一性百分比,示于图17A、图17B、图17C和图17D中。如图17A、图17B、图17C和图17D中所示,序列范围从具有与粗鳞响尾蛇己糖醛酸2-O磺基转移酶的Q76KB1参考序列94.9%的序列同一性(条目tr|T1DMV2|T1DMV2_CROHD)一直到与棕耳蜱己糖醛酸2-O磺基转移酶56.3%的序列同一性(条目tr|A0A131Z2T4|A0A131Z2T4_RHIAP)。人酶(条目sp|Q7LGA3|HS2ST_HUMAN)具有与Q76KB1参考序列94.1%的序列同一性。本领域技术人员会理解,为了清楚起见,多序列比对限于十二个序列,有编码天然HS己糖醛酸2-O磺基转移酶的数百个氨基酸序列已进行鉴定并且也具有高度保守的活性位点和/或结合区域。
在图17A、图17B、图17C和图17D中,在特定位置在黑色背景下以白色描绘的氨基酸在所有序列中是100%相同的。高度保守的氨基酸,意指相同或在化学或结构上相似的氨基酸,在特定位置用黑色轮廓包围。在高度保守的区域内,大多数序列中存在的共有氨基酸以粗体显示。在特定位置不相同或高度保守的氨基酸通常是可变的。序列内的句点表示已插入序列中的间隙,以促进与在高度保守或相同区域之间具有另外残基的其他序列的序列比对。最后,基于比对中氨基酸的同一性并且使用天然鸡HS己糖醛酸2-O磺基转移酶的结构作为参考,在每个序列块上方是一系列箭头和线圈,它们表示在所有序列中保守的二级结构。与箭头相邻的β符号是指β折叠,然而与α符号或η符号相邻的线圈是指螺旋二级结构。
在图17A、图17B、图17C和图17D中的12个比对序列中,基于上述鸡HS己糖醛酸2-O磺基转移酶的晶体结构,有几个保守的氨基酸基序,所述基序包括一个或多于一个构成活性位点的氨基酸。基于图17A、图17B、图17C和图17D中氨基酸残基的编号,这些基序包括残基12-19(R-V-P-K-T-A/G-S-T),残基40-44(N-T-S/T-K-N),残基71-74(Y-H-G-H),残基108-115(F-L-R-F/H-G-D-D/N-F/Y),残基121-125(R-R-K/R-Q-G),和残基217-222(SH-L-R-K/R-T)。不受特定理论限制,认为这些残基促进或参与化学反应,或能够在活性位点内结合3′-磷酸腺苷5′-磷酸硫酸酯或多糖。特别地并且如图18A、图18B和图18C中所示,在74位的组氨酸残基从多糖内艾杜糖醛酸残基的2-O位置提取质子,能够亲核攻击并且将磺基从3′-磷酸腺苷5′-磷酸硫酸酯中去除,然而在15位的赖氨酸残基与3′-磷酸腺苷5′-磷酸硫酸酯的硫酸酯部分配位以在从活性位点释放N,2O-HS产物之前稳定酶的过渡态。
然而,如上所述,EC 2.8.2.-内天然己糖醛酸2-O磺基转移酶不能够催化硫酸酯基从芳基硫酸酯化合物转移至多糖。与天然氨基葡萄糖N-磺基转移酶一样,认为天然磺基转移酶的活性位点内3′-磷酸腺苷5′-磷酸硫酸酯的结合口袋对芳基硫酸酯化合物不具有足够高的亲和力来促进结合和/或芳基硫酸酯化合物在空间上受到阻碍不能进入活性位点。因此,并且在另一个实施方案中,EC2.8.2.-内野生型己糖醛酸2-O磺基转移酶可在其氨基酸序列内的几个位置进行突变以能够在活性位点内结合芳基硫酸酯化合物和/或优化芳基硫酸酯化合物的位置,从而可使硫酸酯基转移至多糖。
因此,并且在另一个实施方案中,本发明的工程化己糖醛酸2-O磺基转移酶可以是EC 2.8.2.-内天然己糖醛酸2-O磺基转移酶,包括具有图17A、图17B、图17C和图17D中所示氨基酸序列的酶的突变体。
在另一个实施方案中,工程化为工程化己糖醛酸2-O磺基转移酶的氨基酸序列中的突变促进生物活性,其中芳基硫酸酯化合物可结合作为磺基供体的酶并且与其反应。在另一个实施方案中,尽管工程化己糖醛酸2-O磺基转移酶可结合作为磺基供体的芳基硫酸酯化合物并且与其反应,但它们可保留天然己糖醛酸2-O磺基转移酶与作为磺基受体的N-硫酸化的基于肝素前体的多糖、特别是包含式IV和/或式V结构的那些结合的生物活性。不受特定理论限制,认为由于插入工程化己糖醛酸2-O磺基转移酶的氨基酸序列的突变,它们的磺基转移酶活性可包括磺基从芳基硫酸酯化合物直接转移至基于肝素前体的多糖,其使用如上图18A至图18C中所述的类似机制,不同之处在于3′-磷酸腺苷5′-磷酸硫酸酯被芳基硫酸酯化合物取代。在其他方面,认为突变可导致磺基转移酶活性包括两步过程,包括芳基硫酸酯化合物的水解和磺基组氨酸中间体的形成,然后是己糖醛酸残基的2-O位置的氧原子亲核攻击磺基组氨酸中间体,以形成N,2O-HS产物。通过任一机制,工程化己糖醛酸2-O磺基转移酶能够实现磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖,如下面的实施例中所述。
在另一个实施方案中,工程化己糖醛酸2-O磺基转移酶可包含相对于EC2.8.2.-内天然己糖醛酸2-O磺基转移酶中发现的保守的氨基酸序列基序的一个或多于一个突变的氨基酸序列基序,如上所述并且指示于图17A、图17B、图17C和图17D中的多序列比对。在另一个实施方案中,存在于工程化酶的氨基酸序列中每个突变的氨基酸序列基序包含相对于天然己糖醛酸2-O磺基转移酶内相应保守的氨基酸序列基序的至少一个氨基酸突变。在另一个实施方案中,工程化己糖醛酸2-O磺基转移酶可包含一个突变的氨基酸序列基序。在另一个实施方案中,工程化己糖醛酸2-O磺基转移酶可包含两个突变的氨基酸序列基序。在另一个实施方案中,工程化己糖醛酸2-O磺基转移酶可包含三个突变的氨基酸序列基序。在另一个实施方案中,工程化己糖醛酸2-O磺基转移酶可包含四个突变的氨基酸序列基序。在另一个实施方案中,工程化己糖醛酸2-O磺基转移酶可包含五个突变的氨基酸序列基序。在另一个实施方案中,工程化己糖醛酸2-O磺基转移酶可包含六个突变的氨基酸序列基序。在另一个实施方案中,包括相对于EC 2.8.2.-内任何野生型己糖醛酸2-O磺基转移酶的至少一个突变氨基酸序列基序的工程化己糖醛酸2-O磺基转移酶可具有选自如下的氨基酸序列:SEQID NO:63、SEQ ID NO:65、SEQ ID NO:68和SEQ ID NO:69。
在另一个实施方案中,在3D分子可视化系统(包括作为非限制性实例的开源软件PyMOL)中查看鸡己糖醛酸2-O磺基转移酶(PDB代码:3F5F)的晶体结构后,相关序列的结构,例如相对于鸡己糖醛酸2-O磺基转移酶氨基酸序列含有一个或多于一个突变氨基酸序列基序的工程化己糖醛酸2-O磺基转移酶的那些,可以建模用于比较,如图19所示。图19显示与包含SEQ ID NO:63和SEQ ID NO:65氨基酸序列的两种工程化己糖醛酸2-O磺基转移酶重叠的鸡己糖醛酸2-O磺基转移酶活性位点的放大视图,其中工程化酶的结构相对于鸡己糖醛酸2-O磺基转移酶氨基酸序列进行突变后来计算。活性位点内也说明了腺苷3′,5′-二磷酸,其为3′-磷酸腺苷5′-磷酸硫酸酯是磺基供体的磺基转移反应的产物,并且与鸡己糖醛酸2-O磺基转移酶共结晶。将天然底物中会存在的3′-磷酸腺苷5′-磷酸硫酸酯中的硫酸酯基建模到5′-磷酸酯官能团上,以说明其在启动反应之前在活性位点内的大致位置。NCS也建模到工程酶的活性位点中,其使用分子动力学(MD)模拟的共识解决方案,其设计为计算与多糖结合位点(未示出)相邻的酶活性位点内配体的优化位置和取向,如果这样的解决方案是可能的话。未显示氢原子。
如图19中所示,尽管相对于鸡己糖醛酸2-O磺基转移酶,使SEQ ID NO:63和SEQ IDNO:65进行几个突变,但各自的蛋白质骨架处于彼此几乎相同的位置,能够一对一地比较活性位点。当比较两个活性位点时,3′-磷酸腺苷5′-磷酸硫酸酯位于背景中并且与赖氨酸残基相邻(图17A中Q76KB1序列的位置15),然而来自上述MD模拟的会聚性解决方案表明,工程化酶中的NCS结合在活性位点的相反侧上是有利的。然而,NCS的结合会在天然酶中受到空间位阻,部分原因是赖氨酸残基以及位于附近α螺旋上的苯丙氨酸残基(图17B中Q76KB1序列的位置108)。不受特定理论限制,认为在包含SEQ ID NO:63的氨基酸序列的工程化酶活性位点中的NCS结合通过赖氨酸残基突变为组氨酸残基而得以促进,这在活性位点内产生额外空间并且为NCS中的芳环提供π-π堆积伴侣。还不受特定理论限制,认为在包含SEQ IDNO:65的氨基酸序列的工程化酶活性位点中的NCS结合通过如下得以促进:赖氨酸至精氨酸残基的突变与脯氨酸残基(图17A中Q76KB1序列的14位)至组氨酸残基的相邻突变相一致。精氨酸侧链构象自由度的增加促进NCS的进入,同时仍处于提供极性接触以在转移反应期间稳定过渡态的位置,而相邻的组氨酸为NCS提供其他结合接触。
另一个值得注意的突变包括从精氨酸残基(图17C中Q76KB1序列的位置220)到组氨酸残基的突变,该突变在SEQ ID NO:63和SEQ ID NO:65的221位发现。不受特定理论限制,突变的组氨酸残基处于有利于从NCS中去除硫酸酯基的有利位置。来自鸡己糖醛酸2-O磺基转移酶的其他说明性突变,特别是SEQ ID NO:65(His-20、Ser-114、Lys-116、Met-122)中存在的突变可类似地驱动活性位点内的NCS结合,其通过提供与NCS(His-20)内的硫酸酯部分的直接结合接触、与其他突变的残基配位(Ser-114与His-221配位),或通过增加NCS(Met-122)附近的疏水环境进行。
本领域技术人员会理解,任何其他氨基酸序列的工程化己糖醛酸2-O磺基转移酶,包括但不限于SEQ ID NO:68和SEQ ID NO:69所公开的那些,可能表现出与鸡己糖醛酸2-O磺基转移酶以及具有SEQ ID NO:63和SEQ ID NO:65氨基酸序列的工程化己糖醛酸2-O磺基转移酶类似的结构。不受特定理论限制,认为PNS会与在与任何工程化己糖醛酸2-O磺基转移酶活性位点内的NCS相似的位置结合,因为两种芳基硫酸酯化合物的结构非常相似,不同之处在于硫酸酯基位于芳环上相对于NCS中硝基的邻位,而不是PNS中硝基的对位。
因此,在另一个实施方案中,本发明的工程化己糖醛酸2-O磺基转移酶可包含选自如下的氨基酸序列:SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:68和SEQ ID NO:69。在另一个实施方案中,包含SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:68或SEQ ID NO:69的氨基酸序列的工程化氨基葡萄糖N-磺基转移酶可与任何芳基硫酸酯化合物反应。在进一步的实施方案中,芳基硫酸酯化合物选自PNS、MUS、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2-萘基硫酸酯和NCS。在一些更进一步的实施方案中,芳基硫酸酯化合物是PNS。在其他更进一步的实施方案中,芳基硫酸酯化合物是NCS。
在另一个实施方案中,在包含任何天然或工程化己糖醛酸2-O磺基转移酶、特别是包含SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:68或SEQ ID NO:69的氨基酸序列的工程化己糖醛酸2-O磺基转移酶的反应混合物中,反应混合物还可包含葡糖醛酸C5-差向异构酶以催化形成N,2O-HS产物。在一些实施方案中,N,2O-HS产物可包含式VI的结构。在其他实施方案中,N,2O-HS产物可包含式VII的结构。在另一个实施方案中,葡糖醛酸C5-差向异构酶可包含SEQ ID NO:67的氨基酸序列。在另一个实施方案中,葡糖醛酸C5-差向异构酶可包含SEQ ID NO:67的残基34-617。
工程化氨基葡萄糖6-O磺基转移酶
实际上,HS氨基葡萄糖6-O磺基转移酶识别、结合作为磺基受体的基于N-、2-O硫酸化肝素前体的多糖并且与其反应。另外,任一相邻己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸,并且可任选地进行2-O硫酸化。通常,接受6-O磺基的氨基葡萄糖残基的非还原端的己糖醛酸是2-O硫酸化艾杜糖醛酸,并且在许多情况下,氨基葡萄糖残基本身也N-硫酸化。类似于天然氨基葡萄糖N-磺基转移酶和己糖醛酸2-O磺基转移酶,野生型氨基葡萄糖6-O磺基转移酶在与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应后将磺基转移至多糖。与野生型己糖醛酸2-O磺基转移酶一样,野生型氨基葡萄糖6-O磺基转移酶也是EC 2.8.2.-酶类的成员。在一个非限制性实例中,EC 2.8.2.-内氨基葡萄糖6-O磺基转移酶可识别、结合包含下式VIII结构的基于肝素前体的多糖并且与其反应:
其中,接受6-O磺基的氨基葡萄糖残基进行N-硫酸化并且与在其非还原端的2-O硫酸化艾杜糖醛酸残基相邻,X包含上式VIII中所示的任何己糖醛酸残基。具有与基于N-、2-O硫酸化乙酰肝素的多糖、包括但不限于包含式VIII结构的那些结合的生物活性的EC2.8.2.-内氨基葡萄糖6-O磺基转移酶,已经由Xu,Y.等人,(2017)ACS Chem.Biol.12(1):73-82和Holmborn,K.等人,(2004)J.Biol.Chem.279,(41):42355-42358进行了描述,其公开内容通过引用整体并入。
如上所述,尽管与氨基葡萄糖6-O磺基转移酶反应的基于肝素前体的多糖的部分可包含式VIII的结构,多糖内的其他氨基葡萄糖残基可以是N-硫酸化、N-乙酰化、3-O硫酸化和/或6-O硫酸化的,和己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸,其任何一个都可以进行2-O硫酸化。类似于上述其他工程化磺基转移酶,工程化氨基葡萄糖6-O磺基转移酶可将磺基转移至相同多糖分子内的多个氨基葡萄糖残基,并且相同多糖分子内的多个氨基葡萄糖残基可通过相同多肽进行6-O硫酸化。通常,可与工程化氨基葡萄糖6-O磺基转移酶反应的基于肝素前体的多糖,包括包含式VIII结构的那些,可包含至少三个单糖残基。在另一个实施方案中,本发明的工程化氨基葡萄糖6-O磺基转移酶可具有与EC 2.8.2.-内野生型氨基葡萄糖6-O磺基转移酶相同的与基于肝素前体的磺基受体多糖、特别是包含式VIII结构的基于肝素前体的多糖结合的生物活性。
在成功结合3′-磷酸腺苷5′-磷酸硫酸酯和包含式VIII结构的基于肝素前体的多糖后,野生型氨基葡萄糖6-O磺基转移酶可催化磺基转移至氨基葡萄糖残基的6-O位置,形成包含下式IX结构的N,2O,6O-HS产物:
其中X包括上式IX中描述的任何己糖醛酸残基。
在另一个实施方案中,本发明的工程化氨基葡萄糖6-O磺基转移酶可与本文所述任何基于肝素前体的多糖结合并反应,包括通过工程化氨基葡萄糖N-磺基转移酶、工程化己糖醛酸2-O磺基转移酶和工程化氨基葡萄糖3-O磺基转移酶识别为磺基受体的基于肝素前体的多糖(下文中进一步详述)。在另一个实施方案中,本发明的工程化氨基葡萄糖6-O磺基转移酶可结合包含式VIII结构的基于肝素前体的多糖并且与其反应,以便形成包含式IX结构的N,2O,6O-HS产物。可与作为磺基受体的工程化氨基葡萄糖6-O磺基转移酶反应的一种这样的基于肝素前体的多糖的一个非限制性实例示于图20中。图20显示包括三个N-取代的氨基葡萄糖残基210的多糖240,所述N-取代的氨基葡萄糖残基210可由乙酰基211或硫酸酯基212进行N-取代。在多糖240内,能够充当磺基受体的N-取代的氨基葡萄糖残基210的侧面是两个己糖醛酸残基。己糖醛酸残基可包括由式VIII中的官能团“X”表示的任何残基、特别是葡糖醛酸残基220和艾杜糖醛酸残基230。葡糖醛酸残基220或艾杜糖醛酸残基230可进一步在2-O位置被硫酸酯基231取代。在多糖240与工程化氨基葡萄糖6-O磺基转移酶和磺基供体反应后,任何氨基葡萄糖残基210的6-O的213位可进行硫酸化,最终形成产物多糖241内的6-O硫酸化氨基葡萄糖残基310。
EC 2.8.2.-内的天然氨基葡萄糖6-O磺基转移酶通常包含大约300个至700个氨基酸残基,在一些情况下它们的序列可以相差很大,但最终具有完全相同的功能,即催化硫酰基从3′-磷酸腺苷5′-磷酸硫酸酯转移至N,2O-HS多糖内氨基葡萄糖残基的6-O位置、特别是包含式VIII结构的那些。不受特定理论限制,认为EC 2.8.2.-内每种天然氨基葡萄糖6-O磺基转移酶可催化相同的化学反应,因为在所有物种中存在相同或高度保守的多个氨基酸序列基序和二级结构。
此外,认为几个保守的氨基酸序列基序直接参与3′-磷酸腺苷5′-磷酸硫酸酯和/或多糖的结合或参与化学反应本身。天然氨基葡萄糖6-O磺基转移酶之间的同一性可通过如下表明:比较斑马鱼氨基葡萄糖6-O磺基转移酶同工型3-B酶的氨基酸序列(其具有其中已鉴定活性位点内的氨基酸残基的已知晶体结构(PDB代码5T03、5T05和5T0A))与EC2.8.2.-内其他天然氨基葡萄糖6-O磺基转移酶的氨基酸序列。十五种酶的多序列比对,连同相对于小鼠氨基葡萄糖6-O磺基转移酶(同工型1)参考序列(UniProtKB登录号Q9QYK5)的每个序列的同一性百分比,示于图21A、图21B和图21C中。如图21A、图21B和图21C中所示,序列范围从与Q9QYK5参考序列具有97.3%同一性(条目O60243|H6ST1_HUMAN)一直到53.7%同一性(条目A0A3P8W3M9|A0A3P8W3M9_CYSNE)。为了比较,斑马鱼氨基葡萄糖6-O磺基转移酶同工型3-B酶(条目A0MGZ7|H6S3B_DANRE)与Q9QYK5参考序列具有60.4%序列同一性。本领域技术人员会理解,为了清楚起见,多序列比对限于十五个序列,有编码天然氨基葡萄糖6-O磺基转移酶的数百个氨基酸序列已进行鉴定并且也具有高度保守的活性位点和/或结合区域。
在图21A、图21B和图21C中,在特定位置在黑色背景下以白色描绘的氨基酸在所有序列中是100%同一性。高度保守的氨基酸,意指相同或在化学或结构上相似的氨基酸,在特定位置用黑色轮廓包围。在高度保守的区域内,大多数序列中存在的共有氨基酸以粗体显示。在特定位置不相同或高度保守的氨基酸通常是可变的。序列内的句点表示已插入序列中的间隙,以促进与在高度保守或相同区域之间具有另外残基的其他序列的序列比对。最后,基于比对中氨基酸的同一性并且使用天然斑马鱼氨基葡萄糖6-O磺基转移酶的结构作为参考,在每个序列块上方是一系列箭头和线圈,它们表示在所有序列中保守的二级结构。与箭头相邻的β符号是指β折叠,然而与α符号相邻的线圈是指螺旋二级结构。图21A、图21B和图21C中所述15个比对序列中的每一个都相对于它们的天然全长序列被截短以与本发明的工程化酶一致,特别是具有氨基酸序列SEQ ID NO:104、SEQ ID NO:106和SEQ IDNO:108的那些。特别地,图21A、图21B和图21C中所述的残基与小鼠氨基葡萄糖6-O磺基转移酶的Q9QYK5参考序列的残基67-377进行比对。
在图21A、图21B和图21C中的15个比对序列中,基于上述斑马鱼氨基葡萄糖6-O磺基转移酶的晶体结构(条目A0MGZ7|H6S3B_DANRE),有几个保守的氨基酸序列基序,这些基序包括一个或多于一个构成活性位点的氨基酸。基于图21A、图21B和图21C中氨基酸残基的编号,这些保守的氨基酸序列基序包括氨基酸残基29至34(Q-K-T-G-G-T);81至86(C-G-L-H-A-D);127至139(S-E-W-R/K-H-V-Q-R-G-A-T-W-K);178至184(N-L-A-N-N-R-Q);和227至231(L-T-E-F/Y-Q)。特别地,并且如图22A、图22B和图22C中所示,C-G-L-H-A-D保守氨基酸序列基序内的组氨酸残基在适当位置从N-磺基氨基葡萄糖残基的6’-羟基提取氢原子,然后能够使带负电荷的氧原子引发3′-磷酸腺苷5′-磷酸硫酸酯的亲核攻击并且去除硫酸酯基。另外,Q-K-T-G-G-T保守氨基酸序列基序内普遍保守的赖氨酸残基与3′-磷酸腺苷5′-磷酸硫酸酯中的5′-磷酸配位,同时普遍保守的组氨酸和色氨酸残基在131位和138位与N-磺基氨基葡萄糖残基配位(参见Xu,Y.等人,如上)。
然而,如上所述,EC 2.8.2.-内的天然氨基葡萄糖6-O磺基转移酶不能够催化硫酸酯基从芳基硫酸酯化合物转移至多糖。不受特定理论限制,并且与上述天然氨基葡萄糖N-磺基转移酶和己糖醛酸2-O磺基转移酶一样,认为天然氨基葡萄糖6-O磺基转移酶的活性位点内3′-磷酸腺苷5′-磷酸硫酸酯的结合口袋对芳基硫酸酯化合物不具有足够高的亲和力来促进结合和/或芳基硫酸酯化合物在空间上受到阻碍不能进入活性位点。因此,并且在另一个实施方案中,EC 2.8.2.-内野生型氨基葡萄糖6-O磺基转移酶可在其氨基酸序列内的几个位置进行突变以能够在活性位点内结合芳基硫酸酯化合物和/或优化芳基硫酸酯化合物的位置,从而可使硫酸酯基转移至多糖。
因此,并且在另一个实施方案中,本发明的工程化氨基葡萄糖6-O磺基转移酶可以是EC 2.8.2.-内天然氨基葡萄糖6-O磺基转移酶的突变体,包括具有图21A、图21B和图21C中所述氨基酸序列的酶。
在另一个实施方案中,工程化至工程化氨基葡萄糖6-O磺基转移酶的氨基酸序列中的突变促进生物活性,其中芳基硫酸酯化合物可结合作为磺基供体的酶并且与其反应。在另一个实施方案中,尽管工程化氨基葡萄糖6-O磺基转移酶可结合作为磺基供体的芳基硫酸酯化合物并且与其反应,但它们可保留天然氨基葡萄糖6-O磺基转移酶与作为磺基受体的N,2O-HS多糖、包括但不限于包含式VIII结构的那些结合的生物活性。不受特定理论限制,认为由于插入工程化氨基葡萄糖6-O磺基转移酶的氨基酸序列中的突变,它们的磺基转移酶活性可包括磺基从芳基硫酸酯化合物直接转移至基于肝素前体的多糖,其使用上述图22A至图22C中所述的类似机制,不同之处在于3′-磷酸腺苷5′-磷酸硫酸酯被芳基硫酸酯化合物取代。在其他方面,认为突变可导致磺基转移酶活性包括两步过程,包括芳基硫酸酯化合物的水解和磺基组氨酸中间体的形成,然后是在氨基葡萄糖残基的6-O位置的氧原子亲核攻击磺基组氨酸中间体,以形成6-O硫酸化HS产物。在另一个实施方案中,任一磺基转移机制的6-O硫酸化HS产物都是N,2O,6O-HS产物。本发明的工程化氨基葡萄糖6-O磺基转移酶能够实现磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖,如以下实施例中所述。
在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含相对于EC2.8.2.-内天然氨基葡萄糖6-O磺基转移酶中发现的保守氨基酸序列基序的一个或多于一个突变的氨基酸序列基序,如上所述并且示于图21A、图21B和图21C的多序列比对中。在另一个实施方案中,存在于工程化酶的氨基酸序列中的每个突变的氨基酸序列基序包含相对于天然氨基葡萄糖6-O磺基转移酶内相应保守氨基酸序列基序的至少一个氨基酸突变。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含一个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含两个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含三个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含四个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含五个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶包括相对于EC 2.8.2.-内任何野生型HS氨基葡萄糖6-O磺基转移酶的至少一个突变的氨基酸序列基序,可具有选自如下的氨基酸序列:SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ IDNO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122。
在另一个实施方案中,在3D分子可视化系统(包括作为非限制性实例的开源软件PyMOL)中查看斑马鱼氨基葡萄糖6-O磺基转移酶(UniProtKB登录号A0MGZ7)的任何晶体结构后,相关序列的结构例如包含相对于任何斑马鱼氨基葡萄糖6-O磺基转移酶结构一个或多于一个突变的氨基酸序列基序的工程化氨基葡萄糖6-O磺基转移酶的那些,可以建模用于比较,如图23中所示。图23显示斑马鱼氨基葡萄糖6-O磺基转移酶(PDB代码:5T03)与包含SEQ ID NO:108氨基酸序列的本发明的一种工程化酶的活性位点的放大视图,其中工程化氨基葡萄糖6-O磺基转移酶的结构相对于斑马鱼氨基葡萄糖6-O磺基转移酶氨基酸序列进行突变后来计算。活性位点内也说明了腺苷3′,5′-二磷酸,其为磺基转移反应的产物,其中3′-磷酸腺苷5′-磷酸硫酸酯是磺基供体,并且与斑马鱼氨基葡萄糖6-O磺基转移酶共结晶。PNS也建模到工程化酶的活性位点中,其使用分子动力学(MD)模拟的共识解决方案,设计为计算与多糖结合位点(未示出)相邻的酶活性位点内配体的优化位置和取向,如果这样的解决方案是可能的话。为清楚起见,未显示氢原子。
如图23中所示,尽管相对于斑马鱼氨基葡萄糖6-O磺基转移酶,对SEQ ID NO:108进行几个突变,但各自的蛋白质骨架处于彼此几乎相同的位置,能够一对一地比较活性位点。然而,当比较两个活性位点时,腺苷3′,5′-二磷酸产物作为PNS分子位于中心α-螺旋的相反侧上,如通过来自上述MD模拟的会聚性解决方法确定。不受特定理论限制,认为会聚性MD模拟解决方案将PNS放置在α螺旋的相反侧,因为在斑马鱼酶内与3′-磷酸腺苷5′-磷酸硫酸酯相同或相似的位置对PNS没有足够的亲和力。如通过以上Xu,Y.等人所述,在全长氨基酸序列158位的保守组氨酸是催化组氨酸,其从N-磺基氨基葡萄糖的6′-羟基提取质子,然后能够与3′-磷酸腺苷5′-磷酸硫酸酯反应以引发磺基转移。然而,尽管3′-磷酸腺苷5′-磷酸硫酸酯和PNS的结合口袋存在明显差异,但包含SEQ ID NO:104、SEQ ID NO:106和SEQ IDNO:108的氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶全部实现了磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖内一个或多于一个氨基葡萄糖残基的6-O位置,如以下实施例中所述。
因此,并且不受特定理论限制,工程化氨基葡萄糖6-O磺基转移酶的活性位点内存在的一个或多于一个突变可在其可转移至磺基受体HS多糖的位置处协助结合芳基硫酸酯化合物的硫酸酯部分。如图23中所示,工程化酶具有氨基酸序列SEQ ID NO:108,并且芳基硫酸酯化合物是PNS。然而,未示出基于肝素前体的多糖。在一个非限制性实例中,工程化到SEQ ID NO:108的31位中的组氨酸残基可处于促进使用乒乓机制从PNS中去除硫酸酯基的位置,所述乒乓机制类似于上述Malojcic等人中所述的机制。另外,工程化到SEQ ID NO:108的133位的组氨酸残基连同在SEQ ID NO:108的132位(对应于图21B的每个序列中的131位)的保守组氨酸可进一步与硫酸酯部分配位。在SEQ ID NO:22的137-139位突变为G-A-N(对应于在图21B中的序列的136-138位的保守A-T-W基序)的突变去除空间体积,这可在可通过工程化组氨酸在SEQ ID NO:108的31位提取硫酸酯的位置处阻止PNS的结合。包含A-T-W的环内突变为G-A-N的突变也表现出使环远离PNS,这可进一步帮助PNS到达其结合口袋。最后,工程化到SEQ ID NO:108的84位的丝氨酸残基,其紧邻对应于上述全长斑马鱼氨基葡萄糖6-O磺基转移酶中His 158的天然组氨酸,可以产生另外的氢结合接触以帮助工程化酶保留斑马鱼酶与磺基受体多糖结合的天然活性。
本领域技术人员会理解,任何其他氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶,包括但不限于SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ IDNO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122公开的那些,会表现出类似的结构基序,特别是在活性位点内。不受特定理论限制,认为NCS会结合在任何工程化酶的活性位点内与PNS相似的位置,因为这两种芳基硫酸酯化合物的结构非常相似,不同之处在于硫酸酯基位于芳环上相对于硝基的邻位,而不是硝基的对位。
在另一个实施方案中,可根据本发明的方法使用的工程化氨基葡萄糖6-O磺基转移酶可包含一个或多于一个突变的氨基酸序列基序,其可部分通过如下来确定:比较图21A、图21B和图21C的多序列比对中所示保守的氨基酸序列基序与已知结构的野生型酶和/或模型化工程酶,包括但不限于作为一个非限制性实例的图23中所示的酶。在另一个实施方案中,可包含在工程化氨基葡萄糖6-O磺基转移酶内的突变的氨基酸序列基序可选自(a)G-H-T-G-G-T;(b)C-G-X1-X2-A-D,其中X1选自苏氨酸和丝氨酸,并且X2选自天冬酰胺、精氨酸和组氨酸;(c)X3-X4-W-R-H-X5-Q-R-G-G-X6-N-K,其中X3选自丝氨酸和甘氨酸,X4选自甘氨酸和组氨酸,X5选自组氨酸和苏氨酸,并且X6选自丙氨酸和苏氨酸;和(d)N-L-X7-N-N-R-Q,其中X7选自丙氨酸和甘氨酸;包括它们的任何组合。每个突变的氨基酸序列基序对应于上图21A、图21B和图21C中所示的保守氨基酸基序:序列基序(a)对应于保守的氨基酸序列基序Q-K-T-G-G-T;突变的氨基酸序列基序(b)对应于保守的氨基酸序列基序C-G-L-H-A-D;突变的氨基酸序列基序(c)对应于保守的氨基酸序列基序S-E-W-(R/K)-H-V-Q-R-G-A-T-W-K:和突变的氨基酸序列基序(d)对应于保守的氨基酸序列基序N-L-A-N-N-R-Q。在另一个实施方案中,包含上述至少一个突变的氨基酸序列基序的工程化氨基葡萄糖6-O磺基转移酶可选自SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122。
在另一个实施方案中并且在一个非限制性实例中,工程化氨基葡萄糖6-O磺基转移酶可包含相同氨基酸序列内突变的氨基酸序列基序(b)和(c)。包含突变的氨基酸序列基序(b)和(c)的工程酶包括但不限于,包含如下氨基酸序列的酶:SEQ ID NO:104、SEQ IDNO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ IDNO:121或SEQ ID NO:122。在另一个实施方案中,包含突变的氨基酸序列基序(b)和(c)的每种工程化氨基葡萄糖6-O磺基转移酶具有与如图23中所示的SEQ ID NO:108类似的活性位点。不限于另一种理论,认为包含在突变的氨基酸序列基序(b)和(c)中的几个突变在磺基转移酶活动期间具有一种或多于一种功能,包括不限于:通过减小结合口袋的尺寸来增加芳基硫酸酯化合物对活性位点的亲和力、增加口袋的疏水性、去除或产生极性或氢键接触和/或产生与芳基硫酸酯化合物的芳香族部分的π-π相互作用;稳定化学反应过程中酶的过渡态;和/或参与化学反应本身。
在另一个实施方案中,在包含突变的氨基酸序列基序(b)和(c)的工程化氨基葡萄糖6-O磺基转移酶内,X4是甘氨酸和X5是组氨酸。在其他实施方案中,X4是组氨酸和X5是苏氨酸。
在另一个实施方案中,在包含突变的氨基酸序列基序(b)和(c)的工程化氨基葡萄糖6-O磺基转移酶内,X3是丝氨酸,X6是丙氨酸,和X7是甘氨酸。在其他实施方案中,X3是甘氨酸,X6是苏氨酸,和X7是丙氨酸。
此外,已实验确定为与作为磺基供体的芳基硫酸酯化合物结合的活性磺基转移酶的三种工程化氨基葡萄糖6-O磺基转移酶的氨基酸序列(SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108)(参见如下实施例5)可在多序列比对中与小鼠氨基葡萄糖6-O磺基转移酶的氨基酸序列(条目Q9QYK5|H6ST1_MOUSE)比较以确定每种酶的突变之间是否存在关系。工程化酶的氨基酸序列内的句点表示在特定位置与小鼠氨基葡萄糖6-O磺基转移酶的同一性。如图24中所示,序列比对表明,尽管三个磺基转移酶序列内超过90%的氨基酸残基是相同的,但存在可选择多个氨基酸的几个位置。不受特定理论限制,这些酶彼此之间具有与包含EC 2.8.2.-的氨基葡萄糖6-O磺基转移酶相似的关系。因此,并且在另一个实施方案中,包含可在定义的位置选择多个氨基酸的氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶公开为SEQ ID NO:112和SEQ ID NO:113。用术语“Xaa”、“Xn”或“位置n”表示可以从可能的残基的选择中选择氨基酸同一性的位置,其中n是指残基位置。
在另一个实施方案中,在SEQ ID NO:112内,具有名称“Xaa”的残基说明其中在SEQID NO:104、SEQ ID NO:106和SEQ ID NO:108的氨基酸序列内的特定位置缺乏同一性的已知情况。在另一个实施方案中,氨基酸序列SEQ ID NO:113,也说明其中在SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108的氨基酸序列内的特定位置缺乏同一性的已知情况,但是SEQ ID NO:113还包含EC 2.8.2.-内几种天然全长氨基葡萄糖6-O磺基转移酶,包括作为非限制性实例的小鼠、人和猪氨基葡萄糖6-O磺基转移酶的N-末端残基1-66和C-末端残基378-411。相比之下,SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108和SEQ ID NO:112中的氨基酸残基对应于EC 2.8.2.-内几个全长氨基葡萄糖6-O磺基转移酶,包括作为非限制性实例的小鼠、人和猪氨基葡萄糖6-O磺基转移酶的残基67-377。为促进蛋白质表达,相对于小鼠、人和猪氨基葡萄糖6-O磺基转移酶的残基67-377,将N-末端甲硫氨酸残基添加至SEQID NO:104、SEQ ID NO:106、SEQ ID NO:108和SEQ ID NO:112氨基酸序列中的每一个。
在另一个实施方案中,可对由氨基酸序列SEQ ID NO:112或SEQ ID NO:113定义的Xaa残基进行任何选择,只要所得酶在与作为磺基供体的芳基硫酸酯化合物反应后保持其氨基葡萄糖6-O磺基转移酶活性即可。
在另一个实施方案中,在包含SEQ ID NO:112氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在129位的氨基酸残基是甘氨酸,在133位的氨基酸残基是组氨酸。在另一个实施方案中,在包含SEQ ID NO:112的氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在129位的氨基酸残基是组氨酸,在133位的氨基酸残基是苏氨酸。在另一个实施方案中,在包含SEQ ID NO:113氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在194位的氨基酸残基是甘氨酸,在198位的氨基酸残基是组氨酸。在另一个实施方案中,在包含SEQ ID NO:113氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在194位的氨基酸残基是组氨酸,在198位的氨基酸残基是苏氨酸。
在另一个实施方案中,在包含SEQ ID NO:112氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在128位的氨基酸残基是丝氨酸,在138位的氨基酸残基是丙氨酸,并且在181位的氨基酸残基是甘氨酸。在另一个实施方案中,在包含SEQ ID NO:112氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在128位的氨基酸残基是甘氨酸,在138位的氨基酸残基是苏氨酸,并且在181位的氨基酸残基是丙氨酸。在另一个实施方案中,在包含SEQ IDNO:113氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在193位的氨基酸残基是丝氨酸,在203位的氨基酸残基是丙氨酸,并且在246位的氨基酸残基是甘氨酸。在另一个实施方案中,在包含SEQ ID NO:113氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,在193位的氨基酸残基是甘氨酸,在203位的氨基酸残基是苏氨酸,并且在246位的氨基酸残基是丙氨酸。
在另一个实施方案中,在包含SEQ ID NO:112或SEQ ID NO:113氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶内,氨基酸序列可在未由“Xn”或“Xaa”指定的残基位置任选地包括一个或多于一个突变,只要任何这种突变不消除氨基葡萄糖6-O磺基转移酶和/或该酶的芳基硫酸酯依赖性活性即可。在另一个实施方案中,在未由“Xn”或“Xaa”指定的位置的未消除芳基硫酸酯依赖性活性的这种突变可包括置换、缺失和/或添加。
因此,在另一个实施方案中,根据本发明的任何方法使用的工程化氨基葡萄糖6-O磺基转移酶可包含选自如下的氨基酸序列:SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶包含如下氨基酸序列:SEQ IDNO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ IDNO:120、SEQ ID NO:121和SEQ ID NO:122。在进一步的实施方案中,芳基硫酸酯化合物选自PNS、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2NapS和NCS。在一些更进一步的实施方案中,芳基硫酸酯化合物是PNS。在其他更进一步的实施方案中,芳基硫酸酯化合物是NCS。
工程化氨基葡萄糖3-O磺基转移酶
实际上,HS氨基葡萄糖3-O磺基转移酶通常识别、结合作为磺基受体的N,2O-HS和N,2O,6O-HS基于肝素前体的多糖并且与其反应。一般来说,在3-O位置接受磺基的氨基葡萄糖残基进行N-硫酸化并且任选地还进行6-O硫酸化。另外,任一相邻己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸,其任何一个可任选地进行2-O硫酸化。通常,进行3-O硫酸化的氨基葡萄糖残基在其非还原端与葡萄糖醛酸相邻,并且在其还原端与2-O硫酸化艾杜糖醛酸相邻。类似于上述各种野生型磺基转移酶,天然存在的氨基葡萄糖3-O磺基转移酶在与作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯反应时将磺基转移至基于肝素前体的多糖。利用3′-磷酸腺苷5′-磷酸硫酸酯作为磺基供体的野生型氨基葡萄糖3-O磺基转移酶是EC 2.8.2.23酶类的成员。在一个非限制性实例中,EC 2.8.2.23内的天然氨基葡萄糖3-O磺基转移酶可识别、结合包含下式X结构的N,2O,6O-HS多糖并且与其反应:
其中中心氨基葡萄糖残基是N-硫酸化的并且在其非还原端与葡萄糖醛酸相邻和在其还原端与2-O硫酸化艾杜糖醛酸残基相邻,X可任选地是硫酸酯基或乙酰基,并且Y可任选地是硫酸酯基或羟基。
如上所述,尽管与氨基葡萄糖3-O磺基转移酶反应的基于肝素前体的多糖的部分可包含式VIII的结构,但多糖内的其他氨基葡萄糖残基可N-硫酸化、N-乙酰化、3-O硫酸化、和/或6-O硫酸化,并且己糖醛酸残基可以是葡萄糖醛酸或艾杜糖醛酸,其任何一个可以进行2-O硫酸化。类似于上述其他工程化磺基转移酶,工程化氨基葡萄糖3-O磺基转移酶可将磺基转移至相同多糖分子内的多个氨基葡萄糖残基,并且多糖分子内的多个氨基葡萄糖残基可通过相同多肽进行3-O硫酸化。通常,可与作为磺基受体的天然氨基葡萄糖3-O磺基转移酶反应的基于肝素前体的多糖通常包含至少五个单糖残基,如式X中所示。在另一个实施方案中,包含式X的结构并且可与作为磺基受体的天然氨基葡萄糖3-O磺基转移酶反应的基于肝素前体的多糖可包含至少三十二个单糖残基。在另一个实施方案中,本发明的工程化氨基葡萄糖3-O磺基转移酶可具有与EC2.8.2.23内野生型氨基葡萄糖3-O磺基转移酶相同的与作为磺基受体的基于肝素前体的多糖、特别是包含式X结构的多糖结合的生物活性。
在成功结合3′-磷酸腺苷5′-磷酸硫酸酯和包含式X结构的基于肝素前体的多糖后,野生型氨基葡萄糖3-O磺基转移酶可催化磺基转移至中心氨基葡萄糖残基的3-O位置,从而形成包含下式I结构的N,2O,3O,6O-HS产物:
其中X是磺基或乙酸酯基团,并且Y是磺基或羟基。具有与作为磺基受体的包含式X结构的N,2O,6O-HS多糖结合的生物活性并且形成包含式I结构的N,2O,3O,6O-HS产物的EC2.8.2.23内的野生型氨基葡萄糖3-O磺基转移酶,已由Xu,D.等人,(2008)Nat.Chem.Biol.4(3):200-202和Edavettal,S.C.等人,(2004)J.Biol.Chem.24(11):25789-25797进行了描述,其公开内容通过引用整体并入。此外,包含式I结构的N,2O,3O,6O-HS产物通常具有抗凝活性。使用工程化氨基葡萄糖3-O磺基转移酶形成抗凝剂N,2O,3O,6O-HS产物的方法在下文中进一步详述。
可作为磺基受体与本发明的工程化氨基葡萄糖3-O磺基转移酶反应的一种基于肝素前体的多糖的一个非限制性实例示于图25中。图25显示包括三个氨基葡萄糖残基410的多糖440,所述三个氨基葡萄糖残基410包含在每个N-位置的N-磺基411和在每个6-O位置的O-磺基412。在多糖440内,能够充当磺基受体的氨基葡萄糖残基410的侧面必须是两个己糖醛酸残基。己糖醛酸残基可包括由式X中的官能团“X”表示的任何残基,并且在图25中表示为葡萄糖醛酸残基420和艾杜糖醛酸残基430。任一己糖醛酸残基可在2-O位置进一步由磺基431取代。在多糖440与HS氨基葡萄糖3-O磺基转移酶和磺基供体反应后,任何氨基葡萄糖残基410的3-O位置413可硫酸化。如图25中所示,中心氨基葡萄糖残基410接受磺基,最终在硫酸化产物多糖441内形成3-O硫酸化氨基葡萄糖残基510。还如所示的,硫酸化产物多糖441包含式I的结构。
EC 2.8.2.23内的天然氨基葡萄糖3-O磺基转移酶通常包含大约300个至325个氨基酸残基,在一些情况下它们的序列可相差很大,但最终具有完全相同的功能,即催化硫酰基从3′-磷酸腺苷5′-磷酸硫酸酯转移至N,2O-HS或N,2O,6O-HS多糖、特别是包含式X结构的那些内的N-磺基氨基葡萄糖残基的3-O位置。不受特定理论限制,认为EC 2.8.2.23酶类内每种天然氨基葡萄糖3-O磺基转移酶可催化相同的化学反应,因为在所有物种中存在相同或高度保守的多个氨基酸序列基序和二级结构。
此外,认为几个保守的氨基酸序列基序直接参与3′-磷酸腺苷5′-磷酸硫酸酯和/或多糖的结合或参与化学反应本身。天然氨基葡萄糖3-O磺基转移酶之间的同一性可通过如下表明:比较小鼠或人氨基葡萄糖3-O磺基转移酶的同工型1的氨基酸序列(其具有其中已鉴定活性位点内的氨基酸残基的已知晶体结构(PDB代码分别为3UAN和1ZRH))与EC2.8.2.23内其他氨基葡萄糖3-O磺基转移酶的氨基酸序列。此外,小鼠和人氨基葡萄糖3-O磺基转移酶结构的直接比较表明这两种酶具有几乎相同的活性位点和整体折叠,即使这两种酶彼此之间只有83%的序列同一性。
EC 2.8.2.23内的十五种酶、包括小鼠和人酶的多序列比对连同相对于人氨基葡萄糖3-O磺基转移酶(同工型1)参考序列(UniProtKB登录号O 14792)的每个序列的百分比同一性,示于图26A、图26B和图26C中。如图26A、图26B和图26C中所示,序列范围从与恒河猴HS氨基葡萄糖3-O磺基转移酶的O14792参考序列具有98%同一性(条目tr|H9ZG39|H9ZG39_MACMU)一直到人氨基葡萄糖3-O磺基转移酶的同工型5的53%同一性(条目sp|Q8IZT8|HS3S5_HUMAN)。本领域技术人员会理解,为了清楚起见,多序列比对限于十五个序列,有编码天然氨基葡萄糖3-O磺基转移酶的数百个氨基酸序列已进行鉴定并且也具有高度保守的活性位点和/或结合区域。
在图26A、图26B和图26C内,在特定位置在黑色背景下以白色描绘的氨基酸在所有序列中是100%同一性。高度保守的氨基酸,意指相同或在化学或结构上相似的氨基酸,在特定位置用黑色轮廓包围。在高度保守的区域内,大多数序列中存在的共有氨基酸以粗体显示。在特定位置不相同或高度保守的氨基酸通常是可变的。序列内的句点表示已插入序列中的间隙,以促进与在高度保守或相同区域之间具有另外残基的其他序列的序列比对。最后,基于比对中氨基酸的同一性并且使用天然人磺基转移酶的结构作为参考,在每个序列块上方是一系列箭头和线圈,它们表示在所有序列中保守的二级结构。与箭头相邻的β符号是指β折叠,然而与α符号或η符号相邻的线圈是指螺旋二级结构。
在图26A、图26B和图26C中的十五个比对序列内,基于上述小鼠(条目sp|O35310|HS3S1_MOUSE)和人氨基葡萄糖3-O磺基转移酶(条目sp|O14792|HS3S1_HUMAN)酶的晶体结构,有几个保守的氨基酸序列基序,这些基序包括一个或多于一个构成活性位点的氨基酸。基于图26A、图26B和图26C中氨基酸残基的编号,这些基序包括残基16-27(包括来自残基18-23的G-V-R-K-G-G),残基43-48(E-V/I-H-F-F-D),残基78-81(P-A/G-Y-F),残基112-117(包括S-D-Y-T-Q-V),和残基145-147(Y-K-A)。认为这些残基促进或参与化学反应,或能够在活性位点内结合3′-磷酸腺苷5′-磷酸硫酸酯或多糖。特别地,在残基43-48内,如上所述并且如图4A、图4B和图4C中所示,在43位的谷氨酸残基从多糖内的N-磺基氨基葡萄糖残基的3-O位置提取质子,能够亲核攻击并且将磺基从3′-磷酸腺苷5′-磷酸硫酸酯中去除,然而在硫酰化多糖产物从活性位点中释放之前His-45和Asp-48配位以稳定酶的过渡态。
然而,如上所述,EC 2.8.2.23内的天然氨基葡萄糖3-O磺基转移酶不能够催化硫酸酯基从芳基硫酸酯化合物转移至多糖。不受特定理论限制,并且与上述天然氨基葡萄糖N-磺基转移酶、己糖醛酸2-O磺基转移酶和氨基葡萄糖6-O磺基转移酶一样,认为天然磺基转移酶的活性位点内3′-磷酸腺苷5′-磷酸硫酸酯的结合口袋对芳基硫酸酯化合物不具有足够高的亲和力来促进结合和/或芳基硫酸酯化合物在空间上受到阻碍不能进入活性位点。因此,并且在另一个实施方案中,EC 2.8.2.23内的野生型氨基葡萄糖3-O磺基转移酶可在其氨基酸序列内的几个位置进行突变以能够在活性位点内结合芳基硫酸酯化合物和/或优化芳基硫酸酯化合物的位置,从而可使硫酸酯基转移至多糖。
因此,并且在另一个实施方案中,本发明的工程化氨基葡萄糖3-O磺基转移酶可以是EC 2.8.2.23内天然氨基葡萄糖3-O磺基转移酶、包括具有图26A、图26B和图26C中所示的酶的突变体。
在另一个实施方案中,工程化至工程化氨基葡萄糖3-O磺基转移酶的氨基酸序列中的突变促进生物活性,其中芳基硫酸酯化合物可结合作为磺基供体的酶并且与其反应。在另一个实施方案中,尽管工程化氨基葡萄糖3-O磺基转移酶可结合作为磺基供体的芳基硫酸酯化合物并且与其反应,它们可保留天然氨基葡萄糖3-O磺基转移酶与作为磺基受体的基于肝素前体的多糖、包括但不限于包含式X结构的那些的生物活性。不受特定理论限制,认为由于插入工程化氨基葡萄糖3-O磺基转移酶的氨基酸序列的突变,它们的磺基转移酶活性可包括磺基从芳基硫酸酯化合物直接转移至基于肝素前体的多糖,其使用如上图4A至图4C中所述的类似机制,不同之处在于3′-磷酸腺苷5′-磷酸硫酸酯被芳基硫酸酯化合物取代。在其他方面,认为突变可导致磺基转移酶活性包括两步过程,包括芳基硫酸酯化合物的水解和磺基组氨酸中间体的形成,然后是在氨基葡萄糖残基的3-O位置的氧原子亲核攻击磺基组氨酸中间体,以形成3-O硫酸化HS产物。在另一个实施方案中,任一磺基转移机制的3-O硫酸化产物是N,2O,3O,6O-HS产物。本发明的工程酶能够实现磺基转移从芳基硫酸酯化合物至基于肝素前体的多糖,如以下实施例中所述。
在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶可包含相对于EC2.8.2.23内天然氨基葡萄糖3-O磺基转移酶中发现的保守的氨基酸序列基序的一个或多于一个突变的氨基酸序列基序,如上所述并且示于图26A、图26B和图26C的多序列比对中。在另一个实施方案中,存在于工程化酶的氨基酸序列中每个突变的氨基酸序列基序包含相对于天然氨基葡萄糖3-O磺基转移酶内相应保守氨基酸序列基序的至少一个氨基酸突变。在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶可包含一个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶可包含两个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶可包含三个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶可包含四个突变的氨基酸序列基序。在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶可包含五个突变的氨基酸序列基序。在另一个实施方案中,包括相对于EC 2.8.2.23内任何野生型氨基葡萄糖3-O磺基转移酶的至少一个突变的氨基酸序列基序的工程化氨基葡萄糖3-O磺基转移酶可具有选自如下的氨基酸序列:SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ IDNO:160。
在另一个实施方案中,在3D分子可视化系统(包括作为一个非限制性实例的开源软件PyMOL)中查看小鼠氨基葡萄糖3-O磺基转移酶的晶体结构后,相关序列的结构,例如包含相对于小鼠氨基葡萄糖3-O磺基转移酶(UniProtKB登录号O35310)结构的一个或多于一个突变的氨基酸序列基序的工程化氨基葡萄糖3-O磺基转移酶的结构,可以建模用于比较,如图27中所示。图27显示与包含SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151氨基酸序列的三种工程化氨基葡萄糖3-O磺基转移酶比较的小鼠氨基葡萄糖3-O磺基转移酶(PDB代码:3UAN)的活性位点的放大视图。活性位点内也说明了腺苷3′,5′-二磷酸,其为磺基转移反应的产物,其中3′-磷酸腺苷5′-磷酸硫酸酯是磺基供体,并且与小鼠氨基葡萄糖3-O磺基转移酶共结晶。PNS也建模到工程化酶的活性位点中,其使用分子动力学(MD)模拟的共识解决方案,设计为计算与多糖结合位点(未示出)相邻的酶活性位点内配体的优化位置和取向,如果这样的解决方案是可能的话。为清楚起见,未显示氢原子。
如图27中所示,尽管相对于天然小鼠氨基葡萄糖3-O磺基转移酶对SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151进行几个突变,但各自的蛋白质骨架在彼此几乎相同的位置,从而能够一对一地比较活性位点。然而,当比较两个活性位点时,来自天然磺基转移反应的腺苷3′,5′-二磷酸产物与赖氨酸残基相邻,然而上述MD模拟的会聚性解决方案表明,工程化酶内的PNS结合在活性位点的相反侧上是有利的。不受特定理论限制,认为会聚性MD模拟解决方案将PNS置于活性位点的相反侧上,因为在与3′-磷酸腺苷5′-磷酸硫酸酯相同或相似的位置对PNS没有足够的亲和力。然而,尽管3′-磷酸腺苷5′-磷酸硫酸酯和PNS的结合口袋存在明显差异,但包含SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶全部实现磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖内一个或多于一个位置的3-O位置,如以下实施例中所述。
此外,对应于小鼠氨基葡萄糖3-O磺基转移酶的20位和在图26A、图26B和图26C所述全部其他氨基葡萄糖3-O磺基转移酶中保守的精氨酸残基,如果存在于工程化氨基葡萄糖3-O磺基转移酶中,表现出阻止PNS在图27所示的位置结合。因此,并且在另一个实施方案中,结合PNS的工程化氨基葡萄糖3-O磺基转移酶可包含活性位点精氨酸残基至甘氨酸残基的突变,这去除了PNS在结合口袋内结合的所有空间位阻。如氨基酸序列SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156和SEQ IDNO:157中所示,精氨酸至甘氨酸的突变在21位。如氨基酸序列SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160中所示,精氨酸至甘氨酸的突变在99位。
类似地,对应于氨基酸序列SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQID NO:154、SEQ ID NO:155、SEQ ID NO:156和SEQ ID NO:157中的22位的每种工程化酶中的下一个氨基酸残基突变为组氨酸残基。不受特定理论限制,认为从保守的赖氨酸残基(对应于图26A中每个氨基酸序列中的21位)突变为组氨酸残基促进从PNS中去除硫酸酯基,其使用与上述Malojcic等人描述的类似机制。如氨基酸序列SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160中所示,赖氨酸至组氨酸残基的突变在100位。
本领域技术人员会理解,任何其他氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶,包括但不限于SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ IDNO:158、SEQ ID NO:159和SEQ ID NO:160公开的那些,会表现出与具有SEQ ID NO:147、SEQID NO:149和SEQ ID NO:151氨基酸序列的工程化酶类似的结构基序,特别是在活性位点内。不受特定理论限制,还认为NCS会在任何工程化酶的活性位点内的PNS类似的位置中结合,因为这两种芳基硫酸酯化合物的结构非常相似,不同之处在于硫酸酯基位于芳环上相对于硝基的邻位,而不是硝基的对位。
在另一个实施方案中,本发明的工程化氨基葡萄糖3-O磺基转移酶可包含一个或多于一个突变的氨基酸序列基序,其可部分地通过如下来确定:比较图26A、图26B和图26C的多序列比对中所示保守的氨基酸序列基序与已知结构的野生型酶和/或模型化工程化酶、包括但不限于图27中所示的工程化氨基葡萄糖3-O磺基转移酶。在另一个实施方案中,可包含在工程化氨基葡萄糖3-O磺基转移酶内的突变的氨基酸序列基序可选自(a)G-V-G-H-G-G;(b)H-S-Y-F;(c)S-X1-X2-T-H-X3,其中X1选自丙氨酸和亮氨酸;X2选自酪氨酸和甘氨酸,并且X3选自甲硫氨酸和亮氨酸;和(d)Y-X4-G,其中X4选自缬氨酸和苏氨酸;包括它们的任何组合。每个突变的氨基酸序列基序对应于上图26A、图26B和图26C中所示的保守氨基酸基序:突变的氨基酸序列基序G-V-G-H-G-G对应于保守的氨基酸序列基序G-V-R-K-G-G;突变的氨基酸序列基序H-S-Y-F对应于保守的氨基酸序列基序P-A/G-Y-F;突变的氨基酸序列基序S-X1-X2-T-H-X3对应于保守的氨基酸序列基序S-D-Y-T-Q-V;和突变的氨基酸序列基序Y-X4-G对应于保守的氨基酸序列基序Y-K-A。在另一个实施方案中,包含上述每个突变的氨基酸序列基序的工程化氨基葡萄糖3-O磺基转移酶可选自SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ IDNO:158、SEQ ID NO:159和SEQ ID NO:160。
在另一个实施方案中,每个突变的氨基酸序列基序可包含相对于EC2.8.2.23内天然氨基葡萄糖3-O磺基转移酶中发现的保守氨基酸进行的至少一个突变。在另一个实施方案中,突变的氨基酸序列基序(a)包含相对于保守的氨基酸序列基序G-V-R-K-G-G的R-K至G-H的突变。在另一个实施方案中,突变的氨基酸序列基序(b)包含相对于保守的氨基酸序列基序P-A/G-Y-F的P-A/G至H-S的突变。在另一个实施方案中,除了在X1、X2和X3位置的潜在突变之外,突变的氨基酸序列基序(c)还包含相对于保守的氨基酸序列基序S-D-Y-T-Q-V的Q至H的突变。在另一个实施方案中,除了在X4位置的突变之外,突变的氨基酸序列基序(d)还包含相对于保守的氨基酸序列基序Y-K-A的A至G的突变。
在另一个实施方案中,X1是丙氨酸,X2是酪氨酸;X3是甲硫氨酸,并且X4是缬氨酸或苏氨酸。在其他实施方案中,X1是亮氨酸,X2是甘氨酸,X3是亮氨酸,并且X4是苏氨酸。不限于另一种理论,认为包含在突变的氨基酸序列基序(b)、(c)和(d)中的一个或多于一个突变,在包括通过减小结合口袋的大小、增加口袋的疏水性和/或产生与芳基硫酸酯化合物的芳香族部分的π-π相互作用来稳定化学反应过程中酶的过渡态或增加芳基硫酸酯化合物对活性位点的亲和力方面发挥作用。
此外,实验确定具有与作为磺基供体的芳基硫酸酯化合物结合的活性的三种工程化氨基葡萄糖3-O磺基转移酶的氨基酸序列(SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151)(参见如下实施例6),可在多序列比对中与人氨基葡萄糖3-O磺基转移酶的第一同工型的氨基酸序列(条目sp|O14792|HS3S1_HUMAN)进行比较以确定每种酶的突变之间是否存在关系。工程化酶的氨基酸序列内的句点表示在特定位置与人氨基葡萄糖3-O磺基转移酶的同一性。如图28中所示,序列比对表明,尽管三个磺基转移酶序列内超过90%的氨基酸残基是相同的,但存在可选择多个氨基酸的几个位置。因此,并且在另一个实施方案中,包含其中可在定义的位置选择多个氨基酸的氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶公开为SEQ ID NO:154。可以从可能的残基选择中选择氨基酸身份的位置用术语“Xaa”、“Xn”或“位置n”表示,其中n是指残基位置。
在另一个实施方案中,在包含SEQ ID NO:154氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶内,在114位的氨基酸残基是丙氨酸并且在118位的氨基酸残基是甲硫氨酸。在进一步的实施方案中,在147位的氨基酸残基选自缬氨酸和苏氨酸。
在另一个实施方案中,在包含SEQ ID NO:154氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶内,在114位的氨基酸残基是亮氨酸,在118位的氨基酸残基是亮氨酸,并且在121位的氨基酸残基是缬氨酸。在进一步的实施方案中,在115位的氨基酸残基是甘氨酸。在更进一步的实施方案中,在147位的氨基酸残基是苏氨酸。
在另一个实施方案中,在包含SEQ ID NO:154氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶内,氨基酸序列可任选地包括在未由“Xn”或“Xaa”指定的残基位置的一个或多于一个突变,只要任何这种突变不消除氨基葡萄糖3-O磺基转移酶和/或该酶的芳基硫酸酯依赖性活性即可。在另一个实施方案中,在未由“Xn”或“Xaa”指定的位置未消除芳基硫酸酯依赖性活性的这种突变可包括置换、缺失和/或添加。
因此,在另一个实施方案中,根据本发明的任何方法使用的工程化氨基葡萄糖3-O磺基转移酶可包含选自如下的氨基酸序列:SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQID NO:159和SEQ ID NO:160。在另一个实施方案中,包含如下氨基酸序列的工程化氨基葡萄糖3-O磺基转移酶可与任何芳基硫酸酯化合物反应:SEQ ID NO:147、SEQ ID NO:149、SEQID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160。在进一步的实施方案中,芳基硫酸酯化合物选自PNS、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2NapS和NCS。在一些更进一步的实施方案中,芳基硫酸酯化合物是PNS。在其他更进一步的实施方案中,芳基硫酸酯化合物是NCS。
硫酸化多糖的体外合成
在本发明的一个实施方案中,上述任何工程化磺基转移酶用于合成基于硫酸化肝素前体的多糖。一般来说,硫酸化可通过如下来完成:用工程化磺基转移酶处理基于肝素前体的多糖和芳基硫酸酯化合物以形成硫酸化产物。如上所述并且不受特定理论限制,认为磺基转移酶识别作为磺基受体的基于肝素前体的多糖,还结合作为磺基供体的芳基硫酸酯化合物并且与其反应,自然界中并未观察到,并且先前也未描述过。
相对于基于硫酸化肝素前体的多糖(下文中“HS多糖”),用于工业、商业或制药用途的HS多糖可以通过将它们从其中在体内产生多糖的动物来源(特别是猪和牛)中分离出来而大量获得(参见Xu,Y.等人,(2011)Science 334(6055):498-501)。2007年和2008年的抗凝HS多糖的全球污染危机凸显了仅依靠从动物来源获取它们的脆弱性。因此,一直在推动开发体外合成足够大量的抗凝HS多糖的合成路线,以补充或替代动物来源产品。2019年非洲猪流感疫情使全球猪群、特别是中国的猪群数量锐减,进一步加强了这一推动力。
为了体外合成硫酸化多糖,过去有两种反应方案:全化学合成和化学酶促合成。虽然两种类型的反应方案都得到了纯化产品,在某些情况下是均质的,但整体合成路线不足以生产工业规模的硫酸化多糖、特别是抗凝HS多糖。事实上,使用全化学合成生产这种多糖历来需要多达60个步骤,导致产量非常低(参见Balagurunathan,K.等人,(eds.)(2015)Glycosaminoglycans:Chemistry and Biology,Methods in Molecular Biology,vol.1229,DOI 10.1007/978-1-4939-1714-3_2,Springer Science+Business MediaNew York)。
另一方面,化学酶促合成路线通常使用少得多的步骤并且将生成的抗凝剂产品的规模增加到数毫克的量(参见美国专利第8771995号和第9951149号,其公开内容通过引用整体并入)。可获得的产品数量的改进可归因于在反应容器中将重组HS磺基转移酶与3′-磷酸腺苷5′-磷酸硫酸酯结合以催化磺基转移至基于肝素前体的多糖的能力。然而,由于野生型磺基转移酶的活性依赖于3′-磷酸腺苷5′-磷酸硫酸酯,因此化学酶法在这一点上仍然不适合合成克级或更大规模量的抗凝HS多糖,如美国专利第5541095号、第5817487号、第5834282号、第6861254号、第8771995号、第9951149号和美国专利公开2009/0035787、2013/0296540和2016/0122446中所述,其公开内容通过引用整体并入。3′-磷酸腺苷5′-磷酸硫酸酯是非常昂贵并且不稳定的分子,一直是大规模生产酶促硫酸化产品(包括抗凝HS多糖)的障碍,因为3′-磷酸腺苷5′-磷酸硫酸酯在pH为8.0时的半衰期仅为约20小时。
此外,腺苷3′,5′-二磷酸对产物的抑制也是硫酸化产物大规模合成的限制因素。通过使用将腺苷3′,5′-二磷酸转化成3′-磷酸腺苷5′-磷酸硫酸酯的3′-磷酸腺苷5′-磷酸硫酸酯再生系统,可在一定程度上降低腺苷3′,5′-二磷酸抑制产物的高度负面影响(参见上述美国专利第6255088号和Burkhart等人,(2000)J.Org.Chem.65:5565-5574)。尽管有3′-磷酸腺苷5′-磷酸硫酸酯再生系统,然而,提供3′-磷酸腺苷5′-磷酸硫酸酯以启动与天然磺基转移酶的化学反应的绝对必要性仍然对在工业、生产级规模上合成硫酸化产品(包括抗凝HS多糖)造成不可逾越的高成本障碍。
与需要3′-磷酸腺苷5′-磷酸硫酸酯作为磺基供体以驱动活性的硫酸化多糖的已知化学酶促合成相反,本发明的方法不需要使用3′-磷酸腺苷5′-磷酸硫酸酯,因为本发明的每种磺基转移酶都设计成识别、结合作为磺基供体的芳基硫酸酯化合物并且与之反应,所述芳基硫酸酯化合物不与天然HS磺基转移酶反应。不受特定理论限制,认为本发明的工程化磺基转移酶是唯一已知的能够与作为磺基供体的芳基硫酸酯化合物以及多糖、特别是基于肝素前体的多糖结合的N-磺基转移酶。
因此,在另一个实施方案中,本发明提供用于合成HS多糖的方法和试剂盒。一般来说,使用本发明的工程化磺基转移酶使基于肝素前体的多糖硫酸化的方法包括以下步骤:(a)提供芳基硫酸酯化合物;(b)提供上述任何工程化磺基转移酶,其中工程化磺基转移酶具有与作为磺基供体的芳基硫酸酯化合物结合的生物活性;(c)提供基于肝素前体的多糖;(d)将芳基硫酸酯化合物、磺基转移酶和基于肝素前体的多糖组合成反应混合物;和(e)使用磺基转移酶,将磺基从芳基硫酸酯化合物转移至基于肝素前体的多糖,由此形成硫酸化多糖产物。在另一个实施方案中,芳基硫酸酯化合物可选自PNS、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2NapS和NCS。根据本发明,芳基硫酸酯化合物可以是PNS。根据本发明,芳基硫酸酯化合物可以是NCS。
在另一个实施方案中,当工程化磺基转移酶是氨基葡萄糖N-磺基转移酶时,基于肝素前体的多糖可以是包含一个或多于一个包含式II结构的二糖单元的N-脱乙酰肝素前体多糖,并且工程化磺基转移酶可具有选自如下的氨基酸序列:SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ IDNO:25。在另一个实施方案中,N-硫酸化HS多糖包含具有式III结构的一个或多于一个二糖单元。
在另一个实施方案中,可商业获得包含具有式II结构的二糖单元的N-脱乙酰肝素前体和/或其他基于肝素前体的多糖。在另一个实施方案中,用于与本发明的工程化氨基葡萄糖N-磺基转移酶反应的基于肝素前体的多糖组合物可通过如下获得:从天然来源中分离肝素前体并且将其化学修饰以N-脱乙酰化一种或多于一种氨基葡萄糖残基并且控制组合物内多糖的分子量。特别地,可发现肝素前体在细菌内为通过代谢物和其他外源性物质调节细胞进入的胶囊。这种细菌包括但不限于多杀巴斯德氏菌(Pasteurella multocida)和大肠杆菌(E.coli)。在一些实施方案中,肝素前体可以作为具有不同分子量的多糖分子的多分散混合物从大肠杆菌、特别是大肠杆菌的K5菌株中提取和纯化。Wang,Z.等人,(2010)Biotechnol.Bioeng.107(6):964-973中讨论并且提供了从大肠杆菌K5菌株中分离肝素前体的程序,其公开内容通过引用整体并入;还参见DeAngelis,P.L.(2015)Expert Opinionon Drug Delivery 12(3):349-352;Ly,M.等人,(2010)Anal.Bioanal.Chem.399:737-745;和Zhang,C.等人,(2012)Metabolic Engineering 14:521-527,其公开内容也整体并入。
在另一个实施方案中,肝素前体组合物的一部分或全部可以通过用碱、特别是氢氧化锂或氢氧化钠处理来N-脱乙酰化(参见Wang,Z.等人,(2011)Appl.Microbiol.Biotechnol.91(1):91-99,其公开内容通过引用整体并入;还参见PCT公开第PCT/US2012/026081号,其公开内容通过引用整体并入)。在另一个实施方案中,碱是氢氧化钠。根据所需的N-脱乙酰度、肝素前体的浓度和碱的浓度,本领域技术人员可根据上述Wang等人,(2011)所述的程序确定将肝素前体用碱孵育多长时间。
在另一个实施方案中,可以获得具有可用于合成抗凝HS多糖的分子量和N-乙酰基含量的N-脱乙酰肝素前体,所述抗凝HS多糖满足美国药典(USP)规定的一项或多于一项基准,下文中进一步详述。在另一个实施方案中,肝素前体可用碱、优选氢氧化钠孵育,直到所需量的N-乙酰化氨基葡萄糖保留在N-脱乙酰化产物中。在另一个实施方案中,N-乙酰氨基葡萄糖残基可以包含小于60%,包括小于30%、20%、18%、16%、14%、12%或10%一直到小于5%和优选12%至18%的N-脱乙酰肝素前体内的氨基葡萄糖残基。在另一个实施方案中,N-乙酰氨基葡萄糖可包含约15%的N-脱乙酰肝素前体内的氨基葡萄糖残基。
另外,并且不受特定理论限制,认为除了N-脱乙酰氨基葡萄糖残基外,肝素前体与碱之间的反应可同时解聚肝素前体多糖并且降低其分子量,其可进而降低N-脱乙酰肝素前体的重均分子量通常,从包括但不限于大肠杆菌的细菌中分离的肝素前体多糖具有约3000Da至约150000Da的分子量,并且分离的肝素前体的组合物可具有约25000Da至约50000Da的(参见上述Ly,M.等人和Wang等人,(2011))。在另一个实施方案中,从商业来源获得的或从细菌(包括但不限于大肠杆菌)中分离得到的肝素前体组合物可以用碱、优选氢氧化钠处理足以将N-脱乙酰肝素前体的降至目标或所需水平的时间。在另一个实施方案中,N-脱乙酰肝素前体可具有如下的至少1000Da,包括至少2000Da、4000Da、6000Da、7000Da、8000Da、8500Da、9000Da、9500Da、10000Da、10500Da、11000Da、11500Da、12000Da、12500Da、13000Da、13500Da、14000Da、15000Da、16000Da或18000Da至至少20000Da。在另一个实施方案中,N-脱乙酰肝素前体可具有如下的小于20000Da,包括小于18000Da、16000Da、15000Da、14000Da、13500Da、13000Da、12500Da、12000Da、11500Da、11000Da、10500Da、10000Da、9500Da、9000Da、8500Da、8000Da、7000Da、6000Da或4000Da一直到小于2000Da。在另一个实施方案中,N-脱乙酰肝素前体可以具有1000Da至20000Da并且包括1000Da和20000Da的上述列举的任何范围内的并且优选地在上述列举的9000Da至12500Da并且包括9000Da和12500D的任何范围内的
具有这种分子量特性和N-乙酰含量的N-脱乙酰肝素前体的制备详细描述于如上Wang等人,(2011)中。在另一个实施方案中,足以使肝素前体与碱(优选氢氧化钠)反应以形成具有9000Da至12500Da范围内的以及12%至18%的N-乙酰氨基葡萄糖含量的N-脱乙酰肝素前体产物的时间,可以是至少1小时,包括至少2、4、6、8、10、12或18小时,至至少24小时,这取决于肝素前体原料的分子量性能和浓度以及用于进行反应的碱的特性和浓度。
在另一个实施方案中,当工程化磺基转移酶是己糖醛酸2-O磺基转移酶时,基于肝素前体的多糖可以是包含一个或多于一个包含式IV和/或式V结构的结构基序的N-硫酸化HS多糖,并且工程化磺基转移酶可具有选自如下的氨基酸序列:SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67和SEQ ID NO:69。在另一个实施方案中,方法还可包括如下步骤:提供葡糖醛酸C5-差向异构酶,优选包含SEQ ID NO:67氨基酸序列、更优选SEQ ID NO:67的残基34-617的葡糖醛酸C5-差向异构酶,并且将葡糖醛酸C5-差向异构酶与反应混合物组合。在另一个实施方案中,可商业获得用于与工程化己糖醛酸2-O磺基转移酶反应的基于肝素前体的多糖。在另一个实施方案中,用于与工程化己糖醛酸2-O磺基转移酶反应的基于肝素前体的多糖可以是工程化或天然氨基葡萄糖N-磺基转移酶的硫酸化HS多糖产物。在另一个实施方案中,硫酸化多糖产物是包含式VI和/或式VII结构的N,2O-HS多糖。
在另一个实施方案中,用作工程化己糖醛酸2-O磺基转移酶的磺基受体的N-硫酸化HS多糖可通过化学N-硫酸化N-脱乙酰肝素前体而获得。在另一个实施方案中,N-脱乙酰肝素前体可通过包含三氧化硫和/或一种或多于一种含三氧化硫的化合物或加合物的组合物化学硫酸化。使用三氧化硫将多糖内的氨基葡萄糖残基化学N-硫酸化在本领域是公知的(参见Lloyd,A.G.等人,(1971)Biochem.Pharmacol.20(3):637-648;Nadkarni,V.D.等人,(1996)Carbohydrate Research 290:87-96;Kuberan,B.等人,(2003)J.Biol.Chem.278(52):52613-52621;Zhang,Z.等人,(2008)J.Am.Chem.Soc.130(39):12998-13007;和上述Wang等人,(2011);还参见美国专利第6991183号和美国专利公开2008/020789,其公开内容通过引用整体并入)。与氢氧化钠不同,三氧化硫络合物通常是足够温和的碱,能够对多糖进行选定的N-硫酸化而不会引起解聚(参见Gilbert,E.E.,(1962)Chem.Rev.62(6):549-589)。含三氧化硫的络合物的非限制性实例包括二氧化硫-吡啶、二氧化硫-二烷、二氧化硫-三甲胺、二氧化硫-三乙胺、二氧化硫-二甲基苯胺、二氧化硫-氧硫杂环己烷、二氧化硫-双(2-氯乙基)乙醚、二氧化硫-2-甲基吡啶、二氧化硫-喹啉或二氧化硫-二甲基甲酰胺。
在另一个实施方案中,当工程化磺基转移酶是氨基葡萄糖6-O磺基转移酶时,基于肝素前体的多糖可以是包含一个或多于一个包含式VIII结构的结构基序的N,2O-HS多糖,并且工程化磺基转移酶可具有选自如下的氨基酸序列:SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ IDNO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122。在另一个实施方案中,用于与工程化氨基葡萄糖6-O磺基转移酶反应的基于肝素前体的多糖可商业获得。在另一个实施方案中,工程化氨基葡萄糖6-O磺基转移酶的基于肝素前体的多糖可以是工程化或天然己糖醛酸2-O磺基转移酶的硫酸化N,2O-HS多糖产物。在另一个实施方案中,硫酸化多糖产物是包含式IX结构的N,2O,6O-HS多糖。
在另一个实施方案中,当工程化磺基转移酶是氨基葡萄糖3-O磺基转移酶时,基于肝素前体的多糖可以是包含一个或多于一个包含式X结构的结构基序的N,2O,6O-HS多糖,并且工程化磺基转移酶可具有选自如下的氨基酸序列:SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ IDNO:158、SEQ ID NO:159和SEQ ID NO:160。在另一个实施方案中,用于与工程化氨基葡萄糖3-O磺基转移酶反应的基于肝素前体的多糖可商业获得。在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶的基于肝素前体的多糖可以是工程化或天然氨基葡萄糖6-O磺基转移酶的硫酸化N,2O,6O-HS多糖产物。在另一个实施方案中,硫酸化多糖产物是包含式I结构的N,2O,3O,6O-HS多糖。
如上所述,包含式I结构的N,2O,3O,6O-HS多糖可具有抗凝活性(参见Desai,U.R.等人,(1998)J.Biol.Chem.273(13):7478-7487)。抗凝剂N,2O,3O,6O-HS多糖的医学用途已有数十年的记载。N,2O,3O,6O-HS多糖的一些抗凝活动包括但不限于,因子Iia(凝血酶)和/或因子Xa的失活,这两种蛋白质在凝血级联反应中至关重要。特别地,当N,2O,3O,6O-HS多糖与抗凝血酶(AT)结合时,其引起酶的构象变化,从而能够在多糖、AT与凝血酶或因子Xa之间形成三元复合物(参见Li,W.等人,(2004)Nat.Struct.Mol.Biol.11(9):857-862,其公开内容通过引用整体并入)。为了与AT结合并且诱导其构象变化,N,2O,3O,6O-HS多糖通常包含特定的五残基AT识别序列,其与式I的结构等价。
虽然可通过将抗凝血酶与仅由AT识别序列组成的寡糖结合来诱导抗凝作用,但是当N,2O,3O,6O-HS多糖包含大于五个糖残基时,通常对凝血的抑制增强(参见Grey,E.等人,(2008)Thromb.Haemost.99:807818,其公开内容通过引用整体并入)。正如Grey等人报道的,当N,2O,3O,6O-HS多糖在AT识别序列的任一侧上包含至少十三个糖残基时,N,2O,3O,6O-HS多糖和凝血酶之间可形成二次结合相互作用作为“桥”,从而允许多糖与凝血酶结合同时也与AT结合。因此,抗凝N,2O,3O,6O-HS多糖通常需要至少十八个糖残基以便在N,2O,3O,6O-HS多糖、AT和凝血酶之间潜在地形成三元复合物。然而,并且不受特定理论限制,认为因为特定多糖分子内的AT识别序列的分布是随机的,所以在十八至三十一个糖残基之间的一些N,2O,3O,6O-HS多糖理论上可包含朝向分子中心的AT识别序列,其任一侧上都不具有十三个相邻的糖残基。因此,抗凝N,2O,3O,6O-HS多糖通常必须包含至少三十二个糖残基以确保可形成与AT识别序列相邻的十三个残基“桥”,无论AT识别序列在分子内的哪个位置。因此,在一些实施方案中,工程化氨基葡萄糖3-O磺基转移酶的N,2O,3O,6O-HS多糖产物可以是至少五个糖残基,优选至少十八个糖残基,更优选至少三十二个糖残基。
在另一个实施方案中,工程化氨基葡萄糖3-O磺基转移酶的抗凝N,2O,3O,6O-HS产物可以满足USP确定的药物UF-HS组合物对于产品纯度、特别是来自其他硫酸化多糖(包括但不限于硫酸软骨素)的纯度的基准要求。特别地,过度硫酸化的硫酸软骨素(OSCS)确定为药物UF-HS组合物中的污染源,在2007年和2008年导致全球数百人死亡。在另一个实施方案中,并且不受特定理论限制,使用工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物可形成为基本上不含硫酸软骨素、特别是OSCS,因为可在体外提供和/或制备用作原料的基于肝素前体的多糖,而没有从动物来源分离的抗凝剂N,2O,3O,6O-HS多糖中固有存在的相同多糖污染物。
USP已定义抗凝N,2O,3O,6O-HS的参考标准(Chemical Abstracts Service(CAS)号:9041-08-1),通过该标准测量所有药物组合物。符合USP标准的抗凝N,2O,3O,6O-HS组合物的分子量特性必须满足以下所有基准:(1)组合物中分子量超过24000Da的多糖比例不大于20%;(2)组合物本身的为15000Da至19000Da;和(3)组合物中分子量为8000Da至16000Da的多糖数量相对于组合物中分子量为16000Da至24000Da的多糖数量的比例不小于1.0∶1(参见Mulloy,B.等人,(2014)Anal.Bioanal.Chem.406:4815-4823,其公开内容通过引用整体并入)。此外,符合USP的抗凝N,2O,3O,6O-HS组合物的抗凝活性必须满足以下所有基准:抗IIa活性不小于180个国际单位/毫克(IU mg-1);抗Xa活性不小于180IU mg-1;以及抗Xa与抗IIa活性的比率为0.9∶1至1.1∶1。在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物可满足美国药典(USP)对药物UF-HS组合物确定的上述抗凝活性和分子量要求中的任何一个或多于一个。
特别是对于抗凝N,2O,3O,6O-HS产物的分子量特性,这些可以部分地基于控制用作磺基受体的基于肝素前体的多糖的分子量特性来控制。控制基于肝素前体的多糖的分子量的最可控机会是通过N-脱乙酰和解聚肝素前体,如上所述。因此,在另一个实施方案中,可进行一系列磺基转移酶反应以控制抗凝N,2O,3O,6O-HS产物的分子量。在另一个实施方案中,一系列磺基转移酶反应可根据以下步骤来进行:(a)使用氨基葡萄糖N-磺基转移酶由N-脱乙酰肝素前体形成N-硫酸化肝素前体产物;(b)使用步骤(a)的己糖醛酸2-O磺基转移酶和N-硫酸化肝素前体产物来形成N,2O-HS多糖产物;(c)使用步骤(b)的氨基葡萄糖6-O磺基转移酶和N,2O-HS多糖产物来形成N,2O,6O-HS多糖产物;和(d)使用步骤(c)的氨基葡萄糖3-O磺基转移酶和N,2O,6O-HS多糖产物来形成抗凝N,2O,3O,6O-HS多糖产物。在另一个实施方案中,所有磺基转移酶是工程化磺基转移酶,并且每个反应中的磺基供体是芳基硫酸酯化合物、优选PNS或NCS。在另一个实施方案中,N-脱乙酰肝素前体具有9000Da至12500Da的以及12%至18%的N-乙酰氨基葡萄糖含量,如以上Wang等人,(2011)中所述。或者,并且在另一个实施方案中,用作己糖醛酸2-O磺基转移酶的磺基受体的N-硫酸化肝素前体产物可由N-脱乙酰肝素前体化学硫酸化,如上所述。
因此,在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物可具有如下至少1000Da,包括至少2000Da、3000Da、4000Da、5000Da、6000Da、7000Da、8000Da、9000Da、10000Da、11000Da、12000Da、13000Da、14000Da、15000Da、16000Da、17000Da、18000Da、19000Da、20000Da、21000Da、22000Da、23000Da或24000Da、至至少50000Da。在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物可具有如下小于50000Da,包括小于24000Da、23000Da、22000Da、21000Da、20000Da、19000Da、18000Da、17000Da、16000Da、15000Da、14000Da、13000Da、12000Da、11000Da、10000Da、9000Da、8000Da、7000Da、6000Da、5000Da、4000Da或3000Da一直到小于2000Da。在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物可具有上述列举的1000Da至50000Da并且包括1000Da和50000Da的任何范围内,并且优选上述列举的15000Da至约19000Da并且包括15000Da和约19000Da的任何范围内的
类似地,在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物的大小分布可使得小于50%,包括小于45%、40%、35%、30%、25%、20%、15%、10%、5%、3%或2%一直到小于1%的N,2O,3O,6O-HS产物内的N,2O,3O,6O-HS多糖的分子量大于24000Da。在另一个实施方案中,小于或等于20%的N,2O,3O,6O-HS产物内的N,2O,3O,6O-HS多糖具有大于24000Da的分子量。在另一个实施方案中,当小于或等于20%的N,2O,3O,6O-HS产物内的N,2O,3O,6O-HS多糖具有大于24000Da的分子量时,抗凝N,2O,3O,6O-HS产物可具有上述列举的1000Da至24000Da并且包括1000Da和24000Da任何范围内、优选上述列举的15000Da至约19000Da并且包括15000Da和约19000Da任何范围内的
在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝剂N,2O,3O,6O-HS产物的大小分布可使得组合物内分子量为8000Da至16000Da的多糖数量相对于组合物内分子量为16000Da至24000Da的多糖数量的比率不小于0.5∶1,包括不小于0.75∶1、0.9∶1、1.0∶1、1.1∶1、1.3∶1或1.5∶1至不小于2.0∶1和优选不小于1.0∶1。在另一个实施方案中,其中组合物内分子量为8000Da至16000Da的多糖数量相对于组合物内分子量为16000Da至24000Da的多糖数量的比率不小于1.0∶1的N,2O,3O,6O-HS产物,也可具有上述列举的1000Da至24000Da并且包括1000Da和24000Da的任何范围内,优选上述列举的15000Da至约19000Da并且包括15000Da和约19000Da的任何范围内的其中N,2O,3O,6O-HS产物内小于或等于20%的N,2O,3O,6O-HS多糖的分子量大于24000Da。
在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物可具有如下抗Xa活性:至少约1IU mg-1,包括至少约50IU mg-1、至少75IU mg-1、100IU mg-1、150IU mg-1、200IU mg-1或500IU mg-1至至少约1000IU mg-1。在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物可具有如下抗IIa活性:至少约1IU mg-1,包括至少约50IU mg-1、至少75IU mg-1、100IU mg-1、150IU mg-1、200IU mg-1或500IU mg-1至至少约1000IU mg-1。在另一个实施方案中,通过工程化氨基葡萄糖3-O磺基转移酶制备的抗凝N,2O,3O,6O-HS产物的抗Xa活性与抗IIa活性的比率可为至少0.5∶1,包括至少0.75∶1、0.9∶1、1∶1、1.1∶1、1.3∶1、1.5∶1、2.0∶1、3.0∶1、4.0∶1、5.0∶1、6.0∶1、7.0∶1、8.0∶1、9.0∶1、10.0∶1、20∶1、40∶1、60∶1或80∶1至至少100∶1。然而,具有三十二个糖残基或更长的并且能够与AT和凝血酶形成三级复合物的抗凝N,2O,3O,6O-HS多糖通常具有的抗Xa活性与抗IIa活性的比率通常接近1∶1,大约0.9∶1至1.1∶1(参见Keire,D.A.等人,(2011)Anal.Bioanal.Chem.399:581591,其公开内容通过引用整体并入)。
制备工程化芳基硫酸酯依赖性酶
一般而言,可以使用本领域已知的任何微生物技术来表达和纯化由所公开的核酸和氨基酸序列编码的工程化酶,包括如下所述。每种纯化酶的芳基硫酸酯依赖性活性可通过分光光度法或荧光法和/或使用质谱法(MS)或核磁共振(NMR)光谱法来确定,以表征原料和/或硫酸化多糖产物。这些方法在下面的实施例部分中描述。
本发明的工程基因产物、蛋白质和多肽还可包括含有相对于公开的DNA或肽序列的插入、缺失或突变,并且还编码其中芳基硫酸酯化合物是底物的催化反应的酶的类似物。在另一个实施方案中,每种类似物都类似地催化磺基转移反应,其中芳基硫酸酯化合物用作磺基供体。类似物可源自本文公开的核苷酸或氨基酸序列,或者它们可使用计算机建模技术经由电脑模拟或从头合成来进行合成设计。本领域技术人员将理解,尚未公开或未发现的其他类似物可用于设计和/或构建本发明的不同硫酸酯依赖性酶。不需要基因产物、蛋白质或多肽包含本文公开的工程化酶的全部或基本上全部的核酸或氨基酸序列。这种序列在本文中称为“片段”。此外,本文讨论和公开的基因产物、蛋白质和多肽还可包括融合或重组工程化酶,其包含本发明公开的序列的全长序列或生物学功能片段。制备这种蛋白质的方法是本领域已知的。
除了本文公开的核酸和氨基酸序列之外,本发明的任何方法都可通过包含与公开的氨基酸序列基本上相同的如下氨基酸序列的工程化酶来实施
(SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160),
或从包含与公开的核苷酸序列基本上相同的如下核苷酸序列的核酸表达
(SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,或SEQ ID NO:152)。
本领域技术人员可以基于核苷酸序列
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,或SEQ ID NO:152
确定编码具有如下氨基酸序列的多肽的适当核苷酸序列:
SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:66,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114,SEQ ID NO:115,SEQ IDNO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ IDNO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
本领域中使用的“基本上相同的”序列是指通过一个或多于一个缺失、置换或添加而与特定参考序列不同的序列,其净效应是保留由参考序列编码的工程化多肽的至少一些生物学活性。即,工程化磺基转移酶的生物活性包括将磺基从芳基硫酸酯化合物转移至充当磺基受体的多糖。在另一个实施方案中,多糖是基于肝素前体的多糖和/或HS多糖。因此,当用于描述本发明的工程酶时,“基本同一性”可以指与工程化酶的特定基因产物、多肽或氨基酸序列,或编码工程化酶的基因或核酸序列的同一性。这种序列可包括所公开序列的突变,或如下序列,其中生物活性在某种程度上被改变、增强或减弱但保留由所公开参考核酸序列编码的参考氨基酸序列或多肽的至少一些原始生物活性。
或者,在以下情况下,DNA类似物序列与本文公开的特定DNA序列基本上相同:(a)DNA类似物序列衍生自任何公开的核酸序列的编码区;或(b)DNA类似物序列能够在严格条件下与(a)的DNA序列杂交并且编码具有生物活性的基因产物;或(c)DNA序列由于(a)和/或(b)中定义的DNA类似物序列的替代遗传密码而退化。基本上相同的类似物蛋白质将与天然蛋白的相应序列有60%的同一性。具有较低同一性但生物活性相当,即将磺基从芳基硫酸酯化合物转移到多糖、特别是基于肝素前体的多糖或HS多糖的序列,也认为是基本上相同的。在确定核酸序列的基本同一性时,能够编码基本上相同的氨基酸序列的所有对象核酸序列都认为与参考核酸序列基本上相同,而不管产生生物学功能等价物的密码子序列或氨基酸置换的差异。
在生物学水平上,同一性只是指在基因家族的给定家族成员中相同的相对位置上的相同氨基酸。同源性和相似性通常视为更广泛的术语。例如,生化上相似的氨基酸,例如亮氨酸和异亮氨酸或谷氨酸/天冬氨酸,可交替出现在相同位置,这些氨基酸本身并不相同,但在生化上是“相似的”。如本文所公开的,这些称之为保守差异或保守置换。这与DNA水平的保守突变不同,后者改变核苷酸序列而不改变编码的氨基酸,例如TCC至TCA,两者都编码丝氨酸。
在一些实施方案中,基因和基因产物在其各自的序列中包括“基本上与编码工程化酶或其相应蛋白质的基因相同”的序列。基本上作为编码工程化酶的基因的序列是指如下序列,其与公开的核酸序列的一部分基本上相同或基本上相似,并且包含与公开的蛋白质或基因不相同的那些或不是生物学功能等价物的少数碱或氨基酸(无论是DNA还是蛋白质)。生物功能等价物在本领域中是公知的并且在下面进一步详细讨论。核苷酸序列“基本上相同”,其中它们具有约75%至约85%,或特别地约86%至约90%,或更特别地大于90%,或甚至更特别地约91%至约95%,或还更特别地约96%至约99%的与所公开基因的核苷酸序列相同的核酸残基。类似地,与公开的多肽序列的氨基酸相同或在功能上等效或在生物学功能上等价的、具有约80%或90%或特别地90%至95%或更特别地大于96%或甚至更特别地95%至98%、或还更特别地99%或大于99%的氨基酸的肽序列将是“基本上相同”的序列。
另外,本发明还包括包含功能上等效的密码子的替代核酸序列。功能等效密码子是指编码相同氨基酸的密码子,例如丝氨酸的ACG和AGU密码子。因此,将下表1的功能等效密码子置换到以上公开的任何核苷酸序列的序列实例中的置换,最终编码生物功能等效酶,该生物功能等效酶依赖于结合芳基硫酸酯化合物并且与其反应以催化磺基转移。因此,本发明包括包含这种置换的氨基酸和核酸序列,但为方便起见,本文并未完整阐述。
本领域技术人员将认识到,氨基酸和核酸序列可包括另外的残基,例如另外的N-或C-末端氨基酸或5′-或3′-核酸序列,但基本上仍然如本文公开的序列之一中所述,只要该序列保留其在结合作为磺基供体的芳基硫酸酯化合物并且与其反应方面的生物活性即可。末端序列的添加特别适用于核酸序列,所述核酸序列可例如包括位于编码区5′-或3′-部分的侧面的各种非编码序列,或者可包括已知在基因内出现的各种内部序列或内含子。
表1
功能等效密码子
如上所述,可在任何公开的工程化酶的序列中进行修饰和改变,包括保守和非保守突变、缺失和添加,同时仍构成具有相似或其他所需特征的分子。例如,某些氨基酸可以替代蛋白质结构中的其他氨基酸,而不会明显损失与特定结构或化合物、特别是芳基硫酸酯化合物和/或磺基受体多糖的相互作用能力。这可能是因为蛋白质识别、结合环境中的其他结构或化合物并且与其反应的能力决定蛋白质的生物功能活性,而不是序列本身。因此,可在蛋白质的序列中进行某些氨基酸序列置换,以获得具有相同、增强或减弱性能的蛋白质。可在不明显丧失相互作用活性的情况下发生的这种氨基酸取代的一个非限制性实例包括不影响蛋白质折叠和溶解度的蛋白质外部结构域或表面中的取代。类似地,只要蛋白质折叠或识别和结合其底物的能力不受有害影响,就可将氨基酸潜在地添加到蛋白质的任一末端。本领域技术人员可以理解,可利用几种其他方法和/或策略来改变酶的序列而不影响其活性。
因此,对亲本酶结构或序列的突变、缺失、添加或其他改变(其中修饰的酶保留亲本酶的生物活性),可定义为与亲本酶在生物学上功能等效。因此,相对于工程化芳基硫酸酯依赖性酶来说,生物学功能等效酶可包括如下中公开的氨基酸序列的任何取代或修饰:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160,
其中所得的修饰酶依赖于与芳基硫酸酯化合物、特别是PNS或NCS相互作用,以催化磺基转移至多糖、特别是基于肝素前体的多糖和/或HS多糖。特别地,如下所述,这种取代或修饰可由蛋白质任何部分的氨基酸序列中的保守突变引起,尽管也预想到酶的非催化活性区域中的非保守突变。因此,工程化酶可由具有编码生物学功能等效酶的核苷酸序列的任何核酸表达,虽然为了方便起见,本文未完整列出这种核苷酸序列。
或者,重组DNA技术可用于产生生物学功能等效的蛋白质或肽,其中蛋白质结构的变化可基于交换的氨基酸性能来工程化。可通过应用定点诱变技术引入合理设计的变化,例如,来测试某些突变是否对酶的芳基硫酸酯依赖性催化活性和/或酶的活性位点内磺基供体或受体的结合产生积极或消极影响。
氨基酸取代,例如可用于修饰本文所述的任何工程化酶的那些,通常基于氨基酸侧链取代基的相对相似性,例如它们的疏水性、亲水性、电荷、大小等。本领域技术人员熟悉某些氨基酸之间的相似性,例如氨基酸侧链取代基的大小、形状和类型。非限制性实例包括诸如如下的关系:精氨酸、赖氨酸和组氨酸都是带正电荷的残基;丙氨酸、甘氨酸和丝氨酸的大小都相似;并且苯丙氨酸、色氨酸和酪氨酸都具有大致相似的形状。因此,包含以下基团的氨基酸:精氨酸、赖氨酸和组氨酸;丙氨酸、甘氨酸和丝氨酸;和苯丙氨酸、色氨酸和酪氨酸,在本文中定义为相同组中其他氨基酸的生物学功能等价物。本领域技术人员将理解其他生物学功能等效的变化。
评价生物学功能等价物的一种这样的方法是评价和考虑每种氨基酸的亲水指数。根据疏水性和电荷特性,二十种常见氨基酸的中的每一种都指定亲水性指数,这些是:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);和精氨酸(-4.5)。
氨基酸残基的亲水性指数与蛋白质的生物学功能之间的关系是本领域普遍了解的(Kyte,J.等人,(1982)J.Mol.Biol.157(1):105-132.)。已知某些氨基酸可替代具有相似亲水指数或分数的其他氨基酸,并且仍保持相似的生物活性。在根据亲水指数进行改变时,亲水指数在原始值±2以内的氨基酸的取代是确定取代是否在生物学功能上等效的优选度量,但是在原始值的±1以内的那些取代是特别优选的,并且在原始值的±0.5以内的那些是甚至更特别优选的。
类似地,本领域还理解,基于亲水性可以有效地进行类似氨基酸的取代。美国专利第4554101号(其公开内容通过引用整体并入本文)指出,蛋白质的最大局部平均亲水性(由其相邻氨基酸的亲水性控制)与蛋白质的免疫原性、抗原性和其他生物学特性相关联。应理解,一种氨基酸取代另一种具有相似亲水性值的氨基酸,并且仍然获得生物学上等效的蛋白质。如美国专利第4554101号中报道,以下亲水性值已指定给氨基酸残基:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
当基于氨基酸的亲水指数进行突变时,可对亲水性进行类似改变。因此,亲水性值在原始值±2以内的氨基酸的取代是确定取代是否在生物学功能上等效的优选度量,但是在原始值±1以内的那些取代是特别优选的,并且在原始值±0.5以内的那些取代是甚至更特别优选的。
在另一个实施方案中,提供编码本发明工程化酶的分离的核酸或其功能片段。在一些实施方案中,工程化酶包含选自如下的氨基酸序列:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,和SEQ ID NO:160。
在其他实施方案中,本发明提供编码本发明工程化酶的功能片段的分离的核酸或其突变体,其中已对上面列举的任何工程化酶的氨基酸序列中的特定残基进行保守置换。
另外,用于表达本发明的任何工程化酶的分离的核酸可与其他核酸序列连接以用于各种应用。因此,例如,可将分离的核酸连接至克隆或表达载体中,如本领域公知的并且如以下实施例中所述。另外,如本领域公知的,核酸可框内连接至编码另一多肽的序列从而形成融合蛋白。融合蛋白可包含工程化酶的编码区,所述编码区与具有所需功能的其他蛋白质或肽排列在相同表达单元内,例如用于溶解性、纯化或免疫检测。因此,在另一个实施方案中,还提供包含编码本发明工程化酶的任何上述核酸的克隆、表达和融合载体。
此外,本发明的核酸片段,无论编码序列本身的长度如何,都可与其他DNA序列组合,所述其他DNA序列例如启动子、增强子、聚腺苷酸化信号、另外的限制酶位点、多克隆位点、其他编码片段等,使得它们的总长度可能会有很大差异。本领域技术人员会认识到,可使用几乎任何长度的核酸片段,其中总长度通常受到在预期重组DNA方案中制备和使用的容易程度的限制。
特别地,其中基因或DNA片段的编码部分处于启动子控制下的重组载体特别有用。在一些实施方案中,编码DNA片段可与从细菌、病毒、真核或哺乳动物细胞中分离的启动子相关联。特定于选择用于表达的细胞类型的启动子通常是最有效的。用于蛋白质表达的启动子和细胞类型组合的使用对于分子生物学领域的技术人员来说通常是已知的(参见例如,Sambrook等人,(2012)Molecular Cloning:A Laboratory Manual,第四版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,通过引用整体并入)。采用的启动子可以是组成型或诱导型的,并且可在适当条件下用于指导引入的DNA片段的高水平表达,例如在重组蛋白或肽的大规模生产中是有利的。通常对高水平表达有效的适当启动子系统包括但不限于痘苗病毒启动子、杆状病毒启动子和Ptac启动子。
因此,在一些实施方案中,可使用包含编码适合本发明的生物活性工程化酶的核苷酸序列的表达载体。在一个实例中,表达载体可包含编码芳基硫酸酯依赖性基因产物的任何核苷酸序列。在进一步的实施方案中,表达载体包含含有如下核苷酸序列的核酸:
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,或SEQ ID NO:152。
在其他进一步的实施方案中,表达载体包括包含编码多肽的任何核苷酸序列的核酸,所述多肽包含如下氨基酸序列:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
在更进一步的实施方案中,编码本发明工程化酶的任何核酸序列都可基于用于生产酶的表达宿主进行密码子优化。重组载体的制备和密码子优化是本领域技术人员公知的并且在许多参考文献中描述到,例如,Sambrook等人,(2012)Molecular Cloning:ALaboratory Manual,第四版,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.。
本领域技术人员会认识到,待表达的DNA编码序列,在编码工程基因产物的那些的情况下,位于与启动子相邻并且受启动子控制的载体中。如本领域已知的,启动子是DNA分子的一个区域,通常在转录开始点(即转录起始位点)上游(即5′端)的约100个核苷酸对内。此区域通常包含几种类型的DNA序列元件,所述元件位于不同基因中相似的相对位置。本领域理解,为了使编码序列处于这种启动子的控制之下,一般将待表达的基因产物的转录阅读框的转录起始位点的5′端定位在所选启动子的“下游”(即,3′端)的约1个至约50个核苷酸之间。
如果原始插入的DNA中不包含适当的多聚腺苷酸化位点(例如,5′-AATAAA-3′),则还可希望将适当的多聚腺苷酸化位点并入载体的转录单元中。通常,poly-A添加位点位于在转录终止之前的位置的编码序列“下游”的约30个至2000个核苷酸处。
另一种类型的离散转录调控序列元件是增强子。增强子对特定编码区或基因施加时间、位置和表达水平的特异性。增强子的主要功能是提高细胞中编码序列的转录水平,所述细胞包含一个或多于一个结合该增强子的转录因子。只要存在启动子,增强子就可在距转录起始位点不同距离处发挥作用。
任选地,本发明的表达载体包含与增强子-启动子可操作地连接的多核苷酸。如本文所用,短语“增强子-启动子”是指包含增强子和启动子元件的复合单元。例如,表达载体可包含与作为真核启动子的增强子-启动子可操作地连接的多核苷酸,并且表达载体还包含位于羧基末端氨基酸的3’位和编码多肽的转录单元内的聚腺苷酸化信号。如本文所用,短语“可操作地连接”是指增强子-启动子以编码序列的转录受此增强子-启动子控制和调节的方式连接至编码序列。用于将增强子-启动子可操作地连接至编码序列的技术是本领域公知的;相对于感兴趣的编码序列的精确定向和位置主要取决于增强子-启动子的特定性质。
在本发明的载体构建体中使用的增强子-启动子可以是在待转染的细胞中驱动表达的任何增强子-启动子。通过使用具有公知特性的增强子-启动子,可优化基因产物表达的水平和模式。
本发明的工程化酶可在原核或真核的细胞或细胞系中表达,向其中已引入本发明的核酸从而引起那些核酸的克隆繁殖和/或由其编码的蛋白质或肽的表达。这种细胞或细胞系可用于繁殖和生产核酸,包括如下序列中公开的那些:
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,或SEQ ID NO:152。
这种细胞或细胞系也可用于自身产生工程化酶,包括由如下序列描述的那些:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
如本文所用,术语“转化细胞”旨在包括通过转化、转染、转导、感染或其他方式引入本发明任何核酸的任何细胞或任何细胞的后代。产生适当的载体、利用那些载体的转化细胞和鉴定转化子的方法是本领域公知的(参见例如,Sambrook等人,(2012)MolecularCloning:A Laboratory Manual,第四版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.)。
用于产生转化细胞的原核细胞包括细菌属埃希氏菌(例如大肠杆菌)、假单胞菌(例如铜绿假单胞菌(P.aeruginosa))和芽孢杆菌(例如枯草芽孢杆菌(B.subtilus)、嗜热脂肪芽孢杆菌(B.stearothermophilus))以及本领域中公知和经常使用的许多其他原核细胞。原核细胞对于制备大量蛋白质或肽特别有用(例如,包含如下氨基酸序列的工程酶:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160,
那些序列的片段,或包括那些序列的融合蛋白)。细菌细胞(例如,大肠杆菌)可与多种表达载体系统一起使用,其包括例如具有T7RNA聚合酶/启动子系统的质粒、噬菌体λ调控序列或M13噬菌体调控元件。细菌宿主也可用融合蛋白载体转化,产生例如,蛋白A、lacZ、trpE、麦芽糖结合蛋白(MBP)、小泛素相关修饰物(SUMO)、poly-His标签或谷胱甘肽-S-转移酶(GST)融合蛋白。所有这些以及许多其他原核表达系统是本领域公知的并且可广泛商购获得(例如,用于GST融合的pGEX-27(Amrad,USA))。
在本发明的一些实施方案中,包含如下所述核酸序列的表达载体还可包含用任何工程化酶编码融合蛋白的基因或核酸序列:
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,或SEQ ID NO:152。
在进一步的实施方案中,表达载体可另外包含malE基因,其编码麦芽糖结合蛋白。在从这种表达载体中诱导蛋白质表达后,表达的基因产物包含融合蛋白,所述融合蛋白包括麦芽糖结合蛋白和包含如下氨基酸序列所述的工程化酶:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
在其他进一步的实施方案中,包含编码任何上述工程化酶的任何上述核酸的表达载体可另外包含编码SUMO修饰剂的基因,例如在一个非限制性实例中,SUMO-1。
在其他实施方案中,根据本发明的表达载体可以另外包括编码poly-His标签的核酸序列。在从这种表达载体诱导蛋白质表达后,所表达的基因产物包含融合蛋白,所述融合蛋白包含poly-His标签和包含如下氨基酸序列的工程化酶:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
在一个进一步的实施方案中,表达载体可包括从中可表达包含poly-His标签、MBP或SUMO的融合蛋白的编码poly-His标签和malE基因或SUMO基因的核酸序列以及任何工程化酶。
用于产生转化细胞的真核细胞和细胞系包括哺乳动物细胞(例如,内皮细胞、肥大细胞、COS细胞、CHO细胞、成纤维细胞、杂交瘤、卵母细胞、胚胎干细胞)、昆虫细胞系(例如,果蝇Schneider细胞)、酵母和真菌。这种细胞的非限制性实例包括但不限于COS-7细胞、CHO细胞、鼠原代心脏微血管内皮细胞(CME)、鼠肥大细胞系C57.1、人脐静脉原代内皮细胞(HUVEC)、F9胚胎癌细胞、大鼠脂肪垫内皮细胞(RFPEC)和L细胞(例如,鼠LTA tk-细胞)。
可以通过本领域熟知的各种方法将载体引入受体或“宿主”细胞,包括但不限于磷酸钙转染、磷酸锶转染、DEAE葡聚糖转染、电穿孔、脂质转染、显微注射、在微珠上的弹道插入,原生质体融合,或者对于病毒或噬菌体载体,通过用重组病毒或噬菌体感染。
在一些实施方案中,本发明提供依赖于与芳基硫酸酯化合物反应以获得生物活性的工程化酶的基本上纯的制剂。在进一步的实施方案中,纯化的工程化酶可包含如以下公开的氨基酸序列:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
在另一个实施方案中,本发明提供工程化酶变体,其中对如下公开的氨基酸序列中的某些残基进行保守或非保守置换:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160。
保守或非保守置换可在氨基酸序列的任何点进行,包括围绕活性位点或参与催化的残基,条件是酶保持可测量的催化活性;即,磺基从芳基硫酸酯化合物转移至多糖、特别是基于肝素前体的多糖和/或HS多糖。在其他实施方案中,芳基硫酸酯化合物是PNS。还在其他实施方案中,芳基硫酸酯化合物是NCS。
在另一个实施方案中,工程化磺基转移酶具有与如下公开的氨基酸序列至少50%,包括至少60%、至少70%、至少80%、至少85%、至少90%或至少95%至至少99%的氨基酸序列同一性:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160,
同时保留其磺基从芳基硫酸酯化合物至转移多糖、特别是基于肝素前体的多糖和/或HS多糖的催化活性。这种序列可由本领域技术人员常规产生,并且磺基转移酶活性可通过常规方法例如本文公开的方法测试。
此外,并且在另一个实施方案中,根据本文所述的任何方法使用的任何工程化磺基转移酶的氨基酸序列可表征为相对于使用作为磺基供体的3′-磷酸腺苷5′-磷酸硫酸酯催化相同反应的野生型磺基转移酶的百分比同一性,只要磺基转移酶具有芳基硫酸酯依赖性活性即可。例如,并且在另一个实施方案中,可根据本发明的任何方法使用的工程化芳基硫酸酯依赖性氨基葡萄糖N-磺基转移酶可包含具有与EC 2.8.2.8酶类内任何野生型酶的N-磺基转移酶结构域的氨基酸序列至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%序列同一性的氨基酸序列,包括其生物功能片段。在一个进一步的实施方案中,工程化氨基葡萄糖N-磺基转移酶可包含与野生型人氨基葡萄糖N-脱乙酰酶/N-磺基转移酶的N-磺基转移酶结构域的氨基酸序列至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性(条目sp|P52848|NDST_1_HUMAN,在上图6A、图6B和图6C中)。
在另一个实施方案中,可根据本发明的任何方法使用的工程化芳基硫酸酯依赖性己糖醛酸2-O磺基转移酶可包含具有与EC 2.8.2.-酶类任何野生型己糖醛酸2-O磺基转移酶的氨基酸序列至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性的氨基酸序列,包括其生物功能片段。在一个进一步的实施方案中,工程化己糖醛酸2-O磺基转移酶可包含与野生型鸡己糖醛酸2-O磺基转移酶的氨基酸序列至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性(条目sp|Q76KB1|HS2ST_CHICK,在上图17A、图17B、图17C和图17D中)。
在另一个实施方案中,可根据本发明的任何方法使用的工程化芳基硫酸酯依赖性氨基葡萄糖6-O磺基转移酶可包含具有与EC 2.8.2.-酶类内任何野生型氨基葡萄糖6-O磺基转移酶的氨基酸序列至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性的氨基酸序列,包括其生物功能片段。在一个进一步的实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含与小鼠氨基葡萄糖6-O磺基转移酶的第一同工型的氨基酸序列至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性(UniProtKB登录号Q9QYK5)。在一个进一步的实施方案中,工程化氨基葡萄糖6-O磺基转移酶可包含与小鼠氨基葡萄糖6-O磺基转移酶的第一同工型氨基酸序列的残基67-377至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性(条目Q9QYK5|H6ST1_MOUSE,在上图21A、图21B和图21C中)。
在另一个实施方案中,可根据本发明的任何方法使用的工程化芳基硫酸酯依赖性氨基葡萄糖3-O磺基转移酶可包含具有与EC 2.8.2.23酶类内任何野生型酶的氨基酸序列至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性的氨基酸序列,包括其生物功能片段。在一个进一步的实施方案中,工程化氨基葡萄糖3-O磺基转移酶可包含与野生型人氨基葡萄糖3-O磺基转移酶的第一同工型氨基酸序列的残基48-311至少50%,包括至少55%、60%、65%、70%、75%、80%、85%、90%或95%至至少97%的序列同一性(条目O14792|HS3S1_HUMAN,在上图26A、图26B和图26C中)。
可将基本上纯的工程化酶与其他多肽序列连接以用于各种应用。因此,例如,如本领域公知的,工程化酶可与一种或多于一种另外的多肽连接以形成融合蛋白。另外的多肽可连接至工程化酶的N-末端、C-末端或两个末端。如果另外的多肽序列易于鉴定(例如,通过提供抗原决定簇)、易于纯化(例如,通过提供用于亲和纯化的配体)或提高工程化酶在溶液中的溶解度,则此类融合蛋白可能特别有用。
在另一个实施方案中,基本上纯的蛋白质可仅包含工程化酶的氨基酸序列的一部分或片段。在一些情况下,可优选使用保留芳基硫酸酯依赖性活性的最小片段,特别是如果最小片段提高酶的溶解度或反应性。因此,在一些实施方案中,可使用任何长度的基本上纯的工程化磺基转移酶来实施本发明的方法,包括由以下氨基酸序列描述的全长形式:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ IDNO:63,SEQ ID NO:65,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:111,SEQ ID NO:112,SEQ ID NO:113,SEQ IDNO:114,SEQ ID NO:115,SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118,SEQ ID NO:119,SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122,SEQ ID NO:123,SEQ ID NO:125,SEQ IDNO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ IDNO:149,SEQ ID NO:151,SEQ ID NO:153,SEQ ID NO:154,SEQ ID NO:155,SEQ ID NO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:159,或SEQ ID NO:160,
包括其最小功能片段。另外,这些蛋白质还可包含如上所述的保守或非保守置换变体。
工程化酶可通过基于其蛋白质序列所揭示的特性选择的多种方法中的任一种来进行基本上纯化。通常,如上所述,工程化酶、融合蛋白或其片段可从利用表达载体转化或转染的细胞中纯化。可以使用昆虫、酵母、真核或原核表达系统,并且这些是本领域公知的。在蛋白质或片段位于源自高尔基体、内质网或此类细胞的其他含膜结构的微粒体中的情况下,可从适当的细胞级分中纯化蛋白质。或者,如果蛋白质不在这些结构中定位,或在重组细胞(例如原核细胞)内的包涵体中聚集,则可通过标准方法从完整裂解的细胞或溶解的包涵体中纯化蛋白质。
可使用标准蛋白质纯化程序实现纯化,其包括但不限于亲和色谱、凝胶过滤色谱、离子交换色谱、高效液相色谱(RP-HPLC、离子交换HPLC、尺寸排阻HPLC)、高效色谱聚焦色谱、疏水相互作用色谱、免疫沉淀或免疫亲和纯化。凝胶电泳(例如,PAGE、SDS-PAGE)也可用于根据蛋白质或肽的分子量、电荷特性和疏水性来分离它。
工程化酶或其片段也可通过产生融合蛋白来方便地纯化,所述融合蛋白包括与另一种肽融合的所需序列,例如抗原决定簇、多组氨酸标签(例如,QIAexpress载体,QIAGENCorp.,Chatsworth,CA),或更大的蛋白质(例如,使用pGEX-27载体的GST(Amrad,USA),使用Green Lantern载体的绿色荧光蛋白(GlBCO/BRL.Gaithersburg,MD),使用pMAL载体的麦芽糖结合蛋白(New England Biolabs,Ipswich,MA)或SUMO蛋白。融合蛋白可从原核或真核细胞中表达和回收,并且通过基于融合载体序列的任何标准方法进行纯化。例如,融合蛋白可通过免疫亲和或免疫沉淀用融合的非芳基硫酸酯依赖性酶部分的抗体进行纯化,或者在poly-His标签的情况下,通过与镍柱的亲和结合来纯化。然后可通过融合蛋白的酶促裂解从融合蛋白中进一步纯化所需工程化酶蛋白或片段。制备和使用这种融合构建体来纯化蛋白质的方法是本领域公知的,并且现有许多试剂盒商购可得用于该目的。
此外,在一些实施方案中,编码任何工程化酶的分离核酸可用于转化宿主细胞。然后可通过公知方法基本上纯化所得蛋白质,包括但不限于以下实施例中描述的那些。或者,分离的核酸可用于无细胞体外翻译系统。这样的系统在本领域中也是公知的。
虽然已描述本发明的特定实施方案,但是可在本公开的精神和范围内进一步修改本发明。本领域技术人员将认识到或能够仅使用常规实验来确定本文描述的特定程序、实施方案、权利要求和实例的许多等同物。因此,认为这种等同物在本发明的范围内,因此本申请旨在使用其一般原理覆盖本发明的任何变体、用途或修改。此外,本发明旨在涵盖在本发明所属领域的已知或惯用实践内并且落入所附权利要求范围内的与本公开内容的这种偏离。
应该理解,为了清楚起见,在单独实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反,为了简洁起见,在单个实施方案的上下文中描述的本发明的各种特征也可单独地或以任何合适的子组合或在本发明的任何其他所述的实施方案中合适地提供。在各种实施方案的上下文中描述的某些特征不认为是那些实施方案的基本特征,除非实施方案在没有这些要素的情况下是不可操作的。
本说明书中提及的所有参考文献、专利和专利申请的内容在此通过引用并入,并且不应解释为承认这种引用可作为本发明的现有技术而获得。本说明书中所有并入的出版物和专利申请都表示本发明所属领域的普通技术水平,并且以与每个单独出版物或专利申请都特别指明和单独指明的程度相同的程度通过引用并入。
本发明通过以下工作和预见性实施例进一步说明,这些实施例都不应解释为限制本发明。此外,就使用章节标题而言,它们不应解释为必然限制。任何使用过去时来描述以其他方式指示为建设性或预见性的实例并不旨在反映该建设性或预见性实例实际上已进行。
实施例
以下工作和预见性实施例说明目前最广为人知的本发明的实施方案。然而,应该理解,以下仅是本发明原理的示例性或说明性应用。在不脱离本发明的精神和范围的情况下,本领域技术人员可以设计多种修改和替代组合物、方法和系统。因此,虽然本发明已在上文中进行具体描述,但以下实施例提供与目前认为是本发明最实用和优选实施方案相关的进一步细节。
实施例1:工程化芳基硫酸酯依赖性酶的克隆、表达和纯化
根据本公开的实施方案进行研究以确定根据本发明的基因是否可转化到能够过表达工程化芳基硫酸酯依赖性酶、特别是具有磺基转移酶活性的酶的宿主细胞中。表达后,从宿主细胞中分离和纯化每种芳基硫酸酯依赖性酶。
一般来说,编码任何序列的基因的DNA可通过本领域公知的方法从头合成,包括但不限于寡核苷酸合成和退火。或者,DNA可商业合成并且从定期合成给定序列的基因的几个实验室中的任一个购买,所述实验室包括但不限于ThermoFisher Scientific、GenScript、DNA 2.0或OriGene。本领域技术人员会理解,有几家公司提供相同的服务,上面提供的列表仅是其中的一小部分。感兴趣的基因可独立合成,随后使用常规分子生物学技术插入到细菌或其他表达载体中,或者基因可与包含表达载体本身的DNA同时合成。与感兴趣的基因类似,合适的表达载体也可合成或商业获得。通常,细菌表达载体包括赋予宿主细胞选择性抗生素抗性的基因,以及允许细胞响应异丙基β-D-1-硫代半乳糖苷(IPTG)的添加而过量产生感兴趣的蛋白质的基因。使用IPTG诱导蛋白质表达的感兴趣的蛋白质的细菌生产是本领域众所周知的。
如上所述,表达载体还可包括能够产生融合蛋白的基因,所述融合蛋白包括与另外的已知蛋白质共表达以帮助蛋白质折叠和溶解的所需蛋白质。通常产生并且本领域公知的融合蛋白的非限制性实例包括MBP、SUMO或绿色荧光蛋白融合的融合蛋白。特别地,MBP融合蛋白有助于更容易地纯化,因为MBP对某些亲和色谱柱中使用的直链淀粉类树脂具有高亲和力,同时SUMO融合蛋白可包含多组氨酸标签,其能够在以基于Ni2+的树脂作为固定相的柱上进行亲和纯化。通常,在感兴趣的蛋白质和MBP和/或SUMO之间的融合蛋白可任选地包括连接这两种蛋白质的氨基酸连接序列。可购买以生产MBP融合蛋白的商业表达载体的非限制性实例包括pMAL-c5ETM和pMAL-c5XTM载体,其可从New England Biolabs获得。类似地,并且在另一个非限制性实例中,也可购买商业表达载体来生产SUMO融合蛋白,例如pE-SUMOpro AMP载体,其可从LifeSensors,Inc.获得。一旦产生并且纯化融合蛋白,如果活性需要切割,则可利用蛋白酶从酶中切割融合蛋白和任何相关的接头序列。
另外,表达载体还可包括编码多组氨酸标签的DNA,所述标签可在感兴趣的蛋白质的N-端或C-端合成。与MBP融合一样,包括多组氨酸标签的蛋白质简化酶纯化,因为该标签对许多纯化柱中使用的Ni2+树脂具有高亲和力。另外,如果需要酶的最佳活性,多组氨酸标签可在纯化后任选地切割。编码C-末端多组氨酸标签的表达载体的一个非限制性实例是pET21b载体,其可从Novagen获得。编码多组氨酸标签的表达载体的另一个非限制性实例是pE-SUMO载体,其编码在SUMO蛋白的N-末端的多组氨酸标签。
在本实施例中,包含如下核苷酸序列:
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ IDNO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ IDNO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQ ID NO:130,SEQ IDNO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,或SEQ ID NO:152,
分别编码包含如下氨基酸序列的工程化芳基硫酸酯依赖性酶:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ IDNO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ ID NO:149,或SEQ ID NO:151的双链DNA片段使用Integrated DNA Technologies(IDT)的Gene Fragments合成服务来合成。启动聚合酶链反应(PCR)以生成每个双链DNA片段的拷贝,其使用包含适当限制酶识别序列的正向和反向引物以促进插入表达载体。包含如下核苷酸序列:
SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:124,SEQ ID NO:126,SEQ ID NO:128,SEQID NO:130,SEQ ID NO:132,SEQ ID NO:134,SEQ ID NO:136,SEQ ID NO:138,SEQ ID NO:140,SEQ ID NO:142,SEQ ID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQ ID NO:150,或SEQ ID NO:152,
分别编码包含如下氨基酸序列的工程化酶:
SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ IDNO:13,SEQ ID NO:15,SEQ ID NO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ IDNO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ ID NO:149,或SEQ ID NO:151
的基因含有NdeI和BamHI限制酶识别序列,并且通过NEB提供的快速连接试剂盒连接到pMAL-c5x表达载体中。表达载体然后转化到感受态DH5-α大肠杆菌细胞中。单克隆在含有100μL/mL氨苄青霉素的LB培养基中孵育。转化宿主细胞内的每个基因和表达载体的核苷酸序列通过商业DNA测序(GeneWiz)确认。
包含如下氨基酸序列的工程化酶的蛋白质表达:SEQ ID NO:1,SEQ ID NO:3,SEQID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ IDNO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ IDNO:145,SEQ ID NO:147,SEQ ID NO:149,或SEQ ID NO:151
通过如下实现:将确认的DNA构建体转化到感受态T7Express lysY大肠杆菌细胞中,尽管通过将确认的DNA构建体转化到感受态BL21(DE3)大肠杆菌细胞中也实现蛋白质表达。从任一构建体中,所得菌落用于接种LB培养基中的250mL培养物,使其在32℃下摇晃和孵育,直到观察到600nM(OD 600)处的光密度为约0.4至0.6。通过在18℃下向每个培养物中添加100μM IPTG来诱导表达。
在18℃下孵育过夜后,通过如下采集表达细胞:以3620g离心并且将丸粒重悬于10mL重悬缓冲液(25mM Tris-HCl,pH 7.5;0.15M NaCl;0.2mg/mL溶菌酶;10μg/ml DNaseI;5mM MgCl2;和0.1%(重量/体积)Triton-X 100)中。重悬的细胞在冰上超声处理3个脉冲、每次10秒后裂解,随后通过0.45-μm注射器过滤器。将所得上清液加载到包含悬浮在结合缓冲液中的Dextrin树脂(GE Biosciences)的5-mL离心柱(G-biosciences)中,所述结合缓冲液包含25mM Tris-HCl、pH 7.5和0.15M NaCl。在加入包含25mM Tris-HCl,pH 7.5;0.15M NaCl;和40mM麦芽糖的洗脱缓冲液后,感兴趣的酶从柱上洗脱下来。
另一方面,包含如下核苷酸序列:
SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQ ID NO:34,SEQID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,或SEQ ID NO:109,
分别编码包含如下氨基酸序列的工程化酶:
SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86,SEQID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,或SEQ ID NO:108
的基因含有BsaI和XbaI限制酶识别序列,并且连接至pE-SUMO载体(LifeSensors,Inc.)。然后表达载体转化到感受态BL21-DE3大肠杆菌细胞中。单克隆在含有100μL/mL氨苄青霉素的Terrific Broth中孵育。转化宿主细胞内的每个基因和表达载体的核苷酸序列通过商业DNA测序(GeneWiz)来确认。
包含如下氨基序列的工程化酶的蛋白质表达:SEQ ID NO:27,SEQ ID NO:29,SEQID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQID NO:82,SEQ ID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,或SEQ ID NO:108
通过如下来实现:在Terrific Broth中用氨苄青霉素接种500mL培养物,并且将培养物在35℃下振荡孵育,直至达到OD 600为大约0.6-0.8。通过在18℃下添加0.2mM IPTG来诱导蛋白质表达。然后将培养物在18℃下孵育过夜,然后使用与上述相同的程序进行裂解和过滤。随后在包含悬浮在结合缓冲液中的HisPur Ni-NTA树脂(Thermofisher)的5-mL离心柱(G biosciences)中纯化工程酶,所述结合缓冲液包含25mM Tris-HCl、pH 7.5、0.15MNaCl、5mM MgCl2和30mM咪唑。在添加包含25mM Tris-HCl、pH 7.5、0.15M NaCl、5mM MgCl2、和300mM咪唑的洗脱缓冲液后,感兴趣的酶从柱上洗脱。
实施例2:确认芳基硫酸酯依赖性硫酸酯酶活性
一般来说,芳基硫酸酯依赖性酶的硫酸酯酶活性可容易地确定,因为许多芳基硫酸酯化合物的脱硫酰化芳族产物,包括但不限于PNS、MUS、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1萘基硫酸酯、2NapS和NCS各自具有吸收近紫外或可见光谱中的光或荧光的能力。脱硫酰化芳族产物的吸光度或荧光可分别用分光光度计或荧光计检测。本领域技术人员将能够根据特定芳基硫酸酯化合物及其脱硫酰化芳族产物的光谱性质,来容易地确定使用哪种仪器来监测反应进程。
在一个非限制性实例中,利用PNS作为底物的反应在硫酸酯键水解时产生作为产物的对硝基苯酚。pH值大于对硝基苯酚的pKa(约7.15)的反应混合物变黄,因为带负电荷的对硝基苯酚离子比带中性电荷的对硝基苯酚更为普遍。通常,可在约405nm的波长处观察到含有对硝基苯酚离子的溶液对可见光的最大吸光度。因此,反应条件下的吸光度值大于在相同缓冲液条件下仅含有PNS的阴性对照,表明酶是有活性的。类似地,由于特定芳基硫酸盐依赖性酶的催化作用产生更多的对硝基苯酚离子,因此可在约405nm处测量反应混合物的吸光度随时间的变化,以确定反应速率和其他动力学信息。作为另一个非限制性实例,通过观察波长为约515nm的可见光的吸光度,可在pH大于4-硝基儿茶酚的pKa(约7.17)的反应中测量NCS脱硫酰化产物4-硝基儿茶酚在硫酸酯键水解时的产生。
作为另一个限制性实例,2NapS的脱硫酰化产物可响应于被较低波长的辐射激发而在溶液中发出荧光。根据溶液的pH值,脱硫酰化产物是2-萘酚或2-萘酚离子(pKa=9.5)。为了确保溶液中存在单一的2-萘基物质,通常用酸或碱淬灭反应完成的组合物,以便驱动平衡以完全形成2-萘酚,其最大发射为约355nM,或2-萘酚离子,其最大发射为约410nm。在任一情况下,脱硫酰化产物可在约320nm的波长处激发。
因此,根据本公开的实施方案进行研究以确定包含如下氨基酸序列的纯化酶的硫酸酯酶活性:
SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ IDNO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ IDNO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ IDNO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQ ID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ ID NO:149,或SEQ ID NO:151。
在含有50μM酶和5mM底物的洗脱缓冲液中的100μL反应中监测PNS、NCS和2NapS的非稳态硫酸酯酶活性。在含有PNS的反应中,在401nm处测量对硝基苯酚产生的反应混合物的吸光度。在含有NCS的反应中,在515nm处测量4-硝基儿茶酚产生的反应混合物的吸光度。含有2NapS的反应混合物通过添加0.1M NaOH以将反应产生的所有2-萘酚转化为2-萘酚离子而进行淬灭。所有活性实验组都使用Spectramax M2酶标仪(Molecular Dynamics)进行。另外,为每个实验设置阴性对照反应条件,其中在洗脱缓冲液中含有芳基硫酸酯化合物(见上文),但不存在酶。工程化酶的活性实验在几个数据集中进行。将所有原始数据标准化并且评估为相对于添加除酶之外的所有其他成分的对照的信号增加百分比,结果在下表2-10中报告。特别地,为天然氨基葡萄糖N-磺基转移酶突变体的酶的结果在表2、表3和表4中报告,为天然己糖醛酸2-O磺基转移酶突变体的酶的结果在表5和表6中报告,为天然氨基葡萄糖6-O磺基转移酶突变体的酶的结果在表7和表8中报告,并且为天然氨基葡萄糖3-O磺基转移酶突变体的酶的结果在表9和表10中报告。表2
表3
表4
表5
表6
表7
表8
表9
表10
如在上表中可观察到的,一些酶对PNS有活性,一些对NCS有活性,许多对PNS和NCS都有活性。通常,含有对任一芳基硫酸酯化合物具有活性的酶的反应混合物表现出比阴性对照高约1.1至2.5倍的吸光度。
实施例3:工程化芳基硫酸酯依赖性氨基葡萄糖N-磺基转移酶的N-硫酸化多糖产物的质谱表征
根据本公开的实施方案进行研究,以确认包含SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13或SEQ ID NO:15氨基酸序列的酶的氨基葡萄糖N-磺基转移酶活性,这是通过使用质谱法(MS)检测由于它们的磺基转移反应而形成的N-硫酸化多糖产物的存在来进行的。根据实施例1的程序纯化每种工程化酶。磺基转移酶活性在含有50μM酶的100μL反应物中监测。对于每个纯化的蛋白质溶液,将20mg芳基硫酸酯化合物(PNS或NCS)溶解在2mL反应缓冲液(50mM MES pH 7.0,2mM CaCl2)中,添加到蛋白质溶液中,并且在37℃下孵育10分钟。将2.5mL的2mg/mL的N-脱乙酰肝素前体溶液添加到蛋白质/供体溶液中,并且在37℃下孵育过夜。N-脱乙酰肝素前体根据Balagurunathan,K.等人(eds.)(2015),Glycosaminoglycans:Chemistry and Biology,Methods in Molecular Biology,1229卷,DOI 10.1007/978-1-4939-1714-3_2,Springer Science+Business Media,New York,第11-19页(3.1章节)中描述的方案来合成。为纯化N-硫酸化产物,第二天将孵育的反应混合物以5000x g离心10分钟。过滤器用2mL水洗涤一次并且再次离心。将滤液添加至1K MWCO透析膜,在Milli-Q水中透析2天,在1小时、2小时、8小时、16小时、32小时换水,然后冻干。
随后用三种碳-氧裂解酶的混合物消化来自每个反应的冻干N-硫酸化产物,所述碳-氧裂解酶包含SEQ ID NO:161、SEQ ID NO:162和SEQ ID NO:163的氨基酸序列,其催化基于肝素前体的多糖的β-消除裂解。这种裂解酶可从New England Biolabs以及其他化学和生物商业实体获得。将1μL的每种裂解酶与50μg的冻干硫酸化多糖产物和提供的消化缓冲液一起孵育,并且根据由New England Biolabs提供的包装说明用每种裂解酶孵育超过24小时。消化后,裂解酶通过加热至100℃持续5分钟而失活。将样品以14000rpm离心30分钟,然后进行强阴离子交换、高效液相色谱(SAX)分析。SAX分析在Dionex Ultimate 3000LC系统界面上进行。在45℃下在5.0μm粒径的4.6×250mm Waters Spherisorb分析柱上进行分离。流动相溶液A是2.5mM磷酸钠,pH为3.5,同时流动相溶液B是2.5mM磷酸钠,pH为3.5和1.2M高氯酸钠。每个样品加载到柱上后,流动相溶液以98%流动相溶液A和2%流动相溶液B的比率在1.4毫升/分钟的流速下加载到柱上持续5分钟。五分钟后,应用线性梯度增加流动相溶液B,直到流动相溶液A与流动相溶液B的比率是50∶50。
使用SAX分析,确定八种测试酶中的六种具有磺基转移酶活性。然而,每种磺基转移酶未必对PNS和NCS都有活性。具有SEQ ID NO:5、SEQ ID NO:7和SEQ ID NO:13氨基酸序列的酶仅对NCS具有活性,具有SEQ ID NO:15氨基酸序列的酶仅对PNS具有活性。具有SEQID NO:9和SEQ ID NO:11氨基酸序列的酶对两种芳基硫酸酯化合物都具有活性。
来自SAX分析的代表性色谱图说明由反应产生的N-硫酸化产物的存在,如图29所示。N-脱乙酰肝素前体原料和由SEQ ID NO:13产生的N-硫酸化产物都用具有SEQ ID NO:161、SEQ ID NO:162和SEQ ID NO:163的氨基酸序列的裂解酶根据上述消化过程来消化。还使用SAX分析可从Iduron,Ltd商购得到的两种二糖标准品(HD005和HD013)。HD013二糖包含未经取代的氨基葡萄糖残基和还原的己糖醛酸。HD005二糖与HD013相同,不同之处在于氨基葡萄糖残基进行N-硫酸化。所有重叠的色谱图都进行归一化,因此每个色谱图中最突出的峰指定为归一化的相对荧光值1.0。
如图29中所示,HD013二糖最突出的峰(用*符号表示)几乎立即洗脱出,然而HD005二糖的最突出峰(用**符号表示)在大约17分钟后洗脱出。这是在SAX条件下预期的,因为带正电的物质(如HD013)通常不会与色谱柱结合,而带负电荷的物质(如HD005)会与色谱柱结合。N-脱乙酰肝素前体,同样是非硫酸化的,最显著的洗脱与HD013几乎相同的时间。类似地,反应过程中产生的冻干样品在与HD005几乎相同的时间显示出峰,表明该样品含有N-硫酸化产物。每个色谱图中的其他峰、特别是合成的原料和产物中的其他峰,表明基于使用离心过滤柱作为在每种情况下纯化多糖的唯一基础,缺乏样品纯度。本领域技术人员会理解,如果需要更高纯度的产物,还可使用其他几种分离技术。另外,当通过流动相将在色谱柱上引入增加的盐量时,色谱图中荧光信号的基线向上漂移是已知现象。
实施例4:工程化芳基硫酸酯依赖性己糖醛酸2-O磺基转移酶的2-O硫酸化多糖产物的质谱表征
根据本公开的实施方案进行研究来确认包含如下氨基酸序列的酶的己糖醛酸2-O磺基转移酶活性:
SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQID NO:61,SEQ ID NO:63,或SEQ ID NO:65,
这是通过使用与实施例3中类似的程序,不同之处在于磺基受体多糖是商业硫酸乙酰肝素,其中2-O硫酸酯基已被选择性地用化学方法(产品DSH001/2,可从GalenLaboratory Supplies获得)去除,并且使用质谱法结合基于SAX的高效液相色谱法(LCMS)对每个含有硫酸化产物的消化样品进行分析,以检测由于磺基转移反应形成的2-O硫酸化多糖产物的存在来进行的。
通过使用具有SEQ ID NO:161、SEQ ID NO:162和SEQ ID NO:163氨基酸序列的碳-氧裂解酶并且根据实施例3中的上述程序消化2-O硫酸化产物而获得的二糖在ShimadzuLCMS-8050三重四极杆液相色谱质谱仪上定量。将100ng的每个消化样品用10mM碳酸氢铵(pH为10)稀释。在Thermo Hypercarb HPLC柱(100x2.1mm,5μm)上分离二糖。流动相由10mM碳酸氢铵(pH 10)组成,二糖用0%至20%的乙腈梯度洗脱2.5分钟,在接下来的2.5分钟内保持在20%,在0%平衡2分钟,然后进行下次注射;流速为0.2毫升/分钟,总运行时间为7.1分钟。
来自LCMS的提取离子色谱图显示在图30A和图3B中,对应于从与分别具有SEQ IDNO:63或SEQ ID NO:65氨基酸序列的工程化酶反应获得的2-O硫酸化产物。将峰与一系列八种二糖标准品的色谱图以及100ng商业UF-HS多糖(CAS号:9041-08-1,可从MilliporeSigma获得)的色谱图进行比较,该多糖也使用裂解酶混合物消化。八种参考二糖标准品(D0A0、D0S0、D0A6、D2A0、D0S6、D2S0、D2A6、D2S6)代表在N-、2-O和6-O位置被不同地硫酸化的二糖。特别地,二糖D2S0代表在2-O位置具有硫酸化的己糖醛酸残基和N-硫酸化氨基葡萄糖残基的二糖。来自所有二糖标准品(未示出)、消化的商业硫酸化多糖(未示出)和具有SEQID NO:63或SEQ ID NO:65氨基酸序列的工程化酶的硫酸化多糖产物的光谱的保留时间和峰面积收集在下表11中。由于每个单独二糖的电离是不同的,因此EIC色谱图中的当前百分比可能不代表它们的实际丰度。然而,不同样品的每种二糖的电离效率是相同的。因此,认为仍然可实现比较不同样品中相同糖的峰面积百分比。
表11
工程化酶的磺基转移酶活性通过磺基受体多糖内己糖醛酸残基的2-O位置处的再硫酸化来证实,所述磺基受体多糖在反应之前已经脱硫酸化。从工程化酶和NCS的反应中分离的产物中存在D2S0二糖说明了这一点。不受特定理论的限制,还认为工程化酶的活性取决于与多糖的一部分反应,其中己糖醛酸残基与N-硫酸化、但不是6-O硫酸化的氨基葡萄糖残基相邻。这通过在分离的硫酸化多糖产物中检测到D2S6(2-O硫酸化己糖醛酸残基和N,6-硫酸化氨基葡萄糖残基)和D2A6(2-O硫酸化己糖醛酸残基和6-O硫酸化N-乙酰氨基葡萄糖残基)二糖来说明。这是与EC 2.8.2.-内的野生型己糖醛酸2-O磺基转移酶类似的反应性,认为其与包含式IV或式V结构的N-硫酸化肝素前体反应。
实施例5:工程化芳基硫酸酯依赖性氨基葡萄糖6-O磺基转移酶的6-O硫酸化多糖产物的质谱表征
根据本公开的实施方案进行研究来确认包含如下氨基酸序列的酶的氨基葡萄糖6-O磺基转移酶活性:
SEQ ID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQID NO:80,SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,或SEQ ID NO:108,
这是通过使用与实施例4中类似的LCMS程序,不同之处在于磺基受体多糖通过根据Kariya,Y.等人,(2000)J.Biol.Chem.275(34):25949-25958)中提供的程序进行化学6-O脱硫酸化商购可得的UF-HS(CAS号:9041-08-1,可从Millipore Sigma获得),以检测由于其磺基转移反应形成的6-O硫酸化多糖产物的存在来进行的。
对应于从与具有SEQ ID NO:104、SEQ ID NO:106或SEQ ID NO:108氨基酸序列的工程化酶反应获得的6-O硫酸化产物的提取离子色谱图分别显示于图31A、图31B和图31C中。当NCS是磺基供体时,具有SEQ ID NO:104和SEQ ID NO:106序列的酶是有活性的,而当PNS是磺基供体时具有SEQ ID NO:108序列的酶是有活性的。指定的峰基于八种参考二糖标准品的确定保留时间。八种参考二糖标准品(D0A0、D0S0、D0A6、D2A0、D0S6、D2S0、D2A6和D2S6)代表在N-、2-O和6-O位置被不同地硫酸化的二糖。DOA6、D0S6、D2A6和D2S6包含6-O硫酸化氨基葡萄糖残基。S6表示N,6-硫酸化氨基葡萄糖残基,而A6表示6-O硫酸化N-乙酰氨基葡萄糖残基。每个色谱图指示两个可积分峰D0S6和D2S6,其与N,6-硫酸化氨基葡萄糖残基的合成相关,与分别在2-O位置未硫酸化或硫酸化的己糖醛酸残基相邻。所有标记的二糖的峰面积%在下表12中。由于每种单独二糖的电离不同,特别是D0A0和D2S6,因此EIC色谱图中的当前百分比可能不代表它们的实际丰度。然而,不同样品的每种二糖的电离效率是相同的。因此,认为仍然可实现比较不同样品中相同糖的峰面积百分比。
表12
工程化酶的磺基转移酶活性通过氨基葡萄糖残基在6-O位置处的再硫酸化得到证实,所述氨基葡萄糖残基已通过根据上述Kariya,Y.等人的方法脱硫酸化。由与每种酶的反应分离的产物中存在D0S6和D2S6二糖说明这一点。在每种工程化酶中,基于比较D0S6和D2S6二糖的峰面积百分比,表现出具有SEQ ID NO:108氨基酸序列的氨基葡萄糖6-O磺基转移酶活性最高。然而,虽然在工程化酶产生的任何6-O硫酸化产物中都未观察到D0A6和D2A6多糖,不受任何特定理论的限制,认为这些酶仍然能够在不同反应条件下将磺基转移至N-乙酰氨基葡萄糖残基,特别是通过增加酶和/或多糖的浓度,其中基于天然EC 2.8.2.-内野生型氨基葡萄糖6-O磺基转移酶的反应性,在反应前确认存在N-乙酰氨基葡萄糖残基。
实施例6:工程化芳基硫酸酯依赖性氨基葡萄糖3-O磺基转移酶的3-O硫酸化多糖产物的质谱表征
根据本公开的实施方案进行研究来确认包含如下氨基酸序列的酶的氨基葡萄糖3-O磺基转移酶活性:
SEQ ID NO:123,SEQ ID NO:125,SEQ ID NO:127,SEQ ID NO:129,SEQ ID NO:131,SEQ ID NO:133,SEQ ID NO:135,SEQ ID NO:137,SEQ ID NO:139,SEQ ID NO:141,SEQID NO:143,SEQ ID NO:145,SEQ ID NO:147,SEQ ID NO:149,或SEQ ID NO:151,
这是通过使用与实施例4中类似的LCMS程序,不同之处在于磺基受体多糖为商购可得的UF-HS(CAS号:9041-08-1,可从Millipore Sigma获得)的反应,以检测由于其磺基转移反应形成的3-O硫酸化多糖产物的存在来进行的。
尽管未修饰的UF-HS含有约3.5%(=重量/重量)的3-O硫酸化氨基葡萄糖残基,但约60%的氨基葡萄糖残基是N,6-硫酸化的并且与2-O硫酸化己糖醛酸残基相邻,如在式X中。因此,这些N,6-硫酸化氨基葡萄糖残基仍可被3-O硫酸化。
提取离子色谱图以及一系列十个参考标准和也使用裂解酶混合物消化的100ng商业多糖的色谱图显示在图32A和图32B中。十个参考标准品(D0A0、D0S0、D0A6、D2A0、D0S6、D2S0、D2A6、D2S6、D0A6G0S3和D0A6G0S9)代表在N-、2-O、3-O和6-O位置被不同地硫酸化的二糖或四糖(图32A,顶部)。为清楚起见,消化的商业多糖光谱中示出包括3-O硫酸化氨基葡萄糖残基(D0A6G0S3)和(D0A6G0S9)的参考峰(图32A,中心)。代表从与包含氨基酸序列SEQ IDNO:147(PNS,图32B,中心)、SEQ ID NO:149(PNS,图32B,底部)(NCS,图32A,底部)和SEQ IDNO:151(NCS,图32A,顶部)的酶反应得到的消化的硫酸化多糖产物的四个质谱显示在消化的商业多糖光谱下方。所有标记的二糖和四糖的峰面积%在下表13中。由于每种单独二糖的电离不同,特别是D0A0和D2S6,因此EIC色谱图中的当前百分比可能不代表它们的实际丰度。然而,不同样品中每种二糖或四糖的电离效率相同。因此,认为仍然可实现比较不同样品中相同糖的峰面积百分比。
表13
每种工程化酶的磺基转移酶活性通过D0A6G0S3(己糖醛酸-6-O-硫酸化N-乙酰氨基葡萄糖-葡萄糖醛酸-N,3,6-硫酸化氨基葡萄糖)和D0A6G0S9(己糖醛酸-6-O-硫酸化N-乙酰氨基葡萄糖-葡萄糖醛酸-N,3-硫酸化氨基葡萄糖)四糖相对于商业UF-HS样品的丰度增加得以证实。然而,SEQ ID NO:149PNS样品中二糖的总丰度远低于其他样品。随后的试验包括以10倍以上的进样体积再度运行实验,并且用裂解酶混合物再次消化样品。尽管如此,只能发现D2S6二糖,这表明最初分离的SEQ ID NO:149PNS硫酸化多糖样品的丰度极低,和/或多糖抵抗裂解酶消化,导致产品在长于1小时的保留时间内从柱中潜在地洗脱出。
尽管如此,NMR研究(在下面的实施例7中指出)表明当PNS是芳基硫酸酯化合物时,包含氨基酸序列SEQ ID NO:149的酶的3-O磺基转移酶活性。此外,当NCS是芳基硫酸酯化合物时,确定具有SEQ ID NO:149氨基酸序列的作为磺基转移酶的酶具有活性。因此,认为在LCMS实验期间对SEQ ID NO:149PNS硫酸化多糖样品的观察结果来自为实验目的而产生的样品,而不是酶本身的活性。在其他方面,相对于商业UF-HS标准,在来自SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151的所有其他硫酸化多糖产物中发现更高丰度的3-O硫酸化。
实施例7:使用核磁共振确认工程化氨基葡萄糖3-O磺基转移酶的磺基转移酶活性
根据本公开的实施方案进行研究以确认具有SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151的氨基酸序列的工程化酶的3-O磺基转移酶活性,特别是具有氨基酸序列SEQ ID NO:149的酶对作为磺基供体的PNS的活性。根据实施例1的程序纯化每种酶。向每种纯化的蛋白质溶液中,将溶解在2mL反应缓冲液(50mM MES pH 7.0,2mM CaCl2)中的20mg芳基硫酸酯化合物(PNS或NCS)添加至蛋白质溶液中,并且在37℃下孵育10分钟。将实施例6中使用的2.5mL的2mg/mL商业UF-HS多糖溶液添加至蛋白质/供体溶液中,并且在37℃下孵育过夜。
每个反应以5000x g离心10分钟,施加至预先润湿的30K MWCO Amicon-15过滤器并且以5000x g离心10分钟。过滤器用2mL水洗涤一次,并且再次离心。将滤液添加至1KMWCO透析膜,在Milli-Q水中透析2天,在1小时、2小时、8小时、16小时、32小时换水,然后冻干。将干燥的白色粉末重悬于400μL D2O中,冻干以去除可交换质子,然后重悬于600μL D2O中并且转移至NMR管(Wilmad,0.38mm x 7”)。为了确定是否发生磺基转移,在Bruker600MHz NMR、32次扫描利用水抑制获得1H NMR光谱。总体反应方案如图33所示。在图33内,任何氨基葡萄糖残基的3-O位置可通过氨基葡萄糖3-O磺基转移酶硫酸化。硫酸化3-O位置在中心多糖中圈出。能够在氘交换时表现出共振的可交换质子在底部多糖中以粗体显示。将粗混合物峰整合到磺基受体多糖和相关的3-O硫酸化产物的文献参考光谱中。
如图34中的叠加光谱所示,与商业UF-HS中存在的2-O硫酸化艾杜糖醛酸的C2碳上的质子相关的5.15ppm处的尖峰在与包含SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151氨基酸序列的酶反应后消失。感兴趣的质子在光谱上方显示的多糖中圈出。由包含SEQ IDNO:147、SEQ ID NO:149或SEQ ID NO:151氨基酸序列的酶与PNS和/或NCS反应合成的3-O硫酸化产物的1H NMR光谱都已进行说明。在每个产物光谱中,IdoA2S峰移动到大约5.0ppm至5.05ppm之间。当用相同的多糖底物和3′-磷酸腺苷5′-磷酸硫酸酯孵育天然人N-磺基转移酶时,显示出类似的转变(数据未显示)。
如图35中所示,4.5和3.5之间的区域显示几个峰,这些峰响应于硫酸酯基添加至氨基葡萄糖残基的3-O位置而发生类似漂移,所有这些都与用相同的商业UF-HS底物和3′-磷酸腺苷5′-磷酸硫酸酯孵育野生型人氨基葡萄糖3-O磺基转移酶时观察到的相同漂移相关。漂移的峰用曲线箭头表示,并且用直箭头显示来自具有SEQ ID NO:147、SEQ ID NO:149或SEQ ID NO:151氨基酸序列的酶产生的3-O硫酸化多糖的峰位置。GlcNS3S6S的H3发生最大漂移,从3.7ppm到4.2ppm。这是因为最接近新添加的3-O硫酸酯基导致的。另外,Ido2S的H3质子和GlcNS3S6S的H5都向4.07ppm处的峰收敛,其显示两个重叠峰。GlcNS3S6S的H4在前场从3.7ppm区域适度漂移到3.8ppm区域,并且根据参考文献,许多峰例如来自GlcNs6s的H3和H4以及来自GlcA的H3、H4和H5,从3.7ppm区域漂移到3.6ppm区域。
实施例8:使用本发明的工程化磺基转移酶化学合成N-硫酸化肝素前体
根据本公开的实施方案进行研究以化学合成用作与本发明的任何工程化芳基硫酸酯依赖性磺基转移酶结合的磺基受体多糖的N-硫酸化肝素前体,特别是工程化己糖醛酸2-O磺基转移酶。N-脱乙酰肝素前体根据上述Balagurunathan,K.等人所述的方案制备。特别地,从DEAE树脂洗脱的肝素前体在醋酸钠饱和的乙醇中在-30℃下沉淀过夜,然后重悬于水中并且在截留分子量(MWCO)为1000Da的纤维素透析膜中透析。
为了使肝素前体得以N-脱乙酰化,将足够的氢氧化钠小球(约4.0g)溶解以在40mL透析肝素前体在水中的等分试样中制备2.5M溶液。将溶液在55℃、100rpm振荡下孵育16小时。然后用乙酸中和样品中的氢氧化钠,直到溶液达到约7.0的pH,然后在1000MWCO透析膜中在水中透析过夜。
N-脱乙酰肝素前体的随后的N-硫酸化通过添加100mg碳酸钠和100mg三氧化硫-三乙胺络合物,并且使组合物在48℃下孵育直至所有固体溶解来完成。然后使用乙酸将溶液的pH重新调整到约9.5。在48℃下以100rpm振荡孵育过夜后,添加另外的100mg碳酸钠和100mg三氧化硫-三乙胺络合物,随后使用乙酸将pH重新调整至约9.5。将溶液在48℃下再孵育24小时。将硫酸化多糖溶液用乙酸中和至pH为约7.0,并且在1000MWCO透析膜内在水中透析过夜。然后在进一步使用之前将透析的N-硫酸化肝素前体冻干。然后通过将N-硫酸化肝素前体加载到Zenix SEC-100柱上并且用0.1M乙酸铵(pH 9.0)等度洗脱来进一步纯化。
纯化的基于肝素前体的多糖的功能化特征在于用包含SEQ ID NO:161、SEQ IDNO:162和SEQ ID NO:163氨基酸序列的三种碳-氧裂解酶的混合物对其进行消化,并且使用SAX、使用与上述类似的程序来分析消化的样品。作为阳性对照,还分析含有N-硫酸化氨基葡萄糖残基的实施例3的商业HD005二糖。两个样品的代表性色谱图如图36所示。在两个色谱图中,在约16.5分钟处出现一个强峰,表明合成样品含有N-硫酸化氨基葡萄糖残基。
实施例9:制备N,20-HS多糖产物
根据本公开的实施方案进行研究以使用工程化己糖醛酸2-O磺基转移酶和在实施例8中合成作为磺基受体的N-硫酸化肝素前体,来合成包含式VI或式VII结构的N,2O-HS多糖产物。在锥形底离心管中,将80mM NCS等分试样溶解在50mM MES pH 7.0、2mM CaCl2中。基于酶样品在280nm处的吸光度,向每种溶液中添加2mg具有SEQ ID NO:63序列的酶(约4mL)。将5mg实施例8中合成的冻干N-硫酸化肝素前体重悬于1mL水中并且添加到含有酶和NCS的反应混合物中。然后将整个反应混合物在34℃下以30rpm振荡孵育48小时。使用相同的程序制备第二组反应物,不同之处在于在孵育前,还将2mg包含SEQ ID NO:67氨基酸序列的C5-己糖醛酸差向异构酶添加到反应混合物中。
来自两组反应的多糖产物通过首先通过将反应容器置于沸水中10分钟并且高速离心以形成丸粒而从反应混合物中沉淀出蛋白质来纯化。从丸粒中倾倒出含有多糖产物的上清液,并且在1000MWCO透析膜内在水中透析过夜。然后将透析的产品冻干以备将来使用。
为了表征多糖产品,将冻干样品重悬于400μL水中,并且使用Q-Sepharose FastFlow Column(GE Biosciences)纯化。使用0到2M NaCl的梯度,在20mM乙酸钠缓冲液(pH为5.0)中从柱上洗脱样品。然后根据上述实施例3中的程序,将纯化的多糖连同包含2-O硫酸化糖醛酸和N-硫酸化氨基葡萄糖的二糖的商业多糖HD002(Iduron)一起通过SAX进行消化和分析。不包含或包含差向异构酶的反应的代表性色谱图分别显示在图37和图38中。在图37中,HD002二糖的色谱图在约21.1分钟处具有一个单一尖峰,其与在几乎相同时间反应产物中的尖峰相关,表明由于反应形成包含式VI结构的N,2O-HS产物。在图38中,HD002二糖在包含其他二糖标准品的混合物中提供,其中对应于HD002的二糖在20.5分钟时洗脱出,与图37中HD002标准品的洗脱时间相对应。差向异构化反应产物在与HD002标准品几乎相同的洗脱时间处具有尖峰,表明由于反应形成包含式VII结构的N,2O-HS产物。
实施例10:制备N,2O,6O-HS产物
根据本公开的实施方案进行研究以使用实施例9的程序合成包含式IX结构的N,2O,6O-HS产物,不同之处在于实施例9的差向异构化N,2O-HS产物用作磺基受体多糖,并且具有SEQ ID NO:104氨基酸序列的工程化氨基葡萄糖6-O磺基转移酶用作酶。
硫酸化多糖产物和商业二糖混合物的代表性色谱图如图39所示。商业混合物的色谱图在约23.7分钟处出现一个峰,与二糖HD001(Iduron)相关,它由2-O硫酸化糖醛酸和N-,6-O硫酸化氨基葡萄糖的二糖组成,同时反应产物表现出在23.4分钟时的一个类似峰,表明由于反应形成N,2O,6O-HS产物。N,2O,6O-HS产物中存在的其他峰包括未消化的多糖(2.5分钟)、未经取代的糖醛酸和N-乙酰化氨基葡萄糖(5.5分钟)以及未经取代的糖醛酸和N-,6-O硫酸化氨基葡萄糖。
实施例11:制备N,2O,3O,6O-HS产物
根据本公开的实施方案进行研究以合成包含式I的结构并且具有N-,6-O,3-O硫酸化氨基葡萄糖和2-O硫酸化己糖醛酸残基的硫酸化多糖产物,其使用了实施例9的程序,不同之处在于使用实施例10的化学合成的N-,2-O,6-O硫酸化多糖作为磺基受体多糖,以及使用具有SEQ ID NO:147、SEQ ID NO:149或SEQ ID NO:151氨基酸序列的工程化3-O磺基转移酶作为磺基转移酶。根据实施例9的程序,使用SAX来消化和分析硫酸化多糖产物。预期在与包含N-,6-O,3-O硫酸化氨基葡萄糖残基的消化的商业四糖进行比较后,将确定由于反应使硫酸化多糖产物3-O硫酸化。
实施例12:确认N,2O,3O,6O-HS产物的抗凝活性
根据本公开内容的实施方案进行研究以确定是否根据实施例6或实施例7的程序使用本文所述任何氨基葡萄糖3-O磺基转移酶而产生N,2O,3O,6O-HS产物,预期其对抗凝血酶具有结合亲和力(参见Meneghetti,G.等人,(2017)Org.Biomol.Chem.15:6792-6799)。对照反应含有已知具有抗凝血酶活性的商业N,2O,3O,6O-HS产物,例如USP参考标准品(CAS号:9041081)。在染料例如SyproOrangeTM染料(Invitrogen)的存在下,将人抗凝血酶(AT)(1mg/mL)与不同底物一起孵育。将染料在水中稀释(1单位Sypro:50单位水(体积/体积)),并且将3.5μL稀释的染料添加至PBS缓冲液中的反应混合物。SyproOrangeTM染料的激发波长为300nm或470nm,当与疏水性残基结合时,其在570nm处发射。每个反应混合物中包含25μgN,2O,3O,6O-HS产物。反应在31℃下孵育2分钟,然后以0.5℃的步长进行从32℃到85℃的逐步温度梯度。在每个温度步骤之间,可采取5秒的孵育期以确保样品平衡。可使用实时PCR系统进行反应。预期与USP参考标准品以及合成的N,2O,3O,6O-HS产物的对照反应的熔解曲线都将比单独使用染料和AT的标准品转移到更高温度,表明AT可与N,2O,3O,6O-HS产物结合,因为N,2O,3O,6O-HS产物包含至少一个含有式I结构的AT识别序列。
实施例13:确定其他EC 2.8.2.8酶的工程化芳基硫酸酯依赖性突变体
根据本公开的实施方案进行研究以使另外的芳基硫酸酯依赖性氨基葡萄糖N-磺基转移酶工程化。如上所述,具有SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13或SEQ ID NO:15氨基酸序列的芳基硫酸酯依赖性氨基葡萄糖N-磺基转移酶已工程化为人氨基葡萄糖N-脱乙酰酶/N-磺基转移酶的N-磺基转移酶结构域的突变体(参见条目sp|P52848|NDST_1_HUMAN,在上图6A、图6B和图6C中),其为酶类EC 2.8.2.8的成员。通过生成和分析多序列比对,包括EC 2.8.2.8内的一种或多于一种其他氨基葡萄糖N-脱乙酰酶/N-磺基转移酶的N-磺基转移酶结构域的氨基酸序列以及以及具有SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和/或SEQ ID NO:15氨基酸序列的芳基硫酸酯依赖性氨基葡萄糖N-磺基转移酶的氨基酸序,可观察到相对于相同比对内野生型EC 2.8.2.8酶的氨基酸序列的工程化氨基葡萄糖N-磺基转移酶中的氨基酸序列突变。在选择不是人氨基葡萄糖N-脱乙酰酶/N-磺基转移酶的野生型2.8.2.8酶的N-磺基转移酶结构域的氨基酸序列后,在SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13,和/或SEQ ID NO:15氨基酸序列内存在的突变可工程化到野生型序列中以便形成可具有芳基硫酸酯依赖性磺基转移酶活性的另外的突变体。
作为一个非限制性实例,编码猪氨基葡萄糖N-脱乙酰酶/N-磺基转移酶的N-磺基转移酶结构域的氨基酸序列(条目tr|M3V841|M3V841_PIG,如上图6A、图6B和图6C中的序列比对所示),与如下氨基酸序列SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和SEQ ID NO:15进行比对。将SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQID NO:11、SEQ ID NO:13和SEQ ID NO:15中存在的氨基酸突变工程化到猪N-脱乙酰酶/N-磺基转移酶的N-磺基转移酶结构域的氨基酸序列内的其等同位置中,以便分别产生突变的氨基酸序列SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:25。分别包含如下氨基酸序列SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQID NO:23、SEQ ID NO:24或SEQ ID NO:25的酶将用于下面的实施例14和实施例15中。然而,本领域技术人员会理解,对于EC 2.8.2.8酶类中的任何其他氨基葡萄糖野生型N-脱乙酰酶/N-磺基转移酶,可应用相同的程序来产生N-磺基转移酶结构域或整个酶的突变体,并且那些为清楚起见而省略。
实施例14:工程化芳基硫酸酯依赖性EC 2.8.2.8突变体的表达和纯化
根据本公开内容的实施方案进行研究以确定编码分别具有氨基酸序列SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:25的工程化氨基葡萄糖N-磺基转移酶的基因是否可转化到宿主细胞中,并且包含那些氨基酸序列中每一个的酶可随后根据上述实施例1的程序进行表达、分离和纯化。基于所需的表达宿主,确定编码分别具有SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24或SEQ ID NO:25的氨基酸序列的酶的密码子优化的核苷酸序列。在合适的表达载体中合成或插入那些基因后,预期分别编码每个氨基酸序列SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25的基因将转化到宿主细胞中,随后含有这些序列的酶将以足够的量和纯度进行表达、分离和纯化,以确定芳基硫酸酯依赖性氨基葡萄糖N-磺基转移酶活性。
实施例15:EC 2.8.2.8突变体的磺基转移酶活性
根据本公开内容的实施方案进行研究以使用实施例3的程序确定分别包含SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:25序列的突变体酶是否为活性磺基转移酶。预期SAX研究将证实,存在由于N-脱乙酰肝素前体和芳基硫酸酯化合物与分别包含SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24或SEQ ID NO:25序列的每种工程化酶反应而形成的N-硫酸化多糖产物。
实施例16:确定EC 2.8.2.-内其他己糖醛酸2-O磺基转移酶的工程化芳基硫酸酯依赖性突变体
根据本公开的实施方案进行研究以使另外的芳基硫酸酯依赖性己糖醛酸2-O磺基转移酶工程化。如上所述,具有SEQ ID NO:63和SEQ ID NO:65氨基酸序列的芳基硫酸酯依赖性己糖醛酸2-O磺基转移酶己工程化为鸡HS己糖醛酸2-O磺基转移酶的突变体(参见条目sp|Q76KB1|HS2ST_CHICK,在上图17A、图17B、图17C和图17D中),其为酶类EC 2.8.2.-的成员。通过生成和分析包括EC 2.8.2.-内其他HS己糖醛酸2-O磺基转移酶中一种或多于一种的氨基酸序列以及具有SEQ ID NO:63和/或SEQ ID NO:65氨基酸序列的芳基硫酸酯依赖性HS己糖醛酸2-O磺基转移酶的氨基酸序列的多序列比对,可观察到相对于相同比对内野生型HS己糖醛酸2-O磺基转移酶的氨基酸序列的工程化HS己糖醛酸2-O磺基转移酶中的氨基酸序列突变。在选择不是鸡HS己糖醛酸2-O磺基转移酶的野生型HS己糖醛酸2-O磺基转移酶的氨基酸序列后,SEQ ID NO:63和/或SEQ ID NO:65氨基酸序列内存在的突变可工程化到野生型序列中以便形成可具有芳基硫酸酯依赖性磺基转移酶活性的另外突变体。
作为一个非限制性实例,编码人HS己糖醛酸2-O磺基转移酶的氨基酸序列(条目sp|Q7LGA3|HS2ST_HUMAN,如上图17A、图17B、图17C和图17D中的序列比对所示)与SEQ ID NO:63和SEQ ID NO 65氨基酸序列进行比对。将SEQ ID NO 63和SEQ ID NO:65中存在的氨基酸突变工程化到人HS己糖醛酸2-O磺基转移酶的氨基酸序列内的其等同位置中,以便分别产生突变的氨基酸序列SEQ ID NO:68或SEQ ID NO:69。分别包含SEQ ID NO:68或SEQ ID NO:69氨基酸序列的酶将用于下面的实施例17和实施例18中。然而,本领域技术人员会理解,对于EC 2.8.2.-酶类内任何其他HS己糖醛酸2-O磺基转移酶,可应用相同程序以生成芳基硫酸酯依赖性突变体,并且那些为了清楚起见而省略。
实施例17:表达和纯化具有己糖醛酸2-O磺基转移酶活性的EC 2.8.2.-突变体
根据本公开内容的实施方案进行研究以确定编码分别具有氨基酸序列SEQ IDNO:68或SEQ ID NO:69的工程化己糖醛酸2-O磺基转移酶的基因是否可转化到宿主细胞中,并且包含那些氨基酸序列中每一个的酶可随后根据上述实施例1的程序进行表达、分离和纯化。基于所需的表达宿主,确定编码分别具有SEQ ID NO:68或SEQ ID NO:69氨基酸序列的酶的密码子优化的核苷酸序列。在合适的表达载体中合成或插入那些基因后,预期分别编码每个氨基酸序列SEQ ID NO:68和SEQ ID NO:69的基因将转化到宿主细胞中,随后含有那些序列的酶将以足够的量和纯度进行表达、分离和纯化,以确定芳基硫酸酯依赖性己糖醛酸2-O磺基转移酶活性。
实施例18:EC 2.8.2.-突变体的己糖醛酸2-O磺基转移酶活性
根据本公开内容的实施方案进行研究以使用实施例4的程序确定分别包含SEQ IDNO:68或SEQ ID NO:69序列的突变体酶是否为活性磺基转移酶。预期MS研究将证实存在由于基于N-硫酸化肝素前体的多糖和芳基硫酸酯化合物与分别包含SEQ ID NO:68和SEQ IDNO:69序列的每种工程酶反应所形成的N,2O-HS产物。还预期两种酶将对包含式IV或式V中任一或两者的基于肝素前体的多糖具有活性。
实施例19:确定EC 2.8.2.-内其他氨基葡萄糖6-O磺基转移酶的工程化芳基硫酸酯依赖性突变体
根据本公开的实施方案进行研究以使另外的芳基硫酸酯依赖性氨基葡萄糖6-O磺基转移酶工程化。如上所述,具有SEQ ID NO:104、SEQ ID NO:106或SEQ ID NO:108氨基酸序列的芳基硫酸酯依赖性氨基葡萄糖6-O磺基转移酶已工程化为小鼠HS氨基葡萄糖6-O磺基转移酶的同工型1的突变体(参见条目Q9QYK5|H6ST1_MOUSE,在上图21A、图21B和图21C中),其为酶类EC 2.8.2.-的成员。通过生成和分析包括EC 2.8.2.-内其他HS氨基葡萄糖6-O磺基转移酶中一种或多于一种的氨基酸序列以及具有SEQ ID NO:104、SEQ ID NO:106,和/或SEQ ID NO:108氨基酸序列的芳基硫酸酯依赖性HS氨基葡萄糖6-O磺基转移酶的氨基酸序列的多序列比对,可观察到相对于相同比对内野生型HS氨基葡萄糖6-O磺基转移酶的氨基酸序列的工程化HS氨基葡萄糖6-O磺基转移酶中的氨基酸序列突变。在选择不是小鼠HS氨基葡萄糖6-O磺基转移酶的野生型HS氨基葡萄糖6-O磺基转移酶的氨基酸序列后,SEQID NO:104、SEQ ID NO:106和/或SEQ ID NO:108氨基酸序列内存在的突变可工程化到野生型序列中以便形成可具有芳基硫酸酯依赖性磺基转移酶活性的另外突变体。
作为一个非限制性实例,编码猪HS氨基葡萄糖6-O磺基转移酶(条目I3LAM6|I3LAM6_PIG,如上图21A、图21B和图21C中的序列比对所示)的氨基酸序列与SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108氨基酸序列进行比对。SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108中存在的氨基酸突变工程化到猪HS氨基葡萄糖6-O磺基转移酶的氨基酸序列内的其等同位置中,以便产生突变的氨基酸序列。产生的对应于猪HS氨基葡萄糖6-O磺基转移酶的残基67-377的突变氨基酸序列,如上图21A、图21B和图21C中所示,分别公开为SEQ ID NO:114、SEQ ID NO:115和SEQ ID NO:116。产生的对应于猪HS氨基葡萄糖6-O磺基转移酶的全长氨基酸序列的突变氨基酸序列(未显示于上图21A、图21B和图21C中),分别公开为SEQ ID NO:117、SEQ ID NO:118和SEQ ID NO:119。
在另一个非限制实例中,编码小鼠HS氨基葡萄糖6-O磺基转移酶的同工型3的全长氨基酸序列(条目Q9QYK4|H6HS3_MOUSE,示于上图21A、图21B和图21C的序列比对中的截短序列)与SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108氨基酸序列比对。SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108中存在的氨基酸突变工程化到小鼠HS氨基葡萄糖6-O磺基转移酶的同工型3的氨基酸序列内的其等同位置中,以便产生突变的氨基酸序列。生成的全长氨基酸序列分别公开为SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122。分别包含SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ IDNO:119、SEQ ID NO:120、SEQ ID NO:121或SEQ ID NO:122氨基酸序列的酶将用于下面的实施例20和实施例21中。然而,本领域技术人员会理解,对于EC 2.8.2.-酶类内任何其他HS氨基葡萄糖6-O磺基转移酶,可应用相同程序以生成芳基硫酸酯依赖性突变体,并且那些为了清楚起见而省略。
实施例20:表达和纯化具有氨基葡萄糖6-O磺基转移酶活性的EC 2.8.2.-突变体
根据本公开内容的实施方案进行研究以确定编码分别具有氨基酸序列SEQ IDNO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121或SEQ ID NO:122的工程化氨基葡萄糖6-O磺基转移酶的基因是否可转化到宿主细胞中,并且包含那些氨基酸序列中每一个的酶可随后根据上述实施例1的程序进行表达、分离和纯化。基于所需的表达宿主,确定编码分别具有氨基酸序列SEQID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121或SEQ ID NO:122的酶的密码子优化的核苷酸序列。在合适的表达载体中合成或插入那些基因后,预期分别编码氨基酸序列SEQ ID NO:114、SEQID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122中的每一个的基因将转化到宿主细胞中,随后含有那些序列的酶将以足够的量和纯度进行表达、分离和纯化,以确定芳基硫酸酯依赖性氨基葡萄糖6-O磺基转移酶活性。
实施例21:EC 2.8.2.-突变体的氨基葡萄糖6-O磺基转移酶活性
根据本公开内容的实施方案进行研究以使用实施例5的程序确定分别包含SEQ IDNO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121或SEQ ID NO:122序列的突变体酶是否为活性磺基转移酶。预期MS研究将证实,存在由于N,2O-HS多糖和芳基硫酸酯化合物与分别包含SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQID NO:120、SEQ ID NO:121和SEQ ID NO:122序列的每种工程酶反应而形成的N,2O,6O-HS产物。
实施例22:确定EC 2.8.2.23内其他氨基葡萄糖3-O磺基转移酶的工程化芳基硫酸酯依赖性突变体
根据本公开的实施方案进行研究以使另外的芳基硫酸酯依赖性氨基葡萄糖3-O磺基转移酶工程化。如上所述,具有氨基酸序列SEQ ID NO:147、SEQ ID NO:149或SEQ ID NO:151的芳基硫酸酯依赖性氨基葡萄糖3-O磺基转移酶已工程化为人HS氨基葡萄糖3-O磺基转移酶的同工型1的突变体(参见条目sp|O14792|HS3S1_HUMAN,在上图26A、图26B和图26C中),其为酶类EC 2.8.2.23的成员。通过生成和分析包括EC 2.8.2.23内其他HS氨基葡萄糖3-O磺基转移酶中一种或多于一种的氨基酸序列,以及具有氨基酸序列SEQ ID NO:147,SEQID NO:149和/或SEQ ID NO:151的芳基硫酸酯依赖性HS氨基葡萄糖3-O磺基转移酶的氨基酸序列的多序列比对,可观察到相对于相同比对内野生型HS氨基葡萄糖3-O磺基转移酶的氨基酸序列的工程化HS氨基葡萄糖3-O磺基转移酶中的氨基酸序列突变。在选择不是人HS氨基葡萄糖3-O磺基转移酶的野生型HS氨基葡萄糖3-O磺基转移酶的氨基酸序列后,SEQ IDNO:147、SEQ ID NO:149和/或SEQ ID NO:151的氨基酸序列内存在的突变可工程化到野生型序列中以便形成可具有芳基硫酸酯依赖性磺基转移酶活性的另外突变体。
作为一个非限制性实例,编码猪HS氨基葡萄糖3-O磺基转移酶的同工型1的氨基酸序列(条目tr|I3LHH5|I3LHH5_PIG,如上图26A、图26B和图26C中的序列比对所示),与SEQID NO:147、SEQ ID NO:149和SEQ ID NO:151氨基酸序列进行比对。SEQ ID NO:147、SEQ IDNO:149或SEQ ID NO:151中存在的氨基酸突变工程化到猪HS氨基葡萄糖3-O磺基转移酶的氨基酸序列内的其等同位置中,以便分别产生突变的氨基酸序列SEQ ID NO:155、SEQ IDNO:156或SEQ ID NO:157。
在另一个非限制实例中,编码小鼠HS氨基葡萄糖3-O磺基转移酶的同工型5的全长氨基酸序列(未显示于上图26A、图26B和图26C中)与SEQ ID NO:147、SEQ ID NO:149和SEQID NO:151氨基酸序列比对。SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151中存在的氨基酸突变工程化到小鼠HS氨基葡萄糖3-O磺基转移酶的同工型5的氨基酸序列内的其等同位置中,以便产生突变的氨基酸序列。生成的全长氨基酸序列分别公开为SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160。
分别包含SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQID NO:159或SEQ ID NO:160氨基酸序列的酶将用于下面的实施例23和实施例24中。然而,本领域技术人员会理解,对于EC 2.8.2.23酶类内任何其他HS氨基葡萄糖3-O磺基转移酶,可应用相同程序以生成芳基硫酸酯依赖性突变体,并且那些为了清楚起见而省略。
实施例23:表达和纯化具有氨基葡萄糖3-O磺基转移酶活性的EC 2.8.2.23突变体
根据本公开内容的实施方案进行研究以确定编码分别具有氨基酸序列SEQ IDNO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159或SEQ ID NO:160的工程化氨基葡萄糖3-O磺基转移酶的基因是否可转化到宿主细胞中,并且包含那些氨基酸序列中的每一个的酶可随后根据上述实施例1的程序进行表达、分离和纯化。基于所需的表达宿主,确定编码分别具有氨基酸序列为SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159或SEQ ID NO:160的酶的密码子优化的核苷酸序列。在合适的表达载体中合成或插入那些基因后,预期分别编码每个氨基酸序列SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160的基因将转化到宿主细胞中,随后含有那些序列的酶将以足够的量和纯度进行表达、分离和纯化,以确定芳基硫酸酯依赖性氨基葡萄糖3-O磺基转移酶活性。
实施例24:EC 2.8.2.23突变体的氨基葡萄糖3-O磺基转移酶活性
根据本公开的实施方案进行研究以使用实施例6和/或实施例7的程序确定分别包含序列SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159或SEQ ID NO:160的突变体酶是否为活性磺基转移酶。预期MS和/或NMR研究将证实,存在由于N,2O,6O-HS多糖和芳基硫酸酯化合物与分别包含SEQ ID NO:155、SEQ ID NO:156、SEQ IDNO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160序列的每种工程化酶反应所形成的N,2O,3O,6O-HS产物。
权利要求书(按照条约第19条的修改)
1.一种工程化的具有生物活性的磺基转移酶,其具有将磺基从磺基供体催化转移至基于肝素前体的多糖的生物活性,所述磺基供体由芳基硫酸酯化合物组成,
其中所述芳基硫酸酯化合物优选地选自对硝基苯硫酸酯、4-甲基伞形酮基硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2-萘基硫酸酯和4-硝基儿茶酚硫酸酯,更优选为对硝基苯硫酸酯或4-硝基儿茶酚硫酸酯;并且
其中所述磺基转移酶的生物活性选自氨基葡萄糖N-磺基转移酶活性、己糖醛酸2-O磺基转移酶活性、氨基葡萄糖6-O磺基转移酶活性和氨基葡萄糖3-O磺基转移酶活性。
2.根据权利要求1所述的磺基转移酶,其中所述磺基转移酶具有氨基葡萄糖N-磺基转移酶生物活性,优选基于肝素前体的多糖包含下式II的结构:
其中n是整数,并且R为氢原子或磺基、优选为氢原子。
3.根据权利要求2所述的磺基转移酶,其中所述磺基转移酶包含与酶类(EC)2.8.2.8内天然氨基葡萄糖N-磺基转移酶中的任一种的氨基酸序列具有至少80%序列同一性的氨基酸序列。
Claims (49)
1.一种工程化的具有生物活性的磺基转移酶,其具有将磺基从芳基硫酸酯化合物催化转移至基于肝素前体的多糖的生物活性,
其中所述芳基硫酸酯化合物优选地选自对硝基苯硫酸酯、4-甲基伞形酮基硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2-萘基硫酸酯和4-硝基儿茶酚硫酸酯,更优选为对硝基苯硫酸酯或4-硝基儿茶酚硫酸酯;并且
其中所述磺基转移酶的生物活性选自氨基葡萄糖N-磺基转移酶活性、己糖醛酸2-O磺基转移酶活性、氨基葡萄糖6-O磺基转移酶活性和氨基葡萄糖3-O磺基转移酶活性。
3.根据权利要求2所述的磺基转移酶,其中所述磺基转移酶包含与酶类(EC)2.8.2.8内天然氨基葡萄糖N-磺基转移酶中的任一种的氨基酸序列具有至少80%序列同一性的氨基酸序列。
4.根据权利要求3所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和SEQ ID NO:15。
5.根据权利要求3所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24和SEQ ID NO:25。
7.根据权利要求6所述的磺基转移酶,其中所述磺基转移酶包含具有与EC 2.8.2.-内天然己糖醛酸2-O磺基转移酶中的任一种的氨基酸序列至少80%序列同一性的氨基酸序列。
8.根据权利要求7所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:63和SEQ ID NO:65。
9.根据权利要求7所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:68和SEQ ID NO:69。
11.根据权利要求10所述的磺基转移酶,其中所述磺基转移酶包含具有与EC 2.8.2.-内天然氨基葡萄糖6-O磺基转移酶中的任一种的氨基酸序列至少80%序列同一性的氨基酸序列。
12.根据权利要求11所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108。
13.根据权利要求11所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ IDNO:122。
15.根据权利要求14所述的磺基转移酶,其中所述磺基转移酶包含具有与EC 2.8.2.23内天然氨基葡萄糖3-O磺基转移酶中任一种的氨基酸序列至少80%序列同一性的氨基酸序列。
16.根据权利要求15所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151。
17.根据权利要求15所述的磺基转移酶,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ ID NO:159和SEQ ID NO:160。
18.根据权利要求1-17中任一项所述的磺基转移酶,其中所述芳基硫酸酯化合物是对硝基苯硫酸酯。
19.根据权利要求1-18中任一项所述的磺基转移酶,其中所述芳基硫酸酯化合物是4-硝基儿茶酚硫酸酯。
20.一种分离的核酸分子,其包含编码根据权利要求1-19中任一项所述的磺基转移酶的核苷酸序列。
21.根据权利要求20所述的分离的核酸分子,其中所述分离的核酸分子包含选自如下的核苷酸序列:SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:148、SEQ ID NO:150和SEQ ID NO:152。
22.一种包含根据权利要求20所述的分离的核酸分子中的任一种的载体。
23.根据权利要求22所述的载体,其中所述载体包含选自如下的核苷酸序列:SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:148、SEQ ID NO:150和SEQ ID NO:152。
24.根据权利要求22或权利要求23所述的载体,其中所述载体还包含来自大肠杆菌(E.coli)的malE基因。
25.根据权利要求22或权利要求23所述的载体,其中所述载体还包含编码小泛素相关修饰物(SUMO)蛋白的基因,优选SUMO1基因。
26.一种包含权利要求22-25中任一项所述的载体的分离的宿主细胞。
27.根据权利要求26所述的分离的宿主细胞,其中所述分离的宿主细胞选自细菌细胞、酵母细胞、昆虫细胞和哺乳动物细胞,并且优选大肠杆菌宿主细胞。
28.一种将磺基酶促转移至基于肝素前体的多糖以形成硫酸化多糖产物的方法,所述方法包括以下步骤:
提供芳基硫酸酯化合物,其选自对硝基苯硫酸酯、4-甲基伞形酮硫酸酯、7-羟基香豆素硫酸酯、硫酸苯酯、4-乙酰苯基硫酸酯、硫酸吲哚酚、1-萘基硫酸酯、2-萘基硫酸酯和4-硝基儿茶硫酸酯;
提供根据权利要求1-19中任一项所述的磺基转移酶;
提供基于肝素前体的多糖;
将所述芳基硫酸酯化合物、所述磺基转移酶和所述基于肝素前体的多糖组合成反应混合物;和
使用所述磺基转移酶,将所述磺基从所述芳基硫酸酯化合物转移至所述基于肝素前体的多糖,从而形成硫酸化多糖产物。
29.根据权利要求28所述的方法,其中所述磺基转移酶是氨基葡萄糖N-磺基转移酶,并且所述基于肝素前体的多糖包含式II的结构。
30.根据权利要求29所述的方法,其中所述磺基转移酶包含具有与EC 2.8.2.8内任何天然氨基葡萄糖N-磺基转移酶的氨基酸序列至少80%序列同一性的氨基酸序列。
31.根据权利要求30所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13和SEQ ID NO:15。
32.根据权利要求30所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25。
33.根据权利要求28所述的方法,其中所述磺基转移酶是己糖醛酸2-O磺基转移酶,并且所述基于肝素前体的多糖包含式IV和/或式V的结构。
34.根据权利要求33所述的方法,其中所述磺基转移酶包含具有与EC2.8.2.-内任何天然己糖醛酸2-O磺基转移酶的氨基酸序列至少80%序列同一性的氨基酸序列。
35.根据权利要求34所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:63和SEQ ID NO:65。
36.根据权利要求34所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:68和SEQ ID NO:69。
37.根据权利要求33-36中任一项所述的方法,其中所述方法还包括如下步骤:提供葡糖醛酸C5-差向异构酶,优选包含氨基酸序列SEQ ID NO:67的葡糖醛酸C5-差向异构酶,并且更优选包含SEQ ID NO:67的氨基酸残基34-617的葡糖醛酸C5-差向异构酶。
38.根据权利要求28所述的方法,其中所述磺基转移酶是氨基葡萄糖6-O磺基转移酶,并且所述基于肝素前体的多糖包含式VIII的结构。
39.根据权利要求38所述的方法,其中所述磺基转移酶包含具有与EC 2.8.2.-内的任何天然氨基葡萄糖6-O磺基转移酶的氨基酸序列至少80%序列同一性的氨基酸序列。
40.根据权利要求39所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:104、SEQ ID NO:106和SEQ ID NO:108。
41.根据权利要求39所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:116、SEQ IDNO:117、SEQ ID NO:118、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:121和SEQ ID NO:122。
42.根据权利要求28所述的方法,其中所述磺基转移酶是氨基葡萄糖3-O磺基转移酶,并且所述基于肝素前体的多糖包含式X的结构。
43.根据权利要求42所述的方法,其中所述磺基转移酶包含具有与EC 2.8.2.23内任何天然氨基葡萄糖3-O磺基转移酶的氨基酸序列至少80%序列同一性的氨基酸序列。
44.根据权利要求43所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:147、SEQ ID NO:149和SEQ ID NO:151。
45.根据权利要求43所述的方法,其中所述磺基转移酶包含选自如下的氨基酸序列:SEQ ID NO:154、SEQ ID NO:155、SEQ ID NO:156、SEQ ID NO:157、SEQ ID NO:158、SEQ IDNO:159和SEQ ID NO:160。
47.根据权利要求46所述的方法,其中所述硫酸化多糖产物具有抗凝活性。
48.根据权利要求28-47中任一项所述的方法,其中所述芳基硫酸酯化合物是对硝基苯硫酸酯。
49.根据权利要求28-47中任一项所述的方法,其中所述芳基硫酸酯化合物是4-硝基儿茶硫酸酯。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962792440P | 2019-01-15 | 2019-01-15 | |
US62/792,440 | 2019-01-15 | ||
US201962797466P | 2019-01-28 | 2019-01-28 | |
US62/797,466 | 2019-01-28 | ||
US201962808074P | 2019-02-20 | 2019-02-20 | |
US62/808,074 | 2019-02-20 | ||
US201962853261P | 2019-05-28 | 2019-05-28 | |
US62/853,261 | 2019-05-28 | ||
PCT/US2020/013677 WO2020150350A1 (en) | 2019-01-15 | 2020-01-15 | Engineered aryl sulfate-dependent enzymes |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113646427A true CN113646427A (zh) | 2021-11-12 |
Family
ID=69529057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080021311.XA Pending CN113646427A (zh) | 2019-01-15 | 2020-01-15 | 工程化芳基硫酸酯依赖性酶 |
Country Status (10)
Country | Link |
---|---|
US (9) | US11692180B2 (zh) |
EP (1) | EP3911737A1 (zh) |
JP (1) | JP2022523638A (zh) |
KR (1) | KR20210126019A (zh) |
CN (1) | CN113646427A (zh) |
AU (1) | AU2020209822A1 (zh) |
BR (1) | BR112021013890A2 (zh) |
CA (1) | CA3126805A1 (zh) |
MX (1) | MX2021008479A (zh) |
WO (1) | WO2020150350A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2022000343A (es) * | 2019-07-09 | 2022-03-11 | Optimvia Llc | Metodos para sintetizar polisacaridos anticoagulantes. |
EP4182452A1 (en) | 2020-07-14 | 2023-05-24 | Optimvia, LLC | Methods for synthesizing non-anticoagulant heparan sulfate |
CN114763570B (zh) * | 2021-09-10 | 2024-02-27 | 江南大学 | 制备不同分子量肝素的磺酸化修饰体系构建及其应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050255562A1 (en) * | 2003-11-12 | 2005-11-17 | Rosenberg Robert D | Methods for synthesis of sulfated saccharides |
US20090197308A1 (en) * | 2005-05-12 | 2009-08-06 | Jian Liu | Enzymatic synthesis of sulfated polysaccharides |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4554101A (en) | 1981-01-09 | 1985-11-19 | New York Blood Center, Inc. | Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity |
US5541095A (en) | 1992-06-16 | 1996-07-30 | University Of Massachusetts Medical Center | Glycosaminoglycan specific sulfotransferases |
JP3818676B2 (ja) | 1994-07-22 | 2006-09-06 | 生化学工業株式会社 | ヘパラン硫酸6−o−硫酸基転移酵素 |
US5919673A (en) | 1995-03-22 | 1999-07-06 | The Scripps Research Institute | One-pot enzymatic sulfation process using 3'-phosphoadenosine-5'-phosphosulfate and recycled phosphorylated adenosine intermediates |
JP3672359B2 (ja) | 1995-07-24 | 2005-07-20 | 生化学工業株式会社 | ヘパラン硫酸 2−o−硫酸基転移酵素 |
JP3964982B2 (ja) * | 1997-06-19 | 2007-08-22 | 生化学工業株式会社 | ヘパラン硫酸6−o硫酸基転移酵素のポリペプチド及びそれをコードするdna |
US6861254B1 (en) | 1997-10-24 | 2005-03-01 | Massachusetts Institute Of Technology | Heparan sulfate D-glucosaminyl 3-O-sulfotransferases, and uses therefor |
US8088604B2 (en) | 1998-04-02 | 2012-01-03 | The Board Of Regents Of The University Of Oklahoma | Production of defined monodisperse heparosan polymers and unnatural polymers with polysaccharide synthases |
US20060188966A1 (en) | 1998-04-02 | 2006-08-24 | Deangelis Paul L | Natural, chimeric and hybrid glycosaminoglycan polymers and methods of making and using same |
US6593459B1 (en) | 1998-06-16 | 2003-07-15 | The Board Of Regents Of The University Of Oklahoma | Synthetic glycosulfopeptides and methods of synthesis thereof |
US6255088B1 (en) | 1999-05-11 | 2001-07-03 | The Scripps Research Institute | Enzymatic sulfation of biomolecules |
DE10002005A1 (de) | 2000-01-19 | 2001-08-09 | Bosch Gmbh Robert | Zerstäubungsdüse |
ITMI20010397A1 (it) | 2001-02-27 | 2002-08-27 | Giorgio Zoppetti | Derivati altamente n,o-solfatati del polisaccaride k5 e loro preparazione |
JP2005507640A (ja) | 2001-03-28 | 2005-03-24 | マサチューセッツ・インスティチュート・オブ・テクノロジー | グルコサミニルの6−o硫酸化方法及び6−o硫酸化された多糖製剤 |
EP1392843B1 (en) | 2001-05-08 | 2017-12-13 | The Board of Regents of the University of Oklahoma | Heparin/heparosan synthase and methods of making and using same |
US8580290B2 (en) | 2001-05-08 | 2013-11-12 | The Board Of Regents Of The University Of Oklahoma | Heparosan-based biomaterials and coatings and methods of production and use thereof |
AU2003247808A1 (en) | 2002-07-05 | 2004-01-23 | Anders Malmstrom | Purified and isolated heparan sulfate 3-o-sulfotransferase isoform 5 nucleic acids and polypeptides and therapeutic and screening methods using same |
US20040147469A1 (en) | 2002-11-01 | 2004-07-29 | Case Western Reserve University | Methods of inhibiting glial scar formation |
AU2003293122A1 (en) | 2002-11-27 | 2004-06-23 | Massachusetts Institute Of Technology | Methods for synthesizing polysaccharides |
WO2006023487A2 (en) | 2004-08-16 | 2006-03-02 | Massachusetts Institute Of Technology | Rapid two-step synthesis of anti-coagulants |
US20060154894A1 (en) | 2004-09-15 | 2006-07-13 | Massachusetts Institute Of Technology | Biologically active surfaces and methods of their use |
JP2008526258A (ja) | 2005-01-12 | 2008-07-24 | マサチューセッツ・インスティテュート・オブ・テクノロジー | 細胞外幹細胞環境を調節することに関する方法および組成物 |
ATE453282T1 (de) | 2005-07-05 | 2010-01-15 | Huawei Tech Co Ltd | Authentifizierungsverfahren für das ip multimedia subsystem |
US20090035787A1 (en) | 2007-07-23 | 2009-02-05 | The University Of North Carolina At Chapel Hill | Enzymatic synthesis of sulfated polysaccharides without iduronic acid residues |
EP2307440A4 (en) | 2008-07-01 | 2012-12-19 | Zacharon Pharmaceuticals Inc | HEPARAN SULFATE INHIBITORS |
CN101724086B (zh) | 2009-11-25 | 2012-09-26 | 深圳海王药业有限公司 | 低聚凤梨参糖胺聚糖及其制备方法 |
ES2910476T3 (es) | 2010-12-23 | 2022-05-12 | Univ North Carolina Chapel Hill | Síntesis quimioenzimática de heparinas de peso molecular ultra bajo estructuralmente homogéneas |
TW201309305A (zh) | 2011-02-22 | 2013-03-01 | Rensselaer Polytech Inst | 用於製造生物工程肝素之單一步驟肝素前體之n-去乙醯化作用及解聚合作用 |
US8815529B2 (en) | 2011-05-23 | 2014-08-26 | Research & Diagnostics Systems, Inc. | Sulfotransferase assay |
AU2013237894B2 (en) | 2012-03-30 | 2018-06-21 | The Board Of Regents Of The University Of Oklahoma | High molecular weight heparosan polymers and methods of production and use thereof |
US20140349962A1 (en) | 2013-05-24 | 2014-11-27 | Massachusetts Institute Of Technology | Rapid two-step synthesis of anti-coagulants |
US9951149B2 (en) | 2013-06-17 | 2018-04-24 | The University Of North Carolina At Chapel Hill | Reversible heparin molecules and methods of making and using the same |
US20170226543A1 (en) | 2014-08-22 | 2017-08-10 | Danmarks Tekniske Universitet | Biological processes for the production of aryl sulfates |
JP6879216B2 (ja) | 2015-12-28 | 2021-06-02 | 味の素株式会社 | 抗凝固活性を有するヘパラン硫酸の製造法 |
WO2017144671A1 (en) | 2016-02-24 | 2017-08-31 | Danmarks Tekniske Universitet | Improved biological processes for the production of aryl sulfates |
TWI769176B (zh) | 2016-09-07 | 2022-07-01 | 瑞瑟勒綜合技術協會 | 生合成肝素 |
CN110191958A (zh) | 2017-01-19 | 2019-08-30 | 味之素株式会社 | 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法 |
US11903963B2 (en) | 2017-03-10 | 2024-02-20 | The University Of North Carolina At Chapel Hill | Short-acting heparin-based anticoagulant compounds and methods |
EP3679147A1 (en) | 2017-09-05 | 2020-07-15 | Ajinomoto Co., Inc. | 2-o-sulfation enzyme mutant and 3-o-sulfation enzyme mutant, and method for using same |
-
2020
- 2020-01-15 CN CN202080021311.XA patent/CN113646427A/zh active Pending
- 2020-01-15 BR BR112021013890-0A patent/BR112021013890A2/pt unknown
- 2020-01-15 EP EP20704737.4A patent/EP3911737A1/en active Pending
- 2020-01-15 AU AU2020209822A patent/AU2020209822A1/en active Pending
- 2020-01-15 MX MX2021008479A patent/MX2021008479A/es unknown
- 2020-01-15 KR KR1020217025890A patent/KR20210126019A/ko active Search and Examination
- 2020-01-15 WO PCT/US2020/013677 patent/WO2020150350A1/en unknown
- 2020-01-15 CA CA3126805A patent/CA3126805A1/en active Pending
- 2020-01-15 JP JP2021541244A patent/JP2022523638A/ja active Pending
-
2021
- 2021-07-15 US US17/376,341 patent/US11692180B2/en active Active
- 2021-07-15 US US17/376,332 patent/US11572550B2/en active Active
- 2021-07-15 US US17/376,335 patent/US11473068B2/en active Active
- 2021-07-15 US US17/376,322 patent/US11572549B2/en active Active
-
2022
- 2022-08-24 US US17/894,933 patent/US11708567B2/en active Active
- 2022-08-24 US US17/894,929 patent/US11773382B2/en active Active
- 2022-08-24 US US17/894,932 patent/US11767518B2/en active Active
-
2023
- 2023-07-24 US US18/225,213 patent/US20240002819A1/en active Pending
- 2023-09-25 US US18/473,809 patent/US20240093166A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050255562A1 (en) * | 2003-11-12 | 2005-11-17 | Rosenberg Robert D | Methods for synthesis of sulfated saccharides |
US20090197308A1 (en) * | 2005-05-12 | 2009-08-06 | Jian Liu | Enzymatic synthesis of sulfated polysaccharides |
Also Published As
Publication number | Publication date |
---|---|
US20220340888A9 (en) | 2022-10-27 |
US11692180B2 (en) | 2023-07-04 |
BR112021013890A2 (pt) | 2021-09-21 |
US11708567B2 (en) | 2023-07-25 |
US11572550B2 (en) | 2023-02-07 |
US20230051957A1 (en) | 2023-02-16 |
CA3126805A1 (en) | 2020-07-23 |
US11773382B2 (en) | 2023-10-03 |
WO2020150350A1 (en) | 2020-07-23 |
EP3911737A1 (en) | 2021-11-24 |
JP2022523638A (ja) | 2022-04-26 |
US11767518B2 (en) | 2023-09-26 |
KR20210126019A (ko) | 2021-10-19 |
US11572549B2 (en) | 2023-02-07 |
MX2021008479A (es) | 2021-10-13 |
US20240002819A1 (en) | 2024-01-04 |
US20230092183A1 (en) | 2023-03-23 |
US20240093166A1 (en) | 2024-03-21 |
US20230029317A1 (en) | 2023-01-26 |
US11473068B2 (en) | 2022-10-18 |
US20210363504A1 (en) | 2021-11-25 |
US20210363503A1 (en) | 2021-11-25 |
US20210363505A1 (en) | 2021-11-25 |
US20220042062A1 (en) | 2022-02-10 |
AU2020209822A1 (en) | 2021-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11692180B2 (en) | Engineered aryl sulfate-dependent enzymes | |
US20120322114A1 (en) | Enzymatic synthesis of sulfated polysaccharides | |
EP2655421A2 (en) | Chemoenzymatic synthesis of structurally homogeneous ultra-low molecular weight heparins | |
US20230340552A1 (en) | Methods for synthesizing anticoagulant polysaccharides | |
US11708593B2 (en) | Engineered aryl sulfate-dependent enzymes | |
US20240076634A1 (en) | Engineered aryl sulfate-dependent enzymes | |
US20230151339A1 (en) | Engineered aryl sulfate-dependent enzymes | |
US10273517B2 (en) | Methods of producing testosteronan polymers using testosteronan synthase | |
EP4182452A1 (en) | Methods for synthesizing non-anticoagulant heparan sulfate | |
KR20220032086A (ko) | 항응고제 다당류의 합성 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |