CN116096898A

CN116096898A - 人类α半乳糖苷酶变体

Info

Publication number: CN116096898A
Application number: CN202180017455.2A
Authority: CN
Inventors: 威廉·凯西·哈洛斯; 尼基·德拉斯; 朱钰; 朱迪·维多利亚·安东尼奥·维杜雅; 庄静斌; 安托瓦内特·塞罗; 雷切尔·凯思琳·博瑟姆; 大卫·威廉·霍曼; 穆莱·希沙姆·阿拉维伊斯梅利; 乔纳森·弗罗姆; 亚当·P·西尔弗曼; 克里斯汀·让·瓦利厄; 查鲁·舒克拉·雷迪; 克里恩·麦克卢斯基
Original assignee: Codexis Inc
Current assignee: Codexis Inc
Priority date: 2020-02-28
Filing date: 2021-02-26
Publication date: 2023-05-09
Also published as: IL295818A; AR121457A1; US20210269787A1; TW202146648A; ECSP22075305A; CA3173294A1; PE20230487A1; AU2021228689A1; CL2022002330A1; EP4110926A2; JP2023516301A; CO2022012809A2; BR112022016990A2; KR20220146601A; WO2021173928A2; MX2022010663A; WO2021173928A3

Abstract

本发明提供了工程化人类α半乳糖苷酶多肽及其组合物。该工程化人类α半乳糖苷酶多肽已经被优化，以提供提高的热稳定性、血清稳定性、提高的细胞摄取、在酸性(pH<4)和碱性(pH>7)条件下的稳定性、降低的免疫原性以及改进的球形三酰神经酰胺从细胞中的去除。本发明还涉及包含该工程化人类α半乳糖苷酶多肽的组合物用于治疗目的的用途。

Description

人类α半乳糖苷酶变体

本申请要求2020年2月28日提交的美国临时申请序列第62/982,949号的优先权，该美国临时申请为了所有目的在此通过引用以其整体并入。

发明领域

本发明提供了工程化人类α半乳糖苷酶多肽及其组合物。该工程化人类α半乳糖苷酶多肽已经被优化，以提供提高的热稳定性、血清稳定性、降低的免疫原性、提高的细胞摄取、和在酸性(pH<4)和碱性(pH>7)条件下的稳定性以及改进的球形三酰神经酰胺(globotriaosylceramide)从细胞中的清除。本发明还涉及包含该工程化人类α半乳糖苷酶多肽的组合物用于治疗目的的用途。

对序列表、表格或计算机程序的引用

序列表的正式副本作为ASCII格式的文本文件经由EFS-Web与说明书同时提交，文件名为“CX7-203WO2_ST25.txt”，创建日期为2021年2月22日，且大小为4.43兆字节。经由EFS-Web提交的序列表是说明书的一部分并且通过引用以其整体并入本文。

发明背景

人类α半乳糖苷酶(“GLA”；EC 3.2.1.22)是一种溶酶体糖蛋白，负责从糖脂和糖蛋白水解末端α半乳糖基部分。人类α半乳糖苷酶作用于一系列人体组织中存在的许多底物。法布里病(Fabry disease)(也称为弥漫性体部血管角化瘤、安德森-法布里病(Anderson-Fabry disease)、遗传性异位性脂质沉积症、α半乳糖苷酶A缺乏症、GLA缺乏症和球形三酰神经酰胺酶缺乏症)是一种由α半乳糖苷酶A缺乏或缺乏活性导致的鞘糖脂分解代谢的X连锁的先天性错误。罹患法布里病的患者的血管、组织和器官中的血浆和细胞溶酶体中积累球形三酰神经酰胺(本文中称为“Gb₃”和“Gb3”)和相关鞘糖脂(参见例如，Nance等人,Arch.Neurol.,63:453-457[2006])。随着患者年龄增长，由于这些脂质的积累，血管逐渐变窄，导致到达组织(特别是在皮肤、肾、心脏、脑和神经系统中)的血流和营养减少。因此，法布里病是一种全身性紊乱，表现为肾衰竭、心脏病、脑血管病、小纤维周围神经病变和皮肤病灶以及其他紊乱(参见例如，Schiffmann，Pharman.Ther.,122:65-77[2009])。受影响的患者表现出诸如手和脚疼痛、患者皮肤上的深红色小斑点簇、出汗能力下降、角膜混浊、胃肠问题、耳鸣和听力损失的症状。潜在的危及生命的并发症包括进行性肾损害、心脏病发作和中风。该疾病估计影响1/40,000-1/60,000的男性，但也发生于女性中。实际上，患有法布里病的杂合子女性经历严重的危及生命的状况，包括神经系统异常、慢性疼痛、疲劳、高血压、心脏病、肾衰竭和中风，因此需要药物治疗(参见例如，Want等人,Genet.Med.,13:457-484[2011])。法布里病的病征可以从婴儿期的任何时间开始，病征通常在4岁和8岁之间开始出现，尽管一些患者表现出较轻的迟发性疾病。治疗通常是支持性的，并且法布里病是无法治愈的，因此仍然存在对安全且有效的治疗的需求。

发明概述

本发明提供了重组α半乳糖苷酶A和/或生物活性重组α半乳糖苷酶A片段，其包含含有与SEQ ID NO:8的至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％序列同一性的氨基酸序列。本发明提供了重组α半乳糖苷酶A和/或生物活性重组α半乳糖苷酶A片段，其包含含有与SEQ ID NO:8的至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的氨基酸序列。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：44、44/217、44/217/316、44/217/322、44/217/322/337、44/247、44/247/302、44/247/302/322、44/247/322、44/247/337、44/247/362、44/302、44/337、44/373、217/322、217/373、247/322、247/362、302/322/362/373、302/337、316、316/337、322、322/337、362/373和373，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：44L、44L/217F、44L/217F/316L、44L/217F/322M、44L/217F/322M/337A、44L/247N、44L/247N/302Q、44L/247N/302Q/322M、44L/247N/322M、44L/247N/337A、44L/247N/362K、44L/302Q、44L/337A、44L/373R、217F/322M、217F/373R、247N/322M、247N/362K、302Q/322M/362K/373R、302Q/337A、316L、316L/337A、322M、322M/337A、362K/373R和373R，其中所述多肽序列的氨基酸位置参考SEQID NO:8来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：R44L、R44L/R217F、R44L/R217F/D316L、R44L/R217F/I322M、R44L/R217F/I322M/P337A、R44L/D247N、R44L/D247N/K302Q、R44L/D247N/K302Q/I322M、R44L/D247N/I322M、R44L/D247N/P337A、R44L/D247N/Q362K、R44L/K302Q、R44L/P337A、R44L/K373R、R217F/I322M、R217F/K373R、D247N/I322M、D247N/Q362K、K302Q/I322M/Q362K/K373R、K302Q/P337A、D316L、D316L/P337A、I322M、I322M/P337A、Q362K/K373R和K373R，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10/39/44/47/92/166/206/217/247/261/271/302/316/322/337/362/368/373/392、44/217/316、44/217/322/337、166/362、217/373和362/373，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10T/39M/44L/47S/92Y/166S/206K/217F/247N/261A/271H/302Q/316L/322M/337A/362K/368W/373R/392M、44L/217F/316L、44L/217F/322M/337A、166A/362K、217F/373R和362K/373R，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10T/E39M/R44L/T47S/H92Y/P166S/A206K/R217F/D247N/G261A/A271H/K302Q/D316L/I322M/P337A/Q362K/A368W/K373R/T392M、R44L/R217F/D316L、R44L/R217F/I322M/P337A、P166A/Q362K、R217F/K373R和Q362K/K373R，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：7、7/48/68、7/48/68/120/282/299、7/48/130/282、7/48/180、7/68/130/282/365、7/68/180、7/88/120/305/365、7/120、7/130、7/282、7/305、7/305/365、7/365、39、47、47/87/95/96/158/162、47/95、47/273、47/343、48、48/68、48/180/282、48/282、48/282/305、67/180、68、68/299/300、71、87/91/95/96/158/162、87/91/95/96/206/343、87/96/155/273/343、88、91/95、91/95/96、92、93、96、96/273、96/312/343、120、120/299/305、151、158、158/162/273、162、162/273、162/343、166、178、180、181、206、217、271、273、273/343、282、282/365、293/391、299/300、299/300/305/365、300、301、305、305/365、314、333、336、337、343、345、363、365、370、389、393、394、396/398、397和398，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：7L、7L/48D/68E、7L/48D/68E/120H/282N/299R、7L/48D/130E/282N、7L/48D/180G、7L/68E/130E/282N/365V、7L/68E/180G、7L/88A/120H/305G/365V、7L/120H、7L/130E、7L/282N、7L/305G、7L/305G/365V、7L/365V、39V、47D、47D/87K/95E/96L/158R/162H、47D/95E、47D/273P、47D/343G、47V、48D、48D/68E、48D/180G/282N、48D/282N、48D/282N/305G、67T/180G、68E、68E/299R/300I、71P、87K/91Q/95E/96L/158A/162K、87K/91Q/95E/96L/206S/343G、87K/96I/155N/273P/343G、88A、91Q/95E、91Q/95E/96L、92F、92T、93I、96L、96L/273P、96L/312Q/343G、120H、120H/299R/305G、151L、158A、158A/162K/273G、158R、162H/343D、162K、162K/273P、162S、166K、178G、178S、180G、180L、180T、180V、181A、206K、206S、217K、271R、273P、273P/343G、282N、282N/365V、293P/391A、299R/300I、299R/300I/305G/365V、300I、301M、305G、305G/365V、314A、333F、333G、336V、337R、343D、343G、345A、345Q、363Q、365A、365Q、365V、370G、389K、393V、394K、396G/398T、397A、398A、398P、398S和398V，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：R7L、R7L/E48D/Q68E、R7L/E48D/Q68E/Y120H/D282N/Q299R、R7L/E48D/D130E/D282N、R7L/E48D/F180G、R7L/Q68E/D130E/D282N/F365V、R7L/Q68E/F180G、R7L/Q88A/Y120H/N305G/F365V、R7L/Y120H、R7L/D130E、R7L/D282N、R7L/N305G、R7L/N305G/F365V、R7L/F365V、E39V、T47D、T47D/R87K/S95E/K96L/L158R/R162H、T47D/S95E、T47D/S273P、T47D/K343G、T47V、E48D、E48D/Q68E、E48D/F180G/D282N、E48D/D282N、E48D/D282N/N305G、P67T/F180G、Q68E、Q68E/Q299R/L300I、S71P、R87K/N91Q/S95E/K96L/L158A/R162K、R87K/N91Q/S95E/K96L/A206S/K343G、R87K/K96I/H155N/S273P/K343G、Q88A、N91Q/S95E、N91Q/S95E/K96L、H92F、H92T、V93I、K96L、K96L/S273P、K96L/P312Q/K343G、Y120H、Y120H/Q299R/N305G、D151L、L158A、L158A/R162K/S273G、L158R、R162H/K343D、R162K、R162K/S273P、R162S、P166K、W178G、W178S、F180G、F180L、F180T、F180V、Q181A、A206K、A206S、R217K、A271R、S273P、S273P/K343G、D282N、D282N/F365V、L293P/Q391A、Q299R/L300I、Q299R/L300I/N305G/F365V、L300I、R301M、N305G、N305G/F365V、S314A、S333F、S333G、I336V、P337R、K343D、K343G、V345A、V345Q、L363Q、F365A、F365Q、F365V、S370G、T389K、S393V、L394K、D396G/L398T、L397A、L398A、L398P、L398S和L398V，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:158具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：24/202、39/47、39/47/217、39/151、39/282/337/398、39/337/343/398、39/393/398、47/130、47/151、47/343/345/393、48、48/68、48/68/217/333/391/393、48/68/333、48/217、48/333、48/345/393、48/393、59/143、68、68/345、130、130/158、130/158/393、130/345/393、143/271、143/333、143/387、151、151/158/217/343/345/393、151/206/282/337/343/345/398、151/282/393、151/345/393/398、151/393、158、158/393、202、206、206/217、217、217/333、217/337/345/398、271、282/393、333、333/345、337/343/345/398、343、343/345/393/398、393和393/398，其中所述多肽序列的氨基酸位置参考SEQ ID NO:158来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:158具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：24S/202N、39V/47D、39V/47V/217K、39V/151L、39V/282N/337R/398A、39V/337R/343G/398A、39V/393V/398A、47V/130E、47V/151L、47V/343D/345Q/393V、48D、48D/68E、48D/68E/217K/333F/391A/393V、48D/68E/333F、48D/217K、48D/333F、48D/333G、48D/345Q/393V、48D/393V、59A/143S、68E、68E/345Q、130E、130E/158R、130E/158R/393V、130E/345Q/393V、143S/271N、143S/333N、143S/387N、151L、151L/158R/217K/343G/345Q/393V、151L/206S/282N/337R/343D/345Q/398A、151L/282N/393V、151L/345Q/393V/398A、151L/393V、158R、158R/393V、202N、206S、206S/217K、217K、217K/333F、217K/333G、217K/337R/345Q/398A、271N、282N/393V、333F/345Q、333G、333N、337R/343G/345Q/398A、343D、343D/345Q/393V/398A、393V和393V/398A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:158来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:158具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：D24S/D202N、E39V/T47D、E39V/T47V/R217K、E39V/D151L、E39V/D282N/P337R/L398A、E39V/P337R/K343G/L398A、E39V/S393V/L398A、T47V/D130E、T47V/D151L、T47V/K343D/V345Q/S393V、E48D、E48D/Q68E、E48D/Q68E/R217K/S333F/Q391A/S393V、E48D/Q68E/S333F、E48D/R217K、E48D/S333F、E48D/S333G、E48D/V345Q/S393V、E48D/S393V、C59A/C143S、Q68E、Q68E/V345Q、D130E、D130E/L158R、D130E/L158R/S393V、D130E/V345Q/S393V、C143S/A271N、C143S/S333N、C143S/E387N、D151L、D151L/L158R/R217K/K343G/V345Q/S393V、D151L/A206S/D282N/P337R/K343D/V345Q/L398A、D151L/D282N/S393V、D151L/V345Q/S393V/L398A、D151L/S393V、L158R、L158R/S393V、D202N、A206S、A206S/R217K、R217K、R217K/S333F、R217K/S333G、R217K/P337R/V345Q/L398A、A271N、D282N/S393V、S333F/V345Q、S333G、S333N、P337R/K343G/V345Q/L398A、K343D、K343D/V345Q/S393V/L398A、S393V和S393V/L398A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:158来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:372具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、10/39/44/322、10/39/92/206/217/271、10/39/92/247、10/39/92/247/271/316、10/44、10/44/47/92/247、10/44/47/261/302/322/368、10/44/92/316/322、10/44/261/302/316、10/44/302/337/368、10/47/217/247/316/392、10/47/217/322、10/47/271、10/92、10/92/206/217/247、10/92/206/247/316/322/392、10/92/206/247/322/368、10/92/217/261/302/337、10/206/217/271、10/206/247、10/206/261/271/316、10/261、10/271/302、10/302、10/302/316、10/302/322/337、10/316/322、10/337/392、10/368、39/44/92/162/247/302/316/322、39/44/92/217/322、39/44/92/247/271/302、39/47/92/247/302/316/322、39/47/217/247/368、39/47/247、39/92/247/302/316/337/368、39/92/316/322、39/247/271、39/247/271/316、39/322、44/47/92/206/217/316/322、44/47/92/247/261/271/316/337/368、44/47/206/217/247/271/322、44/47/247/322/368、44/47/302/316/322、44/92/206/247/368、44/206/337、44/247/261/302/316、44/247/261/302/316/322、47/92/247/271、47/217/302、47/247、47/247/271、89/217/247/261/302/316、92/217/271、92/247、92/247/271/322、92/247/302/322/337、92/271/337、92/302、92/316、206/217/271/392、217/247/316/322/337/368、247、247/271、247/302、271、271/302/322、271/316/322、302/322/368和368，其中所述多肽序列的氨基酸位置参考SEQ ID NO:372来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:372具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10P、10P/39E/44R/322I、10P/39E/92H/206A/217R/271A、10P/39E/92H/247D、10P/39E/92H/247D/271A/316D、10P/44R、10P/44R/47T/92H/247D、10P/44R/47T/261G/302K/322I/368A、10P/44R/92H/316D/322I、10P/44R/261G/302K/316D、10P/44R/302K/337P/368A、10P/47T/217R/247D/316D/392T、10P/47T/217R/322I、10P/47T/271A、10P/92H、10P/92H/206A/217R/247D、10P/92H/206A/247D/316D/322I/392T、10P/92H/206A/247D/322I/368A、10P/92H/217R/261G/302K/337P、10P/206A/217R/271A、10P/206A/247D、10P/206A/261G/271A/316D、10P/261G、10P/271A/302K、10P/302K、10P/302K/316D、10P/302K/322I/337P、10P/316D/322I、10P/337P/392T、10P/368A、39E/44R/92H/162M/247D/302K/316D/322I、39E/44R/92H/217R/322I、39E/44R/92H/247D/271A/302K、39E/47T/92H/247D/302K/316D/322I、39E/47T/217R/247D/368A、39E/47T/247D、39E/92H/247D/302K/316D/337P/368A、39E/92H/316D/322I、39E/247D/271A、39E/247D/271A/316D、39E/322I、44R/47T/92H/206A/217R/316D/322I、44R/47T/92H/247D/261G/271A/316D/337P/368A、44R/47T/206A/217R/247D/271A/322I、44R/47T/247D/322I/368A、44R/47T/302K/316D/322I、44R/92H/206A/247D/368A、44R/206A/337P、44R/247D/261G/302K/316D、44R/247D/261G/302K/316D/322I、47T/92H/247D/271A、47T/217R/302K、47T/247D、47T/247D/271A、89I/217R/247D/261G/302K/316D、92H/217R/271A、92H/247D、92H/247D/271A/322I、92H/247D/302K/322I/337P、92H/271A/337P、92H/302K、92H/316D、206A/217R/271A/392T、217R/247D/316D/322I/337P/368A、247D、247D/271A、247D/302K、271A、271A/302K/322I、271A/316D/322I、302K/322I/368A和368A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:372来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:372具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：T10P、T10P/M39E/L44R/M322I、T10P/M39E/Y92H/K206A/F217R/H271A、T10P/M39E/Y92H/N247D、T10P/M39E/Y92H/N247D/H271A/L316D、T10P/L44R、T10P/L44R/S47T/Y92H/N247D、T10P/L44R/S47T/A261G/Q302K/M322I/W368A、T10P/L44R/Y92H/L316D/M322I、T10P/L44R/A261G/Q302K/L316D、T10P/L44R/Q302K/A337P/W368A、T10P/S47T/F217R/N247D/L316D/M392T、T10P/S47T/F217R/M322I、T10P/S47T/H271A、T10P/Y92H、T10P/Y92H/K206A/F217R/N247D、T10P/Y92H/K206A/N247D/L316D/M322I/M392T、T10P/Y92H/K206A/N247D/M322I/W368A、T10P/Y92H/F217R/A261G/Q302K/A337P、T10P/K206A/F217R/H271A、T10P/K206A/N247D、T10P/K206A/A261G/H271A/L316D、T10P/A261G、T10P/H271A/Q302K、T10P/Q302K、T10P/Q302K/L316D、T10P/Q302K/M322I/A337P、T10P/L316D/M322I、T10P/A337P/M392T、T10P/W368A、M39E/L44R/Y92H/R162M/N247D/Q302K/L316D/M322I、M39E/L44R/Y92H/F217R/M322I、M39E/L44R/Y92H/N247D/H271A/Q302K、M39E/S47T/Y92H/N247D/Q302K/L316D/M322I、M39E/S47T/F217R/N247D/W368A、M39E/S47T/N247D、M39E/Y92H/N247D/Q302K/L316D/A337P/W368A、M39E/Y92H/L316D/M322I、M39E/N247D/H271A、M39E/N247D/H271A/L316D、M39E/M322I、L44R/S47T/Y92H/K206A/F217R/L316D/M322I、L44R/S47T/Y92H/N247D/A261G/H271A/L316D/A337P/W368A、L44R/S47T/K206A/F217R/N247D/H271A/M322I、L44R/S47T/N247D/M322I/W368A、L44R/S47T/Q302K/L316D/M322I、L44R/Y92H/K206A/N247D/W368A、L44R/K206A/A337P、L44R/N247D/A261G/Q302K/L316D、L44R/N247D/A261G/Q302K/L316D/M322I、S47T/Y92H/N247D/H271A、S47T/F217R/Q302K、S47T/N247D、S47T/N247D/H271A、L89I/F217R/N247D/A261G/Q302K/L316D、Y92H/F217R/H271A、Y92H/N247D、Y92H/N247D/H271A/M322I、Y92H/N247D/Q302K/M322I/A337P、Y92H/H271A/A337P、Y92H/Q302K、Y92H/L316D、K206A/F217R/H271A/M392T、F217R/N247D/L316D/M322I/A337P/W368A、N247D、N247D/H271A、N247D/Q302K、H271A、H271A/Q302K/M322I、H271A/L316D/M322I、Q302K/M322I/W368A和W368A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:372来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10/36/92/166/247/261/316/392、10/39、10/39/44/47/92/206/217、10/39/44/47/316、10/39/44/47/337、10/39/44/92/166/261/316/322、10/39/44/92/166/302/322、10/39/44/92/166/392、10/39/44/92/217/302/322、10/39/44/92/302/322、10/39/44/166/261/271/316/322、10/39/44/392、10/39/47/92/337、10/39/92/131/166/271/316/322、10/39/92/166/217/247/271、10/39/92/217/316、10/44/47/166/261/271、10/44/47/166/271/322/368、10/44/47/217/271/316/322、10/44/92、10/44/92/217/247/271/302/316/392、10/44/166/302、10/44/206/316/322、10/47/92/166/271/316/337、10/47/92/271/302、10/47/92/316/322/392、10/47/166/271、10/47/166/316、10/92/166、10/92/166/217/247/261/271、10/92/166/261/271/392、10/92/166/261/316/322/337、10/92/166/337/368、10/92/302/337、10/92/316/322、10/206、10/206/247/261、10/217/322、10/261、10/261/337/392、10/316/392、10/368、39/44/47/92/166/206/392、39/44/47/92/206/247/261、39/44/47/92/206/392、39/44/47/206/337/368/392、39/44/92/166/247/261/302/337、39/44/166/271、39/44/166/271/337/368/392、39/47/92/316/322、39/47/92/392、39/47/166/217/261/392、39/47/217/247/368、39/47/247、39/92/166/217/392、39/92/261/302、39/166/217/261/316/368、39/322、39/392、44/47、44/47/92/217/271、44/47/92/217/316/322/392、44/47/92/392、44/47/166、44/47/166/271、44/47/247/271/392、44/316/322/392、44/337、47/166/206/217/247/337、47/166/217/271/337、47/206、47/217/247/261、47/271、52/217/302/316、92/166/206/271/316、92/166/217/261/271/392、92/166/217/316/337/392、92/166/247、92/166/316、92/206/322、92/217、92/217/271/337、92/261/271、92/271、166/217/316/322/337、166/247/271/316、166/316/322/337、206/217、217/392、247/316、316/322/368和316/337/392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10T/36M/92Y/166S/247N/261A/316L/392M、10T/39M、10T/39M/44L/47S/92Y/206K/217F、10T/39M/44L/47S/316L、10T/39M/44L/47S/337A、10T/39M/44L/92Y/166S/261A/316L/322M、10T/39M/44L/92Y/166S/302Q/322M、10T/39M/44L/92Y/166S/392M、10T/39M/44L/92Y/217F/302Q/322M、10T/39M/44L/92Y/302Q/322M、10T/39M/44L/166S/261A/271H/316L/322M、10T/39M/44L/392M、10T/39M/47S/92Y/337A、10T/39M/92Y/131G/166S/271H/316L/322M、10T/39M/92Y/166S/217F/247N/271H、10T/39M/92Y/217F/316L、10T/44L/47S/166S/261A/271H、10T/44L/47S/166S/271H/322M/368W、10T/44L/47S/217F/271H/316L/322M、10T/44L/92Y、10T/44L/92Y/217F/247N/271H/302Q/316L/392M、10T/44L/166S/302Q、10T/44L/206K/316L/322M、10T/47S/92Y/166S/271H/316L/337A、10T/47S/92Y/271H/302Q、10T/47S/92Y/316L/322M/392M、10T/47S/166S/271H、10T/47S/166S/316L、10T/92Y/166S、10T/92Y/166S/217F/247N/261A/271H、10T/92Y/166S/261A/271H/392M、10T/92Y/166S/261A/316L/322M/337A、10T/92Y/166S/337A/368W、10T/92Y/302Q/337A、10T/92Y/316L/322M、10T/206K、10T/206K/247N/261A、10T/217F/322M、10T/261A、10T/261A/337A/392M、10T/316L/392M、10T/368W、39M/44L/47S/92Y/166S/206K/392M、39M/44L/47S/92Y/206K/247N/261A、39M/44L/47S/92Y/206K/392M、39M/44L/47S/206K/337A/368W/392M、39M/44L/92Y/166S/247N/261A/302Q/337A、39M/44L/166S/271H、39M/44L/166S/271H/337A/368W/392M、39M/47S/92Y/316L/322M、39M/47S/92Y/392M、39M/47S/166S/217F/261A/392M、39M/47S/217F/247N/368W、39M/47S/247N、39M/92Y/166S/217F/392M、39M/92Y/261A/302Q、39M/166S/217F/261A/316L/368W、39M/322M、39M/392M、44L/47S、44L/47S/92Y/217F/271H、44L/47S/92Y/217F/316L/322M/392M、44L/47S/92Y/392M、44L/47S/166S、44L/47S/166S/271H、44L/47S/247N/271H/392M、44L/316L/322M/392M、44L/337A、47S/166S/206K/217F/247N/337A、47S/166S/217F/271H/337A、47S/206K、47S/217F/247N/261A、47S/271H、52N/217F/302Q/316L、92Y/166S/206K/271H/316L、92Y/166S/217F/261A/271H/392M、92Y/166S/217F/316L/337A/392M、92Y/166S/247N、92Y/166S/316L、92Y/206K/322M、92Y/217F、92Y/217F/271H/337A、92Y/261A/271H、92Y/271H、166S/217F/316L/322M/337A、166S/247N/271H/316L、166S/316L/322M/337A、206K/217F、217F/392M、247N/316L、316L/322M/368W和316L/337A/392M，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10T/K36M/H92Y/P166S/D247N/G261A/D316L/T392M、P10T/E39M、P10T/E39M/R44L/T47S/H92Y/A206K/R217F、P10T/E39M/R44L/T47S/D316L、P10T/E39M/R44L/T47S/P337A、P10T/E39M/R44L/H92Y/P166S/G261A/D316L/I322M、P10T/E39M/R44L/H92Y/P166S/K302Q/I322M、P10T/E39M/R44L/H92Y/P166S/T392M、P10T/E39M/R44L/H92Y/R217F/K302Q/I322M、P10T/E39M/R44L/H92Y/K302Q/I322M、P10T/E39M/R44L/P166S/G261A/A271H/D316L/I322M、P10T/E39M/R44L/T392M、P10T/E39M/T47S/H92Y/P337A、P10T/E39M/H92Y/W131G/P166S/A271H/D316L/I322M、P10T/E39M/H92Y/P166S/R217F/D247N/A271H、P10T/E39M/H92Y/R217F/D316L、P10T/R44L/T47S/P166S/G261A/A271H、P10T/R44L/T47S/P166S/A271H/I322M/A368W、P10T/R44L/T47S/R217F/A271H/D316L/I322M、P10T/R44L/H92Y、P10T/R44L/H92Y/R217F/D247N/A271H/K302Q/D316L/T392M、P10T/R44L/P166S/K302Q、P10T/R44L/A206K/D316L/I322M、P10T/T47S/H92Y/P166S/A271H/D316L/P337A、P10T/T47S/H92Y/A271H/K302Q、P10T/T47S/H92Y/D316L/I322M/T392M、P10T/T47S/P166S/A271H、P10T/T47S/P166S/D316L、P10T/H92Y/P166S、P10T/H92Y/P166S/R217F/D247N/G261A/A271H、P10T/H92Y/P166S/G261A/A271H/T392M、P10T/H92Y/P166S/G261A/D316L/I322M/P337A、P10T/H92Y/P166S/P337A/A368W、P10T/H92Y/K302Q/P337A、P10T/H92Y/D316L/I322M、P10T/A206K、P10T/A206K/D247N/G261A、P10T/R217F/I322M、P10T/G261A、P10T/G261A/P337A/T392M、P10T/D316L/T392M、P10T/A368W、E39M/R44L/T47S/H92Y/P166S/A206K/T392M、E39M/R44L/T47S/H92Y/A206K/D247N/G261A、E39M/R44L/T47S/H92Y/A206K/T392M、E39M/R44L/T47S/A206K/P337A/A368W/T392M、E39M/R44L/H92Y/P166S/D247N/G261A/K302Q/P337A、E39M/R44L/P166S/A271H、E39M/R44L/P166S/A271H/P337A/A368W/T392M、E39M/T47S/H92Y/D316L/I322M、E39M/T47S/H92Y/T392M、E39M/T47S/P166S/R217F/G261A/T392M、E39M/T47S/R217F/D247N/A368W、E39M/T47S/D247N、E39M/H92Y/P166S/R217F/T392M、E39M/H92Y/G261A/K302Q、E39M/P166S/R217F/G261A/D316L/A368W、E39M/I322M、E39M/T392M、R44L/T47S、R44L/T47S/H92Y/R217F/A271H、R44L/T47S/H92Y/R217F/D316L/I322M/T392M、R44L/T47S/H92Y/T392M、R44L/T47S/P166S、R44L/T47S/P166S/A271H、R44L/T47S/D247N/A271H/T392M、R44L/D316L/I322M/T392M、R44L/P337A、T47S/P166S/A206K/R217F/D247N/P337A、T47S/P166S/R217F/A271H/P337A、T47S/A206K、T47S/R217F/D247N/G261A、T47S/A271H、D52N/R217F/K302Q/D316L、H92Y/P166S/A206K/A271H/D316L、H92Y/P166S/R217F/G261A/A271H/T392M、H92Y/P166S/R217F/D316L/P337A/T392M、H92Y/P166S/D247N、H92Y/P166S/D316L、H92Y/A206K/I322M、H92Y/R217F、H92Y/R217F/A271H/P337A、H92Y/G261A/A271H、H92Y/A271H、P166S/R217F/D316L/I322M/P337A、P166S/D247N/A271H/D316L、P166S/D316L/I322M/P337A、A206K/R217F、R217F/T392M、D247N/D316L、D316L/I322M/A368W和D316L/P337A/T392M，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:704具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：2、4、5、24/59、24/143/144、24/143/202/333、24/143/202/352/390/391、24/143/333/352/387/390/391、24/143/390/391、24/202、24/202/271、24/202/333/352、24/271/352、24/352/387/390/391、24/387/391、31、40、59、59/143、59/143/202、59/143/202/271/333、59/143/271、59/143/333、59/202、59/202/333、59/271/387/390、73、76、80、83、84、91/215/361、122、123、143、143/202、143/271、143/271/352/390、143/333、143/333/387/390、143/387/391、147、155、164、165、179、186、202、202/333、210、215/218、218、218/361、218/361/398、218/398、246、254/398、271、271/333、271/333/390/391、271/333/391、271/352/391、273、275、277、278、280、281、283、284、287、300、303、304、325、331、332、333/352、333/390/391、333/391、334、335、336、338、339、340、341、343、359、360、361、362、367、369、371、373、375、377、382、382/398、385、387/391、390和398，其中所述多肽序列的氨基酸位置参考SEQ ID NO:704来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:704具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：2S、4L、5M、5V、24S/59A、24S/143S/144N、24S/143S/202N/333N、24S/143S/202N/352N/390N/391N、24S/143S/333N/352N/387N/390T/391N、24S/143S/390T/391N、24S/202N、24S/202N/271N、24S/202N/333N/352N、24S/271N/352N、24S/352N/387N/390N/391N、24S/387N/391N、31F、31H、31L、31T、31W、40Q、59A、59A/143S、59A/143S/271N、59A/202N、59T、59T/143S/202N、59T/143S/333N、59T/202N/333N、59V/143S/202N/271N/333N、59V/271N/387N/390T、73A、76A、76F、76M、76S、80T、83R、83S、84G、84K、84R、91S/215S/361T、122E、122N、122S、123Q、123R、123S、123T、143S、143S/202N、143S/271N、143S/271N/352N/390N、143S/333N、143S/333N/387N/390T、143S/387N/391N、147L、147S、155A、155D、155F、155L、155R、155T、164E、165I、179H、179L、179R、179W、186E、186F、186M、186P、186R、186S、186Y、202N、202N/333N、210I、215S/218Y、218Y、218Y/361T、218Y/361T/398F、218Y/398F、246Y、254T/398F、271N、271N/333N、271N/333N/390N/391N、271N/333N/391N、271N/352N/391N、273L、275A、275G、277Q、277V、278N、278R、278S、280G、281I、281M、283L、283P、283T、283V、284A、284E、284G、284L、284M、284R、284S、287R、300F、303A、303C、303W、304T、304V、304W、325A、331M、332G、332H、333N/352N、333N/390N/391N、333N/390S/391N、333N/391N、334C、334V、335A、335L、336F、336G、336S、336T、338L、339G、339N、339Q、339V、340H、340I、340K、340M、340P、340W、341F、341M、343L、343R、343S、343W、359F、359L、359R、360H、360V、361T、361V、362H、367A、367D、367L、367M、369D、371G、373L、373S、375L、375Q、377Q、382I、382I/398F、385R、387N/391N、390S和398F，其中所述多肽序列的氨基酸位置参考SEQ ID NO:704来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:704具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：D2S、G4L、L5M、L5V、D24S/C59A、D24S/C143S/D144N、D24S/C143S/D202N/G333N、D24S/C143S/D202N/F352N/M390N/Q391N、D24S/C143S/G333N/F352N/E387N/M390T/Q391N、D24S/C143S/M390T/Q391N、D24S/D202N、D24S/D202N/A271N、D24S/D202N/G333N/F352N、D24S/A271N/F352N、D24S/F352N/E387N/M390N/Q391N、D24S/E387N/Q391N、S31F、S31H、S31L、S31T、S31W、E40Q、C59A、C59A/C143S、C59A/C143S/A271N、C59A/D202N、C59T、C59T/C143S/D202N、C59T/C143S/G333N、C59T/D202N/G333N、C59V/C143S/D202N/A271N/G333N、C59V/A271N/E387N/M390T、G73A、Q76A、Q76F、Q76M、Q76S、Q80T、P83R、P83S、H84G、H84K、H84R、N91S/T215S/R361T、D122E、D122N、D122S、I123Q、I123R、I123S、I123T、C143S、C143S/D202N、C143S/A271N、C143S/A271N/F352N/M390N、C143S/G333N、C143S/G333N/E387N/M390T、C143S/E387N/Q391N、E147L、E147S、H155A、H155D、H155F、H155L、H155R、H155T、G164E、R165I、P179H、P179L、P179R、P179W、T186E、T186F、T186M、T186P、T186R、T186S、T186Y、D202N、D202N/G333N、S210I、T215S/N218Y、N218Y、N218Y/R361T、N218Y/R361T/L398F、N218Y/L398F、W246Y、A254T/L398F、A271N、A271N/G333N、A271N/G333N/M390N/Q391N、A271N/G333N/Q391N、A271N/F352N/Q391N、S273L、Q275A、Q275G、K277Q、K277V、A278N、A278R、A278S、L280G、Q281I、Q281M、K283L、K283P、K283T、K283V、D284A、D284E、D284G、D284L、D284M、D284R、D284S、A287R、L300F、G303A、G303C、G303W、D304T、D304V、D304W、R325A、P331M、R332G、R332H、G333N/F352N、G333N/M390N/Q391N、G333N/M390S/Q391N、G333N/Q391N、Y334C、Y334V、T335A、T335L、I336F、I336G、I336S、I336T、V338L、A339G、A339N、A339Q、A339V、S340H、S340I、S340K、S340M、S340P、S340W、L341F、L341M、K343L、K343R、K343S、K343W、V359F、V359L、V359R、K360H、K360V、R361T、R361V、K362H、E367A、E367D、E367L、E367M、T369D、R371G、R373L、R373S、H375L、H375Q、N377Q、V382I、V382I/L398F、Q385R、E387N/Q391N、M390S和L398F，其中所述多肽序列的氨基酸位置参考SEQ ID NO:704来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、39、44、47、92、166、206、217、247、261、271、302、316、322、337、368和392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10A、10C、10D、10E、10F、10G、10H、10I、10K、10L、10M、10N、10Q、10R、10S、10T、10V、10W、10Y、39A、39C、39D、39F、39G、39H、39I、39K、39L、39M、39N、39P、39Q、39R、39S、39T、39V、39W、39Y、44A、44C、44D、44E、44F、44G、44H、44I、44K、44L、44N、44P、44Q、44S、44T、44V、44W、44Y、47A、47C、47D、47E、47F、47G、47H、47I、47K、47L、47M、47N、47P、47Q、47R、47S、47V、47W、47Y、92A、92C、92D、92E、92F、92G、92I、92K、92L、92M、92N、92P、92Q、92R、92S、92T、92V、92W、92Y、166A、166C、166D、166E、166F、166G、166H、166I、166K、166L、166M、166N、166Q、166R、166S、166T、166V、166W、166Y、206C、206D、206E、206F、206G、206H、206I、206K、206L、206M、206N、206P、206Q、206R、206S、206T、206V、206W、206Y、217A、217C、217D、217E、217F、217G、217H、217I、217K、217L、217M、217N、217P、217Q、217S、217T、217V、217W、217Y、247A、247C、247E、247F、247G、247H、247I、247K、247L、247M、247N、247P、247Q、247R、247S、247T、247V、247W、247Y、261A、261C、261D、261E、261F、261H、261I、261K、261L、261M、261N、261P、261Q、261R、261S、261T、261V、261W、261Y、271C、271D、271E、271F、271G、271H、271I、271K、271L、271M、271N、271P、271Q、271R、271S、271T、271V、271W、271Y、302A、302C、302D、302E、302F、302G、302H、302I、302L、302M、302N、302P、302Q、302R、302S、302T、302V、302W、302Y、316A、316C、316E、316F、316G、316H、316I、316K、316L、316M、316N、316P、316Q、316R、316S、316T、316V、316W、316Y、322A、322C、322D、322E、322F、322G、322H、322K、322L、322M、322N、322P、322Q、322R、322S、322T、322V、322W、322Y、337A、337C、337D、337E、337F、337G、337H、337I、337K、337L、337M、337N、337Q、337R、337S、337T、337V、337W、337Y、368C、368D、368E、368F、368G、368H、368I、368K、368L、368M、368N、368P、368Q、368R、368S、368T、368V、368W、368Y、392A、392C、392D、392E、392F、392G、392H、392I、392K、392L、392M、392N、392P、392Q、392R、392S、392V、392W和392Y，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10A、P10C、P10D、P10E、P10F、P10G、P10H、P10I、P10K、P10L、P10M、P10N、P10Q、P10R、P10S、P10T、P10V、P10W、P10Y、E39A、E39C、E39D、E39F、E39G、E39H、E39I、E39K、E39L、E39M、E39N、E39P、E39Q、E39R、E39S、E39T、E39V、E39W、E39Y、R44A、R44C、R44D、R44E、R44F、R44G、R44H、R44I、R44K、R44L、R44N、R44P、R44Q、R44S、R44T、R44V、R44W、R44Y、T47A、T47C、T47D、T47E、T47F、T47G、T47H、T47I、T47K、T47L、T47M、T47N、T47P、T47Q、T47R、T47S、T47V、T47W、T47Y、H92A、H92C、H92D、H92E、H92F、H92G、H92I、H92K、H92L、H92M、H92N、H92P、H92Q、H92R、H92S、H92T、H92V、H92W、H92Y、P166A、P166C、P166D、P166E、P166F、P166G、P166H、P166I、P166K、P166L、P166M、P166N、P166Q、P166R、P166S、P166T、P166V、P166W、P166Y、A206C、A206D、A206E、A206F、A206G、A206H、A206I、A206K、A206L、A206M、A206N、A206P、A206Q、A206R、A206S、A206T、A206V、A206W、A206Y、R217A、R217C、R217D、R217E、R217F、R217G、R217H、R217I、R217K、R217L、R217M、R217N、R217P、R217Q、R217S、R217T、R217V、R217W、R217Y、D247A、D247C、D247E、D247F、D247G、D247H、D247I、D247K、D247L、D247M、D247N、D247P、D247Q、D247R、D247S、D247T、D247V、D247W、D247Y、G261A、G261C、G261D、G261E、G261F、G261H、G261I、G261K、G261L、G261M、G261N、G261P、G261Q、G261R、G261S、G261T、G261V、G261W、G261Y、A271C、A271D、A271E、A271F、A271G、A271H、A271I、A271K、A271L、A271M、A271N、A271P、A271Q、A271R、A271S、A271T、A271V、A271W、A271Y、K302A、K302C、K302D、K302E、K302F、K302G、K302H、K302I、K302L、K302M、K302N、K302P、K302Q、K302R、K302S、K302T、K302V、K302W、K302Y、D316A、D316C、D316E、D316F、D316G、D316H、D316I、D316K、D316L、D316M、D316N、D316P、D316Q、D316R、D316S、D316T、D316V、D316W、D316Y、I322A、I322C、I322D、I322E、I322F、I322G、I322H、I322K、I322L、I322M、I322N、I322P、I322Q、I322R、I322S、I322T、I322V、I322W、I322Y、P337A、P337C、P337D、P337E、P337F、P337G、P337H、P337I、P337K、P337L、P337M、P337N、P337Q、P337R、P337S、P337T、P337V、P337W、P337Y、A368C、A368D、A368E、A368F、A368G、A368H、A368I、A368K、A368L、A368M、A368N、A368P、A368Q、A368R、A368S、A368T、A368V、A368W、A368Y、T392A、T392C、T392D、T392E、T392F、T392G、T392H、T392I、T392K、T392L、T392M、T392N、T392P、T392Q、T392R、T392S、T392V、T392W和T392Y，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:1022具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、10/392、31、31/39/44/166/302、31/47、31/283/284、39、39/44、39/44/47、39/44/47/261/283/284、39/44/283、39/44/339、39/47/261、39/92、39/206、39/284、44、44/284/302、84、84/92、84/284/302/392、84/316、84/368/392、92、92/206/217、92/206/275、92/206/284、92/206/302/368、92/271、92/271/277、92/275/284、92/283、92/283/392、92/284、92/302、92/316、92/368、155、155/217、155/368、166、166/283/284、166/302、206、206/217、206/334、261、261/283、271、271/368、275、283、283/284、283/392、284、302、316、334、339、368、368/392和392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:1022来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:1022具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10G、P10G/T392D、S31T、S31T/E39V/R44V/P166D/K302Y、S31T/T47R、S31T/K283L/D284A、E39L、E39L/H92V、E39L/A206E、E39L/D284S、E39V/R44V、E39V/R44V/T47R、E39V/R44V/T47R/G261S/K283L/D284A、E39V/R44V/K283T、E39V/R44V/A339N、E39V/T47R/G261S、R44V、R44V/D284E/K302Y、H84K、H84K/H92V、H84K/D284S/K302L/T392A、H84K/D316H、H84K/A368E/T392A、H92Q、H92T、H92T/A206E/R217N、H92T/A206E/K302T/A368E、H92T/A271K、H92T/A271K/K277R、H92T/K283P、H92T/K283V/T392W、H92T/D284M、H92T/K302L、H92T/A368E、H92V、H92V/A206E/D284S、H92V/A206Y/Q275A、H92V/Q275A/D284S、H92V/D284S、H92V/K302L、H92V/D316H、H155F、H155F/R217I、H155F/A368E、P166D、P166D/K283L/D284A、P166D/K302Y、A206E、A206E/R217N、A206I、A206Q、A206T/Y334C、A206Y、G261S、G261S/K283L、A271K、A271K/A368E、Q275A、K283L、K283P/T392W、K283T、K283T/D284E、D284E、D284M、D284S、K302L、K302Y、D316H、Y334C、A339N、A368E、A368E/T392W、T392A、T392D和T392W，其中所述多肽序列的氨基酸位置参考SEQ ID NO:1022来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:1022具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10G、10G/392D、31T、31T/39V/44V/166D/302Y、31T/47R、31T/283L/284A、39L、39L/92V、39L/206E、39L/284S、39V/44V、39V/44V/47R、39V/44V/47R/261S/283L/284A、39V/44V/283T、39V/44V/339N、39V/47R/261S、44V、44V/284E/302Y、84K、84K/92V、84K/284S/302L/392A、84K/316H、84K/368E/392A、92Q、92T、92T/206E/217N、92T/206E/302T/368E、92T/271K、92T/271K/277R、92T/283P、92T/283V/392W、92T/284M、92T/302L、92T/368E、92V、92V/206E/284S、92V/206Y/275A、92V/275A/284S、92V/284S、92V/302L、92V/316H、155F、155F/217I、155F/368E、166D、166D/283L/284A、166D/302Y、206E、206E/217N、206I、206Q、206T/334C、206Y、261S、261S/283L、271K、271K/368E、275A、283L、283P/392W、283T、283T/284E、284E、284M、284S、302L、302Y、316H、334C、339N、368E、368E/392W、392A、392D和392W，其中所述多肽序列的氨基酸位置参考SEQ ID NO:1022来编号。

在一些实施方案中，本发明的α半乳糖苷酶A在表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中提供的至少一个位置中包含至少一个突变，其中所述位置参考SEQ ID NO:2或如表中所示的另一参考序列来编号。在一些另外的实施方案中，重组α半乳糖苷酶A源自人类α半乳糖苷酶A。在一些另外的实施方案中，重组α半乳糖苷酶A包含SEQ ID NO:8、58、158、372、374、704和/或1022的多肽序列。

在一些实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A更具热稳定性。在一些另外的实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A在pH7更稳定。在又一些另外的实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A在pH4更稳定。在还一些另外的实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A在pH7更稳定且在pH4更稳定。在还另外的实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A对暴露于血清更稳定。在一些另外的实施方案中，重组α半乳糖苷酶A比SEQ IDNO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A更具溶酶体稳定性。在又一些另外的实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A更容易被细胞摄取。在一些另外的实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A从细胞中消耗更多球形三酰神经酰胺。在又一些另外的实施方案中，重组α半乳糖苷酶A与SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A相比表现出提高的向细胞中的摄取。在一些另外的实施方案中，重组α半乳糖苷酶A比SEQ ID NO:2、8、58、158、372、374、704和/或1022的α半乳糖苷酶A免疫原性更少。在一些另外的实施方案中，重组α半乳糖苷酶A与参考序列相比表现出至少一种选自以下的改进的特性：i)催化活性增强；ii)对pH7的耐受性增加；iii)对pH4的耐受性增加；iv)对血清的耐受性增加；v)向细胞中的摄取提高；vi)免疫原性降低；或vii)从细胞中消耗球形三酰神经酰胺增加；或i)、ii)、iii)、iv)、v)、vi)或vii)的任何组合。在一些实施方案中，参考序列为SEQ ID NO:2、8、58、158、372、374、704和/或1022。在一些另外的实施方案中，重组α半乳糖苷酶A是纯化的。

本发明还提供了编码至少一种本文(例如，在表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中)提供的重组α半乳糖苷酶A的重组多核苷酸序列。在一些实施方案中，多核苷酸序列选自DNA、RNA和mRNA。在一些实施方案中，重组多核苷酸序列是密码子优化的。

本发明还提供了包含编码至少一种本文(例如，表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1)提供的重组α半乳糖苷酶A的重组多核苷酸序列的表达载体。在一些实施方案中，重组多核苷酸序列可操作地连接至控制序列。在一些另外的实施方案中，控制序列是启动子。在一些另外的实施方案中，启动子是异源启动子。在一些实施方案中，表达载体还包含如本文所提供的信号序列。

本发明还提供了包含至少一种本文提供的表达载体的宿主细胞。在一些实施方案中，宿主细胞包含表达载体，该表达载体包含编码至少一种本文(例如，表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1)提供的重组α半乳糖苷酶A的重组多核苷酸序列。在一些实施方案中，宿主细胞选自真核细胞和原核细胞。在一些实施方案中，宿主细胞为真核细胞。在一些另外的实施方案中，宿主细胞为哺乳动物细胞。

本发明还提供了产生α半乳糖苷酶A变体的方法，该方法包括在产生由重组多核苷酸编码的α半乳糖苷酶A的条件下培养本文提供的宿主细胞。在一些实施方案中，该方法还包括回收α半乳糖苷酶A的步骤。在一些另外的实施方案中，该方法还包括纯化α半乳糖苷酶A的步骤。本发明还提供了包含至少一种本文(例如，表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1)提供的重组α半乳糖苷酶A的组合物。在一些实施方案中，本发明提供了药物组合物。在一些实施方案中，本发明提供了包含至少一种本文提供的重组多核苷酸的药物组合物。在一些另外的实施方案中，本发明提供了用于治疗法布里病的药物组合物，该药物组合物包含本文提供的酶组合物。在一些实施方案中，药物组合物还包含药学上可接受的载体和/或赋形剂。在一些另外的实施方案中，药物组合物适于向人类胃肠外注射或输注。

本发明还提供了用于治疗和/或预防受试者的法布里病症状的方法，该方法包括提供患有法布里病的受试者，并提供至少一种药物组合物，该药物组合物包含至少一种本文(例如，表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1)提供的重组α半乳糖苷酶A，并向受试者施用该药物组合物。在一些实施方案中，受试者的法布里病症状得到改善。在一些另外的实施方案中，施用了本发明的药物组合物的受试者能够食用脂肪含量比表现出法布里病症状的受试者所需的饮食限制更少的饮食。在一些实施方案中，受试者是婴儿或儿童，而在一些可选的实施方案中，受试者是成年人或年轻成人。

本发明还提供了本文提供的组合物的用途。

附图简述

图1提供了示出在温度30-50℃孵育1小时后GLA变体的相对活性的图。

图2提供了示出在37℃用人类血清挑战0-24小时后GLA变体的相对活性的图。

图3提供了示出在37℃用人类溶酶体提取物挑战0-24小时后GLA变体的相对活性的图。

图4提供了示出不同的纯化GLA变体的细胞摄取的图，表示为在37℃与培养的法布里病患者成纤维细胞一起孵育4小时后与野生型相比的相对活性。

图5提供了示出在施用后1周、2周和4周，与SEQ ID NO:2相比，GLA变体在法布里病小鼠心脏中的活性的图。

图6提供了示出用GLA变体处理的法布里病小鼠在施用后1周和2周心脏中的残余Gb₃的图。

图7提供了示出用人类血清挑战0-24hr后GLA变体的残余活性的图。

图8提供了示出培养的法布里病患者成纤维细胞在37℃孵育4小时和3天消耗(washout)后对纯化的GLA变体的细胞摄取的图。

图9提供了示出最后一次处理后7天法布里病小鼠模型的心脏中体内酶活性的图。

图10提供了示出最后一次处理后7天法布里病小鼠模型的肾中体内酶活性的图。

图11提供了示出心脏组织中Gb3降解的图。

图12提供了示出肾组织中Gb3降解的图。

图13提供了示出心脏组织中溶酶体-Gb3降解的图。

图14提供了示出肾组织中溶酶体-Gb3降解的图。

发明描述

本发明提供了工程化人类α半乳糖苷酶多肽及其组合物。该工程化人类α半乳糖苷酶多肽已经被优化，以提供提高的热稳定性、血清稳定性、提高的细胞摄取、以及在酸性(pH<4)和碱性(pH>7)条件下的稳定性、降低的免疫原性和改进的球形三酰神经酰胺从细胞中的去除。本发明还涉及包含该工程化人类α半乳糖苷酶多肽的组合物用于治疗目的的用途。

在一些实施方案中，工程化人类α半乳糖苷酶多肽已经被优化以提供提高的细胞摄取，同时保持稳定性。本发明还涉及包含该工程化人类α半乳糖苷酶多肽的组合物用于治疗目的的用途。

在一些情况下，用于治疗法布里病的酶替换疗法(例如，

agalsidaseβ；Genzyme)被考虑用于合格的个人。目前使用的酶替换疗法是重组表达形式的野生型人类GLA。已知，静脉施用的GLA循环，通过受体(主要是甘露糖6-磷酸受体(M6PR))介导的内吞作用被摄取到细胞中，并运送至靶器官的内吞体/溶酶体，在内吞体/溶酶体中GLA清除积累的Gb3。这些药物不能完全缓解患者症状，因为神经性疼痛和短暂缺血发作以降低的比率继续发生。此外，与高度血管化且富含M6PR的肝相比，大多数靶器官对GLA的摄取较差，并且该酶在血液和溶酶体的pH不稳定。因此，可用的治疗仍然存在问题。此外，患者可能会产生免疫应答(靶向所施用的药物的IgG和IgE抗体)，并遭受严重的变态(过敏性)反应、严重的输注反应以及甚至死亡。本发明意图提供适用于治疗法布里病的更稳定且有效的酶，但与目前可用的治疗相比，具有减少的副作用和改善的结果。实际上，本发明意图提供在引入血流时酶遇到的血液(pH7.4)中具有增加的稳定性的重组GLA酶。此外，该酶在溶酶体的pH(pH 4.3)具有增加的稳定性，溶酶体是该酶在治疗过程中有活性的位置。因此，在人类HEK293T细胞中重组表达的人类GLA的定向演化(采用不同酶变体文库的高通量筛选)用于提供具有保持的稳定性特性、改进的球形三酰神经酰胺清除和细胞摄取的新型GLA变体。在一些实施方案中，GLA变体表现出降低的免疫原性。

缩写和定义：

除非另外定义，否则本文使用的所有技术术语和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常，本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学中的实验程序是本领域熟知的并且普遍地采用的那些。这样的技术是熟知的，并且在本领域技术人员熟知的许多教科书和参考著作中进行了描述。对于化学合成和化学分析使用了标准技术或其修改形式。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物，在此通过引用明确并入本文。

尽管本发明的实践中可使用与本文描述的方法和材料类似或等同的任何合适的方法和材料，但本文也描述了一些方法和材料。应理解本发明不限于所描述的特定方法、方案和试剂，因为这些可以根据本领域技术人员使用它们的情况而改变。因此，下文即将定义的术语通过参考本申请作为整体而被更充分地描述。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物，在此通过引用明确并入本文。

此外，如本文使用的，单数“一(a)”、“一(an)”和“所述/该(the)”包括复数指示物，除非上下文另外清楚地指示。

数值范围包括限定该范围的数字。因此，本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围，如同这样的较窄数值范围在本文被全部清楚地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制，如同这样的较低(或较高)数值限制在本文被清楚地写出。

术语“约”意指特定值的可接受误差。在一些实例中，“约”意指在给定值范围的0.05％、0.5％、1.0％或2.0％内。在一些实例中，“约”意指在给定值的1、2、3或4个标准偏差内。

此外，本文所提供的标题不是可以通过参考本申请作为整体而获取的本发明的各个方面或实施方案的限制。因此，下文即将定义的术语通过参考本申请作为整体而被更充分地定义。尽管如此，为了便于理解本发明，许多术语定义如下。

除非另外指示，否则，分别地，核酸以5'至3'方向从左到右书写；氨基酸序列以氨基至羧基方向从左至右书写。

如本文使用的，术语“包括(comprising)”及其同源词以其包括性意义使用(即，等同于术语“包括(including)”及其相应的同源词)。

如本文使用的，“EC”编号是指生物化学和分子生物学国际联合命名委员会(Nomenclature Committee ofthe International Union of Biochemistry andMolecular Biology)(NC-IUBMB)的酶命名法。该IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。

如本文使用的，“ATCC”是指美国典型培养物保藏中心(American Type CultureCollection)，其生物保藏收集物包括基因和菌株。

如本文使用的，“NCBI”是指美国国家生物技术信息中心(National Center forBiological Information)和其中提供的序列数据库。

“蛋白质”、“多肽”和“肽”在本文中可互换地使用，来表示通过酰胺键共价连接的至少两个氨基酸的聚合物，而不论长度或翻译后修饰(例如糖基化或磷酸化)。

“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文被提及。同样地，核苷酸可以通过其通常可接受的单字母代码被提及。用于遗传编码的氨基酸的缩写是常规的，并且如下：丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬酰胺(Asn或N)、天冬氨酸(Asp或D)、半胱氨酸(Cys或C)、谷氨酸(Glu或E)、谷氨酰胺(Gln或Q)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L)、赖氨酸(Lys或K)、甲硫氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。当使用三字母缩写时，除非前面具体地有“L”或“D”，或者从使用缩写的上下文清楚看出，否则氨基酸可以是关于α-碳(C_α)的L-构型或D-构型。例如，“Ala”表示丙氨酸而不指定关于α-碳的构型，而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当多肽序列以单字母或三字母缩写(或其混合)串呈现时，根据常规惯例将序列呈现为氨基(N)至羧基(C)方向。

用于遗传编码核苷的缩写是常规的并且如下：腺苷(A)；鸟苷(G)；胞苷(C)；胸苷(T)；和尿苷(U)。除非具体描述，否则缩写的核苷可以是核糖核苷或2’-脱氧核糖核苷。核苷可以单独地或总体地指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列以单字母缩写串呈现时，序列根据常规惯例呈现为5’至3’方向，并且不示出磷酸。

当提及细胞、多核苷酸或多肽使用时，术语“工程化”、“重组”、“非天然存在的”和“变体”是指如下材料或与该材料的天然或自然形式对应的材料：已经以自然界本来不存在的方式被修饰或与其相同但由合成材料产生或衍生和/或通过使用重组技术操作产生。

如本文使用的，“UTR”是指mRNA多核苷酸的非翻译区。在一些实施方案中，“5’非翻译区”或“5’UTR”被称为“前导序列”或“前导RNA”。该mRNA区域位于起始密码子的直接上游。在一些实施方案中，“3’非翻译区”或“3’UTR”是位于终止密码子直接下游的mRNA区域。在各种生物体(例如，原核生物、真核生物和病毒)中，这两个区域对于翻译调控和细胞内转运都是重要的。

如本文使用的，“野生型”、“WT”和“天然存在的”是指在自然界中发现的形式。例如，天然存在的或野生型多肽或多核苷酸序列为生物体中存在的序列，其可以从天然来源分离且未通过人为操纵被有意地修饰。

如本文使用的，“编码序列”是指核酸(例如基因)编码蛋白质的氨基酸序列的部分。

术语“序列同一性百分比(％)”在本文中用于指多核苷酸和多肽之间的比较，并通过比较比较窗中两条最佳比对的序列确定，其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包括添加或缺失(即，空位)，以用于两个序列的最佳比对。百分比可以通过如下计算：确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性百分比。可选择地，百分比可以通过如下计算：确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解，存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可以例如通过以下进行：通过Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981])，通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970])，通过Pearson和Lipman的相似性搜索方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988])，通过这些算法的计算机化实现(例如，GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)，或者通过目视检查，如本领域已知的。适合于确定序列同一性和序列相似性百分比的算法的实例包括但不限于BLAST和BLAST 2.0算法，由Altschul等人描述(分别参见Altschul等人,J.Mol.Biol.,215:403-410[1990]；和Altschul等人,1977,Nucleic Acids Res.,3389-3402[1977])。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP)，所述短字在与数据库序列中相同长度的字比对时匹配或满足某一正值的阀值评分T。T被称为邻近字评分阈值(参见，Altschul等人，上文)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列，累积评分使用参数M(用于匹配残基对的奖励评分；总是＞0)和N(用于错配残基的惩罚评分；总是＜0)计算。对于氨基酸序列，评分矩阵用于计算累积评分。在以下情况时，停止字击中在每一个方向的延伸：累积比对评分从其最大达到值下降了量X；由于累积了一个或更多个负评分残基比对，累积评分达到0或小于0；或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值：字长(W)为11、期望值(E)为10、M＝5、N＝-4、以及两条链的比较。对于氨基酸序列，BLASTP程序使用以下作为默认值：字长(W)为3，期望(E)为10和BLOSUM62评分矩阵(参见，Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与％序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys、Madison WI)中的BESTFIT或GAP程序，使用提供的默认参数。

如本文使用的，“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集，例如，全长基因或多肽序列的区段(segment)。通常，参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或者核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即，完整序列的一部分)，和(2)还可以包含两个序列之间不同的(divergent)序列，所以两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”中的序列以鉴定和比较局部区域的序列相似性来进行。在一些实施方案中，“参考序列”可以基于一级氨基酸序列(primary amino acid sequence)，其中参考序列是可以在一级序列中具有一个或更多个变化的序列。“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段，其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较，并且其中序列在比较窗中的部分与参考序列(其不包含添加或缺失)相比，可以包含20％或更少的添加或缺失(即，空位)以用于两个序列的最佳比对。比较窗可以比20个连续残基更长，并任选地包括30、40、50、100或更长的窗。

当在对给定氨基酸或多核苷酸序列进行编号的情况中使用时，“对应于”、“参考”和“相对于”是指当给定氨基酸或多核苷酸序列与参考序列相比较时对指定参考序列的残基进行编号。换言之，给定聚合物的残基编号或残基位置关于参考序列被指定，而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如，给定氨基酸序列，诸如工程化GLA的氨基酸序列可以通过引入空位以与参考序列对齐，来优化两个序列之间的残基匹配。在这些情况中，尽管存在空位，但对给定氨基酸或多核苷酸序列中的残基关于与其比对的参考序列进行编号。

如本文使用的，“氨基酸差异”和“残基差异”指在多肽序列的一个位置处氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。本文中氨基酸差异的位置通常被称为“Xn”，其中n是指残基差异所基于的参考序列中的对应位置。例如，“与SEQ ID NO:8相比，在位置X44处的残基差异”是指在对应于SEQ ID NO:8的位置44的多肽位置处的氨基酸残基的差异。因此，如果参考多肽SEQ ID NO:8在位置44处具有精氨酸，则“与SEQ ID NO:8相比，在位置X44处的残基差异”是指在对应于SEQ ID NO:8的位置44的多肽位置处除精氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下，在一个位置处的特定氨基酸残基差异指示为“XnY”，其中“Xn”指定如上文描述的对应位置，并且“Y”是在工程化多肽中发现的氨基酸(即，与参考多肽中的不同的残基)的单字母标识符。在一些情况下(例如，如表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和表13-1中示出的)，本公开内容还提供由常规符号“AnB”表示的特定氨基酸差异，其中A是参考序列中的残基的单字母标识符，“n”是在参考序列中的残基位置的编号，并且B是工程化多肽的序列中残基取代的单字母标识符。在一些情况下，本公开内容的多肽可以包含相对于参考序列的一个或更多个氨基酸残基差异，所述氨基酸残基差异由相对于参考序列存在残基差异的指定位置的列表指示。在一些实施方案中，当多于一个氨基酸可以在多肽的特定残基位置中使用时，可以使用的各种氨基酸残基由“/”分开(例如，X247D/X247N或X247D/N)。在一些实施方案中，酶变体包含多于一个取代。为了便于阅读，这些取代由斜线分开(例如，D24S/D202N)。本申请包括包含一个或更多个氨基酸差异的工程化多肽序列，所述一个或更多个氨基酸差异包括保守氨基酸取代和非保守氨基酸取代的任一种/或两者。

如本文使用的，“突变”是指多肽和多核苷酸序列的取代、插入、缺失和其他修饰。不意图本发明受限于任何特定类型的突变。

“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基，并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于，具有脂肪族侧链的氨基酸可以被另一种脂肪族氨基酸(例如，丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代；具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如，丝氨酸和苏氨酸)取代；具有芳香族侧链的氨基酸被另一种具有芳香族侧链的氨基酸(例如，苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代；具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如，赖氨酸和精氨酸)取代；具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如，天冬氨酸或谷氨酸)取代；和/或疏水氨基酸或亲水氨基酸分别被另一种疏水氨基酸或亲水氨基酸取代。

“非保守取代”是指用具有显著不同的侧链性质的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而不是之内的氨基酸，并且影响(a)取代区域中的肽骨架的结构(例如，脯氨酸取代甘氨酸)，(b)电荷或疏水性，或(c)侧链体积。例如但不限于，示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸；用小氨基酸取代芳香族氨基酸；和用疏水氨基酸取代亲水氨基酸。

如本文使用的，“缺失”是指通过从参考多肽去除一个或更多个氨基酸对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10％或多达氨基酸总数的20％，同时保留酶活性和/或保留工程化酶的改进的性质。缺失可以涉及多肽的内部部分和/或末端部分。在多种实施方案中，缺失可以包括连续的区段或可以是不连续的。

如本文使用的，“插入”是指通过将一个或更多个氨基酸添加到参考多肽对多肽进行的修饰。插入可以处于多肽的内部部分或者可以是插入到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由天然存在的多肽中的一个或更多个氨基酸分开。

“功能片段”和“生物活性片段”在本文中可互换使用以指这样的多肽：所述多肽具有氨基末端缺失和/或羧基末端缺失和/或内部缺失，但其中剩余的氨基酸序列与和它进行比较的序列(例如，本发明的全长工程化GLA)中的对应位置相同，并且保留全长多肽的基本上全部活性。

如本文使用的，“分离的多肽”是指与天然伴随其的其他污染物(例如蛋白质、脂质和多核苷酸)基本上分开的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如，宿主细胞或体外合成)中取出或纯化的多肽。重组GLA多肽可以存在于细胞内、存在于细胞培养基中，或以各种形式(诸如裂解物或分离的制品)制备。因此，在一些实施方案中，重组GLA多肽可以是分离的多肽。

如本文使用的，“基本上纯的多肽”是指如下组合物，在所述组合物中多肽物质是存在的主要物质(即，在摩尔或重量基础上，它比该组合物中的任何其他单独的大分子物质更丰富)，并且当目标物质构成存在的大分子物质的按摩尔或％重量计至少约50％时，通常是基本上纯化的组合物。通常，基本上纯的GLA组合物构成该组合物中存在的所有大分子物质的按摩尔或％重量计约60％或更多、约70％或更多、约80％或更多、约90％或更多、约95％或更多以及约98％或更多。在一些实施方案中，将目标物质纯化至基本同质(即，通过常规检测方法不能在组合物中检测出污染物物质)，其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中，分离的重组GLA多肽是基本上纯的多肽组合物。

如本文使用的，“改进的酶特性”是指与参考GLA多肽和/或野生型GLA多肽或另一种工程化GLA多肽相比，表现出任何酶特性的改进的工程化GLA多肽。改进的特性包括但不限于这样的特性，如增加的基因表达、增加的蛋白产量、增加的热活性、增加的热稳定性、在各种pH水平增加的活性、增加的稳定性、增加的酶活性、增加的底物特异性或亲和力、增加的比活性、增加的对底物和/或产物抑制的抗性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性、中性或碱性pH的耐受性、增加的对蛋白水解活性的耐受性(即，降低的对蛋白水解的敏感性)、减少的聚集、增加的溶解性、降低的免疫原性，改进的翻译后修饰(例如，糖基化)、改变的温度谱(temperature profile)、增加的细胞摄取、增加的溶酶体稳定性、增加的消耗细胞Gb3的能力、增加的从GLA产生细胞的分泌等。

如本文使用的，“增加的酶促活性”和“增强的催化活性”是指工程化GLA多肽的改进的特性，其可以被表示为与参考GLA酶相比，比活性(例如，产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如，使用指定量的GLA，在指定的时间段内，起始量的底物向产物的转化百分比)的增加。

确定酶活性的示例性方法在实施例中提供。与酶活性相关的任何特性都可以被影响，包括经典的酶特性K_m、V_max或k_cat，其改变可以导致酶促活性的增加。酶活性的改进可以是从对应野生型酶的酶促活性的约1.1倍至比天然存在的GLA或GLA多肽所源自的另一种工程化GLA的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶促活性。

在一些实施方案中，工程化GLA多肽具有以下的k_cat：至少0.1/sec、至少0.5/sec、至少1.0/sec、至少5.0/sec、至少10.0/sec，并且在一些优选的实施方案中大于10.0/sec。在一些实施方案中，K_m在约1μM至约5mM的范围内、在约5μM至约2mM的范围内、在约10μM至约2mM的范围内或在约10μm至约1mM的范围内。在一些特定实施方案中，在暴露于某些条件之后，工程化GLA酶与参考GLA酶(例如，野生型GLA或任何其它参考GLA，诸如SEQ ID NO:8)的酶促活性相比表现出1.5倍至10倍、1.5倍至25倍、1.5倍至50倍、1.5倍至100倍或更大的范围内的改进的酶促活性。GLA活性可以通过本领域已知的任何合适的方法来测量(例如，标准测定，例如监测反应物或产物的分光光度特性的变化)。在一些实施方案中，产生的产物的量可以通过高效液相色谱法(HPLC)分离结合UV吸光度或荧光检测来直接测量或在o-酞二醛(OPA)衍生化后测量。在一些实施方案中，产生的产物的量可以通过水解4-甲基伞形基-α-D-吡喃半乳糖苷(4-MUGal)分子后监测荧光(Ex.355nm，Em.460nm)来测量。酶活性的比较使用限定的酶制品、设定条件下的限定的测定和一种或更多种限定的底物来进行，如本文进一步详细描述的。通常，当比较裂解物时，确定细胞的数目和测定的蛋白的量，并使用相同表达系统和相同宿主细胞以使由宿主细胞产生并存在于裂解物中的酶的量的变化最小化。

如本文使用的，术语“提高的对酸性pH的耐受性”意指与参考GLA或另一种酶相比，根据本发明的重组GLA将具有增加的稳定性(在暴露于酸性pH指定的时间段(1小时，最多24小时)后，在约pH4.8保持更高的活性)。

如本文使用的，术语“提高的细胞摄取”意指与参考GLA(包括野生型GLA)或另一种酶相比，本文提供的重组GLA表现出增加的进入细胞的内吞作用。在一些实施方案中，细胞是培养的法布里病患者成纤维细胞(在与培养的细胞一起孵育指定的时间段后，与参考GLA或另一种酶相比，保持更高的细胞内活性)。在一些另外的实施方案中，与参考GLA(包括野生型GLA)或另一种酶相比，本文提供的重组GLA在与培养的细胞一起孵育指定的时间段后表现出更大的保持的细胞内活性。在一些另外的实施方案中，该时间段为约4小时，而在一些其他实施方案中，该时间段小于4小时(例如，1小时、2小时或3小时)，并且在一些可选的实施方案中，该时间段大于4小时(例如，5小时、6小时、7小时、8小时或更多小时)。

如本文使用的“生理pH”意指通常存在于受试者(例如，人类)的血液内的pH范围。

术语“碱性pH”(例如，用于述及提高的对碱性pH条件的稳定性或增加的对碱性pH的耐受性)意指约7至11的pH范围。

术语“酸性pH”(例如，用于述及提高的对酸性pH条件的稳定性或增加的对酸性pH的耐受性)意指约1.5至4.5的pH范围。

如本文使用的，“转化”是指底物向对应产物的酶促转化(或生物转化)。“转化百分比”是指在指定条件下在一定时间段内转化为产物的底物的百分比。因此，GLA多肽的“酶促活性”或“活性”可以表示为在指定的时间段内底物向产物的“转化百分比”。

如本文使用的，“杂交严格性”是指核酸杂交中的杂交条件，诸如洗涤条件。通常，杂交反应在较低严格性的条件下进行，随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件，所述互补核酸与靶DNA具有约60％同一性，优选地约75％同一性，约85％同一性，与靶多核苷酸具有大于约90％同一性。示例性中度严格条件是等同于在50％甲酰胺、5×Denhart溶液、5×SSPE、0.2％ SDS中在42℃杂交，随后在0.2×SSPE、0.2％ SDS中在42℃洗涤的条件。“高严格性杂交”通常是指与如对限定的多核苷酸序列在溶液条件下确定的热解链温度T_m相差约10℃或更小的条件。在一些实施方案中，高严格性条件是指仅允许在0.018MNaCl中在65℃形成稳定杂交体的那些核酸序列的杂交(即，如果杂交体在0.018MNaCl中在65℃是不稳定的，它在如本文预期的高严格性条件下是不稳定的)的条件。可以提供高严格性条件，例如，通过在等同于在50％甲酰胺、5×Denhart溶液、5×SSPE、0.2％ SDS在42℃的条件杂交，然后在0.1×SSPE和0.1％ SDS中在65℃洗涤提供。另一种高严格性条件是在等同于在含有0.1％(w:v)SDS的5X SSC中在65℃杂交的条件进行杂交和在含有0.1％ SDS的0.1×SSC中在65℃洗涤。其他高严格性杂交条件以及中度严格条件在上文引用的参考文献中描述。

如本文使用的，“密码子优化”是指编码蛋白的多核苷酸的密码子的改变，使得编码的蛋白在感兴趣的生物体和/或细胞中更有效地表达。尽管遗传密码是简并的，即大多数氨基酸由被称为“同义”(“synonyms”)或“同义”(“synonymous”)密码子的若干密码子表示，但熟知的是，特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言，这种密码子使用偏倚可能更高。在一些实施方案中，可以考虑GC含量、隐蔽剪接位点、转录终止信号、可能影响RNA稳定性的基序、和核酸二级结构以及任何其他感兴趣的因素，对编码GLA酶的多核苷酸进行密码子优化，用于从选择用于表达的宿主生物体和/或细胞类型中最佳产生。

如本文使用的，“控制序列”是指包括对本申请的多核苷酸和/或多肽的表达必要或有利的所有组分。每个控制序列对于编码多肽的核酸序列可以是天然的或外源的。这样的控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。在最小程度上，控制序列包括启动子和转录及翻译终止信号。控制序列可以与接头一起被提供，以用于引入促进控制序列与编码多肽的核酸序列的编码区的连接的特定限制性位点的目的。

如本文使用的，“可操作地连接”是指如下配置：在所述配置中控制序列被适当地放置(即，以功能关系)在相对于感兴趣的多核苷酸的位置处，使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。

如本文使用的，“启动子序列”是指被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列，包括突变体、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

如本文使用的，“合适的反应条件”是指在酶促转化反应溶液中的那些条件(例如，酶载量、温度、pH、缓冲液、共溶剂等的范围)，在该条件下本申请的GLA多肽能够将底物转化为期望的产物化合物。示例性的“合适的反应条件”被提供于本申请中并且通过实施例来说明。“酶载量”是指在反应开始时反应混合物中的组分的浓度或量。在酶促转化反应过程的上下文中，“底物”是指受GLA多肽作用的化合物或分子。在酶促转化过程的上下文中，“产物”是指由GLA多肽对底物的作用产生的化合物或分子。

如本文使用的术语“培养”是指微生物细胞、哺乳动物细胞或其他合适细胞的群体在任何合适的条件(例如，使用液体、凝胶或固体培养基)下的生长。

重组多肽可以使用本领域已知的任何合适方法产生。编码感兴趣的野生型多肽的基因可以被克隆到载体诸如质粒中，并在期望的宿主诸如大肠杆菌(E.coli)、酿酒酵母(S.cerevisiae)或哺乳动物细胞系(例如，HEK或CHO细胞)等中表达。重组多肽的变体可以通过本领域已知的各种方法产生。事实上，存在本领域技术人员熟知的各种各样不同的诱变技术。此外，诱变试剂盒还可从许多商业分子生物学供应商获得。方法可用于做出确定的氨基酸(定点)处的特定取代、基因的局部区域中的特异性(区域特异性)或随机突变，或整个基因内的随机诱变(例如，饱和诱变)。本领域的技术人员已知产生酶变体的许多合适的方法，包括但不限于，使用PCR对单链DNA或双链DNA定点诱变、盒式诱变、基因合成、易错PCR、改组和化学饱和诱变，或本领域已知的任何其他合适的方法。用于DNA和蛋白工程化的方法的非限制性实例在以下专利中提供：美国专利第6,117,679号；美国专利第6,420,175号；美国专利第6,376,246号；美国专利第6,586,182号；美国专利第7,747,391号；美国专利第7,747,393号；美国专利第7,783,428号和美国专利第8,383,346号。产生变体后，可以对它们筛选任何期望的特性(例如，高或增加的活性、或者低或减少的活性、增加的热活性、增加的热稳定性和/或酸性pH稳定性等)。在一些实施方案中，可使用“重组GLA多肽”(在本文中也称为“工程化GLA多肽”、“变体GLA酶”和“GLA变体”)。

如本文使用的，“载体”是用于将DNA序列引入到细胞中的DNA构建体。在一些实施方案中，载体是被可操作地连接至能够实现DNA序列中编码的多肽在合适宿主中的表达的合适的控制序列的表达载体。在一些实施方案中，“表达载体”具有可操作地连接至DNA序列(例如，转基因)以驱动在宿主细胞中表达的启动子序列，并且在一些实施方案中，还包含转录终止子序列。

如本文使用的，术语“基因治疗载体”是指适于向细胞递送多核苷酸序列的媒介物或载体。在一些实施方案中，载体封装用于递送至细胞或组织的基因(例如，治疗性基因)或多核苷酸序列，载体包括但不限于腺病毒(AV)、腺相关病毒(AAV)、慢病毒(LV)和非病毒载体，诸如脂质体。不意图本发明限于任何特定的基因治疗载体，因为任何适用于给定环境的媒介物都可使用。基因治疗载体可以被设计成将基因递送至特定物种或宿主，或者可具有更普遍的适用性。

如本文使用的，术语“表达”包括涉及多肽产生的任何步骤，包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中，该术语还包括多肽从细胞的分泌。

如本文使用的，术语“产生”是指由细胞产生蛋白和/或其他化合物。意图该术语涵盖参与多肽产生的任何步骤，包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中，该术语还包括多肽从细胞的分泌。

如本文使用的，如果氨基酸或核苷酸序列(例如，启动子序列、信号肽、终止子序列等)与它被可操作地连接的另一种序列在自然界中不是缔合的，则这两种序列是“重组”或“异源”的。

如本文使用的，术语“宿主细胞”和“宿主菌株”是指用于包含本文提供的DNA(例如，编码GLA变体的多核苷酸)的表达载体的合适的宿主。在一些实施方案中，宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。

术语“类似物”意指与参考多肽具有多于70％序列同一性，但少于100％序列同一性(例如，多于75％、78％、80％、83％、85％、88％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性)的多肽。在一些实施方案中，“类似物”意指含有一个或更多个非天然存在的氨基酸残基(包括但不限于高精氨酸、鸟氨酸和正缬氨酸)以及天然存在的氨基酸的多肽。在一些实施方案中，类似物还包括一个或更多个D-氨基酸残基和两个或更多个氨基酸残基之间的非肽键。

如本文使用的，术语“治疗剂”是指向显示出病理学迹象或症状的受试者施用的具有有益或期望的医学效应的化合物。

如本文使用的，术语“药物组合物”是指包含药学有效量的由本发明所包括的工程化GLA多肽和可接受的载体的适用于哺乳动物受试者(例如，人类)的药物用途的组合物。

如本文使用的，术语“基因疗法”是指用基因治疗载体将基因、多脱氧核糖核苷酸或多核苷酸序列递送至细胞或组织，用于修饰这些细胞或组织来治疗或预防疾病。基因疗法可以包括用基因的健康拷贝替换引起疾病的突变基因，或者使功能不正常的突变基因失活或“敲除”功能不正常的突变基因。在一些实施方案中，基因疗法用于治疗患者的疾病。

如本文使用的，术语“mRNA疗法”是指将mRNA多核糖核苷酸序列递送至细胞或组织，用于修饰这些细胞或组织来治疗或预防疾病。在一些实施方案中，用于递送至细胞或组织的mRNA多核苷酸序列被配制在例如但不限于脂质体中。在一些实施方案中，mRNA疗法用于治疗患者的疾病。

如本文使用的，术语“细胞疗法”是指将外源修饰的活细胞递送至患者，以提供缺失的基因来治疗或预防疾病。然后，将修饰的细胞重新引入体内。

如本文使用的，术语“有效量”意指足以产生期望的结果的量。本领域普通技术人员可以通过使用常规实验确定有效量是多少。

术语“分离的”和“纯化的”在本文中用于指从与其天然缔合的至少一种其他组分取出的分子(例如，分离的核酸、多肽等)或其他组分。术语“纯化的”不要求绝对纯度，而是意图作为相对定义。

如本文使用的，术语“受试者”包括哺乳动物，诸如人类、非人灵长目动物、家畜、宠物和实验动物(例如，啮齿动物和兔形目动物)。意图的是该术语包括雌性以及雄性。

如本文所用，术语“患者”意指正在被评估、治疗或正在经历疾病的任何受试者。

术语“婴儿”是指在出生之后第一个月至约一(1)岁的时期内的儿童。如本文使用的，术语“新生儿”是指在从出生至生命的第28天的时期内的儿童。术语“早产婴儿”是指妊娠第二十个完整周之后但在妊娠期满之前出生的婴儿，通常在出生时称重～500至～2499克。“极低出生体重婴儿”是在出生时称重少于1500g的婴儿。

如本文使用的，术语“儿童”是指对于同意治疗或研究程序未达到法定年龄的人。在一些实施方案中，该术语是指在出生和青春期的时期之间的人。

如本文使用的，术语“成人”是指对于相关司法权已经达到法定年龄的人(例如，在美国为18岁)。在一些实施方案中，该术语是指任何完全发育成熟的生物体。在一些实施方案中，术语“青年”是指小于18岁但已经达到性成熟的人。

如本文使用的，“组合物”和“制剂”包括意图用于任何适合的用途的包含本发明的至少一种工程化GLA的产物(例如，药物组合物、膳食/营养补充物、饲料等)。

如本文使用的，术语“施用(administration)”和“施用(administering)”组合物意指向受试者(例如，遭受法布里病效果的人)提供本发明的组合物。

如本文使用的，当提及药物组合物使用时，术语“载体”意指标准药物载体，缓冲液和赋形剂诸如稳定剂、防腐剂和佐剂中的任一种。

如本文使用的，术语“药学上可接受的”意指可以向受试者施用而不引起任何不良生物效应或以有害的方式与在其中它被包含的组分的任何一种相互作用并且拥有期望的生物活性的材料。

如本文使用的，术语“赋形剂”是指任何药学上可接受的添加剂、载体、稀释剂、佐剂或其他成分，而不是活性药物成分(API；例如，本发明的工程化GLA多肽)。赋形剂通常被包括以用于制剂和/或施用目的。

如本文使用的，当提及疾病/状况的症状使用时，术语“治疗有效量”是指改善、减弱或消除疾病/状况的一种或更多种症状或者预防或延缓症状的发作的化合物(例如，工程化GLA多肽)的量和/或浓度。

如本文使用的，当提及疾病/状况使用时，术语“治疗有效量”是指改善、减弱或消除该疾病/状况的组合物(例如，工程化GLA多肽)的量和/或浓度。在一些实施方案中，该术语被用于指组合物的量，所述组合物的量引发研究者、医师、兽医师或其他临床医师寻求的组织、系统或动物受试者的生物学(例如，医学)响应。

意图的是，术语“治疗(treating)”、“治疗(treat)”和“治疗(treatment)”包括预防性治疗(例如，预防剂)以及姑息治疗。

工程化GLA的表达和活性：

使用合成的小鼠IG信号肽实现了酵母密码子优化的成熟人类GLA的分泌表达。克隆从HEK293T细胞中的pCDNA3.1(+)载体表达。这种方法提供了对荧光底物4-甲基伞形基α-D-吡喃半乳糖苷(4-MuGal)具有可测量活性的上清液。

在一些实施方案中，为了鉴定与SEQ ID NO:8相比具有相似稳定性和提高的细胞摄取的突变多样性，构建了产生源自SEQ ID NO:8的GLA变体的组合文库。在未挑战条件下(未孵育，pH4.6)或在低pH(3.9-4.2)、中性pH(7.0-7.6)或人类血清(生理pH7.1-8.2)环境中孵育1小时后，筛选等体积的上清液。由于GLA表达增加或GLA比活性增加而具有活性的GLA变体基于它们相对于亲本GLA的倍数提高来鉴定。具有增加的稳定性的GLA变体通过将在挑战条件下观察到的改进倍数除以在未挑战条件下观察到的改进倍数来鉴定。这种方法减少了基于表达增加但在极端pH比活性不变而选择变体的偏倚。综合活性评分(所有三种条件下倍数提高的乘积)和稳定性(稳定性评分的乘积)用于对改进的变体中的突变进行排序，用于纳入后续的GLA文库。在另外的实施方案中，使用了实施例中描述的另外的方法和序列。

工程化GLA：

在一些实施方案中，表现出改进特性的工程化GLA与SEQ ID NO:2、8、58、158、372、374、704和/或1022具有至少约85％、至少约88％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或至少约100％的氨基酸序列同一性，并且与SEQ ID NO:2、8、58、158、372、374、704和/或1022相比在一个或更多个氨基酸位置处具有氨基酸残基差异(诸如与SEQ ID NO:2、8、58、158、372、374、704和/或1022相比在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个、20个或更多个氨基酸位置处，或与SEQ ID NO:2、8、58、158、372、374、704和/或1022具有至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高氨基酸序列同一性的序列)。在一些实施方案中，与SEQ ID NO:2、8、58、158、372、374、704和/或1022相比在一个或更多个位置处的残基差异包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个保守氨基酸取代。在一些实施方案中，工程化GLA多肽是表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中列出的多肽。在一些实施方案中，工程化GLA多肽包含SEQ IDNO:2、8、58、158、372、374、704和/或1022。

本发明还提供了重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ IDNO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：7、7/48/68、7/48/68/120/282/299、7/48/130/282、7/48/180、7/68/130/282/365、7/68/180、7/88/120/305/365、7/120、7/130、7/282、7/305、7/305/365、7/365、39、47、47/87/95/96/158/162、47/95、47/273、47/343、48、48/68、48/180/282、48/282、48/282/305、67/180、68、68/299/300、71、87/91/95/96/158/162、87/91/95/96/206/343、87/96/155/273/343、88、91/95、91/95/96、92、93、96、96/273、96/312/343、120、120/299/305、151、158、158/162/273、162、162/273、162/343、166、178、180、181、206、217、271、273、273/343、282、282/365、293/391、299/300、299/300/305/365、300、301、305、305/365、314、333、336、337、343、345、363、365、370、389、393、394、396/398、397和398，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：7L、7L/48D/68E、7L/48D/68E/120H/282N/299R、7L/48D/130E/282N、7L/48D/180G、7L/68E/130E/282N/365V、7L/68E/180G、7L/88A/120H/305G/365V、7L/120H、7L/130E、7L/282N、7L/305G、7L/305G/365V、7L/365V、39V、47D、47D/87K/95E/96L/158R/162H、47D/95E、47D/273P、47D/343G、47V、48D、48D/68E、48D/180G/282N、48D/282N、48D/282N/305G、67T/180G、68E、68E/299R/300I、71P、87K/91Q/95E/96L/158A/162K、87K/91Q/95E/96L/206S/343G、87K/96I/155N/273P/343G、88A、91Q/95E、91Q/95E/96L、92F、92T、93I、96L、96L/273P、96L/312Q/343G、120H、120H/299R/305G、151L、158A、158A/162K/273G、158R、162H/343D、162K、162K/273P、162S、166K、178G、178S、180G、180L、180T、180V、181A、206K、206S、217K、271R、273P、273P/343G、282N、282N/365V、293P/391A、299R/300I、299R/300I/305G/365V、300I、301M、305G、305G/365V、314A、333F、333G、336V、337R、343D、343G、345A、345Q、363Q、365A、365Q、365V、370G、389K、393V、394K、396G/398T、397A、398A、398P、398S和398V，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。

在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：R7L、R7L/E48D/Q68E、R7L/E48D/Q68E/Y120H/D282N/Q299R、R7L/E48D/D130E/D282N、R7L/E48D/F180G、R7L/Q68E/D130E/D282N/F365V、R7L/Q68E/F180G、R7L/Q88A/Y120H/N305G/F365V、R7L/Y120H、R7L/D130E、R7L/D282N、R7L/N305G、R7L/N305G/F365V、R7L/F365V、E39V、T47D、T47D/R87K/S95E/K96L/L158R/R162H、T47D/S95E、T47D/S273P、T47D/K343G、T47V、E48D、E48D/Q68E、E48D/F180G/D282N、E48D/D282N、E48D/D282N/N305G、P67T/F180G、Q68E、Q68E/Q299R/L300I、S71P、R87K/N91Q/S95E/K96L/L158A/R162K、R87K/N91Q/S95E/K96L/A206S/K343G、R87K/K96I/H155N/S273P/K343G、Q88A、N91Q/S95E、N91Q/S95E/K96L、H92F、H92T、V93I、K96L、K96L/S273P、K96L/P312Q/K343G、Y120H、Y120H/Q299R/N305G、D151L、L158A、L158A/R162K/S273G、L158R、R162H/K343D、R162K、R162K/S273P、R162S、P166K、W178G、W178S、F180G、F180L、F180T、F180V、Q181A、A206K、A206S、R217K、A271R、S273P、S273P/K343G、D282N、D282N/F365V、L293P/Q391A、Q299R/L300I、Q299R/L300I/N305G/F365V、L300I、R301M、N305G、N305G/F365V、S314A、S333F、S333G、I336V、P337R、K343D、K343G、V345A、V345Q、L363Q、F365A、F365Q、F365V、S370G、T389K、S393V、L394K、D396G/L398T、L397A、L398A、L398P、L398S和L398V，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。

在一些实施方案中，重组α半乳糖苷酶A多肽序列与SEQ ID NO:4-1864中的偶数编号序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性。

在一些实施方案中，工程化GLA多肽包含本发明涵盖的工程化GLA多肽的功能片段。功能片段具有其所源自的工程化GLA多肽(即，亲本工程化GLA)的活性的至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。功能片段包含工程化GLA的亲本序列的至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％以及甚至99％。在一些实施方案中，功能片段被截短少于5个、少于10个、少于15个、少于20个、少于25个、少于30个、少于35个、少于40个、少于45个和少于50个氨基酸。

编码工程化多肽的多核苷酸、表达载体和宿主细胞：

本发明提供了编码本文描述的工程化GLA多肽的多核苷酸。在一些实施方案中，多核苷酸被可操作地连接至控制基因表达的一个或更多个异源或同源调控序列，以创建能够表达多肽的重组多核苷酸。包含编码工程化GLA多肽的异源多核苷酸的表达构建体可以被引入到适当的宿主细胞中以表达对应的GLA多肽。

如对技术人员将是明显的，蛋白序列的可获得性和对应于各种氨基酸的密码子的知识提供了能够编码主题多肽的所有多核苷酸的说明。遗传密码的简并性，其中相同的氨基酸由可替代的密码子或同义密码子编码，允许制备极大数目的核酸，所有这些核酸都编码工程化GLA多肽。因此，知道了特定的氨基酸序列后，本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单修改序列的一个或更多个密码子来制备任何数目的不同核酸。在这方面，本发明特别设想了可以通过基于可能的密码子选择来选择组合以制备编码本文描述的多肽的多核苷酸的每种和每一种可能的改变，并且对于本文描述的任何多肽，所有此类改变，包括表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中提供的变体，应被认为被特别地公开。

在多种实施方案中，优选地选择密码子来适应在其中产生蛋白的宿主细胞。例如，细菌中使用的优选的密码子被用于在细菌中的表达。因此，编码工程化GLA多肽的密码子优化的多核苷酸在全长编码区的约40％、50％、60％、70％、80％或大于90％的密码子位置处包含优选的密码子。在一些实施方案中，本发明提供了重组多核苷酸序列，其中密码子被优化用于在人类细胞或组织中表达。

在一些实施方案中，本发明提供了与SEQ ID NO:1具有至少约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，本发明提供了与SEQ ID NO:1具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，本发明提供了与SEQ ID NO:7具有至少约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，本发明提供了与SEQ ID NO:7具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，重组多核苷酸序列与SEQ ID NO:3-1863中的奇数编码序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性。

在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，该重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：44、44/217、44/217/316、44/217/322、44/217/322/337、44/247、44/247/302、44/247/302/322、44/247/322、44/247/337、44/247/362、44/302、44/337、44/373、217/322、217/373、247/322、247/362、302/322/362/373、302/337、316、316/337、322、322/337、362/373和373，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，该重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：44L、44L/217F、44L/217F/316L、44L/217F/322M、44L/217F/322M/337A、44L/247N、44L/247N/302Q、44L/247N/302Q/322M、44L/247N/322M、44L/247N/337A、44L/247N/362K、44L/302Q、44L/337A、44L/373R、217F/322M、217F/373R、247N/322M、247N/362K、302Q/322M/362K/373R、302Q/337A、316L、316L/337A、322M、322M/337A、362K/373R和373R，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，该重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：R44L、R44L/R217F、R44L/R217F/D316L、R44L/R217F/I322M、R44L/R217F/I322M/P337A、R44L/D247N、R44L/D247N/K302Q、R44L/D247N/K302Q/I322M、R44L/D247N/I322M、R44L/D247N/P337A、R44L/D247N/Q362K、R44L/K302Q、R44L/P337A、R44L/K373R、R217F/I322M、R217F/K373R、D247N/I322M、D247N/Q362K、K302Q/I322M/Q362K/K373R、K302Q/P337A、D316L、D316L/P337A、I322M、I322M/P337A、Q362K/K373R和K373R，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。

在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，该重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10/39/44/47/92/166/206/217/247/261/271/302/316/322/337/362/368/373/392、44/217/316、44/217/322/337、166/362、217/373和362/373，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，该重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10T/39M/44L/47S/92Y/166S/206K/217F/247N/261A/271H/302Q/316L/322M/337A/362K/368W/373R/392M、44L/217F/316L、44L/217F/322M/337A、166A/362K、217F/373R和362K/373R，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，该重组α半乳糖苷酶A包含与SEQ ID NO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10T/E39M/R44L/T47S/H92Y/P166S/A206K/R217F/D247N/G261A/A271H/K302Q/D316L/I322M/P337A/Q362K/A368W/K373R/T392M、R44L/R217F/D316L、R44L/R217F/I322M/P337A、P166A/Q362K、R217F/K373R和Q362K/K373R，其中所述多肽序列的氨基酸位置参考SEQ ID NO:8来编号。

在一些实施方案中，本发明提供了与SEQ ID NO:57具有至少约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，本发明提供了与SEQ ID NO:57具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ ID NO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：7、7/48/68、7/48/68/120/282/299、7/48/130/282、7/48/180、7/68/130/282/365、7/68/180、7/88/120/305/365、7/120、7/130、7/282、7/305、7/305/365、7/365、39、47、47/87/95/96/158/162、47/95、47/273、47/343、48、48/68、48/180/282、48/282、48/282/305、67/180、68、68/299/300、71、87/91/95/96/158/162、87/91/95/96/206/343、87/96/155/273/343、88、91/95、91/95/96、92、93、96、96/273、96/312/343、120、120/299/305、151、158、158/162/273、162、162/273、162/343、166、178、180、181、206、217、271、273、273/343、282、282/365、293/391、299/300、299/300/305/365、300、301、305、305/365、314、333、336、337、343、345、363、365、370、389、393、394、396/398、397和398，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：7L、7L/48D/68E、7L/48D/68E/120H/282N/299R、7L/48D/130E/282N、7L/48D/180G、7L/68E/130E/282N/365V、7L/68E/180G、7L/88A/120H/305G/365V、7L/120H、7L/130E、7L/282N、7L/305G、7L/305G/365V、7L/365V、39V、47D、47D/87K/95E/96L/158R/162H、47D/95E、47D/273P、47D/343G、47V、48D、48D/68E、48D/180G/282N、48D/282N、48D/282N/305G、67T/180G、68E、68E/299R/300I、71P、87K/91Q/95E/96L/158A/162K、87K/91Q/95E/96L/206S/343G、87K/96I/155N/273P/343G、88A、91Q/95E、91Q/95E/96L、92F、92T、93I、96L、96L/273P、96L/312Q/343G、120H、120H/299R/305G、151L、158A、158A/162K/273G、158R、162H/343D、162K、162K/273P、162S、166K、178G、178S、180G、180L、180T、180V、181A、206K、206S、217K、271R、273P、273P/343G、282N、282N/365V、293P/391A、299R/300I、299R/300I/305G/365V、300I、301M、305G、305G/365V、314A、333F、333G、336V、337R、343D、343G、345A、345Q、363Q、365A、365Q、365V、370G、389K、393V、394K、396G/398T、397A、398A、398P、398S和398V，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：R7L、R7L/E48D/Q68E、R7L/E48D/Q68E/Y120H/D282N/Q299R、R7L/E48D/D130E/D282N、R7L/E48D/F180G、R7L/Q68E/D130E/D282N/F365V、R7L/Q68E/F180G、R7L/Q88A/Y120H/N305G/F365V、R7L/Y120H、R7L/D130E、R7L/D282N、R7L/N305G、R7L/N305G/F365V、R7L/F365V、E39V、T47D、T47D/R87K/S95E/K96L/L158R/R162H、T47D/S95E、T47D/S273P、T47D/K343G、T47V、E48D、E48D/Q68E、E48D/F180G/D282N、E48D/D282N、E48D/D282N/N305G、P67T/F180G、Q68E、Q68E/Q299R/L300I、S71P、R87K/N91Q/S95E/K96L/L158A/R162K、R87K/N91Q/S95E/K96L/A206S/K343G、R87K/K96I/H155N/S273P/K343G、Q88A、N91Q/S95E、N91Q/S95E/K96L、H92F、H92T、V93I、K96L、K96L/S273P、K96L/P312Q/K343G、Y120H、Y120H/Q299R/N305G、D151L、L158A、L158A/R162K/S273G、L158R、R162H/K343D、R162K、R162K/S273P、R162S、P166K、W178G、W178S、F180G、F180L、F180T、F180V、Q181A、A206K、A206S、R217K、A271R、S273P、S273P/K343G、D282N、D282N/F365V、L293P/Q391A、Q299R/L300I、Q299R/L300I/N305G/F365V、L300I、R301M、N305G、N305G/F365V、S314A、S333F、S333G、I336V、P337R、K343D、K343G、V345A、V345Q、L363Q、F365A、F365Q、F365V、S370G、T389K、S393V、L394K、D396G/L398T、L397A、L398A、L398P、L398S和L398V，其中所述多肽序列的氨基酸位置参考SEQ ID NO:58来编号。

在一些实施方案中，本发明提供了与SEQ ID NO:157具有至少约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，本发明提供了与SEQ ID NO:157具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ ID NO:158具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：24/202、39/47、39/47/217、39/151、39/282/337/398、39/337/343/398、39/393/398、47/130、47/151、47/343/345/393、48、48/68、48/68/217/333/391/393、48/68/333、48/217、48/333、48/345/393、48/393、59/143、68、68/345、130、130/158、130/158/393、130/345/393、143/271、143/333、143/387、151、151/158/217/343/345/393、151/206/282/337/343/345/398、151/282/393、151/345/393/398、151/393、158、158/393、202、206、206/217、217、217/333、217/337/345/398、271、282/393、333、333/345、337/343/345/398、343、343/345/393/398、393和393/398，其中所述多肽序列的氨基酸位置参考SEQ ID NO:158来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQIDNO:158具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：24S/202N、39V/47D、39V/47V/217K、39V/151L、39V/282N/337R/398A、39V/337R/343G/398A、39V/393V/398A、47V/130E、47V/151L、47V/343D/345Q/393V、48D、48D/68E、48D/68E/217K/333F/391A/393V、48D/68E/333F、48D/217K、48D/333F、48D/333G、48D/345Q/393V、48D/393V、59A/143S、68E、68E/345Q、130E、130E/158R、130E/158R/393V、130E/345Q/393V、143S/271N、143S/333N、143S/387N、151L、151L/158R/217K/343G/345Q/393V、151L/206S/282N/337R/343D/345Q/398A、151L/282N/393V、151L/345Q/393V/398A、151L/393V、158R、158R/393V、202N、206S、206S/217K、217K、217K/333F、217K/333G、217K/337R/345Q/398A、271N、282N/393V、333F/345Q、333G、333N、337R/343G/345Q/398A、343D、343D/345Q/393V/398A、393V和393V/398A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:158来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:158具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：D24S/D202N、E39V/T47D、E39V/T47V/R217K、E39V/D151L、E39V/D282N/P337R/L398A、E39V/P337R/K343G/L398A、E39V/S393V/L398A、T47V/D130E、T47V/D151L、T47V/K343D/V345Q/S393V、E48D、E48D/Q68E、E48D/Q68E/R217K/S333F/Q391A/S393V、E48D/Q68E/S333F、E48D/R217K、E48D/S333F、E48D/S333G、E48D/V345Q/S393V、E48D/S393V、C59A/C143S、Q68E、Q68E/V345Q、D130E、D130E/L158R、D130E/L158R/S393V、D130E/V345Q/S393V、C143S/A271N、C143S/S333N、C143S/E387N、D151L、D151L/L158R/R217K/K343G/V345Q/S393V、D151L/A206S/D282N/P337R/K343D/V345Q/L398A、D151L/D282N/S393V、D151L/V345Q/S393V/L398A、D151L/S393V、L158R、L158R/S393V、D202N、A206S、A206S/R217K、R217K、R217K/S333F、R217K/S333G、R217K/P337R/V345Q/L398A、A271N、D282N/S393V、S333F/V345Q、S333G、S333N、P337R/K343G/V345Q/L398A、K343D、K343D/V345Q/S393V/L398A、S393V和S393V/L398A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:158来编号。

在一些实施方案中，本发明提供了与SEQ ID NO:371具有至少约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，本发明提供了与SEQ ID NO:371具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ ID NO:372具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、10/39/44/322、10/39/92/206/217/271、10/39/92/247、10/39/92/247/271/316、10/44、10/44/47/92/247、10/44/47/261/302/322/368、10/44/92/316/322、10/44/261/302/316、10/44/302/337/368、10/47/217/247/316/392、10/47/217/322、10/47/271、10/92、10/92/206/217/247、10/92/206/247/316/322/392、10/92/206/247/322/368、10/92/217/261/302/337、10/206/217/271、10/206/247、10/206/261/271/316、10/261、10/271/302、10/302、10/302/316、10/302/322/337、10/316/322、10/337/392、10/368、39/44/92/162/247/302/316/322、39/44/92/217/322、39/44/92/247/271/302、39/47/92/247/302/316/322、39/47/217/247/368、39/47/247、39/92/247/302/316/337/368、39/92/316/322、39/247/271、39/247/271/316、39/322、44/47/92/206/217/316/322、44/47/92/247/261/271/316/337/368、44/47/206/217/247/271/322、44/47/247/322/368、44/47/302/316/322、44/92/206/247/368、44/206/337、44/247/261/302/316、44/247/261/302/316/322、47/92/247/271、47/217/302、47/247、47/247/271、89/217/247/261/302/316、92/217/271、92/247、92/247/271/322、92/247/302/322/337、92/271/337、92/302、92/316、206/217/271/392、217/247/316/322/337/368、247、247/271、247/302、271、271/302/322、271/316/322、302/322/368和368，其中所述多肽序列的氨基酸位置参考SEQ ID NO:372来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:372具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10P、10P/39E/44R/322I、10P/39E/92H/206A/217R/271A、10P/39E/92H/247D、10P/39E/92H/247D/271A/316D、10P/44R、10P/44R/47T/92H/247D、10P/44R/47T/261G/302K/322I/368A、10P/44R/92H/316D/322I、10P/44R/261G/302K/316D、10P/44R/302K/337P/368A、10P/47T/217R/247D/316D/392T、10P/47T/217R/322I、10P/47T/271A、10P/92H、10P/92H/206A/217R/247D、10P/92H/206A/247D/316D/322I/392T、10P/92H/206A/247D/322I/368A、10P/92H/217R/261G/302K/337P、10P/206A/217R/271A、10P/206A/247D、10P/206A/261G/271A/316D、10P/261G、10P/271A/302K、10P/302K、10P/302K/316D、10P/302K/322I/337P、10P/316D/322I、10P/337P/392T、10P/368A、39E/44R/92H/162M/247D/302K/316D/322I、39E/44R/92H/217R/322I、39E/44R/92H/247D/271A/302K、39E/47T/92H/247D/302K/316D/322I、39E/47T/217R/247D/368A、39E/47T/247D、39E/92H/247D/302K/316D/337P/368A、39E/92H/316D/322I、39E/247D/271A、39E/247D/271A/316D、39E/322I、44R/47T/92H/206A/217R/316D/322I、44R/47T/92H/247D/261G/271A/316D/337P/368A、44R/47T/206A/217R/247D/271A/322I、44R/47T/247D/322I/368A、44R/47T/302K/316D/322I、44R/92H/206A/247D/368A、44R/206A/337P、44R/247D/261G/302K/316D、44R/247D/261G/302K/316D/322I、47T/92H/247D/271A、47T/217R/302K、47T/247D、47T/247D/271A、89I/217R/247D/261G/302K/316D、92H/217R/271A、92H/247D、92H/247D/271A/322I、92H/247D/302K/322I/337P、92H/271A/337P、92H/302K、92H/316D、206A/217R/271A/392T、217R/247D/316D/322I/337P/368A、247D、247D/271A、247D/302K、271A、271A/302K/322I、271A/316D/322I、302K/322I/368A和368A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:372来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:372具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：T10P、T10P/M39E/L44R/M322I、T10P/M39E/Y92H/K206A/F217R/H271A、T10P/M39E/Y92H/N247D、T10P/M39E/Y92H/N247D/H271A/L316D、T10P/L44R、T10P/L44R/S47T/Y92H/N247D、T10P/L44R/S47T/A261G/Q302K/M322I/W368A、T10P/L44R/Y92H/L316D/M322I、T10P/L44R/A261G/Q302K/L316D、T10P/L44R/Q302K/A337P/W368A、T10P/S47T/F217R/N247D/L316D/M392T、T10P/S47T/F217R/M322I、T10P/S47T/H271A、T10P/Y92H、T10P/Y92H/K206A/F217R/N247D、T10P/Y92H/K206A/N247D/L316D/M322I/M392T、T10P/Y92H/K206A/N247D/M322I/W368A、T10P/Y92H/F217R/A261G/Q302K/A337P、T10P/K206A/F217R/H271A、T10P/K206A/N247D、T10P/K206A/A261G/H271A/L316D、T10P/A261G、T10P/H271A/Q302K、T10P/Q302K、T10P/Q302K/L316D、T10P/Q302K/M322I/A337P、T10P/L316D/M322I、T10P/A337P/M392T、T10P/W368A、M39E/L44R/Y92H/R162M/N247D/Q302K/L316D/M322I、M39E/L44R/Y92H/F217R/M322I、M39E/L44R/Y92H/N247D/H271A/Q302K、M39E/S47T/Y92H/N247D/Q302K/L316D/M322I、M39E/S47T/F217R/N247D/W368A、M39E/S47T/N247D、M39E/Y92H/N247D/Q302K/L316D/A337P/W368A、M39E/Y92H/L316D/M322I、M39E/N247D/H271A、M39E/N247D/H271A/L316D、M39E/M322I、L44R/S47T/Y92H/K206A/F217R/L316D/M322I、L44R/S47T/Y92H/N247D/A261G/H271A/L316D/A337P/W368A、L44R/S47T/K206A/F217R/N247D/H271A/M322I、L44R/S47T/N247D/M322I/W368A、L44R/S47T/Q302K/L316D/M322I、L44R/Y92H/K206A/N247D/W368A、L44R/K206A/A337P、L44R/N247D/A261G/Q302K/L316D、L44R/N247D/A261G/Q302K/L316D/M322I、S47T/Y92H/N247D/H271A、S47T/F217R/Q302K、S47T/N247D、S47T/N247D/H271A、L89I/F217R/N247D/A261G/Q302K/L316D、Y92H/F217R/H271A、Y92H/N247D、Y92H/N247D/H271A/M322I、Y92H/N247D/Q302K/M322I/A337P、Y92H/H271A/A337P、Y92H/Q302K、Y92H/L316D、K206A/F217R/H271A/M392T、F217R/N247D/L316D/M322I/A337P/W368A、N247D、N247D/H271A、N247D/Q302K、H271A、H271A/Q302K/M322I、H271A/L316D/M322I、Q302K/M322I/W368A和W368A，其中所述多肽序列的氨基酸位置参考SEQ ID NO:372来编号。

在一些实施方案中，本发明提供了与SEQ ID NO:373具有至少约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，本发明提供了与SEQ ID NO:373具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的重组多核苷酸序列。在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10/36/92/166/247/261/316/392、10/39、10/39/44/47/92/206/217、10/39/44/47/316、10/39/44/47/337、10/39/44/92/166/261/316/322、10/39/44/92/166/302/322、10/39/44/92/166/392、10/39/44/92/217/302/322、10/39/44/92/302/322、10/39/44/166/261/271/316/322、10/39/44/392、10/39/47/92/337、10/39/92/131/166/271/316/322、10/39/92/166/217/247/271、10/39/92/217/316、10/44/47/166/261/271、10/44/47/166/271/322/368、10/44/47/217/271/316/322、10/44/92、10/44/92/217/247/271/302/316/392、10/44/166/302、10/44/206/316/322、10/47/92/166/271/316/337、10/47/92/271/302、10/47/92/316/322/392、10/47/166/271、10/47/166/316、10/92/166、10/92/166/217/247/261/271、10/92/166/261/271/392、10/92/166/261/316/322/337、10/92/166/337/368、10/92/302/337、10/92/316/322、10/206、10/206/247/261、10/217/322、10/261、10/261/337/392、10/316/392、10/368、39/44/47/92/166/206/392、39/44/47/92/206/247/261、39/44/47/92/206/392、39/44/47/206/337/368/392、39/44/92/166/247/261/302/337、39/44/166/271、39/44/166/271/337/368/392、39/47/92/316/322、39/47/92/392、39/47/166/217/261/392、39/47/217/247/368、39/47/247、39/92/166/217/392、39/92/261/302、39/166/217/261/316/368、39/322、39/392、44/47、44/47/92/217/271、44/47/92/217/316/322/392、44/47/92/392、44/47/166、44/47/166/271、44/47/247/271/392、44/316/322/392、44/337、47/166/206/217/247/337、47/166/217/271/337、47/206、47/217/247/261、47/271、52/217/302/316、92/166/206/271/316、92/166/217/261/271/392、92/166/217/316/337/392、92/166/247、92/166/316、92/206/322、92/217、92/217/271/337、92/261/271、92/271、166/217/316/322/337、166/247/271/316、166/316/322/337、206/217、217/392、247/316、316/322/368和316/337/392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10T/36M/92Y/166S/247N/261A/316L/392M、10T/39M、10T/39M/44L/47S/92Y/206K/217F、10T/39M/44L/47S/316L、10T/39M/44L/47S/337A、10T/39M/44L/92Y/166S/261A/316L/322M、10T/39M/44L/92Y/166S/302Q/322M、10T/39M/44L/92Y/166S/392M、10T/39M/44L/92Y/217F/302Q/322M、10T/39M/44L/92Y/302Q/322M、10T/39M/44L/166S/261A/271H/316L/322M、10T/39M/44L/392M、10T/39M/47S/92Y/337A、10T/39M/92Y/131G/166S/271H/316L/322M、10T/39M/92Y/166S/217F/247N/271H、10T/39M/92Y/217F/316L、10T/44L/47S/166S/261A/271H、10T/44L/47S/166S/271H/322M/368W、10T/44L/47S/217F/271H/316L/322M、10T/44L/92Y、10T/44L/92Y/217F/247N/271H/302Q/316L/392M、10T/44L/166S/302Q、10T/44L/206K/316L/322M、10T/47S/92Y/166S/271H/316L/337A、10T/47S/92Y/271H/302Q、10T/47S/92Y/316L/322M/392M、10T/47S/166S/271H、10T/47S/166S/316L、10T/92Y/166S、10T/92Y/166S/217F/247N/261A/271H、10T/92Y/166S/261A/271H/392M、10T/92Y/166S/261A/316L/322M/337A、10T/92Y/166S/337A/368W、10T/92Y/302Q/337A、10T/92Y/316L/322M、10T/206K、10T/206K/247N/261A、10T/217F/322M、10T/261A、10T/261A/337A/392M、10T/316L/392M、10T/368W、39M/44L/47S/92Y/166S/206K/392M、39M/44L/47S/92Y/206K/247N/261A、39M/44L/47S/92Y/206K/392M、39M/44L/47S/206K/337A/368W/392M、39M/44L/92Y/166S/247N/261A/302Q/337A、39M/44L/166S/271H、39M/44L/166S/271H/337A/368W/392M、39M/47S/92Y/316L/322M、39M/47S/92Y/392M、39M/47S/166S/217F/261A/392M、39M/47S/217F/247N/368W、39M/47S/247N、39M/92Y/166S/217F/392M、39M/92Y/261A/302Q、39M/166S/217F/261A/316L/368W、39M/322M、39M/392M、44L/47S、44L/47S/92Y/217F/271H、44L/47S/92Y/217F/316L/322M/392M、44L/47S/92Y/392M、44L/47S/166S、44L/47S/166S/271H、44L/47S/247N/271H/392M、44L/316L/322M/392M、44L/337A、47S/166S/206K/217F/247N/337A、47S/166S/217F/271H/337A、47S/206K、47S/217F/247N/261A、47S/271H、52N/217F/302Q/316L、92Y/166S/206K/271H/316L、92Y/166S/217F/261A/271H/392M、92Y/166S/217F/316L/337A/392M、92Y/166S/247N、92Y/166S/316L、92Y/206K/322M、92Y/217F、92Y/217F/271H/337A、92Y/261A/271H、92Y/271H、166S/217F/316L/322M/337A、166S/247N/271H/316L、166S/316L/322M/337A、206K/217F、217F/392M、247N/316L、316L/322M/368W和316L/337A/392M，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10T/K36M/H92Y/P166S/D247N/G261A/D316L/T392M、P10T/E39M、P10T/E39M/R44L/T47S/H92Y/A206K/R217F、P10T/E39M/R44L/T47S/D316L、P10T/E39M/R44L/T47S/P337A、P10T/E39M/R44L/H92Y/P166S/G261A/D316L/I322M、P10T/E39M/R44L/H92Y/P166S/K302Q/I322M、P10T/E39M/R44L/H92Y/P166S/T392M、P10T/E39M/R44L/H92Y/R217F/K302Q/I322M、P10T/E39M/R44L/H92Y/K302Q/I322M、P10T/E39M/R44L/P166S/G261A/A271H/D316L/I322M、P10T/E39M/R44L/T392M、P10T/E39M/T47S/H92Y/P337A、P10T/E39M/H92Y/W131G/P166S/A271H/D316L/I322M、P10T/E39M/H92Y/P166S/R217F/D247N/A271H、P10T/E39M/H92Y/R217F/D316L、P10T/R44L/T47S/P166S/G261A/A271H、P10T/R44L/T47S/P166S/A271H/I322M/A368W、P10T/R44L/T47S/R217F/A271H/D316L/I322M、P10T/R44L/H92Y、P10T/R44L/H92Y/R217F/D247N/A271H/K302Q/D316L/T392M、P10T/R44L/P166S/K302Q、P10T/R44L/A206K/D316L/I322M、P10T/T47S/H92Y/P166S/A271H/D316L/P337A、P10T/T47S/H92Y/A271H/K302Q、P10T/T47S/H92Y/D316L/I322M/T392M、P10T/T47S/P166S/A271H、P10T/T47S/P166S/D316L、P10T/H92Y/P166S、P10T/H92Y/P166S/R217F/D247N/G261A/A271H、P10T/H92Y/P166S/G261A/A271H/T392M、P10T/H92Y/P166S/G261A/D316L/I322M/P337A、P10T/H92Y/P166S/P337A/A368W、P10T/H92Y/K302Q/P337A、P10T/H92Y/D316L/I322M、P10T/A206K、P10T/A206K/D247N/G261A、P10T/R217F/I322M、P10T/G261A、P10T/G261A/P337A/T392M、P10T/D316L/T392M、P10T/A368W、E39M/R44L/T47S/H92Y/P166S/A206K/T392M、E39M/R44L/T47S/H92Y/A206K/D247N/G261A、E39M/R44L/T47S/H92Y/A206K/T392M、E39M/R44L/T47S/A206K/P337A/A368W/T392M、E39M/R44L/H92Y/P166S/D247N/G261A/K302Q/P337A、E39M/R44L/P166S/A271H、E39M/R44L/P166S/A271H/P337A/A368W/T392M、E39M/T47S/H92Y/D316L/I322M、E39M/T47S/H92Y/T392M、E39M/T47S/P166S/R217F/G261A/T392M、E39M/T47S/R217F/D247N/A368W、E39M/T47S/D247N、E39M/H92Y/P166S/R217F/T392M、E39M/H92Y/G261A/K302Q、E39M/P166S/R217F/G261A/D316L/A368W、E39M/I322M、E39M/T392M、R44L/T47S、R44L/T47S/H92Y/R217F/A271H、R44L/T47S/H92Y/R217F/D316L/I322M/T392M、R44L/T47S/H92Y/T392M、R44L/T47S/P166S、R44L/T47S/P166S/A271H、R44L/T47S/D247N/A271H/T392M、R44L/D316L/I322M/T392M、R44L/P337A、T47S/P166S/A206K/R217F/D247N/P337A、T47S/P166S/R217F/A271H/P337A、T47S/A206K、T47S/R217F/D247N/G261A、T47S/A271H、D52N/R217F/K302Q/D316L、H92Y/P166S/A206K/A271H/D316L、H92Y/P166S/R217F/G261A/A271H/T392M、H92Y/P166S/R217F/D316L/P337A/T392M、H92Y/P166S/D247N、H92Y/P166S/D316L、H92Y/A206K/I322M、H92Y/R217F、H92Y/R217F/A271H/P337A、H92Y/G261A/A271H、H92Y/A271H、P166S/R217F/D316L/I322M/P337A、P166S/D247N/A271H/D316L、P166S/D316L/I322M/P337A、A206K/R217F、R217F/T392M、D247N/D316L、D316L/I322M/A368W和D316L/P337A/T392M，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。

在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，所述重组α半乳糖苷酶A包含与SEQ ID NO:704具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：2、4、5、24/59、24/143/144、24/143/202/333、24/143/202/352/390/391、24/143/333/352/387/390/391、24/143/390/391、24/202、24/202/271、24/202/333/352、24/271/352、24/352/387/390/391、24/387/391、31、40、59、59/143、59/143/202、59/143/202/271/333、59/143/271、59/143/333、59/202、59/202/333、59/271/387/390、73、76、80、83、84、91/215/361、122、123、143、143/202、143/271、143/271/352/390、143/333、143/333/387/390、143/387/391、147、155、164、165、179、186、202、202/333、210、215/218、218、218/361、218/361/398、218/398、246、254/398、271、271/333、271/333/390/391、271/333/391、271/352/391、273、275、277、278、280、281、283、284、287、300、303、304、325、331、332、333/352、333/390/391、333/391、334、335、336、338、339、340、341、343、359、360、361、362、367、369、371、373、375、377、382、382/398、385、387/391、390和398，其中所述多肽序列的氨基酸位置参考SEQ IDNO:704来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:704具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：2S、4L、5M、5V、24S/59A、24S/143S/144N、24S/143S/202N/333N、24S/143S/202N/352N/390N/391N、24S/143S/333N/352N/387N/390T/391N、24S/143S/390T/391N、24S/202N、24S/202N/271N、24S/202N/333N/352N、24S/271N/352N、24S/352N/387N/390N/391N、24S/387N/391N、31F、31H、31L、31T、31W、40Q、59A、59A/143S、59A/143S/271N、59A/202N、59T、59T/143S/202N、59T/143S/333N、59T/202N/333N、59V/143S/202N/271N/333N、59V/271N/387N/390T、73A、76A、76F、76M、76S、80T、83R、83S、84G、84K、84R、91S/215S/361T、122E、122N、122S、123Q、123R、123S、123T、143S、143S/202N、143S/271N、143S/271N/352N/390N、143S/333N、143S/333N/387N/390T、143S/387N/391N、147L、147S、155A、155D、155F、155L、155R、155T、164E、165I、179H、179L、179R、179W、186E、186F、186M、186P、186R、186S、186Y、202N、202N/333N、210I、215S/218Y、218Y、218Y/361T、218Y/361T/398F、218Y/398F、246Y、254T/398F、271N、271N/333N、271N/333N/390N/391N、271N/333N/391N、271N/352N/391N、273L、275A、275G、277Q、277V、278N、278R、278S、280G、281I、281M、283L、283P、283T、283V、284A、284E、284G、284L、284M、284R、284S、287R、300F、303A、303C、303W、304T、304V、304W、325A、331M、332G、332H、333N/352N、333N/390N/391N、333N/390S/391N、333N/391N、334C、334V、335A、335L、336F、336G、336S、336T、338L、339G、339N、339Q、339V、340H、340I、340K、340M、340P、340W、341F、341M、343L、343R、343S、343W、359F、359L、359R、360H、360V、361T、361V、362H、367A、367D、367L、367M、369D、371G、373L、373S、375L、375Q、377Q、382I、382I/398F、385R、387N/391N、390S和398F，其中所述多肽序列的氨基酸位置参考SEQ ID NO:704来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:704具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：D2S、G4L、L5M、L5V、D24S/C59A、D24S/C143S/D144N、D24S/C143S/D202N/G333N、D24S/C143S/D202N/F352N/M390N/Q391N、D24S/C143S/G333N/F352N/E387N/M390T/Q391N、D24S/C143S/M390T/Q391N、D24S/D202N、D24S/D202N/A271N、D24S/D202N/G333N/F352N、D24S/A271N/F352N、D24S/F352N/E387N/M390N/Q391N、D24S/E387N/Q391N、S31F、S31H、S31L、S31T、S31W、E40Q、C59A、C59A/C143S、C59A/C143S/A271N、C59A/D202N、C59T、C59T/C143S/D202N、C59T/C143S/G333N、C59T/D202N/G333N、C59V/C143S/D202N/A271N/G333N、C59V/A271N/E387N/M390T、G73A、Q76A、Q76F、Q76M、Q76S、Q80T、P83R、P83S、H84G、H84K、H84R、N91S/T215S/R361T、D122E、D122N、D122S、I123Q、I123R、I123S、I123T、C143S、C143S/D202N、C143S/A271N、C143S/A271N/F352N/M390N、C143S/G333N、C143S/G333N/E387N/M390T、C143S/E387N/Q391N、E147L、E147S、H155A、H155D、H155F、H155L、H155R、H155T、G164E、R165I、P179H、P179L、P179R、P179W、T186E、T186F、T186M、T186P、T186R、T186S、T186Y、D202N、D202N/G333N、S210I、T215S/N218Y、N218Y、N218Y/R361T、N218Y/R361T/L398F、N218Y/L398F、W246Y、A254T/L398F、A271N、A271N/G333N、A271N/G333N/M390N/Q391N、A271N/G333N/Q391N、A271N/F352N/Q391N、S273L、Q275A、Q275G、K277Q、K277V、A278N、A278R、A278S、L280G、Q281I、Q281M、K283L、K283P、K283T、K283V、D284A、D284E、D284G、D284L、D284M、D284R、D284S、A287R、L300F、G303A、G303C、G303W、D304T、D304V、D304W、R325A、P331M、R332G、R332H、G333N/F352N、G333N/M390N/Q391N、G333N/M390S/Q391N、G333N/Q391N、Y334C、Y334V、T335A、T335L、I336F、I336G、I336S、I336T、V338L、A339G、A339N、A339Q、A339V、S340H、S340I、S340K、S340M、S340P、S340W、L341F、L341M、K343L、K343R、K343S、K343W、V359F、V359L、V359R、K360H、K360V、R361T、R361V、K362H、E367A、E367D、E367L、E367M、T369D、R371G、R373L、R373S、H375L、H375Q、N377Q、V382I、V382I/L398F、Q385R、E387N/Q391N、M390S和L398F，其中所述多肽序列的氨基酸位置参考SEQ ID NO:704来编号。

在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，所述重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、39、44、47、92、166、206、217、247、261、271、302、316、322、337、368和392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10A、10C、10D、10E、10F、10G、10H、10I、10K、10L、10M、10N、10Q、10R、10S、10T、10V、10W、10Y、39A、39C、39D、39F、39G、39H、39I、39K、39L、39M、39N、39P、39Q、39R、39S、39T、39V、39W、39Y、44A、44C、44D、44E、44F、44G、44H、44I、44K、44L、44N、44P、44Q、44S、44T、44V、44W、44Y、47A、47C、47D、47E、47F、47G、47H、47I、47K、47L、47M、47N、47P、47Q、47R、47S、47V、47W、47Y、92A、92C、92D、92E、92F、92G、92I、92K、92L、92M、92N、92P、92Q、92R、92S、92T、92V、92W、92Y、166A、166C、166D、166E、166F、166G、166H、166I、166K、166L、166M、166N、166Q、166R、166S、166T、166V、166W、166Y、206C、206D、206E、206F、206G、206H、206I、206K、206L、206M、206N、206P、206Q、206R、206S、206T、206V、206W、206Y、217A、217C、217D、217E、217F、217G、217H、217I、217K、217L、217M、217N、217P、217Q、217S、217T、217V、217W、217Y、247A、247C、247E、247F、247G、247H、247I、247K、247L、247M、247N、247P、247Q、247R、247S、247T、247V、247W、247Y、261A、261C、261D、261E、261F、261H、261I、261K、261L、261M、261N、261P、261Q、261R、261S、261T、261V、261W、261Y、271C、271D、271E、271F、271G、271H、271I、271K、271L、271M、271N、271P、271Q、271R、271S、271T、271V、271W、271Y、302A、302C、302D、302E、302F、302G、302H、302I、302L、302M、302N、302P、302Q、302R、302S、302T、302V、302W、302Y、316A、316C、316E、316F、316G、316H、316I、316K、316L、316M、316N、316P、316Q、316R、316S、316T、316V、316W、316Y、322A、322C、322D、322E、322F、322G、322H、322K、322L、322M、322N、322P、322Q、322R、322S、322T、322V、322W、322Y、337A、337C、337D、337E、337F、337G、337H、337I、337K、337L、337M、337N、337Q、337R、337S、337T、337V、337W、337Y、368C、368D、368E、368F、368G、368H、368I、368K、368L、368M、368N、368P、368Q、368R、368S、368T、368V、368W、368Y、392A、392C、392D、392E、392F、392G、392H、392I、392K、392L、392M、392N、392P、392Q、392R、392S、392V、392W和392Y，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:374具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10A、P10C、P10D、P10E、P10F、P10G、P10H、P10I、P10K、P10L、P10M、P10N、P10Q、P10R、P10S、P10T、P10V、P10W、P10Y、E39A、E39C、E39D、E39F、E39G、E39H、E39I、E39K、E39L、E39M、E39N、E39P、E39Q、E39R、E39S、E39T、E39V、E39W、E39Y、R44A、R44C、R44D、R44E、R44F、R44G、R44H、R44I、R44K、R44L、R44N、R44P、R44Q、R44S、R44T、R44V、R44W、R44Y、T47A、T47C、T47D、T47E、T47F、T47G、T47H、T47I、T47K、T47L、T47M、T47N、T47P、T47Q、T47R、T47S、T47V、T47W、T47Y、H92A、H92C、H92D、H92E、H92F、H92G、H92I、H92K、H92L、H92M、H92N、H92P、H92Q、H92R、H92S、H92T、H92V、H92W、H92Y、P166A、P166C、P166D、P166E、P166F、P166G、P166H、P166I、P166K、P166L、P166M、P166N、P166Q、P166R、P166S、P166T、P166V、P166W、P166Y、A206C、A206D、A206E、A206F、A206G、A206H、A206I、A206K、A206L、A206M、A206N、A206P、A206Q、A206R、A206S、A206T、A206V、A206W、A206Y、R217A、R217C、R217D、R217E、R217F、R217G、R217H、R217I、R217K、R217L、R217M、R217N、R217P、R217Q、R217S、R217T、R217V、R217W、R217Y、D247A、D247C、D247E、D247F、D247G、D247H、D247I、D247K、D247L、D247M、D247N、D247P、D247Q、D247R、D247S、D247T、D247V、D247W、D247Y、G261A、G261C、G261D、G261E、G261F、G261H、G261I、G261K、G261L、G261M、G261N、G261P、G261Q、G261R、G261S、G261T、G261V、G261W、G261Y、A271C、A271D、A271E、A271F、A271G、A271H、A271I、A271K、A271L、A271M、A271N、A271P、A271Q、A271R、A271S、A271T、A271V、A271W、A271Y、K302A、K302C、K302D、K302E、K302F、K302G、K302H、K302I、K302L、K302M、K302N、K302P、K302Q、K302R、K302S、K302T、K302V、K302W、K302Y、D316A、D316C、D316E、D316F、D316G、D316H、D316I、D316K、D316L、D316M、D316N、D316P、D316Q、D316R、D316S、D316T、D316V、D316W、D316Y、I322A、I322C、I322D、I322E、I322F、I322G、I322H、I322K、I322L、I322M、I322N、I322P、I322Q、I322R、I322S、I322T、I322V、I322W、I322Y、P337A、P337C、P337D、P337E、P337F、P337G、P337H、P337I、P337K、P337L、P337M、P337N、P337Q、P337R、P337S、P337T、P337V、P337W、P337Y、A368C、A368D、A368E、A368F、A368G、A368H、A368I、A368K、A368L、A368M、A368N、A368P、A368Q、A368R、A368S、A368T、A368V、A368W、A368Y、T392A、T392C、T392D、T392E、T392F、T392G、T392H、T392I、T392K、T392L、T392M、T392N、T392P、T392Q、T392R、T392S、T392V、T392W和T392Y，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。

在一些实施方案中，多核苷酸编码重组α半乳糖苷酶A，所述重组α半乳糖苷酶A包含与SEQ ID NO:1022具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、10/392、31、31/39/44/166/302、31/47、31/283/284、39、39/44、39/44/47、39/44/47/261/283/284、39/44/283、39/44/339、39/47/261、39/92、39/206、39/284、44、44/284/302、84、84/92、84/284/302/392、84/316、84/368/392、92、92/206/217、92/206/275、92/206/284、92/206/302/368、92/271、92/271/277、92/275/284、92/283、92/283/392、92/284、92/302、92/316、92/368、155、155/217、155/368、166、166/283/284、166/302、206、206/217、206/334、261、261/283、271、271/368、275、283、283/284、283/392、284、302、316、334、339、368、368/392和392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:1022来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:1022具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：P10G、P10G/T392D、S31T、S31T/E39V/R44V/P166D/K302Y、S31T/T47R、S31T/K283L/D284A、E39L、E39L/H92V、E39L/A206E、E39L/D284S、E39V/R44V、E39V/R44V/T47R、E39V/R44V/T47R/G261S/K283L/D284A、E39V/R44V/K283T、E39V/R44V/A339N、E39V/T47R/G261S、R44V、R44V/D284E/K302Y、H84K、H84K/H92V、H84K/D284S/K302L/T392A、H84K/D316H、H84K/A368E/T392A、H92Q、H92T、H92T/A206E/R217N、H92T/A206E/K302T/A368E、H92T/A271K、H92T/A271K/K277R、H92T/K283P、H92T/K283V/T392W、H92T/D284M、H92T/K302L、H92T/A368E、H92V、H92V/A206E/D284S、H92V/A206Y/Q275A、H92V/Q275A/D284S、H92V/D284S、H92V/K302L、H92V/D316H、H155F、H155F/R217I、H155F/A368E、P166D、P166D/K283L/D284A、P166D/K302Y、A206E、A206E/R217N、A206I、A206Q、A206T/Y334C、A206Y、G261S、G261S/K283L、A271K、A271K/A368E、Q275A、K283L、K283P/T392W、K283T、K283T/D284E、D284E、D284M、D284S、K302L、K302Y、D316H、Y334C、A339N、A368E、A368E/T392W、T392A、T392D和T392W，其中所述多肽序列的氨基酸位置参考SEQ ID NO:1022来编号。在一些实施方案中，重组α半乳糖苷酶A包含与SEQ ID NO:1022具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10G、10G/392D、31T、31T/39V/44V/166D/302Y、31T/47R、31T/283L/284A、39L、39L/92V、39L/206E、39L/284S、39V/44V、39V/44V/47R、39V/44V/47R/261S/283L/284A、39V/44V/283T、39V/44V/339N、39V/47R/261S、44V、44V/284E/302Y、84K、84K/92V、84K/284S/302L/392A、84K/316H、84K/368E/392A、92Q、92T、92T/206E/217N、92T/206E/302T/368E、92T/271K、92T/271K/277R、92T/283P、92T/283V/392W、92T/284M、92T/302L、92T/368E、92V、92V/206E/284S、92V/206Y/275A、92V/275A/284S、92V/284S、92V/302L、92V/316H、155F、155F/217I、155F/368E、166D、166D/283L/284A、166D/302Y、206E、206E/217N、206I、206Q、206T/334C、206Y、261S、261S/283L、271K、271K/368E、275A、283L、283P/392W、283T、283T/284E、284E、284M、284S、302L、302Y、316H、334C、339N、368E、368E/392W、392A、392D和392W，其中所述多肽序列的氨基酸位置参考SEQ ID NO:1022来编号。

在一些实施方案中，如上文描述的，多核苷酸编码具有本文公开的特性的具有GLA活性的工程化多肽，其中该多肽包含与参考序列(例如，SEQ ID NO:2、8、58、158、372、374、704和1022)具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多同一性的氨基酸序列，或包含本文表格中的任一个中公开的任何变体的氨基酸序列以及与参考多肽SEQ ID NO:8或表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中公开的任何变体的氨基酸序列相比的一个或更多个残基差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中，多核苷酸编码具有本文公开的特性的具有GLA活性的工程化多肽，其中该多肽在与SEQ ID NO:8、58、158、372、374、704和/或1022的多肽最佳比对时，包含与参考序列SEQ ID NO:2、8、58、158、372、374、704和/或1022具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的氨基酸序列，以及与SEQ ID NO:2、8、58、158、372、374、704和/或1022相比的一个或更多个残基差异，所述一个或更多个残基差异位于选自表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中提供的那些残基位置处。

在一些实施方案中，编码工程化GLA多肽的多核苷酸包含SEQ ID NO:7、57、157、371、373、703和/或1021的多核苷酸序列。在一些实施方案中，多核苷酸能够在高度严格的条件下与参考多核苷酸序列杂交。在一些实施方案中，参考序列选自SEQ ID NO:1、7、57、157、275、371、373和/或1019或其互补序列或编码本文提供的任何变体GLA多肽的多核苷酸序列。在一些实施方案中，能够在高度严格条件下杂交的多核苷酸编码包含这样的氨基酸序列的GLA多肽，所述氨基酸序列与SEQ ID NO:2、8、58、158、372、374、704和/或1022相比，在选自表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中列出的任何位置的残基位置处具有一个或更多个残基差异。

在一些实施方案中，编码本文提供的任一种工程化GLA多肽的分离的多核苷酸以各种方式被操作，以提供该多肽的表达。在一些实施方案中，编码多肽的多核苷酸以表达载体提供，表达载体中存在一个或更多个控制序列，以调控多核苷酸和/或多肽的表达。取决于表达载体，在将分离的多核苷酸插入载体前对分离的多核苷酸的操作可以是期望的或必要的。用于利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。

在一些实施方案中，控制序列包括，除其它序列之外，启动子、Kozak序列、前导序列、多腺苷酸化序列、前肽序列、信号肽序列、用于基因治疗保留(gene therapyretention)的基于DNA的调控元件和转录终止子。如本领域已知的，合适的启动子可以基于使用的宿主细胞来选择。用于丝状真菌宿主细胞的示例性启动子包括从以下的基因获得的启动子：米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见，例如WO 96/00787)，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)，和其突变体、截短的和杂合的启动子。示例性酵母细胞启动子可以来自以下的基因：酿酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如，Romanos等人，Yeast 8:423-488[1992])。用于在哺乳动物细胞中使用的示例性启动子包括但不限于，来自巨细胞病毒(CMV)的启动子、与CMV增强子融合的鸡β-肌动蛋白启动子、猿猴空泡病毒40(SV40)的启动子、来自智人(Homo sapiens)的磷酸甘油酸激酶、来自β-肌动蛋白、延伸因子-1a或甘油醛-3-磷酸脱氢酶的启动子或来自原鸡(Gallus gallus)β-肌动蛋白的启动子。

在一些实施方案中，控制序列为合适的转录终止子序列，转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3'末端。在选择的宿主细胞中有功能的任何终止子可用于本发明中。例如，用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得：酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如，Romanos等，上文)。用于哺乳动物细胞的示例性终止子包括但不限于来自巨细胞病毒(CMV)、猿猴空泡病毒40(SV40)、来自智人生长激素hGH、来自牛生长激素BGH和来自人或兔β球蛋白的终止子。

在一些实施方案中，控制序列是合适的前导序列、5'-帽修饰、5'UTR等。在一些实施方案中，这些调控序列元件介导与涉及mRNA转运和翻译的分子的结合，抑制5'-外切核酸酶降解并赋予对脱帽的耐受性。前导序列被可操作地连接至编码多肽的核酸序列的5'末端。可以使用在所选择的宿主细胞中有功能的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得：米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列包括但不限于从以下的基因获得的那些：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。用于哺乳动物宿主细胞的合适的先导序列包括但不限于正痘病毒属(Orthopoxvirus)mRNA中存在的5'-UTR元件。

在一些实施方案中，控制序列包括3'非翻译核酸区和多腺苷酸化尾核酸序列，这些序列可操作地连接至蛋白编码核酸序列的3'末端，介导与涉及mRNA转运和翻译以及mRNA半衰期的蛋白的结合。在所选择的宿主细胞中有功能的任何多腺苷酸化序列和3'-UTR可用于本发明。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括但不限于来自以下的基因的那些：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列也是本领域已知的(参见例如，Guo和Sherman,Mol.Cell.Biol.,15:5983-5990[1995])。用于哺乳动物宿主细胞的有用的多腺苷酸化序列和3'UTR序列包括但不限于α球蛋白和β球蛋白mRNA的3'-UTR，所述3'-UTR含有若干个增加mRNA的稳定性和翻译的序列元件。

在一些实施方案中，控制序列为信号肽编码区，所述信号肽编码区编码连接至多肽的氨基末端的氨基酸序列并将编码的多肽引导到细胞的分泌途径中。核酸序列的编码序列的5'末端可以固有地包含信号肽编码区，所述信号肽编码区符合翻译阅读框地(intranslation reading frame)与编码分泌多肽的编码区的区段天然地连接。可选地，编码序列的5'末端可以包含对编码序列是外源的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何信号肽编码区可用于本文提供的工程化GLA多肽的表达。用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和绵毛状腐质霉(Humicola lanuginosa)脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的信号肽：酿酒酵母α因子和酿酒酵母转化酶。用于哺乳动物宿主细胞的有用的信号肽包括但不限于来自免疫球蛋白γ(IgG)基因的信号肽。

在一些实施方案中，控制序列为前肽编码区，所述前肽编码区编码定位在多肽的氨基末端处的氨基酸序列。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或在某些情况下称为“酶原(zymogen)”。前多肽可以通过催化或自体催化前肽从前多肽的裂解被转化为成熟活性多肽。

在另一方面，本发明还提供了重组表达载体，所述重组表达载体包含编码工程化GLA多肽的多核苷酸和取决于多核苷酸被引入的宿主细胞的类型的一个或更多个表达调控区域，诸如启动子和终止子、复制起点等。在一些实施方案中，将以上描述的各种核酸和控制序列连接在一起以产生重组表达载体，所述重组表达载体包含一个或更多个方便的限制位点以允许编码变体GLA多肽的核酸序列在此类位点处插入或取代。可选地，本发明的多核苷酸序列通过将多核苷酸序列或包含该多核苷酸的核酸构建体插入适当的表达载体来表达。在产生表达载体时，编码序列位于载体中，使得编码序列与用于表达的适当的控制序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒，包括但不限于腺病毒(AV)、腺相关病毒(AAV)、慢病毒(LV)和非病毒载体，诸如脂质体)，该载体可以方便地进行重组DNA程序，并可以导致变体GLA多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。

在一些实施方案中，表达载体是自主复制载体(即，作为染色体外实体存在的载体，其复制独立于染色体复制，诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选的实施方案中，载体可以是当被引入到宿主细胞中时，被整合到基因组中并与其被整合进的染色体一起复制的载体。此外，可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两种或更多种载体或质粒，或者转座子。

在一些实施方案中，表达载体优选地包含一个或更多个选择标志物，其允许容易选择经转化的细胞。“选择标志物”是一种基因，其产物提供杀生物剂或病毒耐受性、对重金属的耐受性、对营养缺陷型提供原养型等。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标志物包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))和trpC(邻氨基苯甲酸合酶)以及其等效物。在另一方面，本发明提供了包含编码本申请的至少一种工程化GLA多肽的多核苷酸的宿主细胞，所述多核苷酸被可操作地连接至一个或更多个控制序列，用于在宿主细胞中表达工程化GLA酶。用于表达由本发明的表达载体编码的多肽的宿主细胞是本领域熟知的，并且包括但不限于真菌细胞，诸如酵母细胞(例如，酿酒酵母和巴斯德毕赤酵母(Pichia pastoris)[例如，ATCC登录号201178])；昆虫细胞(例如，果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞)、植物细胞、动物细胞(例如，CHO、CHO-K1、COS和BHK)和人类细胞(例如，HEK293T、人类成纤维细胞、THP-1、Jurkat和Bowes黑素瘤细胞系)。

因此，在另一方面，本发明提供了用于产生工程化GLA多肽的方法，其中该方法包括将能够表达编码工程化GLA多肽的多核苷酸的宿主细胞在适于表达该多肽的条件下培养。在一些实施方案中，该方法还包括分离和/或纯化如本文描述的GLA多肽的步骤。

用于上文描述的宿主细胞的适当的培养基和生长条件是本领域熟知的。用于表达GLA多肽的多核苷酸可以通过本领域已知的各种方法引入到细胞中。技术包括尤其是电穿孔、生物弹射粒子轰击(biolistic particle bombardment)、脂质体介导的转染、氯化钙转染和原生质体融合。

具有本文公开的特性的工程化GLA可以通过使编码天然存在或工程化的GLA多肽的多核苷酸经受本领域已知和/或如本文描述的诱变和/或定向演化方法来获得。示例性定向演化技术为诱变和/或DNA改组(参见例如，Stemmer，Proc.Natl.Acad.Sci.USA 91:10747-10751[1994]；WO 95/22625；WO 97/0078；WO 97/35966；WO 98/27230；WO 00/42651；WO 01/75767和美国专利6,537,746)。可以使用的其他定向演化程序包括交错延伸过程(StEP)、体外重组(参见例如，Zhao等人，Nat.Biotechnol.，16:258-261[1998])、诱变PCR(参见例如，Caldwell等人，PCRMethods Appl.,3:S136-S140[1994])和盒式诱变(参见例如，Black等人，Proc.Natl.Acad.Sci.USA93:3525-3529[1996])以及其他。

例如，诱变和定向演化方法可以容易地应用于多核苷酸，以生成可以被表达、筛选和测定的变体文库。诱变和定向演化方法是本领域熟知的(参见例如，美国专利号5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,489,146、6,506,602、6,506,603、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,613,514、6,653,072、6,716,631、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,288,375、7,421,347、7,430,477、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,873,499、7,904,249、7,957,912、8,383,346、8,504,498、8,849,575、8,876,066、8,768,871、9,593,326以及所有相关的非美国的对应申请；Ling等人,Anal.Biochem.,254(2):157-78[1997]；Dale等人,Meth.Mol.Biol.,57:369-74[1996]；Smith,Ann.Rev.Genet.,19:423-462[1985]；Botstein等人,Science,229:1193-1201[1985]；Carter,Biochem.J.,237:1-7[1986]；Kramer等人,Cell,38:879-887[1984]；Wells等人,Gene,34:315-323[1985]；Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999]；Christians等人,Nat.Biotechnol.,17:259-264[1999]；Crameri等人,Nature,391:288-291[1998]；Crameri等人,Nat.Biotechnol.,15:436-438[1997]；Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997]；Crameri等人,Nat.Biotechnol.,14:315-319[1996]；Stemmer,Nature,370:389-391[1994]；Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994]；美国专利申请公布号2008/0220990、US 2009/0312196、US2014/0005057、US2014/0214391、US2014/0221216、US2015/0050658、US2015/0133307、US2015/0134315和所有相关的非美国的对应专利申请；WO 95/22625、WO 97/0078、WO 97/35966、WO 98/27230、WO 00/42651、WO 01/75767和WO 2009/152336；所有这些通过引用并入本文)。

在一些实施方案中，诱变处理后获得的酶变体通过使酶变体经受指定的温度(或其他测定条件)并测量热处理或其他测定条件之后剩余的酶活性的量来筛选。然后从宿主细胞中分离包含编码GLA多肽的多核苷酸的DNA，测序以鉴定核苷酸序列改变(如果有的话)，并用于在不同或相同的宿主细胞中表达该酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如，标准生物化学技术，诸如HPLC分析)来进行。

对于已知序列的工程化多肽，编码酶的多核苷酸可以根据已知的合成方法通过标准的固相方法制备。在一些实施方案中，多达约100个碱基的片段可以被单独合成、然后被连接(例如，通过酶促或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如，本文公开的多核苷酸和寡核苷酸可以使用经典的亚磷酰胺方法(参见例如，Beaucage等人,Tetra.Lett.,22:1859-69[1981]和Matthes等人,EMBO J.,3:801-05[1984])，如通常在自动化合成方法中所实践的，通过化学合成制备。根据亚磷酰胺方法，寡核苷酸被合成(例如，在自动DNA合成仪中)、纯化、退火、连接并克隆入适当的载体。

因此，在一些实施方案中，用于制备工程化GLA多肽的方法可以包括：(a)合成编码多肽的多核苷酸，所述多肽包含选自表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和/或表13-1中提供的任何变体氨基酸序列的氨基酸序列，以及SEQ ID NO:8、58、158、372、374、704和/或1022，和(b)表达由该多核苷酸编码的GLA多肽。在该方法的一些实施方案中，由多核苷酸编码的氨基酸序列可以任选地具有一个或若干个(例如，最多3个、4个、5个或最多10个)氨基酸残基突变(例如，缺失、插入和/或取代)。在一些实施方案中，氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基突变(例如，缺失、插入和/或取代)。在一些实施方案中，氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基突变(例如，缺失、插入和/或取代)。在一些实施方案中，氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基突变(例如，缺失、插入和/或取代)。在一些实施方案中，取代可以是保守取代或非保守取代。

可以使用本领域已知的任何合适的测定，包括但并不限于本文描述的测定和条件，评估所表达的工程化GLA多肽的任何期望的改进特性(例如，活性、选择性、稳定性、酸耐受性、蛋白酶敏感性等)。

在一些实施方案中，使用用于蛋白纯化的熟知技术中的任何一种或更多种，将在宿主细胞中表达的工程化GLA多肽的任一种从细胞和/或培养基中回收，用于蛋白纯化的熟知技术除了其他以外包括，溶菌酶处理、超声处理、过滤、盐析、超离心和色谱法。

用于分离GLA多肽的色谱技术，除了其他以外，包括，反相色谱法、高效液相色谱法、离子交换色谱法、疏水相互作用色谱法、凝胶电泳和亲和色谱法。用于纯化特定酶的条件部分地取决于因素诸如净电荷、疏水性、亲水性、分子量、分子形状等，并且对本领域技术人员将是明显的。在一些实施方案中，亲和技术可以用于分离改进的变体GLA酶。在利用亲和色谱法纯化的一些实施方案中，可使用特异性结合变体GLA多肽的任何抗体。在一些利用亲和色谱法纯化的实施方案中，可使用与共价附接至GLA的聚糖结合的蛋白。在利用亲和色谱法纯化的还其他实施方案中，可使用任何与GLA活性位点结合的小分子。为了产生抗体，通过注射GLA多肽(例如，GLA变体)或其片段来免疫各种宿主动物，包括但不限于兔、小鼠、大鼠等。在一些实施方案中，GLA多肽或片段通过侧链官能团或附接至侧链官能团的接头的方式附接至合适的载体，诸如BSA。

在一些实施方案中，工程化GLA多肽通过包括以下的方法在宿主细胞中产生：将包含编码如本文描述的工程化GLA多肽的多核苷酸序列的宿主细胞(例如，酿酒酵母、胡萝卜(Daucus carota)、烟草(Nicotiana tabacum)、智人(例如，HEK293T)或灰仓鼠(Cricetulusgriseus)(例如，CHO))在有利于工程化GLA多肽产生的条件下培养，并从细胞和/或培养基回收工程化GLA多肽。

在一些实施方案中，本发明包括产生工程化GLA多肽的方法，该方法包括在合适的培养条件下培养重组真核细胞，以允许产生工程化GLA多肽，并任选地从培养基和/或培养的细胞回收工程化GLA多肽，所述重组真核细胞包含编码工程化GLA多肽的多核苷酸序列，当与SEQ ID NO:8、58、158、372、374、704和/或1022的氨基酸序列最佳比对时，所述工程化GLA多肽与参考序列(例如，SEQ ID NO:8、58、158、372、374、704和/或1022)具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、95％、96％、97％、98％、99％或100％的序列同一性，以及与SEQ ID NO:8、58、158、372、374、704和/或1022相比的一个或更多个氨基酸残基差异，所述一个或更多个氨基酸残基差异选自表2-1、表5-1、表6-1、表7-1、表8-1、表9-1、表11-1、表12-1和表13-1中提供的那些氨基酸残基差异和/或其组合。

在一些实施方案中，将工程化GLA多肽从重组宿主细胞或细胞培养基回收后，将它们通过本领域已知的任何合适的方法进一步纯化。在一些另外的实施方案中，将纯化的GLA多肽与其他成分和化合物组合，来提供适用于不同应用和用途的包含工程化GLA多肽的组合物和制剂(例如，药物组合物)。在一些另外的实施方案中，纯化的工程化GLA多肽或配制的工程化GLA多肽被冻干。在一些实施方案中，工程化GLA多肽直接在体内(即，在诸如人类或另一种动物的体内的细胞中)产生并且不被纯化。然而，在一些可选的实施方案中，工程化GLA多肽在体内(即，在诸如人类或另一种动物的体内的细胞中)产生，并使用本领域已知的方法从体内收集。在一些另外的实施方案中，这些收集的工程化GLA多肽被纯化。在又一些另外的实施方案中，将这些收集的和/或纯化的工程化多肽引入另一种动物(例如，人类或另一种动物)中或重新引入最初产生收集的和/或纯化的工程化GLA多肽的体内。

组合物：

本发明提供了各种组合物和形式，包括但不限于下文描述的那些。在一些实施方案中，本发明提供了工程化GLA多肽，所述工程化GLA多肽适于在药物组合物和其他组合物诸如膳食/营养补充物中使用。

取决于施用方式，包含治疗有效量的根据本发明的工程化GLA的这些组合物呈固体、半固体或液体的形式。在一些实施方案中，组合物包括其他药学上可接受的组分，诸如稀释剂、缓冲液、赋形剂、盐、乳化剂、防腐剂、稳定剂、填料和其他成分。用于配制和施用的技术的细节是本领域熟知的，并在文献中被描述。在一些实施方案中，这些组合物在作为基因治疗引入后直接在人体内产生。

在一些实施方案中，配制了工程化GLA多肽用于在口服药物组合物中使用。用于在递送工程化GLA多肽中使用的任何合适的形式可用于本发明，所述形式包括但不限于丸剂、片剂、凝胶片(geltab)、胶囊、锭剂、糖衣丸、粉末、软凝胶、溶胶凝胶、凝胶、乳剂、植入物、贴剂、喷雾剂、软膏剂、搽剂、霜剂、糊剂、凝胶剂、涂剂、气雾剂、口香糖、缓和剂(demulcent)、条状物、溶液、悬浮液(包括但不限于油基悬浮液、水包油乳剂等)、浆液、糖浆剂、控释制剂、栓剂等。在一些实施方案中，工程化GLA多肽以适于注射或输注的形式提供(即，以可注射制剂的形式)。在一些实施方案中，工程化GLA多肽的多核苷酸序列以适于注射的形式提供。在一些实施方案中，工程化GLA多肽以生物相容性基质诸如溶胶凝胶(包括基于二氧化硅(例如，氧基硅烷(oxysilane))的溶胶凝胶)提供。在一些实施方案中，将工程化GLA多肽封装。在一些可选择的实施方案中，将工程化GLA多肽封装在纳米结构(例如，纳米管、纳米小管、纳米胶囊或微米胶囊、微球体、脂质体等)中。实际上，不意图本发明受限于任何特定递送制剂和/或递送方式。意图工程化GLA多肽通过本领域已知的任何合适的方式来施用，包括但不限于：肠胃外、口服、局部、经皮、鼻内、眼内、鞘内、经由植入物等。

在一些实施方案中，工程化GLA多肽通过糖基化、化学交联试剂、聚乙二醇化(即，用聚乙二醇[PEG]或活化的PEG等修饰)或其他化合物被化学修饰(参见例如，Ikeda,AminoAcids 29:283-287[2005]；美国专利号7,531,341、7,534,595、7,560,263和7,53,653；美国专利申请公布号2013/0039898、2012/0177722等)。实际上，不意图本发明受限于任何特定递送方法和/或机制。

在一些另外的实施方案中，工程化GLA多肽被提供，用于通过基因治疗(包括病毒递送载体，包括但不限于腺病毒(AV)、腺相关病毒(AAV)、慢病毒(LV)或非病毒载体(例如，脂质体))递送至细胞或组织。在一些实施方案中，工程化GLA多肽被提供，用于以封装递送媒介物(例如，脂质体)配制多核糖核苷酸序列之后，通过mRNA治疗递送至细胞或组织。在一些另外的实施方案中，工程化GLA多肽被提供，用于通过细胞疗法递送至细胞或组织，其中编码工程化GLA多肽的多核苷酸序列被引入外源性细胞，并且该细胞(或多于一个细胞)被引入受者(例如，表现出法布里病或处于发展法布里病风险的患者)中。

在一些另外的实施方案中，工程化GLA多肽在包含基质稳定的酶晶体的制剂中来提供。在一些实施方案中，该制剂包含交联的结晶工程化GLA酶和具有附接至酶晶体的反应部分的聚合物。本发明还以聚合物提供了工程化GLA多肽。

在一些实施方案中，包含本发明的工程化GLA多肽的组合物包括一种或更多种常用的载体化合物，包括但不限于糖(例如，乳糖、蔗糖、甘露糖醇和/或山梨糖醇)、淀粉(例如，玉米淀粉、小麦淀粉、大米淀粉、马铃薯淀粉或其他植物淀粉)、纤维素(例如，甲基纤维素、羟丙基甲基纤维素、羧甲基纤维素钠)、树胶(例如，阿拉伯胶、黄芪胶、瓜尔胶等)和/或蛋白(例如，明胶、胶原等)。

在一些实施方案中，本发明提供了适用于降低流体(诸如血液、脑脊液等)中糖脂浓度的工程化GLA多肽。施用的工程化GLA多肽的剂量取决于状况或疾病、受试者的一般状况以及本领域技术人员已知的其他因素。在一些实施方案中，意图将组合物单次或多于一次施用。在一些实施方案中，设想施用至患有法布里病的人类的组合物中工程化GLA多肽的浓度足以有效治疗和/或改善疾病(例如，法布里病)。在一些实施方案中，工程化GLA多肽与其他药物和/或膳食组合物组合施用。

实验

提供了以下实施例，包括实验和获得的结果，仅用于说明性目的，而不应当被解释为限制本发明。

在以下实验公开内容中，以下缩写适用：ppm(百万分率(parts per million))；M(摩尔/升)、mM(毫摩尔/升)、uM和μM(微摩尔/升)、nM(纳摩尔/升)、mol(摩尔)、gm和g(克)、mg(毫克)、ug和μg(微克)、L和l(升)、ml和mL(毫升)、cm(厘米)、mm(毫米)、um和μm(微米)、sec.(秒)、min(s)(分钟)、h(s)和hr(s)(小时)、U(单位)、MW(分子量)、rpm(转/分钟)、℃(摄氏度)、SEM(平均值的标准误差)、IV(静脉内)、CDS(编码序列)、DNA(脱氧核糖核酸)、RNA(核糖核酸)、大肠杆菌W3110(常用的实验室大肠杆菌菌株，从大肠杆菌遗传资源中心(ColiGenetic StockCenter)[CGSC],New Haven,CT可获得)、NHP(非人灵长类动物)、HPLC(高压液相色谱法)、MWCO(分子量截止值)、SDS-PAGE(十二烷基硫酸钠聚丙烯酰胺凝胶电泳)、PBS(磷酸盐缓冲盐水)、DPBS(杜氏磷酸盐缓冲盐水)、PES(聚醚砜)、CFSE(羧基荧光素琥珀酰亚胺酯)、IPTG(异丙基β-D-1-硫代吡喃半乳糖苷)、PMBS(硫酸多粘菌素B)、NADPH(烟酰胺腺嘌呤二核苷酸磷酸)、GIDH(谷氨酸脱氢酶)、FIOPC(相对于阳性对照的改进倍数)、PBMC(外周血单个核细胞)、LB(Luria肉汤)、MeOH(甲醇)、C_max(给药区间期间的最大药物浓度)、RFU(相对荧光单位)、AUC_0-t(曲线下面积，直至最后可测量的浓度)、CL(清除率)、Vz(末阶段期间的表观分布容积apparent volume of distribution during theterminalphase)、TI(测试品)；Athens Research(Athens Research Technology,Athens,GA)；ProSpec(ProSpec Tany Technogene,East Brunswick,NJ)；Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO)；Ram Scientific(RamScientific,Inc.,Yonkers,NY)；PallCorp.(Pall,Corp.,Pt.Washington,NY)；Millipore(Millipore,Corp.,BillericaMA)；Difco(Difco Laboratories,BD Diagnostic Systems,Detroit,MI)；PerkinElmer(PerkinElmer,Waltham,MA)、Molecular Devices(Molecular Devices,LLC,Sunnyvale,CA)；Kuhner(Adolf Kuhner,AG,Basel,Switzerland)；Axygen(Axygen,Inc.,Union City,CA)；Toronto Research Chemicals(Toronto Research Chemicals Inc.,Toronto,Ontario,Canada)；Cambridge Isotope Laboratories,(Cambridge IsotopeLaboratories,Inc.,Tewksbury,MA)；Applied Biosystems(Applied Biosystems,LifeTechnologies,Corp.的一部分,Grand Island,NY),Agilent(Agilent Technologies,Inc.,Santa Clara,CA)；Thermo Scientific(ThermoFisher Scientific的一部分,Waltham,MA)；Gibco(ThermoFisher Scientific)；Pierce(Pierce Biotechnology(现为Thermo Fisher Scientific的一部分),Rockford,IL)；ThermoFisher Scientific(ThermoFisher Scientific,Waltham,MA)；Corning(Corning,Inc.,Palo Alto,CA)；XenoTech(Sekisui XenoTech,LLC,Kansas City,KS)；CoriellInstitute for MedicalResearch(CoriellInstitute for MedicalResearch,Camden,NJ)；VWR(VWR International,Radnor,PA)；Jackson(The Jackson Laboratory,Bar Harbor,ME)；Megazyme(MegazymeInternational,Wicklow,Ireland)；Enzo(Enzo Life Sciences,Inc.,Farmingdale,NY)；GE Healthcare(GE Healthcare Bio-Sciences,Piscataway,NJ)；LI-COR(LI-CORBiotechnology,Lincoln,NE)；Amicus(Amicus Therapeutics,Cranbury,NJ)；Phenomenex(Phenomenex,Inc.,Torrance,CA)；Optimal(OptimalBiotech Group,Belmont,CA)以及Bio-Rad(Bio-Rad Laboratories,Hercules,CA)。

以下多核苷酸序列和多肽序列可用于本发明。在一些情况下(如下文示出的)，多核苷酸序列后面是所编码的多肽。

全长人类GLA cDNA的多核苷酸序列(SEQ ID NO.1)：

ATGCAGCTGAGGAACCCAGAACTACATCTGGGCTGCGCGCTTGCGCTTCGCTTCCTGGCCCTCGTTTCCTGGGACATCCCTGGGGCTAGAGCACTGGACAATGGATTGGCAAGGACGCCTACCATGGGCTGGCTGCACTGGGAGCGCTTCATGTGCAACCTTGACTGCCAGGAAGAGCCAGATTCCTGCATCAGTGAGAAGCTCTTCATGGAGATGGCAGAGCTCATGGTCTCAGAAGGCTGGAAGGATGCAGGTTATGAGTACCTCTGCATTGATGACTGTTGGATGGCTCCCCAAAGAGATTCAGAAGGCAGACTTCAGGCAGACCCTCAGCGCTTTCCTCATGGGATTCGCCAGCTAGCTAATTATGTTCACAGCAAAGGACTGAAGCTAGGGATTTATGCAGATGTTGGAAATAAAACCTGCGCAGGCTTCCCTGGGAGTTTTGGATACTACGACATTGATGCCCAGACCTTTGCTGACTGGGGAGTAGATCTGCTAAAATTTGATGGTTGTTACTGTGACAGTTTGGAAAATTTGGCAGATGGTTATAAGCACATGTCCTTGGCCCTGAATAGGACTGGCAGAAGCATTGTGTACTCCTGTGAGTGGCCTCTTTATATGTGGCCCTTTCAAAAGCCCAATTATACAGAAATCCGACAGTACTGCAATCACTGGCGAAATTTTGCTGACATTGATGATTCCTGGAAAAGTATAAAGAGTATCTTGGACTGGACATCTTTTAACCAGGAGAGAATTGTTGATGTTGCTGGACCAGGGGGTTGGAATGACCCAGATATGTTAGTGATTGGCAACTTTGGCCTCAGCTGGAATCAGCAAGTAACTCAGATGGCCCTCTGGGCTATCATGGCTGCTCCTTTATTCATGTCTAATGACCTCCGACACATCAGCCCTCAAGCCAAAGCTCTCCTTCAGGATAAGGACGTAATTGCCATCAATCAGGACCCCTTGGGCAAGCAAGGGTACCAGCTTAGACAGGGAGACAACTTTGAAGTGTGGGAACGACCTCTCTCAGGCTTAGCCTGGGCTGTAGCTATGATAAACCGGCAGGAGATTGGTGGACCTCGCTCTTATACCATCGCAGTTGCTTCCCTGGGTAAAGGAGTGGCCTGTAATCCTGCCTGCTTCATCACACAGCTCCTCCCTGTGAAAAGGAAGCTAGGGTTCTATGAATGGACTTCAAGGTTAAGAAGTCACATAAATCCCACAGGCACTGTTTTGCTTCAGCTAGAAAATACAATGCAGATGTCATTAAAAGACTTACTTTAG(SEQ ID NO:1)

全长人类GLA的多肽序列：

MQLRNPELHLGCALALRFLALVSWDIPGARALDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAELMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWKSIKSILDWTSFNQERIVDVAGPGGWNDPDMLVIGNFGLSWNQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRQGDNFEVWERPLSGLAWAVAMINRQEIGGPRSYTIAVASLGKGVACNPACFITQLLPVKRKLGFYEWTSRLRSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:2)

成熟的酵母密码子优化(yCDS)的人类GLA的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGAAGTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATGATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATGAGTGGACATCTAGGCTAAGAAGTCACATCAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:3)

成熟的人类GLA(天然hCDS)的多核苷酸序列：

CTGGACAATGGATTGGCAAGGACGCCTACCATGGGCTGGCTGCACTGGGAGCGCTTCATGTGCAACCTTGACTGCCAGGAAGAGCCAGATTCCTGCATCAGTGAGAAGCTCTTCATGGAGATGGCAGAGCTCATGGTCTCAGAAGGCTGGAAGGATGCAGGTTATGAGTACCTCTGCATTGATGACTGTTGGATGGCTCCCCAAAGAGATTCAGAAGGCAGACTTCAGGCAGACCCTCAGCGCTTTCCTCATGGGATTCGCCAGCTAGCTAATTATGTTCACAGCAAAGGACTGAAGCTAGGGATTTATGCAGATGTTGGAAATAAAACCTGCGCAGGCTTCCCTGGGAGTTTTGGATACTACGACATTGATGCCCAGACCTTTGCTGACTGGGGAGTAGATCTGCTAAAATTTGATGGTTGTTACTGTGACAGTTTGGAAAATTTGGCAGATGGTTATAAGCACATGTCCTTGGCCCTGAATAGGACTGGCAGAAGCATTGTGTACTCCTGTGAGTGGCCTCTTTATATGTGGCCCTTTCAAAAGCCCAATTATACAGAAATCCGACAGTACTGCAATCACTGGCGAAATTTTGCTGACATTGATGATTCCTGGAAAAGTATAAAGAGTATCTTGGACTGGACATCTTTTAACCAGGAGAGAATTGTTGATGTTGCTGGACCAGGGGGTTGGAATGACCCAGATATGTTAGTGATTGGCAACTTTGGCCTCAGCTGGAATCAGCAAGTAACTCAGATGGCCCTCTGGGCTATCATGGCTGCTCCTTTATTCATGTCTAATGACCTCCGACACATCAGCCCTCAAGCCAAAGCTCTCCTTCAGGATAAGGACGTAATTGCCATCAATCAGGACCCCTTGGGCAAGCAAGGGTACCAGCTTAGACAGGGAGACAACTTTGAAGTGTGGGAACGACCTCTCTCAGGCTTAGCCTGGGCTGTAGCTATGATAAACCGGCAGGAGATTGGTGGACCTCGCTCTTATACCATCGCAGTTGCTTCCCTGGGTAAAGGAGTGGCCTGTAATCCTGCCTGCTTCATCACACAGCTCCTCCCTGTGAAAAGGAAGCTAGGGTTCTATGAATGGACTTCAAGGTTAAGAAGTCACATAAATCCCACAGGCACTGTTTTGCTTCAGCTAGAAAATACAATGCAGATGTCATTAAAAGACTTACTT(SEQ ID NO:4)

成熟的人类GLA的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAELMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWKSIKSILDWTSFNQERIVDVAGPGGWNDPDMLVIGNFGLSWNQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRQGDNFEVWERPLSGLAWAVAMINRQEIGGPRSYTIAVASLGKGVACNPACFITQLLPVKRKLGFYEWTSRLRSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:5)

pCK110900i大肠杆菌(E.coli)表达载体的多核苷酸序列：

TCGAGTTAATTAAGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACGGCTATGACCATGATTACGGATTCACTGGCCGTCGTTTTACAATCTAGAGGCCAGCCTGGCCATAAGGAGATATACATATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTCTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAGCGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTGTTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGTTTTTTTGCACACCATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTACAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGTAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGGGCCAAACTGGCCACCATCACCATCACCATTAGGGAAGAGCAGATGGGCAAGCTTGACCTGTGAAGTGAAAAATGGCGCACATTGTGCGACATTTTTTTTTGAATTCTACGTAAAAAGCCGCCGATACATCGGCTGCTTTTTTTTTGATAGAGGTTCAAACTTGTGGTATAATGAAATAAGATCACTCCGGGGCGTATTTTTTGAGTTATCGAGATTTTCAGGAGCTAAGGAAGCTAAAATGGAGAAAAAAATCACTGGATATACCACCGTTGATATATCCCAATGGCATCGTAAAGAACATTTTGAGGCATTTCAGTCAGTTGCTCAATGTACCTATAACCAGACCGTTCAGCTGGATATTACGGCCTTTTTAAAGACCGTAAAGAAAAATAAGCACAAGTTTTATCCGGCCTTTATTCACATTCTTGCCCGCCTGATGAATGCTCATCCGGAGTTCCGTATGGCAATGAAAGACGGTGAGCTGGTGATATGGGATAGTGTTCACCCTTGTTACACCGTTTTCCATGAGCAAACTGAAACGTTTTCATCGCTCTGGAGTGAATACCACGACGATTTCCGGCAGTTTCTACACATATATTCGCAAGATGTGGCGTGTTACGGTGAAAACCTGGCCTATTTCCCTAAAGGGTTTATTGAGAATATGTTTTTCGTCTCAGCCAATCCCTGGGTGAGTTTCACCAGTTTTGATTTAAACGTGGCCAATATGGACAACTTCTTCGCCCCCGTTTTCACCATGGGCAAATATTATACGCAAGGCGACAAGGTGCTGATGCCGCTGGCGATTCAGGTTCATCATGCCGTCTGTGATGGCTTCCATGTCGGCAGAATGCTTAATGAATTACAACAGTACTGCGATGAGTGGCAGGGCGGGGCGTAACTGCAGGAGCTCAAACAGCAGCCTGTATTCAGGCTGCTTTTTTCGTTTTGGTCTGCGCGTAATCTCTTGCTCTGAAAACGAAAAAACCGCCTTGCAGGGCGGTTTTTCGAAGGTTCTCTGAGCTACCAACTCTTTGAACCGAGGTAACTGGCTTGGAGGAGCGCAGTCACCAAAACTTGTCCTTTCAGTTTAGCCTTAACCGGCGCATGACTTCAAGACTAACTCCTCTAAATCAATTACCAGTGGCTGCTGCCAGTGGTGCTTTTGCATGTCTTTCCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGACTGAACGGGGGGTTCGTGCATACAGTCCAGCTTGGAGCGAACTGCCTACCCGGAACTGAGTGTCAGGCGTGGAATGAGACAAACGCGGCCATAACAGCGGAATGACACCGGTAAACCGAAAGGCAGGAACAGGAGAGCGCACGAGGGAGCCGCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCACTGATTTGAGCGTCAGATTTCGTGATGCTTGTCAGGGGGGCGGAGCCTATGGAAAAACGGCTTTGCCGCGGCCCTCTCACTTCCCTGTTAAGTATCTTCCTGGCATCTTCCAGGAAATCTCCGCCCCGTTCGTAAGCCATTTCCGCTCGCCGCAGTCGAACGACCGAGCGTAGCGAGTCAGTGAGCGAGGAAGCGGAATATATCCTGTATCACATATTCTGCTGACGCACCGGTGCAGCCTTTTTTCTCCTGCCACATGAAGCACTTCACTGACACCCTCATCAGTGAACCACCGCTGGTAGCGGTGGTTTTTTTAGGCCTATGGCCTTTTTTTTTTGTGGGAAACCTTTCGCGGTATGGTATTAAAGCGCCCGGAAGAGAGTCAATTCAGGGTGGTGAATGTGAAACCAGTAACGTTATACGATGTCGCAGAGTATGCCGGTGTCTCTTATCAGACCGTTTCCCGCGTGGTGAACCAGGCCAGCCACGTTTCTGCGAAAACGCGGGAAAAAGTGGAAGCGGCGATGGCGGAGCTGAATTACATTCCCAACCGCGTGGCACAACAACTGGCGGGCAAACAGTCGTTGCTGATTGGCGTTGCCACCTCCAGTCTGGCCCTGCACGCGCCGTCGCAAATTGTCGCGGCGATTAAATCTCGCGCCGATCAACTGGGTGCCAGCGTGGTGGTGTCGATGGTAGAACGAAGCGGCGTCGAAGCCTGTAAAGCGGCGGTGCACAATCTTCTCGCGCAACGCGTCAGTGGGCTGATCATTAACTATCCGCTGGATGACCAGGATGCCATTGCTGTGGAAGCTGCCTGCACTAATGTTCCGGCGTTATTTCTTGATGTCTCTGACCAGACACCCATCAACAGTATTATTTTCTCCCATGAAGACGGTACGCGACTGGGCGTGGAGCATCTGGTCGCATTGGGTCACCAGCAAATCGCGCTGTTAGCGGGCCCATTAAGTTCTGTCTCGGCGCGTCTGCGTCTGGCTGGCTGGCATAAATATCTCACTCGCAATCAAATTCAGCCGATAGCGGAACGGGAAGGCGACTGGAGTGCCATGTCCGGTTTTCAACAAACCATGCAAATGCTGAATGAGGGCATCGTTTCCACTGCGATGCTGGTTGCCAACGATCAGATGGCGCTGGGCGCAATGCGCGCCATTACCGAGTCCGGGCTGCGCGTTGGTGCGGACATCTCGGTAGTGGGATACGACGATACCGAAGACAGCTCATGTTATATCCCGCCGTTAACCACCATCAAACAGGATTTTCGCCTGCTGGGGCAAACCAGCGTGGACCGCTTGCTGCAACTCTCTCAGGGCCAGGCGGTTAAGGGCAATCAGCTGTTGCCCGTCTCACTGGTGAAAAGAAAAACCACCCTGGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGGTACCCGATAAAAGCGGCTTCCTGACAGGAGGCCGTTTTGTTTC(SEQ ID NO:6)

pYT-72Bgl分泌型酵母表达载体的多核苷酸序列：

TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGTACAAATATCATAAAAAAAGAGAATCTTTTTAAGCAAGGATTTTCTTAACTTCTTCGGCGACAGCATCACCGACTTCGGTGGTACTGTTGGAACCACCTAAATCACCAGTTCTGATACCTGCATCCAAAACCTTTTTAACTGCATCTTCAATGGCTTTACCTTCTTCAGGCAAGTTCAATGACAATTTCAACATCATTGCAGCAGACAAGATAGTGGCGATAGGGTTGACCTTATTCTTTGGCAAATCTGGAGCGGAACCATGGCATGGTTCGTACAAACCAAATGCGGTGTTCTTGTCTGGCAAAGAGGCCAAGGACGCAGATGGCAACAAACCCAAGGAGCCTGGGATAACGGAGGCTTCATCGGAGATGATATCACCAAACATGTTGCTGGTGATTATAATACCATTTAGGTGGGTTGGGTTCTTAACTAGGATCATGGCGGCAGAATCAATCAATTGATGTTGAACTTTCAATGTAGGGAATTCGTTCTTGATGGTTTCCTCCACAGTTTTTCTCCATAATCTTGAAGAGGCCAAAACATTAGCTTTATCCAAGGACCAAATAGGCAATGGTGGCTCATGTTGTAGGGCCATGAAAGCGGCCATTCTTGTGATTCTTTGCACTTCTGGAACGGTGTATTGTTCACTATCCCAAGCGACACCATCACCATCGTCTTCCTTTCTCTTACCAAAGTAAATACCTCCCACTAATTCTCTAACAACAACGAAGTCAGTACCTTTAGCAAATTGTGGCTTGATTGGAGATAAGTCTAAAAGAGAGTCGGATGCAAAGTTACATGGTCTTAAGTTGGCGTACAATTGAAGTTCTTTACGGATTTTTAGTAAACCTTGTTCAGGTCTAACACTACCGGTACCCCATTTAGGACCACCCACAGCACCTAACAAAACGGCATCAGCCTTTTTGGAGGCTTCCAGCGCCTCATTTGGAAGTGGAACACCTGTAGCATCGATAGCAGCCCCCCCAATTAAATGATTTTCGAAATCGAACTTGACATTGGAACGAACATCAGAAATAGCTTTAAGAACCTTAATGGCTTCGGCTGTGATTTCTTGACCAACGTGGTCACCTGGCAAAACGACGATTTTTTTAGGGGCAGACATTACAATGGTATATCCTTGAAATATATATAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAATGCAGCTTCTCAATGATATTCGAATACGCTTTGAGGAGATACAGCCTAATATCCGACAAACTGTTTTACAGATTTACGATCGTACTTGTTACCCATCATTGAATTTTGAACATCCGAACCTGGGAGTTTTCCCTGAAACAGATAGTATATTTGAACCTGTATAATAATATATAGTCTAGCGCTTTACGGAAGACAATGTATGTATTTCGGTTCCTGGAGAAACTATTGCATCTATTGCATAGGTAATCTTGCACGTCGCATCCCCGGTTCATTTTCTGCGTTTCCATCTTGCACTTCAATAGCATATCTTTGTTAACGAAGCATCTGTGCTTCATTTTGTAGAACAAAAATGCAACGCGAGAGCGCTAATTTTTCAAACAAAGAATCTGAGCTGCATTTTTACAGAACAGAAATGCAACGCGAAAGCGCTATTTTACCAACGAAGAATCTGTGCTTCATTTTTGTAAAACAAAAATGCAACGCGAGAGCGCTAATTTTTCAAACAAAGAATCTGAGCTGCATTTTTACAGAACAGAAATGCAACGCGAGAGCGCTATTTTACCAACAAAGAATCTATACTTCTTTTTTGTTCTACAAAAATGCATCCCGAGAGCGCTATTTTTCTAACAAAGCATCTTAGATTACTTTTTTTCTCCTTTGTGCGCTCTATAATGCAGTCTCTTGATAACTTTTTGCACTGTAGGTCCGTTAAGGTTAGAAGAAGGCTACTTTGGTGTCTATTTTCTCTTCCATAAAAAAAGCCTGACTCCACTTCCCGCGTTTACTGATTACTAGCGAAGCTGCGGGTGCATTTTTTCAAGATAAAGGCATCCCCGATTATATTCTATACCGATGTGGATTGCGCATACTTTGTGAACAGAAAGTGATAGCGTTGATGATTCTTCATTGGTCAGAAAATTATGAACGGTTTCTTCTATTTTGTCTCTATATACTACGTATAGGAAATGTTTACATTTTCGTATTGTTTTCGATTCACTCTATGAATAGTTCTTACTACAATTTTTTTGTCTAAAGAGTAATACTAGAGATAAACATAAAAAATGTAGAGGTCGAGTTTAGATGCAAGTTCAAGGAGCGAAAGGTGGATGGGTAGGTTATATAGGGATATAGCACAGAGATATATAGCAAAGAGATACTTTTGAGCAATGTTTGTGGAAGCGGTATTCGCAATATTTTAGTAGCTCGTTACAGTCCGGTGCGTTTTTGGTTTTTTGAAAGTGCGTCTTCAGAGCGCTTTTGGTTTTCAAAAGCGCTCTGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTTCAAAGCGTTTCCGAAAACGAGCGCTTCCGAAAATGCAACGCGAGCTGCGCACATACAGCTCACTGTTCACGTCGCACCTATATCTGCGTGTTGCCTGTATATATATATACATGAGAAGAACGGCATAGTGCGTGTTTATGCTTAAATGCGTACTTATATGCGTCTATTTATGTAGGATGAAAGGTAGTCTAGTACCTCCTGTGATATTATCCCATTCCATGCGGGGTATCGTATGCTTCCTTCAGCACTACCCTTTAGCTGTTCTATATGCTGCCACTCCTCAATTGGATTAGTCTCATCCTTCAATGCTATCATTTCCTTTGATATTGGATCATATGCATAGTACCGAGAAACTAGTGCGAAGTAGTGATCAGGTATTGCTGTTATCTGATGAGTATACGTTGTCCTGGCCACGGCAGAAGCACGCTTATCGCTCCAATTTCCCACAACATTAGTCAACTCCGTTAGGCCCTTCATTGAAAGAAATGAGGTCATCAAATGTCTTCCAATGTGAGATTTTGGGCCATTTTTTATAGCAAAGATTGAATAAGGCGCATTTTTCTTCAAAGCTTTATTGTACGATCTGACTAAGTTATCTTTTAATAATTGGTATTCCTGTTTATTGCTTGAAGAATTGCCGGTCCTATTTACTCGTTTTAGGACTGGTTCAGAATTCCTCAAAAATTCATCCAAATATACAAGTGGATCGATGATAAGCTGTCAAACATGAGAATTCTTGAAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTGTTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGCAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATACACTCCGCTATCGCTACGTGACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGGCAGCTGCGGTAAAGCTCATCAGCGTGGTCGTGAAGCGATTCACAGATGTCTGCCTGTTCATCCGCGTCCAGCTCGTTGAGTTTCTCCAGAAGCGTTAATGTCTGGCTTCTGATAAAGCGGGCCATGTTAAGGGCGGTTTTTTCCTGTTTGGTCACTGATGCCTCCGTGTAAGGGGGATTTCTGTTCATGGGGGTAATGATACCGATGAAACGAGAGAGGATGCTCACGATACGGGTTACTGATGATGAACATGCCCGGTTACTGGAACGTTGTGAGGGTAAACAACTGGCGGTATGGATGCGGCGGGACCAGAGAAAAATCACTCAGGGTCAATGCCAGCGCTTCGTTAATACAGATGTAGGTGTTCCACAGGGTAGCCAGCAGCATCCTGCGATGCAGATCCGGAACATAATGGTGCAGGGCGCTGACTTCCGCGTTTCCAGACTTTACGAAACACGGAAACCGAAGACCATTCATGTTGTTGCTCAGGTCGCAGACGTTTTGCAGCAGCAGTCGCTTCACGTTCGCTCGCGTATCGGTGATTCATTCTGCTAACCAGTAAGGCAACCCCGCCAGCCTAGCCGGGTCCTCAACGACAGGAGCACGATCATGCGCACCCGTGGCCAGGACCCAACGCTGCCCGAGATGCGCCGCGTGCGGCTGCTGGAGATGGCGGACGCGATGGATATGTTCTGCCAAGGGTTGGTTTGCGCATTCACAGTTCTCCGCAAGAATTGATTGGCTCCAATTCTTGGAGTGGTGAATCCGTTAGCGAGGTGCCGCCGGCTTCCATTCAGGTCGAGGTGGCCCGGCTCCATGCACCGCGACGCAACGCGGGGAGGCAGACAAGGTATAGGGCGGCGCCTACAATCCATGCCAACCCGTTCCATGTGCTCGCCGAGGCGGCATAAATCGCCGTGACGATCAGCGGTCCAATGATCGAAGTTAGGCTGGTAAGAGCCGCGAGCGATCCTTGAAGCTGTCCCTGATGGTCGTCATCTACCTGCCTGGACAGCATGGCCTGCAACGCGGGCATCCCGATGCCGCCGGAAGCGAGAAGAATCATAATGGGGAAGGCCATCCAGCCTCGCGTCGCGAACGCCAGCAAGACGTAGCCCAGCGCGTCGGCCGCCATGCCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGGATCTGGGCAAAACGTAGGGGCAAACAAACGGAAAAATCGTTTCTCAAATTTTCTGATGCCAAGAACTCTAACCAGTCTTATCTAAAAATTGCCTTATGATCCGTCTCTCCGGTTACAGCCTGTGTAACTGATTAATCCTGCCTTTCTAATCACCATTCTAATGTTTTAATTAAGGGATTTTGTCTTCATTAACGGCTTTCGCTCATAAAAATGTTATGACGTTTTGCCCGCAGGCGGGAAACCATCCACTTCACGAGACTGATCTCCTCTGCCGGAACACCGGGCATCTCCAACTTATAAGTTGGAGAAATAAGAGAATTTCAGATTGAGAGAATGAAAAAAAAAAAAAAAAAAAGGCAGAGGAGAGCATAGAAATGGGGTTCACTTTTTGGTAAAGCTATAGCATGCCTATCACATATAAATAGAGTGCCAGTAGCGACTTTTTTCACACTCGAAATACTCTTACTACTGCTCTCTTGTTGTTTTTATCACTTCTTGTTTCTTCTTGGTAAATAGAATATCAAGCTACAAAAAGCATACAATCAACTATCAACTATTAACTATATCGTAATACACAGGATCCACCATGAAGGCTGCTGCGCTTTCCTGCCTCTTCGGCAGTACCCTTGCCGTTGCAGGCGCCATTGAATCGAGAAAGGTTCACCAGAAGCCCCTCGCGAGATCTGAACCTTTTTACCCGTCGCCATGGATGAATCCCAACGCCATCGGCTGGGCGGAGGCCTATGCCCAGGCCAAGTCCTTTGTCTCCCAAATGACTCTGCTAGAGAAGGTCAACTTGACCACGGGAGTCGGCTGGGGGGAGGAGCAGTGCGTCGGCAACGTGGGCGCGATCCCTCGCCTTGGACTTCGCAGTCTGTGCATGCATGACTCCCCTCTCGGCGTGCGAGGAACCGACTACAACTCAGCGTTCCCCTCTGGCCAGACCGTTGCTGCTACCTGGGATCGCGGTCTGATGTACCGTCGCGGCTACGCAATGGGCCAGGAGGCCAAAGGCAAGGGCATCAATGTCCTTCTCGGACCAGTCGCCGGCCCCCTTGGCCGCATGCCCGAGGGCGGTCGTAACTGGGAAGGCTTCGCTCCGGATCCCGTCCTTACCGGCATCGGCATGTCCGAGACGATCAAGGGCATTCAGGATGCTGGCGTCATCGCTTGTGCGAAGCACTTTATTGGAAACGAGCAGGAGCACTTCAGACAGGTGCCAGAAGCCCAGGGATACGGTTACAACATCAGCGAAACCCTCTCCTCCAACATTGACGACAAGACCATGCACGAGCTCTACCTTTGGCCGTTTGCCGATGCCGTCCGGGCCGGCGTCGGCTCTGTCATGTGCTCGTACAACCAGGGCAACAACTCGTACGCCTGCCAGAACTCGAAGCTGCTGAACGACCTCCTCAAGAACGAGCTTGGGTTTCAGGGCTTCGTCATGAGCGACTGGTGGGCACAGCACACTGGCGCAGCAAGCGCCGTGGCTGGTCTCGATATGTCCATGCCGGGCGACACCATGGTCAACACTGGCGTCAGTTTCTGGGGCGCCAATCTCACCCTCGCCGTCCTCAACGGCACAGTCCCTGCCTACCGTCTCGACGACATGTGCATGCGCATCATGGCCGCCCTCTTCAAGGTCACCAAGACCACCGACCTGGAACCGATCAACTTCTCCTTCTGGACCCGCGACACTTATGGCCCGATCCACTGGGCCGCCAAGCAGGGCTACCAGGAGATTAATTCCCACGTTGACGTCCGCGCCGACCACGGCAACCTCATCCGGAACATTGCCGCCAAGGGTACGGTGCTGCTGAAGAATACCGGCTCTCTACCCCTGAACAAGCCAAAGTTCGTGGCCGTCATCGGCGAGGATGCTGGGCCGAGCCCCAACGGGCCCAACGGCTGCAGCGACCGCGGCTGTAACGAAGGCACGCTCGCCATGGGCTGGGGATCCGGCACAGCCAACTATCCGTACCTCGTTTCCCCCGACGCCGCGCTCCAGGCGCGGGCCATCCAGGACGGCACGAGGTACGAGAGCGTCCTGTCCAACTACGCCGAGGAAAATACAAAGGCTCTGGTCTCGCAGGCCAATGCAACCGCCATCGTCTTCGTCAATGCCGACTCAGGCGAGGGCTACATCAACGTGGACGGTAACGAGGGCGACCGTAAGAACCTGACTCTCTGGAACAACGGTGATACTCTGGTCAAGAACGTCTCGAGCTGGTGCAGCAACACCATCGTCGTCATCCACTCGGTCGGCCCGGTCCTCCTGACCGATTGGTACGACAACCCCAACATCACGGCCATTCTCTGGGCTGGTCTTCCGGGCCAGGAGTCGGGCAACTCCATCACCGACGTGCTTTACGGCAAGGTCAACCCCGCCGCCCGCTCGCCCTTCACTTGGGGCAAGACCCGCGAAAGCTATGGCGCGGACGTCCTGTACAAGCCGAATAATGGCAATTGGGCGCCCCAACAGGACTTCACCGAGGGCGTCTTCATCGACTACCGCTACTTCGACAAGGTTGACGATGACTCGGTCATCTACGAGTTCGGCCACGGCCTGAGCTACACCACCTTCGAGTACAGCAACATCCGCGTCGTCAAGTCCAACGTCAGCGAGTACCGGCCCACGACGGGCACCACGATTCAGGCCCCGACGTTTGGCAACTTCTCCACCGACCTCGAGGACTATCTCTTCCCCAAGGACGAGTTCCCCTACATCCCGCAGTACATCTACCCGTACCTCAACACGACCGACCCCCGGAGGGCCTCGGGCGATCCCCACTACGGCCAGACCGCCGAGGAGTTCCTCCCGCCCCACGCCACCGATGACGACCCCCAGCCGCTCCTCCGGTCCTCGGGCGGAAACTCCCCCGGCGGCAACCGCCAGCTGTACGACATTGTCTACACAATCACGGCCGACATCACGAATACGGGCTCCGTTGTAGGCGAGGAGGTACCGCAGCTCTACGTCTCGCTGGGCGGTCCCGAGGATCCCAAGGTGCAGCTGCGCGACTTTGACAGGATGCGGATCGAACCCGGCGAGACGAGGCAGTTCACCGGCCGCCTGACGCGCAGAGATCTGAGCAACTGGGACGTCACGGTGCAGGACTGGGTCATCAGCAGGTATCCCAAGACGGCATATGTTGGGAGGAGCAGCCGGAAGTTGGATCTCAAGATTGAGCTTCCTTGATAAGTCGACCTCGACTTTGTTCCCACTGTACTTTTAGCTCGTACAAAATACAATATACTTTTCATTTCTCCGTAAACAACATGTTTTCCCATGTAATATCCTTTTCTATTTTTCGTTCCGTTACCAACTTTACACATACTTTATATAGCTATTCACTTCTATACACTAAAAAACTAAGACAATTTTAATTTTGCTGCCTGCCATATTTCAATTTGTTATAAATTCCTATAATTTATCCTATTAGTAGCTAAAAAAAGATGAATGTGAATCGAATCCTAAGAGAATTGGATCTGATCCACAGGACGGGTGTGGTCGCCATGATCGCGTAGTCGATAGTGGCTCCAAGTAGCGAAGCGAGCAGGACTGGGCGGCGGCCAAAGCGGTCGGACAGTGCTCCGAGAACGGGTGCGCATAGAAATTGCATCAACGCATATAGCGCTAGCAGCACGCCATAGTGACTGGCGATGCTGTCGGAATGGACGATATCCCGCAAGAGGCCCGGCAGTACCGGCATAACCAAGCCTATGCCTACAGCATCCAGGGTGACGGTGCCGAGGATGACGATGAGCGCATTGTTAGATTTCATACACGGTGCCTGACTGCGTTAGCAATTTAACTGTGATAAACTACCGCATTAAAGCTTTTTCTTTCCAATTTTTTTTTTTTCGTCATTATAAAAATCATTACGACCGAGATTCCCGGGTAATAACTGATATAATTAAATTGAAGCTCTAATTTGTGAGTTTAGTATACATGCATTTACTTATAATACAGTTTTTTAGTTTTGCTGGCCGCATCTTCTCAAATATGCTTCCCAGCCTGCTTTTCTGTAACGTTCACCCTCTACCTTAGCATCCCTTCCCTTTGCAAATAGTCCTCTTCCAACAATAATAATGTCAGATCCTGTAGAGACCACATCATCCACGGTTCTATACTGTTGACCCAATGCGTCTCCCTTGTCATCTAAACCCACACCGGGTGTCATAATCAACCAATCGTAACCTTCATCTCTTCCACCCATGTCTCTTTGAGCAATAAAGCCGATAACAAAATCTTTGTCGCTCTTCGCAATGTCAACAGTACCCTTAGTATATTCTCCAGTAGATAGGGAGCCCTTGCATGACAATTCTGCTAACATCAAAAGGCCTCTAGGTTCCTTTGTTACTTCTTCTGCCGCCTGCTTCAAACCGCTAACAATACCTGGGCCCACCACACCGTGTGCATTCGTAATGTCTGCCCATTCTGCTATTCTGTATACACCCGCAGAGTACTGCAATTTGACTGTATTACCAATGTCAGCAAATTTTCTGTCTTCGAAGAGTAAAAAATTGTACTTGGCGGATAATGCCTTTAGCGGCTTAACTGTGCCCTCCATGGAAAAATCAGTCAAGATATCCACATGTGTTTTTAGTAAACAAATTTTGGGACCTAATGCTTCAACTAACTCCAGTAATTCCTTGGTGGTACGAACATCCAATGAAGCACACAAGTTTGTTTGCTTTTCGTGCATGATATTAAATAGCTTGGCAGCAACAGGACTAGGATGAGTAGCAGCACGTTCCTTATATGTAGCTTTCGACATGATTTATCTTCGTTTCCTGCAGGTTTTTGTTCTGTGCAGTTGGGTTAAGAATACTGGGCAATTTCATGTTTCTTCAACACTACATATGCGTATATATACCAATCTAAGTCTGTGCTCCTTCCTTCGTTCTTCCTTCTGTTCGGAGATTACCGAATCAAAAAAATTTCAAGGAAACCGAAATCAAAAAAAAGAATAAAAAAAAAATGATGAATTGAAAAGCTTATCGATCCTACCCCTTGCGCTAAAGAAGTATATGTGCCTACTAACGCTTGTCTTTGTCTCTGTCACTAAACACTGGATTATTACTCCCAGATACTTATTTTGGACTAATTTAAATGATTTCGGATCAACGTTCTTAATATCGCTGAATCTTCCACAATTGATGAAAGTAGCTAGGAAGAGGAATTGGTATAAAGTTTTTGTTTTTGTAAATCTCGAAGTATACTCAAACGAATTTAGTATTTTCTCAGTGATCTCCCAGATGCTTTCACCCTCACTTAGAAGTGCTTTAAGCATTTTTTTACTGTGGCTATTTCCCTTATCTGCTTCTTCCGATGATTCGAACTGTAATTGCAAACTACTTACAATATCAGTGATATCAGATTGATGTTTTTGTCCATAGTAAGGAATAATTGTAAATTCCCAAGCAGGAATCAATTTCTTTAATGAGGCTTCCAGAATTGTTGCTTTTTGCGTCTTGTATTTAAACTGGAGTGATTTATTGACAATATCGAAACTCAGCGAATTGCTTATGATAGTATTATAGCTCATGAATGTGGCTCTCTTGATTGCTGTTCCGTTATGTGTAATCATCCAACATAAATAGGTTAGTTCAGCAGCACATAATGCTATTTTCTCACCTGAAGGTCTTTCAAACCTTTCCACAAACTGACGAACAAGCACCTTAGGTGGTGTTTTACATAATATATCAAATTGTGGCATGCTTAGCGCCGATCTTGTGTGCAATTGATATCTAGTTTCAACTACTCTATTTATCTTGTATCTTGCAGTATTCAAACACGCTAACTCGAAAAACTAACTTTAATTGTCCTGTTTGTCTCGCGTTCTTTCGAAAAATGCACCGGCCGCGCATTATTTGTACTGCGAAAATAATTGGTACTGCGGTATCTTCATTTCATATTTTAAAAATGCACCTTTGCTGCTTTTCCTTAATTTTTAGACGGCCCGCAGGTTCGTTTTGCGGTACTATCTTGTGATAAAAAGTTGTTTTGACATGTGATCTGCACAGATTTTATAATGTAATAAGCAAGAATACATTATCAAACGAACAATACTGGTAAAAGAAAACCAAAATGGACGACATTGAAACAGCCAAGAATCTGACGGTAAAAGCACGTACAGCTTATAGCGTCTGGGATGTATGTCGGCTGTTTATTGAAATGATTGCTCCTGATGTAGATATTGATATAGAGAGTAAACGTAAGTCTGATGAGCTACTCTTTCCAGGATATGTCATAAGGCCCATGGAATCTCTCACAACCGGTAGGCCGTATGGTCTTGATTCTAGCGCAGAAGATTCCAGCGTATCTTCTGACTCCAGTGCTGAGGTAATTTTGCCTGCTGCGAAGATGGTTAAGGAAAGGTTTGATTCGATTGGAAATGGTATGCTCTCTTCACAAGAAGCAAGTCAGGCTGCCATAGATTTGATGCTACAGAATAACAAGCTGTTAGACAATAGAAAGCAACTATACAAATCTATTGCTATAATAATAGGAAGATTGCCCGAGAAAGACAAGAAGAGAGCTACCGAAATGCTCATGAGAAAAATGGATTGTACACAGTTATTAGTCCCACCAGCTCCAACGGAAGAAGATGTTATGAAGCTCGTAAGCGTCGTTACCCAATTGCTTACTTTAGTTCCACCAGATCGTCAAGCTGCTTTAATAGGTGATTTATTCATCCCGGAATCTCTAAAGGATATATTCAATAGTTTCAATGAACTGGCGGCAGAGAATCGTTTACAGCAAAAAAAGAGTGAGTTGGAAGGAAGGACTGAAGTGAACCATGCTAATACAAATGAAGAAGTTCCCTCCAGGCGAACAAGAAGTAGAGACACAAATGCAAGAGGAGCATATAAATTACAAAACACCATCACTGAGGGCCCTAAAGCGGTTCCCACGAAAAAAAGGAGAGTAGCAACGAGGGTAAGGGGCAGAAAATCACGTAATACTTCTAGGGTATGATCCAATATCAAAGGAAATGATAGCATTGAAGGATGAGACTAATCCAATTGAGGAGTGGCAGCATATAGAACAGCTAAAGGGTAGTGCTGAAGGAAGCATACGATACCCCGCATGGAATGGGATAATATCACAGGAGGTACTAGACTACCTTTCATCCTACATAAATAGACGCATATAAGTACGCATTTAAGCATAAACACGCACTATGCCGTTCTTCTCATGTATATATATATACAGGCAACACGCAGATATAGGTGCGACGTGAACAGTGAGCTGTATGTGCGCAGCTCGCGTTGCATTTTCGGAAGCGCTCGTTTTCGGAAACGCTTTGAAGTTCCTATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTCAGAGCGCTTTTGAAAACCAAAAGCGCTCTGAAGACGCACTTTCAAAAAACCAAAAACGCACCGGACTGTAACGAGCTACTAAAATATTGCGAATACCGCTTCCACAAACATTGCTCAAAAGTATCTCTTTGCTATATATCTCTGTGCTATATCCCTATATAACCTACCCATCCACCTTTCGCTCCTTGAACTTGCATCTAAACTCGACCTCTACATCAACAGGCTTCCAATGCTCTTCAAATTTTACTGTCAAGTAGACCCATACGGCTGTAATATGCTGCTCTTCATAATGTAAGCTTATCTTTATCGAATCGTGTGAAAAACTACTACCGCGATAAACCTTTACGGTTCCCTGAGATTGAATTAGTTCCTTTAGTATATGATACAAGACACTTTTGAACTTTGTACGACGAATTTTGAGGTTCGCCATCCTCTGGCTATTTCCAATTATCCTGTCGGCTATTATCTCCGCCTCAGTTTGATCTTCCGCTTCAGACTGCCATTTTTCACATAATGAATCTATTTCACCCCACAATCCTTCATCCGCCTCCGCATCTTGTTCCGTTAAACTATTGACTTCATGTTGTACATTGTTTAGTTCACGAGAAGGGTCCTCTTCAGGCGGTAGCTCCTGATCTCCTATATGACCTTTATCCTGTTCTCTTTCCACAAACTTAGAAATGTATTCATGAATTATGGAGCACCTAATAACATTCTTCAAGGCGGAGAAGTTTGGGCCAGATGCCCAATATGCTTGACATGAAAACGTGAGAATGAATTTAGTATTATTGTGATATTCTGAGGCAATTTTATTATAATCTCGAAGATAAGAGAAGAATGCAGTGACCTTTGTATTGACAAATGGAGATTCCATGTATCTAAAAAATACGCCTTTAGGCCTTCTGATACCCTTTCCCCTGCGGTTTAGCGTGCCTTTTACATTAATATCTAAACCCTCTCCGATGGTGGCCTTTAACTGACTAATAAATGCAACCGATATAAACTGTGATAATTCTGGGTGATTTATGATTCGATCGACAATTGTATTGTACACTAGTGCAGGATCAGGCCAATCCAGTTCTTTTTCAATTACCGGTGTGTCGTCTGTATTCAGTACATGTCCAACAAATGCAAATGCTAACGTTTTGTATTTCTTATAATTGTCAGGAACTGGAAAAGTCCCCCTTGTCGTCTCGATTACACACCTACTTTCATCGTACACCATAGGTTGGAAGTGCTGCATAATACATTGCTTAATACAAGCAAGCAGTCTCTCGCCATTCATATTTCAGTTATTTTCCATTACAGCTGATGTCATTGTATATCAGCGCTGTAAAAATCTATCTGTTACAGAAGGTTTTCGCGGTTTTTATAAACAAAACTTTCGTTACGAAATCGAGCAATCACCCCAGCTGCGTATTTGGAAATTCGGGAAAAAGTAGAGCAACGCGAGTTGCATTTTTTACACCATAATGCATGATTAACTTCGAGAAGGGATTAAGGCTAATTTCACTAGTATGTTTCAAAAACCTCAATCTGTCCATTGAATGCCTTATAAAACAGCTATAGATTGCATAGAAGAGTTAGCTACTCAATGCTTTTTGTCAAAGCTTACTGATGATGATGTGTCTACTTTCAGGCGGGTCTGTAGTAAGGAGAATGACATTATAAAGCTGGCACTTAGAATTCCACGGACTATAGACTATACTAGTATACTCCGTCTACTGTACGATACACTTCCGCTCAGGTCCTTGTCCTTTAACGAGGCCTTACCACTCTTTTGTTACTCTATTGATCCAGCTCAGCAAAGGCAGTGTGATCTAAGATTCTATCTTCGCGATGTAGTAAAACTAGCTAGACCGAGAAAGAGACTAGAAATGCAAAAGGCACTTCTACAATGGCTGCCATCATTATTATCCGATGTGACGCTGCA(SEQ ID NO:7)

变体No.73yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATGATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATGAGTGGACATCTAGGCTAAGAAGTCACATCAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:8)

变体No.73的多核苷酸序列：

CTGGACAATGGATTGGCAAGGACGCCTACCATGGGCTGGCTGCACTGGGAGCGCTTCATGTGCAACCTTGACTGCCAGGAAGAGCCAGATTCCTGCATCAGTGAGAAGCTCTTCATGGAGATGGCAGAGCTCATGGTCTCAGAAGGCTGGAAGGATGCAGGTTATGAGTACCTCTGCATTGATGACTGTTGGATGGCTCCCCAAAGAGATTCAGAAGGCAGACTTCAGGCAGACCCTCAGCGCTTTCCTCATGGGATTCGCCAGCTAGCTAATTATGTTCACAGCAAAGGACTGAAGCTAGGGATTTATGCAGATGTTGGAAATAAAACCTGCGCAGGCTTCCCTGGGAGTTTTGGATACTACGACATTGATGCCCAGACCTTTGCTGACTGGGGAGTAGATCTGCTAAAATTTGATGGTTGTTACTGTGACAGTTTGGAAAATTTGGCAGATGGTTATAAGCACATGTCCTTGGCCCTGAATAGGACTGGCAGAAGCATTGTGTACTCCTGTGAGTGGCCTCTTTATATGTGGCCCTTTCAAAAGCCCAATTATACAGAAATCCGACAGTACTGCAATCACTGGCGAAATTTTGCTGACATTGATGATTCCTGGGCGAGTATAAAGAGTATCTTGGACTGGACATCTTTTAACCAGGAGAGAATTGTTGATGTTGCTGGACCAGGGGGTTGGAATGACCCAGATATGTTAGTGATTGGCAACTTTGGCCTCAGCTGGAATCAGCAAGTAACTCAGATGGCCCTCTGGGCTATCATGGCTGCTCCTTTATTCATGTCTAATGACCTCCGACACATCAGCCCTCAAGCCAAAGCTCTCCTTCAGGATAAGGACGTAATTGCCATCAATCAGGACCCCTTGGGCAAGCAAGGGTACCAGCTTAGACAGGGAGACAACTTTGAAGTGTGGGAACGACCTCTCTCAGGCTTAGCCTGGGCTGTAGCTATGATAAACCGGCAGGAGATTGGTGGACCTCGCTCTTATACCATCGCAGTTGCTTCCCTGGGTAAAGGAGTGGCCTGTAATCCTGCCTGCTTCATCACACAGCTCCTCCCTGTGAAAAGGAAGCTAGGGTTCTATGAATGGACTTCAAGGTTAAGAAGTCACATAAATCCCACAGGCACTGTTTTGCTTCAGCTAGAAAATACAATGCAGATGTCATTAAAAGACTTACTT(SEQ ID NO:9)

变体No.73的多肽序列：LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAELMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSFNQERIVDVAGPGGWNDPDMLVIGNFGLSWNQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRQGDNFEVWERPLSGLAWAVAMINRQEIGGPRSYTIAVASLGKGVACNPACFITQLLPVKRKLGFYEWTSRLRSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:10)

变体No.218yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATTATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATAACTGGACATCTAGGCTAAAAAGTCACATTAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:11)

变体No.218hCDS的多核苷酸序列：

CTGGACAATGGATTGGCAAGGACGCCTACCATGGGCTGGCTGCACTGGGAGCGCTTCATGTGCAACCTTGACTGCCAGGAAGAGCCAGATTCCTGCATCAGTGAGAAGCTCTTCATGGAGATGGCAGAGCTCATGGTCTCAGAAGGCTGGAAGGATGCAGGTTATGAGTACCTCTGCATTGATGACTGTTGGATGGCTCCCCAAAGAGATTCAGAAGGCAGACTTCAGGCAGACCCTCAGCGCTTTCCTCATGGGATTCGCCAGCTAGCTAATTATGTTCACAGCAAAGGACTGAAGCTAGGGATTTATGCAGATGTTGGAAATAAAACCTGCGCAGGCTTCCCTGGGAGTTTTGGATACTACGACATTGATGCCCAGACCTTTGCTGACTGGGGAGTAGATCTGCTAAAATTTGATGGTTGTTACTGTGACAGTTTGGAAAATTTGGCAGATGGTTATAAGCACATGTCCTTGGCCCTGAATAGGACTGGCAGAAGCATTGTGTACTCCTGTGAGTGGCCTCTTTATATGTGGCCCTTTCAAAAGCCCAATTATACAGAAATCCGACAGTACTGCAATCACTGGCGAAATTTTGCTGACATTGATGATTCCTGGGCGAGTATAAAGAGTATCTTGGACTGGACATCTTTTAACCAGGAGAGAATTGTTGATGTTGCTGGACCAGGGGGTTGGAATGACCCAGATATGTTAGTGATTGGCAACTTTGGCCTCAGCTGGAATCAGCAAGTAACTCAGATGGCCCTCTGGGCTATCATGGCTGCTCCTTTATTCATGTCTAATGACCTCCGACACATCAGCCCTCAAGCCAAAGCTCTCCTTCAGGATAAGGACGTAATTGCCATCAATCAGGACCCCTTGGGCAAGCAAGGGTACCAGCTTAGACAGGGAGACAACTTTGAAGTGTGGGAACGACCTCTCTCAGGCTTAGCCTGGGCTGTAGCTATTATAAACCGGCAGGAGATTGGTGGACCTCGCTCTTATACCATCGCAGTTGCTTCCCTGGGTAAAGGAGTGGCCTGTAATCCTGCCTGCTTCATCACACAGCTCCTCCCTGTGAAAAGGAAGCTAGGGTTCTATAACTGGACTTCAAGGTTAAAAAGTCACATAAATCCCACAGGCACTGTTTTGCTTCAGCTAGAAAATACAATGCAGATGTCATTAAAAGACTTACTT(SEQ ID NO:12)

变体No.218的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAELMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSFNQERIVDVAGPGGWNDPDMLVIGNFGLSWNQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRQGDNFEVWERPLSGLAWAVAIINRQEIGGPRSYTIAVASLGKGVACNPACFITQLLPVKRKLGFYNWTSRLKSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:13)

变体No.326yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACGGATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAAGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTCGTAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGGACCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGAAAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGAGATGCGTGGGCTGTTGCTATTATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCCCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGACAATTGGGTTTCTATAACTGGACCTCTAGGCTAAAAAGTCACATTAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:14)

变体No.326的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAERMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSRNQERIVDVAGPGGWNDPDMLVIGNFGLSWDQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRKGDNFEVWERPLSGDAWAVAIINRQEIGGPRSYTIPVASLGKGVACNPACFITQLLPVKRQLGFYNWTSRLKSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:15)

变体No.206yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATGATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATAATTGGACCTCTAGGCTAAGAAGTCACATCAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:16)

变体No.206hCDS的多核苷酸序列：

CTGGACAATGGATTGGCAAGGACGCCTACCATGGGCTGGCTGCACTGGGAGCGCTTCATGTGCAACCTTGACTGCCAGGAAGAGCCAGATTCCTGCATCAGTGAGAAGCTCTTCATGGAGATGGCAGAGCTCATGGTCTCAGAAGGCTGGAAGGATGCAGGTTATGAGTACCTCTGCATTGATGACTGTTGGATGGCTCCCCAAAGAGATTCAGAAGGCAGACTTCAGGCAGACCCTCAGCGCTTTCCTCATGGGATTCGCCAGCTAGCTAATTATGTTCACAGCAAAGGACTGAAGCTAGGGATTTATGCAGATGTTGGAAATAAAACCTGCGCAGGCTTCCCTGGGAGTTTTGGATACTACGACATTGATGCCCAGACCTTTGCTGACTGGGGAGTAGATCTGCTAAAATTTGATGGTTGTTACTGTGACAGTTTGGAAAATTTGGCAGATGGTTATAAGCACATGTCCTTGGCCCTGAATAGGACTGGCAGAAGCATTGTGTACTCCTGTGAGTGGCCTCTTTATATGTGGCCCTTTCAAAAGCCCAATTATACAGAAATCCGACAGTACTGCAATCACTGGCGAAATTTTGCTGACATTGATGATTCCTGGGCGAGTATAAAGAGTATCTTGGACTGGACATCTTTTAACCAGGAGAGAATTGTTGATGTTGCTGGACCAGGGGGTTGGAATGACCCAGATATGTTAGTGATTGGCAACTTTGGCCTCAGCTGGAATCAGCAAGTAACTCAGATGGCCCTCTGGGCTATCATGGCTGCTCCTTTATTCATGTCTAATGACCTCCGACACATCAGCCCTCAAGCCAAAGCTCTCCTTCAGGATAAGGACGTAATTGCCATCAATCAGGACCCCTTGGGCAAGCAAGGGTACCAGCTTAGACAGGGAGACAACTTTGAAGTGTGGGAACGACCTCTCTCAGGCTTAGCCTGGGCTGTAGCTATGATAAACCGGCAGGAGATTGGTGGACCTCGCTCTTATACCATCGCAGTTGCTTCCCTGGGTAAAGGAGTGGCCTGTAATCCTGCCTGCTTCATCACACAGCTCCTCCCTGTGAAAAGGAAGCTAGGGTTCTATAACTGGACTTCAAGGTTAAGAAGTCACATAAATCCCACAGGCACTGTTTTGCTTCAGCTAGAAAATACAATGCAGATGTCATTAAAAGACTTACTT(SEQ ID NO:17)

变体No.206的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAELMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSFNQERIVDVAGPGGWNDPDMLVIGNFGLSWNQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRQGDNFEVWERPLSGLAWAVAMINRQEIGGPRSYTIAVASLGKGVACNPACFITQLLPVKRKLGFYNWTSRLRSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:18)

变体No.205yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATGATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATGATTGGGACTCTAGGCTAAGAAGTCACATCAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:19)

变体No.205hCDS的多核苷酸序列：

CTGGACAATGGATTGGCAAGGACGCCTACCATGGGCTGGCTGCACTGGGAGCGCTTCATGTGCAACCTTGACTGCCAGGAAGAGCCAGATTCCTGCATCAGTGAGAAGCTCTTCATGGAGATGGCAGAGCTCATGGTCTCAGAAGGCTGGAAGGATGCAGGTTATGAGTACCTCTGCATTGATGACTGTTGGATGGCTCCCCAAAGAGATTCAGAAGGCAGACTTCAGGCAGACCCTCAGCGCTTTCCTCATGGGATTCGCCAGCTAGCTAATTATGTTCACAGCAAAGGACTGAAGCTAGGGATTTATGCAGATGTTGGAAATAAAACCTGCGCAGGCTTCCCTGGGAGTTTTGGATACTACGACATTGATGCCCAGACCTTTGCTGACTGGGGAGTAGATCTGCTAAAATTTGATGGTTGTTACTGTGACAGTTTGGAAAATTTGGCAGATGGTTATAAGCACATGTCCTTGGCCCTGAATAGGACTGGCAGAAGCATTGTGTACTCCTGTGAGTGGCCTCTTTATATGTGGCCCTTTCAAAAGCCCAATTATACAGAAATCCGACAGTACTGCAATCACTGGCGAAATTTTGCTGACATTGATGATTCCTGGGCGAGTATAAAGAGTATCTTGGACTGGACATCTTTTAACCAGGAGAGAATTGTTGATGTTGCTGGACCAGGGGGTTGGAATGACCCAGATATGTTAGTGATTGGCAACTTTGGCCTCAGCTGGAATCAGCAAGTAACTCAGATGGCCCTCTGGGCTATCATGGCTGCTCCTTTATTCATGTCTAATGACCTCCGACACATCAGCCCTCAAGCCAAAGCTCTCCTTCAGGATAAGGACGTAATTGCCATCAATCAGGACCCCTTGGGCAAGCAAGGGTACCAGCTTAGACAGGGAGACAACTTTGAAGTGTGGGAACGACCTCTCTCAGGCTTAGCCTGGGCTGTAGCTATGATAAACCGGCAGGAGATTGGTGGACCTCGCTCTTATACCATCGCAGTTGCTTCCCTGGGTAAAGGAGTGGCCTGTAATCCTGCCTGCTTCATCACACAGCTCCTCCCTGTGAAAAGGAAGCTAGGGTTCTATGATTGGGATTCAAGGTTAAGAAGTCACATAAATCCCACAGGCACTGTTTTGCTTCAGCTAGAAAATACAATGCAGATGTCATTAAAAGACTTACTT(SEQ ID NO:20)

变体No.205的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAELMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSFNQERIVDVAGPGGWNDPDMLVIGNFGLSWNQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRQGDNFEVWERPLSGLAWAVAMINRQEIGGPRSYTIAVASLGKGVACNPACFITQLLPVKRKLGFYDWDSRLRSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:21)

变体No.76yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGAGGTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATGATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATGAGTGGACATCTAGGCTAAGAAGTCACATCAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:22)

变体No.76hCDS的多核苷酸序列：

CTGGACAATGGATTGGCAAGGACGCCTACCATGGGCTGGCTGCACTGGGAGCGCTTCATGTGCAACCTTGACTGCCAGGAAGAGCCAGATTCCTGCATCAGTGAGAAGCTCTTCATGGAGATGGCAGAGCTCATGGTCTCAGAAGGCTGGAAGGATGCAGGTTATGAGTACCTCTGCATTGATGACTGTTGGATGGCTCCCCAAAGAGATTCAGAAGGCAGACTTCAGGCAGACCCTCAGCGCTTTCCTCATGGGATTCGCCAGCTAGCTAATTATGTTCACAGCAAAGGACTGAAGCTAGGGATTTATGCAGATGTTGGAAATAAAACCTGCGCAGGCTTCCCTGGGAGTTTTGGATACTACGACATTGATGCCCAGACCTTTGCTGACTGGGGAGTAGATCTGCTAAAATTTGATGGTTGTTACTGTGACAGTTTGGAAAATTTGGCAGATGGTTATAAGCACATGTCCTTGGCCCTGAATAGGACTGGCAGAAGCATTGTGTACTCCTGTGAGTGGCCTCTTTATATGTGGCCCTTTCAAAAGCCCAATTATACAGAAATCCGACAGTACTGCAATCACTGGCGAAATTTTGCTGACATTGATGATTCCTGGCGTAGTATAAAGAGTATCTTGGACTGGACATCTTTTAACCAGGAGAGAATTGTTGATGTTGCTGGACCAGGGGGTTGGAATGACCCAGATATGTTAGTGATTGGCAACTTTGGCCTCAGCTGGAATCAGCAAGTAACTCAGATGGCCCTCTGGGCTATCATGGCTGCTCCTTTATTCATGTCTAATGACCTCCGACACATCAGCCCTCAAGCCAAAGCTCTCCTTCAGGATAAGGACGTAATTGCCATCAATCAGGACCCCTTGGGCAAGCAAGGGTACCAGCTTAGACAGGGAGACAACTTTGAAGTGTGGGAACGACCTCTCTCAGGCTTAGCCTGGGCTGTAGCTATGATAAACCGGCAGGAGATTGGTGGACCTCGCTCTTATACCATCGCAGTTGCTTCCCTGGGTAAAGGAGTGGCCTGTAATCCTGCCTGCTTCATCACACAGCTCCTCCCTGTGAAAAGGAAGCTAGGGTTCTATGAATGGACTTCAAGGTTAAGAAGTCACATAAATCCCACAGGCACTGTTTTGCTTCAGCTAGAAAATACAATGCAGATGTCATTAAAAGACTTACTT(SEQ ID NO:23)

变体No.76的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAELMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWRSIKSILDWTSFNQERIVDVAGPGGWNDPDMLVIGNFGLSWNQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRQGDNFEVWERPLSGLAWAVAMINRQEIGGPRSYTIAVASLGKGVACNPACFITQLLPVKRKLGFYEWTSRLRSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:24)

Mfα信号肽的多核苷酸序列：

ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCT(SEQ IDNO:25)

Mfα信号肽的多肽序列：

MRFPSIFTAVLFAASSALA(SEQ ID NO:26)

MMO435的多核苷酸序列：

ttaactatatcgtaatacacaggatccaccATGAGATTTCCTTCAATTTTTACTG(SEQ ID NO:27)

MMO439的多核苷酸序列：

AGTAGGTGTACGGGCTAACCCGTTATCCAAAGCTAATGCGGAGGATGC(SEQ ID NO:28)MMO514的多核苷酸序列：

TTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTTTGGATAACGGGTTAGCCCG(SEQ IDNO:29)

MMO481的多核苷酸序列：

GAGCTAAAAGTACAGTGGGAACAAAGTCGAGGTCGACTTATAACAAATCTTTCAAAGACA(SEQ IDNO:30)

合成哺乳动物信号肽的多核苷酸序列：

ATGGAATGGAGCTGGGTCTTTCTCTTCTTCCTGTCAGTAACGACTGGTGTCCACTCC(SEQ ID NO:31)

LAKE Fw的多核苷酸序列：

CGATCGAAGCTTCGCCACCA(SEQ ID NO:32)

Br反向的多核苷酸序列：

CTTGCCAATCCATTGTCCAGGGAGTGGACACCAGTCGTTA(SEQ ID NO:33)

Br Fw的多核苷酸序列：

TAACGACTGGTGTCCACTCCCTGGACAATGGATTGGCAAG(SEQ ID NO:34)

hGLA Rv的多核苷酸序列：

CGATCGGCGGCCGCTCAAAGTAAGTCTTTTAATGACA(SEQ ID NO:35)

SP-GLA(yCDS)的多核苷酸序列：

ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTTTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGAAGTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATGATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATGAGTGGACATCTAGGCTAAGAAGTCACATCAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:36)

MF前导-GLA(yCDS)的多核苷酸序列：

ATGAGATTTCCTTCAATTTTTACTGCAGTTTTATTCGCAGCATCCTCCGCATTAGCTGCTCCAGTCAACACTACAACAGAAGATGAAACGGCACAAATTCCGGCTGAAGCTGTCATCGGTTACTTAGATTTAGAAGGGGATTTCGATGTTGCTGTTTTGCCATTTTCCAACAGCACAAATAACGGGTTATTGTTTATAAATACTACTATTGCCAGCATTGCTGCTAAAGAAGAAGGGGTATCTTTGGATAAAAGATTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACTAATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAGGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGAAGTCAATCAAATCTATCTTGGATTGGACTTCTTTCAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGAATCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGACAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGACTTGCGTGGGCTGTTGCTATGATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCGCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGAAAGTTGGGTTTCTATGAGTGGACATCTAGGCTAAGAAGTCACATCAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:37)

MF前导的多肽序列：

MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYLDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVSLDKR(SEQ ID NO:38)

变体No.395yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACGGATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACCATGTACACAGCAAAGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGAGCATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTCGTAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGGACCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGAAAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGAGATGCGTGGGCTGTTGCTATTATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCCCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGACAATTGGGTTTCTATAACTGGACCTCTAGGCTAAAAAGTCACATTAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:39)

变体No.395的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAERMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANHVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRSIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSRNQERIVDVAGPGGWNDPDMLVIGNFGLSWDQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRKGDNFEVWERPLSGDAWAVAIINRQEIGGPRSYTIPVASLGKGVACNPACFITQLLPVKRQLGFYNWTSRLKSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:40)

变体No.402yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACGGATGGTAAGTGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACTACGTACACAGCAAAGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGCCGATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTCGTAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGGACCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTCACATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGAAAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGAGATGCGTGGGCTGTTGCTATTATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCCCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGACAATTGGGTTTCTATAACTGGACCTCTAGGCTAAAAAGTCACATTAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAATGTCTTTGAAAGATTTGTTA(SEQ ID NO:41)

变体No.402的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAERMVSEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANYVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRPIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSRNQERIVDVAGPGGWNDPDMLVIGNFGLSWDQQVTQMALWAIMAAPLFMSNDLRHISPQAKALLQDKDVIAINQDPLGKQGYQLRKGDNFEVWERPLSGDAWAVAIINRQEIGGPRSYTIPVASLGKGVACNPACFITQLLPVKRQLGFYNWTSRLKSHINPTGTVLLQLENTMQMSLKDLL(SEQ ID NO:42)

变体No.625yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTACTATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCATGGAGATGGCTGAACGGATGGTAACCGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACCATGTACACAGCAAAGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGCCGATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTCGTAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGGACCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGCACCCCTATTCATGTCTAATGATCTACGTGCGATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGAAAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGAGATGCGTGGGCTGTTGCTATTATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCCCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGACAATTGGGTTTCTATAACTGGACCTCTAGGCTAAAAAGTCACATTAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAACCTCTTTGAAAGATTTGTTA(SEQ ID NO:43)

变体No.625的多肽序列：

LDNGLARTPTMGWLHWERFMCNLDCQEEPDSCISEKLFMEMAERMVTEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANHVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRPIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSRNQERIVDVAGPGGWNDPDMLVIGNFGLSWDQQVTQMALWAIMAAPLFMSNDLRAISPQAKALLQDKDVIAINQDPLGKQGYQLRKGDNFEVWERPLSGDAWAVAIINRQEIGGPRSYTIPVASLGKGVACNPACFITQLLPVKRQLGFYNWTSRLKSHINPTGTVLLQLENTMQTSLKDLL(SEQ ID NO:44)

变体No.648yCDS的多核苷酸序列：

TTGGATAACGGGTTAGCCCGTACACCTCCGATGGGTTGGCTTCACTGGGAAAGATTCATGTGTAACTTAGATTGCCAAGAAGAGCCTGACAGCTGTATCTCAGAGAAACTATTCGAAGAGATGGCTGAACGGATGGTAACCGAAGGATGGAAGGATGCTGGTTATGAATACCTATGTATTGATGATTGCTGGATGGCTCCACAGCGTGATTCAGAAGGTAGGTTACAAGCTGACCCCCAGAGATTCCCACATGGCATACGTCAGCTTGCAAACCATGTACACAGCAAAGGTCTAAAGTTAGGCATCTACGCTGATGTCGGAAACAAGACATGTGCTGGTTTCCCAGGTTCATTCGGTTACTATGACATAGATGCGCAGACGTTTGCTGATTGGGGTGTTGATTTGTTGAAGTTTGATGGATGCTACTGCGATTCCCTGGAGAACCTAGCCGATGGGTACAAACACATGAGTTTGGCTCTAAACAGGACTGGTAGGCCGATCGTCTATAGTTGTGAATGGCCCTTGTACATGTGGCCGTTTCAGAAGCCAAACTACACTGAGATAAGACAATACTGTAACCATTGGCGTAACTTTGCTGACATAGATGATTCATGGGCTTCAATCAAATCTATCTTGGATTGGACTTCTCGTAACCAGGAAAGAATTGTTGATGTTGCAGGTCCAGGTGGATGGAATGACCCTGATATGCTTGTCATAGGGAACTTTGGGCTATCATGGGACCAACAAGTTACACAAATGGCTTTGTGGGCGATCATGGCCGGCCCCCTATTCATGTCTAATGATCTACGTGCGATATCACCCCAAGCAAAGGCTTTACTTCAAGATAAGGATGTCATAGCGATCAACCAAGATCCTCTTGGTAAACAAGGTTATCAATTGAGAAAAGGTGACAACTTTGAAGTGTGGGAAAGACCATTGTCTGGAGATGCGTGGGCTGTTGCTATTATCAACCGTCAAGAGATCGGAGGGCCAAGATCTTACACTATCCCGGTAGCCTCTTTGGGTAAGGGTGTTGCGTGCAATCCTGCCTGCTTCATTACACAATTGCTTCCAGTTAAGAGACAATTGGGTTTCTATAACGCAACCTCTAGGCTAAAAAGTCACATTAATCCTACTGGTACGGTATTGTTGCAATTGGAGAACACAATGCAAACCTCTTTGAAAGATTTGTTA(SEQ ID NO:45)

变体No.648的多肽序列：

LDNGLARTPPMGWLHWERFMCNLDCQEEPDSCISEKLFEEMAERMVTEGWKDAGYEYLCIDDCWMAPQRDSEGRLQADPQRFPHGIRQLANHVHSKGLKLGIYADVGNKTCAGFPGSFGYYDIDAQTFADWGVDLLKFDGCYCDSLENLADGYKHMSLALNRTGRPIVYSCEWPLYMWPFQKPNYTEIRQYCNHWRNFADIDDSWASIKSILDWTSRNQERIVDVAGPGGWNDPDMLVIGNFGLSWDQQVTQMALWAIMAGPLFMSNDLRAISPQAKALLQDKDVIAINQDPLGKQGYQLRKGDNFEVWERPLSGDAWAVAIINRQEIGGPRSYTIPVASLGKGVACNPACFITQLLPVKRQLGFYNATSRLKSHINPTGTVLLQLENTMQTSLKDLL(SEQ ID NO:46)

实施例1

GLA基因获得及表达载体的构建

编码WT人类GLA序列(SEQ ID NO:2)的合成基因(SEQ ID NO:1)和衍生变体(SEQID NO:4、SEQ ID NO:6)如前所述构建(参见例如美国专利申请公布第2017/0360900A1号)。为了在哺乳动物细胞中分泌表达和瞬时转染，如下产生嵌合GLA表达构建体，该嵌合GLA表达构建体包含与编码不同GLA变体的合成基因融合的编码合成小鼠IG信号肽的多核苷酸。使用寡核苷酸BamHI-pcDNA-GLA-F(SEQ ID NO:63)和XhoI-pcDNA-GLA-R(SEQ ID NO:64)来扩增编码信号肽的片段和成熟形式的GLA变体的编码序列。将PCR产物连接到BamHI/XhoI线性化的哺乳动物表达载体pcDNA3.1(+)(Invitrogen)或包含CMV启动子和BGH-pA(牛生长激素多腺苷酸化)序列的载体中。使用本领域技术人员通常已知的定向演化技术产生源自该质粒构建体中的SEQ ID NO:8的基因变体(参见例如，美国专利第8,383,346号和WO2010/144103)。

实施例2

高通量生长和测定

GLA和GLA变体的高通量(HTP)生长

用

3000试剂(ThermoFisher Scientific)使用脂质体转染方法，用编码与野生型GLA或GLA变体融合的合成小鼠IG信号肽的pcDNA 3.1(+)载体或包含CMV启动子和BGH-pA的载体转染HEK293T细胞。HEK293T细胞在生长培养基(含有10％胎牛血清的DMEM[两者均来自Corning])中进行培养。转染前24小时，将细胞以10⁵个细胞/孔/250μL生长培养基中的密度接种到

Edge 2.096孔板(ThermoFisher Scientific)，并在培养箱中在37℃、5％ CO₂孵育。将细胞在37℃和5％ CO₂孵育24-72小时，以允许GLA变体的表达和分泌。将来自HEK293T转染的条件培养基(50-100μL)转移到Corning 96孔实心黑色板(Corning)中，用于活性分析和/或稳定性分析。

上清液的HTP分析

GLA变体活性通过测量4-甲基伞形基α-D-吡喃半乳糖苷(4-methylumbelliferylα-D-galactopyranoside，MUGal)的水解来确定。对于未挑战测定，在96孔黑色不透明底部微量滴定板中，将50μL如上文描述产生的HEK293T条件培养基与50μL McIlvaine缓冲液(McIlvaine,J.Biol.Chem.,49:183-186[1921])pH 4.8中的1mM MUGal混合。将反应物短暂混合，并在37℃孵育30-180分钟，然后用100μL 0.5M碳酸钠pH 10.2猝灭。水解使用

M2微量板读取器监测荧光(Ex.355nm，Em.460nm)来分析。来自该测定的结果呈现于表2-1中。

用酸预处理的上清液的HTP分析

用酸性缓冲液对GLA变体进行挑战，以模拟变体在溶酶体内可能遇到的极端pH。首先，将50μL HEK 293T条件培养基和50uL McIlvaine缓冲液(pH 3.3-4.3)添加到96孔圆底微量滴定板的孔中。将板用

热微量板密封器(Agilent)密封，并在37℃孵育1-2h。对于pH4挑战测定，将50μL酸pH挑战的样品与50uL McIlvaine缓冲液pH 4.4中的1mMMUGal混合。将反应物短暂混合，并在37℃孵育30-180分钟，然后用100μL 0.5M碳酸钠pH10.2猝灭。水解使用

用碱预处理的上清液的HTP分析

用碱性(中性)缓冲液对GLA变体进行挑战，以模拟变体在施用至患者后在血液中遇到的pH。首先，将50μL GLA变体HEK293T条件培养基和50μL McIlvaine缓冲液(pH 7.0-8.2)添加到96孔圆底微量滴定板的孔中。将板密封，并在37℃孵育1-18h。对于pH 7挑战测定，将50μL碱性pH挑战的样品与50μL McIlvaine缓冲液pH 4.4中的1mM MUGal混合。将反应物短暂混合，并在37℃孵育30-180分钟，然后用100μL 0.5M碳酸钠pH 10.2猝灭。水解使用

实施例3

GLA变体的产生

在HEK293T细胞中产生GLA

在哺乳动物细胞中GLA变体的分泌表达通过瞬时转染HEK293、HEK293T或Expi293细胞来进行。用与N末端合成哺乳动物信号肽融合的GLA变体(SEQ ID NO:3、4、9、12、17、20、23和41)(并亚克隆到哺乳动物表达载体pLEV113中)转染细胞，如实施例1中描述的。使用本领域技术人员已知的标准技术，用质粒DNA转染HEK293细胞并在悬浮液中生长4天。收集上清液并储存于4℃直至分析。

实施例4

GLA变体的纯化

从哺乳动物细胞上清液纯化GLA变体

WT GLA(SEQ ID NO:2)从哺乳动物培养物上清液纯化，如文献(Yasuda等人，Prot.Exp.Pur,.37:499-506[2004])中描述的。所有其他GLA变体如下进行纯化。GLA变体从哺乳动物培养物上清液纯化，基本上如本领域已知的(参见，Yasuda等人，Prot.Exp.Pur,.37:499-506[2004])。将伴刀豆球蛋白A树脂(Sigma Aldrich)用0.1M乙酸钠，0.1MNaCl，1mM MgCl₂、CaCl₂和MnCl₂,pH 6.0(伴刀豆球蛋白A结合缓冲液)平衡。将上清液用0.2μm的瓶顶过滤器进行无菌过滤，然后将上清液加载到柱上。加载后，将柱用10倍柱体积的伴刀豆球蛋白A结合缓冲液洗涤，并用补充有0.9M甲基-α-D-吡喃甘露糖苷和0.9M甲基-α-D-吡喃葡萄糖苷的伴刀豆球蛋白A结合缓冲液洗脱结合的蛋白。浓缩洗脱的蛋白，并使用带有30kDa分子量截止膜的

Ultra 15mL过滤单元(Millipore)将缓冲液交换为储存缓冲液(20mM磷酸钠、150mM氯化钠、185μM

非离子去污剂，pH6.0)。将储存缓冲液中的GLA通过

0.2μm注射过滤器(Whatman)进行无菌过滤，并储存于-80℃。基于BCA定量，纯化提供了2.4-50μg纯化的蛋白/ml培养物上清液。

通过BCA蛋白测定进行蛋白定量

二喹啉甲酸(BCA)蛋白测定(Sigma Aldrich)用于定量纯化的GLA。在微量滴定板中，将适当稀释的25uL蛋白标准品和纯化的GLA与200uL含有50份BCA试剂A和1份BCA试剂B的工作试剂混合。将板在板振荡器上充分混合30秒并在37℃孵育30分钟。板冷却至室温后，使用板读取器在562nm处测量样品的吸光度。

实施例5

GLA变体的体外表征

HEK293T细胞中表达的GLA变体的热稳定性

将GLA变体暴露于各种温度挑战，以评估酶的总体稳定性。首先，将50μL 1×PBSpH 6.2中的纯化的HEK293T表达的GLA和GLA变体添加到96孔PCR板(Biorad，HSP-9601)的孔中。将板密封，并使用热循环仪的梯度程序，在30-50℃孵育1h。对于该测定，将25μL挑战的上清液与25μL McIlvaine缓冲液pH4.4中的1mMMUGal混合。将反应物短暂混合，并在37℃孵育60分钟，然后用100μL 0.5M碳酸钠pH10.2猝灭。水解使用

M2微量板读取器监测荧光(Ex.355nm，Em.460nm)来分析。对于每种变体，通过将挑战的样品的活性除以未挑战的样品的活性，计算在30℃至50℃的温度范围内孵育1h的残余活性百分比，其中“未挑战”是在时间0测量的水解，而“挑战”是在指定的温度1小时测量的水解。来自该测定的结果在表5-1中示出。图1提供了示出GLA变体在各种温度孵育1hr后的残余活性的图。

HEK293T细胞中表达的GLA变体的血清稳定性

为了评估变体在存在血液时的相对稳定性，将样品暴露于血清。首先，将100μL在1×PBS pH 6.2中的7.5ug/mL纯化的GLA变体和90μL人类血清添加到

孔圆形底板(Corning)的孔中。将板密封，并在37℃孵育0-24h。对于该测定，将50μL挑战的上清液与50μL McIlvaine缓冲液pH 4.4中的1mMMUGal混合。将反应物短暂混合，并在37℃孵育90分钟，然后用100μL 0.5M碳酸钠pH10.2猝灭。水解使用

M2微量板读取器监测荧光(Ex.355nm，Em.460nm)来分析。对于每种变体，通过将挑战的样品的活性除以未挑战的样品的活性，计算在血清中24h后的残余活性百分比，其中“未挑战”是在时间0测量的水解，而“挑战”是在指定的时间点测量的水解。结果在表5-1中示出。图2提供了示出用人类血清挑战0-24hr后GLA变体的残余活性的图。

HEK293T细胞中表达的GLA变体的溶酶体稳定性

为了评估变体在存在溶酶体蛋白酶和其他溶酶体组分时的相对稳定性，按照制造商的说明及一些修改，将GLA变体暴露于人类溶酶体裂解物(XenoTech，#H0610.L)，如本文中描述的。简言之，将GLA变体稀释至适当的浓度范围(0.0625-0.0078125mM)，并将10μL稀释液与10μL 2×分解代谢缓冲液(XenoTech，#K5200)中的1:20稀释的人类溶酶体裂解物在

96孔圆底板(#3798，Corning)中混合。将板密封，并在37℃孵育0-24h。对于该测定，将50μL挑战的上清液与50μL McIlvaine缓冲液pH 4.4中的1mM MUGal混合。将反应物短暂混合，并在37℃孵育90分钟，然后用100μL 0.5M碳酸钠pH10.2猝灭。水解使用

M2微量板读取器监测荧光(Ex.355nm，Em.460nm)来分析。对于每种变体，通过将挑战的样品的活性除以未挑战的样品的活性，计算在溶酶体提取物中24h后的残余活性百分比，其中“未挑战”是在时间0测量的水解，而“挑战”是在4小时和24小时测量的水解。结果在表5-1中提供。图3提供了示出用人类溶酶体提取物挑战0hr至24hr后GLA变体的残余活性的图。

法布里病成纤维细胞(FabryFibroblast)对纯化的HEK293T细胞中表达的GLA变体的细胞摄取

确定与参考酶(WT GLA[SEQ ID NO:2])相比的GLA变体的细胞摄取，以评估变体被内吞入培养细胞中的整体能力。将法布里病成纤维细胞(GMO2775，CoriellInstitute forMedicalResearch)接种到含有最小必需培养基(MEM；Gibco#11095-080，补充有1％非必需氨基酸(NEAA；Gibco#11140-050)和15％胎牛血清(Corning#35-016-CV))的12孔培养皿中并允许生长至汇合(在37℃、5％ CO₂ 2-3天)。达到汇合后，通过无菌真空去除补充的MEM，并用1mL/孔的无血清MEM+1％ NEAA替换。将如实施例4中描述纯化的酶以10ug GLA/mL添加至细胞，并允许在37℃、5％ CO₂孵育4小时。通过无菌真空吸出无血清培养基，将细胞用1mL1×PBS/孔短暂洗涤，并通过无菌真空吸出PBS。然后将细胞用200μL/孔0.25％胰蛋白酶-EDTA(VWR#02-0154-0100)进行胰蛋白酶消化(trypsinize)，并在室温孵育～5分钟，以使贴壁细胞从板脱离并降解剩余的细胞外GLA。然后，向每个孔中添加500μL无血清MEM，并将样品转移到1.5mL微量离心管中。将样品以8000RPM离心5min以沉淀细胞。用1000μL移液器温和吸出培养基。将细胞沉淀物重悬于500μL 1×PBS中，以8000RPM再离心5min，并温和去除PBS。然后，向每个样品中添加100μL裂解缓冲液(稀释于1×PBS中的0.2％ TRITON X-100^TM非离子表面活性剂(Sigma#93443))，随后声处理1-2分钟，并在4℃以12,000-14,000RPM离心10分钟。将上清液转移到无菌PCR管中用于蛋白测定和活性测定。对于活性测定，将10μL细胞裂解样品与50μL McIlvaine缓冲液pH 4.6中的2.5mMMUGal混合。将反应板密封，并在37℃孵育60分钟，然后用每孔140μL 0.5M碳酸钠pH10.2猝灭反应。MUGal水解使用

M2微量板读取器监测荧光(Ex.355nm，Em.460nm)来确定。对于蛋白定量，BCA测定按照制造商的说明(Pierce，#23225)及以下修改来进行：将10μL细胞裂解样品与190μL BCA工作试剂混合，并将板密封，并在37℃孵育60分钟。使用

M2微量板读取器监测吸光度(562nm)来分析样品。根据BSA标准曲线计算蛋白浓度。每种GLA变体的细胞摄取通过首先从酶处理的样品中减去未处理细胞的背景非酶促荧光，并且然后针对每个孔中的蛋白浓度归一化来计算。细胞摄取FIOPC通过将归一化的GLA变体细胞内活性除以对应的对照(WT)活性来计算。图4提供了培养的法布里病患者成纤维细胞在37℃孵育4小时后对纯化的GLA变体的细胞摄取的图，表示为与野生型(SEQ ID NO:2)相比的相对活性。

法布里病成纤维细胞的裂解物中GLA活性的HTP分析

挑战以HTP产生的GLA变体进入细胞并保持活性超过24小时至96小时的能力。将法布里病成纤维细胞(GMO2775，Coriell Institute for Medical Research)铺板，并允许在24-72小时内生长至汇合。达到汇合后，使用自动化BioMek i5液体处理机器人去除培养基。将来自如上文描述瞬时转染的HEK293T细胞的条件培养基添加至法布里病成纤维细胞，并允许细胞与GLA变体在37℃、5％ CO₂一起孵育2-4小时。用自动化BioMek i5液体处理机器人去除含GLA的条件培养基。然后，用150μL 1×DPBS/孔短暂洗涤细胞，并用自动化BioMeki5液体处理机器人去除DPBS。然后，向每个孔中添加200μL完全生长培养基，并将板返回至培养箱中24-72小时。孵育结束时，用自动化BioMek i5液体处理机器人去除完全生长培养基。用150μL 1×DPBS/孔洗涤细胞，并用自动化BioMek i5液体处理机器人去除DPBS。通过添加50μL补充有0.2％ TRITON X-100^TM非离子表面活性剂(Sigma#93443)的McIlvain缓冲液pH 4.4并在室温搅拌30分钟来裂解细胞。通过添加50μL McIlvain缓冲液pH4.4中的1.5mM MuGal来评估活性。将板密封，并在37℃以400rpm搅拌孵育360分钟，然后用100μL0.5M碳酸钠pH 10.2猝灭。水解使用

M2微量板读取器监测荧光(Ex.355nm，Em.460nm)来分析。细胞摄取FIOPC通过将归一化的GLA变体细胞内活性除以对应的参考序列活性来计算。

GLA诱导的法布里病成纤维细胞中球形三酰神经酰胺的消耗的HTP分析

挑战以HTP产生的GLA变体被摄取到细胞中并减少细胞的球形三酰神经酰胺负荷的能力。将法布里病成纤维细胞(GMO2775，CoriellInstitute for MedicalResearch)铺板，并允许在24-72小时内生长至汇合。达到汇合后，通过自动化BioMek i5液体处理机器人去除培养基。将如上文描述瞬时转染的HEK293T细胞产生的条件培养基添加至成纤维细胞，并允许在37℃、5％ CO₂孵育2-4小时。用自动化BioMek i5液体处理机器人去除含GLA的条件培养基。然后，用150μL 1×DPBS/孔短暂洗涤细胞，并用自动化BioMek i5液体处理机器人去除DPBS。然后，向每个孔中添加200μL完全生长培养基，并将板返回至培养箱中24-72小时。孵育结束时，用自动化BioMeki5液体处理机器人去除完全生长培养基。然后，用150μL 1×DPBS/孔洗涤细胞，并用自动化BioMek i5液体处理机器人去除DPBS。在室温温和搅拌30分钟，将球形三酰神经酰胺萃取到200uL补充有10ng/mL正十七烷酰基-神经酰胺三己糖苷的甲醇中。将甲醇萃取物通过Millipore疏水过滤器堆栈(Millipore hydrophobic filterstack)过滤到圆底96孔板中。细胞球形三酰神经酰胺基本上如本领域已知的通过LC-MS/MS来定量(参见，Provencal等人,Bioanal.,8:1793-1807[2016])。确定每个细胞样品的峰积分之和，并通过将归一化的GLA变体球形三酰神经酰胺水平的变化除以参考序列来计算球形三酰神经酰胺FIOPC。

实施例6

源自SEQ ID NO:58的GLA变体

在本实施例中，描述了为评估法布里病成纤维细胞中GLA变体的活性和对Gb3的清除所进行的实验。在本实施例中，SEQ ID NO:58用作参考序列(即，变体中的氨基酸差异是相对于SEQ ID NO:58指示的，并且测定结果是相对于SEQ ID NO:58获得的结果报告)。在这些实验中，在没有预孵育的情况下，测试GLA变体的MU-Gal活性，如实施例5中描述的。

还测试了法布里病成纤维细胞中变体的Gb3消耗，如实施例5中描述的。

实施例7

源自SEQ ID NO:158的GLA变体

在本实施例中，描述了为评估GLA变体的活性、在pH 7.4的稳定性和在法布里病成纤维细胞中的细胞内活性所进行的实验。在本实施例中，参考序列为SEQ ID NO:158(即，变体中的氨基酸差异是相对于SEQ ID NO:158指示的，并且测定结果是相对于SEQ ID NO:158的结果报告的)。在没有预孵育(未挑战)和pH7.4预孵育后，测试变体的GLA MU-Gal活性，如实施例5中描述的。在裂解与GLA变体一起孵育的法布里病成纤维细胞后，还测试了变体的MU-Gal活性，如实施例5中描述的。

实施例8

源自SEQ ID NO:372的GLA变体在本实施例中，描述了为评估GLA变体的活性、在pH7.4的稳定性、Gb3清除和在法布里病成纤维细胞中的细胞内活性所进行的实验。在本实施例中，参考序列为SEQ ID NO:372(即，变体中的氨基酸差异是相对于SEQ ID NO:372指示的，并且测定结果是相对于SEQ ID NO:372的结果报告的)。在没有预孵育(未挑战)和pH7.4预孵育后，测试这些变体的MU-Gal活性，如实施例5中描述的。在与GLA变体一起孵育的法布里病成纤维细胞中，还测试了变体的MU-Gal活性(“裂解物FIOPC”)，如实施例5中描述的。在与GLA变体一起孵育后，还测试了法布里病成纤维细胞中变体的Gb3消耗(“Gb3FIOPC”)，如实施例5中描述的。

实施例9

源自SEQ ID NO:374的GLA变体

在本实施例中，描述了为通过在一系列或独立的挑战后测定酶活性来确定GLA变体活性进行的实验。在没有预孵育和pH7.4预孵育后，测试这些变体的GLA MU-Gal活性，如实施例5中描述的。在裂解与变体一起孵育的法布里病成纤维细胞后，还测试了变体的MU-Gal活性，如实施例5中描述的。还测试了孵育后法布里病成纤维细胞中变体的Gb3消耗，如实施例5中描述的。

实施例10GLA变体的体内表征

在体内表征了GLA变体对积累的Gb3的活性。使用了具有相同的遗传背景的法布里病小鼠(5月龄雌性；Jackson,stock#3535)和年龄/性别匹配的野生型小鼠。小鼠通过尾静脉单次IV注射施用Codexis酶变体(1.0mg/kg)。在预定的时间点(注射后1周和2周)使用CO₂麻醉处死动物，并将疾病相关组织(例如，心脏和肾)解剖成两部分(一部分用于酶活性测定，另一部分用于Gb3定量)，在干冰上冷冻，并储存于-80℃直至分析。对于酶测定，在玻璃匀浆器中使用马达驱动的

涂层杵，将小鼠组织在20×体积(w/v)的裂解缓冲液(稀释于1×PBS中的0.2％ TRITON X-100^TM非离子表面活性剂(Sigma#93443))中匀浆。将裂解物进行声处理，在4℃以14,000rpm离心15min，并将上清液用于酶测定。在存在0.1MN-乙酰半乳糖胺(即，α半乳糖苷酶B的特异性抑制剂)的条件下，在pH4.4，使用5mM4-甲基伞形基-α-D-吡喃半乳糖苷通过标准荧光测定来测量α-GalA活性。蛋白浓度使用BCA蛋白测定试剂盒(Pierce，#23225)来测量。将活性针对蛋白浓度归一化，并表示为nmol/mg蛋白/小时。如先前描述的，Gb3浓度通过质谱法测量(参见，Durant等人,J.Lipid Res.,52:1742-6[2011])。简言之，在玻璃匀浆器中，将小鼠组织在冰冷的20×体积的超纯水中匀浆，并将对应于200μg总蛋白的裂解物进行鞘糖脂提取、皂化，并随后通过质谱法分析Gb₃。Gb₃浓度表示为ng/mg蛋白。图5提供了示出处理后1周、2周和4周法布里病小鼠模型的心脏中体内酶活性的图。图6提供了与未处理的动物相比，处理后1周和2周法布里病小鼠模型的心脏组织中Gb3降解的图。

实施例11

源自SEQ ID NO:704的GLA变体

在本实施例中，描述了为评估GLA变体的活性、血清稳定性、在法布里病成纤维细胞中的细胞内活性和对法布里病成纤维细胞中的Gb3的清除所进行的实验。在这些实验中，在没有预孵育的条件下、在血清孵育后的条件下、在法布里病成纤维细胞的裂解物中的条件下，测试GLA变体相对于SEQ ID NO:704(SEQ ID NO:704是来自SEQ ID NO:703的氨基酸序列，SEQ ID NO:703是酵母密码子优化的SEQ ID NO:275的哺乳动物密码子优化的版本)的MU-Gal活性，如实施例5中描述的。还测试了法布里病成纤维细胞中变体的Gb3消耗，如实施例5中描述的。

实施例12

源自SEQ ID NO:374的GLA变体

在本实施例中，描述了为评估GLA变体的活性、血清稳定性、在法布里病成纤维细胞中的细胞内活性和对法布里病成纤维细胞中的Gb3的清除所进行的实验。在这些实验中，在没有预孵育的条件下、在血清孵育后的条件下、在法布里病成纤维细胞的裂解物中的条件下，测试GLA变体的MU-Gal活性，如实施例5中描述的。还测试了法布里病成纤维细胞中变体的Gb3消耗，如实施例5中描述的。

实施例13

源自SEQ ID NO:1022的GLA变体

在本实施例中，描述了为评估活性、血清稳定性和在法布里病成纤维细胞中的细胞内活性所进行的实验。在这些实验中，在没有预孵育的条件下、在血清孵育后的条件下、在法布里病成纤维细胞的裂解物中的条件下，测试GLA变体的MU-Gal活性，如实施例5中描述的。

纯化的悬浮培养中产生的GLA变体的血清稳定性

为了评估变体在存在血液时的相对稳定性，将样品暴露于血清。首先，将100μL在1×PBS pH 6.2中的7.5ug/ml纯化的GLA变体和90uL人类血清添加到

96孔圆形底板(Corning)的孔中。将板密封，并在37℃孵育0-24h。对于该测定，将50μL挑战的上清液与50μL McIlvaine缓冲液pH 4.4中的1mMMUGal混合。将反应物短暂混合，并在37℃孵育90分钟，然后用100μL 0.5M碳酸钠pH 10.2猝灭。水解使用

微量板读取器(PerkinElmer)监测荧光(Ex.355nm，Em.460nm)来分析。对于每种变体，通过将挑战的样品的活性除以未挑战的样品的活性，计算在血清中24h后的残余活性百分比，其中“未挑战”是在时间0测量的水解，而“挑战”是在指定的时间点测量的水解。图7提供了示出用人类血清挑战0-24hr后GLA变体的残余活性的图。

法布里病成纤维细胞对纯化的悬浮培养中产生的GLA变体的细胞摄取

确定与参考酶(WT GLA[SEQ ID NO:2])相比的GLA变体的细胞摄取，以评估变体被内吞入培养细胞中的整体能力。将法布里病成纤维细胞(GMO2775,Coriell Institute forMedicalResearch)接种到含有最小必需培养基(MEM；Gibco#11095-080，补充有1％非必需氨基酸(NEAA；Gibco#11140-050)和15％胎牛血清[Corning#35-016-CV])的96孔培养皿中并允许生长至汇合(在37℃、5％ CO₂ 1-3天)。达到汇合后，通过无菌真空去除补充的MEM，并用1mL/孔的无血清MEM+1％ NEAA替换。将如实施例4中描述纯化的酶以220nM到2nM的剂量响应添加至细胞中，并允许在37℃、5％ CO₂孵育4小时。将细胞用100μL无菌1×PBS/孔洗涤2次，并通过无菌真空吸出PBS。然后将细胞在最少必需培养基(MEM；Gibco#11095-080，补充有1％非必需氨基酸(NEAA；Gibco#11140-050)和15％胎牛血清[Corning#35-016-CV])中孵育，并允许在37℃、5％ CO₂孵育3天。3天后，将细胞用100μL无菌1×PBS/孔洗涤2次，并通过无菌真空吸出PBS。然后，向每个样品中添加25μL裂解缓冲液(稀释于1×PBS中的0.2％TRITON X-100^TM非离子表面活性剂[Sigma#93443])，随后声处理1-2分钟，并在4℃以12,000-14,000RPM离心10分钟。对于活性测定，将25μL细胞裂解样品与25μL McIlvaine缓冲液pH4.6中的2.5mMMUGal混合。将反应板密封，并在37℃孵育60分钟，然后用每孔150μL 0.5M碳酸钠pH10.2猝灭反应。MUGal水解使用

微量板读取器(PerkinElmer)监测荧光(Ex.355nm，Em.460nm)来确定。图8提供了培养的法布里病患者成纤维细胞在37℃孵育4小时和3天消耗后对纯化的GLA变体的细胞摄取的图。

实施例14

GLA变体的体内表征

在本实施例中，描述了使用动物模型来表征一些GLA变体所进行的实验。评估小鼠中药代动力学谱的研究设计概述在表14-1中提供。本研究以单个阶段进行，并包括36只雄性C57Bl/6小鼠(20-25g)。在实验前使动物适应至少三天。所有动物经由尾静脉接受1mg/kg的WT GLA(SEQ ID NO:2)或GLA变体的单次IV注射。个体剂量基于给药当天测量的体重来计算。

在预定的时间点，将约150μL的全血从6只小鼠/测试品(根据表14-1在两组之间交替进行，每个时间点6只)采集到肝素化毛细管中，立即处理以获得血浆，并储存于-80℃直至测定。使用标准荧光MuGal测定测量血浆GLA活性，如实施例5中描述的。总体而言，与SEQID NO:2相比，GLA变体表现出更优的血浆药代动力学谱，并且SEQ ID NO:2具有最快的清除速度，估计半衰期(t_1/2)为约10min。相比之下，GLA变体的t_1/2为约10倍高。数据在表14-2中提供。

除了上述小鼠研究外，还进行了实验以确定在健康大鼠中一些GLA变体的药代动力学。简要研究设计在表14-3中示出。第一项研究以3个阶段进行并包括21只大鼠。在实验前使动物适应至少三天。所有动物经由颈静脉套管接受WT GLA(SEQ ID NO:2)或GLA变体的IV注射。个体剂量基于给药当天测量的体重来计算。

在表14-3中示出的预定时间点，将血液(约0.25mL)从每只大鼠采集到EDTA分离管中，立即处理以获得血浆，并储存于-80℃直至测定。使用标准荧光MuGal测定测量血浆GLA活性，如实施例5中描述的。当与SEQ ID NO:2相比时，所有GLA变体表现出改进的PK特性。所有PK参数的数据在表14-4中提供。

用于大鼠PK研究编号2的简要研究设计在表14-5中提供。本研究以1阶段进行并包括18只大鼠。在实验前使动物适应至少三天。所有动物经由颈静脉套管接受WT GLA(SEQ IDNO:2)或GLA变体的IV注射。个体剂量基于给药当天测量的体重来计算。

在表14-5中示出的预定时间点，将血液(约0.25mL)采集到EDTA分离管中，立即处理以获得血浆，并储存于-80℃直至测定。使用标准荧光MuGal测定测量血浆GLA活性，如实施例5中描述的。当与SEQ ID NO:2相比时，所有GLA变体的剂量都导致改进的PK特性。所有PK参数的数据在表14-6中提供。

除了上述小鼠和大鼠研究外，还在灵长类动物模型中进行了实验。简要研究设计在表14-7中示出。本研究以1阶段进行，并包括12只雄性食蟹猴(2-3kg)。动物来源于测试机构的群体，并被认为是蛋白天然的。所有动物接受WT GLA(SEQ ID NO:2)或GLA变体的IV注射。个体剂量基于给药当天测量的体重来计算。

在表14-7中示出的预定时间点，将血液(约0.5mL)采集到EDTA分离管中，立即处理以获得血浆，并储存于-80℃直至测定。使用标准荧光MuGal测定测量血浆GLA活性，如实施例5中描述的。当与SEQ ID NO:2相比时，所有GLA变体的剂量都导致改进的PK特性。所有PK参数的数据在

表14-8中提供。

用于猴中第二项PK研究的简要研究设计在表14-9中示出。本研究以1阶段进行，并包括12只食蟹猴(3只动物/组)。动物来源于测试机构的群体，并被认为是GLA蛋白天然的。所有动物接受WT GLA(SEQ ID NO:2)或GLA变体的IV注射。个体剂量基于给药当天测量的体重来计算。在以下时间点采集血液样品：给药前(最多3小时)、给药后1分钟、5分钟、15分钟、30分钟、1小时、2小时、4小时、8小时、12小时和24小时。

在表14-7中示出的预定时间点，将血液(约1mL)采集到EDTA分离管中，立即处理以获得血浆，并储存于-80℃直至测定。使用标准荧光MuGal测定测量血浆GLA活性，如实施例5中描述的。当与SEQ ID NO:2相比时，所有GLA变体的剂量都导致改进的PK特性。所有PK参数的数据在

表14-10中提供。

法布里病敲除小鼠中与rhGLA相比的GLA变体的效力

法布里病小鼠(5月龄雌性；Jackson,stock#3535)和具有相同遗传背景的年龄/性别匹配的野生型小鼠被用于评估与WT GLA(SEQ ID NO:2)相比的六种GLA变体(SEQ ID NO:4、58、158、704、1022和1864)的效力。小鼠被施用酶变体(0.1mg/kg、0.3mg/kg、1.0mg/kg，经由尾静脉注射)，每周1次，进行4周(n＝5/组)。在最后一次注射后7天，将动物麻醉以进行心脏穿刺，以便将血液采集在K3 EDTA管中，并且然后将动物安乐死。用冷盐水通过心脏进行全身灌注以便将污染血液从组织中去除。将疾病相关组织(例如，心脏和肾)解剖成两部分(一部分用于酶活性测定，另一部分用于Gb3和溶酶体-Gb3定量)，在干冰上冷冻，并储存于-80℃直至分析。血液被立即处理以获得血浆，并储存于-80℃直至测定。使用标准荧光MuGal测定测量血浆和组织GLA活性，如实施例5中描述的。使用实施例10中引用的方法，并如实施例10中描述将组织匀浆，评估血浆和组织Gb3和溶酶体Gb3水平。除SEQ ID NO:1864的一些情况外，在法布里病小鼠模型中，所有GLA变体都比SEQ ID NO:2更有效。

图9和图10分别提供了示出在法布里病小鼠模型中最后一次处理后7天，在心脏和肾中的体内酶活性的图。在图9中，数据表示为平均值+SEM。采用双因素ANOVA与Dunnett事后检验将结果与SEQ ID NO:2的结果进行比较；“∧”，p<0.0001，相比于SEQ ID NO:2的不利的显著改进未在该图中示出。在图10中，数据表示为平均值±SEM。采用双因素ANOVA与Dunnett事后检验将结果与SEQ ID NO:2的结果进行比较；“*”，p<0.05；“**”，p<0.005；以及“∧”，p<0.0001，相比于SEQ ID NO:2的不利的显著改进未在该图中示出。图11和12分别提供了心脏和肾组织中Gb3降解的图。在图11中，数据表示为平均值±SEM。采用双因素ANOVA与Dunnett事后检验将结果与SEQ ID NO:2的结果进行比较；在0.1mg/kg剂量，对于SEQ IDNO:158和1022，“*”，p<0.05；并且在0.3mg/kg剂量，对于SEQ ID NO:158，“∧”，p<0.0001；对于SEQ ID NO:58、704、1022和1864，“**”，p<0.005。在图12中，数据表示为平均值+SEM。采用双因素ANOVA与Dunnett事后检验将结果与SEQ ID NO:2的结果进行比较；在0.1mg/kg剂量，对于SEQ ID NO:4、58、158、704和1022，“∧”，p<0.0001；并且在0.3mg/kg剂量，对于SEQ IDNO:158，“∨”，p<0.0001；对于SEQ ID NO:4、58、704和1022，“**”，p<0.005。图13和14分别提供了心脏和肾组织中溶酶体-GB3降解的图。在图13中，数据表示为平均值±SEM。采用双因素ANOVA与Dunnett事后检验将结果与SEQ ID NO:2的结果进行比较。在图14中，数据表示为平均值±SEM。采用双因素ANOVA与Dunnett事后检验将结果与SEQ ID NO:2的结果进行比较；在0.1mg/kg剂量，对于SEQ ID NO:4、58、158，“**”，p<0.005；对于SEQ ID NO:704，“*”，p<0.05。

虽然已经参考特定实施方案描述了本发明，但在不偏离所要求保护的范围的情况下，可以做出各种改变并且可以替换等同物，以适应特定的情况、材料、物质的组成、方法、一个方法步骤或更多个方法步骤，从而实现本发明的益处。

出于在美国的所有目的，本公开内容中引用的每个和每一个出版物和专利文件通过引用并入本文，如同每个这样的出版物或文件被明确且单独地指出通过引用并入本文。对出版物和专利文件的引用并不意图指示任何这样的文件是相关的现有技术，也不构成对其内容或日期的承认。

Claims

1.一种重组α半乳糖苷酶A和/或生物活性重组α半乳糖苷酶A片段，包含含有与SEQ IDNO:374、704和/或1022的至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的氨基酸序列。

2.根据权利要求1所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶包含与SEQ IDNO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：2、4、5、24/59、24/143/144、24/143/202/333、24/143/202/352/390/391、24/143/333/352/387/390/391、24/143/390/391、24/202、24/202/271、24/202/333/352、24/271/352、24/352/387/390/391、24/387/391、31、40、59、59/143、59/143/202、59/143/202/271/333、59/143/271、59/143/333、59/202、59/202/333、59/271/387/390、73、76、80、83、84、91/215/361、122、123、143、143/202、143/271、143/271/352/390、143/333、143/333/387/390、143/387/391、147、155、164、165、179、186、202、202/333、210、215/218、218、218/361、218/361/398、218/398、246、254/398、271、271/333、271/333/390/391、271/333/391、271/352/391、273、275、277、278、280、281、283、284、287、300、303、304、325、331、332、333/352、333/390/391、333/391、334、335、336、338、339、340、341、343、359、360、361、362、367、369、371、373、375、377、382、382/398、385、387/391、390和398，其中所述多肽序列的氨基酸位置参考SEQ ID NO:704来编号。

3.根据权利要求1所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶包含与SEQ IDNO:8具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、39、44、47、92、166、206、217、247、261、271、302、316、322、337、368和392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:374来编号。

4.根据权利要求1所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶包含与SEQ IDNO:58具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，并且其中所述重组α半乳糖苷酶A在选自以下的一个或更多个位置处包含至少一个取代或取代集：10、10/392、31、31/39/44/166/302、31/47、31/283/284、39、39/44、39/44/47、39/44/47/261/283/284、39/44/283、39/44/339、39/47/261、39/92、39/206、39/284、44、44/284/302、84、84/92、84/284/302/392、84/316、84/368/392、92、92/206/217、92/206/275、92/206/284、92/206/302/368、92/271、92/271/277、92/275/284、92/283、92/283/392、92/284、92/302、92/316、92/368、155、155/217、155/368、166、166/283/284、166/302、206、206/217、206/334、261、261/283、271、271/368、275、283、283/284、283/392、284、302、316、334、339、368、368/392和392，其中所述多肽序列的氨基酸位置参考SEQ ID NO:1022来编号。

5.根据权利要求1所述的重组α半乳糖苷酶A，其中所述α半乳糖苷酶A包含表11-1、表12-1和/或表13-1中提供的至少一个位置中的至少一个突变。

6.根据权利要求1-5中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A源自人类α半乳糖苷酶A。

7.一种重组α半乳糖苷酶A，所述重组α半乳糖苷酶A包含SEQ ID NO:374、704和/或1022的多肽序列。

8.根据权利要求1-7中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A比SEQ ID NO:2、374、704和/或1022的α半乳糖苷酶A更具热稳定性。

9.根据权利要求1-8中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A比SEQ ID NO:2、374、704和/或1022的α半乳糖苷酶A在pH 7更稳定。

10.根据权利要求1-9中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A比SEQ ID NO:2、374、704和/或1022的α半乳糖苷酶A在pH4更稳定。

11.根据权利要求1-10中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A比SEQ ID NO:2、374、704和/或1022的α半乳糖苷酶A对暴露于血清更稳定。

12.根据权利要求1-11中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A比SEQ ID NO:2、374、704和/或1022的α半乳糖苷酶A更具溶酶体稳定性。

13.根据权利要求1-12中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A比SEQ ID NO:2、374、704和/或1022的α半乳糖苷酶A更容易被细胞摄取。

14.根据权利要求1-13中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A比SEQ ID NO:2、374、704和/或1022的α半乳糖苷酶A从细胞中消耗更多球形三酰神经酰胺。

15.根据权利要求1-14中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A是纯化的。

16.根据权利要求1-15中任一项所述的重组α半乳糖苷酶A，其中所述重组α半乳糖苷酶A与参考序列相比表现出至少一种选自以下的改进的特性：i)催化活性增强；ii)对pH 7的耐受性增加；iii)对pH 4的耐受性增加；iv)对血清的耐受性增加；v)向细胞中的摄取增加；vi)从细胞中消耗球形三酰神经酰胺增加；vii)免疫原性降低；或i)、ii)、iii)、iv)、v)、vi)和/或vii)的任何组合。

17.根据权利要求16所述的重组α半乳糖苷酶A，其中所述参考序列选自SEQ ID NO:374、704和/或1022。

18.一种组合物，所述组合物包含至少一种根据权利要求1-17中任一项所述的重组α半乳糖苷酶A。

19.一种重组多核苷酸序列，所述重组多核苷酸序列编码至少一种根据权利要求1-18中任一项所述的重组α半乳糖苷酶A。

20.根据权利要求19的重组多核苷酸序列，其中所述多核苷酸序列选自DNA、RNA和mRNA。

21.根据权利要求20所述的重组多核苷酸序列，其中所述多核苷酸序列是密码子优化的。

22.一种表达载体，所述表达载体包含根据权利要求19、20和/或21所述的重组多核苷酸序列。

23.根据权利要求22所述的表达载体，其中所述重组多核苷酸序列可操作地连接至一个或更多个控制序列。

24.根据权利要求23所述的表达载体，其中所述控制序列是启动子。

25.根据权利要求24所述的表达载体，其中所述启动子是异源启动子。

26.一种宿主细胞，所述宿主细胞包含根据权利要求22-25中任一项所述的表达载体。

27.根据权利要求26所述的宿主细胞，其中所述宿主细胞选自真核细胞和原核细胞。

28.根据权利要求26和/或27所述的宿主细胞，其中所述宿主细胞是哺乳动物细胞。

29.一种产生α半乳糖苷酶A变体的方法，所述方法包括将根据权利要求26-28中任一项所述的宿主细胞在产生由所述重组多核苷酸编码的所述α半乳糖苷酶A的条件下培养。

30.根据权利要求29所述的方法，所述方法还包括回收所述α半乳糖苷酶A的步骤。

31.根据权利要求30所述的方法，所述方法还包括纯化所述α半乳糖苷酶A的步骤。

32.一种药物组合物，所述药物组合物用于治疗法布里病，所述药物组合物包含根据权利要求18所述的组合物。

33.根据权利要求32所述的药物组合物，所述药物组合物还包含药学上可接受的载体和/或赋形剂。

34.根据权利要求32和/或33所述的药物组合物，其中所述组合物适于向人类胃肠外注射或输注。

35.一种药物组合物，所述药物组合物包含根据权利要求19-21中任一项所述的重组多核苷酸。

36.一种用于治疗和/或预防受试者的法布里病症状的方法，所述方法包括提供患有法布里病的受试者，并向所述受试者提供根据权利要求32-35中任一项所述的药物组合物。

37.根据权利要求36所述的方法，其中所述法布里病症状得到改善。

38.根据权利要求36和/或37所述的方法，其中所述受试者能够食用脂肪含量比表现出所述法布里病症状的受试者所需的饮食限制更少的饮食。

39.根据权利要求36-38中任一项所述的方法，其中所述受试者是婴儿或儿童。

40.根据权利要求36-39中任一项所述的方法，其中所述受试者是成年人或年轻人。

41.根据权利要求18和32-35中任一项提供的所述组合物的用途。