CN109486803A

CN109486803A - 工程化苯丙氨酸解氨酶多肽

Info

Publication number: CN109486803A
Application number: CN201811343013.3A
Authority: CN
Inventors: 吉伽特·W·哈思曼; 尼古拉斯·J·阿加德; 本杰明·米杰茨; 乔纳森·弗罗姆; 张希云
Original assignee: Codexis Inc
Current assignee: Codexis Inc
Priority date: 2013-04-18
Filing date: 2014-04-17
Publication date: 2019-03-19
Anticipated expiration: 2034-04-17
Also published as: EP2986722B1; US20200040325A1; US20190040377A1; US20200032234A1; CN109486803B; US10870843B2; PE20151775A1; US20200032236A1; SI2986722T1; RS58802B1; CA2909719C; JP7129715B2; US10144924B2; US20180037880A1; US20200032235A1; US10160963B2; CN105324483A; US20190055535A1; CY1121891T1; AU2014253900B2

Abstract

本申请涉及工程化苯丙氨酸解氨酶多肽。特别地，本申请提供了工程化苯丙氨酸解氨酶(phenylalanine ammonia‑lyase，PAL)多肽及其组合物，以及编码工程化苯丙氨酸解氨酶(PAL)多肽的多核苷酸。在一些实施方案中，工程化PLA多肽被优化以提供增强的催化活性、以及降低的对蛋白水解的敏感性和增加的对酸性pH水平的耐受性。在一些实施方案中，工程化PLA多肽被去免疫化(deimmunized)。本申请还涉及包含工程化PAL多肽的组合物用于治疗和工业目的的用途。

Description

工程化苯丙氨酸解氨酶多肽

本申请是申请日为2014年4月17日，申请号为201480035201.3，发明名称为“工程化苯丙氨酸解氨酶多肽”的申请的分案申请。

相关申请的交叉引用

本申请要求2013年4月18日提交的美国临时专利申请系列号61/813,586和2013年10月31日提交的美国临时专利申请系列号61/897,932的优先权，两者都通过引用以其整体被并入用于全部目的。

对作为ASCII文本文件提交的“序列表”、表格，或计算机程序列表附件的引用

写入文件CX7-131WO2_ST25.TXT中，创建日期为2014年4月15日，127,412个字节，机器格式IBM-PC，MS-Windows操作系统的序列表在此通过引用并入。

发明领域

本发明提供了工程化苯丙氨酸解氨酶(PAL)多肽及其组合物，以及编码工程化苯丙氨酸解氨酶(PAL)多肽的多核苷酸。在一些实施方案中，工程化PAL多肽被优化以提供增强的催化活性，以及降低的对蛋白水解的敏感性和增加的对酸性pH水平的耐受性。在一些实施方案中，工程化PAL多肽被去免疫化。本发明还涉及包含工程化PAL多肽的组合物用于治疗和工业目的的用途。

发明背景

苯丙氨酸解氨酶(PAL)连同组氨酸解氨酶(HAL)和酪氨酸解氨酶(TAL)一起为芳香族氨基酸裂解酶家族(EC 4.3.1.23-1.25和4.3.1.3)的成员。更具体地，具有PAL活性的酶(EC 4.3.1.23-1.25和先前分类为EC4.3.1.5)催化L-苯丙氨酸的非氧化性脱氨基为(E)-肉桂酸。PAL为非哺乳动物酶，其广泛分布于植物中并且还在真菌和有限数目的细菌中被鉴定出。PAL酶可以被用作用于治疗代谢紊乱苯丙酮尿症(PKU)的治疗性蛋白。PKU是常染色体代谢遗传紊乱，其中肝酶苯丙氨酸羟化酶(PAH)或参与辅因子四氢生物蝶呤的合成或再循环的一种或更多种酶，由于在相应基因的一个中的突变而无功能。这种功能的缺乏导致血流中高水平的苯丙氨酸。苯丙氨酸被转化为苯丙酮酸盐(苯基酮)和其他衍生物。在人中，如果PKU未及早治疗，高水平的苯丙氨酸和其分解产物的部分可引起显著医学问题，所述医学问题包括智力障碍、小头畸形和癫痫发作。许多研究都集中在通过酶替代将PAL用于治疗PKU(Ambrus等人，Science 201:837-839[1978]；Bourget等人，Appl.Biochem.Biotechnol.，10:57-59[1984]；和Sarkissian等人，Proc.Natl.Acad.Sci.USA 96:2339-2344[1999])。

除去血流中苯丙氨酸的一种方法是使用可注射的重组PAL和通过聚乙二醇化修饰的PAL变体(PEG-PAL)。聚乙二醇化已被证明改进酶的半衰期并降低受试者抗原反应(参见例如，WO 2008/153776、WO 2011/097335和美国专利号7,531,341)。在PEG-PAL组合物中有用的PAL变体已经被描述为野生型点状念珠藻(Nostoc punctiforme)(NpPAL)；多变鱼腥藻(Anabaena variabilis)(AvPAL)和圆红冬孢酵母(Rhodosporidium toruloides)(RtPAL)的变体。特别地，已描述了野生型AvPAL的变体，其中在位置64、318、503和565处的半胱氨酸残基已用丝氨酸置换(参见例如，美国专利号：7,790,433；7,560,263；和7,537,923)。

PAL施用作为减少PKU受试者中的L-苯丙氨酸的血浆浓度的方法的替代方案是非侵入性制剂，诸如口服制剂(Sarkissian等人，Proc.Natl.Acad.Sci.USA 96:2339-2344[1999])。口服递送PAL的关键优势是酶对免疫系统的减少的暴露，从而最小化用可注射PEG-PAL观察到的免疫反应。然而，关于PAL的口服制剂的主要限制是酶活性在胃和肠腔中的损失。为了有效而实用，PAL必须耐受酸性pH和蛋白酶的降解，所述蛋白酶诸如通常降解蛋白食物为寡肽和氨基酸的胰蛋白酶、胰凝乳蛋白酶、羧肽酶和胃蛋白酶。在一些以前的研究中(Sarkissian，同上)，部分由于通过蛋白酶的酶降解且部分由于在pH 7.0下相对低的比活性，为了实现口服施用PAL的显著效应，需要大量的酶。已经开发多种方法以抑制消化后的PAL降解(Kim等人，Molec.Therap.,10:220-224[2004]；和Shah等人,Int.J.Pharmaceut,356:61-68[2008])。

提高PAL在消化道的苛刻条件下的效力的一种方法是提供耐受固有的苛刻条件的工程化PAL多肽。Kang等人使用胰凝乳蛋白酶裂解位点的定点诱变和AvPAL的表面赖氨酸的聚乙二醇化以减少蛋白水解失活(参见，Kang等人，Mol.Gen.Metabol.,99:4-9[2010])。在这些研究中，特异性突变了十个裂解位点，并且这些所得突变体除了两个(F18A和R94G)以外的所有都损失多于50％的原始酶活性。没有突变体显示出增加的活性，并且F18A突变体显示胰蛋白酶耐受性的轻微增加(Kang等人，同上)。用PAL的另外的研究，虽然有效，但通常没有导致较长存活的酶。因此，先前描述的PAL突变体及其衍生物的口服施用不会导致有效治疗PKU。

尽管PAL的多种制剂取得了进展，对具有改进的特性的用于口服施用的PAL多肽仍存在需要。这些改进的特性包括但不限于较长的半衰期、增加的催化活性、改进的对消化道中条件的稳定性和减少的聚集。

除了治疗应用以外，PAL酶还可用于工业合成L-苯丙氨酸和其他取代的L-苯丙氨酸衍生物。然后，这些衍生物可用作药物前体(Gloge等人，6:3386-3390[2000]；Bartsch等人，Prot.Eng.Des.Sel.,23:929-933[2010]；和Turner,Curr.Opin.Chem.Biol.,234-240[2011])。

PAL酶还可用于农业应用。PAL在植物、真菌和细菌中的苯丙素(phenylpropanoid)(诸如类黄酮和木质素)生物合成中起着重要作用，并且可以用作防御相关酶(Bate等人,Proc.Natl.Acad.Sci.USA 91:7608-7612[1994])。通过使用具有PAL活性的重组多肽的PAL活性的调节可潜在地导致有效的除草剂。

发明概述

本发明提供了工程化苯丙氨酸解氨酶(PAL)多肽及其组合物，以及编码工程化苯丙氨酸解氨酶(PAL)多肽的多核苷酸。在一些实施方案中，工程化PAL多肽被优化以提供增强的催化活性，以及降低的对蛋白水解的敏感性和增加的对酸性pH水平的耐受性。在一些实施方案中，工程化PAL多肽被去免疫化。本发明还涉及包含工程化PAL多肽的组合物用于治疗和工业目的的用途。在一些实施方案中，本发明涉及具有改进的特性的工程化苯丙氨酸解氨酶(PAL)多肽及其生物活性片段和类似物，所述改进的特性诸如增加的对酸性pH的耐受性和/或降低的对蛋白水解的敏感性。

本发明涉及当在基本相同的条件下与野生型PAL酶或参考PAL多肽相比时具有改进的特性的工程化PAL多肽及其生物活性片段和类似物。本发明还涉及在治疗性和/或工业组合物中使用工程化PAL多肽及其生物活性片段和类似物的方法以及使用此类组合物用于治疗和/或工业目的的方法。

在第一个方面，本发明提供了工程化苯丙氨酸解氨酶(PAL)多肽，其中当在基本相同的条件下测量时，所述工程化苯丙氨酸解氨酶(PAL)多肽与参考序列相比具有选自以下的组的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、或i)、ii)、iii)、或iv)的任何组合。在一些具体实施方案中，工程化PAL多肽具有两种改进的特性。在其他具体实施方案中，改进的特性是降低的对蛋白水解的敏感性，并且在又其他具体实施方案中，改进的特性是增加的对酸性pH的耐受性。

在第二个方面，工程化PAL多肽包括蛋白，所述蛋白包含与SEQ ID NO:4或其功能片段至少85％的氨基酸序列同一性，和当与SEQ ID NO:4的多肽最佳比对时在对应于以下位置的位置处的氨基酸残基差异：X39；X91；X158；X180；X195；X243；X245；X256；X257；X270；X290；X307；X308；X326；X349；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X522；X524；和X528。

在第一个和第二个方面的一些具体实施方案中，当与SEQ ID NO:4的多肽最佳比对时，工程化PAL多肽包含对应于以下的一个或更多个氨基酸残基位置处的至少一个氨基酸残基差异：A39；A91；Y158；S180；K195；T243；I245；A256；L257；N270；N290；H307；E308；I326；L349；L364；A394；S399；N400；P404；L407；F443；N453；Y459；T460；T463；N474；K522；T524；和P528。在一些具体实施方案中，工程化PAL多肽包含与包含SEQ ID NO:4的氨基酸序列的参考多肽的至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个和至少20个氨基酸残基差异。

在第一个和第二个方面的其他具体实施方案中，工程化PAL多肽包含与SEQ IDNO:4至少90％(至少91％、92％、93％、94％、95％、96％、97％、98％和99％)的氨基酸序列同一性。在又另外的具体实施方案中，工程化PAL多肽包含与SEQ ID NO:4至少90％(至少91％、92％、93％、94％、95％、96％、97％、98％和99％)的氨基酸序列同一性，并且包含以下置换中的一个或更多个：A39V；A91V；Y158H；S180A；K195E；T243I/L；I245L；A256G；L257W/A；N270K；N290G；H307G/Q/M；E308Q；I326F；L349M；L364Q；A394V；S399N；N400K；P404A；L407V；F443H；N453G；Y459F；T460G；T463N；N474Q；K522Y/F/N；T524S；和P528L。

在其他具体实施方案中，工程化PAL多肽源自野生型多变鱼腥藻PAL(诸如ATCC29413；NCBI蛋白参考序列YP_324488.1；SEQ ID NO:4)。

在第三个方面，被本发明包括的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:10或其功能片段至少99％的序列同一性的氨基酸序列。

在第四个方面，被本发明包括的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:10或其功能片段至少95％的序列同一性且还包含与SEQ ID NO:10相比在一个、两个、三个、四个、五个或六个或更多个氨基酸位置处的氨基酸残基差异的氨基酸序列。

在第五个方面，本发明提供了多核苷酸序列，所述多核苷酸序列编码如本文描述的工程化PAL多肽中的任何一种。

在第六个方面，本发明提供了药物组合物或工业组合物，所述药物组合物或工业组合物包含如本文描述的工程化PAL多肽中的任何一种。

在一些实施方案中，本发明提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:4或其功能片段至少85％的序列同一性；b)与SEQ ID NO:4或其功能片段相比在一个或更多个氨基酸位置处的氨基酸残基差异；并且c)所述工程化多肽与参考序列相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、或i)、ii)、iii)、或iv)的任何组合。在一些实施方案中，当与SEQ IDNO:4的氨基酸序列最佳比对时，一个或更多个氨基酸位置选自：X39；X54；X59；X73；X91；X158；X112，X134，X180；X195；X240；X243；X245；X256；X257；X270；X290；X304，X305；X307；X308；X326；X349；X353；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X509；X521；X522；X524；X528；X546；X564；和/或其组合。在一些另外的实施方案中，改进的特性选自减少的对蛋白水解的敏感性和/或增加的对酸性pH的耐受性。在又另外的实施方案中，参考序列是源自多变鱼腥藻的野生型PAL。在一些另外的实施方案中，参考序列SEQ ID NO:4的氨基酸残基对应于A39；T54；G59，S73；A91；Y158；S180；K195；A112；R134；Q240；T243；I245；A256；L257；N270；N290；Y304；R305；H307；E308；I326；L349；D353；L364；A394；S399；N400；P404；L407；F443；N453；Y459；T460；T463；N474；E509；Q521；K522；T524；P528；S546；和/或P564。在一些实施方案中，当与SEQ ID NO:4的多肽最佳比对时，与SEQ IDNO:4相比的氨基酸残基差异选自以下置换中的一个或更多个：A39V；T54K；G59R；S73K；A112C；R134Q；A91V；Y158H；S180A；K195E；Q240R/W；T243I/L；I245L；A256G；L257W/A；N270K；N290G；Y304H；R305M；H307G/Q/M；E308Q；I326F；L349M；D353A/N；L364Q；A394V；S399N；N400K；P404A；L407V；F443H；N453G；Y459F；T460G；T463N；N474Q；E509L；Q521K/S；K522Y/F/N；T524S；P528L；S546R；和P564G/L/M。在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、或约100％的序列同一性。在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少约90％的序列同一性。在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少约95％的序列同一性。在一些另外的实施方案中，工程化多肽具有与SEQ ID NO:4至少约90％的序列同一性；和在位置H307处的氨基酸残基差异。在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少90％的序列同一性。在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少95％的序列同一性。在一些另外的实施方案中，工程化多肽具有与SEQ ID NO:4至少90％的序列同一性；和在位置H307处的氨基酸残基差异。在一些另外的实施方案中，氨基酸残基差异为H307G/Q/M。在一些另外的实施方案中，氨基酸残基差异选自以下的一个或更多个的组合：A39；A91；Q240；A256；N290；Y304；R305；H307；D353A394；S399；P404；L407；Q521；K522；和T524。

本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％、或至少约l00％的序列同一性的氨基酸序列。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少约95％的序列同一性的氨基酸序列。

在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少约99％的序列同一性的氨基酸序列。

本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少约至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少100％的序列同一性的氨基酸序列。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少约95％的序列同一性的氨基酸序列。在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少约99％的序列同一性的氨基酸序列。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少95％的序列同一性的氨基酸序列。在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14或其功能片段至少99％的序列同一性的氨基酸序列。

本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与SEQ ID NO:4或其功能片段至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或至少约l00％的序列同一性的氨基酸序列，其中该工程化多肽被去免疫化。本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与SEQ ID NO:4或其功能片段至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或l00％的序列同一性的氨基酸序列，其中该工程化多肽被去免疫化。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含具有与SEQ ID NO:4或其功能片段至少95％的序列同一性的氨基酸序列，其中该工程化多肽被去免疫化。在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽是在表9-1至9-7的任一个中提供的变体PAL。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的去免疫化的工程化多肽包含具有与SEQ ID NO:6、8、10、12和/或14至少95％序列同一性的氨基酸序列。

本发明还提供了多核苷酸序列，所述多核苷酸序列编码本文提供的具有PAL活性的工程化多肽。在一些实施方案中，多核苷酸序列被可操作地连接到控制序列。本发明还提供了载体，所述载体包含编码具有PAL活性的至少一种工程化多肽的至少一种多核苷酸序列。本发明还提供了宿主细胞，所述宿主细胞用编码如本文所提供的具有PAL活性的工程化多肽的至少一种多核苷酸序列转化。

本发明还提供了在宿主细胞中产生工程化PAL多肽的方法，所述方法包括在适合的培养条件下培养包含编码至少一种工程化PAL多肽的至少一种多核苷酸的宿主细胞。本发明还提供了在宿主细胞中产生工程化PAL多肽的方法，所述方法包括在适合的培养条件下培养包含编码工程化PAL多肽的多核苷酸的宿主细胞。在一些实施方案中，该方法还包括从培养物和/或宿主细胞中回收工程化PAL多肽。

本发明还提供了组合物，所述组合物包含至少一种如本文所提供的具有PAL活性的工程化多肽。在一些实施方案中，组合物为药物组合物，所述药物组合物还包含药学上可接收的载体。本发明还提供了这些组合物的用途。

本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与具有苯丙氨酸解氨酶(PAL)活性的参考序列或其功能片段至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或更大的序列同一性；b)多肽序列，所述多肽序列包含与具有苯丙氨酸解氨酶(PAL)活性的参考序列或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与具有苯丙氨酸解氨酶(PAL)活性的参考序列相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。在一些实施方案中，参考序列为原核PAL，而在一些其他实施方案中，参考序列为真核PAL。在一些实施方案中，参考序列为细菌PAL(例如，多变鱼腥藻PAL)，而在一些其他实施方案中，它是人或其他PAL。在一些另外的实施方案中，参考序列为野生型序列(例如，野生型多变鱼腥藻PAL)，而在一些可选的实施方案中，参考序列为变体酶(例如，具有PAL活性的工程化多肽)。

在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:4或其功能片段至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或更大的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:4或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ ID NO:4相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:4或其功能片段至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:4或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ ID NO:4相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

在一些实施方案中，具有苯丙氨酸解氨酶活性(PAL)的工程化多肽包含在以下氨基酸位置的一个或更多个处的至少一个置换：20、24、27、39、43、45、47、54、58、59、62、70、73、80、82、91、94、98、104、105、110、112、115、117、118、119、121、123、124、125、126、127、128、129、130、131、133、134、135、139、140、141、142、143、144、145、146、147、149、150、151、153、154、156、157、158、159、172、174、175、176、177、178、180、187、191、195、199、205、206、210、212、213、214、232、240、243、245、247、248、250、256、257、266、270、275、278、279、285、286、289、290、292、304、305、307、308、309、319、321、326、331、332、334、349、353、355、364、365、369、370、371、372、374、375、377、378、379、381、382、383、384、385、387、389、394、396、399、400、403、404、407、417、418、425、431、432、433、434、435、436、437、438、439、443、446、447、453、456、459、460、461、463、471、472、473、474、475、476、477、478、479、482、483、503、507、509、521、522、524、525、528、538、546、547、551、558、560、564、565和/或其任何组合，其中氨基酸位置参考SEQ ID NO:4来编号。在一些实施方案中，参考序列SEQ ID NO:4的氨基酸残基对应于A39、T54、G59、S73、A91、Y158、S180、K195、A112、R134、Q240、T243、I245、A256、L257、N270、N290、Y304、R305、H307、E308、I326、L349、D353、L364、A394、S399、N400、P404、L407、F443、N453、Y459、T460、T463、N474、E509、Q521、K522、T524、P528、S546和/或P564。在一些另外的实施方案中，当与SEQ ID NO:4的多肽最佳比对时，与SEQ ID NO:4相比的氨基酸残基差异选自以下置换中的一个或更多个：A39V、T54K、G59R、S73K、A112C、R134Q、A91V、Y158H、S180A、K195E、Q240R/W、T243I/L、I245L、A256G、L257W/A、N270K、N290G、Y304H、R305M、H307G/Q/M、E308Q、I326F、L349M、D353A/N、L364Q、A394V、S399N、N400K、P404A、L407V、F443H、N453G、Y459F、T460G、T463N、N474Q、E509L、Q521K/S、K522Y/F/N、T524S、P528L、S546R和P564G/L/M。在一些另外的实施方案中，工程化多肽具有与SEQ ID NO:4至少约90％的序列同一性；和在位置H307处的氨基酸残基差异。在一些实施方案中，氨基酸残基差异为H307G/Q/M。在一些仍然另外的实施方案中，氨基酸残基差异选自以下的一个或更多个的组合：A39、A91、Q240、A256、N290、Y304、R305、H307、D353、A394、S399、P404、L407、Q521、K522和T524。在一些另外的实施方案中，具有苯丙氨酸解氨酶活性(PAL)的工程化多肽的改进的特性选自降低的对蛋白水解的敏感性和/或增加的对酸性pH的耐受性。

本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:10或其功能片段至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或更大的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:10或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ ID NO:10相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

在一些实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:10或其功能片段至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:10或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ IDNO:10相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

在一些实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:10或其功能片段至少85％的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:10或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ ID NO:10相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

在一些实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与参考序列SEQ ID NO：10至少85％的序列同一性的氨基酸序列，和与SEQ ID NO：10相比的至少一个氨基酸残基差异，且所述工程化多肽与SEQ ID NO：10相比表现出选自以下的至少一种改进的特性：增强的催化活性、降低的对蛋白水解的敏感性、增加的对酸性pH的耐受性、减少的聚集、和/或降低的免疫原性。

在一些实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO：10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：

127E/V39A；I27E/V39A/R43L/V105C/A153R/L214E/P266H/L278D/C503Q；

I27E/V39A/R43L/L214E/A547D；

I27E/V39A/V105C/A112C/R134Q/L214E/L278D/C503Q/A547D/C565N；

I27E/V39A/V105C/A112C/R134Q/A153R/Q205T/L214E/P266H/L278D/C503Q/A551D；

I27E/V39A/V105C/A112C/Q205T/P210C/P266H/C503Q/A547D；

I27E/V39A/V105C/A112C/Q205T/P266H/I285E/C503Q/A551D；

I27E/V39A/V105C/A112C/L214E/I285E/C503Q/A547D；

I27E/V39A/V105C/S131N/R134Q/Q205T/L214E/C503Q/A547D/C565N；

I27E/V39A/V105C/R134Q/A153R/P210C/L278D/I285E/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/Q205T/P210C/L278D/C503Q/A547D；

I27E/V39A/V105C/R134Q/Q205T/L214E；

I27E/V39A/V105C/R134Q/Q205T/L214E/A551D/C565N；

I27E/V39A/V105C/R134Q/Q205T/L278D/I285E/C503Q/A547D/A551D/C565N；

I27E/V39A/V105C/R134Q/P210C；I27E/V39A/V105C/R134Q/P210C/L214E；

I27E/V39A/V105C/R134Q/P210C/L214E/I285E/A547D；

I27E/V39A/V105C/R134Q/P210C/L214E/C503Q/A551D/C565N；

I27E/V39A/V105C/R134Q/L214E/L278D/A547D/A551D；

I27E/V39A/V105C/R134Q/L214E/I285E/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/P266H/C503Q；

I27E/V39A/V105C/R134Q/P266H/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/L278D/C503Q/C565N；

I27E/V39A/V105C/R134Q/L278D/I285E/C503Q；I27E/V39A/V105C/R134Q/L278D/A551D；

I27E/V39A/V105C/R134Q/I285E/A547D/A551D；I27E/V39A/V105C/R134Q/C503Q/A551D；

I27E/V39A/V105C/A153R/Q205T/L278D/C503Q/A547D/A551D；

I27E/V39A/V105C/A153R/L214E；I27E/V39A/V105C/A153R/I285E；

I27E/V39A/V105C/A153R/C503Q/A547D/C565N；I27E/V39A/V105C/A153R/A551D/C565N；

I27E/V39A/V105C/Q205T/P210C/L214E/L278D/A547D；

I27E/V39A/V105C/Q205T/P210C/L278D/C503Q；

I27E/V39A/V105C/Q205T/P210C/L278D/A547D；

I27E/V39A/V105C/Q205T/L214E/L278D/C503Q/A547D；

I27E/V39A/V105C/Q205T/L278D/C503Q/A547D；

I27E/V39A/V105C/P210C/I285E/C503Q/A547D/A551D/C565N；

I27E/V39A/V105C/P210C/L214E/P266H/L278D；

I27E/V39A/V105C/L214E/P266H/C503Q/A547D/C565N；

I27E/V39A/V105C/L214E/L278D/L309P/C503Q/A547D/A551D；

I27E/V39A/V105C/L278D/C503Q/A547D/C565N；I27E/V39A/V105C/I285E/A547D；

I27E/V39A/V105C/C503Q/A551D；I27E/V39A/V105C/C503Q/A547D/A551D/C565N；

I27E/V39A/A112C/R134Q/Q205T/P210C/L214E/A551D/C565N；

I27E/V39A/A112C/R134Q/L214E/P266H/A551D；

I27E/V39A/A112C/R134Q/L214E/C503Q/A547D；I27E/V39A/A112C/R134Q/P266H/I285E；

I27E/V39A/A112C/Q205T/L214E/P266H/C503Q/A551D/C565N；

I27E/V39A/A112C/Q205T/L278D/I285E；I27E/V39A/A112C/L214E；

I27E/V39A/A112C/L214E/L278D/C503Q/A547D/A551D；I27E/V39A/A112C/I285E；

I27E/V39A/A112C/A547D；I27E/V39A/R134Q；

I27E/V39A/R134Q/A153R/Q205T/L214E/P266H/C503Q；

I27E/V39A/R134Q/A153R/P210C/L214E/L278D/I285E/A547D/C565N；

I27E/V39A/R134Q/A153R/L214E/P266H/L278D/C503Q/A547D/C565N；

I27E/V39A/R134Q/A153G/L214E/P266H/I285E/C503Q/A551D/C565N；

I27E/V39A/R134Q/A153R/L214E/C503Q/A547D；I27E/V39A/R134Q/A153R/L278D；

I27E/V39A/R134Q/A153R/L278D/A547D/A551D；I27E/V39A/R134Q/A153R/A547D；

I27E/V39A/R134Q/Q205T/L214E/P266H/I285E/C503Q/A551D/C565N；

I27E/V39A/R134Q/Q205T/P266H/C503Q/A551D/C565N；

I27E/V39A/R134Q/P210C/L214E/C503Q；I27E/V39A/R134Q/P210C/C503Q/A551D；

I27E/V39A/R134Q/L214E/P266H/A551D；

I27E/V39A/R134Q/L278D/I285E/C503Q/A547D/A551D；

I27E/V39A/R134Q/L278D/C503Q/A547D；I27E/V39A/R134Q/C503Q/A547D；

I27E/V39A/R134Q/A547D/C565N；I27E/V39A/Q205T/L214E/C503Q/C565N；

I27E/V39A/Q205T/P266H/I285E/A547D/A551D/C565N；I27E/V39A/Q205T/P266H/A551D；

I27E/V39A/Q205T/L278D/C503Q/A551D/C565N；I27E/V39A/Q205T/L278D/C503Q/C565N；

I27E/V39A/Q205T/C503Q/A547D/C565N；I27E/V39A/P210C/T212S；

I27E/V39A/P210C/L214E/L278D/C503Q/A551D；I27E/V39A/P210C/L214E/I285E/C503Q/A551D；

I27E/V39A/P210C/P266H/I285E/C503Q/A547D；I27E/V39A/P210C/P266H/C503Q/A551D；

I27E/V39A/L214E；I27E/V39A/L214E/P266H/L278D/C503Q/A547D/A551D/C565N；

127E/V39A/L214E/L278D/C503Q；I27E/V39A/L214E/L278D/C503Q/A547D/C565N；

I27E/V39A/L214E/C503Q/A551D；I27E/V39A/P266H；I27E/V39A/P266H/L278D；

I27E/V39A/L278D；I27E/V39A/L278D/A547D；I27E/V39A/L278D/I285E/C503Q/A547D；

I27E/V39A/L278D/C503Q/C565N；I27E/V39A/C503Q；I27E/G45D/Q205T/P266H/C565N；

I27E/V105C；I27E/V105C/R134Q/A153R/P210C/L214E/C503Q/A547D；

I27E/V105C/R134Q/A153R/I285E/A547D；I27E/V105C/R134Q/A153R/C503Q；

I27E/V105C/R134Q/Q205T/P210C/C503Q；

I27E/V105C/R134Q/Q205T/L214E/P266H/L278D/C503Q/C565N；

I27E/V105C/Q205T/P266H/C503Q；

I27E/V105C/R134Q/P210C/L214E/P266H/L278D/A551D/C565N；

I27E/V105C/R134Q/P210C/L214E/C503Q/A551D/C565N；

I27E/V105C/R134Q/P210C/P266H/L278D/I285E/C503Q/A551D/C565N；

I27E/V105C/R134Q/L214E/L278D/C503Q/A547D；

I27E/V105C/R134Q/L214E/L278D/C503Q/A547D/A551D/C565N；I27E/V105C/Q205T；

I27E/V105C/Q205T/L214E/P266H；I27E/V105C/Q205T/L214E/P266H/A551D/C565N；

I27E/V105C/Q205T/L214E/L278D/I285E/C503Q/A547D/A551D/C565N；

I27E/V105C/Q205T/C503Q/A547D/A551D/C565N；I27E/V105C/L214E；

I27E/V105C/L214E/P266H/C503Q；I27E/V105C/L214E/I285E/A551D/C565N；

I27E/V105C/L214E/A547D/A551D/C565N；I27E/V105C/L214E/A551D/C565N；

I27E/V105C/P266H；I27E/V105C/P266H/I285E/C503Q/A547D/C565N；

I27E/V105C/L278D/A547D；I27E/V105C/I285E/C503Q/A547D/A551D/C565N；

I27E/V105C/C503Q/A547D/C565N；I27E/V105C/C503Q/A547D/A551D/C565N；

I27E/A112C/R134Q/A153R/L214E/P266H/C503Q；

I27E/A112C/R134Q/L278D/I285E/C503Q/A551D/C565N；

I27E/A112C/R134Q/Q205T/L278D/C503Q；I27E/A112C/R134Q/Q205T/I285E/C503Q；

I27E/A112C/Q205T/P266H/L278D/I285E/C503Q；I27E/A112C/P210C/L214E/C503Q/A547D；

I27E/R134Q；I27E/R134Q/A153R/I285E/C503Q/A547D；

I27E/R134Q/Q205T/I285E/C503Q/A551D；I27E/R134Q/Q205T/P266H/L278D/A547D；

I27E/R134Q/P210C；I27E/R134Q/L214E/C503Q；I27E/R134Q/L214E/C503Q/A547D；

I27E/R134Q/L214E/C503Q/A547D/A551D；I27E/R134Q/L214E/C503Q/C565N；

I27E/R134Q/L278D/I285E/A551D/C565N；I27E/R134Q/I285E/C503Q；

I27E/A153R/L214E/L278D/I285E/A551D/C565N；I27E/A153R/L214E/L278D/A551D；

I27E/Q205T；I27E/Q205T/L214E/L278D/I285E/C503Q/C565N；

I27E/Q205T/L214E/C503Q/A547D/C565N；I27E/Q205T/P266H/L278D/I285E/A551D/C565N；

I27E/Q205T/L278D/A551D；I27E/P210C；I27E/P210C/L214E/C503Q/A547D；

I27E/P210C/L278D/C503Q；I27E/P210C/C503Q；I27E/P210C/C503Q/C565N；I27E/P210C/A551D；

I27E/L214E；I27E/L214E/P266H/L278D/I285E/A551D；I27E/L214E/L278D；

I27E/L214E/L278D/C503Q；I27E/L214E/C503Q；I27E/L214E/C503Q/A547D；

I27E/L214E/C503Q/A547D/C565N；I27E/L214E/A551D；I27E/P266H/L278D/C503Q；

I27E/P266H/A547D/A551D；I27E/L278D/C503Q/A551D；I27E/L278D/C503Q/A551D/C565N；

I27E/A547D/C565N；V39A/G45S/L278D/C503Q/A551D；

V39A/V105C/R134Q/A153R/Q205T/A551D；V39A/V105C/R134Q/P210C/L214E/A551D；

V39A/V105C/R134Q/L214E/C503Q/A547D/A551D；V39A/V105C/A153R/P266H/A547D/A551D；

V39A/V105C/Q205T/C503Q；V39A/V105C/Q205T/A551D；V39A/V105C/P210C/A547D；

V39A/V105C/L214E/P266H/A547D/C565N；V39A/V105C/L214E/I285E/C503Q/A551D/C565N；

V39A/A112C/R134Q/Q205T/L214E/L278D；V39A/A112C/R134Q/L214E/C503Q/A547D/A551D；

V39A/A112C/A153R/Q205T/L278D/C503Q/A547D；V39A/R134Q；

V39A/R134Q/Q205T/L214E/C503Q/C565N；V39A/R134Q/P210C/L214E/A547D/C565N；

V39A/A153R/C503Q/A547D；V39A/Q205T/L278D/A547D/A551D；

V39A/P210C/L214E/L278D/I285E/C503Q/A551D；V39A/P266H；

V39A/P275R/L278D/C503Q/A551D；V39A/C503Q；V39A/C503Q/A551D/C565N；V105C；

V105C/A112C/R134Q/Q205T/L214E/Y492H/C503Q/A547D；

V105C/R134Q/A153R/Q205T/L214E/C503Q；V105C/R134Q/Q205T/L214E/A547D；

V105C/R134Q/Q205T/P266H/L278D；V105C/R134Q/L214E/P266H/I285E/C503Q/A551D/C565N；

V105C/R134Q/L214E/L278D/C565N；V105C/R134Q/L214E/C503Q/A547D；

V105C/R134Q/L214E/C503Q/A547D/A551D；V105C/R134Q/C503Q；

V105C/R134Q/C503Q/A547D；V105C/R134Q/C503Q/A547D/C565N；

V105C/A153R/Q205T/L214E/P266H/C503Q/A547D；

V105C/A153R/Q205T/P266H/I285E/A547D/C565N；V105C/Q205T/P210C/L214E/C503Q/A547D；

V105C/Q205T/L214E/L278D；V105C/Q205T/L214E/C503Q/A547D/A551D/C565N；

V105C/Q205T/C503Q/A551D；V105C/L214E/P266H/L278D/A547D；

V105C/L214E/L278D/C503Q/A547D/A551D；V105C/L214E/I285E；

V105C/L214E/I285E/C503Q/A547D/A551D/C565N；V105C/L214E/I285E/A547D/C565N；

V105C/L278D/C503Q/A551D；V105C/I285E；V105C/I285E/A547D；V105C/C503Q；

V105C/A547D/A551D；A112C/R134Q/A153R/L214E/L278D/I285E/C503Q/A547D/A551D/C565N；

A112C/R134Q/L214E/C503Q/A547D/A551D/C565N；A112C/L214E/L278D；

A112C/L278D/C503Q/A547D；R134Q/Q205T/L214E/I285E/C503Q/A551D/C565N；

R134Q/Q205T/C503Q；R134Q/P210C/L214E/L278D/C503Q/A547D/C565N；

R134Q/P210C/L214E/C503Q/A547D/A551D；R134Q/L214E；R134Q/L214E/L278D/C503Q；

R134Q/L214E/L278D/C503Q/A551D；R134Q/L214E/I285E/C503Q；R134Q/C503Q；

R134Q/C503Q/A547D/A551D；A153R；Q205T/L214E/I285E/C503Q/A551D；

Q205T/L214E/I285E/C503Q/C565N；Q205T/L214E/C503Q/A547D/C565N；

Q205T/L278D/I285E/A547D/A551D；P210C/L214E；P210C/L214E/P266H；L214E/P266H；

L214E/P266H/C503Q/A547D/A551D/C565N；L214E/C503Q/A547D；L214E/A547D；

P266H/L278D/C503Q；P266H/C565N；L278D/A547D；C503Q；C503Q/A547D；

C503Q/A547D/A551D/C565N；C503Q/A547D/C565N；C503Q/A551D；C503Q/A551D/C565N；

A547D；和/或C565N。

在一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO：10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：V80I/R134C/P564Q；V121C；A123G；A124G；M125L；L126I/T；L126M/R134L；L127A；A129G/L；N130Q；N130C/M370I R134W；M133R；R134I；R134N/G307C；G135C/S；和/或G135A/A394E。

在一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO：10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：G20S/I144L；R43S；L47M/I144L；L47M/R146E；L47M/M147G/A383E；L47M/P157C；Q58H/L143V；Q58K/P157D/G369C；A62S/M147V；S82I/G135C/P157F/W279L；R94C/I149E；T110I/I139R；L118M/L141H；A119E/T156H/A289D；I139M/V；R140D/G/M；R140N/A199E；R140E/A334S/A551D；L141K/Q/P/T；E142H/P/V；E142D/G371D；L143F/M；I144L/N/V；K145N/Q/R；K145G/P157T；R146H/L；R146W/D191Y；M147A；I149L/R；F150K/L/M；L151M；A153C/G；A153S/H250N；G154R；G154Y/L174M/Q321K/S456I/G483C；T156K/G483C；P157D/F/H/Y；Y158E；V159C/H/L/M；M247I；L319M；和/或Q389K。

在仍然一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO:10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：P117T/Y176Q；V172I/C/L；L174M；S175G；Y176E/I/M/R/V；I177M/V；T178L/A477S；和/或S180C/T。

在一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO:10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：R43S/H374K；R43S/H374R；A112S/M370A/A507E；M147I/H374S；S187R/L381V；D191Y/H385N；A232S；Q240K/H374R；A256S/L381N；P275Q/M370S；P275T/H374R；Q332K/Y377M；A334S/H374V；L349M；Q355K/H374S；M370G/I/S；G371H/N/Q/S；M372A/V；H374A/D/G/L/N/R/S/T；H374Q/P396Q；H374R/G417C；L375I；L375M；Y377C/I/N；Y378C/D/E/I/L/N/S；Y378F/P404Q；I379C/H/L/M/N；L381G/V；L381M/Q560K；L382C/H/I/M/S；A383S/V；K384R；H385C/G/N；H385M/P403H；H385S/P403H；D387S；L418M；G425V；A447S；S461G；和/或S525L。

在一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO:10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：A24S/F434M；A62S/T433N；S98I；L213M/S438L；Q240K/T433Y；S286R/Y435T；A289S/L431E；S331I；L431C/E/G/P/S/V；L432C/V；T433A/I/L/N/P/Q/R/S/V/W；F434C；Y435L；Y435Q/H446N；G436M；G436D/T；N437E/G/Q；N437T/L538M；S438C/F/M/R/T；I439C/F/L/V；和/或A477S。

在一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO:10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：A24E；Q58R/Y475H；A70S/N474E；L104M/V476L；A119E/G365A；L206M；P275Q；G276V；Q292H/A479G；Q355H/I478C；P404T/A477V；I471F/G/K/M/N/R/V/W；F472G；Q473H/K/M/R/S；Q473H/A507S；N474A/H/R/W；N474D/R490H；Y475C/F/L/Q；V476C/I/L；I478N/S；A479G/S；F482C/L；G483C/H/S；G483A/S524I；G483R/G537C；和/或A558S。

在一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO:10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：V39A/K115E/M133R/C565N；V39A/M133R/F472G/C503Q/C565N；V39A/M133R/F472G/C565N；V39A/M133R/C503Q；V39A/M133R/C503Q/C565N；V39A/M147A/Y378E/C503Q/C565N；V39A/M147A/Y378E/C565N；V39A/M147A/L381G/F472G/C503Q/C565N；V39A/M147A/L381G/C503Q/C565N；V39A/M147A/F472G/C503Q/C565N；V39A/M147A/F472G/C565N；V39A/M147A/C565N；V39A/G248C/L381G/F472G/C503Q/C565N；V39A/Y378E/C503Q/C565N；V39A/Y378E/C565N；V39A/L381G；V39A/F472G/C503Q/C565N；V39A/C503Q/C565N；M133R/L381G/C565N；M133R/C503Q；Y378D/C503Q；Y378E/F472G/C503Q/C565N；L381G/F472GC503Q/C565N；和/或F472G/C503Q/C565N。

在仍然一些另外的实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中与SEQ ID NO:10相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：

I27E/V39A；I27E/V39A//R43L/V105C/A153R/L214E/P266H/L278D/C503Q；

I27E/V39A/R43L/L214E/A547D；

I27E/V39A/V105C/A112C/R134Q/L214E/L278D/C503Q/A547D/C565N；

I27E/V39A/V105C/A112C/R134Q/A153R/Q205T/L214E/P266H/L278D/C503Q/A551D；

I27E/V39A/V105C/A112C/Q205T/P210C/P266H/C503Q/A547D；

I27E/V39A/V105C/A112C/Q205T/P266H/I285E/C503Q/A551D；

I27E/V39A/V105C/A112C/L214E/I285E/C503Q/A547D；

I27E/V39A/V105C/S131N/R134Q/Q205T/L214E/C503Q/A547D/C565N；

I27E/V39A/V105C/R134Q/A153R/P210C/L278D/I285E/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/Q205T/P210C/L278D/C503Q/A547D；

I27E/V39A/V105C/R134Q/Q205T/L214E；

I27E/V39A/V105C/R134Q/Q205T/L214E/A551D/C565N；

I27E/V39A/V105C/R134Q/Q205T/L278D/I285E/C503Q/A547D/A551D/C565N；

I27E/V39A/V105C/R134Q/P210C；I27E/V39A/V105C/R134Q/P210C/L214E；

I27E/V39A/V105C/R134Q/P210C/L214E/I285E/A547D；

I27E/V39A/V105C/R134Q/P210C/L214E/C503Q/A551D/C565N；

I27E/V39A/V105C/R134Q/L214E/L278D/A547D/A551D；

I27E/V39A/V105C/R134Q/L214E/I285E/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/P266H/C503Q；

I27E/V39A/V105C/R134Q/P266H/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/L278D/C503Q/C565N；

I27E/V39A/V105C/R134Q/L278D/I285E/C503Q；I27E/V39A/V105C/R134Q/L278D/A551D；

I27E/V39A/V105C/R134Q/I285E/A547D/A551D；I27E/V39A/V105C/R134Q/C503Q/A551D；

I27E/V39A/V105C/A153R/Q205T/L278D/C503Q/A547D/A551D；

I27E/V39A/V105C/A153R/L214E；I27E/V39A/V105C/A153R/I285E；

I27E/V39A/V105C/A153R/C503Q/A547D/C565N；I27E/V39A/V105C/A153R/A551D/C565N；

I27E/V39A/V105C/Q205T/P210C/L214E/L278D/A547D；

I27E/V39A/V105C/Q205T/P210C/L278D/C503Q；

I27E/V39A/V105C/Q205T/P210C/L278D/A547D；

I27E/V39A/V105C/Q205T/L214E/L278D/C503Q/A547D；

I27E/V39A/V105C/Q205T/L278D/C503Q/A547D；

I27E/V39A/V105C/P210C/I285E/C503Q/A547D/A551D/C565N；

I27E/V39A/V105C/P210C/L214E/P266H/L278D；

I27E/V39A/V105C/L214E/P266H/C503Q/A547D/C565N；

I27E/V39A/V105C/L214E/L278D/L309P/C503Q/A547D/A551D；

I27E/V39A/V105C/L278D/C503Q/A547D/C565N；I27E/V39A/V105C/I285E/A547D；

I27E/V39A/V105C/C503Q/A551D；I27E/V39A/V105C/C503Q/A547D/A551D/C565N；

I27E/V39A/A112C/R134Q/Q205T/P210C/L214E/A551D/C565N；

I27E/V39A/A112C/R134Q/L214E/P266H/A551D；

I27E/V39A/A112C/R134Q/L214E/C503Q/A547D；I27E/V39A/A112C/R134Q/P266H/I285E；

I27E/V39A/A112C/Q205T/L214E/P266H/C503Q/A551D/C565N；

I27E/V39A/A112C/Q205T/L278D/I285E；I27E/V39A/A112C/L214E；

I27E/V39A/A112C/L214E/L278D/C503Q/A547D/A551D；I27E/V39A/A112C/I285E；

I27E/V39A/A112C/A547D；I27E/V39A/R134Q；

I27E/V39A/R134Q/A153R/Q205T/L214E/P266H/C503Q；

I27E/V39A/R134Q/A153R/P210C/L214E/L278D/I285E/A547D/C565N；

I27E/V39A/R134Q/A153R/L214E/P266H/L278D/C503Q/A547D/C565N；

I27E/V39A/R134Q/A153G/L214E/P266H/I285E/C503Q/A551D/C565N；

I27E/V39A/R134Q/A153R/L214E/C503Q/A547D；I27E/V39A/R134Q/A153R/L278D；

I27E/V39A/R134Q/A153R/L278D/A547D/A551D；I27E/V39A/R134Q/A153R/A547D；

I27E/V39A/R134Q/Q205T/L214E/P266H/I285E/C503Q/A551D/C565N；

I27E/V39A/R134Q/Q205T/P266H/C503Q/A551D/C565N；

I27E/V39A/R134Q/P210C/L214E/C503Q；I27E/V39A/R134Q/P210C/C503Q/A551D；

I27E/V39A/R134Q/L214E/P266H/A551D；

I27E/V39A/R134Q/L278D/I285E/C503Q/A547D/A551D；

I27E/V39A/R134Q/L278D/C503Q/A547D；I27E/V39A/R134Q/C503Q/A547D；

I27E/V39A/R134Q/A547D/C565N；I27E/V39A/Q205T/L214E/C503Q/C565N；

I27E/V39A/Q205T/P266H/I285E/A547D/A551D/C565N；I27E/V39A/Q205T/P266H/A551D；

I27E/V39A/Q205T/L278D/C503Q/A551D/C565N；I27E/V39A/Q205T/L278D/C503Q/C565N；

I27E/V39A/Q205T/C503Q/A547D/C565N；I27E/V39A/P210C/T212S；

I27E/V39A/P210C/P266H/I285E/C503Q/A547D；I27E/V39A/P210C/P266H/C503Q/A551D；

I27E/V39A/L214E；I27E/V39A/L214E/P266H/L278D/C503Q/A547D/A551D/C565N；

I27E/V39A/L214E/L278D/C503Q；I27E/V39A/L214E/L278D/C503Q/A547D/C565N；

I27E/V39A/L214E/C503Q/A551D；I27E/V39A/P266H；I27E/V39A/P266H/L278D；

I27E/V39A/L278D；I27E/V39A/L278D/A547D；I27E/V39A/L278D/I285E/C503Q/A547D；

I27E/V39A/L278D/C503Q/C565N；I27E/V39A/C503Q；I27E/G45D/Q205T/P266H/C565N；

I27E/V105C；I27E/V105C/R134Q/A153R/P210C/L214E/C503Q/A547D；

I27E/V105C/R134Q/A153R/I285E/A547D；I27E/V105C/R134Q/A153R/C503Q；

I27E/V105C/R134Q/Q205T/P210C/C503Q；

I27E/V105C/R134Q/Q205T/L214E/P266H/L278D/C503Q/C565N；

I27E/V105C/Q205T/P266H/C503Q；

I27E/V105C/R134Q/P210C/L214E/P266H/L278D/A551D/C565N；

I27E/V105C/R134Q/P210C/L214E/C503Q/A551D/C565N；

I27E/V105C/R134Q/P210C/P266H/L278D/I285E/C503Q/A551D/C565N；

I27E/V105C/R134Q/L214E/L278D/C503Q/A547D；

I27E/V105C/R134Q/L214E/L278D/C503Q/A547D/A551D/C565N；I27E/V105C/Q205T；

I27E/V105C/Q205T/L214E/P266H；I27E/V105C/Q205T/L214E/P266H/A551D/C565N；

I27E/V105C/Q205T/L214E/L278D/I285E/C503Q/A547D/A551D/C565N；

I27E/V105C/Q205T/C503Q/A547D/A551D/C565N；I27E/V105C/L214E；

I27E/V105C/L214E/P266H/C503Q；I27E/V105C/L214E/I285E/A551D/C565N；

I27E/V105C/L214E/A547D/A551D/C565N；I27E/V105C/L214E/A551D/C565N；

I27E/V105C/P266H；I27E/V105C/P266H/I285E/C503Q/A547D/C565N；

I27E/V105C/L278D/A547D；I27E/V105C/I285E/C503Q/A547D/A551D/C565N；

I27E/V105C/C503Q/A547D/C565N；I27E/V105C/C503Q/A547D/A551D/C565N；

I27E/A112C/R134Q/A153R/L214E/P266H/C503Q；

I27E/A112C/R134Q/L278D/I285E/C503Q/A551D/C565N；

I27E/A112C/R134Q/Q205T/L278D/C503Q；I27E/A112C/R134Q/Q205T/I285E/C503Q；

I27E/R134Q；I27E/R134Q/A153R/I285E/C503Q/A547D；

I27E/R134Q/Q205T/I285E/C503Q/A551D；I27E/R134Q/Q205T/P266H/L278D/A547D；

I27E/R134Q/P210C；I27E/R134Q/L214E/C503Q；I27E/R134Q/L214E/C503Q/A547D；

I27E/R134Q/L214E/C503Q/A547D/A551D；I27E/R134Q/L214E/C503Q/C565N；

I27E/R134Q/L278D/I285E/A551D/C565N；I27E/R134Q/I285E/C503Q；

I27E/A153R/L214E/L278D/I285E/A551D/C565N；I27E/A153R/L214E/L278D/A551D；

I27E/Q205T；I27E/Q205T/L214E/L278D/I285E/C503Q/C565N；

I27E/Q205T/L278D/A551D；I27E/P210C；I27E/P210C/L214E/C503Q/A547D；

I27E/L214E；I27E/L214E/P266H/L278D/I285E/A551D；I27E/L214E/L278D；

I27E/L214E/L278D/C503Q；I27E/L214E/C503Q；I27E/L214E/C503Q/A547D；

I27E/L214E/C503Q/A547D/C565N；I27E/L214E/A551D；I27E/P266H/L278D/C503Q；

I27E/A547D/C565N；V39A/G45S/L278D/C503Q/A551D；

V39A/V105C/R134Q/A153R/Q205T/A551D；V39A/V105C/R134Q/P210C/L214E/A551D；

V39A/V105C/Q205T/C503Q；V39A/V105C/Q205T/A551D；V39A/V105C/P210C/A547D；

V39A/A112C/A153R/Q205T/L278D/C503Q/A547D；V39A/R134Q；

V39A/R134Q/Q205T/L214E/C503Q/C565N；V39A/R134Q/P210C/L214E/A547D/C565N；

V39A/A153R/C503Q/A547D；V39A/Q205T/L278D/A547D/A551D；

V39A/P210C/L214E/L278D/I285E/C503Q/A551D；V39A/P266H；

V39A/P275R/L278D/C503Q/A551D；V39A/C503Q；V39A/C503Q/A551D/C565N；V105C；

V105C/A112C/R134Q/Q205T/L214E/Y492H/C503Q/A547D；

V105C/R134Q/A153R/Q205T/L214E/C503Q；V105C/R134Q/Q205T/L214E/A547D；

V105C/R134Q/L214E/L278D/C565N；V105C/R134Q/L214E/C503Q/A547D；

V105C/R134Q/L214E/C503Q/A547D/A551D；V105C/R134Q/C503Q；

V105C/R134Q/C503Q/A547D；V105C/R134Q/C503Q/A547D/C565N；

V105C/A153R/Q205T/L214E/P266H/C503Q/A547D；

V105C/Q205T/L214E/L278D；V105C/Q205T/L214E/C503Q/A547D/A551D/C565N；

V105C/Q205T/C503Q/A551D；V105C/L214E/P266H/L278D/A547D；

V105C/L214E/L278D/C503Q/A547D/A551D；V105C/L214E/I285E；

V105C/L214E/I285E/C503Q/A547D/A551D/C565N；V105C/L214E/I285E/A547D/C565N；

V105C/L278D/C503Q/A551D；V105C/I285E；V105C/I285E/A547D；V105C/C503Q；

A112C/R134Q/L214E/C503Q/A547D/A551D/C565N；A112C/L214E/L278D；

A112C/L278D/C503Q/A547D；R134Q/Q205T/L214E/I285E/C503Q/A551D/C565N；

R134Q/Q205T/C503Q；R134Q/P210C/L214E/L278D/C503Q/A547D/C565N；

R134Q/P210C/L214E/C503Q/A547D/A551D；R134Q/L214E；R134Q/L214E/L278D/C503Q；

R134Q/L214E/L278D/C503Q/A551D；R134Q/L214E/I285E/C503Q；R134Q/C503Q；

R134Q/C503Q/A547D/A551D；A153R；Q205T/L214E/I285E/C503Q/A551D；

Q205T/L214E/I285E/C503Q/C565N；Q205T/L214E/C503Q/A547D/C565N；

L214E/P266H/C503Q/A547D/A551D/C565N；L214E/C503Q/A547D；L214E/A547D；

P266H/L278D/C503Q；P266H/C565N；L278D/A547D；C503Q；C503Q/A547D；

A547D；C565N；V80I/R134C/P564Q；V121C；A123G；A124G；M125L；L126I/T；L126M/R134L；

L127A；A129G/L；N130Q；N130C/M370I R134W；M133R；R134I；R134N/G307C；G135C/S；

G135A/A394E；G20S/I144L；R43S；L47M/I144L；L47M/R146E；L47M/M147G/A383E；

L47M/P157C；Q58H/L143V；Q58K/P157D/G369C；A62S/M147V；S82I/G135C/P157F/W279L；

R94C/I149E；T110I/I139R；L118M/L141H；A119E/T156H/A289D；I139M/V；R140D/G/M；

R140N/A199E；R140E/A334S/A551D；L141K/Q/P/T；E142H/P/V；E142D/G371D；L143F/M；

I144L/N/V；K145N/Q/R；K145G/P157T；R146H/L；R146W/D191Y；M147A；I149L/R；F150K/L/M；

L151M；A153C/G；A153S/H250N；G154R；G154Y/L174M/Q321K/S456I/G483C；T156K/G483C；

P157D/F/H/Y；Y158E；V159C/H/L/M；M247I；L319M；Q389K；P117T/Y176Q；V172I/C/L；

L174M；S175G；Y176E/I/M/R/V；I177M/V；T178L/A477S；S180C/T；R43S/H374K；R43S/H374R；

A112S/M370A/A507E；M147I/H374S；S187R/L381V；D191Y/H385N；A232S；Q240K/H374R；

A256S/L381N；P275Q/M370S；P275T/H374R；Q332K/Y377M；A334S/H374V；L349M；

Q355K/H374S；M370G/I/S；G371H/N/Q/S；M372A/V；H374A/D/G/L/N/R/S/T；H374Q/P396Q；

H374R/G417C；L375I；L375M；Y377C/I/N；Y378C/D/E/I/L/N/S；Y378F/P404Q；I379C/H/L/M/N；

L381G/V；L381M/Q560K；L382C/H/I/M/S；A383S/V；K384R；H385C/G/N；H385M/P403H；

H385S/P403H；D387S；L418M；G425V；A447S；S461G；S525L；A24S/F434M；A62S/T433N；S98I；

L213M/S438L；Q240K/T433Y；S286R/Y435T；A289S/L431E；S331I；L431C/E/G/P/S/V；L432C/V；

T433A/I/L/N/P/Q/R/S/V/W；F434C；Y435L；Y435Q/H446N；G436M；G436D/T；N437E/G/Q；

N437T/L538M；S438C/F/M/R/T；I439C/F/L/V；A477S；A24E；Q58R/Y475H；A70S/N474E；

L104M/V476L；A119E/G365A；L206M；P275Q；G276V；Q292H/A479G；Q355H/I478C；

P404T/A477V；I471F/G/K/M/N/R/V/W；F472G；Q473H/K/M/R/S；Q473H/A507S；N474A/H/R/W；

N474D/R490H；Y475C/F/L/Q；V476C/I/L；I478N/S；A479G/S；

F482C/L；G483C/H/S；G483A/S524I；G483R/G537C；A558S；V39A/K115E/M133R/C565N；

V39A/M133R/F472G/C503Q/C565N；V39A/M133R/F472G/C565N；V39A/M133R/C503Q；

V39A/M133R/C503Q/C565N；V39A/M147A/Y378E/C503Q/C565N；V39A/M147A/Y378E/C565N；

V39A/M147A/L381G/F472G/C503Q/C565N；V39A/M147A/L381G/C503Q/C565N；

V39A/M147A/F472G/C503Q/C565N；V39A/M147A/F472G/C565N；V39A/M147A/C565N；

V39A/G248C/L381G/F472G/C503Q/C565N；V39A/Y378E/C503Q/C565N；V39A/Y378E/C565N；

V39A/L381G；V39A/F472G/C503Q/C565N；V39A/C503Q/C565N；M133R/L381G/C565N；

M133R/C503Q；Y378D/C503Q；Y378E/F472G/C503Q/C565N；L381G/F472GC503Q/C565N；

和/或F472G/C503Q/C565N。

本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:26或其功能片段至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或更大的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:26或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ ID NO:26相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

在一些实施方案中，本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:26或其功能片段至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:26或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ IDNO:26相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

在一些另外的实施方案中，本发明提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:26或其功能片段至少85％的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:26或其功能片段相比在一个或多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与参考序列SEQ ID NO:26相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，包含具有与参考序列SEQ ID NO:26至少85％的序列同一性的氨基酸序列，和与SEQ ID NO:126相比的至少一个氨基酸残基差异，并且所述工程化多肽与SEQ ID NO:26相比表现出选自以下的至少一种改进的特性：增强的催化活性、降低的对蛋白水解的敏感性、增加的对酸性pH的耐受性、减少的聚集和/或降低的免疫原性。在工程化多肽的一些实施方案中，与SEQ ID NO:26相比的氨基酸残基差异选自以下置换或置换集合中的一个或更多个：A24E/G381L；L127V；A129I/V；S131C/T；H132L/S；R134C/F/H/K；R134H/Y378E/G381L；R134H/Y378E/G381L/V388T；R134H/V388T；A136K；A289S；M372L；H374G/M/Q；G381A/C/F/I/L/M/N/Q/S/T；A383C/M；V388C/T；L431M；和/或L563M。

在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽具有与参考序列SEQ ID NO:4至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽具有与参考序列SEQ IDNO:4至少约90％的序列同一性，而在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少约95％的序列同一性。在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽具有与参考序列SEQ ID NO:4至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽具有与参考序列SEQID NO:4至少90％的序列同一性，而在一些另外的实施方案中，工程化多肽具有与参考序列SEQ ID NO:4至少95％的序列同一性。在一些另外的实施方案中，工程化多肽包含本发明的具有苯丙氨酸解氨酶(PAL)活性的多肽(例如，本文在表中提供的任何变体)的功能片段。

在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。在一些实施方案中，本发明的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽包括具有与SEQID NO:6、8、10、12、14、16、18、20、22、24和/或26至少约90％序列同一性的氨基酸序列。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)的酶活性的工程化多肽包括具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26或其功能片段至少约99％的序列同一性的氨基酸序列。在一些另外的实施方案中，工程化多肽包含本发明的具有苯丙氨酸解氨酶(PAL)活性的多肽的功能片段(例如，SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26，以及本文中表中提供的任何变体的功能片段)。

本发明还提供了具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中该工程化多肽是表2-1至2-5和/或表9-1至9-7中的任一个提供的变体PAL。

在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽是多变鱼腥藻酶。在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽是热稳定的。在一些实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽耐受蛋白水解。在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽耐受通过至少一种消化道酶的蛋白水解。在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽耐受通过胰凝乳蛋白酶、胰蛋白酶、羧肽酶和/或弹性蛋白酶的蛋白水解。在一些另外的实施方案中，具有苯丙氨酸解氨酶(PAL)活性的工程化多肽是酸稳定的。

本发明还提供了去免疫化的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽。在一些实施方案中，去免疫化的工程化多肽包含具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或更大的序列同一性的氨基酸序列。在一些另外的实施方案中，去免疫化的工程化多肽包含具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的序列同一性的氨基酸序列。在一些实施方案中，去免疫化的工程化多肽包含具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26至少95％序列同一性的氨基酸序列。在一些实施方案中，去免疫化的工程化多肽包含与SEQ ID NO:6、8、10、12、14、16、18、20、22、24和/或26具有95％的序列同一性的氨基酸序列。

在仍然一些另外的实施方案中，本发明提供了纯化的工程化多肽，所述工程化多肽具有苯丙氨酸解氨酶(PAL)活性。

本发明还提供了多核苷酸序列，所述多核苷酸序列编码至少一种如本文所述的具有苯丙氨酸解氨酶(PAL)的工程化多肽。在一些实施方案中，多核苷酸序列被可操作地连接到控制序列。在一些另外的实施方案中，多核苷酸序列是密码子优化的。

本发明还提供了表达载体，所述表达载体包含编码至少一种如本文所提供的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽的至少一种多核苷酸序列。在一些实施方案中，表达载体还包含至少一种控制序列。在一些实施方案中，控制序列是启动子。在一些另外的实施方案中，启动子是异源启动子。

本发明还提供了宿主细胞，所述宿主细胞用编码具有苯丙氨酸解氨酶(PAL)活性的至少一种工程化多肽的至少一种多核苷酸序列来转化，和/或用至少一种表达载体来转化，所述表达载体包含编码具有苯丙氨酸解氨酶(PAL)活性的至少一种工程化多肽的至少一种多核苷酸序列和至少一种控制序列。在一些实施方案中，宿主细胞包含具有苯丙氨酸解氨酶(PAL)活性的至少一种工程化多肽，所述工程化多肽是密码子优化的。在一些实施方案中，宿主细胞是大肠杆菌(E.coli)。

本发明还提供了在宿主细胞中产生至少一种工程化PAL多肽的方法，所述方法包括在适合的培养条件下，培养包含编码具有苯丙氨酸解氨酶(PAL)活性的至少一种工程化多肽的至少一种多核苷酸、和/或包含编码具有苯丙氨酸解氨酶(PAL)活性的至少一种工程化多肽的至少一种多核苷酸序列的至少一种表达载体的宿主细胞，使得该工程化PAL多肽被产生。在一些实施方案中，该方法还包括从培养物和/或宿主细胞中回收具有苯丙氨酸解氨酶(PAL)的至少一种工程化多肽的步骤。在一些另外的实施方案中，该方法还包括纯化具有苯丙氨酸解氨酶(PAL)的至少一种工程化多肽的步骤。

本发明还提供了组合物，所述组合物包含至少一种如本文所提供的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽。在一些实施方案中，组合物是药物组合物。在一些实施方案中，组合物是膳食和/或营养补充物。在一些另外的实施方案中，药物组合物还包含至少一种药学上可接受的赋形剂和/或载体。在一些另外的实施方案中，组合物适合于苯丙酮尿症的治疗。在一些另外的实施方案中，组合物适合于口服施用至人。在一些实施方案中，组合物呈丸剂、片剂、胶囊、囊形片(gelcap)、液体或乳剂的形式。在又一些另外的实施方案中，丸剂、片剂、胶囊、或囊形片还包含肠溶包衣。在一些另外的实施方案中，药物组合物适合于肠胃外注射到人中。在一些实施方案中，药物组合物与至少一种另外的治疗有效化合物共施用。在一些另外的实施方案中，药物组合物包含至少一种另外的治疗有效化合物。在一些另外的实施方案中，药物组合物存在于膳食和/或营养补充物中。

本发明还提供了用于治疗和/或预防受试者中苯丙酮尿症的症状的方法，所述方法包括：提供患有苯丙酮尿症的受试者，以及向受试者提供本文所提供的至少一种组合物。在一些实施方案中，组合物包含药物组合物，而在一些可选的实施方案中，组合物包含膳食/营养补充物。在该方法的一些实施方案中，苯丙酮尿症的症状被改善。在一些另外的实施方案中，被治疗的受试者能够食用在其甲硫氨酸、苯丙氨酸和/或酪氨酸含量方面比由表现出苯丙氨酸症状的受试者所需要的饮食较不受限的饮食。在一些实施方案中，被治疗的受试者(即，已经被提供了包含至少一种如本文所提供的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽的至少一种组合物的受试者)能够食用在其甲硫氨酸、苯丙氨酸和/或酪氨酸含量方面比由还未被提供至少一种如本文所提供的组合物的受试者所需要的饮食较不受限的饮食。在一些实施方案中，向受试者提供的组合物包含药物组合物，而在一些可选的实施方案中，组合物包含膳食/营养补充物。本发明还提供了被治疗的受试者，其中该受试者已被施用了至少一种组合物和/或药物组合物，所述至少一种组合物和/或药物组合物包含至少一种如本文所提供的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽。在一些实施方案中，受试者是选自以下的动物：灵长类、啮齿类动物和兔类动物。在一些另外的实施方案中，受试者是小鼠。在一些另外的实施方案中，受试者是人。在仍然一些另外的实施方案中，受试者是人类婴儿或儿童，而在一些可选的实施方案中，受试者是人类成人或青年。I

本发明还提供了包含至少一种本文所提供的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽的组合物的用途。

附图简述

图1提供了野生型PAL蛋白序列的比对：多变鱼腥藻PAL(NCBI YP_324488.1(SEQID NO:4))；点状念珠藻苯丙氨酸/组氨酸解氨酶“NpPHAL”(NCBI YP_001865631.1(SEQ IDNO:30)；胶须藻属(Rivularia sp.)组氨酸解氨酶“RspHAL”(NCBI YP_007056096.1(SEQ IDNO:31)；颤藻属(Oscillatoria sp.)组氨酸解氨酶“Osp HAL”(NCBI YP_07108482.1(SEQID NO:32)；和粘球藻属(Gloeocapsa sp.)组氨酸解氨酶“GspHAL”(NCBI YP_007127054.1)(SEQ ID NO:33)。

图2的A图显示了与野生型AvPAL相比，在pH 7.0下测试的变体22号(SEQ ID NO:8)、变体30号(SEQ ID NO:6)和变体36号(SEQ ID NO:10)的降低的对蛋白水解的敏感性(表示为胰凝乳蛋白酶和胰蛋白酶耐受性)，如实施例4中进一步描述的。

图2的B图提供了显示与野生型AvPAL相比，在pH 4.0至5.2下测试的变体22号、30号和36号的增加的对酸性pH的耐受性的图，如实施例4中进一步描述的。

图3提供了野生型PAL和变体36号的K_M结果。

图4提供了显示野生型PAL和变体36号的氨基酸特异性的数据。

图5提供了显示暴露于人胰凝乳蛋白酶和胰蛋白酶的野生型PAL和变体36号的相对稳定性的结果。

图6提供了显示暴露于猪胰腺提取物的野生型PAL和变体36号、42号和43号的相对稳定性的结果。

图7提供了显示实施例5获得的结果的图。

图8提供了显示实施例8获得的结果的图。

发明描述

本发明提供了工程化PAL多肽、突变体、生物活性片段及其类似物，以及包含工程化PAL多肽、突变体、生物活性片段及其类似物的药物组合物和工业组合物。

缩写和定义：

除非另外定义，本文所使用的所有技术和科学术语通常具有与本发明所属领域普通技术人员通常理解的的相同的含义。通常，本文中所使用的命名法和下面所述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学的实验室程序是本领域熟知和通常采用的那些。此类技术在本领域技术人员熟知的许多文本和参考作品中被熟知和描述。标准技术或其修改用于化学合成和化学分析。本文中上文和下文均提及的所有专利、专利申请、文章和出版物在此通过引用明确并入本文。

尽管发现在本发明的实践中使用类似或等同于本文所述那些的任何适合的方法和材料，一些方法和材料被本文描述。应当理解，本发明并不限于所述的具体方法学、方案和试剂，因为这些取决于本领域技术人员使用其的技术范围而变化。因此，下面即将定义的术语通过参考本申请作为整体而被更充分地描述。本文上文和下文均提及的所有专利、专利申请、文章和出版物，在此通过引用明确并入本文。

此外，除非上下文另外清楚地指示，如本文所用的单数“一(a)”、“一(an)”和“该(the)”包括复数指示物。

数值范围包括限定该范围的数字。因此，本文公开的每个数值范围意在包括落在此类较宽数值范围内的每一较窄数值范围，如同此类较窄数值范围在本文被全部清楚地写出。它还意在本文公开的每一最大(或最小)数值极限包括每一较低(或较高)的数值极限，如同此类较低(或较高)数值极限在本文被清楚地写出。

术语“约”意指特定值的可接受误差。在某些情况下，“约”意指在给定值范围的0.05％、0.5％、1.0％或2.0％内。在某些情况下，“约”意指在给定值的1、2、3或4个标准差内。

此外，本文所提供的标题不是可通过参考本申请作为整体而被具有的本发明的各个方面或实施方案的限制。因此，下面即将定义的术语通过参考本申请作为整体而被更充分地描述。尽管如此，为了便于理解本发明，许多术语定义如下。

除非另外指示，核酸以5'至3'方向从左到右书写；氨基酸序列分别以氨基至羧基方向从左至右书写。

如本文所用的术语“包含(comprising)”及其同源词以其包含的意义被使用(即，等同于术语“包括(including)”和其相应的同源词)。

“EC”数字是指Enzyme Nomenclature of the Nomenclature Committee of theInternational Union of Biochemistry and Molecular Biology(生物化学和分子生物学国际联合命名委员会)(NC-IUBMB)的酶命名法。该IUBMB生化分类是基于其催化的化学反应的酶数值分类系统。

“ATCC”是指American Type Culture Collection(美国典型培养物保藏中心)，其生物保藏收集包括基因和菌株。

“NCBI”是指National Center for Biological Information(国家生物信息中心)和在其中所提供的序列数据库。

如本文所用，术语“苯丙氨酸解氨酶(PAL)多肽”是指在还包括组氨酸解氨酶和酪氨酸解氨酶的芳香族氨基酸裂解酶家族(EC 4.3.1.23，EC 4.3.1.24和EC4.3.1.25)内的一类酶。因为一些PAL酶可使用酪氨酸和苯丙氨酸作为底物，PAL多肽有时还被称为苯丙氨酸/酪氨酸解氨酶。然而，本文公开和要求保护的AvPAL和变体不使用酪氨酸作为底物。PAL多肽催化L-苯丙氨酸转化为反式肉桂酸和氨。PAL活性指PAL多肽的酶活性。在一些优选的实施方案中，PAL酶还包含辅因子3,5-二氢-5-亚甲基-4H-咪唑-4-酮(MIO)。该辅因子可能为催化活性所需要，并通过保守的活性位点Ala167-Ser168-Gly169三肽区段的环化和脱水来形成。

“蛋白”、“多肽”和“肽”在本文可互换使用，以表示不管长度或翻译后修饰(例如，糖基化或磷酸化)通过酰胺键共价连接的至少两个氨基酸聚合物。

“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的的单字母符号在本文被提及。同样地，核苷酸可通过其通常可接受的单字母代码被提及。

当关于细胞、多核苷酸或多肽使用时，术语“工程化”、“重组”、“非天然存在的”和“变体”指如下材料或与该材料的天然或自然形式相应的材料：已经以天然本来不存在的方式被修饰或与其相同但由合成材料产生或衍生和/或通过使用重组技术操作产生。

如本文所用，“野生型”和“天然存在的”是指在自然界中发现的形式。例如野生型多肽或多核苷酸序列是生物体中存在的序列，其可从天然来源分离且未通过人为操作而被有意识地修饰。

如本文所用的“去免疫化”是指操作蛋白创造不如野生型或参考蛋白那样是免疫原性的变体。在一些实施方案中，去免疫化被完成，其中变体蛋白不刺激该变体蛋白被施用至其的患者中的免疫应答。该应答可通过多种方法来测量，所述多种方法包括但并不限于，施用蛋白后中和(即，耐药物抗体)的存在或丰度、过敏性应答的存在或细胞因子释放的普遍程度(prevalence)或强度。在一些实施方案中，变体蛋白比野生型蛋白或参考蛋白的免疫原性更小。在一些实施方案中，去免疫化包括对被T细胞受体识别的蛋白(例如，表位)的修饰。在一些实施方案中，T细胞表位从野生型蛋白或参考蛋白中除去，以便产生去免疫化的变体蛋白。在一些实施方案中，去免疫化的蛋白显示了对人体免疫应答的生物化学和细胞生物学的预测因子的较低水平的应答，该应答包括树突状细胞T细胞活化测定或人白细胞抗原(HLA)肽结合测定。

“编码序列”指编码蛋白的氨基酸序列的核酸的部分(例如，基因)。

术语“序列同一性百分比(％)”在本文中使用以指多核苷酸和多肽之间的比较，并通过跨比较窗比较两条最佳比对的序列来确定，其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可包括添加或缺失(即，缺口)，以用于两个序列的最佳比对。百分比可如下计算：通过确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目，以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性的百分比。可选地，百分比可如下计算：通过确定两个序列中出现相同的核酸碱基或氨基酸残基或核酸碱基或氨基酸残基与缺口对齐的位置的数目，以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解，存在许多可用于比对两个序列的已建立的算法。用于比较的最佳序列比对如下进行，例如，如本领域已知的，通过Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981])、通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970])、通过Pearson和Lipman的相似度检索方法(Pearson和Lipman，Proc.Natl.Acad.Sci.USA 85:2444[1988])、通过这些算法的计算机实现(例如，在GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)或通过目测。适合于确定序列同一性百分比和序列相似性的算法的实例包括但不限于BLAST和BLAST2.0算法(参见例如，Altschul等，J.Mol.Biol.,215:403-410[1990]；和Altschul等,Nucleic Acids Res.,3389-3402[1977])。用于进行BLAST分析的软件为通过美国国家生物技术信息中心网站公共可获得的。该算法包括首先通过识别查询序列(query sequence)中具有长度“W”的短字来确定高评分序列对(HSP)，当其与数据库序列中相同长度的字比对时，所述短字匹配或满足某个正值阈值评分“T”。T被称为邻近字评分阈值(参见，Altschul等，同上)。这些最初的邻近字击中(word hit)用作启动检索的种子以找到更长的包括它们的HSP。然后字击中沿着每个序列的两个方向延伸到累积比对评分不能增加的程度。对于核苷酸序列，累积评分使用参数“M”(用于一对匹配残基的奖励评分；总是>0)和“N”(用于错配残基的惩罚评分；总是<0)来计算。对于氨基酸序列，使用评分矩阵以计算累积评分。当发生以下情况时字击中在每个方向的延伸停止：累积比对评分从其最大获得的值下降了量“X”时；由于一个或多个负评分残基比对的累积，累积评分变成零或以下时；或达到任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(E)、M＝5、N＝-4、以及两个链的比较作为默认参数。对于氨基酸序列，BLASTP程序使用3的字长(W)、10的期望值(E)，和BLOSUM62评分矩阵作为缺省(参见例如,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与％序列同一性的示例性确定可使用GCG Wisconsin软件包(Accelrys、Madison WI)中的BESTFIT或GAP程序，使用提供的默认参数。

“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集，例如，全长基因或多肽序列的片段。通常，参考序列是至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或核酸或多肽的全长。由于两种多核苷酸或多肽可以各自(1)包括两个序列之间相似的序列(即，完整序列的一部分)，和(2)还可包括两个序列之间不同的序列，两种(或更多种)多核苷酸或多肽之间的序列比较通常通过在“比较窗口”内比较两种多核苷酸或多肽的序列来进行，以确定和比较具有序列相似性的局部区域。在一些实施方案中，“参考序列”可基于基本氨基酸序列，其中参考序列是可在基本序列中具有一个或更多变化的序列。例如，短语“基于SEQ ID NO:4的在相应于X39的残基上具有缬氨酸的参考序列”指在SEQ ID NO:4中的位置X39上相应的残基(例如，丙氨酸)已被改变为缬氨酸的参考序列。

“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段，其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较，并且其中在比较窗口中序列的一部分与用于两个序列的最佳比对的参考序列(其不包含添加或缺失)相比，可包括20％或更少的添加或缺失(即，缺口)。比较窗口可以比20个连续残基更长，并任选地包括30、40、50、100或更长的窗。

当在给定的氨基酸或多核苷酸序列编号的上下文中使用时，“对应于”、“关于”和“相对于”是指当给定的氨基酸或多核苷酸序列与指定的参考序列相比时，参考序列的残基编号。换言之，给定的聚合物的残基数目或残基位置关于参考序列被指定，而不是通过给定的氨基酸或多核苷酸序列内的残基的实际数字位置被指定。例如，给定的氨基酸序列，诸如工程化PAL的氨基酸序列可通过引入空位以优化两条序列之间的残基匹配与参考序列比对。在这些情况中，尽管存在空位，在给定的氨基酸或多核苷酸序列中的残基的编号关于与其比对的参考序列作出。

“氨基酸差异”和“残基差异”是指多肽序列的位置处的氨基酸残基相对于参考序列中在相应位置处的氨基酸残基的差异。氨基酸差异的位置通常在本文中称为“Xn”，其中n指残基差异基于其的参考序列中的相应位置。例如，“与SEQ ID NO:4相比在位置X91上的残基差异”是指相应于SEQ ID NO:4的位置91的多肽位置处的氨基酸残基的差异。因此，如果SEQ ID NO:4的参考多肽在位置91上具有丙氨酸，那么“与SEQ ID NO:4相比在位置X91上的残基差异”是指相应于SEQ ID NO:4的位置的91的多肽位置处的丙氨酸以外的任何残基的氨基酸置换。在本文的大多数情况下，位置处的特定氨基酸残基差异表示为“XnY”，其中“Xn”是指定参考多肽的相应残基和位置(如上所述)，并且“Y”是工程化多肽中发现的氨基酸的单字母标识符(即，与参考多肽相比的不同残基)。在一些情况下(例如，在实施例的表中)，本公开内容还提供了由常规表示法“AnB”表示的特定氨基酸差异，其中A是参考序列中残基的单字母标识符，“n”是参考序列中的残基位置的数目，且B是工程化多肽的序列中的残基置换的单字母标识符。在一些情况下，本公开内容的多肽相对于参考序列可包含一个或更多个氨基酸残基，其由相对于参考序列存在残基差异的一列特定位置指示。在一些实施方案中，当多于一个氨基酸可在多肽的特定残基位置中使用时，可使用的各种氨基酸残基由“/”分离(例如，X307G/X307Q或X307G/Q)。本公开内容包括包含包括保守和非保守的氨基酸置换的任一个/或两者的一个或更多个氨基酸差异的工程化多肽序列置换。

术语“氨基酸置换集合”和“置换集合”是指多肽序列内的一组氨基酸置换。在一些实施方案中，置换集合包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或更多个氨基酸置换。在一些实施方案中，置换集合指存在于在实施例的任一表中列出的变体AvPAL多肽的任何一个中的氨基酸置换的集合。例如，在变体36中存在的置换集合为A39V/A91V/N290G/H307G/L407V/T524S，其中所述氨基酸位置是相对于SEQ IDNO:4。

“保守氨基酸置换”是指用具有相似侧链的不同残基置换残基，并且因此通常涉及在相同或相似定义类别的氨基酸内的氨基酸置换多肽中的氨基酸。通过示例的方式而非限制，具有脂族侧链的氨基酸可被另一个脂肪族氨基酸置换(例如，丙氨酸、缬氨酸、亮氨酸和异亮氨酸)；具有羟基侧链的氨基酸被具有羟基侧链的另一个氨基酸置换(例如，丝氨酸和苏氨酸)；具有芳香族侧链的氨基酸被具有芳香族侧链的另一个氨基酸置换(例如，苯丙氨酸、酪氨酸、色氨酸和组氨酸)；具有碱性侧链的氨基酸被具有碱性侧链的另一个氨基酸置换(例如，赖氨酸和精氨酸)；具有酸性侧链的氨基酸被具有酸性侧链的另一个氨基酸置换(例如，天冬氨酸或谷氨酸)；且疏水性氨基酸或亲水性氨基酸分别被另一个疏水性氨基酸或亲水性氨基酸置换。

“非保守置换”是指用具有显著差异侧链性质的氨基酸置换多肽中的氨基酸置换。非保守置换可以使用限定组之间，而不是它们之内的氨基酸，并影响：(a)在置换的区域中肽骨架的结构(例如，脯氨酸置换甘氨酸)；(b)电荷或疏水性；和/或(c)侧链的体积。通过示例的方式而非限制，示例性非保守性置换包括酸性氨基酸被碱性或脂肪族氨基酸置换；芳香族氨基酸被小氨基酸置换；和亲水性氨基酸被疏水性氨基酸置换。

“缺失”是指通过从参考多肽中除去一个或更多个氨基酸而对多肽进行的修饰。缺失可包括除去1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或20个或更多个氨基酸、多至组成参考酶的氨基酸总数的10％、或多至氨基酸总数的20％，同时保留酶活性和/或保留工程化转氨酶的改进的特性。缺失可涉及多肽的内部和/或端部。在各个实施方案中，缺失可包括连续的区段或可以是不连续的。

“插入”是指通过向参考多肽添加一个或更多个氨基酸而对多肽进行的修饰。插入可以在多肽的内部或到羧基或氨基末端。如本文所用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由天然存在的多肽中的一个或更多个氨基酸分隔。

术语“功能片段”和“生物活性片段”在本文可互换使用，是指如下多肽：所述多肽具有氨基末端和/或羧基末端缺失和/或内部缺失，但其中剩余的氨基酸序列与它与其相比的序列(例如，本发明的全长工程化PAL)中的相应位置相同，并且其保留全长多肽的基本上所有的活性。

“分离的多肽”是指如下多肽：所述多肽与其天然伴随的其他污染物(例如，蛋白、脂质和多核苷酸)基本上分离。术语包括已从它们天然存在的环境或表达系统(例如，宿主细胞或体外合成)中取出或纯化的多肽。重组PAL多肽可存在于细胞内、存在于细胞培养基中，或以各种形式制备，诸如裂解物或分离的制剂。因此，在一些实施方案中，本文提供的重组PAL多肽是分离的多肽。

“实际上纯化的多肽”指如下组合物，在所述组合物中多肽物种是存在的优势物种(即，在摩尔或重量基础上，它比在该组合物中的任何其他单独的大分子物质更丰富)，并且当目标物种构成存在的的大分子物种的按摩尔或％重量计至少约50％时，通常是基本上纯化的组合物。通常，基本上纯化的PAL组合物将构成该组合物中存在的所有大分子物种的按摩尔或％重量计约60％或更多、约70％或更多、约80％或更多、约90％或更多、约95％或更多以及约98％或更多。在一些实施方案中，将目标物种纯化至基本的均一性(即，通过常规检测方法不能在组合物中检测出污染物物种)，其中该组合物基本上由单一大分子物种组成。溶剂物种、小分子(<500道尔顿)和元素离子物种不被认为是大分子物种。在一些实施方案中，分离的重组PAL多肽是基本上纯化的多肽组合物。

“改进的酶特性”是指与参考PAL多肽诸如野生型PAL多肽(例如，具有SEQ ID NO:4的AvPAL野生型)或另一种工程化PAL多肽相比表现出在任何酶特性中的改进的工程化的PAL多肽。改进的特性包括但不限于这样的特性，如增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的pH活性、增加的稳定性、增加的酶活性、增加的底物特异性和/或亲和力、增加的比活性、增加的对底物和/或终产物抑制的抑制性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性pH耐受性、增加的对蛋白水解活性耐受性(即，降低的对蛋白水解的敏感性)、降低聚集、增加的溶解度、降低的免疫原性和改变的温度曲线。

“增加的酶活性”和“增强的催化活性”是指工程化PAL多肽的改进的特性，其可被表示为与参考PAL酶(例如，野生型AvPAL和/或另一种工程化AvPAL)相比，比活性的增加(例如，产生的产物/时间/重量蛋白)和/或底物至产物的转化率百分比的增加(例如，在指定的时间段使用指定量的PAL，起始量的底物至产物的转化率百分比)。确定酶活性的示例性方法在实施例中被提供。可影响与酶活性相关的任何特性，包括经典酶特性K_m、V_max或k_cat，它们的改变可导致增加的酶活性。酶活性的改进可以是从相应野生型酶的酶活性的约1.1倍到相比于天然存在的PAL或从其衍生PAL多肽的另一种工程化PAL的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶活性。

在一些实施方案中，工程化PAL多肽具有以下的k_cat：至少0.1/秒、至少0.2/秒、至少0.3/秒、至少0.5/秒、至少1.0/秒的，且在一些优选的实施方案中大于1.0/秒。在一些实施方案中，K_m在约1μm至约5mM的范围内；在约5μm至约2mM的范围内；在约l0μm至约2mM的范围内；或在约l0μm至约1mM的范围内。在一些特别的实施方案中，工程化PAL酶表现出比参考PAL酶的酶活性大1.5至10倍、1.5至25倍、1.5至50倍、1.5至100倍或更大的范围内的改进的酶活性。PAL活性可通过本领域已知的任何标准测定来测量(例如，通过监测反应物或产物的分光光度法性质中的变化)。在一些实施方案中，产生的产物的量通过高效液相色谱法(HPLC)分离结合o-酞二醛(OPA)衍生化后的UV吸光度或荧光检测来测量。在一些实施方案中，使用确定的酶制剂、在设定条件下的确定的测定、和一种或多种确定的底物进行酶活性的比较，如本文进一步详细地描述的。通常，当比较裂解物时，细胞的数目和测定的蛋白的量被确定，并使用相同的表达系统和相同的宿主细胞以将由宿主细胞产生的和裂解物中存在的酶的量的变化最小化。

术语“改进的对酸性pH的耐受性”意指与参考PAL相比，根据本发明的重组PAL表现出增加的稳定性(即，在暴露于酸性pH持续指定的时间段[1小时，多达24小时]后，在约pH7.0下的更高的保留的活性)。

如本文所用的“生理pH”意指通常在受试者(例如，人)的小肠内发现的pH范围。通常从幽门瓣到大肠存在约6.0至7.5的范围内梯度pH。

关于改进的对酸性pH条件的稳定性或增加的对酸性pH的耐受性所用的术语“酸性pH”意指约1.5至6.8的pH范围。

本文可互换使用的术语“蛋白水解活性”和“蛋白水解”是指蛋白分解为较小的多肽或氨基酸。蛋白的分解通常是肽键通过蛋白酶(蛋白酶)的酶水解的结果。蛋白酶包括但不限于，胃蛋白酶、胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶；羧肽酶A和B和肽酶(例如，氨基肽酶、二肽酶和肠肽酶)。

短语“降低的对蛋白水解敏感性”和“降低的蛋白水解敏感性”在本文中可互换使用，意指在标准测定(例如，如实施例中公开的)中，在用一种或更多种蛋白酶上理之后，根据本发明的工程化PAL多肽与参考PAL相比将具有较高的酶活性。

“聚集”意指PAL多肽的凝结或沉淀。聚集可导致酶失活。术语“减少的聚集”意指工程化PAL多肽与参考PAL相比将更不易聚集。用于评价聚集的方法是本领域已知的，包括但不限于用适当染料(例如，硫磺素T或尼罗红)的荧光显微镜检查术、动态光散射、用适当染料(例如，氟硼荧(Bodipy))的流式细胞术、通过SDS-PAGE的过滤和分析、和/或蛋白印迹、荧光相关光谱法和电子显微镜的使用。存在评价聚集的商购可得的试剂盒(例如，蛋白聚集测定试剂盒[Enzo])。

“转化率”指底物至相应的产物的酶促转化(或生物转化)。“百分比转化率”是指在指定条件下一段时间内被转化为产物的底物的百分比。因此，PAL多肽的“酶活性”或“活性”可表示为在指定的一段时间内底物至产物的“转化率百分比”。

“杂交严格性”涉及核酸杂交中的杂交条件，诸如洗涤的条件。通常，杂交反应在较低严格性的条件下进行，随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶-DNA结合以下互补的核酸的条件，所述互补的核酸具有与靶DNA约60％的同一性、优选地约75％的同一性、约85％的同一性，与靶-多核苷酸大于约90％的同一性。示例性中度严格条件是等同于在42℃下于50％甲酰胺、5×Denhart溶液、5×SSPE、0.2％SDS中杂交，随后在42℃下于0.2×SSPE、0.2％SDS中洗涤的条件。“高严格度杂交”通常是指以下的条件：偏离对于定义的多核苷酸序列在溶液条件下确定的热熔化温度T_m约10℃或更少。在一些实施方案中，高严格度条件指以下的条件，其仅允许在65℃下于0.018M NaCl中形成稳定的杂交体的那些核酸序列的杂交(即，如果杂交体在65℃下于0.018M NaCl中是不稳定的，它在如本文考虑的在高严格度条件下将是不稳定的)。例如，可通过在等同于在42℃下于50％甲酰胺、5×Denhart溶液、5×SSPE、0.2％SDS的条件中杂交，随后在65℃下于0.1×SSPE和0.1％SDS中洗涤，而提供高度严格条件。另一种高严格度条件是在与以下等同的条件中杂交：在65℃下于含0.1％(w:v)SDS的5×SSC中杂交，和在65℃下于含0.1％SDS的0.1×SSC中洗涤。其他高严格度杂交条件，以及中度严格条件描述于以上引用的参考文献中。

“密码子优化的”是指编码蛋白的多核苷酸的密码子变为特定生物体中优先使用的那些密码子，使得所编码的蛋白在该生物体中更有效地表达。尽管遗传密码由于大多数氨基酸被称为“同义密码子”或“同义”密码子的几种密码子代表而为简并的，，但众所周知具体生物体的密码子使用是非随机的且偏向特定的密码子三联体。就给定的基因、具有共同功能或祖先起源的基因、高表达的蛋白相对于低拷贝数蛋白和生物体基因组的聚集蛋白编码区而言，这种密码子使用偏向可能更高。在一些实施方案中，对编码PAL酶的多核苷酸进行优化，以用于从被被选择用于表达的宿主生物体优化生产。

本文中“控制序列”是指包括对本公开内容的多核苷酸和/或多肽的表达是必要的或有利的所有组分。每个控制序列对编码多肽的核酸序列来说可以是天然的或外源的。此类控制序列包括但不限于，前导序列、多腺苷酸序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。在最小程度上，控制序列包括启动子和转录及翻译终止信号。在一些实施方案中，控制序列设置有连接体，用于引入特异性限制位点的目的，促进控制序列与编码多肽的核酸序列的编码区的连接。

“可操作地连接的”在本文中定义为如下一种配制：在所述配置中控制序列相对于感兴趣的多核苷酸被适当放置(即，以功能关系)在一位置中，使得控制序列指导或调整编码感兴趣的多肽的多核苷酸的表达。

“启动子序列”指被宿主细胞识别用于感兴趣的多核苷酸的表达的核酸序列，诸如编码序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列，包括突变、截短的和杂合启动子，的，并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因来获得。

“适当的反应条件”是指在酶促转化反应溶液中的那些条件(例如，酶载量、底物载量、温度、pH、缓冲液、助溶剂等的范围)，在上述条件下本公开内容的PAL多肽能够将底物转化为期望的产物化合物。示例性的“适当的反应条件”被提供在本文中(参见，实施例)。

“载量”，诸如在“化合物载量”或“酶载量”中是指在反应开始时反应混合物中组分的浓度或量。在酶促转化反应过程的上下文中的“底物”是指由PAL多肽作用产生的化合物或分子。在酶促转化过程的上下文中的“产物”是指从PAL多肽对底物的作用产生的化合物或分子。

如本文所用的术语“培养”是指微生物细胞群使用任何适合的培养基(例如，液体、凝胶或固体)在适当的条件下适合的生长。

重组多肽(例如，PAL酶变体)可使用本领域已知的任何适合的方法来产生。例如，存在本领域技术人员熟知的很多不同的诱变技术。另外，诱变试剂盒还可购自许多商业分子生物学供应商。方法可用于做出在限定的氨基酸(定点)上的特定置换、在基因的局部区域中的特异性(区域-特异性)或随机突变、或在整个基因内的随机诱变(例如，饱和诱变)。许多产生酶变体的适合的方法是本领域技术人员已知的，包括但不限于使用PCR、盒式诱变、基因合成、易错PCR、改组和化学饱和诱变或本领域已知的任何其他适合的方法进行单链DNA或双链DNA的定点诱变。用于DNA和蛋白工程化的方法的非限制性实例在以下专利中被提供：美国专利号6,117,679；美国专利号6,420,175；美国专利号6,376,246；美国专利号6,586,182；美国专利号7,747,391；美国专利号7,747,393；美国专利号7,783,428；和美国专利号8,383,346。变体产生之后，它们可被筛选任何期望的特性(例如，高或增加的活性或低或降低的活性、增加的热活性、增加的热稳定性和/或酸性pH稳定性等)。在一些实施方案中，“重组PAL多肽”(在本文中还称为“工程化PAL多肽”、“变体PAL酶”和“变体PAL体”)发现用途。

如本文所用，“载体”是用于将DNA序列导入细胞的DNA构建体。在一些实施方案中，载体为可操作地被连接到能够影响编码多肽的DNA序列在适合的宿主中表达的适合的控制序列的表达载体。在一些实施方案中，“表达载体”具有可操作地连接到DNA序列(例如，转基因)以驱动宿主细胞中表达的启动子序列，并且在一些实施方案中，还包括转录终止子序列。

如本文所用的，术语“表达”包括参与多肽产生的任何步骤，包括但不限于，转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中，该术语还包括从细胞中分泌多肽。

如本文所用的，术语“产生”是指蛋白和/或其他化合物通过细胞的产生。意图是，术语包括参与多肽产生的任何步骤，包括但不限于，转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中，该术语还包括从细胞中分泌多肽。

如本文所用的，如果两个序列在自然界中未缔合，氨基酸或核苷酸序列(例如，启动子序列、信号肽、终止子序列等)与它被可操作地连接至其的另一个序列是“异源的”。

如本文所用的，术语“宿主细胞”和“宿主菌株”是指用于表达包含本文提供的DNA(例如，编码至少一种AvPAL变体的多核苷酸序列)的载体的适合的宿主。在一些实施方案中，宿主细胞是已用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核或真核细胞。

术语“类似物”意指具有与参考多肽大于70％的序列同一性，但小于100％的序列同一性的多肽(例如，大于75％、78％、80％、83％、85％、88％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的序列同一性)的多肽。在一些实施方案中，类似物包括非天然存在的氨基酸残基以及天然存在的氨基酸，所述非天然存在的氨基酸残基包括但不限于高精氨酸、鸟氨酸和正缬氨酸。在一些实施方案中，类似物还包括一种或更多种D-氨基酸残基和两个或更多个氨基酸残基之间的非肽键。

术语“治疗的”是指向显示病理学迹象或症状的受试者施用具有有益或期望的医疗效应的化合物。

术语“药物组合物”是指适合于哺乳动物受试者(例如，人)中药物用途的包含由本发明所包括的药学有效量的工程化PAL多肽和可接受的载体的组合物。

术语“有效量”意指足以产生期望的结果的量。本领域一般技术人员可通过使用常规实验确定有效量是多少。

使用术语“分离的”和“纯化的”指从它与其天然缔合的至少一种其他组分中取出的分子(例如，分离的核酸、多肽等)或其他组分。术语“纯化的”不要求绝对纯度，而它的目的是作为相对的定义。

术语“受试者”包括哺乳动物，诸如人、非人灵长类动物、家畜、宠物和实验动物(例如，啮齿动物和兔类动物)。它的目的是，术语包括女性以及男性。

如本文所用的，术语“患者”意指被评价、治疗或正经历疾病的任何受试者。

术语“婴儿”是指在出生之后第一个月至约一(1)岁的时期内的儿童。如本文所用的，术语“新生儿”是指在从出生至第生命的28天的时期内的儿童。术语“早产儿”是指完成妊娠二十周后但妊娠期满之前出生的婴儿，通常在出生时称重～500-～2499克。“极低出生体重儿”是在出生时称重低于1500g的婴儿。

如本文所用的，术语“儿童”是指对于同意治疗或研究程序未达到法定年龄的人。在一些实施方案中，该术语是指在出生和青春期的时期之间的人。

如本文所用的，术语“成人”是指对于相关司法权已达到法定年龄的人(例如，在美国为18岁)。在一些实施方案中，该术语是指任何完全发育成熟的生物体。在一些实施方案中，术语“青年”是指小于18岁但已经达到性成熟的人。

如本文所用，“组合物”和“制剂”包括目的用于任何适合的用途的包含本发明的至少一种工程化PAL的产物(例如，药物组合物、膳食/营养补充物、饲料等)。

术语“施用”和“施用”组合物意指向受试者(例如，患有PKU效应的人)提供本发明的组合物。

当关于药物组合物使用时，术语“载体”意指标准药物载体，缓冲液和赋形剂诸如稳定剂、防腐剂和佐剂中的任一种。

术语“药学上可接受的”意指可被施用至受试者而不引起任何不良生物效应或以有害的方式与在其中它被包含的组分的任何一个相互作用且拥有期望的生物活性的材料。

如本文所用的，术语“赋形剂”是指任何药学上可接受的添加剂、载体、稀释剂、佐剂或其他成分，而不是活性药物成分(API；例如，本发明的工程化PAL多肽)。赋形剂通常包括配制和/或施用目的。

当关于疾病/状况的症状使用时，术语“治疗有效量”是指改善、减弱或消除疾病/状况的一个或更多个症状或预防或延缓症状(例如，PKU)的发作的化合物(例如，工程化PAL多肽)的量和/或浓度。在一些实施方案中，该术语关于组合物的量被使用，所述组合物的量引发被研究者、医师、兽医师或其他临床医师寻找的组织、系统或动物受试者的生物学(例如，医学)应答。。

当关于疾病/状况使用时，术语“治疗有效量”是指改善、减弱或消除该疾病/状况的组合物的量和/或浓度。

它的目的是，术语“治疗(treating)”、“治疗(treat)”和“治疗(treatment)”包括预防的治疗(例如，预防剂)，以及舒减治疗。

工程化PAL多肽：

本发明的工程化PAL多肽源自其的亲本PAL多肽包括细菌菌株诸如鱼腥藻属(Anabaena)(例如，多变鱼腥藻(A.variabilis))、念珠藻属(Nostoc)(例如，点状念珠藻(N.punctiforme))、红冬孢酵母属(Rhodosporidium)(例如，圆红冬孢酵母(R.toruloides))、链霉菌属(Streptomyces)(例如S.maritimus或S.verticillatus)、颤菌属(Oscillatoria sp.)、粘球藻属(Gloeocapsa sp.)和胶须藻属(Rivularia sp.)。来自这些菌株的PAL酶已被鉴定，并是熟知的。在图1中提供了来自鱼腥藻属(多变鱼腥藻)ATCC29413和NCBI YP_324488.1；念珠藻属(点状念珠藻)ATCC 29133和NCBI YP_00186563.1；颤藻属(Oscillatoria sp.)PCC 6506和NCBI ZP_07108482.1和粘球藻属(Gloeocapsa sp.)PCC 7428和NCBI YP_007127054.1的同源酶序列。点状念珠藻苯丙氨酸/组氨酸解氨酶"NpPHAL"(NCBI YP_001865631.1(SEQ ID NO:30)；胶须藻属(Rivularia sp.)组氨酸解氨酶"RspHAL"(NCBI YP_007056096.1(SEQ ID NO:31)；颤藻属(Oscillatoria sp.)组氨酸解氨酶"Osp HAL"(NCBI YP_07108482.1(SEQ ID NO:32)；和粘球藻属(Gloeocapsa sp.)组氨酸解氨酶"GspHAL"(NCBI YP_007127054.1)(SEQ ID NO:33)与AvPAL(SEQ ID NO:4)具有多于70％的同源性。

此外，当特定的PAL变体(即，工程化PAL多肽)通过参考野生型PAL或参考PAL的序列中的特定氨基酸残基的修饰被提及时，应该理解的是，本文包括了在等同位置修饰的另一种PAL的变体(如从各自的氨基酸序列之间的任选的氨基酸序列比对中所确定的)。在一些实施方案中，工程化PAL多肽源自从以上细菌菌株(即，念珠藻属[点状念珠藻]、红冬孢酵母属[圆红冬孢酵母]、链霉菌属[S.maritimus或S.verticillatus]、颤藻属(Oscillatoriasp.)、粘球藻属(Gloeocapsa sp.)和胶须藻属(Rivularia sp.))列出的多肽中的任何一种。在一些另外的实施方案中，本发明的工程化PAL多肽包含保守的活性位点Alal67-Serl68-Glyl69，并且包含与SEQ ID NO:4至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。在一些实施方案中，工程化PAL多肽不仅包含PAL活性，还具有对酪氨酸和/或组氨酸底物的活性。

在一些实施方案中，工程化PAL多肽通过在有利于产生工程化PAL多肽的条件下培养包含编码至少一种工程化PAL多肽的至少一种多核苷酸序列的微生物来产生。在一些实施方案中，工程化PAL多肽随后从所得的培养基和/或细胞中回收。

本发明提供了具有PAL活性的示例性工程化PAL多肽。实施例提供了显示与工程化PAL多肽的功能活性相关的特定氨基酸序列特征的序列结构信息的表。该结构-功能相关信息以相对于SEQ ID NO:4的参考工程化多肽的特定氨基酸残基差异、以及与示例性工程化PAL多肽的相关的实验上确定的活性数据的形式来提供。

在一些实施方案中，本发明的具有PAL活性的工程化PAL多肽包含a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:4至少85％的序列同一性；b)与SEQ ID NO:4相比在一个或更多个氨基酸位置处的氨基酸残基差异；并且c)所述工程化PAL多肽与参考序列相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的蛋白水解敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、或i)、ii)、iii)、或iv)的任何组合。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:4相比在一个或更多个氨基酸位置处(诸如与SEQ ID NO:4或具有与SEQ ID NO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在1、2、3、4、5、6、7、8、9、10、11、12、14、15、20或更多个氨基酸位置处)的氨基酸残基差异。在一些实施方案中，与SEQID NO:4相比在一个或更多个位置处的残基差异包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个保守氨基酸置换。在一些实施方案中，工程化PAL多肽是在实施例中提供的表中所列的多肽。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，以及当与SEQ IDNO：4的氨基酸序列最佳比对时，与SEQ ID NO:4相比在选自以下的一个或更多个氨基酸位置处的氨基酸残基差异：X39；X54；X59；X73；X91；X158；X112，X134，X180；X195；X240；X243；X245；X256；X257；X270；X290；X304、X305；X307；X308；X326；X349；X353；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X509；X521；X522；X524；X528；X546；X564或其任何组合。在一些实施方案中，氨基酸差异是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个或20个或更多个氨基酸位置。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:4至少85％(至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％)的序列同一性，并且包含在位置H307处的氨基酸残基差异和任选地在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置处的氨基酸残基差异。在一些实施方案中，在位置307处的氨基酸残基差异为H307/G/Q/M。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:4至少85％(至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％)的序列同一性，并且包含选自以下的一个或更多个的组合的至少一个氨基酸残基差异：A39；T54；G59，S73；A91；Y158；S180；K195；A112；R134；Q240；T243；I245；A256；L257；N270；N290；Y304；R305；H307；E308；I326；L349；D353；L364；A394；S399；N400；P404；L407；F443；N453；Y459；T460；T463；N474；E509；Q521；K522；T524；P528；S546；和/或P564。在一些另外的实施方案中，存在在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置处的氨基酸残基差异。

在一些实施方案中，表现出改进的特性的工程化PAL多肽具有与SEQ ID NO:4至少85％(至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％)的序列同一性，并且包含当与SEQ ID NO:4最佳比对时选自以下的一个或更多个的组合的氨基酸残基差异：A39V；T54K；G59R；S73K；A112C；R134Q；A91V；Y158H；S180A；K195E；Q240R/W；T243I/L；I245L；A256G；L257W/A；N270K；N290G；Y304H；R305M；H307G/Q/M；E308Q；I326F；L349M；D353A/N；L364Q；A394V；S399N；N400K；P404A；L407V；F443H；N453G；Y459F；T460G；T463N；N474Q；E509L；Q521K/S；K522Y/F/N；T524S；P528L；S546R；和P564G/L/M。

在一些实施方案中，氨基酸残基差异选自当与SEQ ID NO:4最佳比对时以下的一个或更多个的组合：A39V；A91V；A256G；N290G；A394V；S399N；P404A；L407V；K522Y/F/N；和/或T524S。

在一些实施方案中，本发明提供了工程化PAL多肽的功能片段。在一些实施方案中，功能片段包括其所源自的工程化PAL多肽(即，亲本工程化PAL)的至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的活性。在一些实施方案中，功能片段包含至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的工程化PAL的亲本序列。在一些实施方案中，功能片段将被截短小于5个、小于10个、小于15个、小于10个、小于25个、小于30个、小于35个、小于40个、小于45个和小于50个氨基酸。

在一些实施方案中，本发明提供了工程化PAL多肽的功能片段。在一些实施方案中，功能片段包括其所源自的工程化PAL多肽(即，亲本工程化PAL)的至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的活性。在一些实施方案中，功能片段包含至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的工程化PAL的亲本序列。在一些实施方案中，功能片段将被截短小于5个、小于10个、小于15个、小于10个、小于25个、小于30个、小于35个、小于40个、小于45个、小于50个、小于55个、小于60个、小于65个或小于70个氨基酸。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:6至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:6相比，与SEQ ID NO:6或具有与SEQ ID NO:6至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或多个氨基酸位置)处的氨基酸残基差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:6至少90％的序列同一性，并且包含与SEQID NO:6相比在至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置处的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ ID NO:6的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:10或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:10相比，与SEQ ID NO:10或具有与SEQ ID NO:10至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或更多个氨基酸位置)处的氨基酸残基的差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:10至少95％的序列同一性，并且包含与SEQ ID NO:10相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ IDNO:10的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:12或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:12相比，与SEQ ID NO:12或具有与SEQ ID NO:12至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(比如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或更多个氨基酸位置)处的氨基酸残基的差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:12至少95％的序列同一性，并且包含与SEQ ID NO:12相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ IDNO:12的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:14或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:14相比，与SEQ ID NO:14或具有与SEQ ID NO:14至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或更多个氨基酸位置)处的氨基酸残基的差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:14至少95％的序列同一性，并且包含与SEQ ID NO:14相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ IDNO:14的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:16或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:16相比，与SEQ ID NO:16或具有与SEQ ID NO:16至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或更多个氨基酸位置)处的氨基酸残基差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:16至少95％的序列同一性，并且包含与SEQ ID NO:16相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ ID NO:16的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:18或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:18相比，与SEQ ID NO:18或具有与SEQ ID NO:18至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或多个氨基酸位置)处的氨基酸残基差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:18至少95％的序列同一性，并且包含与SEQ ID NO:18相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ ID NO:18的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:20或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:20相比，与SEQ ID NO:20或具有与SEQ ID NO:20至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或多个氨基酸位置)处的氨基酸残基的差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:20至少95％的序列同一性，并且包含与SEQ ID NO:20相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ ID NO:20的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:22或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:22相比，与SEQ ID NO:22或具有与SEQ ID NO:22至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或更多个氨基酸位置)处的氨基酸残基差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:22至少95％的序列同一性，并且包含与SEQ ID NO:22相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ ID NO:22的序列组成。

在一些实施方案中，表现出至少一种改进的特性的工程化PAL多肽具有与SEQ IDNO:24或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:24相比，与SEQ ID NO:24或具有与SEQ ID NO:24至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比，在一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或多个氨基酸位置)处的氨基酸残基的差异。在一些实施方案中，工程化PAL包含与SEQ ID NO:24至少95％的序列同一性，并且包含与SEQ ID NO:24相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，工程化PAL多肽由SEQ ID NO:24的序列组成。

具有降低的对蛋白水解敏感性的变体：

在一些实施方案中，本发明的工程化PAL多肽具有PAL活性，表现出降低的对蛋白水解的敏感性，并包含：a)具有与参考序列SEQ ID NO:4至少85％的序列同一性的氨基酸序列；b)与SEQ ID NO:4相比在一个或更多个氨基酸位置处的氨基酸残基差异。

在一些实施方案中，表现出降低的对蛋白水解的敏感性的工程化PAL多肽具有与SEQ ID NO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ IDNO:4相比在一个或更多个氨基酸位置(诸如与SEQ ID NO:4或具有与SEQ ID NO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个、20个或更多个氨基酸位置)处的氨基酸残基差异。

在一些实施方案中，表现出降低的对蛋白水解的敏感性的工程化PAL多肽具有与SEQ ID NO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，以及当与SEQ ID NO:4的氨基酸序列最佳比对时，与SEQ ID NO:4相比在选自以下的一个或更多个氨基酸位置处的氨基酸残基差异：X39；X54；X59；X73；X91；X158；X112、X134、X180；X195；X240；X243；X245；X256；X257；X270；X290；X304、X305；X307；X308；X326；X349；X353；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X509；X521；X522；X524；X528；X546；X564；或其任何组合。在一些实施方案中，氨基酸差异为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个或20个或更多的氨基酸位置。

在一些实施方案中，表现出降低的对蛋白水解的敏感性的工程化PAL多肽具有与SEQ ID NO:4至少85％、至少88％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性，并包含在位置X307；X326；X460；X307；和/或X528处的氨基酸残基差异，和任选地在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置处的氨基酸残基差异。在一些实施方案中，当与SEQ ID NO:4比对时，氨基酸残基差异选自Y304H/W；R305L/M；H307G/M/Q；I326F；Q240W；T460G；P528L；和这些置换的任何组合。

在一些实施方案中，表现出降低的对蛋白水解的敏感性的工程化PAL多肽具有与SEQ ID NO:10、12、14、16、18、20、22和/或24中的任一个或其功能片段至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:10、12、14、16、18、20、22和/或24相比的氨基酸残基差异，所述氨基酸残基差异在与SEQ ID NO:10、12、14、16、18、20、22和/或24或具有与SEQ ID NO:10、12、14、16、18、20、22和/或24至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比的一个或更多个氨基酸位置(诸如在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个或更多个氨基酸位置)处。在一些实施方案中，工程化PAL包含与SEQ ID NO:10、12、14、16、18、20、22和/或24至少95％的序列同一性，并且包含与SEQ ID NO:10、12、14、16、18、20、22和/或24相比至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置的氨基酸差异。在一些实施方案中，PAL包含SEQ ID NO:10、12、14、16、18、20、22和/或24的序列或由SEQ ID NO:10、12、14、16、18、20、22和/或24的序列组成。

在一些实施方案中，在基本相同的条件下，工程化PAL多肽的蛋白水解敏感性比野生型PAL(例如，具有SEQ ID NO:4的AvPAL)的蛋白水解敏感性或与参考PAL多肽相比降低了至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％或至少95％。蛋白水解活性可使用本领域已知的任何适合方法来测量，包括但不限于在实施例中所述的那些。

在一些实施方案中，当参考PAL和具有降低的敏感性的工程化PAL在基本相同的条件下被比较并暴露于基本上相同量和种类的蛋白酶时，具有降低的对蛋白水解的敏感性的工程化PAL多肽具有降低的对包含一种或更多种蛋白酶的组合物的敏感性，所述蛋白酶包括但不限于胃蛋白酶、胰蛋白酶、胰凝乳蛋白酶、羧肽酶A和B、肽酶(例如，氨基肽酶、二肽酶和肠肽酶)。

在一些实施方案中，具有降低的对蛋白水解的敏感性的工程化PAL多肽具有是参考PAL(例如，AvPAL)的酶活性的约1.0倍、2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更高倍数的酶活性水平。在一些实施方案中，当在4.5到7.5的pH范围下测量活性时，当在4.5到6.5的pH范围下测量活性时；当在5.0到7.5的pH范围下测量活性时；当在5.0至6.5的pH范围下测量活性时；当在5.5到7.5的pH范围下测量活性时；和/或还当在5.5到6.5的pH范围下测量活性时；工程化多肽具有与参考PAL相比更大的酶活性。在一些其他实施方案中，工程化PAL多肽具有在1μΜ至5mM范围内的K_m值。

具有增加的对酸性pH耐受性的变体：

在一些实施方案中，本发明的工程化PAL多肽具有PAL活性，耐受酸性pH水平，并包含：a)具有与参考序列SEQ ID NO:4或其片段至少85％的序列同一性的氨基酸序列；b)与SEQ ID NO:4相比在一个或更多个氨基酸位置处的氨基酸残基差异。

在一些实施方案中，与野生型AvPAL和/或另一种参考多肽相比表现出增加的对酸性pH耐受性的工程化PAL多肽具有与SEQ ID NO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:4相比，在一个或更多个氨基酸位置(诸如与SEQ ID NO:4或具有与SEQ ID NO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性的序列相比在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、14个、15个、20个或更多个氨基酸位置)处的氨基酸残基差异。

在一些实施方案中，与野生型AvPAL和/或另一种参考多肽相比表现出增加的对酸性pH的耐受性的工程化PAL多肽具有与SEQ ID NO:4至少85％、至少88％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更大的氨基酸序列同一性，和与SEQ ID NO:4的氨基酸序列最佳比对时，与SEQ ID NO:4相比在一个或更多个氨基酸位置处的氨基酸残基差异，所述一个或更多个氨基酸位置选自X39；X54；X59；X73；X91；X158；X112，X134，X180；X195；X240；X243；X245；X256；X257；X270；X290；X304、X305；X307；X308；X326；X349；X353；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X509；X521；X522；X524；X528；X546；X564；或其任何组合。在一些实施方案中，氨基酸差异为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个或20个或更多个氨基酸位置。

在一些实施方案中，与野生型AvPAL和/或另一种参考多肽相比表现出增加的对酸性pH耐受性的工程化PAL多肽具有与SEQ ID NO:4至少85％、至少88％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性，且包含选自在以下位置处的氨基酸残基差异：X39；X54；X59；X73；X91；X158；X112，X134，X180；X195；X240；X243；X245；X256；X257；X270；X290；X304，X305；X307；X308；X326；X349；X353；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X509；X521；X522；X524；X528；X546；X564或其任何组合；和任选地在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸位置处的氨基酸残基差异。在一些实施方案中，当与SEQ ID NO:4比对时，氨基酸残基差异为A39；T54；G59，S73；A91；Y158；S180；K195；A112；R134；Q240；T243；I245；A256；L257；N270；N290；Y304；R305；H307；E308；I326；L349；D353；L364；A394；S399；N400；P404；L407；F443；N453；Y459；T460；T463；N474；E509；Q521；K522；T524；P528；S546；和/或P564。在一些实施方案中，表现出增加的对酸性pH耐受性的工程化PAL多肽当与SEQ ID NO:4比对时具有与SEQ IDNO:4至少85％、至少88％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性，且包含在以下一个或更多个位置处的氨基酸残基差异：A39V；T54K；G59R；S73K；A112C；R134Q；A91V；Y158H；S180A；K195E；Q240R/W；T243I/L；I245L；A256G；L257W/A；N270K；N290G；Y304H；R305M；H307G/Q/M；E308Q；I326F；L349M；D353A/N；L364Q；A394V；S399N；N400K；P404A；L407V；F443H；N453G；Y459F；T460G；T463N；N474Q；E509L；Q521K/S；K522Y/F/N；T524S；P528L；S546R；和/或P564G/L/M。

在一些实施方案中，当所有其他测定条件基本相同时，与参考PAL多肽相比具有增加的对酸性pH的耐受性的工程化PAL多肽具有在以下pH范围下的增加的耐受性：在1.5至6.5之间；在1.5和5.0之间；在2.0至5.5之间；在3.0和6.8之间；在3.0和5.5之间；在4.0和6.5之间；在4.0和4.5之间；在4.5和5.0之间；在4.5和5.5之间；在4.5和6.0之间；在4.5和6.5之间；在5.0和6.5之间；在5.0和6.0之间；在5.0和5.5之间；在5.5和6.0之间；在6.0和6.5之间；和/或在6.5和7.0之间。在一些实施方案中，增加的对酸性pH的耐受性表现在约3.5、4.0、4.5、5.0、5.5、6.0和/或6.5的pH下。

在一些实施方案中，与参考PAL相比具有增加的对酸性pH的耐受性的工程化PAL多肽当通过标准测定测量时还表现出更大的PAL活性。任何适合的测定在本发明中具备实用性，包括但不限于本文所提供的那些。

进一步设想，任何例示的工程化多肽(即，变体1号-变体1010号)，例如通过随后的多轮进化通过添加来自本文描述的其他多肽和其他残基位置的多种氨基酸差异的新组合，具备作为用于合成其他工程化PAL多肽的起始氨基酸序列的用途。在一些实施方案中，另外的改进通过包括在贯穿前几轮的进化中已被保持不变的残基位置处的氨基酸差异而产生。这不意在使本发明限于任何特定的产生工程化PAL多肽的方法，因为任何适合的方法在本发明中具备实用性，包括但不限于本文所提供的那些方法。

编码工程化多肽的多核苷酸、表达载体和宿主细胞：

本发明提供了编码本文描述的工程化PAL多肽的多核苷酸。在一些实施方案中，多核苷酸被可操作地连接至控制基因表达的一个或更多个异源调控序列，以创建能够表达多肽的重组多核苷酸。在一些实施方案中，将包含编码工程化PAL多肽的至少一个异源的多核苷酸的表达构建体引入到适当的宿主细胞以表达相应的PAL多肽。

如对本领域技术人员将是明显的，蛋白序列的可用性和对应各种氨基酸的密码子的知识提供了对能够编码该主题多肽的所有多核苷酸的描述。遗传密码子的简并性，其中相同氨基酸由替代的或同义的密码子编码，允许制备极大数目的核酸被，所有这些核酸编码工程化PAL多肽。因此，通过选择基于可能的密码子选择的组合，本发明提供了用于产生可制备的编码本文描述的PAL多肽的PAL多核苷酸的每种和每一种可能的变化的方法和组合物，并且所有这些变化将被认为针对本文描述的任何多肽，包括在实施例(例如，在多个表中)中呈现的氨基酸序列被明确地公开。

在一些实施方案中，密码子优选地被优化以被用于产生蛋白所选择的宿主细胞利用。例如，细菌中使用的优选的密码子通常被用于在细菌中的表达。因此，编码工程化PAL多肽的密码子优化的多核苷酸在全长编码区的约40％、50％、60％、70％、80％、90％或大于90％的密码子位置处包含优选的密码子。

在一些实施方案中，PAL多核苷酸编码具有PAL活性、具有本文公开的特性的的工程化多肽，其中所述多肽包含具有与选自SEQ ID NO:3、5、7、9、11、13、15、17、19、21、和/或23的参考序列或任何变体(例如，在实施例中提供的变体)的氨基酸序列至少80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更大的同一性的氨基酸序列，，和与SEQ ID NO:3、5、7、9、11、13、15、17、19、21和/或23的参考多核苷酸或实施例中公开的任何变体的氨基酸序列相比的一个或更多个残基差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中，参考序列选自SEQ ID NO:3、5、7、9、11、13、15、17、19、21和/或23。

在一些实施方案中，PAL多核苷酸编码具有PAL活性的、具有本文公开的特性的工程化多肽，其中所述多肽包含具有与参考序列SEQ ID NO:4至少80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性的氨基酸序列，和当与SEQ ID NO:4的多肽最佳比对时，与SEQ ID NO:4相比在来自以下残基位置处的一个或更多个残基差异：X39；X54；X59；X73；X91；X158；X112，X134，X180；X195；X240；X243；X245；X256；X257；X270；X290；X304、X305；X307；X308；X326；X349；X353；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X509；X521；X522；X524；X528；X546；和/或X564。

在一些实施方案中，编码工程化PAL多肽的多核苷酸包含选自多核苷酸序列SEQID NO:3、5、7、9、11、13、15、17、19、21和/或23的多核苷酸序列。在一些实施方案中，编码工程化PAL多肽的多核苷酸具有与SEQ ID NO:2、3、5、7、9、11、13、15、17、19、21和/或23至少80％、85％、90％、93％、95％、96％、97％、98％、99％的核苷酸残基同一性。

在一些实施方案中，多核苷酸能够在高度严格条件下与选自SEQ ID NO:2、3、5、7、9、11、13、15、17、19、21和/或23的参考多核苷酸序列或其互补序列或编码本文提供的任何变体PAL多肽的多核苷酸序列杂交。在一些实施方案中，能够在高度严格条件下杂交的多核苷酸编码包含氨基酸序列的PAL多肽，所述氨基酸序列具有与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异：X39；X54；X59；X73；X91；X158；X112、X134、X180；X195；X240；X243；X245；X256；X257；X270；X290；X304、X305；X307；X308；X326；X349；X353；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X509；X521；X522；X524；X528；X546；和/或X564。

在一些实施方案中，编码本文的工程化PAL多肽中的任何一个的分离的多核苷酸以多种方式被操作，以促进PAL多肽的表达。在一些实施方案中，编码PAL多肽的多核苷酸包含存在一个或更多个控制序列以调控PAL多核苷酸和/或多肽的表达的表达载体。取决于所利用的表达载体，所分离的多核苷酸在其插入载体中之前的操作可以是令人期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。在一些实施方案中，控制序列包括，尤其是，启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。在一些实施方案中，适合的启动子根据宿主细胞的选择来选择。对于细菌宿主细胞，用于指导本公开内容的核酸构建体转录的合适启动子包括但不限于从以下获得的启动子：大肠杆菌(E.coli)lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α解淀粉酶基因(amyQ)、地衣芽孢杆菌(Bacillus licheniformis)青霉素酶基因(penP)、枯草芽孢杆菌(Bacillus subtilis)xylA和xylB基因和原核β内酰胺酶基因(参见例如，Villa-Kamaroff等，Proc.Natl Acad.Sci.USA 75:3727-3731[1978])，以及tac启动子(参见例如，DeBoer等，Proc.Natl Acad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性的启动子包括，但不限于从针对以下的基因获得的启动子：米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α粉淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusariumoxysporum)胰蛋白酶样蛋白酶(参见例如，WO 96/00787)，以及NA2-tpi启动子(来自对于黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶启动子的基因的启动子的杂合体)，和其突变的、截短的和杂合的启动子。示例性酵母细胞启动子可来自对于以下的基因：酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如，Romanos等，Yeast 8:423-488[1992])。

在一些实施方案中，控制序列还是适合的转录终止子序列(即，由宿主细胞识别以终止转录的序列)。在一些实施方案中，终止子序列可操作地连接到编码该PAL多肽的核酸序列的3'末端。在选择的宿主细胞中有功能的任何合适的终止子在本发明中具备实用性。用于丝状真菌宿主细胞的示例性转录终止子可从对于以下的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可从对于以下的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如，Romanos等，同上)。

在一些实施方案中，控制序列还是适合的前导序列(即，对宿主细胞的翻译重要的mRNA的未翻译区)。在一些实施方案中，前导序列可操作地连接到编码PAL多肽的核酸序列的5'末端。在选择的宿主细胞中有功能的任何适合的前导序列在本发明中具备实用性。用于丝状真菌宿主细胞的示例性前导序列从以下基因获得：米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的适合的前导序列从对于以下的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油激酶、酿酒酵母α因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

在一些实施方案中，控制序列还是多聚腺苷酸化序列(即，可操作地连接到核酸序列的3'末端的序列，并且当转录时，其被宿主细胞识别为将多聚腺苷残基添加到转录的mRNA的信号)。在选择的宿主细胞中有功能的任何适合的多聚腺苷酸序列在本发明中具备实用性。用于丝状真菌宿主细胞的示例性多腺苷酸序列包括，但不限于对于的以下的基因：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α粉葡糖苷酶。对酵母宿主细胞有用的多聚腺苷酸化序列是已知的(参见例如，，Guo和Sherman，Mol.Cell.Bio.,15:5983-5990[1995])。

在一些实施方案中，控制序列还是信号肽(即，编码连接到多肽的氨基末端的氨基酸序列并将编码的多肽引导入细胞的分泌通路的编码区)。在一些实施方案中，核酸序列的编码序列的5'末端固有地包含信号肽编码区，所述信号肽编码区与编码分泌的多肽的编码区的区段符合翻译读码框地天然连接。可选地，在一些实施方案中，编码序列的5'端包含对于编码序列而言是外源的信号肽编码区。将表达的多肽引导入选择的宿主细胞的分泌通路的任何合适的信号肽编码区具备用于工程化多肽的表达的用途。对于细菌宿主细胞有效的信号肽编码区包括但不限于从对于以下的基因获得的那些：芽孢杆菌(Bacillus)NC1B11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-芽淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如，Simonen和Palva，Microbiol.Rev.,57:109-137[1993])。在一些实施方案中，对于丝状真菌宿主细胞有效的信号肽编码区包括但不限于从对于以下的基因获得的信号肽编码区：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和胎毛腐质霉(Humicola lanuginosa)脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自对于以下的基因的那些：酿酒酵母α因子和酿酒酵母转化酶。

在一些实施方案中，控制序列还是前肽编码区，其编码定位在多肽的氨基末端的氨基酸序列。所得多肽称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或“酶原”。前多肽可被转化为成熟活性多肽，通过催化或自动催化裂解来自前多肽的前肽。前肽编码区可从任何适合的来源来获得，所述来源包括但不限于对于以下的基因：枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶参见例如，WO 95/33836)。当信号肽和前肽区均存在于多肽的氨基末端时，前肽区紧邻多肽的氨基末端定位并且信号肽区紧邻前肽区的氨基末端定位。

在一些实施方案中，还利用了调节序列。这些序列促进多肽相对于宿主细胞的生长的表达的调节。调节系统的实例是引起基因表达响应于化学或物理刺激，包括调节化合物的存在而开启或关闭的那些调节系统。在原核宿主细胞中，适合的调节序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中，适合的调节系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中，适合的调控序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。

在另一个方面，本发明涉及重组表达载体，所述重组表达载体包含编码工程化PAL多肽的多核苷酸和取决于其被引入的宿主细胞的类型的一个或更多个表达调节区，诸如启动子和终止子、复制起点等。在一些实施方案中，将本文描述的各种核酸和控制序列连接在一起以产生重组表达载体，其包含一个或更多个方便的限制位点以允许编码PAL多肽的核酸序列在这些位点插入或置换。可选地，在一些实施方案中，本发明的核酸序列通过将核酸序列或包含该序列的核酸构建体插入合适的表达载体来表达。在涉及创建表达载体的一些实施方案中，编码序列位于载体中，以使编码序列与用于表达的适当的控制序列可操作地连接。

重组表达载体可以是任何适合的载体(例如，质粒或病毒)，其可方便地经历重组DNA程序，并致使PAL多核苷酸序列的表达。载体的选择通常取决于载体与载体将被引入的宿主细胞的相容性。载体可以是线性的或闭合的环状质粒。

在一些实施方案中，表达载体是自主复制载体(即，作为染色体外的实体存在的载体，其复制独立于染色体复制，诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可包含用于确保自我复制的任何工具(means)。在一些替代性实施方案中，载体是当被引入宿主细胞时，被整合进入基因组并与其被整合进的染色体一起复制的载体。此外，在一些实施方案中，利用了单一载体或质粒，或共同包含待引入宿主细胞的基因组的全部DNA的两种或更多种载体或质粒，和/或转座子。

在一些实施方案中，表达载体包含一个或更多个可选择的标志物，其允许容易选择经转化的细胞。“可选择的标志物”是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等等。细菌的可选择的标志物的实例包括但不限于，来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的适合的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的可选择的标志物包括但不限于amdS(乙酰胺酶；例如，来自构巢曲霉(A.nidulans)或米曲霉(A.orzyae)的乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草胺膦乙酰基转移酶；例如，来自吸水链霉菌(S.hygroscopicus)的草胺膦乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶；例如，来自构巢曲霉或米曲霉的乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶)以及其等同物。在另一个方面，本发明提供了宿主细胞，其包含编码至少一种本发明的工程化PAL多肽的至少一种多核苷酸，所述多核苷酸可操作地连接到用于在宿主细胞中表达工程化PAL酶的一个或更多个控制序列。适合于在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的，并且包括但不限于细菌细胞，诸如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞；真菌细胞，诸如酵母细胞(例如，酿酒酵母或毕赤酵母(Pichia pastoris)(ATCC保藏号201178))；昆虫细胞，诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞；动物细胞，诸如CHO、COS、BHK、293和Bowes黑素瘤细胞；和植物细胞。示例性的宿主细胞还包括各种大肠杆菌(Escherichia coli)菌株(例如，W3110(ΔfhuA)和BL21)。

因此，在另一个方面，本发明提供了产生工程化PAL多肽的方法，其中所述方法包括在适合于多肽表达的条件下，培养能够表达编码工程化PAL多肽的多核苷酸的宿主细胞。在一些实施方案中，该方法还包括分离和/或纯化如本文所描述的PAL多肽的步骤。

用于宿主细胞的适当的培养基和生长条件是本领域已知的。可以预期的是，将用于将表达PAL多肽的多核苷酸引入细胞的任何适合的方法用于本发明。适合的技术包括但不限于：电穿孔、生物射弹粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。

具有本文公开的特性的工程化PAL多肽可通过使编码天然存在的或工程化的PAL多肽的多核苷酸经历任何适合的诱变和/或本领域中已知的和/或如本文所描述的定向进化方法来获得。示例性的定向进化技术是诱变和/或DNA改组(参见例如，Stemmer，Proc.Natl.Acad.Sci.USA 91:10747-10751[1994]；WO 95/22625；WO 97/0078；WO 97/35966；WO 98/27230；WO 00/42651；WO 01/75767和美国专利6,537,746)。可使用的其他定向进化程序包括交错延伸过程(StEP)、体外重组(参见例如，Zhao等，Nat.Biotechnol.，16:258-261[1998])、诱变PCR(参见例如，Caldwell等，PCR Methods Appl.,3:S136-S140[1994])和盒式诱变(参见例如.、Black等，Proc.Natl.Acad.Sci.USA 93:3525-3529[1996])。

诱变和定向进化的方法可容易地应用到编码PAL-的多核苷酸中，以产生可被表达、筛选和测定的变体库。将任何适合的诱变和定向进化方法应用于本发明且是本领域熟知的(参见例如，美国专利号5,605,793、5,830,721、6,132,970、6,420,175、6,277,638、6,365,408、6,602,986、7,288,375、6,287,861、6,297,053、6,576,467、6,444,468、5,811238、6,117,679、6,165,793、6,180,406、6,291,242、6,995,017、6,395,547、6,506,602、6,519,065、6,506,603、6,413,774、6,573,098、6,323,030、6,344,356、6,372,497、7,868,138、5,834,252、5,928,905、6,489,146、6,096,548、6,387,702、6,391,552、6,358,742、6,482,647、6,335,160、6,653,072、6,355,484、6,03,344、6,319,713、6,613,514、6,455,253、6,579,678、6,586,182、6,406,855、6,946,296、7,534,564、7,776,598、5,837,458、6,391,640、6,309,883、7,105,297、7,795,030、6,326,204、6,251,674、6,716,631、6,528,311、6,287,862、6,335,198、6,352,859、6,379,964、7,148,054、7,629,170、7,620,500、6,365,377、6,358,740、6,406,910、6,413,745、6,436,675、6,961,664、7,430,477、7,873,499、7,702,464、7,783,428、7,747,391、7,747,393、7,751,986、6,376,246、6,426,224、6,423,542、6,479,652、6,319,714、6,521,453、6,368,861、7,421,347、7.058.515、7,024,312、7,620,502、7,853,410、7,957,912、7,904,249，和所有相关的非美国对应申请；Ling等，Anal.Biochem，254(2):157-78[1997]；Dale等，Meth.Mol.Biol.，57:369-74[1996]；Smith，Ann.Rev.Genet，19:423-462[1985]；Botstein等，Science，229:1193-1201[1985]；Carter，Biochem.J.,237:1-7[1986]；Kramer等，Cell,38:879-887[1984]；Wells e等，Gene,34:315-323[1985]；Minshull等，Curr.Op.Chem.Biol.,3:284-290[1999]；Christians等，Nat.Biotechnol.,17:259-264[1999]；Crameri等，Nature,391:288-291[1998]；Crameri.等，Nat.Biotechnol.,15:436-438[1997]；Zhang等，Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997]；Crameri等，Nat.Biotechnol.,14:315-319[1996]；Stemmer，Nature,370:389-391[1994]；Stemmer，Proc.Nat.Acad.Sci.USA,91:10747-10751[1994]；WO 95/22625；WO97/0078；WO 97/35966；WO 98/27230；WO 00/42651；WO 01/75767；WO 2009/152336和美国专利号6,537,746。其所有通过引用并入本文)。

在一些实施方案中，诱变处理后获得的酶克隆通过使酶制剂经历定义的温度(或其他测定条件)，并测量热处理或其他适合的测定条件之后剩余的酶活性的量进行筛选。然后将包含编码PAL多肽的多核苷酸的克隆从基因中分离、测序以鉴定核苷酸序列变化(如果有的话)，并且用于在宿主细胞中表达酶。测量来自表达文库的酶活性可使用本领域已知的任何适合的方法(例如，标准生物化学技术，诸如HPLC分析)来进行。

对于已知序列的工程化多肽，编码酶的多核苷酸可根据已知的合成方法通过标准的固相方法制备。在一些实施方案中，多至约100个碱基的片段可被单独地合成，然后连接(例如，通过酶或化学连接方法(chemical litigation method)或聚合酶介导的方法)以形成任何期望的连续序列。例如，使用经典的亚磷酰胺法(参见例如，Beaucage等，Tet.Lett，22:1859-69[1981]；和Matthes等，EMBO J.,3:801-05[1984])，如通常在自动合成方法中所实践的，本文公开的多核苷酸和寡核苷酸可通过化学合成来制备。根据亚磷酰胺方法，寡核苷酸被合成(例如，在自动的DNA合成仪中，纯化、退火、连接并克隆入适合的载体)。

因此，在一些实施方案中，用于制备工程化PAL多肽的方法可包括：(a)合成编码包含选自如本文所描述的任何变体的氨基酸序列的氨基酸序列的多肽的多核苷酸，和(b)表达由多核苷酸编码的PAL多肽。在该方法的一些实施方案中，由多核苷酸编码的氨基酸序列可任选地具有一个或几个(例如，多至3个、4个、5个或多至10个)氨基酸残基缺失、插入和/或置换。在一些实施方案中，氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基缺失、插入和/或置换。在一些实施方案中，氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或置换。在一些实施方案中，氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或置换。在一些实施方案中，置换为保守置换或非保守置换。

使用本领域中已知的任何适合的测定，包括但并不限于本文所描述的测定和条件，评价所表达的工程化PAL多肽的任何期望的改进的特性或特性的组合(例如，活性、选择性、稳定性、酸耐受性、蛋白酶敏感性等)。

在一些实施方案中，使用用于蛋白纯化的熟知技术中的任何一种或更多种，将在宿主细胞中表达的工程化PAL多肽的任一种从细胞和/或培养基中回收，用于蛋白纯化的熟知技术包括，溶菌酶处理、超声处理、过滤、盐析、超离心和色谱法以及其他。

用于分离PAL多肽的色谱技术包括，除了其他的以外，反相色谱法、高效液相色谱法、离子交换色谱法、疏水相互作用色谱法、尺寸排阻色谱法、凝胶电泳和亲和色谱法。用于纯化特定酶的条件部分取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素，并且对本领域技术人员将是明显的。在一些实施方案中，亲和技术可用于分离改进的PAL酶。对于亲和色谱纯化，可使用特异性结合感兴趣的PAL多肽的任何抗体。为了产生抗体，通过用PAL多肽或其片段注射免疫多种宿主动物，包括但不限于兔、小鼠、大鼠等。在一些实施方案中，PAL多肽或片段借助于侧链官能团或被附连至侧链官能团的衔接子被附连至适合的载体，诸如BSA。

在一些实施方案中，工程化PAL多肽通过包括以下的方法在宿主细胞中产生：在有利于工程化PAL多肽产生的条件下培养包含编码如本文描述的工程化PAL多肽的多核苷酸序列的宿主细胞(例如，大肠杆菌菌株)，并从细胞和/或培养物中回收工程化PAL多肽。在一些实施方案中，宿主细胞产生多于一种工程化PAL多肽。

在一些实施方案中，本发明提供了产生工程化PAL多肽的方法，所述方法包括在适合的培养条件下培养包含编码工程化PAL多肽的多核苷酸序列的重组细菌细胞以允许产生工程化PAL多肽并任选地从培养物和/或培养的细菌细胞回收工程化PAL多肽，所述工程化PAL多肽具有与参考序列SEQ ID NO:4至少85％、90％、95％、96％、97％、98％或99％的序列同一性，和当与SEQ ID NO:4的氨基酸序列最佳比对时与SEQ ID NO:4相比选自以下的一个或更多个氨基酸残基差异：X39；X91；X158；X180；X195；X243；X245；X256；X257；X270；X290；X307；X308；X326；X349；X364；X394；X399；X400；X404；X407；X443；X453；X459；X460；X463；X474；X522；X524；和X528或其组合。在一些实施方案中，宿主细胞产生多于一种工程化PAL多肽。

在一些实施方案中，工程化PAL多肽从重组宿主细胞和/或培养物中回收后，它们可通过本领域已知的任何适合的方法进一步纯化。在一些另外的实施方案中，纯化的TAL多肽与其他成分和化合物组合以提供适当包含工程化PAL多肽用于不同应用和用途的组合物和制剂(例如，药物组合物)。

组合物：

本发明提供了适合于在多种组合物中使用的工程化PAL多肽。这些组合物用于许多领域，包括但不限于医药、膳食/营养补充物、食品、饲料、和精细化工生产。例如，在一些实施方案中，本发明提供了食品和/或饲料，所述食品和/或饲料包含至少一种工程化PAL变体和/或编码至少一种PAL变体的至少一种多核苷酸序列。在一些实施方案中，本发明提供了饮品，所述饮品包含至少一种工程化PAL变体。

在一些实施方案中，在食品、饲料和/或营养/膳食补充物中的工程化PAL变体是糖基化的。此外，工程化PAL变体应用于任何适合的可食用的酶递送基质。在一些实施方案中，工程化PAL变体存在于可食用的酶递送基质中，所述可食用的酶递送基质被设计用于摄取变体后PAL变体在动物的消化道内的快速扩散。

本发明还提供了工程化PAL多肽，所述工程化PAL多肽适合于在精细化学品和其他工业上重要的化合物的产生中使用(参见例如，美国专利申请号2013/0340119、2013/0005012和2005/0260724，和WO 2012/122333)。

药物组合物和其他组合物

本发明提供了工程化PAL多肽，所述工程化PAL多肽适合于在药物组合物和其他组合物诸如膳食/营养补充物中使用。

取决于施用方式，包含治疗有效量的根据本发明的工程化PAL的这些组合物呈固体、半固体或液体的形式。在一些实施方案中，组合物包括其他药学上可接受的组分，诸如稀释剂、缓冲液、赋形剂、盐、乳化剂、防腐剂、稳定剂、填料和其他成分。用于配制和施用的技术的细节是本领域熟知的，并在文献中被描述。

在一些实施方案中，配制工程化PAL多肽用于在口服药物组合物中使用。在递送工程化PAL多肽中使用的任何适合的形式应用于本发明，所述形式包括但不限于丸剂、片剂、凝胶片(gel tabs)、胶囊、锭剂、糖衣丸、粉末、软凝胶、溶胶凝胶、凝胶、乳剂、植入物、贴剂、喷雾剂、软膏剂、搽剂、霜剂、糊剂、凝胶剂、涂剂、气雾剂、口香糖、缓和剂、条状物、悬液(包括但不限于油基悬液、水包油乳剂等)、药浆、糖浆剂、控释制剂、栓剂等。在一些实施方案中，工程化PAL多肽以适合于注射的形式提供(即，以可注射的制剂的形式)。在一些实施方案中，工程化PAL多肽以生物相容性基质诸如溶胶凝胶，包括基于二氧化硅(例如，氧基硅烷(oxysilane))的溶胶凝胶来提供。在一些实施方案中，封装工程化PAL多肽。在一些可选的实施方案中，将工程化PAL多肽封装在纳米结构(例如，纳米管、纳米通道(nanotubule)、纳米胶囊或微米胶囊、微球体、脂质体等)中。实际上，不预期将本发明限于任何特定的递送制剂和/或递送装置。预期工程化PAL多肽通过本领域已知的任何适合的方式来施用，包括但不限于：肠胃外、口服、局部、经皮、鼻内、眼内、鞘内、经由植入物等等。

在一些实施方案中，将工程化PAL多肽通过糖基化、聚乙二醇化(即，用聚乙二醇[PEG]或活化的PEG等修饰)或其他化合物化学修饰(参见例如，Ikeda，Amino Acids 29:283-287[2005]；美国专利号7,531,341、7,534,595、7,560,263和7,53,653；美国专利申请公布号2013/0039898，2012/0177722等)。实际上，不预期使本发明限于任何特定的递送方法和/或机制。

在一些另外的实施方案中，工程化PAL多肽被提供在包含基质稳定的酶晶体的制剂中。在一些实施方案中，该制剂包含交联的结晶工程化PAL酶和具有附连至酶晶体的反应部分的聚合物。本发明还以聚合物提供工程化PAL多肽。

在一些实施方案中，包含本发明的工程化PAL多肽的组合物包含一种或更多种常用的载体化合物，其包括但不限于糖(例如，乳糖、蔗糖、甘露醇和/或山梨糖醇)、淀粉(例如，玉米、小麦、水稻、马铃薯或其他植物淀粉)、纤维素(例如，甲基纤维素、羟丙基甲基纤维素、羧甲基纤维素钠)、树胶(例如，阿拉伯、黄芪胶、瓜尔胶等)和/或蛋白(例如，明胶、胶原等)。在口服制剂中的另外的组分可包括着色剂和或甜味剂(例如，葡萄糖、蔗糖和甘露糖醇)和润滑剂(例如，硬脂酸镁)，以及肠溶包衣(例如，甲基丙烯酸酯聚合物、羟丙基甲基纤维素邻苯二甲酸酯和/或本领域已知的任何其他适合的肠溶包衣)。在一些实施方案中，崩解剂或增溶剂被包括(例如，交联的聚乙烯吡咯烷酮、琼脂、藻酸或其盐，诸如藻酸钠)。在一些实施方案中，特别是在液体制剂中，工程化PAL多肽与多种另外的组分组合，所述另外的组分包括但不限于防腐剂、助悬剂、增稠剂、湿润剂、醇类、脂肪酸和/或乳化剂。

在一些实施方案中，特别是在液体制剂中，工程化PAL多肽与多种另外的组分组合，所述另外的组分包括但不限于防腐剂、助悬剂、增稠剂、湿润剂、醇类、脂肪酸和/或乳化剂。在一些实施方案中，将工程化PAL多肽与用于治疗PKU的其他化合物组合施用到受试者，所述用于治疗PKU的其他化合物包括但不限于四氢生物蝶呤(BioMarinPharmaceutical,Inc.,Novato,CA)、抗酸剂(例如奥美拉唑、埃索美拉唑和其他吡唑类)，以及任何其他适合的化合物。

在一些实施方案中，本发明提供了工程化PAL多肽，所述工程化PAL多肽适合用于降低在流体诸如血液、脑脊髓液等中的苯丙氨酸的浓度。施用到动物中的工程化PAL多肽的剂量取决于状况或疾病、动物的一般情况、和本领域技术人员已知的其他因素。在一些实施方案中，组合物用于单次或多次施用至动物。在一些实施方案中，预期的是，工程化PAL多肽在施用到动物(例如，患有PKU的人)的组合物中的浓度足以有效治疗、改善和/或预防疾病(例如PKU和/或PKU相关的状况、疾病和/或症状)。在一些实施方案中，工程化PAL多肽与其他药物和/或膳食组合物组合施用。

工业组合物

预期的是，将本发明的工程化PAL多肽应用于工业组合物中。在一些实施方案中，配制工程化PAL多肽用于在食品和/或饲料工业中使用。在一些实施方案中，将工程化PAL多肽配制为粒状或丸状产品，其与动物饲料组分诸如另外的酶(例如，纤维素酶、漆酶和淀粉酶)混合。在一些可选的实施方案中，工程化PAL多肽被用于液体动物饲料组合物(例如，水基或油基的浆液)。因此，在一些实施方案中，本发明的工程化PAL变体是足够耐热和热稳定的以承受用于产生丸剂和其他处理的饲料/食品的处理。

还将本发明的工程化PAL变体用于制备苯丙氨酸和/或苯丙氨酸衍生物。

本申请提供了以下内容：

项目1.一种具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:4或其功能片段至少85％的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:4或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与所述参考序列SEQID NO:4相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

项目2.如项目1所述的工程化多肽，其中所述一个或更多个氨基酸位置选自20、24、27、39、43、45、47、54、58、59、62、70、73、80、82、91、94、98、104、105、110、112、115、117、118、119、121、123、124、125、126、127、128、129、130、131、133、134、135、139、140、141、142、143、144、145、146、147、149、150、151、153、154、156、157、158、159、172、174、175、176、177、178、180、187、191、195、199、205、206、210、212、213、214、232、240、243、245、247、248、250、256、257、266、270、275、278、279、285、286、289、290、292、304、305、307、308、309、319、321、326、331、332、334、349、353、355、364、365、369、370、371、372、374、375、377、378、379、381、382、383、384、385、387、389、394、396、399、400、403、404、407、417、418、425、431、432、433、434、435、436、437、438、439、443、446、447、453、456、459、460、461、463、471、472、473、474、475、476、477、478、479、482、483、503、507、509、521、522、524、525、528、538、546、547、551、558、560、564、565和/或其任何组合，其中所述氨基酸位置参考SEQ ID NO:4来编号。

项目3.如前述项目中任一项所述的工程化多肽，其中所述参考序列SEQ ID NO:4的氨基酸残基对应于A39、T54、G59、S73、A91、Y158、S180、K195、A112、R134、Q240、T243、I245、A256、L257、N270、N290、Y304、R305、H307、E308、I326、L349、D353、L364、A394、S399、N400、P404、L407、F443、N453、Y459、T460、T463、N474、E509、Q521、K522、T524、P528、S546和/或P564。

项目4.如前述项目中任一项所述的工程化多肽，其中当与SEQ ID NO:4的多肽最佳比对时，与SEQ ID NO:4相比的所述氨基酸残基差异选自以下置换中的一个或更多个：A39V、T54K、G59R、S73K、A112C、R134Q、A91V、Y158H、S180A、K195E、Q240R/W、T243I/L、I245L、A256G、L257W/A、N270K、N290G、Y304H、R305M、H307G/Q/M、E308Q、I326F、L349M、D353A/N、L364Q、A394V、S399N、N400K、P404A、L407V、F443H、N453G、Y459F、T460G、T463N、N474Q、E509L、Q521K/S、K522Y/F/N、T524S、P528L、S546R和P564G/L/M。

项目5.如项目1-4中任一项所述的工程化多肽，其中所述氨基酸残基差异选自以下的一个或更多个的组合：A39、A91、Q240、A256、N290、Y304、R305、H307、D353、A394、S399、P404、L407、Q521、K522和T524。

项目6.如前述项目中任一项所述的工程化多肽，其中所述工程化多肽具有与SEQID NO:4至少约90％的序列同一性；和在位置H307处的氨基酸残基差异。

项目7.如项目6所述的工程化多肽，其中所述氨基酸残基差异为H307G/Q/M。

项目8.如前述项目中任一项所述的工程化多肽，其中所述改进的特性选自降低的对蛋白水解的敏感性和/或增加的对酸性pH的耐受性。

项目9.如前述项目中任一项所述的工程化多肽，其中所述参考序列是源自多变鱼腥藻(Anabaena variabilis)的野生型PAL。

项目10.一种具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:10或其功能片段至少85％的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:10或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与所述参考序列SEQ ID NO:10相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

项目11.一种具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与参考序列SEQ ID NO:10至少85％的序列同一性的氨基酸序列，和与SEQ ID NO:10相比的至少一个氨基酸残基差异，并且所述工程化多肽与SEQ ID NO:10相比表现出选自以下的至少一种改进的特性：增强的催化活性、降低的对蛋白水解的敏感性、增加的对酸性pH的耐受性、减少的聚集、和/或降低的免疫原性。

项目12.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO:10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：

I27E/V39A；I27E/V39A/R43L/V105C/A153R/L214E/P266H/L278D/C503Q；

I27E/V39A/R43L/L214E/A547D；

I27E/V39A/V105C/A112C/R134Q/L214E/L278D/C503Q/A547D/C565N；

I27E/V39A/V105C/A112C/R134Q/A153R/Q205T/L214E/P266H/L278D/C503Q/A551D；

I27E/V39A/V105C/A112C/Q205T/P210C/P266H/C503Q/A547D；

I27E/V39A/V105C/A112C/Q205T/P266H/I285E/C503Q/A551D；

I27E/V39A/V105C/A112C/L214E/I285E/C503Q/A547D；

I27E/V39A/V105C/S131N/R134Q/Q205T/L214E/C503Q/A547D/C565N；

I27E/V39A/V105C/R134Q/A153R/P210C/L278D/I285E/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/Q205T/P210C/L278D/C503Q/A547D；

I27E/V39A/V105C/R134Q/Q205T/L214E；

I27E/V39A/V105C/R134Q/Q205T/L214E/A551D/C565N；

I27E/V39A/V105C/R134Q/Q205T/L278D/I285E/C503Q/A547D/A551D/C565N；

I27E/V39A/V105C/R134Q/P210C；I27E/V39A/V105C/R134Q/P210C/L214E；

I27E/V39A/V105C/R134Q/P210C/L214E/I285E/A547D；

I27E/V39A/V105C/R134Q/P210C/L214E/C503Q/A551D/C565N；

I27E/V39A/V105C/R134Q/L214E/L278D/A547D/A551D；

I27E/V39A/V105C/R134Q/L214E/I285E/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/P266H/C503Q；

I27E/V39A/V105C/R134Q/P266H/C503Q/A547D/A551D；

I27E/V39A/V105C/R134Q/L278D/C503Q/C565N；

I27E/V39A/V105C/R134Q/L278D/I285E/C503Q；I27E/V39A/V105C/R134Q/L278D/A551D；

I27E/V39A/V105C/R134Q/I285E/A547D/A551D；I27E/V39A/V105C/R134Q/C503Q/A551D；

I27E/V39A/V105C/A153R/Q205T/L278D/C503Q/A547D/A551D；

I27E/V39A/V105C/A153R/L214E；I27E/V39A/V105C/A153R/I285E；

I27E/V39A/V105C/A153R/C503Q/A547D/C565N；I27E/V39A/V105C/A153R/A551D/C565N；

I27E/V39A/V105C/Q205T/P210C/L214E/L278D/A547D；

I27E/V39A/V105C/Q205T/P210C/L278D/C503Q；

I27E/V39A/V105C/Q205T/P210C/L278D/A547D；

I27E/V39A/V105C/Q205T/L214E/L278D/C503Q/A547D；

I27E/V39A/V105C/Q205T/L278D/C503Q/A547D；

I27E/V39A/V105C/P210C/I285E/C503Q/A547D/A551D/C565N；

I27E/V39A/V105C/P210C/L214E/P266H/L278D；

I27E/V39A/V105C/L214E/P266H/C503Q/A547D/C565N；

I27E/V39A/V105C/L214E/L278D/L309P/C503Q/A547D/A551D；

I27E/V39A/V105C/L278D/C503Q/A547D/C565N；I27E/V39A/V105C/I285E/A547D；

I27E/V39A/V105C/C503Q/A551D；I27E/V39A/V105C/C503Q/A547D/A551D/C565N；

I27E/V39A/A112C/R134Q/Q205T/P210C/L214E/A551D/C565N；

I27E/V39A/A112C/R134Q/L214E/P266H/A551D；

I27E/V39A/A112C/R134Q/L214E/C503Q/A547D；I27E/V39A/A112C/R134Q/P266H/1285E；

I27E/V39A/A112C/Q205T/L214E/P266H/C503Q/A551D/C565N；

I27E/V39A/A112C/Q205T/L278D/I285E；I27E/V39A/A112C/L214E；

I27E/V39A/A112C/L214E/L278D/C503Q/A547D/A551D；I27E/V39A/A112C/I285E；

I27E/V39A/A112C/A547D；I27E/V39A/R134Q；

I27E/V39A/R134Q/A153R/Q205T/L214E/P266H/C503Q；

I27E/V39A/R134Q/A153R/P210C/L214E/L278D/I285E/A547D/C565N；

I27E/V39A/R134Q/A153R/L214E/P266H/L278D/C503Q/A547D/C565N；

I27E/V39A/R134Q/A153G/L214E/P266H/I285E/C503Q/A551D/C565N；

I27E/V39A/R134Q/A153R/L214E/C503Q/A547D；I27E/V39A/R134Q/A153R/L278D；

I27E/V39A/R134Q/A153R/L278D/A547D/A551D；I27E/V39A/R134Q/A153R/A547D；

I27E/V39A/R134Q/Q205T/L214E/P266H/I285E/C503Q/A551D/C565N；

I27E/V39A/R134Q/Q205T/P266H/C503Q/A551D/C565N；

I27E/V39A/R134Q/P210C/L214E/C503Q；I27E/V39A/R134Q/P210C/C503Q/A551D；

I27E/V39A/R134Q/L214E/P266H/A551D；

I27E/V39A/R134Q/L278D/I285E/C503Q/A547D/A551D；

I27E/V39A/R134Q/L278D/C503Q/A547D；I27E/V39A/R134Q/C503Q/A547D；

I27E/V39A/R134Q/A547D/C565N；I27E/V39A/Q205T/L214E/C503Q/C565N；

I27E/V39A/Q205T/P266H/I285E/A547D/A551D/C565N；I27E/V39A/Q205T/P266H/A551D；

I27E/V39A/Q205T/L278D/C503Q/A551D/C565N；I27E/V39A/Q205T/L278D/C503Q/C565N；

I27E/V39A/Q205T/C503Q/A547D/C565N；I27E/V39A/P210C/T212S；

I27E/V39A/P210C/P266H/I285E/C503Q/A547D；I27E/V39A/P210C/P266H/C503Q/A551D；

I27E/V39A/L214E；I27E/V39A/L214E/P266H/L278D/C503Q/A547D/A551D/C565N；

I27E/V39A/L214E/L278D/C503Q；I27E/V39A/L214E/L278D/C503Q/A547D/C565N；

I27E/V39A/L214E/C503Q/A551D；I27E/V39A/P266H；I27E/V39A/P266H/L278D；

I27E/V39A/L278D；I27E/V39A/L278D/A547D；I27E/V39A/L278D/I285E/C503Q/A547D；

I27E/V39A/L278D/C503Q/C565N；I27E/V39A/C503Q；I27E/G45D/Q205T/P266H/C565N；

I27E/V105C；I27E/V105C/R134Q/A153R/P210C/L214E/C503Q/A547D；

I27E/V105C/R134Q/A153R/I285E/A547D；I27E/V105C/R134Q/A153R/C503Q；

I27E/V105C/R134Q/Q205T/P210C/C503Q；

I27E/V105C/R134Q/Q205T/L214E/P266H/L278D/C503Q/C565N；

I27E/V105C/Q205T/P266H/C503Q；

I27E/V105C/R134Q/P210C/L214E/P266H/L278D/A551D/C565N；

I27E/V105C/R134Q/P210C/L214E/C503Q/A551D/C565N；

I27E/V105C/R134Q/P210C/P266H/L278D/I285E/C503Q/A551D/C565N；

I27E/V105C/R134Q/L214E/L278D/C503Q/A547D；

I27E/V105C/R134Q/L214E/L278D/C503Q/A547D/A551D/C565N；I27E/V105C/Q205T；

I27E/V105C/Q205T/L214E/P266H；I27E/V105C/Q205T/L214E/P266H/A551D/C565N；

I27E/V105C/Q205T/L214E/L278D/I285E/C503Q/A547D/A551D/C565N；

I27E/V105C/Q205T/C503Q/A547D/A551D/C565N；I27E/V105C/L214E；

I27E/V105C/L214E/P266H/C503Q；I27E/V105C/L214E/I285E/A551D/C565N；

I27E/V105C/L214E/A547D/A551D/C565N；I27E/V105C/L214E/A551D/C565N；

I27E/V105C/P266H；I27E/V105C/P266H/I285E/C503Q/A547D/C565N；

I27E/V105C/L278D/A547D；I27E/V105C/I285E/C503Q/A547D/A551D/C565N；

I27E/V105C/C503Q/A547D/C565N；I27E/V105C/C503Q/A547D/A551D/C565N；

I27E/A112C/R134Q/A153R/L214E/P266H/C503Q；

I27E/A112C/R134Q/L278D/I285E/C503Q/A551D/C565N；

I27E/A112C/R134Q/Q205T/L278D/C503Q；I27E/A112C/R134Q/Q205T/I285E/C503Q；

I27E/R134Q；I27E/R134Q/A153R/I285E/C503Q/A547D；

I27E/R134Q/Q205T/I285E/C503Q/A551D；I27E/R134Q/Q205T/P266H/L278D/A547D；

I27E/R134Q/P210C；I27E/R134Q/L214E/C503Q；I27E/R134Q/L214E/C503Q/A547D；

I27E/R134Q/L214E/C503Q/A547D/A551D；I27E/R134Q/L214E/C503Q/C565N；

I27E/R134Q/L278D/I285E/A551D/C565N；I27E/R134Q/I285E/C503Q；

I27E/A153R/L214E/L278D/I285E/A551D/C565N；I27E/A153R/L214E/L278D/A551D；

I27E/Q205T；I27E/Q205T/L214E/L278D/I285E/C503Q/C565N；

I27E/Q205T/L278D/A551D；I27E/P210C；I27E/P210C/L214E/C503Q/A547D；

I27E/L214E；I27E/L214E/P266H/L278D/I285E/A551D；I27E/L214E/L278D；

I27E/L214E/L278D/C503Q；I27E/L214E/C503Q；I27E/L214E/C503Q/A547D；

I27E/L214E/C503Q/A547D/C565N；I27E/L214E/A551D；I27E/P266H/L278D/C503Q；

I27E/A547D/C565N；V39A/G45S/L278D/C503Q/A551D；

V39A/V105C/R134Q/A153R/Q205T/A551D；V39A/V105C/R134Q/P210C/L214E/A551D；

V39A/V105C/Q205T/C503Q；V39A/V105C/Q205T/A551D；V39A/V105C/P210C/A547D；

V39A/A112C/A153R/Q205T/L278D/C503Q/A547D；V39A/R134Q；

V39A/R134Q/Q205T/L214E/C503Q/C565N；V39A/R134Q/P210C/L214E/A547D/C565N；

V39A/A153R/C503Q/A547D；V39A/Q205T/L278D/A547D/A551D；

V39A/P210C/L214E/L278D/I285E/C503Q/A551D；V39A/P266H；

V39A/P275R/L278D/C503Q/A551D；V39A/C503Q；V39A/C503Q/A551D/C565N；V105C；

V105C/A112C/R134Q/Q205T/L214E/Y492H/C503Q/A547D；

V105C/R134Q/A153R/Q205T/L214E/C503Q；V105C/R134Q/Q205T/L214E/A547D；

V105C/R134Q/L214E/L278D/C565N；V105C/R134Q/L214E/C503Q/A547D；

V105C/R134Q/L214E/C503Q/A547D/A551D；V105C/R134Q/C503Q；

V105C/R134Q/C503Q/A547D；V105C/R134Q/C503Q/A547D/C565N；

V105C/A153R/Q205T/L214E/P266H/C503Q/A547D；

V105C/Q205T/L214E/L278D；V105C/Q205T/L214E/C503Q/A547D/A551D/C565N；

V105C/Q205T/C503Q/A551D；V105C/L214E/P266H/L278D/A547D；

V105C/L214E/L278D/C503Q/A547D/A551D；V105C/L214E/I285E；

V105C/L214E/I285E/C503Q/A547D/A551D/C565N；V105C/L214E/I285E/A547D/C565N；

V105C/L278D/C503Q/A551D；V105C/I285E；V105C/I285E/A547D；V105C/C503Q；

A112C/R134Q/L214E/C503Q/A547D/A551D/C565N；A112C/L214E/L278D；

A112C/L278D/C503Q/A547D；R134Q/Q205T/L214E/I285E/C503Q/A551D/C565N；

R134Q/Q205T/C503Q；R134Q/P210C/L214E/L278D/C503Q/A547D/C565N；

R134Q/P210C/L214E/C503Q/A547D/A551D；R134Q/L214E；R134Q/L214E/L278D/C503Q；

R134Q/L214E/L278D/C503Q/A551D；R134Q/L214E/I285E/C503Q；R134Q/C503Q；

R134Q/C503Q/A547D/A551D；A153R；Q205T/L214E/I285E/C503Q/A551D；

Q205T/L214E/I285E/C503Q/C565N；Q205T/L214E/C503Q/A547D/C565N；

L214E/P266H/C503Q/A547D/A551D/C565N；L214E/C503Q/A547D；L214E/A547D；

P266H/L278D/C503Q；P266H/C565N；L278D/A547D；C503Q；C503Q/A547D；

A547D；和/或C565N。

项目13.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO：10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：V80I/R134C/P564Q；V121C；A123G；A124G；M125L；L126I/T；L126M/R134L；L127A；A129G/L；N130Q；N130C/M370I R134W；M133R；R134I；R134N/G307C；G135C/S；和/或G135A/A394E。

项目14.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO:10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：G20S/I144L；R43S；L47M/I144L；L47M/R146E；L47M/M147G/A383E；L47M/P157C；Q58H/L143V；Q58K/P157D/G369C；A62S/M147V；S82I/G135C/P157F/W279L；R94C/I149E；T110I/I139R；L118M/L141H；A119E/T156H/A289D；I139M/V；R140D/G/M；R140N/A199E；R140E/A334S/A551D；L141K/Q/P/T；E142H/P/V；E142D/G371D；L143F/M；I144L/N/V；K145N/Q/R；K145G/P157T；R146H/L；R146W/D191Y；M147A；I149L/R；F150K/L/M；L151M；A153C/G；A153S/H250N；G154R；G154Y/L174M/Q321K/S456I/G483C；T156K/G483C；P157D/F/H/Y；Y158E；V159C/H/L/M；M247I；L319M；和/或Q389K。

项目15.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO:10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：P117T/Y176Q；V172I/C/L；L174M；S175G；Y176E/I/M/R/V；I177M/V；T178L/A477S；和/或S180C/T。

项目16.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO:10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：R43S/H374K；R43S/H374R；A112S/M370A/A507E；M147I/H374S；S187R/L381V；D191Y/H385N；A232S；Q240K/H374R；A256S/L381N；P275Q/M370S；P275T/H374R；Q332K/Y377M；A334S/H374V；L349M；Q355K/H374S；M370G/I/S；G371H/N/Q/S；M372A/V；H374A/D/G/L/N/R/S/T；H374Q/P396Q；H374R/G417C；L375I；L375M；Y377C/I/N；Y378C/D/E/I/L/N/S；Y378F/P404Q；I379C/H/L/M/N；L381G/V；L381M/Q560K；L382C/H/I/M/S；A383S/V；K384R；H385C/G/N；H385M/P403H；H385S/P403H；D387S；L418M；G425V；A447S；S461G；和/或S525L。

项目17.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO:10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：A24S/F434M；A62S/T433N；S98I；L213M/S438L；Q240K/T433Y；S286R/Y435T；A289S/L431E；S331I；L431C/E/G/P/S/V；L432C/V；T433A/I/L/N/P/Q/R/S/V/W；F434C；Y435L；Y435Q/H446N；G436M；G436D/T；N437E/G/Q；N437T/L538M；S438C/F/M/R/T；I439C/F/L/V；和/或A477S。

项目18.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO:10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：A24E；Q58R/Y475H；A70S/N474E；L104M/V476L；A119E/G365A；L206M；P275Q；G276V；Q292H/A479G；Q355H/I478C；P404T/A477V；I471F/G/K/M/N/R/V/W；F472G；Q473H/K/M/R/S；Q473H/A507S；N474A/H/R/W；N474D/R490H；Y475C/F/L/Q；V476C/I/L；I478N/S；A479G/S；F482C/L；G483C/H/S；G483A/S524I；G483R/G537C；和/或A558S。

项目19.如项目10和/或11所述的工程化多肽，其中与SEQ ID NO:10相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：V39A/K115E/M133R/C565N；V39A/M133R/F472G/C503Q/C565N；V39A/M133R/F472G/C565N；V39A/M133R/C503Q；V39A/M133R/C503Q/C565N；V39A/M147A/Y378E/C503Q/C565N；V39A/M147A/Y378E/C565N；V39A/M147A/L381G/F472G/C503Q/C565N；V39A/M147A/L381G/C503Q/C565N；V39A/M147A/F472G/C503Q/C565N；V39A/M147A/F472G/C565N；V39A/M147A/C565N；V39A/G248C/L381G/F472G/C503Q/C565N；V39A/Y378E/C503Q/C565N；V39A/Y378E/C565N；V39A/L381G；V39A/F472G/C503Q/C565N；V39A/C503Q/C565N；M133R/L381G/C565N；M133R/C503Q；Y378D/C503Q；Y378E/F472G/C503Q/C565N；L381G/F472GC503Q/C565N；和/或F472G/C503Q/C565N。

项目20.一种具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含：a)氨基酸序列，所述氨基酸序列具有与参考序列SEQ ID NO:26或其功能片段至少85％的序列同一性；b)多肽序列，所述多肽序列包含与SEQ ID NO:26或其功能片段相比在一个或更多个氨基酸位置处的至少一个氨基酸残基差异；并且c)所述工程化多肽与所述参考序列SEQ ID NO:26相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)减少的聚集、v)降低的免疫原性、或i)、ii)、iii)、iv)或v)的任何组合。

项目21.一种具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与参考序列SEQ ID NO:26至少85％的序列同一性和与SEQ ID NO:26相比的至少一个氨基酸残基差异的氨基酸序列，并且所述工程化多肽与SEQ ID NO:26相比表现出选自以下的至少一种改进的特性：增强的催化活性、降低的对蛋白水解的敏感性、增加的对酸性pH的耐受性、减少的聚集、和/或降低的免疫原性。

项目22.如项目20和/或21所述的工程化多肽，其中与SEQ ID NO:26相比的所述氨基酸残基差异选自以下置换或置换集合中的一个或更多个：A24E/G381L；L127V；A129I/V；S131C/T；H132L/S；R134C/F/H/K；R134H/Y378E/G381L；R134H/Y378E/G381L/V388T；R134H/V388T；A136K；A289S；M372L；H374G/M/Q；G381A/C/F/I/L/M/N/Q/S/T；A383C/M；V388C/T；L431M；和/或L563M。

项目23.如前述项目中任一项所述的工程化多肽，其中所述工程化多肽具有与参考序列SEQ ID NO:4至少约90％的序列同一性。

项目24.如项目23所述的工程化多肽，其中所述工程化多肽具有与参考序列SEQID NO:4至少约95％的序列同一性。

项目25.一种具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽包含具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24、和/或26或其功能片段至少约90％的序列同一性的氨基酸序列。

项目26.如项目25所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，包含具有与SEQ ID NO:6、8、10、12、14、16、18、20、22、24、和/或26或其功能片段至少约99％的序列同一性的氨基酸序列。

项目27.具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中所述工程化多肽是表2-1至2-5和/或表9-1至9-7中的任一个中提供的变体PAL。

项目28.如项目1-27中任一项所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中所述工程化多肽是多变鱼腥藻酶。

项目29.如项目1-28中任一项所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中所述工程化多肽是热稳定的。

项目30.如项目1-29中任一项所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中所述工程化多肽耐受蛋白水解。

项目31.如项目30所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中所述工程化多肽耐受通过至少一种消化道酶的蛋白水解。

项目32.如项目31所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中所述工程化多肽耐受通过胰凝乳蛋白酶、胰蛋白酶、羧肽酶和/或弹性蛋白酶的蛋白水解。

项目33.如项目1-32中任一项所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，其中所述工程化多肽是酸稳定的。

项目34.如项目1-33中任一项所述的工程化多肽，其中所述工程化多肽被去免疫化。

项目35.如项目34所述的去免疫化的工程化多肽，其中所述多肽包含具有与SEQID NO:6、8、10、12、14、16、18、20、22、24和/或26至少95％的序列同一性的氨基酸序列。

项目36.如项目1-35中任一项所述的工程化多肽，其中所述多肽是纯化的。

项目37.一种多核苷酸序列，所述多核苷酸序列编码至少一种如前述项目1-36中任一项所述的工程化多肽。

项目38.如项目37所述的多核苷酸序列，其中所述序列被可操作地连接到控制序列。

项目39.如项目37和/或38所述的多核苷酸序列，其中所述多核苷酸是密码子优化的。

项目40.一种表达载体，所述表达载体包含至少一种如项目37-39中任一项所述的多核苷酸序列，和至少一种控制序列。

项目41.如项目40所述的表达载体，其中所述控制序列是启动子。

项目42.如项目41所述的表达载体，其中所述启动子是异源启动子。

项目43.一种宿主细胞，所述宿主细胞用至少一种如项目35-37中任一项所述的多核苷酸序列，和/或项目40-42中任一项所述的载体来转化。

项目44.如项目43所述的宿主细胞，其中所述宿主细胞是大肠杆菌(E.coli)。

项目45.一种在宿主细胞中产生工程化PAL多肽的方法，所述方法包括在适合的培养条件下培养包含编码至少一种如项目1至36中任一项所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽的至少一种多核苷酸、和/或至少一种如项目37和/或39所述的多核苷酸序列、和/或至少一种如项目40-42中任一项所述的载体的宿主细胞，使得产生至少一种工程化PAL多肽。

项目46.如项目45所述的方法，所述方法还包括从所述培养物和/或宿主细胞回收至少一种具有苯丙氨酸解氨酶(PAL)的工程化多肽。

项目47.如项目46所述的方法，所述方法还包括纯化产生的所述至少一种具有苯丙氨酸解氨酶(PAL)的工程化多肽的步骤。

项目48.一种组合物，所述组合物包含至少一种如项目1至36中任一项所述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽。

项目49.如项目48所述的组合物，其中所述组合物是药物组合物。

项目50.如项目49所述的药物组合物，所述药物组合物还包含至少一种药学上可接受的赋形剂和/或载体。

项目51.如项目48-50中任一项所述的组合物，其中所述组合物适合于苯丙酮尿症的治疗。

项目52.如项目49-51中任一项所述的药物组合物，其中所述组合物适合于口服施用至人。

项目53.如项目49-52中任一项所述的药物组合物，其中所述组合物呈丸剂、片剂、胶囊、囊形片、液体或乳剂的形式。

项目54.如项目53所述的药物组合物，其中所述丸剂、片剂、胶囊、或囊形片还包含肠溶包衣。

项目55.如项目49-51中任一项所述的药物组合物，其中所述组合物适合于肠胃外注射入人中。

项目56.如项目49-55中任一项所述的药物组合物，其中所述组合物与至少一种另外的治疗有效化合物共施用。

项目57.如项目56所述的药物组合物，其中所述组合物包含至少一种另外的治疗有效化合物。

项目58.一种用于治疗和/或预防受试者中苯丙酮尿症的症状的方法，所述方法包括：提供患有苯丙酮尿症的受试者，以及向所述受试者提供如项目49-57中任一项所述的药物组合物。

项目59.如项目58所述的方法，其中所述苯丙酮尿症的症状被改善。

项目60.如项目58和/或59所述的方法，其中所述受试者能够食用在其甲硫氨酸、苯丙氨酸和/或酪氨酸含量方面比由还未被提供包含至少一种如项目1-36中所阐述的具有苯丙氨酸解氨酶(PAL)活性的工程化多肽的至少一种药物组合物的受试者所需要的饮食较不受限的饮食。

项目61.如项目58-60中任一项所述的方法，其中所述受试者是婴儿或儿童。

项目62.如项目58-60中任一项所述的方法，其中所述受试者是成人或青年。

项目63.项目48-57中任一项所提供的组合物的用途。

可以结合以下非限制性实施例更好地理解本发明的前述和其他方面。提供实施例仅用于说明目的并且不意图以任何方式限制本发明的范围。

实验

提供以下实施例，包括实验和获得的结果，仅用于说明的目的，而不应被解释为限制本发明。

在下面的实验公开内容中，应用以下缩写：ppm(parts per million)；M(摩尔)；mM(毫摩尔)，uM和μΜ(微摩尔)；nM(纳摩尔)；mol(摩尔)；gm和g(克)；mg(毫克)；ug和μg(微克)；L和l(升)；ml和mL(毫升)；cm(厘米)；mm(毫米)；uM和μM(微米)；sec.(秒)；min(s)(分钟)；h(s)和hr(s)(小时)；U(单位)；MW(分子量)；rpm(每分钟转数)；psi和PSI(每平方英寸磅数)；℃(摄氏温度)；RT和rt(室温)；CDS(编码序列)；DNA(脱氧核糖核酸)；RNA(核糖核酸)；大肠杆菌W3110(常用的实验室大肠杆菌菌株，可从Coli Genetic Stock Center[CGSC]，New Haven,CT获得)；HTP(高通量)；HPLC(高压液相色谱)；CFSE(羧基荧光素琥珀酰亚胺酯)；IPTG(异丙基β-D-1-硫代半乳糖苷))；PES(聚醚砜)；PHE和phe(苯丙氨酸)；BSA(牛血清白蛋白)；PBMC(外周血单核细胞)；PKU(苯丙酮尿症)；MHC(主要组织相容性复合物)；HLA(人白细胞抗原)；HLA-DR(由6号染色体上的HLA复合物编码的MHC II类细胞表面受体)；FIOPC(相比于阳性对照的改进倍数)；LB(Luria肉汤)；AthensResearch(Athens ResearchTechnology，Athens,GA)；ProSpec(ProSpec TANY Technogene，East Brunswick,NJ)；Sigma-Aldrich(Sigma-Aldrich，St.Louis,MO)；Ram Scientific(Ram Scientific,Inc.,Yonkers,NY)；Pall Corp.(Pall Corp.,Pt.Washington,NY)；Millipore(MilliporeCorp.,Billerica MA)；Difco(Difco Laboratories，BD Diagnostic Systems,Detroit,MI)；Molecular Devices(Molecular Devices,LLC,Sunnyvale,CA)；Kuhner(AdolfKuhner,AG,Basel,Switzerland)；Cambridge Isotope Laboratories,(CambridgeIsotope Laboratories,Inc.,Tewksbury，MA)；Applied Biosystems(AppliedBiosystems,part of Life Technologies,Corp.,Grand Island,NY)，Agilent(AgilentTechnologies,Inc.,Santa Clara,CA)；Thermo Scientific(Thermo Fisher Scientific的一部分，Waltham,MA)；Corning(Corning,Inc.,Palo Alto,CA)；Constant Systems(Constant Systems Ltd.,Daventry,United Kingdom)；Megazyme(MegazymeInternational,Wicklow,Ireland)；Enzo(Enzo Life Sciences,Inc.,Farmingdale,NY)；GE Healthcare(GE Healthcare Bio-Sciences,Piscataway,NJ)；Harlan(HarlanLaboratories,Indianapolis,IN)；AB Sciex(AB Sciex,Framingham,MA)；和Bio-Rad(Bio-Rad Laboratories,Hercules，CA)。

以下多核苷酸和多肽序列应用于本发明。在某些情况下(如下所示)，多核苷酸序列之后是所编码的多肽。

pET16b-AvPAL表达载体的多核苷酸序列(SEQ ID NO:1)：

AvPAL ORF的多核苷酸序列(SEQ ID NO:2)：

WT AvPAL的多核苷酸序列(SEQ ID NO:3)：

WT AvPAL的多肽序列(SEQ ID NO:4)：

AvPAL变体30号的多核苷酸序列(SEQ ID NO:5)：

AvPAL变体30号的多肽序列(SEQ ID NO:6)：

AvPAL变体22号的多核苷酸序列(SEQ ID NO:7)：

AvPAL变体22号的多肽序列(SEQ ID NO:8)：

AvPAL变体36号的多核苷酸序列(SEQ ID NO:9)：

AvPAL变体36号的多肽序列(SEQ ID NO:10)：

AvPAL变体42号的多核苷酸序列(SEQ ID NO:11)：

AvPAL变体42号的多肽序列(SEQ ID NO:12)：

AvPAL变体43号的多核苷酸序列(SEQ ID NO:13)：

AvPAL变体43号的多肽序列(SEQ ID NO:14)：

AvPAL变体1002号的多核苷酸序列(SEQ ID NO:15)：

AvPAL变体1002号的多肽序列(SEQ ID NO:16)：

AvPAL变体1008号的多核苷酸序列(SEQ ID NO:17)：

AvPAL变体1008号的多肽序列(SEQ ID NO:18)：

AvPAL变体1009号的多核苷酸序列(SEQ ID NO:19)：

AvPAL变体1009号的多肽序列(SEQ ID NO:20)：

AvPAL变体1010号的多核苷酸序列(SEQ ID NO:21)：

AvPAL变体1010号的多肽序列(SEQ ID NO:22)：

AvPAL变体1084号的多核苷酸序列(SEQ ID NO:23)：

AvPAL变体1084号的多肽序列(SEQ ID NO:24)：

AvPAL变体967号的多核苷酸序列(SEQ ID NO:25)：

变体967号的多肽序列(SEQ ID NO:26)：

表达载体pCK100900i：

实施例1

PAL基因获得和表达载体的构建

获得多变鱼腥藻苯丙氨酸解氨酶(AvPAL)质粒DNA，并将编码AvPAL的合成基因密码子优化用于在大肠杆菌中表达，并克隆进大肠杆菌表达载体pET16b中以提供pET16b-AvPAL(SEQ ID NO:1)。AvPAL开放阅读框(SEQ ID NO:2)使用寡核苷酸：PAL-pCK-F和PAL-pCK-R通过PCR来扩增，并被亚克隆进表达载体pCK100900i(SEQ ID NO:27)中。

将该质粒构建体转化进源自W3110的大肠杆菌菌株中。使用本领域技术人员通常已知的定向进化技术从该质粒构建体产生基因变体文库(参见例如，美国专利号8,383,346和WO2010/144103)。

实施例2

高通量(HTP)生长和测定

PAL和PAL变体的高通量(HTP)生长

将转化的大肠杆菌细胞通过平铺在包含1％葡萄糖和30μg/ml氯霉素的LB琼脂平板上来选择。在37℃下孵育过夜后，将菌落放入NUNC^TM(Thermo-Scientific)的96孔浅平底板的孔中，该96孔浅平底板填充有180μl/孔的补充有1％葡萄糖和30μg/ml氯霉素的LB。将培养物在摇床中过夜生长18-20小时(200rpm，30℃和85％相对湿度；Kuhner)。将过夜生长的样品(20μL)转移到填充有380μL的补充有30μg/ml氯霉素的Terrific肉汤的Costar 96孔深板中。将板在摇床中孵育135分钟(250rpm，30℃，和85％相对湿度；Kuhner)。然后将细胞用40μL无菌水中的10mM IPTG诱导，并在摇床中过夜孵育20-24小时(250rpm，30℃，和85％相对湿度；Kuhner)。将两个重复培养物合并，使细胞沉淀(4000rpm x 20min)，将上清液弃去，并在分析之前将细胞冷冻在-80℃。

HTP沉淀物的裂解

首先，将500μL裂解缓冲液(20mM Tris pH 7.5，1mM MgSO₄，1mg/ml溶菌酶和0.5mg/ml多粘菌素B硫酸盐)加入到细胞沉淀物。将混合物在室温下搅拌1.5h，并沉淀(4000rpm x 5min)，然后在本文所描述的多种HTP测定中使用澄清的裂解物。这些裂解物通过SDS-PAGE的分析显示，过表达的蛋白以～60kDa的表观MW存在，与PAL的期望的MW一致。

澄清的裂解物的分析

PAL变体活性通过测量肉桂酸的形成来确定，如通过290nm处吸光度随时间的变化确定的。对于该测定，将100μL 200mM Tris/50mM苯丙氨酸pH 7.5，或200mM磷酸钠/50mM苯丙氨酸pH 7.0，80μL水，和20μL澄清的裂解物加入到聚-丙烯酸酯96孔板(Costar#3635,Corning)的孔中。将反应物短暂混合，并且活性使用 Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。

用蛋白酶预处理的澄清的裂解物的HTP-分析

PAL变体用胰凝乳蛋白酶和胰蛋白酶来刺激，以模拟下肠道(lower intestine)环境。首先，将30μL蛋白酶混合物(0.01-100mg/ml胰凝乳蛋白酶(C4129Sigma Aldrich)、0.01-100mg/ml胰蛋白酶(T7409Sigma Aldrich)、1mM CaCl₂和1mM HCl)、0-30μL的在500mM磷酸钠pH 7.0中的20mM牛磺胆酸钠、和90-120μL澄清的裂解物加入到96孔圆底板(Costar#3798,Corning)的孔。将板密封，并在37℃、400rpm、1”throw下孵育1h，然后分析。对于该测定，将100μL的200mM Tris/50mM苯丙氨酸pH 7.5或200mM磷酸钠/50mM苯丙氨酸pH 7.0和100μL蛋白酶处理的裂解物加入到聚-丙烯酸酯96孔板(Costar#3635,Corning)的孔。将该反应物短暂混合，并且活性使用 Plus³⁸⁴或(MolecularDevices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在下表中提供。

用酸处理的澄清的裂解物的HTP-分析

在该测定中，PAL变体在酸性条件下被刺激，以模拟胃环境。首先，将20μL的1M柠檬酸钠(pH 3.7-4.5)和30μL水或50μL 400mM柠檬酸钠pH 3.7-4.8，和50uL澄清的裂解物加入到96孔圆底板(Costar#3798,Corning)的孔。将板密封，并在37℃、400rpm、1”throw下孵育1h，然后分析。对于该测定，将100μL 200mM Tris、50mM苯丙氨酸pH 7.5和80μL 1M Tris pH7.5，或200mM磷酸钠/50mM苯丙氨酸pH 7.0和80μL1.0M磷酸钠pH 7.0，和20μL酸处理的裂解物加入到聚-丙烯酸酯96孔板(Costar#3635,Corning)的孔。将该反应物短暂混合，并且活性使用 Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在下表中提供。

用胃蛋白酶预处理的澄清的裂解物的HTP分析

在另一测定中，PAL变体用酸性条件和胃蛋白酶来刺激，以在模拟胃环境的条件下进一步测试变体。首先，将50μL在400mM柠檬酸钠pH1.5-4中的0.01-100mg/ml胃蛋白酶，和50μL澄清的裂解物加入到96孔圆底板(Costar#3798,Corning)的孔。将板密封，并在37℃、400rpm、1”throw下孵育1-12h，然后分析。对于该测定，将100μL 200mM Tris/50mM苯丙氨酸pH 7.5和80μL 1M Tris pH 7.5，或200mM磷酸钠/50mM苯丙氨酸pH 7.0和20μL酸处理的裂解物加入到聚-丙烯酸酯96孔板(Costar#3635,Corning)的孔。将该反应物短暂混合，并且活性使用 Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。

1.相对活性被计算为变体的活性/SEQ ID NO:4(由SEQ ID NO:3编码)的活性。

2.变体22号具有SEQ ID NO:7的多核苷酸序列和SEQ ID NO:8的多肽序列，且变体30号具有SEQ ID NO:5的多核苷酸序列和SEQ ID NO:6的多肽序列。

3.+＝0.1至1.0的相对于野生型AvPAL的相对活性；

++＝>1.0至2.0的相对于野生型AvPAL的相对活性；和

+++＝>2.0的相对于野生型AvPAL的相对活性。

1.相对活性被计算为变体的活性/变体30号的活性。

2.变体36号具有SEQ ID NO:9的多核苷酸序列和SEQ ID NO:10的多肽序列。

3.+＝>1.0至3.0的相对于变体30号的相对活性；

++＝>3.0至10的相对于变体30号的相对活性；和

+++＝>10至35的相对于变体30号的相对活性。

1.相对活性被计算为变体的活性/变体36号的活性。

2.变体42号具有SEQ ID NO:11的多核苷酸序列和SEQ ID NO:12的多肽序列，变体43号具有SEQ ID NO:13的多核苷酸序列和SEQ ID NO:14的多肽序列。

3.+＝>0.5至1.5的相对于变体36号的相对活性；

++＝>1.5至3的相对于变体36号的相对活性；和

+++＝>3至10的相对于变体36号的相对活性。

1.相对活性被计算为变体的活性/变体30号(变体53-73)或SEQ ID NO:4(由SEQID NO:3编码)(变体74-83)的活性。

2.+＝>0.5至1.5的相对于变体30号的相对活性；++＝>1.5至3的相对于变体30号的相对活性；和+++＝>3至10的相对于变体30号的相对活性。

1.相对活性被计算为变体的活性/变体42号的活性。

2.-<0,5的相对于变体42号的相对活性；+＝>0.5至1.5的相对于变体42号的相对活性；++＝>1.5至3的相对于变体42号的相对活性。

实施例3

确定PAL变体的蛋白聚集的测定

PAL变体聚集的倾向根据制造商的说明书使用蛋白聚集测定试剂盒(Enzo)来确定。简要地，将0-100μM的纯化的PAL与检测试剂(1:2000)混合，并通过流式细胞术分析。与聚集标准品一致地评价样品荧光，与如本领域已知的(参见例如，Bershtein等，Mol.Cell,,133-144[2013])。

实施例4

来自摇瓶(SF)培养物的冻干的裂解物

将如以上所描述的生长的选择的HTP培养物平铺在具有1％葡萄糖和30μg/ml氯霉素的LB琼脂平板上，并在37℃下生长过夜。将来自每个培养物的单菌落转移至50ml具有1％葡萄糖和30μg/ml氯霉素的LB。培养物在30℃、250rpm下生长18h，并以大约1:10的稀释在250ml具有30μg/ml氯霉素的Terrific肉汤中亚培养，至最终OD600为0.2。将培养物在30℃、250rpm下孵育135分钟，至OD 600为0.6，并用1mM IPTG诱导。诱导的培养物在30℃、250rpm下孵育20h。在该孵育期之后，将培养物以4000rpm x 10min离心。弃去上清液，将沉淀物重悬于30ml的50mM pH 7.5的磷酸钠中。使细胞沉淀(4000rpm×10min)，重悬于12ml 50mM pH7.5的磷酸钠中，并且使用One Shot Cell Disruption系统(Constant Systems)以17000psi裂解。使裂解物沉淀(10,000rpm×30min)，并将上清液冷冻并干燥以产生含酶的粉末。

来自摇瓶培养物的PAL的纯化

将PAL变体42号在摇瓶培养物中生长至饱和，如以上所述。将饱和的培养物通过离心(4000rpm×20min)沉淀，并在纯化之前将细胞沉淀物储存于-80℃。将细胞沉淀物在室温下解冻，并以5mL缓冲液/g细胞重悬于具有130mM NaCl pH 8的25mM Tris中。样品浆液使用具有110psi的压力设定的微流化器(microfluidizer)来裂解。将所得裂解物通过以10,000rpm离心1小时，随后通过0.2μm PES滤器(Millipore)过滤来澄清。

过滤后，在10mM Phe的存在或不存在下，将所得裂解物在70℃-85℃下加热1.5-2小时。将裂解物从热源移开，并在4℃下以10,000rpm离心1小时来澄清。然后将包含可溶性PAL的上清液通过0.2μm PES滤器过滤,然后装载到层析柱中。

将经热处理的包含80-100mg总蛋白的过滤的裂解物使用具有1.2M硫酸铵pH 8的25mM Tris稀释两倍。将样品装载到用具有0.6M硫酸铵pH 8的25mM Tris预平衡的HiPrep16/10苯基FF(hi sub)柱(GE Healthcare)上。在样品装载之后，将柱用三倍柱体积的相同缓冲液来洗涤，随后用一个柱体积的在pH 8的25mM Tris中的0.6M-0M硫酸铵的线性梯度洗涤。将紧密结合的PAL使用三倍柱体积的具有25mM Tris,pH 8的等度洗脱从柱上洗脱。将包含活性和纯PAL的级分汇集。

将来自苯基柱的纯化的PAL缓冲液交换入pH 8.5的0.5M Tris中，并浓缩。浓缩的PAL通过SDS-PAGE来分析，并发现以～60kDa条带存在。纯化的PAL样品使用0.45μm PES滤器来过滤，并储存在-80℃下直到准备使用。

实施例5

纯化的PAL和PAL变体的表征

在本实施例中，描述了进行的旨在表征野生型和变体PAL的测定。

对酸性pH的耐受性：

将包含PAL变体的冻干的粉末以2g/L溶解于pH 7.0的20mM磷酸钠中。然后，将50μL酶溶液与50μL 400mM柠檬酸(pH 4.0-5.2)或100mM磷酸钠混合，并将反应物在37℃以400rpm(1”throw)孵育1h。然后，将20μL溶液与80μL 1M磷酸钠pH 7.0和100μL 200mM Tris/50mM苯丙氨酸pH 7.5短暂混合。在酸性条件下的酶活性使用 Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在图2中示出。如图2中所示，与野生型PAL相比，变体30号和36号在pH约4至4.8下孵育之后保持更多的活性。

测定K_M：

为了评价变体PAL中的突变是否已改变了PAL变体对苯丙氨酸的亲和力，测定了野生型酶和变体36的米氏常数。首先，将100μL的100mM Tris pH 8.0中的15μg/ml PAL和100μL的在100mM Tris,pH 8.0中的0-32mM苯丙氨酸加入到聚-丙烯酸酯96孔平板(Costar#3625,Corning)的孔。将该反应物短暂混合，并且初始速率使用 Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。每个测试的PAL变体的K_M通过如本领域已知的将数据拟合为Lineweaver-Burke图来确定。结果在图3中示出。如所示的，野生型酶的K_M为74μM，且变体36的K_M为60μM。

氨基酸特异性：

一些苯丙氨酸解氨酶除了苯丙氨酸以外显示针对酪氨酸和/或组氨酸的活性。为了评价存在于PAL变体中的突变是否已改变了PAL变体对苯丙氨酸的特异性，评价了野生型酶和变体36对这三种氨基酸的活性。首先，将100μL在10mM磷酸钠pH 7.0中5g/L的含PAL的冻干粉末和100μL在200mM磷酸钠pH 7.5中的50mM苯丙氨酸或组氨酸或2.5mM酪氨酸加入到聚-丙烯酸酯96孔板(Costar#3635,Corning)的孔。将该溶液短暂混合，并且初始速率使用 Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在图4中示出。如所示的，未观察到WT酶或变体36号对组氨酸或酪氨酸的可检测的活性，表明这些酶是苯丙氨酸特异性的。

对猪和牛蛋白酶的耐受性：

将如实施例4所描述制备的PAL变体样品以2g/L溶解于100mM磷酸钠pH 7.0中。将猪胰蛋白酶和牛胰凝乳蛋白酶(均为100mg)溶解于2ml 100mM磷酸钠pH 7.0中，并在100mM磷酸钠中连续11次稀释2倍。然后，将80μL PAL变体酶溶液与20μL胰蛋白酶和胰凝乳蛋白酶溶液混合。将反应混合物在37℃下以400rpm(1”throw)孵育1h。然后，将20μL反应物与80μL水和100μL 100mM磷酸钠、50mM苯丙氨酸pH 7.0混合。将每种溶液短暂混合，并且活性使用 Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在图2中示出。如该图中所示，所有测试的变体与野生型PAL相比显示出改进的蛋白酶耐受性，变体36号针对蛋白水解最稳定。

对人蛋白酶的耐受性：

如以上所述，针对猪胰蛋白酶和牛胰凝乳蛋白酶筛选了一些进化的PAL变体以评价它们对通过在胃肠道中存在的酶的蛋白水解的耐受性。还使用人酶测试了一些进化的PAL变体，以确认它们耐受猪或牛酶的人同源物。在这些测定中，将WT PAL和变体36号的冻干的粉末(2.4g/L，在100mM磷酸钠pH 7.0中)与人类胰凝乳蛋白酶(Athens Research)0-80BTEE单位/ml或人胰蛋白酶(ProSpec)(0-10,000BAEE单位/ml)在37℃下孵育2h。然后，将100μL混合物加入到聚-丙烯酸酯96孔板(Costar#3635,Corning)的孔，随后加入100μL50mM苯丙氨酸、200mM磷酸钠pH 7.0。将溶液短暂混合，并且初始速率使用Plus³⁸⁴或(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在图5中示出。如图5中所示，变体36号比野生型PAL酶更稳定。

对胰腺粗提物的耐受性：

还测试了进化的PAL变体以确定其对胰腺酶的耐受性。WT PAL、变体36号、变体42号和变体43号的冻干的粉末(如实施例4所描述的制备；12g/L，在50mM磷酸钾pH 6.8中)与猪胰酶制剂(pancreatin)(4x Sigma-Aldrich，St.Louis，MO)以1:1混合，并在37℃下振荡(400rpm，1”throw)孵育多达23h。在指定的时间点，将反应物的10μL等分试样加入到在聚-丙烯酸酯96孔板(Costar#3635,Corning)的孔中的190μL 50mM苯丙氨酸、190mM磷酸钠pH7.0中。将反应物短暂混合，并且初始速率使用 Plus³⁸⁴或190(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在图6中示出。如图6中所示，在这些测定条件下，与野生型PAL酶相比，变体36号，变体42号和变体43号都显示显著的稳定性。

肠道去垢剂的影响：

还测试了进化的PAL变体以确定它们在肠道胆汁酸和脂肪酸的存在或不存在下对蛋白水解的敏感性，以评价这些酸是否影响它们的稳定性。将包含变体36号的冻干的粉末(如实施例4中描述的)以50μg/ml溶解于0-16mM牛磺胆酸钠、100mM磷酸钠pH 7.0中。将猪胰蛋白酶和牛胰凝乳蛋白酶(各80mg)溶解于2ml的100mM磷酸钠pH 7.0中，并在100mM磷酸钠中连续11次稀释2倍。对于测定，将50μL PAL溶液与50μL蛋白酶溶液混合。将混合物在37℃下以400rpm(1”throw)孵育1h。然后，将50μL混合物与150μL 200mM磷酸钠、50mM苯丙氨酸pH7.0混合。将每种反应物短暂混合，并且活性使用 Plus³⁸⁴或190(Molecular Devices)光吸收酶标仪通过在290nm处随时间推移(每12-20s一次，经过5-20min)追踪吸光度来确定。结果在图7中示出。如该图中所示的，添加的牛磺胆酸钠增加了变体36号对蛋白水解的敏感性。

实施例6

变体PAL的肠道稳定性

为了评价当其经过动物肠道时PAL变体的稳定性和活性，用纯化的酶变体强饲小鼠。将10-12周鼠龄和称重20-26g的健康C57B1/6小鼠维持在代谢笼中，并且禁食15h。随意提供水。禁食过夜后，使用21-gauge强饲针用0.3ml的0.5M Tris-HCl pH 8.5和在0.5MTris-HCl pH 8.5中的8mg/ml WT PAL(如实施例4中描述的制备)或在0.5M Tris-HCl pH8.5中的8mg/ml变体42号(如实施例4中所描述的制备)的混合物强饲动物。在强饲后0.5、2或6h，将动物断头，使用绿顶毛细血管血液收集管(Ram Scientific)收集血浆，并收集胃、十二指肠(距离胃～1-8cm)、空肠(距离胃～10-18cm)、回肠(盲肠以上～8cm)和结肠(盲肠以下～5cm)的内容物。记录这些内容物的重量，并在分析前将这些内容物储存在-80℃。

将胃或肠内容物用100mM磷酸钠pH 7.0稀释4X，短暂混合，并以14,000rpm x 2min离心。将上清液转移到350μL 0.45μΜAcroPrep^TM高级96-孔过滤板(Pall Corp)，并通过真空过滤去除颗粒。如前述实施例中所描述的评价澄清的滤液的酶活性并通过SDS-PAGE评价完整的PAL蛋白的存在。结果表明，与野生型PAL酶和阴性对照相比，进化的PAL变体的酶活性在十二指肠和空肠中显示是更高的。

实施例7

血浆苯丙氨酸的水平

评价从实施例6中所描述的小鼠收集的血浆样品，以确定所测试的小鼠的血液中存在的苯丙氨酸的量。将小鼠血浆(50μL)与250μL包含0.6mM dl-苯丙氨酸(环D₅)(即，包含与芳香族环碳原子键合的氘而非氢的同位素标记的版本的苯丙氨酸；Cambridge同位素实验室)的乙腈合并。将样品在RT下混合5min，在4℃下以3200x g离心10min，并将上清液转移至板用于样品分析。对于分析，将10μL每个样品注入进3200 LC/MS/MS系统(ABSciex)经过 C₁₈柱(150x 2.1mM,5μm珠子)(Supelco,现在Sigma-Aldrich)，用水中0.1％的甲酸(A)和乙腈(B)洗脱。跨5min梯度(t＝0，97％A；3min，50％A；3.5min，5％A；4min，97％A；5min，95％A)洗脱样品，寻找内源性苯丙氨酸的166至120的转变，和同位素标记的标准品的171至125的转变。结果表明，与野生型PAL酶和阴性对照相比，来自给予了进化的PAL变体(即，变体42号)的小鼠样品中的血浆苯丙氨酸水平在30分钟时间-点时是较低的。

实施例8

变体PAL的治疗功能

为了评价PAL变体是否降低体内的血清Phe水平，使用了PKU的小鼠模型。在这些实验中，将PAL蛋白强饲入受影响的动物。首先，通过从小鼠的饮食中去除苯丙氨酸三天，随后注射已知量的包含Phe的溶液来在小鼠中建立一致的基线Phe水平。将具有C57B1/6背景的3-至-6个月鼠龄的纯合PAH enu-2小鼠(参见，McDonald等，Proc.Natl.Acad.Sci.USA 87:1965-1967[1990])转移至无苯丙氨酸的饮食(TD.97152，Harlan)，具有在其饮用水中提供的0.03g/L Phe持续72h。在开始处理之前在时间＝0h时，将小鼠注射0.15mg/g体重的Phe(来自在水中的10g/L的Phe溶液)。注射后55分钟，通过尾部-静脉穿刺收集大约20μL血液，并点制在滤纸上。随后，在注射后时间1h、3h和5h时，将小鼠用0.3ml 50-100g/L WT AvPAL、WT AvPAL加抑肽酶、BSA或变体42号强饲。在注射后6h、7h和9h时，将另外的血液斑点收集在滤纸上。将血液斑点干燥并在使用本领域已知的方法进行Phe和Tyr水平的LC-MS/MS分析之前储存在-20℃(参见，Chase等，Clin.Chem.,39:66-71[1993])。

结果在图8中示出。如在该图中所示的，用无活性蛋白(BSA)强饲，导致增加的血清Phe水平。相比之下，用蛋白水解敏感的WT AvPAL的处理导致恒定的Phe-水平，而与蛋白酶抑制剂抑肽酶结合的相同蛋白导致Phe-水平的显著下降。该结果还表明，在蛋白酶抑制剂不存在下施用工程化-PAL变体42号导致降低的血清Phe水平。

实施例9

PAL的去免疫化

在此实施例中，描述了进行的旨在鉴定将T细胞表位从PAL中去除的多样性的实验。

去免疫化多样性的鉴定：

为了鉴定当突变时可去除T细胞表位的氨基酸，使用计算机方法鉴定预测引发T细胞应答的PAL序列。并行地，还进行了针对允许的、无害突变的实验探究，特别是针对在未刺激的测定(例如，在实施例2中描述的测定)中保持蛋白活性的氨基酸的实验探究。然后分析了活性变体以确定突变对预测的免疫原性的影响。

在变体AvPAL中计算机鉴定推定的T细胞表位：

使用如本领域已知的免疫表位数据库(IEDB；免疫表位数据库和分析资源网站(Immune Epitope Database and Analysis Resource website))工具和专有的统计分析工具(参见例如，iedb.org和Vita等，Nucl.Acids Res.,38(Database issue):D854-62[2010].Epub 2009Nov 11])鉴定了在AvPAL变体36号中推定的T细胞表位。将该AvPAL变体解析成所有可能的15-mer分析框架，与每个框架的最后14个氨基酸重叠。使用在IEDB网站上推荐的方法，通过针对与集体覆盖近95％的人类群体的八种常见的II类HLA-DR等位基因(DRB1*0101、DRB1*0301、DRB1*0401、DRB1*0701、DRB1*0801、DRB1*1101、DRB1*1301、和DRB1*1501)(参见例如，Southwood等，J.Immunol.,160:3363-3373[1998])的预测的结合对15-mer分析框架的9-mer核心区域进行评分，评价15-mer分析框架的免疫原性潜力。使用如本领域已知的统计分析工具鉴定了包含在变体AvPAL内的潜在的T-细胞表位簇(即，包含变体AvPAL内的具有异常高的免疫原性潜力的子区域)。将鉴定的T细胞表位簇针对已知表位的IEDB数据库和GenBank蛋白数据库进行筛选。这些筛选鉴定了在变体AvPAL变体36号中的10(十)个推定的T细胞表位。以下这些表位被称为TCE-I、II、III、IV、V、VI、VII、VIII、IX和X。

去免疫化文库的设计：

首先，创建了包含在如以上描述鉴定的10个推定的T细胞表位区域中的从用于创建变体AvPAL的定向进化轮鉴定出的所有中性和有益突变的组合文库。分析了这些突变对与八种常见的II类HLA-DR等位基因的预测结合的影响。预测多个突变去除或减少TCE-I、II、VI、VII。将这些突变结合到组合文库中。然后使用饱和诱变设计文库，以在剩余的六个T-细胞表位(即，TCE-III、IV、V、VIII、IX和X)内诱变每一个氨基酸。最后，创建了包含从靶向TCE-I、III、IV、VIII和X的多轮进化鉴定的有益多样性连同报道的影响PAL变体的聚集状态的C503和C565两个氨基酸的组合文库。使来自该文库的最佳击中经历靶向TCE-III和VIII的另外的饱和诱变和在几个位置处的另外的靶向的诱变。

去免疫化文库的构建和筛选：

如以上描述的设计的组合和饱和诱变文库通过本领域已知的方法来构建，并在如实施例2中所描述的未刺激的测定中测试活性。鉴定和测序活性变体。在以下表9-1至9-7中提供了关于AvPAL变体36号和许多AvPAL变体的活性和突变。

去免疫化多样性的鉴定：

通过评价活性变体与以上描述的八种常见的II类HLA-DR等位基因的结合分析了活性变体以确定它们的免疫原性水平。总免疫原性评分和免疫原性击中计数在表9-1至9-7中显示。总免疫原性评分反映了变体的整体预测的免疫原性(即，较高评分指示较高水平的预测的免疫原性)。免疫原性“击中计数”指示具有异常高的免疫原性潜力(即，较高的击中计数指示较高的免疫原性潜力)的15-mer分析框架的数目。具有较低的总的预测的免疫原性评分和/或免疫原性击中计数小于参考变体的免疫原性击中计数的突变被认为是“去免疫化突变”。将被鉴定为最佳的去免疫化突变重组以产生许多有活性的并预测比起始参考变体AvPAL具有显著更低的免疫原性的变体。在以下表中，FIOP结果来自未刺激的测定；对于总免疫原性评分(TIS)和免疫原性击中计数(IHC)，结果针对整个PAL蛋白(表9-1、9-8和9-9)或针对所指定的表位(表9-2至9-7)显示。

去免疫化的PAL变体的体外测试：

在树突T细胞测定中测试去免疫化的PAL变体，以经验性地测试其引发T细胞应答的能力。使用标准技术从人供体分离外周血单核细胞(PBMC)。将这些细胞用作在确定成分培养基中培养的单核细胞的来源，以产生未成熟的树突细胞。将这些未成熟的树突细胞(DC)装载去免疫化的PAL变体，并然后通过在确定成分培养基中进一步培养诱导成更成熟的表型，以提供抗原致敏的DC。将从与DC相同的供体样品中获得的CD8+T细胞耗尽的供体PBMC用CFSE来标记，然后与抗原致敏的DC培养7天，其后一式八份被测试。每个DC-T细胞培养物包括一组未经处理的对照组(即，阴性对照)。该测定还包括参考抗原对照(即，阳性对照)，包括两种有效的全蛋白抗原。利用从具有多样性主要组织相容性复合物II类等位基因的50个人供体分离的细胞的测定提供了PAL变体引发T细胞应答的能力的统计学相关的评价。

尽管已经参考具体的实施方案描述了本发明，可做出多种改变并且可替换等同物，以适应特定的情况、材料、物质的组成、方法、方法一个步骤或多个步骤，从而实现本发明的益处，而不偏离所要求保护的范围。

本公开内容中引用的每个和每一个出版物和专利文件通过引用被并入本文用于在美国的所有目的，如同每个这样的出版物或文件被明确和分别指出以通过引用并入本文一样。出版物和专利文件的引用不被认为是任何这样的文件是相关的现有技术的指示，也不构成对其内容或日期的承认。

序列表

<110> 科德克希思公司

吉伽特·W·哈思曼

尼古拉斯·J·阿加德

本杰明·米杰茨

乔纳森·弗罗姆

张希云

<120> 苯丙氨酸解氨酶多肽

<130> CX7-131WO2

<150> US 61/813,586

<151> 2013-04-18

<150> US 61/897,932

<151> 2013-10-31

<160> 33

<170> PatentIn版本3.5

<210> 1

<211> 7407

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 1

tctcatgttt gacagcttat catcgataag ctttaatgcg gtagtttatc acagttaaat 60

tgctaacgca gtcaggcacc gtgtatgaaa tctaacaatg cgctcatcgt catcctcggc 120

accgtcaccc tggatgctgt aggcataggc ttggttatgc cggtactgcc gggcctcttg 180

cgggatatcc ggatatagtt cctcctttca gcaaaaaacc cctcaagacc cgtttagagg 240

ccccaagggg ttatgctagt tattgctcag cggtggcagc agccaactca gcttcctttc 300

gggctttgtt agcagccgga tccttaatgc agacacggca gaatgtcctg aacggcctga 360

acaataacac caccggctgc aatatctgca ctaatacgtg caatatgttc atccagaccc 420

tgttcattat cattccaaat atacggacga tctgaggtcg gtttctgacc aacaacatga 480

cgaactgcgc tatacagacg ttcggttgcc ggtgacagac aggcacgtgc atcataatga 540

ccggtttttt tgtaggtacg cagatcaact gcctgaacac caaacatcag ggcaatggca 600

acataattct gaaaaatatc aacgctacga cgtgccaggg ttgcgctggt ataaccctgg 660

ctgttaatat tctggttaaa ctgttcggca tgggtcggaa aacgatctgc aatactatta 720

ccataaaagg tcagcagcgg cataatgcta ttaccgcaaa tctgcagacc tttcagaccc 780

atattaactt tacgttcacg attacccagc agactcggag gcagaccatt gctaaattcc 840

ggtgatgcca gcagtgcaat ctgaacatcc agatgttttg ccagcagacc gatataatag 900

cgcagatgat ccatacccat accaacatac tgacccagaa aattaccacc atgatagctt 960

gcctgattat caacatcaat cagcgggtta tcggtaacgc tgttaatctc aatttcgatt 1020

tgtttggcaa tctggctaat accatcaaca atcggaccca gatactgcgg cagacaacgc 1080

aggctataac gatcctggat cagttcatga tcacgataat catgtttacc atccagttca 1140

tcacgaacca gctggctatt ggccagcagg ctaatcatct gatctgctgc ccacagctga 1200

cccggatgcg gtttgctgtt atggataaac ggatgaaagc tctgatttgt accattcagt 1260

gcctgaatat ccagtgcatg aacacccatt gcaattgcgg tcagaatctg ggtatcataa 1320

acacaatttg ctgcaatacc ggtcataacg ctggtgccat tcatcattgc cagaccttct 1380

ttcggcagca gggtcagcgg actcagattc agctgacgca gtgcggtcgg tgcgtccatt 1440

tctttgccat taaaatcaac tttaaagctc gggtccaggc caatcaggct accggtaata 1500

tagctcagcg gaaccagatc accgctggca ccaatgctac caaattcata aacatacggg 1560

gtaacaccgg cattcagaaa gatttccatg cgtttaatca gttccagacg aataccgctt 1620

gcaccacgca tgtggctatt tgcacgcagc agcattgctg cacgaacatc tgccagcggc 1680

agtttattac ctgcaccggt tttcagaaac caaaccagat tggtctgcag ttcgcttgcc 1740

tgttcacggc taattgcaac atttgccata ccaccaaaac cgctggtaac accataaatc 1800

ggttcaccgc tttcaactgc attattgata taatcacagc tggcctgaat accctgcaga 1860

atatcggtat tattggtcag gctaaccagg gtgccattac gggcaacacg tgcaacatca 1920

ttgatggtca gtttctgatt accaataatc acatttgcgc tgctattgcc ggtaaagcta 1980

aactgctggc tgctggtttt gctctgtgcc tggctcaggg ttttcatatg acgaccttcg 2040

atatggccgc tgctgtgatg atgatgatga tgatgatgat gatggcccat ggtatatctc 2100

cttcttaaag ttaaacaaaa ttatttctag aggggaattg ttatccgctc acaattcccc 2160

tatagtgagt cgtattaatt tcgcgggatc gagatctcga tcctctacgc cggacgcatc 2220

gtggccggca tcaccggcgc cacaggtgcg gttgctggcg cctatatcgc cgacatcacc 2280

gatggggaag atcgggctcg ccacttcggg ctcatgagcg cttgtttcgg cgtgggtatg 2340

gtggcaggcc ccgtggccgg gggactgttg ggcgccatct ccttgcatgc accattcctt 2400

gcggcggcgg tgctcaacgg cctcaaccta ctactgggct gcttcctaat gcaggagtcg 2460

cataagggag agcgtcgaga tcccggacac catcgaatgg cgcaaaacct ttcgcggtat 2520

ggcatgatag cgcccggaag agagtcaatt cagggtggtg aatgtgaaac cagtaacgtt 2580

atacgatgtc gcagagtatg ccggtgtctc ttatcagacc gtttcccgcg tggtgaacca 2640

ggccagccac gtttctgcga aaacgcggga aaaagtggaa gcggcgatgg cggagctgaa 2700

ttacattccc aaccgcgtgg cacaacaact ggcgggcaaa cagtcgttgc tgattggcgt 2760

tgccacctcc agtctggccc tgcacgcgcc gtcgcaaatt gtcgcggcga ttaaatctcg 2820

cgccgatcaa ctgggtgcca gcgtggtggt gtcgatggta gaacgaagcg gcgtcgaagc 2880

ctgtaaagcg gcggtgcaca atcttctcgc gcaacgcgtc agtgggctga tcattaacta 2940

tccgctggat gaccaggatg ccattgctgt ggaagctgcc tgcactaatg ttccggcgtt 3000

atttcttgat gtctctgacc agacacccat caacagtatt attttctccc atgaagacgg 3060

tacgcgactg ggcgtggagc atctggtcgc attgggtcac cagcaaatcg cgctgttagc 3120

gggcccatta agttctgtct cggcgcgtct gcgtctggct ggctggcata aatatctcac 3180

tcgcaatcaa attcagccga tagcggaacg ggaaggcgac tggagtgcca tgtccggttt 3240

tcaacaaacc atgcaaatgc tgaatgaggg catcgttccc actgcgatgc tggttgccaa 3300

cgatcagatg gcgctgggcg caatgcgcgc cattaccgag tccgggctgc gcgttggtgc 3360

ggatatctcg gtagtgggat acgacgatac cgaagacagc tcatgttata tcccgccgtt 3420

aaccaccatc aaacaggatt ttcgcctgct ggggcaaacc agcgtggacc gcttgctgca 3480

actctctcag ggccaggcgg tgaagggcaa tcagctgttg cccgtctcac tggtgaaaag 3540

aaaaaccacc ctggcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 3600

aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3660

atgtaagtta gctcactcat taggcaccgg gatctcgacc gatgcccttg agagccttca 3720

acccagtcag ctccttccgg tgggcgcggg gcatgactat cgtcgccgca cttatgactg 3780

tcttctttat catgcaactc gtaggacagg tgccggcagc gctctgggtc attttcggcg 3840

aggaccgctt tcgctggagc gcgacgatga tcggcctgtc gcttgcggta ttcggaatct 3900

tgcacgccct cgctcaagcc ttcgtcactg gtcccgccac caaacgtttc ggcgagaagc 3960

aggccattat cgccggcatg gcggccgacg cgctgggcta cgtcttgctg gcgttcgcga 4020

cgcgaggctg gatggccttc cccattatga ttcttctcgc ttccggcggc atcgggatgc 4080

ccgcgttgca ggccatgctg tccaggcagg tagatgacga ccatcaggga cagcttcaag 4140

gatcgctcgc ggctcttacc agcctaactt cgatcactgg accgctgatc gtcacggcga 4200

tttatgccgc ctcggcgagc acatggaacg ggttggcatg gattgtaggc gccgccctat 4260

accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 4320

tggaagccgg cggcacctcg ctaacggatt caccactcca agaattggag ccaatcaatt 4380

cttgcggaga actgtgaatg cgcaaaccaa cccttggcag aacatatcca tcgcgtccgc 4440

catctccagc agccgcacgc ggcgcatctc gggcagcgtt gggtcctggc cacgggtgcg 4500

catgatcgtg ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc ttactggtta 4560

gcagaatgaa tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca aaacgtctgc 4620

gacctgagca acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg 4680

gaagtcagcg ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc 4740

ctgtggaaca cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct 4800

ctggtcccgc cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc 4860

atgttcatca tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac 4920

ccccatgaac agaaatcccc cttacacgga ggcatcagtg accaaacagg aaaaaaccgc 4980

ccttaacatg gcccgcttta tcagaagcca gacattaacg cttctggaga aactcaacga 5040

gctggacgcg gatgaacagg cagacatctg tgaatcgctt cacgaccacg ctgatgagct 5100

ttaccgcagc tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct 5160

cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg 5220

cgcgtcagcg ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag 5280

cggagtgtat actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat 5340

atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt 5400

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 5460

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 5520

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 5580

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 5640

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 5700

ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 5760

tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 5820

agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 5880

atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 5940

acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6000

actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 6060

tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6120

tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6180

tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 6240

tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 6300

caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 6360

cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 6420

agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 6480

acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 6540

gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 6600

ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca 6660

tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 6720

ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 6780

tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 6840

attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 6900

agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg 6960

ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7020

ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7080

cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7140

gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7200

tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 7260

tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 7320

tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta 7380

tcacgaggcc ctttcgtctt caagaat 7407

<210> 2

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 2

atgaaaaccc tgagccaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcacgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gcaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccaat agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatca tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctgct gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcctgtc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga cctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgtgtctgca t 1701

<210> 3

<211> 1701

<212> DNA

<213> 多变鱼腥藻(Anabaena variabilis)

<400> 3

atgaaaaccc tgagccaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcacgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gcaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccaat agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatca tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctgct gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcctgtc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga cctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgtgtctgca t 1701

<210> 4

<211> 567

<212> PRT

<213> 多变鱼腥藻

<400> 4

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Ala Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Ala Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Asn Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp His Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Leu Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Cys Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Thr Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Cys Leu His

565

<210> 5

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 5

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgtacgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcagggact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatca tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg tatcaccgga atttaacaat 1200

ggtctgcctg cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcctgtc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagtatccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgtgtctgca t 1701

<210> 6

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 6

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Val Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Gly

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp His Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Val Ser Pro Glu Phe Asn Asn

385 390 395 400

Gly Leu Pro Ala Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Cys Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Tyr Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Cys Leu His

565

<210> 7

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 7

atgaaaaccc tgagccaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcacgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gcaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccaat agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctgct gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcctgtc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga cctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgtgtctgca t 1701

<210> 8

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 8

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Ala Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Ala Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Asn Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Leu Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Cys Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Thr Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Cys Leu His

565

<210> 9

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 9

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgtacgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcctgtc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgtgtctgca t 1701

<210> 10

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 10

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Val Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Cys Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Cys Leu His

565

<210> 11

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 11

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgtacgt 120

gttgcccgta atggcaccct ggttagcctg accaataata aagatattct gcagcgtatt 180

caggccagct gtgattatat caataatgca gttgaaaaag gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atatggatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

aaaaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgccgctgca t 1701

<210> 12

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 12

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Val Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Lys Asp Ile Leu Gln Arg Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Lys Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Met Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Lys Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Pro Leu His

565

<210> 13

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 13

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgtacgt 120

gttgcccgta atggcaccct ggttagcctg accaataata aagatattct gcagcgtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atatggatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

aaaaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgaacctgca t 1701

<210> 14

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 14

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Val Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Lys Asp Ile Leu Gln Arg Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Met Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Lys Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Asn Leu His

565

<210> 15

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 15

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcgcgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc atggtgcaag cggtattcgt 420

ctggaactga ttaaacgcgc ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ggcctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat attggccaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgaacctgca t 1701

<210> 16

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 16

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Ala Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met His Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Ala Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Gly Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Gly Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Asn Leu His

565

<210> 17

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 17

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcgcgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc atggtgcaag cggtattcgt 420

ctggaactga ttaaacgcgc ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ggcctggcaa aacatctgga tacccagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat attggccaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgaacctgca t 1701

<210> 18

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 18

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Ala Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met His Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Ala Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Gly Leu Ala Lys

370 375 380

His Leu Asp Thr Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Gly Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Asn Leu His

565

<210> 19

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 19

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcgcgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc atggtgcaag cggtattcgt 420

ctggaactga ttaaacgcgc ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta tgaaatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat attggccaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgaacctgca t 1701

<210> 20

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 20

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Ala Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met His Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Ala Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Glu Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Gly Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Asn Leu His

565

<210> 21

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 21

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcgcgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc atggtgcaag cggtattcgt 420

ctggaactga ttaaacgcgc ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta tgaaatcggt 1140

ctgctggcaa aacatctgga tacccagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat attggccaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgaacctgca t 1701

<210> 22

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 22

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Ala Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met His Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Ala Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Glu Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Thr Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Gly Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Asn Leu His

565

<210> 23

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 23

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ccataccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgtacgt 120

gttgcccgta atggcaccgc ggttagcctg accaataata aagatattct gcagcgtatt 180

caggccagct gtgattatat caataatgca gttgaaaaag gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcat ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc agccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atatggatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ctgctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat atttttcaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

aaaaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgccgctgca t 1701

<210> 24

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 24

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser His Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Val Arg Val Ala Arg Asn Gly Thr Ala Val

35 40 45

Ser Leu Thr Asn Asn Lys Asp Ile Leu Gln Arg Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Lys Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Gln Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Met Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Lys Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Pro Leu His

565

<210> 25

<211> 1701

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 25

atgaaaaccc tgagtcaggc acagagcaaa accagcagcc agcagtttag ctttaccggc 60

aatagcagcg caaatgtgat tattggtaat cagaaactga ccatcaatga tgttgcgcgt 120

gttgcccgta atggcaccct ggttagcctg accaataata ccgatattct gcagggtatt 180

caggccagct gtgattatat caataatgca gttgaaagcg gtgaaccgat ttatggtgtt 240

accagcggtt ttggtggtat ggcaaatgtt gtaattagcc gtgaacaggc aagcgaactg 300

cagaccaatc tggtttggtt tctgaaaacc ggtgcaggta ataaactgcc gctggcagat 360

gttcgtgcag caatgctgct gcgtgcaaat agccacatgc gtggtgcaag cggtattcgt 420

ctggaactga ttaaacgcgc ggaaatcttt ctgaatgccg gtgttacccc gtatgtttat 480

gaatttggta gcattggtgc cagcggtgat ctggttccgc tgagctatat taccggtagc 540

ctgattggcc tggacccgag ctttaaagtt gattttaatg gcaaagaaat ggacgcaccg 600

accgcactgc gtcagctgaa tctgagtccg ctgaccctgc tgccgaaaga aggtctggca 660

atgatgaatg gcaccagcgt tatgaccggt attgcagcaa attgtgttta tgatacccag 720

attctgaccg caattgcaat gggtgttcat gcactggata ttcaggcact gaatggtaca 780

aatcagagct ttcatccgtt tatccataac agcaaaccgc atccgggtca gctgtgggca 840

gcagatcaga tgattagcct gctggccggt agccagctgg ttcgtgatga actggatggt 900

aaacatgatt atcgtgatgg tgaactgatc caggatcgtt atagcctgcg ttgtctgccg 960

cagtatctgg gtccgattgt tgatggtatt agccagattg ccaaacaaat cgaaattgag 1020

attaacagcg ttaccgataa cccgctgatt gatgttgata atcaggcaag ctatcatggt 1080

ggtaattttc tgggtcagta tgttggtatg ggtatggatc atctgcgcta ttatatcggt 1140

ggcctggcaa aacatctgga tgttcagatt gcactgctgg catcaccgga atttagcaat 1200

ggtctgcctc cgagtctggt gggtaatcgt gaacgtaaag ttaatatggg tctgaaaggt 1260

ctgcagattt gcggtaatag cattatgccg ctgctgacct tttatggtaa tagtattgca 1320

gatcgttttc cgacccatgc cgaacagttt aaccagaata ttaacagcca gggttatacc 1380

agcgcaaccc tggcacgtcg tagcgttgat attggccaga attatgttgc cattgccctg 1440

atgtttggtg ttcaggcagt tgatctgcgt acctacaaaa aaaccggtca ttatgatgca 1500

cgtgcccagc tgtcaccggc aaccgaacgt ctgtatagcg cagttcgtca tgttgttggt 1560

cagaaaccga gctcagatcg tccgtatatt tggaatgata atgaacaggg tctggatgaa 1620

catattgcac gtattagtgc agatattgca gccggtggtg ttattgttca ggccgttcag 1680

gacattctgc cgaacctgca t 1701

<210> 26

<211> 567

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 26

Met Lys Thr Leu Ser Gln Ala Gln Ser Lys Thr Ser Ser Gln Gln Phe

1 5 10 15

Ser Phe Thr Gly Asn Ser Ser Ala Asn Val Ile Ile Gly Asn Gln Lys

20 25 30

Leu Thr Ile Asn Asp Val Ala Arg Val Ala Arg Asn Gly Thr Leu Val

35 40 45

Ser Leu Thr Asn Asn Thr Asp Ile Leu Gln Gly Ile Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ser Glu Leu Gln Thr Asn Leu Val Trp Phe Leu Lys Thr Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Met Arg Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Ala Glu Ile Phe Leu Asn Ala Gly Val Thr Pro Tyr Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ser Leu Ile Gly Leu Asp Pro Ser Phe Lys Val Asp Phe

180 185 190

Asn Gly Lys Glu Met Asp Ala Pro Thr Ala Leu Arg Gln Leu Asn Leu

195 200 205

Ser Pro Leu Thr Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Thr Gln

225 230 235 240

Ile Leu Thr Ala Ile Ala Met Gly Val His Ala Leu Asp Ile Gln Ala

245 250 255

Leu Asn Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Asn Ser Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Ala Ala Asp Gln Met Ile Ser Leu Leu

275 280 285

Ala Gly Ser Gln Leu Val Arg Asp Glu Leu Asp Gly Lys His Asp Tyr

290 295 300

Arg Asp Gly Glu Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Leu Gly Pro Ile Val Asp Gly Ile Ser Gln Ile Ala Lys Gln

325 330 335

Ile Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Asp Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Met Gly Met Asp His Leu Arg Tyr Tyr Ile Gly Gly Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Leu Leu Ala Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Arg Glu Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Cys Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Thr Ser Ala Thr Leu

450 455 460

Ala Arg Arg Ser Val Asp Ile Gly Gln Asn Tyr Val Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Lys Thr Gly

485 490 495

His Tyr Asp Ala Arg Ala Gln Leu Ser Pro Ala Thr Glu Arg Leu Tyr

500 505 510

Ser Ala Val Arg His Val Val Gly Gln Lys Pro Ser Ser Asp Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Gly Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Ala Gly Gly Val Ile Val Gln Ala Val Gln

545 550 555 560

Asp Ile Leu Pro Asn Leu His

565

<210> 27

<211> 4945

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<220>

<221> misc_feature

<222> (140)..(142)

<223> n是a、c、g或t

<220>

<221> misc_feature

<222> (1758)..(1758)

<223> n是a、c、g或t

<220>

<221> misc_feature

<222> (1761)..(1762)

<223> n是a、c、g或t

<220>

<221> misc_feature

<222> (1781)..(1781)

<223> n是a、c、g或t

<220>

<221> misc_feature

<222> (1784)..(1784)

<223> n是a、c、g或t

<220>

<221> misc_feature

<222> (1786)..(1786)

<223> n是a、c、g或t

<400> 27

tggccaccat caccatcacc attagggaag agcagatggg caagcttgac ctgtgaagtg 60

aaaaatggcg cacattgtgc gacatttttt tttgaattct acgtaaaaag cagccgatac 120

atcggctgct ttttttttgn nngaggttcc aacttgtggt ataatgaaat aagatcactc 180

cggagcgtat tttttgagtt atcgagattt tcaggagcta aggaggaact aaaatggaga 240

aaaaaatcac tggatatacc accgttgata tatcccaatg gcatcgtaaa gaacattttg 300

aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg gatattacgg 360

cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt attcacattc 420

ttgcccgcct gatgaatgct catccggagt tccgtatggc aatgaaagac ggtgagctgg 480

tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact gaaacgtttt 540

catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata tattcgcaag 600

atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt gagaatatgt 660

ttttcgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac gtggccaata 720

tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa ggcgacaagg 780

tgctgatgcc gctggcgatt caggttcatc atgccgtctg tgatggcttc catgtcggca 840

gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg taactgcagg 900

agctcaaaca gcagcctgta ttcaggctgc ttttttcgtt ttggtctgcg cgtaatctct 960

tgctctgaaa acgaaaaaac cgccttgcag ggcggttttt cgaaggttct ctgagctacc 1020

aactctttga accgaggtaa ctggcttgga ggagcgcagt caccaaaact tgtcctttca 1080

gtttagcctt aaccggcgca tgacttcaag actaactcct ctaaatcaat taccagtggc 1140

tgctgccagt ggtgcttttg catgtctttc cgggttggac tcaagacgat agttaccgga 1200

taaggcgcag cggtcggact gaacgggggg ttcgtgcata cagtccagct tggagcgaac 1260

tgcctacccg gaactgagtg tcaggcgtgg aatgagacaa acgcggccat aacagcggaa 1320

tgacaccggt aaaccgaaag gcaggaacag gagagcgcac gagggagccg ccagggggaa 1380

acgcctggta tctttatagt cctgtcgggt ttcgccacca ctgatttgag cgtcagattt 1440

cgtgatgctt gtcagggggg cggagcctat ggaaaaacgg ctttgccgcg gccctctcac 1500

ttccctgtta agtatcttcc tggcatcttc caggaaatct ccgccccgtt cgtaagccat 1560

ttccgctcgc cgcagtcgaa cgaccgagcg tagcgagtca gtgagcgagg aagcggaata 1620

tatcctgtat cacatattct gctgacgcac cggtgcagcc ttttttctcc tgccacatga 1680

agcacttcac tgacaccctc atcagtgaac caccgctggt agcggtggtt tttttaggcc 1740

tatggccttt tttttttntg nnaaaccttt cgcggtatgg natnanagcg cccggaagag 1800

agtcaattaa gagggtggtg aatgtgaaac cagtaacgtt atacgatgtc gcagagtatg 1860

ccggtgtctc ttatcagacc gtttcccgcg tggtgaacca ggccagccac gtttctgcga 1920

aaacgcggga aaaagtggaa gcggcgatgg cggagctgaa ttacattccc aaccgcgtgg 1980

cacaacaact ggcgggcaaa cagtcgttgc tgattggcgt tgccacctcc agtctggccc 2040

tgcacgcgcc gtcgcaaatt gtcgcggcga ttaaatctcg cgccgatcaa ctgggtgcca 2100

gcgtggtggt gtcgatggta gaacgaagcg gcgtcgaagc ctgtaaagcg gcggtgcaca 2160

atcttctcgc gcaacgcgtc agtgggctga tcattaacta tccgctggat gaccaggatg 2220

ccattgctgt ggaagctgcc tgcactaatg ttccggcgtt atttcttgat gtctctgacc 2280

agacacccat caacagtatt attttctccc atgaagacgg tacgcgactg ggcgtggagc 2340

atctggtcgc attgggtcac cagcaaatcg cgctgttagc gggcccatta agttctgtct 2400

cggcgcgtct gcgtctggct ggctggcata aatatctcac tcgcaatcaa attcagccga 2460

tagcggaacg ggaaggcgac tggagtgcca tgtccggttt tcaacaaacc atgcaaatgc 2520

tgaatgaggg catcgttccc actgcgatgc tggttgccaa cgatcagatg gcgctgggcg 2580

caatgcgcgc cattaccgag tccgggctgc gcgttggtgc ggacatctcg gtagtgggat 2640

acgacgatac cgaagacagc tcatgttata tcccgccgtt aaccaccatc aaacaggatt 2700

ttcgcctgct ggggcaaacc agcgtggacc gcttgctgca actctctcag ggccaggcgg 2760

tgaagggcaa tcagctgttg cccgtctcac tggtgaaaag aaaaaccacc ctggcgccca 2820

atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg 2880

tttcccgact ggaaagcggg cagtgagcgg tacccgataa aagcggcttc ctgacaggag 2940

gccgttttgt ttctcgagtt aattaaggca gtgagcgcaa cgcaattaat gtgagttagc 3000

tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 3060

ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac ggattcactg 3120

gccgtcgttt tacaatctag aggccagcct ggccataagg agatatacat atgggccatc 3180

atcatcatca tcatcatcat catcacagca gcggccatat cgaaggtcgt catatgaaaa 3240

ccctgagcca ggcacagagc aaaaccagca gccagcagtt tagctttacc ggcaatagca 3300

gcgcaaatgt gattattggt aatcagaaac tgaccatcaa tgatgttgca cgtgttgccc 3360

gtaatggcac cctggttagc ctgaccaata ataccgatat tctgcagggt attcaggcca 3420

gctgtgatta tatcaataat gcagttgaaa gcggtgaacc gatttatggt gttaccagcg 3480

gttttggtgg tatggcaaat gttgcaatta gccgtgaaca ggcaagcgaa ctgcagacca 3540

atctggtttg gtttctgaaa accggtgcag gtaataaact gccgctggca gatgttcgtg 3600

cagcaatgct gctgcgtgca aatagccaca tgcgtggtgc aagcggtatt cgtctggaac 3660

tgattaaacg catggaaatc tttctgaatg ccggtgttac cccgtatgtt tatgaatttg 3720

gtagcattgg tgccagcggt gatctggttc cgctgagcta tattaccggt agcctgattg 3780

gcctggaccc gagctttaaa gttgatttta atggcaaaga aatggacgca ccgaccgcac 3840

tgcgtcagct gaatctgagt ccgctgaccc tgctgccgaa agaaggtctg gcaatgatga 3900

atggcaccag cgttatgacc ggtattgcag caaattgtgt ttatgatacc cagattctga 3960

ccgcaattgc aatgggtgtt catgcactgg atattcaggc actgaatggt acaaatcaga 4020

gctttcatcc gtttatccat aacagcaaac cgcatccggg tcagctgtgg gcagcagatc 4080

agatgattag cctgctggcc aatagccagc tggttcgtga tgaactggat ggtaaacatg 4140

attatcgtga tcatgaactg atccaggatc gttatagcct gcgttgtctg ccgcagtatc 4200

tgggtccgat tgttgatggt attagccaga ttgccaaaca aatcgaaatt gagattaaca 4260

gcgttaccga taacccgctg attgatgttg ataatcaggc aagctatcat ggtggtaatt 4320

ttctgggtca gtatgttggt atgggtatgg atcatctgcg ctattatatc ggtctgctgg 4380

caaaacatct ggatgttcag attgcactgc tggcatcacc ggaatttagc aatggtctgc 4440

ctccgagtct gctgggtaat cgtgaacgta aagttaatat gggtctgaaa ggtctgcaga 4500

tttgcggtaa tagcattatg ccgctgctga ccttttatgg taatagtatt gcagatcgtt 4560

ttccgaccca tgccgaacag tttaaccaga atattaacag ccagggttat accagcgcaa 4620

ccctggcacg tcgtagcgtt gatatttttc agaattatgt tgccattgcc ctgatgtttg 4680

gtgttcaggc agttgatctg cgtacctaca aaaaaaccgg tcattatgat gcacgtgcct 4740

gtctgtcacc ggcaaccgaa cgtctgtata gcgcagttcg tcatgttgtt ggtcagaaac 4800

cgacctcaga tcgtccgtat atttggaatg ataatgaaca gggtctggat gaacatattg 4860

cacgtattag tgcagatatt gcagccggtg gtgttattgt tcaggccgtt caggacattc 4920

tgccgtgtct gcattaaggc caaac 4945

<210> 28

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 28

ctagaggcca gcctggccat aaggagatat acatatgaaa accctgagcc aggcac 56

<210> 29

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 29

gatggtgatg gtggccagtt tggccttaat gcagacacgg cagaatg 47

<210> 30

<211> 569

<212> PRT

<213> 点状念珠藻(Nostoc punctiforme)

<400> 30

Met Asn Ile Thr Ser Leu Gln Gln Asn Ile Thr Arg Ser Trp Gln Ile

1 5 10 15

Pro Phe Thr Asn Ser Ser Asp Ser Ile Val Thr Val Gly Asp Arg Asn

20 25 30

Leu Thr Ile Asp Glu Val Val Asn Val Ala Arg His Gly Thr Gln Val

35 40 45

Arg Leu Thr Asp Asn Ala Asp Val Ile Arg Gly Val Gln Ala Ser Cys

50 55 60

Asp Tyr Ile Asn Asn Ala Val Glu Thr Ala Gln Pro Ile Tyr Gly Val

65 70 75 80

Thr Ser Gly Phe Gly Gly Met Ala Asp Val Val Ile Ser Arg Glu Gln

85 90 95

Ala Ala Glu Leu Gln Thr Asn Leu Ile Trp Phe Leu Lys Ser Gly Ala

100 105 110

Gly Asn Lys Leu Ser Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Leu Tyr Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Gln Arg Ile Glu Thr Phe Leu Asn Ala Gly Val Thr Pro His Val Tyr

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ser Tyr

165 170 175

Ile Thr Gly Ala Leu Ile Gly Leu Asp Pro Ser Phe Thr Val Asp Phe

180 185 190

Asp Gly Lys Glu Met Asp Ala Val Thr Ala Leu Ser Arg Leu Gly Leu

195 200 205

Pro Lys Leu Gln Leu Gln Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Tyr Asp Ala Lys

225 230 235 240

Val Leu Leu Ala Leu Thr Met Gly Val His Ala Leu Ala Ile Gln Gly

245 250 255

Leu Tyr Gly Thr Asn Gln Ser Phe His Pro Phe Ile His Gln Cys Lys

260 265 270

Pro His Pro Gly Gln Leu Trp Thr Ala Asp Gln Met Phe Ser Leu Leu

275 280 285

Lys Asp Ser Ser Leu Val Arg Glu Glu Leu Asp Gly Lys His Glu Tyr

290 295 300

Arg Gly Lys Asp Leu Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Ala

305 310 315 320

Gln Phe Ile Gly Pro Ile Val Asp Gly Val Ser Glu Ile Thr Lys Gln

325 330 335

Ile Glu Val Glu Met Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Glu Asn Gln Val Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val

355 360 365

Gly Val Thr Met Asp Arg Leu Arg Tyr Tyr Ile Gly Leu Leu Ala Lys

370 375 380

His Ile Asp Val Gln Ile Ala Leu Leu Val Ser Pro Glu Phe Ser Asn

385 390 395 400

Gly Leu Pro Pro Ser Leu Val Gly Asn Ser Asp Arg Lys Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Ser Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Ser Phe Tyr Gly Asn Ser Leu Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Phe Asn Gln Asn Ile Asn Ser Gln Gly Tyr Ile Ser Ala Asn Leu

450 455 460

Thr Arg Arg Ser Val Asp Ile Phe Gln Asn Tyr Met Ala Ile Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ala Val Asp Leu Arg Thr Tyr Lys Met Lys Gly

485 490 495

His Tyr Asp Ala Arg Thr Cys Leu Ser Pro Asn Thr Val Gln Leu Tyr

500 505 510

Thr Ala Val Cys Glu Val Val Gly Lys Pro Leu Thr Ser Val Arg Pro

515 520 525

Tyr Ile Trp Asn Asp Asn Glu Gln Cys Leu Asp Glu His Ile Ala Arg

530 535 540

Ile Ser Ala Asp Ile Ala Gly Gly Gly Leu Ile Val Gln Ala Val Glu

545 550 555 560

His Ile Phe Ser Ser Leu Lys Ser Thr

565

<210> 31

<211> 571

<212> PRT

<213> 胶须藻属(Rivularia sp.)PCC 7116

<400> 31

Met Asn Thr Val Arg Leu Thr Lys Asn Thr Val Ser Gln Lys Ser Phe

1 5 10 15

Ser Phe Leu Asn Asn Ser Asp Ala Ser Val Ile Val Gly Asp Arg Gln

20 25 30

Leu Thr Ile Glu Glu Val Val Ser Val Ala Arg Tyr Arg Ala Arg Val

35 40 45

Lys Leu Thr Glu Asn Leu Glu Lys Leu Ala Asn Val Gln Ala Ser Cys

50 55 60

Asp Phe Ile Arg Asp Ala Val Glu Ser Gly Glu Pro Ile Tyr Gly Val

65 70 75 80

Thr Thr Gly Phe Gly Gly Met Ala Asn Val Val Ile Ser Pro Glu Ser

85 90 95

Ala Thr Leu Leu Gln Asn Asn Leu Met Cys Tyr His Lys Val Gly Ala

100 105 110

Gly Asn Lys Leu Pro Leu Ala Asp Val Arg Ala Ala Met Leu Leu Arg

115 120 125

Ala Asn Ser His Val Ala Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile

130 135 140

Lys Arg Met Leu Ile Phe Leu Asn Ala Gly Val Thr Pro His Val Pro

145 150 155 160

Glu Phe Gly Ser Ile Gly Ala Ser Gly Asp Leu Thr Pro Leu Ala Tyr

165 170 175

Ile Ser Gly Ala Leu Ile Gly Leu Asn Ser Ser Tyr Ile Val Asp Phe

180 185 190

Asp Gly Glu Glu Met Asp Ala Pro Thr Ala Leu Gln Lys Leu Gly Leu

195 200 205

Glu Pro Leu Gln Leu Leu Pro Lys Glu Gly Leu Ala Met Met Asn Gly

210 215 220

Thr Ser Val Met Thr Gly Ile Ala Ala Asn Cys Val Gln Asp Thr Arg

225 230 235 240

Ile Leu Leu Ala Leu Ser Val Ala Thr His Ala Leu Thr Ile Gln Gly

245 250 255

Leu Glu Gly Thr Asn Gln Ser Phe His Glu Tyr Ile His Lys Leu Lys

260 265 270

Pro His Ser Gly Gln Ile Trp Ala Ala Ser Gln Met Leu Glu Leu Leu

275 280 285

Ala Gly Ser Gly Leu Ile Arg Asp Glu Leu Asp Gly Ser His Asp Tyr

290 295 300

Arg Gly Lys Asn Pro Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro

305 310 315 320

Gln Tyr Met Gly Pro Ile Val Asp Gly Ile Glu Asp Ile Ala Lys Gln

325 330 335

Val Glu Ile Glu Ile Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Val

340 345 350

Glu Asn Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Ile

355 360 365

Gly Val Gly Met Asp Arg Leu Arg Tyr His Ile Gly Met Leu Ala Lys

370 375 380

His Leu Asp Val Gln Ile Ala Tyr Leu Val Ala Pro Glu Phe Asn Asn

385 390 395 400

Gly Leu Ser Pro Ser Leu Val Gly Asn Gln Gln Arg Thr Val Asn Met

405 410 415

Gly Leu Lys Gly Leu Gln Ile Thr Gly Asn Ser Ile Met Pro Leu Leu

420 425 430

Thr Phe Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu

435 440 445

Gln Tyr Asn Gln Asn Ile Asn Ser Gln Gly Phe Ala Ser Ala Asn Leu

450 455 460

Ala Arg Thr Ser Val Glu Ile Phe Gln Gln Tyr Ile Ala Leu Ala Leu

465 470 475 480

Met Phe Gly Val Gln Ser Val Asp Leu Arg Thr Tyr Ala Ile Ala Gly

485 490 495

His Tyr Asp Ala Arg Ala Thr Leu Ser Pro Ala Thr Gln Asp Leu Tyr

500 505 510

Met Ala Val Arg Asn Val Val Gly Arg Pro Pro Ser Lys Glu Arg Ala

515 520 525

Tyr Ile Trp Asp Asp Asn Glu Gln Gly Leu Asp Ser His Ile Ser Lys

530 535 540

Ile Ala Asp Asp Ile Ala Tyr Gly Gly Gln Ile Val Thr Ala Ile Ser

545 550 555 560

Glu Val Leu Ser Ala Leu Lys Ser Val Asn Asn

565 570

<210> 32

<211> 565

<212> PRT

<213> 颤藻属(Oscillatoria sp.)PCC 6506

<400> 32

Met Ser Thr Asn Leu Thr Glu Pro Ile Ser Gln Lys Leu Leu Gln Trp

1 5 10 15

Leu Glu Pro Asn Leu Ser Ala Val Ile Val Gly Asn Arg Arg Leu Ser

20 25 30

Val Glu Glu Val Ala Arg Val Ala Arg Cys Gly Thr Arg Val Arg Leu

35 40 45

Asn Asp Glu Ser Asp Val Ala Glu Arg Val Gln Ala Ser Cys Asp Tyr

50 55 60

Ile Thr Asp Ala Val Glu Ser Gly Lys Ala Ile Tyr Gly Val Thr Thr

65 70 75 80

Gly Phe Gly Gly Met Ala Asn Thr Glu Ile Ala Pro Glu Glu Ala Ala

85 90 95

Ser Leu Gln Asn Asn Leu Ile Trp Phe Leu Lys Ala Gly Ala Gly Gln

100 105 110

Lys Leu Pro Thr Ala Cys Val Arg Ala Ala Met Leu Leu Arg Ile Asn

115 120 125

Ser His Leu Gln Gly Ala Ser Gly Ile Arg Leu Glu Leu Ile Lys Arg

130 135 140

Met Ile Val Phe Leu Asn Ala Gly Val Thr Pro His Val Cys Glu Leu

145 150 155 160

Gly Ser Ile Gly Ala Ser Gly Asp Leu Val Pro Leu Ala Gln Ile Thr

165 170 175

Gly Ala Leu Ile Gly Leu Asp Asp Ser Phe Thr Val Asp Phe Asn Gly

180 185 190

Arg Glu Met Ser Ala Ile Gln Ala Leu Glu Leu Leu Asp Leu Pro Lys

195 200 205

Ile Asp Leu Arg Pro Lys Glu Gly Leu Ala Met Val Asn Gly Thr Ser

210 215 220

Val Met Thr Gly Ile Ala Ala Asn Cys Val Arg Asp Ser Gln Val Met

225 230 235 240

Leu Ala Leu Ala Met Gly Thr His Ala Leu Met Ile Gln Gly Leu Gly

245 250 255

Ala Thr Asn Gln Ser Phe His Pro Phe Ile His Lys Leu Lys Pro His

260 265 270

Phe Gly Gln Val Trp Ala Ala Ser Gln Met Val Glu Leu Leu Ala Gly

275 280 285

Ser Cys Leu Asn Arg Asp Glu Leu Asp Gly Gln His Asp Ala Arg Gly

290 295 300

Glu His Pro Ile Gln Asp Arg Tyr Ser Leu Arg Cys Leu Pro Gln Tyr

305 310 315 320

Ile Gly Pro Ile Val Asp Gly Ile Ala Glu Ile Ala Gln Gln Ile Glu

325 330 335

Val Glu Val Asn Ser Val Thr Asp Asn Pro Leu Ile Asp Thr Glu Asn

340 345 350

Gln Ala Ser Tyr His Gly Gly Asn Phe Leu Gly Gln Tyr Val Gly Val

355 360 365

Gly Met Asp Arg Leu Arg Tyr Leu Leu Gly Leu Leu Ala Lys His Leu

370 375 380

Asp Val Gln Ile Ala Leu Leu Ala Ala Pro Glu Phe Asn Asn Gly Leu

385 390 395 400

Ser Pro Ser Leu Val Gly Asn Thr Ser Arg Lys Val Asn Met Gly Leu

405 410 415

Lys Gly Leu Gln Ile Ala Gly Asn Ser Ile Met Pro Leu Leu Thr Phe

420 425 430

Tyr Gly Asn Ser Ile Ala Asp Arg Phe Pro Thr His Ala Glu Gln Phe

435 440 445

Asn Gln Asn Ile Asn Ser Gln Gly Phe Ala Ser Ala Asn Leu Ala Arg

450 455 460

Arg Ser Ile Glu Leu Phe Gln Gln Tyr Met Ala Ile Ser Leu Met Phe

465 470 475 480

Ala Val Gln Ala Val Asp Leu Arg Thr His Glu Val Ala Gly His Tyr

485 490 495

Asp Ala Arg Glu Cys Leu Ser Pro Leu Ser Leu Pro Leu Tyr Glu Ala

500 505 510

Val Arg Glu Val Val Gly Gln Pro Pro Asn Val Asp Arg Ser Tyr Ile

515 520 525

Trp Asn Asp Asn Glu Gln Ser Leu Asp Ile His Ile Ala Met Ile Ala

530 535 540

Ala Asp Ile Ala Gln Glu Gly Arg Ile Val Gln Ala Val Asn Gln Ile

545 550 555 560

Leu Ser Ser Leu Lys

565

<210> 33

<211> 559

<212> PRT

<213> 粘球藻属(Gloeocapsa sp.)PCC 7428

<400> 33

Met Asn Thr Ala Val Gln Thr Gln Ala Ser Thr Asn Leu Asn Ala Asp

1 5 10 15

Thr Ile Leu Leu Gly Asp Arg Asn Leu Thr Ile Asp Glu Val Val Ser

20 25 30

Val Ala Arg His Gly Ala Lys Val Asn Ile Ser Thr Ala Asp Asn Val

35 40 45

Ala Gln Arg Ile Gln Ala Ser Cys Asp Tyr Ile Ala Glu Ala Val Ala

50 55 60

Thr Gly Arg Pro Ile Tyr Gly Val Thr Ser Gly Phe Gly Gly Met Ala

65 70 75 80

Asn Val Val Ile Ser Arg Glu Tyr Ala Asp Leu Leu Gln His Asn Leu

85 90 95

Val Trp Tyr His Lys Val Gly Ala Gly Arg Lys Leu Pro Leu Thr Asp

100 105 110

Val Arg Ala Ala Met Leu Leu Arg Val Asn Ser His Leu His Gly Ala

115 120 125

Ser Gly Ile Arg Arg Glu Ile Val Gln Arg Met Glu Met Phe Leu Asn

130 135 140

Ala Arg Val Thr Pro His Val Pro Glu Tyr Gly Ser Ile Gly Ala Ser

145 150 155 160

Gly Asp Leu Thr Pro Leu Ser Tyr Ile Thr Gly Ala Leu Ile Gly Leu

165 170 175

Asp Asp Arg Tyr Lys Val Asp Phe Asp Gly Glu Glu Ile Asp Ala Ile

180 185 190

Thr Ala Leu Glu Arg Leu Gly Leu Pro Gln Leu Gln Leu Gln Ala Lys

195 200 205

Glu Gly Leu Ala Met Met Asn Gly Thr Ser Val Met Thr Gly Ile Ala

210 215 220

Ala Asn Cys Val Tyr Asp Thr Arg Leu Leu Met Ala Leu Thr Met Gly

225 230 235 240

Ala His Ala Leu Ile Leu Gln Gly Leu Asn Gly Thr Asn Gln Ser Phe

245 250 255

His Pro Phe Ile His Lys Leu Lys Pro His Pro Gly Gln Lys Trp Ala

260 265 270

Ala Ser Thr Met Leu Asp Leu Leu Ala Gly Ser Arg Leu Ile Arg Glu

275 280 285

Glu Leu Asp Gly Thr His Glu Tyr Arg Gly Gln Ala Pro Ile Gln Asp

290 295 300

Arg Tyr Ser Leu Arg Cys Leu Ala Gln Tyr Met Gly Pro Ile Val Asp

305 310 315 320

Gly Val Ser Gln Val Ala Gln Gln Val Glu Ile Glu Met Asn Ser Ala

325 330 335

Thr Asp Asn Pro Leu Ile Asp Val Glu Asn Gln Ala Ser Tyr His Gly

340 345 350

Gly Asn Phe Leu Gly Gln Tyr Ile Gly Met Gly Met Asp His Leu Arg

355 360 365

Tyr Tyr Ile Gly Met Met Ala Lys His Leu Asp Val Gln Ile Ala Tyr

370 375 380

Leu Val Ala Pro Glu Phe Asn Asn Gly Leu Pro Ala Ser Leu Val Gly

385 390 395 400

Asn Lys Glu Arg Ile Val Asn Met Gly Leu Lys Gly Leu Gln Ile Thr

405 410 415

Gly Asn Ser Ile Met Pro Leu Leu Ser Phe Tyr Gly Asn Ser Ile Ala

420 425 430

Asp Arg Tyr Pro Thr His Ala Glu Gln Tyr Asn Gln Asn Ile Asn Ser

435 440 445

Gln Gly Phe Ala Ala Ala Asn Leu Thr Arg Asn Ala Val Glu Ile Phe

450 455 460

Gln Gln Tyr Met Ala Ile Ala Leu Met Phe Gly Val Gln Ala Val Asp

465 470 475 480

Leu Arg Thr Tyr Ala Tyr Ala Gly His Tyr Asp Ala Ser Glu Cys Leu

485 490 495

Ser Pro Thr Thr Arg Arg Leu Tyr Gln Ala Val Arg Glu Val Val Gly

500 505 510

Gln Pro Ser Ser Ala Thr Arg Pro Tyr Ile Trp Asp Asp Arg Glu Gln

515 520 525

Pro Leu Asp Glu His Ile Ala Lys Ile Ala Ala Asp Ile Ala Ala Glu

530 535 540

Gly Val Ile Val Ala Ala Val Lys Asp Leu Leu Thr Ser Leu Lys

545 550 555

Claims

1.一种具有苯丙氨酸解氨酶(PAL)活性的工程化多肽，所述工程化多肽由具有与参考序列SEQ ID NO:4至少97％的序列同一性的氨基酸序列组成并且所述工程化多肽与SEQ IDNO:4相比的氨基酸残基差异选自H307G/Q/M和下列置换中的一个或更多个：F18H、LL47A、L214Q、C503Q、C565P；并且所述工程化多肽与所述参考序列SEQ ID NO:4相比表现出选自以下的改进的特性：i)增强的催化活性、ii)降低的对蛋白水解的敏感性、iii)增加的对酸性pH的耐受性、iv)降低的免疫原性、或i)、ii)、iii)和iv)的任何组合。

2.如权利要求1所述的工程化多肽，其中一个或更多个置换选自F18H、L47A、L214Q和C503Q。

3.如权利要求1所述的工程化多肽，其中所述工程化多肽与SEQ ID NO:4相比的氨基酸残基差异是H307G/Q/M、F18H和L47A。

4.如前述权利要求中任一项所述的工程化多肽，其中所述改进的特性选自降低的对蛋白水解的敏感性和/或增加的对酸性pH的耐受性。

5.如权利要求1-3中任一项所述的工程化多肽，其中所述工程化多肽是多变鱼腥藻酶的变体。

6.如权利要求1-3中任一项所述的工程化多肽，其中所述工程化多肽耐受蛋白水解。

7.如权利要求6所述的工程化多肽，其中所述工程化多肽耐受通过至少一种消化道酶的蛋白水解。

8.如权利要求7所述的工程化多肽，其中所述工程化多肽耐受通过胰凝乳蛋白酶、胰蛋白酶、羧肽酶和/或弹性蛋白酶的蛋白水解。

9.如权利要求1-3中任一项所述的工程化多肽，其中所述工程化多肽是酸稳定的。

10.如权利要求1-3中任一项所述的工程化多肽，其中所述工程化多肽被去免疫化。