CN1714101A - 有效治疗肿瘤和基它需要除去或破坏细胞的疾病的肽 - Google Patents

有效治疗肿瘤和基它需要除去或破坏细胞的疾病的肽 Download PDF

Info

Publication number
CN1714101A
CN1714101A CN 02818332 CN02818332A CN1714101A CN 1714101 A CN1714101 A CN 1714101A CN 02818332 CN02818332 CN 02818332 CN 02818332 A CN02818332 A CN 02818332A CN 1714101 A CN1714101 A CN 1714101A
Authority
CN
China
Prior art keywords
peptide
protein
disease
ntp
related peptides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 02818332
Other languages
English (en)
Other versions
CN100432103C (zh
Inventor
P·A·艾弗白克
J·杰梅尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nymox Corp Canada
Original Assignee
Nymox Corp Canada
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nymox Corp Canada filed Critical Nymox Corp Canada
Publication of CN1714101A publication Critical patent/CN1714101A/zh
Application granted granted Critical
Publication of CN100432103C publication Critical patent/CN100432103C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及用于治疗需要除去或破坏患者的有害细胞或不想要的组织的疾病的肽,组合物和方法,该方法采用含有衍生自神经丝状蛋白至少一种氨基酸序列和其它相关分子的蛋白质,和衍生自该蛋白质氨基酸序列的肽进行治疗。

Description

有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽
本申请要求2001年7月19日提交的题为“有效治疗肿瘤和其它需要除去或破坏细胞的疾病的蛋白质和肽”的临时申请序列号60/306,161的优先权,2001年7月19日提交的题为“有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽”的临时专利申请序列号60/306,150的优先权,以及2001年11月16日提交的题为“有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽”的临时专利申请序列号60/331,477的优先权,在此将它们全文并入以供参考。
                            发明领域
本发明涉及用含有对应于、相似于或同源于神经丝状蛋白的部分氨基酸序列的氨基酸序列的蛋白质和肽化合物治疗疾病的方法,这类疾病需要除去或破坏细胞成分,如良性或恶性肿瘤。该方法包括但不限于肌肉内、口服、静脉内、鞘内、肿瘤内、鼻内、局部、透皮等给所述化合物,或单独或偶联于载体的所述化合物。
                            发明背景
许多医学治疗和过程包括除去或破坏有害或不想要的组织。这种重要治疗的例子包括手术除去癌性生长物、通过化疗破坏转移性肿瘤和减少腺体(如前列腺)增生。其它例子包括除去不想要的面部毛发、疣、皮下组织、淋巴组织或脂肪组织。
需要有效的制剂来破坏从而便于除去有害或不想要的细胞和组织或抑制其进一步生长,主要是局部作用而全身毒性最小或没有。神经丝状蛋白及其相关分子是2002年3月8日提交的题为“用神经丝状蛋白治疗肿瘤和相关疾病的方法”的待审批美国专利申请序列号10/092,934所描述的这类制剂之一,其公布的内容全部纳入本文供参考。含有与神经丝状蛋白部分氨基酸序列相对应的氨基酸序列的肽,AD7c-NTP也是这类试剂。这些肽可参见2002年5月24日提交的题为“有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽”的待审批美国专利申请序列号10/153,334中的描述,其公布的内容全部纳入本文供参考。
癌是细胞内部调节机制发生的异常,导致不受控制的细胞生长和繁殖。正常细胞构成组织,当这些细胞失去作为特定、受控制和协同单元的能力(去分化)时,这种缺陷会导致细胞群发生混乱。当它发生时,即形成肿瘤。
组织的良性过度生长是异常情况,此时需要从机体中除去细胞。良性肿瘤是不会全身转移但能引起疾病症状的细胞增殖。如果这种肿瘤位于器官如脑中难以到达的区域,它们可能是致命的。良性肿瘤存在于许多器官中,包括肺、脑、皮肤、垂体、甲状腺、肾上腺皮质和肾上腺髓质、卵巢、子宫、睾丸、结缔组织、肌肉、肠、耳、鼻、喉、扁桃腺、口、肝脏、胆囊、胰、前列腺、心和其它器官。
在癌症治疗中手术通常是第一步。手术的目的不同。有时用手术的除尽可能多的明显肿瘤,或至少使它“除块”(节除主要的肿瘤块从而减少对其它方法治疗的需要)。取决于癌种类和位置,手术也可为病人提供一些症状缓解。例如,如果手术切除了大部分扩增的脑肿瘤,颅内压将减少,使病人的症状改善。
不是所有的肿瘤都可以手术切除。一些肿瘤可能位于使它们不能完全被切除的身体部位。这些肿瘤例子是脑干中的肿瘤(控制呼吸的脑部分)或生长在主要血管中和周围的肿瘤。在这些情况中,由于肿瘤切除相关的高风险,手术的实施受到限制。
在一些情况中,由于不需要,不能用手术切除肿瘤块。一个例子是何杰金淋巴瘤,这是一种对化疗和放射治疗相联合有良好反应的淋巴结癌症。在何杰金淋巴瘤中,很少需要手术来达到治愈,而手术几乎都是用于确定诊断。
化疗是癌治疗的一种常用形式,包括使用能特异性攻击全身中快速分裂细胞(如肿瘤中所见的细胞)的药物(通常通过口服或注射给予)。这使化疗可用于治疗转移癌以及有很高机会通过血液和淋巴系统扩散但尚未明显超过原发性肿瘤部位的肿瘤。化疗也可用于提高局部肿瘤对手术和放疗的反应。例如对于一些头部和颈部的癌症。
不幸的是,人体中正常快速分裂的其它细胞(如胃的内皮层和毛发)也会受到化疗影响。由于这个原因,许多化疗剂会导致不良副作用如恶心、呕吐、贫血、脱发或其它症状。这些副作用是暂时性的,目前的药物可帮助减轻许多这些副作用。随着我们的知识持续增长,学者们设计了更加新的化疗剂,它们不仅能更好地杀死癌细胞且对病人的副作用更小。
化疗药物可以多种方式给予病人。一些是药丸,一些通过静脉内或其它部位注射给药。就可注射的化疗药物而言,病人须到医生诊所或医院接受治疗。其它化疗剂需要一天24小时连续输入血流中。对于这些类型的化疗药物,可进行小手术给病人植入小泵。用泵慢慢给药。在许多情况中,须在病人静脉中安置永久性输液管口以消除反复针刺的需要。
放疗是另一种抗癌的常用武器。放射线通过破坏肿瘤细胞内的DNA来杀死癌。放疗可用不同方式传送。最普通的方法包括以高度精确方式使放射线束指向病人,集中照射在肿瘤上。为此,病人须躺在台上光束围绕他/她周围移动。此可程持续几分钟,但可每天进行,连续数周(取决于肿瘤类型)以达到具体的总处方放射量。
有时采用称为近程治疗的另一种放射方法,包括采用放射性小丸(“辐射盒”)或电线,将它们植入身体的肿瘤区域中。植入物可以是暂时或永久性的。就永久性植入而言,辐射盒中的射线在几天或几周中“衰变”从而病人不会有放射性。就暂时性植入而言,总放射剂量通常须在数天中输入,病人在此时间中必须住院。对于这两种近程治疗,一般须将放射线准确关至肿瘤区域以获得对癌症的局部控制(此与全身治疗相反,如化疗)。
一些高度选择的病人可求助于骨髓移植。通常进行此种治疗是因为病人患有显著的攻击性癌或因为他们经常规疗法治疗后癌症复发。骨髓移植是一种复杂的过程。有许多种类且它们引起副作用和治愈的可能性不同。大多数移植须在特殊的医疗中心进行,在许多情况中采用移植认为是研究性的。
有一些其它治疗方法,尽管大部分仍在临床考核中探索,未成为标准治疗方法。例子包括免疫治疗、单克隆抗体、抗血管生成因子和基因治疗。
免疫治疗:设计了多种技术以促进病人自身免疫系统抵抗癌症,这与放射治疗或化疗完全不同。通常为达到此目的,学者们用特制疫苗给病人注射。单克隆抗体:设计用于攻击癌细胞(不攻击正常细胞)的抗体,利用癌和非癌细胞之间抗原性或/或其它特征的差异。抗体可单独给予病人,或与各种细胞毒化合物偶联或采用放射性形式,使抗体优先靶向癌性细胞,从而将毒性剂或放射剂递送给需要的细胞。
抗血管生成因子:由于癌细胞迅速分裂和肿瘤生长,它们可能很快长得比其血液供应还快。为补偿这点,一些肿瘤可分泌协助诱导其周围血管生长的物质,从而向癌细胞提供血管输送的营养物。已设计了实验性疗法以阻止血管长入肿瘤。
基因疗法:癌是一系列突变的产物,最终导致癌细胞产生和其过度增殖。治疗癌可将能控制或停止癌增殖的基因引入癌细胞、开启细胞的程序性细胞(死亡)机制破坏癌细胞、提高细胞的免疫识别、或表达能转变成毒性代谢物的前体药物或抑制肿瘤生长的细胞因子。
良性肿瘤和畸形也可通过多种方法治疗,包括手术、放射治疗、药物治疗、热和电烧灼、冷冻疗法等。尽管良性肿瘤不转移,它们可长大且可复发。手术根除良性肿瘤通常有困难和手术副作用,而一些良性肿瘤须要反复进行手术,如垂体腺瘤、脑膜瘤、前列腺增生等。
还有其它一些疾患包含不想要的细胞成分,需要选择性去除这些细胞。例如心脏病和中风一般由动脉粥样硬化所引起,而动脉粥样硬化是纤维脂肪和平滑肌成分的增殖性损伤而致使血管壁扭曲、血管腔狭窄、血流收缩、易发病灶性血栓并最终导致阻塞和梗塞。治疗动脉粥样硬化的各种方法包括:旁路移植;人工移植;采用血管再通、刮除、放射、激光或其它去除阻塞的血管成形术;通过脂质减少抑制动脉粥样硬化的药物疗法;抗血凝治疗;和饮食、锻炼及生活方式的全身疗法。仍需要一种除去动脉粥样硬化性损伤而无风险和副作用的方法。
其它需要选择性去除不想要的细胞丰分例子,包括病毒诱导的生长物如疣。另一个例子是炎症情况中所见的肥大炎性块和肥大疤痕或瘢痕疙瘩。其它例子见于化妆美容时例如除去不想要的毛发如面部汗毛,或为美容目的须除去面部皮肤和结缔组织或四肢皮肤和结缔组织中的皱缩的不需要的组织区域。
其它例子是此领域一般技术人员知道的。在所有或大部分这些例子中,都需要能除去或破坏不想要的细胞成分进行治疗,而无常规疗法的风险和副作用,和需要更精确除去不想要的细胞成分的方法。
神经丝状蛋白(NTP)是最近才鉴定的一个脑蛋白质家族。此家族成员之一AD7c-NTP是41kD功能与神经芽生相关的膜结合磷蛋白(de la Monte等,J.Clin.Invest.,100:3093-3104(1997);de la Monte等,Alz.Rep.,2:327-332(1999);de la Monte SM和Wands JR,Journal of Alzheimer’s Disease,3:345-353(2001))。已鉴定和报道了编码AD7c-NTP的基因和AD7c-NTP的预测蛋白质序列(de laMonte等,J.Clin.Invest.,100:3093-3104(1997))。除了41kD种类外,其它种类的神经丝状蛋白(约26kD、约21kD、约17kD和约15kD)也已鉴定并与神经外胚层瘤、星形细胞瘤和成胶质细胞瘤以及缺氧、局部缺血或脑梗塞引起的损伤相关联(Xu等,Cancer Research,53:3823-3829(1993);de la Monte等,J.Neuropathol.Exp.Neurol.,55(10):1038-50(1996),de la Monte等,J.Neurol.Sci.,138(1-2):26-35(1996);de la Monte等,J.Neurol.Sci.,135(2):118-25(1996);de la Monte等,J.Clin.Invest.,100:3093-3104(1997);de la Monte等,Alz.Rep.,2:327-332(1999))。
对神经丝状蛋白的种类已有描述和权利要求,见美国专利号5,948,634;5,948,888和5,830,670中所有关于“阿尔茨海默氏病的神经丝状蛋白基因表达和检测”和美国专利号6,071,705关于“检测神经疾病或功能不良的方法”。这些专利所披露内容特别地全部纳入本文供参考。如其中所述,NTP在细胞死亡期间上调和产生。因此,报道认为死亡和垂死的神经细胞系过度产生NTP而致,因而它的存在表明神经细胞死亡和阿尔茨海默氏病(AD)发作。
已将其它种类的神经丝状蛋白鉴定为AD7c-NTP基因的其它产物(如描述于NCBI Entrez-蛋白质数据库登录号#XP 032307 PID g15928971的一种112个氨基酸的蛋白质)或类似于神经丝状蛋白(如描述于NCBI Entrez-蛋白质数据库登录号#AAH14951 PID g15928971的一种106个氨基酸的蛋白质,描述于NCBI Entrez-蛋白质数据库登录号#XP 039102 PID g18599339的另一种106个氨基酸的蛋白质和描述于NCBI Entrez-蛋白质数据库登录号#AAH02534 PID g12803421的一种61个氨基酸的蛋白质)。
与AD和NTP相关的神经丝状蛋白在AD的细胞死亡中上调。与对照相比AD7c-NTP mRNA在AD大脑中上调;AD中大脑和CSF中的AD7c-NTP蛋白水平高于对照;AD7c-NTP的免疫反应性发现于AD和唐氏综合症大脑中的老年斑、神经纤维缠结(NFT)、变性神经元、神经毡丝(neuropil thread)和营养不良性神经芽生中(Ozturk等,Proc.Natl.Acad.Sci.USA,86:419-423(1989);de la Monte等,J.Clin.Invest.,86(3):1004-13(1990);de la Monte等,J.Neurol.Sci.,113(2):152-64(1992);de la Monte等,Ann.Neurol.,32(6):733-42(1992);de la Monte等,J.Neuropathol.Exp.Neurol.,55(10):1038-50(1996),de la Monte等,J.Neurol.Sci.,138(1-2):26-35(1996);de la Monte等,J.Neurol.Sci.,135(2):118-25(1996);de la Monte等,J.Clin.Invest.,100:3093-3104(1997);de la Monte等,Alz.Rep.,2:327-332(1999))。NTP定位于细胞内、神经毡内的精细加工中,或AD和唐氏综合症大脑中的细胞外。de la Monte等,Ann.Neurol.,32(6):733-42(1992)。
在AD病人的CSF和尿中都发现AD7c-NTP蛋白水平升高(de la Monte和Wands,Front Biosci 7:989-96(2002);de la Monte和Wands,Journal of Alzheimer’sDisease,3:345-353(2001);Munzar等,Alzheimer’s Reports 4:61-65(2001);Kahle等,Neurology 54:1498-1504(2000);Munzar等,Alzheimer’s Reports 3:155-159(2000);de la Monte等,Alzheimer’s Reports 2:327-332(1999);和de la Monte等,J Clin Invest 100:3093-3104(1997)。
过度表达NTP也与阿尔茨海默氏病中的细胞死亡过程相联系(de la Monte和Wands,J.Neuropathol Exp.Neurol.,60:195-207(2001);de la Monte和Wands,CellMol Life Sci 58:844-49(2001)。也在唐氏综合症大脑组织中鉴定到AD7c-NTP(Wands等,国际专利出版号WO 90/06993;de la Monte等,J Neurol Sci 135:118-25(1996);de la Monte等,Alz.Rep.,2:327-332(1999))。有一些证据表明过度表达NTP也可能与正常张力青光眼相关联(Golubnitschaja-Labudova等,Curr Eye Res21:867-76(2000))。
已证明NTP是在体外神经胶质瘤和成神经细胞瘤的细胞培养物,体内正常啮齿动物肌肉组织、皮下结缔组织和真皮中,以及多种不同人和非人来源的肿瘤(包括乳腺癌、皮肤癌和乳头状瘤、结肠癌、脑胶质瘤和啮齿动物模型中的其它肿瘤)中,能导死细胞死亡的一种有效制剂。参见2002年3月8日提交的待审批美国专利申请序列号10/092,934;题为“用神经丝状蛋白治疗肿瘤和相关疾病的方法”。
此描述中包括上述相关领域的描述、任何和所有本文所述公开的文献,包括任何和所有的美国专利全部纳入本文供参考。上述相关领域的描述不意味着以任何方式承认包括待审批美国专利申请的任何本文所述文献是本发明的现有技术。
                             *  *  *  *
此领域仍需要新的、毒性较弱的治疗不需要的细胞成分的方法。本发明可满足这些需求。
                              发明概述
本发明一部分包括本发明者发现AD7c-NTP中所含的肽序列,及其变体或同系物,包括其人和其它哺乳动物等生物的其它蛋白质中发现的肽序列是破坏或除去有害细胞或不想要细胞的有效制剂,。一旦发现了此种肽序列,此领域的一般技术人员就可通过利用广泛存在的公众或商业蛋白质数据库如国家生物技术信息中心的蛋白质数据库(National Center Biotechnology Information′s Protein database)和检索程序如BLAST(局部序列比对基本检索工具)找到这些蛋白质。参见Altschul,Stephen F.,Thomas L.Madden,Alejandro A.Schffer,Jinghui Zhang,ZhengZhang,Webb Miller和David J.Lipman(1997),“缺口BLAST和PSI-BLAST:新一代蛋白质数据库检索程序(Gapped BLAST and PSI-BLAST:a new generation of proteindatabase search programs)”,Nucleic Acids Res.25:3389-3402。
此领域的一般技术人员然后可以用这里描述的测定方法来筛选这些蛋白质,以确定它们作为破坏或除去不需要的或有害细胞的制剂的效力。发现一种或多种这类有效制剂后,此领域的一般技术人员然后可以确定那些制剂中,包含与这里所述或2002年5月24日提交的题为“有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽”的待审批美国专利申请序列号10/153,334所述的AD7c-NTP肽序列同源或类似的序列,这些制剂可用此领域技术人员已知的方法合成,并测试合成的制剂作为破坏或除去不需要或有害细胞的制剂的效力。此外,此领域的一般技术人员还可所发现的此类蛋白质的氨基酸序列,来确定与本文所述以及2002年5月24日提交的题为“有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽”的美国专利申请序列号10/153,334所述的AD7c-NTP肽序列不类似或不同源,和同源或类似的其它肽序列。然后可测试这些新合成的序列作为破坏或除去不需要的或有害细胞的制剂的效力。
本发明涉及治疗不需要的细胞增殖的肽、组合物和方法,如良性或恶性肿瘤、腺体(如前列腺)增生、不需要的面部汗毛、疣和不需要的脂肪组织。这种方法包括将治疗有效量的相关蛋白、已知是能导致细胞死亡的有效制剂的相关肽或NTP肽,给予需要的哺乳动物,。“相关蛋白”、“相关肽”和“NTP肽”的定义如下。
本发明的肽具有至少一段与神经丝状蛋白的部分氨基酸序列相对应的氨基酸序列。本发明的组合物包括这种肽和药学上可接受的载体。本发明的肽或蛋白质(“细胞死亡肽”)可单独或者与载体或抗体偶联后施用。施用此细胞死亡肽可通过肌肉内、口服、静脉内、腹膜内、脑内(实质内)、脑室内、肿瘤内、病灶内、皮内、鞘内、鼻内、眼内、动脉内、局部、透皮、通过气雾剂、灌输、推注、植入装置、缓释系统等,或单独或运载体偶联。另外,此细胞死亡肽可通过给予表达此肽的基因来体内表达、通过给予能诱导导入此基因的细胞、细菌或病毒体内表达此肽的疫苗,或导致基因修饰等来产生此肽。
此外,此细胞死亡肽可结合其它疗法用于来治疗良性或恶性肿瘤和其它不想要的或有害的细胞生长。以上一般描述和下列详细描述是示范性和说明性的,将为本发明的权利要求提供进一步说明。从本发明的详细描述中,本领域技术人员不难了解本发明的其它目标、优点和新特征。
                            附图简述
图1:显示AD7c-NTP基因的完整氨基酸序列和核酸序列以及该基因的AD7c-NTP蛋白产物(获自美国专利号5,830,670、5,948,634和5,948,888的序列120和121;de la Monte等,J.Clin.Invest.,100:3093-3104(1997);NCBI Entrez-蛋白质数据库登录号#AAC08737;PID g3002527)[SEQ ID NO.1]。
图2:显示122个氨基酸的神经丝状蛋白的完整氨基酸序列(获自美国专利号5,830,670、5,948,634和5,948,888的序列40;NCBI Entrez-蛋白质数据库登录号#AAE25447 PID g10048540)[SEQ ID NO.2](“NTP-122”)。
图3:显示112个氨基酸的神经丝状蛋白的完整氨基酸序列(NCBI Entrez-蛋白质数据库登录号#XP_032307 PID g15928971)[SEQ ID NO.3](“NTP-112”)。
图4:显示106个氨基酸的神经丝状蛋白样蛋白质的完整氨基酸序列(NCBIEntrez-蛋白质数据库登录号#AAH14951 PID g15928971)[SEQ ID NO.4](“NTP-106A”)。
图5:显示106个氨基酸的神经丝状蛋白样蛋白质的完整氨基酸序列(NCBIEntrez-蛋白质数据库登录号#XP_039102 PID g18599339)[SEQ ID NO.5](“NTP-106B”)。
图6:显示98个氨基酸的神经丝状蛋白的完整氨基酸序列(获自美国专利号5,830,670、5,948,634和5,948,888的序列30;NCBI Entrez-蛋白质数据库登录号#AAE25445,PID g10048538)[SEQ ID NO.6](“NTP-98”)。
图7:显示75个氨基酸的神经丝状蛋白的完整氨基酸序列(获自美国专利号5,830,670、5,948,634和5,948,888的序列48;NCBI Entrez-蛋白质数据库登录号#AAE25448,PID g10048541)[SEQ ID NO.7](“NTP-75”)。
图8:显示68个氨基酸的神经丝状蛋白的完整氨基酸序列(获自美国专利号5,830,670、5,948,634和5,948,888的序列36;NCBI Entrez-蛋白质数据库登录号#AAE25446,PID g10048539)[SEQ ID NO.8](“NTP-66”)。
图9:显示61个氨基酸的神经丝状蛋白样蛋白质的完整氨基酸序列(NCBIEntrez-蛋白质数据库登录号#AAH02534,PID g12803421)[SEQ ID NO.9](“NTP-61”)。
                    优选实施方案的详细说明
除非另有说明,本文使用的术语和词组按如下定义。
术语“AD7c-NTP”指约41kD蛋白质和基因以及编码它的核酸序列,描述是de la Monte等,J.Clin.Invest.,100:3093-104(1997),美国专利号5,948,634;5,948,888和5,830,670的序列120和121以及GenBank#AF010144中,其核酸和氨基酸序列示于图1。术语“AD7c-NTP”也包括AD7c-NTP的生物活性片段、变体、衍生物、同源物和模拟物。
术语“NTP”或“神经丝状蛋白”指神经丝状蛋白和相关分子(包括胰丝状蛋白)和编码这些蛋白质的核酸序列,且包括(但不限于)下列蛋白质和编码这些蛋白质的氨基酸序列的核酸序列:
(a)AD7c-NTP;
(b)~42、~26、~21、~17、~14和~8kD种类的神经丝状蛋白,描述见于美国专利号5,948,634;5,948,888;5,830,670和6,071,705和de la Monte等,J.Neuropathol.Exp.Neurol.,55(10):1038-50(1996),de la Monte等,J.Neurol.Sci.,138(1-2):26-35(1996);de la Monte等,J.Neurol.Sci.,135(2):118-25(1996);de la Monte等,J.Clin.Invest.,100:3093-3104(1997);de la Monte等,Alz.Rep.,2:327-332(1999);
(c)单克隆抗体#2特异性识别的蛋白质保存于美国典型培养物保藏所,Manassas,Va.,登录号HB-12546,或单克隆抗体#5特异识别的蛋白质保存于美国典型培养物保藏所,Manassas,Va.,登录号HB-12545;
(d)由AD7c-NTP基因所编码的蛋白质;
(e)122个氨基酸神经丝状蛋白,描述见美国专利号5,830,670、5,948,634和5,948,888的序列40,并在NCBI Entrez-蛋白质登录号#AAE25447,PID g10048540中列出,其氨基酸序列示于图2(“NTP-122”);
(f)NCBI Entrez-蛋白质登录号#XP_032307,PID g14725132中列出的122个氨基酸神经丝状蛋白,其氨基酸序列示于图3(“NTP-112”);
(g)NCBI Entrez-蛋白质登录号#AAH14951 PID g15928971中列出的106个氨基酸神经丝状蛋白,其氨基酸序列示于图4(“NTP-106A”);
(h)NCBI Entrez-蛋白质登录号#XP_039102 PID g18599399中列出的106个氨基酸神经丝状蛋白,其氨基酸序列示于图5(“NTP-106B”);
(i)98个氨基酸神经丝状蛋白,描述见美国专利号5,830,670、5,948,634和5,948,88的序列30,并在NCBI Entrez-蛋白质登录号#AAE25445,PIDg10048538中列出,其氨基酸序列示于图6(“NTP-98”);
(j)75个氨基酸神经丝状蛋白,描述见美国专利号5,830,670、5,948,634和5,948,888的序列48,并在NCBI Entrez-蛋白质登录号#AAE25448,PIDg10048541中列出,其氨基酸序列示于图7(“NTP-75”);
(k)68个氨基酸神经丝状蛋白,描述见美国专利号5,830,670、5,948,634和5,948,888的序列36,并在NCBI Entrez-蛋白质登录号#AAE25446,PIDg10048539中列出,其氨基酸序列示于图8(“NTP-68”);
(l)在NCBI Entrez-蛋白质登录号#AAH02534,PID g12803421中列出的61个氨基酸的神经状蛋白样蛋白质,其氨基酸序列示于图9(“NTP-61”);
(m)胰丝状蛋白;
(n)在美国专利号6,071,705中描述的神经胰丝状蛋白(nPTP);
(o)杂交瘤产生的抗体特异性识别的蛋白质,这些杂交瘤为保存于美国典型培养物保藏所的HB 9934、HB 9935和HB 9936。
术语“NTP肽”所指的肽包括对应于NTP的至少一部分氨基酸序列或NTP片段的氨基酸序列,除非另有说明,还包括这些肽的同源物、衍生物、变体、融合蛋白和肽模拟物。术语“NTP肽”还包括(但不限于)美国专利申请序列号10/092,934个10/153334中特别列出的肽。术语“NTP肽”优选包括(但不限于)NTP的以下氨基酸序列:
a) NTP肽#1[SEQ ID NO.10],AD7c-NTP p239-243
SSWDY
Ser-Ser-Trp-Asp-Tyr
b) NTP肽#2[SEQ ID NO.11],AD7c-NTP p31-39
PASASPVAG
Pro-Ala-Ser-Ala-Ser-Pro-Val-Ala-Gly
c) NTP肽#3[SEQ ID NO.12],AD7c-NTP p14-24
GAISAHRNLRL
Gly-Ala-Ile-Ser-Ala-His-Arg-Asn-Leu-Arg-Leu
d) NTP肽#4[SEQ ID NO.13],AD7c-NTP p53-58
FFLVEM
Phe-Phe-Leu-Val-Glu-Met
e) NTP肽#5[SEQ ID NO.14],AD7c-NTP p208-216
SVTQAGVQW
Ser-Val-Thr-Gln-Ala-Gly-Val-Gln-Trp
f) NTP肽#6[SEQ ID NO.15],NTP-122 p106-122
IDQQVLSRIKLEIKRCL
Ile-Asp-Gln-Gln-Val-Leu-Ser-Arg-Ile-Lys-Leu-Glu-Ile-Lys-Arg-Cys-Leu
g) NTP肽#7[SEQ ID NO.16],NTP-122 p111-119
LSRIKLEIK
Leu-Ser-Arg-Ile-Lys-Leu-Glu-Ile-Lys
并包括这些特别列出的NTP肽的同源物、衍生物、变体、片段、融合蛋白和肽模拟物。
术语“相关蛋白”指含有一种或多种与一种或多种NTP肽相同、非常类似或同源的氨基酸序列的蛋白质。
表述“相关肽”指由与所述相关蛋白的至少一部分氨基酸序列相对应的氨基酸序列构成的肽,并包括这种肽的同源物、变体、融合蛋白、反-D肽和肽模拟物。表述“相关肽”还优选包括(但不限于)所述相关蛋白的以下氨基酸序列:
(a) 相关肽#1[SEQ ID NO.17],暂时的受体潜在通道6,δ变体(NCBI登录号CAC01686,PID g9716913),p356-377
GDHGRPNLSRLKLAIKYEVKKM
Gly-Asp-His-Gly-Arg-Pro-Asn-Leu-Ser-Arg-Leu-Lys-Leu-Ala-Ile-Lys-Tyr-Glu-Val-Lys-Lys-Met
(b) 相关肽#2[SEQ ID NO.18],假定的钙通道(NCBI登录号NP_065122,PIDg9966865),p345-360
QQSIAVKFLAVFGVSI
Gln-Gln-Ser-Ile-Ala-Val-Lys-Phe-Leu-Ala-Val-Phe-Gly-Val-Ser-Ile
(c) 相关肽#3[SEQ ID NO.19],trp-相关蛋白4截短的γ变体(NCBI登录号AF063825_1,PID g6665596),p337-357
GLLFPVFSVCYLIAPKSPLGL
Gly-Leu-Leu-Phe-Pro-Val-Phe-Ser-Val-Cys-Tyr-Leu-Ile-Ala-Pro-Lys-Ser-Pro-Leu-Gly-Leu并包括这些特别列出的相关肽的同源物、衍生物、变体、片段、融合蛋白和肽模拟物。
表述“细胞死亡肽”指已证明是造成细胞死亡的有效制剂的相关蛋白或相关肽。
术语“片段”指由NTP蛋白、NTP肽、相关蛋白或相关肽的氨基酸序列的连续亚序列构成的蛋白质或多肽,包括天然产生的片段,如剪接变体和体内由于蛋白酶水解活性天然产生的片段。这种片段可在氨基末端、羧基末端和/或中间(如自然剪接)截短。这种片段可以用或不用氨基末端甲硫氨酸制备。术语“片段”包括相同NTP蛋白或NTP肽,或相关蛋白或相关肽的片段,可以相同或不同,共有或没有毗连的氨基酸序列,直接或通过接头连接在一起。
术语“变体”指蛋白质或多肽,其中与NTP蛋白、NTP肽、相关蛋白或相关肽的氨基酸序列相比,存在一个或多个氨基酸取代、缺失和/或插入,包括天然产生的NTP蛋白、NTP肽、相关蛋白或相关肽的等位基因变体或者交替剪接变体。术语“变体”包括在肽序列中的一个或多个氨基酸用类似或同源氨基酸或不相似氨基酸的置换。氨基酸可在许多等级上分为类似或同源氨基酸(Gunnar von Heijne,《分子生物学的序列分析》(Sequence Analysis in Molecular Biology),123-39页Academic Press,纽约,NY 1987.)优选的变体包括一个或多个氨基酸位置的丙氨酸取代。其它优选的取代包括对蛋白质的整体净电荷、极性或疏水性影响小或没有影响的保守性取代。保守性取代列于下表2中。
                               表    2
保守性氨基酸取代
碱性:        精氨酸
              赖氨酸
              组氨酸
酸性:        谷氨酸
              天冬氨酸
无电荷极性:  谷氨酰胺
              天冬酰胺
              丝氨酸
              苏氨酸
              酪氨酸
非极性:      苯丙氨酸
              色氨酸
              半胱氨酸
              甘氨酸
              丙氨酸
              缬氨酸
              脯氨酸
              甲硫氨酸
              亮氨酸
              异亮氨酸
表3列出氨基酸取代的另一种方案:
                               表    3
原来的残基            取代
丙氨酸                甘氨酸;丝氨酸
精氨酸                赖氨酸
天冬酰胺              谷氨酰胺;组氨酸
天冬氨酸              谷氨酸
半胱氨酸              丝氨酸
谷氨酰胺              天冬酰胺
谷氨酸                天冬氨酸
甘氨酸                丙氨酸;脯氨酸
组氨酸                天冬酰胺;谷氨酰胺
异亮氨酸              亮氨酸;缬氨酸
亮氨酸                异亮氨酸;缬氨酸
赖氨酸                精氨酸;谷氨酰胺;谷氨酸
甲硫氨酸              亮氨酸;酪氨酸;异亮氨酸
苯丙氨酸              甲硫氨酸;亮氨酸;酪氨酸
丝氨酸                苏氨酸
苏氨酸                丝氨酸
色氨酸                酪氨酸
酪氨酸                色氨酸;苯丙氨酸
缬氨酸                异亮氨酸;亮氨酸
其它变体可由保守性较小的氨基酸取代组成,如选择的残基更显著的不同在于它们对维持(a)取代区域中多肽主链结构的作用,例如片层或螺旋构型,(b)靶位点分子的电荷或疏水性,(c)侧链大小。预期通常对功能有更显著作用的取代是(a)甘氨酸和/或脯氨酸被另一种氨基酸取代或缺失或插入;(b)亲水性残基如丝氨酰或苏氨酰取代(或被)疏水性残基,如亮氨酰、异亮氨酰、苯丙氨酰、缬氨酰或丙氨酰;(c)半胱氨酸残基取代(或被)任何其它残基;(d)具有正电侧链的残基如赖氨酰、精氨酰或组氨酰取代(或被)具有负电荷的残基如谷氨酰或天冬氨酰;或(e)具有大侧链的残基如苯丙氨酸取代(或被)没有这种侧链的残基如甘氨酸。其它变体包括设计为产生新的糖基化和/或磷酸化位点的,或设计为缺失现有糖基化和/或磷酸化位点的残基。变体包括糖基化位点、蛋白水解切割位点和/或半胱氨酸残基上的至少一个氨基酸取代。变体还包括在接头肽上NTP蛋白、NTP肽、相关蛋白或相关肽氨基酸序列之前或之后具有其它氨基酸残基的NTP蛋白、NTP肽、相关蛋白或相关肽。例如,可将半胱氨酸残基加在相关肽的氨基和羧基末端通过形成二硫键使相关肽环化。术语“变体”还包括具有相关蛋白或相关肽的氨基酸序列的多肽,它们在相关蛋白或相关肽的3′或5′末端侧接有至少1个和多达25个或更多额外的氨基酸。
术语“衍生物”指化学修饰的蛋白质或多肽,它们通过天然过程如加工和其它翻译后修饰而被化学修饰,也可通过化学修饰技术加入一个或多个聚乙二醇分子、糖、磷酸盐和/或其它这类分子,其中这类分子不是天然结合于野生型NTP蛋白或肽的分子。衍生物包括盐。这种化学修饰描述可见基础教材和更详细的专论以及大量研究文献中,它们是本领域技术人员所熟知的。将会理解的是,相同类型的修饰可能以相同或不同程度存在于某给定蛋白质或多肽的一些位点上。同样,给定蛋白质或多肽可包含许多种类的修饰。这些修饰可发生在蛋白质或多肽的任何地方,包括肽主链、氨基酸侧链和氨基或羧基末端。这些修饰包括例如乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价结合、血红素部分的共价结合、核苷酸或核苷酸衍生物的共价结合、脂质或脂质衍生物的共价结合、磷脂酰肌醇的共价结合、交联、环化、二硫键形成、脱甲基化、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰化、γ-羧基化、糖基化、GPI锚形成、羟基化、碘化、甲基化、豆蔻酰化、氧化、蛋白酶解加工、磷酸化、异戊二烯化、外消旋化、糖基化、脂质结合、硫酸化、谷氨酸残基的γ-羧基化、羟基化和ADP-核糖基化、硒基化(selenoylation)、转运RNA介导的氨基酸加入蛋白质,如精氨酰化和泛素化。参见例如《蛋白质-结构和分子性质》(Proteins-Structure And Molecular Properties),第二版,T.E.Creighton,W.H.Freeman和Company,纽约(1993)和Wold,F.,“翻译后蛋白质修饰:观点和前景”(Posttranslational Protein Modifcation:Perspective andProspects),《蛋白质的翻译后共价修饰》(Posttranslational Convalent Modification ofProteins),1-12页,B.C.Johnson编,Academic Press,纽约(1983);Seifter等,Meth.Enzymol.182:626-646(1990)和Rattan等,“蛋白质合成:翻译后修饰和衰老”(Posttranslational Modifcation and Aging),Ann.N.Y.Acad.Sci.663:48-62(1992)。术语“衍生物”包括化学修饰导致蛋白质或多肽变成分支状或者有或没有分支的环状。环状、分支状和分支环状蛋白质或多肽可能由翻译后的天然加工产生并也可完全由合成方法产生。
术语“同源物”指蛋白质,其与NTP蛋白、NTP肽、相关蛋白或相关肽的氨基酸序列,根据常用于比较两种多肽的氨基酸位置相似性的标准方法测定至少有60%相同。两种蛋白质之间的相似性或相同性程度可用已知方法计算,包括但不限于以下所描述的那些方法:《计算分子生物学》(Computational Molecular Biology),Lesk,A.M.编,牛津大学出版社,纽约,1988;《生物计算:信息学和基因组计划》(Biocomputing:Informatics and Genome Projiects),Smith,D.W.编,Academic Press,纽约,1993;《序列数据的计算机分析》(Computer Analysis of Sequence Data),第I部分,Griffin,A.M.和Griffin,H.G.编,Humana Press,新泽西州,1994);《分子生物学序列分析》(Sequence analysis in Molecular Biology),von Heinje,G.,AcademicPress,纽约,1987);《序列分析引物》(Sequence analysis Primery),Gribskov,M.和Devereux,J.编,M Stockton Press,纽约,1991;Carillo H.和Lipman,D.,SIAM,J.Applied Math.,48:1073(1988)。设计了确定相同性的优选方法来给出测试序列之间的最大匹配。在公众可得到的计算机程序中编纂了确定相同性和相似性的方法。
用于确定两种序列之间相同性和相似性的优选计算机程序方法,包括但不限于GCG程序包(Devereux,J.等,Nucleic Acids Research,12(1):387(1984)),BLASTP,BLASTN和FASTA,Atschul,S.F.等,J.Molec.Biol.,215:403-410(1990)。BLASTX程序公众可从NCBI和其它来源获得(BLAST手册,Altschul,S.等,NCBI NLM NIHBethesda,Md.20894;Altschul,S.等,J.Mol.Biol.,215:403-410(1990)。例如采用计算机算法如GAP(遗传学计算机组,University of Wisconsin,Madison,Wis.),排列对比两种待测定的蛋白质或多肽的序列相同性百分比用于最佳匹配它们各自的氨基酸(“匹配范围”通过算法确定)。
空隙开放罚分(gap opening penalty)(计算为3x倍平均对角线;“平均对角线”是所用比较矩阵的对角线平均值;“对角线”是通过具体比较矩阵赋予各优选氨基酸的评分或数值)和空隙延伸罚分(gap extension penalty)(通常是空隙开放罚分的1/10倍)以及比较矩阵例如PAM250或BLOSUM 62可与此算法结合使用。此算法也可使用标准的比较矩阵(PAM250比较矩阵参见Dayhoff等,《蛋白质序列和结构图谱集》(Atlas ofProtein Sequence and Structure),第5卷,增补本3[1978];BLOSUM62比较矩阵参见Henikoff等,Proc.Natl.Acad.Sci.USA,89:10915-10919[1992])。然后用该算法计算相同性百分比。同源物与NTP蛋白、NTP肽、相关蛋白或相关肽相比,通常具有一个或多个氨基酸取代、缺失和/或插入。
术语“肽模拟物”或“模拟物”指能模拟肽或蛋白质的生物活性但在化学性质上不再是肽的生物活性化合物,即它们不再含任何肽键(即氨基酸间的酰胺键)。这里术语肽模拟物用于更广泛含义,包括性质上不再完全是肽的分子如假肽、半肽和拟肽(peptoid)。此广泛含义上的肽模拟物的例子(其中肽的一部分被缺乏肽键的结构取代)在下面描述。无论完全是或部分是非肽,本发明的肽模拟物提供了反应性化学组成成分的空间排列,肽模拟物所依据的这种排列非常类似于NTP肽相关蛋白或相关肽中活性基团的三维排列。由于这种相似的活性位点的几何结构,肽模拟物对生物系统的作用类似于NTP肽、相关蛋白或相关肽的生物活性。
本发明的肽模拟物优选在三维形状和生物活性上基本上类似于本文所述的NTP肽、相关蛋白或相关肽。本领域已知的结构上修饰肽以产生肽模拟物的方法的例子,包括倒置主链手性中心产生D-氨基酸残基结构,具体是在N-末端,使对蛋白酶降解的稳定性提高而对活性没有不利地影响。在论文“含氚D-丙氨酸1-肽T结合”,Smith C.S.等,Drug Development Res.,15,371-379页(1988)中描述了一个例子。第二种方法是改变稳定性所需的环状结构,如N到c的链间二酰亚胺和内酰胺(Ede等,Smith和Rivier编,《肽:化学和生物学》(Peptides:Chemistry andBiology),Escom,Leiden,1991,268-270页)。例子见构型限制的胸腺五肽样化合物,如美国专利号4,457,489(1985),Goldstein,G.等所公开的那样,其内容全部纳入本文供参考。第三种方法是用对蛋白水解有抗性的假肽键替换相关蛋白或相关肽中的肽键。
已报道了一些假肽键一般不影响肽的结构和生物活性。此方法的一个例子是取代逆一反转假肽键(“胸腺五肽的生物活性逆反转同源物”)(Biologically activeretroinverso analogue of thymopentin),Sisto A等,Rivier,J.E.和Marshall,G.R.编,“肽、化学、结构和生物学”(Peptides,Chemistry,Structure and Biology),Escom,Leiden,1990,722-773页)和Dalpozzo等(1993),Int.J.Peptide Protein Res.,41:561-566,纳入本文供参考)。根据此修饰,肽的氨基酸序列可能与上述NTP肽、相关蛋白或相关肽的序列相同,除了一个或多个肽键被逆转化假肽键所取代。优选大部分N-末端肽键被取代,由于这种取代将赋于N-末端对抗外肽酶的蛋白水解抗性。也可用其它类似结构的化学基团替代氨基酸的化学基团进行修饰。另一种已知可提高对抗酶裂解的稳定性而生物活性没有或很少损失的合适假肽键,是还原型电子等排物(isostere)假肽键(Couder等(1993),Int.J.Peptide Protein Res.,41:181-184,全部纳入本文供参考)。
因此,这些肽的氨基酸序列可能与NTP肽、相关蛋白或相关肽的序列相同,除了一个或多个肽键被电子等排物假肽键替代外。本文所用术语“氨基酸序列”优选指至少2个氨基酸的序列,优选至少4个,更优选至少5个。优选大部分N-末端肽键被取代,因为这种取代可赋予N-末端对抗外肽酶的蛋白水解抗性。合成具有一个或多个还原型电子等排的假肽键的肽是本领域已知的(Couder等,上面所引用)。另一个例子包括导入酮亚甲基键或甲硫键来替代肽键。
NTP肽、相关蛋白或相关肽的拟肽衍生物代表了另一类肽模拟物,它们保留了生物活性的重要结构决定簇,但去除了肽键,从而赋予对蛋白水解的抗性(Simon等,1992,Proc.Natl.Acad.Sci.USA,89:9367-9371,全部纳入本文供参考)。拟肽是N-取代的甘氨酸的寡聚物。已报道了一些N-烷基基团,各对应于天然氨基酸的侧链(Simon等,1992,见上面所引用)。NTP肽、相关蛋白或相关肽的一些或所有的氨基酸可用对应于被替代氨基酸的N-取代甘氨酸所替代。
术语“肽模拟物”或“模拟物”还包括反-D肽和下面定义的对映异构体。
术语“反-D肽”指与NTP肽、相关蛋白或相关肽的L-氨基酸序列相比,由反向顺序排列的D-氨基酸组成的生物活性蛋白质或肽。因此,L-氨基酸NTP肽、相关蛋白或相关肽的羧基末端残基成为D-氨基酸肽的氨基末端。例如,NTP肽、SSWDY变成TdDdWdSdSd,其中Dd、Sd、Wd和Yd是分别对应于L-氨基酸D、S、W和Y的D-氨基酸。
术语“对映异构体”指一种生物活性蛋白质或肽,其中NTP肽、相关蛋白或相关肽的氨基酸序列中一个或多个L-氨基酸残基被相应的D-氨基酸残基替代。
本文所描述的氨基酸和氨基酸残基可参考下表提供的公众接受的单字母或三字母码。
                  表    1
氨基酸            单字母符            三字母符
丙氨酸            A                   Ala
精氨酸            R                   Arg
天冬酰胺          N                   Asn
天冬氨酸          D                   Asp
半胱氨酸          C                   Cys
谷氨酰胺          Q                   Gln
谷氨酸            E                   Glu
甘氨酸            G                   Gly
组氨酸            H                   His
异亮氨酸          I                   Ile
亮氨酸            L                   Leu
赖氨酸            K                   Lys
甲硫氨酸          M                   Met
苯丙氨酸          F                   Phe
脯氨酸            P                   Pro
丝氨酸            S                   Ser
苏氨酸            T                   Thr
色氨酸            W                   Trp
酪氨酸            Y                   Tyr
缬氨酸            V                   Val
本发明涉及含有如本发明以上定义的细胞死亡肽的组合物。优选的细胞死亡肽与NTP肽类似或同源。然而,使用基于相关蛋白的部分或片段的细胞死亡肽也包括在本发明范围之内。例如,在许多人类和非人蛋白质(“相关蛋白”)中也发现了AD7c-NTP肽序列和类似的变体和同源物。特别是,AD7c-NTP基因含有Alu-型序列,它与那些也在人类和其它灵长类基因组的其它基因中发现的序列非常类似。
因此,可以理解,一些(如果不是全部)相关蛋白也将被证明是造成细胞死亡的有效制剂,因为它们含有肽序列与AD7c-NTP肽同源或非常类似(“相关肽”)。同样,此领域的一般技术人员可以基于任何相关蛋白的氨基酸序列来合成特定的相关肽,这些相关蛋白质是造成细胞死亡的有效制剂,并测试它们作为造成细胞死亡制剂的效力。
衍生自相关蛋白(它们被发现是造成细胞死亡的有效制剂)的其它肽序列也是可造成细胞死亡的有效制剂。此领域的一般技术人员无需过多实验就可合成跨越所述蛋白质整个氨基酸序列的有效相关蛋白的片段,以便鉴定其它有效的肽序列。
一些相关蛋白包括以下已知含有与NTP肽序列相同、非常类似或同源的氨基酸的蛋白质。
蛋白质      序列    蛋白质的氨基酸序列
鉴定编号    编号
(PID)
g10121865    20    MEVSPLQPVNENMQVN KIKKNEDAKKRLSVER IYQKKTQLEHILLRPD
                   TYIGSVELVTQQMWVY DEDVGINYREVTFVPG LYKIFDEILVNAADNK
                   QRDPKMSCIRVTIDPE NNLISIWNNGKGIPVV EHKVEKMYVPALIFGQ
                   LLTSSNYDDDEKKVTG GRNGYGAKLCNIFSTK FTVETASREYKKMFKQ
                   TWMDNMGRAGEMELKP FNGEDYTCITFQPDLS KFKMQSLDKDIVALMV
                   RRAYDIAGSTKDVKVF LNGNKLPVKGFRSYVD MYLKDKLDETGNSLKV
                   IHEQVNHRWEVCLTMS EKGFQQISFVNSIATS KGGRHVDYVADQIVTK
                   LVDVVKKKNKGGVAVK AHQRELCNGAILAHCN LRLMGSSDSPASASRV
                   AGIAGGCHHTQLIFVF LVETGFHHVGQAGLER LTSGDPPASASQSSGI
                   TDVKVKNHMWIFVNAL IENPTFDSQTKENMTL QPKSFGSTCQLSEKFI
                   KAAIGCGIVESILNWV KFKAQVQLNKKCSAVK HNRIKGIPKLDDANDA
                   GGRNSTECTLILTEGD SAKTLAVSGLGVVGRD KYGVFPLRGKILNVRE
                   ASHKQ
g10257409    21    MTGDKGPQRLSGSSYG SISSPTSPTSPGPQQA PPRETYLSEKIPIPDT
                   KPGTFSLRKLWAFTGP GFLMSIAFLDPGNIES DLQAGAVAGFKLLWVL
                   LWATVLGLLCQRLAAR LGVVTGKDLGEVCHLY YPKSESRSVAQSGVQW
                   CDVSSLQPLPPRCPAP SSG
g10433567    22    MMLSVQENVHRCICKH YAPPTAPHLFFETESH SVTQAGVQWCDLGSLQ
                   PSPPGFKQFSCLSLSR SWDYRRVPLCLANFIV FLVETGFCRVGQAGLK
                   LLTSSDLPASACQSAG DYRHEPLRLALTLCHF ISRTCTSVDFYICRDL
                   ERIPHGH
g10434441    23    MISAHRNLHLPGSSNS PASAFLSSWDYRHVPP CPANVVFLVEMGFLHV
                   GQAGLELPTSDDPPTL ASQSAGITGVSHRTWQ EFASLTVSQAVLRMLV
                   WGPQFENHCSKLLMAS EGDSSLVFFLYPLSNL N
g10436387    24    MQGSHSAVQAGVWWCH HDSLQPWPPGLRRSSC LSLQSLWDYRSLALSL
                   RLACNGTTSAHCDLCL LSSSDSPASASQVAGI TGEKTAEPHKAHAAQG
                   ERHLSSHMSPDENMTE KFCPGPRASFHLRILA ASRHLVKRLLNEYTVT
                   VLRDKSYLRNN
g10437485    25    MKNYYYFLGQGLTLSP RLECSSTISAHCNLHL LGSSNSPVAASPVAGT
                   TGTCHHDWLIFVFLVE TGFHHIGQTGLEFLTS GDPPTLASKSAGITGV
                   SHCAWPTFLLNDMRHS FNKNLVIIFYVPAIS
g10441986    26    MRRELLAGILLRITFN FFLFFFLPFPLVVFFI YFYFYFFLEMESHYVA
                   QAGLELLGSSNPPASA SLVAGTLSVHHCACFE SFTKRKKKLKKAFRFI
                   QCLLLGLLKVRPLQHQ GVNSCDCERGYFQGIF MQAAPWEGT
g10945428    27    MSKTLKKKKHWLSKVQ ECAVSWAGPPGDFGAE IRGGAERGEFPYLGRL
                   REEPGGGTCCIVSGKA PNPSDVLLEVNGTPVS GLTNRDTLAVIRHFRE
                   PIRLKTVKPGKVINKD LRHYLSLQFQKGSIDH KLQQVIRDNLYLRTIP
                   CTTRAPRDGEVPGVDY NFISVEQFKALEESGA LLESGTYDGNFYGTPK
                   PPAEPSPFQPDPVDQV LFDNEFDAESQRKRTT SVSKMERMDSSLPEEE
                   EDEDKGAINGSGNAEN RERHSESSDWMKTVPS YNQTNSSMDFRNYMMR
                   DETLEPLPKNWEMAYT DTGMIYFIDHNTKTTT WLDPRLCKKAKAPEDC
                   EDGELPYGWEKIEDPQ YGTYYVDFTLVAQAGV QWHDLGSLQPPPPGFN
                   HLNQKTQFENPVEEAK RKKQLGQVEIGSSKPD MEKSHFTRDPSQLKGV
                   LVRASLKKSTMGFGFT IIGGDRPDEFLQVKNV LKDGPAAQDGKIAPGD
                   VIVDINGNCVFGHTHA DVVQMFQLVPVNQYVN LTLCRGYPLPDDSEDP
                   VVDIVAATPVINGQSL TKGETCMNPQDFKPGA MVLEQNGKSGHTSTGD
                   GLNGPSDASEQRVSMA SSGSSQPELVTIPLIK GPKGFGFAIADSPTGQ
                   KVKMILDSQWCQGLQK EDIIKEIYHQNVQNLT HLQVVEVLKQFPVGAD
                   VPLLILRGGPPSTTKT AKMKTDKKENAGSLEA INEPIPQPMPFPPSII
                   RSGSPKLDPSEVYLKS KTLYEDKPPNTKDLDV FLRKQESGFGFRVLGG
                   DGPDQSIYIGAIIPLG AAEKDGRLRAADELMC IDGIPVKGKSHKQVLD
                   LMTTAARNGHVLLTVR RKIFYGEKQPEDDSSQ AFISTQNGSPRLNRAE
                   VPARPAPQEPYDVVLQ RKENEGFGFVILTSKN KPPPGVIPHKIGRVIE
                   GSPADRCGKLKVGDHI SAVNGQSIVELSHANI VQLIKDAGVTVTLTVI
                   AEEEHHGPPSGTNSAR QSPALQHRPMGQSQAN HIPGDRSALEGEIGKD
                   VSTSYRHSWSDHKHLA QPDTAVISVVGSRHNQ NLGCYPVELERGPRGF
                   GFSLRGGKEYNMGLFI LRLAEDGPAIKDGRIH VGDQIVEINGEPTQGI
                   THTRAIELIQAGGNKV LLLLRPGTGLIPDHGL APSGLCSYVKPEQH
 g1117849    28    MADDQGCIEEQGVEDS ANEDSVDAKPDRSSFV PSLFSKKKKNVTMRSI
                   KTTRDRVPTYQYNMNF EKLGKCIIINNKNFDK VTGMGVRNGTDKDAEA
                   LFKCFRSLGFDVIVYN DCSCAKMQDLLKKASE EDHTNAACFACILLSH
                   GEENMESCSVTQAGVQ RRDLGRLQPPPPRLAE GPSLMMASRPTRGPSM
                   TQMLILDTRSQWKLTS SSPIPRFQAITRGGAQ EEAPGLCKPSAPSWRS
                   TEKTWKSCRSSPG
g11493409    29    MGLSIASHFGLLIKKV ERNILFFFRRSLALCQ AGVQWRYLSQLTAASA
                   SWVQAILCLSLPSSWD YRHMPPRPANFCILSR DGISPCWPGWSRSLDL
                   VIRPPRPPKVLRLQA
g11493483    30    MQIIFFFLFLRWSFTL VAQAGVQWRDLSSPQP PPPRFKRFSCLSPPSS
                   WDYRHAPPHPANFVFL VETGFLRVGQAGLELL TSGDPPASASQSAGIT
                   GVSHHTQPDANNFLRK LFQKLF
g12654881    31    MGHPRAIQPSVFFSPY DVHFLLYPIRCPYLKI GRFHIKLKGLHFLFSF
                   LFFFFETQSHSVTRLE CSGTISAHCNLCLPGS SNSPASASQVAGTTGT
                   CHHAQLI FVFLAEMGF HHIGQDGLDLNLVIHP PRSPKALGLQA
g12803929    32    MPNHYSFCFCFCFCFR RSLALSPRLECSGAIL AHGKLHLPGSRHSPAS
                   ASPVAGTKGARHHARL IFLYF
g13359183    33    LFTNSPFSLLSPAQWL CFGTHLGHVQSVSHLQ WEGSVQESLRSVRNSR
                   CALPMLSAPCSLSLHF LLFSLSPFFFFEIRVL LYRQAGVQWCYLGSLQ
                   PLPPGFKQFSCLSYPS SWDYRRPPPRQANFCI FSTDGVSPCWPRWSLS
                   LDLMIRPPQPPEVLGL QV
g13375624    34    MGRLVLLWGAAVFLLG GWMALGQGGAEGVQIQ IIYFNLETVQVTWNAS
                   KYSRTNLTFHYRFNGD EAYDQCTNYLLQEGHT SGCLLDAEQRDDILYF
                   SIRNGTHPVFTASRWM VYYLKPSSPKHVRFSW HQDAVTVTCSDLSYGD
                   LLYEVQYRSPFDTEWQ TQSRSVTQAGVQWCDL CLLQPSPPRFKRFSCL
                   SLPSSWDYRHPPPRLA NFCIISRDGVSPCWPG WSRTCDLR
g13376528    35    MEFLKVARRNKREQLE QIQKELSVLEEDIKRV EEMSGLYSPVSEDSTV
                   PQFEAPSPSHSSIIDS TEYSQPPGFSGSSQAG VQWRYLGSLQPPPPRY
                   KRFSCLTLPSSWDYRR LPPHLTKKQPWYNSTL ASRRKRLTAHFEDLEQ
                   CYFSTRMSRISDDSRT ASQLDEFQECLSKFTR YNSVRPLATLSYASDL
                   YNGSSIVSSIEFDRDC DYFAIAGVTKKIKVYE YDTVIQDAVDIHYPEN
                   EMTCNSKISCISWSSY HKNLLASSDYEGTVIL WDGFTGQRSKVYQEHE
                   KRCWSVDFNLMDPKLL ASGSDDAKVKLWSTNL DNSVASIEAKANVCCV
                   KFSPSSRYHLAFGCAD HCVHYYDLRNTKQPIM VFKGHRKAVSYAKFVS
                   GEEIVSASTDSQLKLW NVGKPYCLRSFKGHIN EKNFVGLASNGDYIAC
                   GSENNSLYLYYKGLSK TLLTFKFDTVKSVLDK DRKEDDTNEFVSAVCW
                   RALPDGESNVLIAANS QGTIKVLELV
g13376550    36    MGSYFVARAGCKLLGL KGTSHFSLPKCRNCRR EPLPGLFFLFFVFFFL
                   RRSLALSPRLECSGAI VAHCKLGLPGSLHSPA SASQVAGTIGTCHNTR
                   IIFCILVETGFHRVSQ DGVDLLTL
g13430856    37    MDCGSVGGQRTQRLPG RQRLLFLPVGLSGRPG GSETSARRCPSALSDG
                   LGALRPRAPAARGGVS RASPLLLLLLVPSPRL AAAAPRRQLGDWERSR
                   LGYAAPPAGRSGAWRC SPGVAAAAGALPQYHG PAPALVSCRRELSLSA
                   GSLQLERKRRDFTSSG SRKLYFDTHALVCLLE DNESHSFIQAGVQWHS
                   LGLLQPPPPGFKRSSH LILLSSWDYRHAPPHL DNFSVFLLETGFHHVG
                   QAGLKLLTSSDPPTLA S
g13431835    38    MSPATTGTFLLTVYSI FSKVHSDRNVYPSAGV LFVHVLEREYFKGEFP
                   PYPKPGEISNDPITFN TNLMGYPDRPGWLRYI QRTPYSDGVLYGSPTA
                   ENVGKPTIIEITAYNR RTFETARHNLIINIMS AEDFPLPYQAEFFIKN
                   MNVEEMLASEVLGDFL GAVKNVWQPERLNAIN ITSALDRGGRVPLPIN
                   DLKEGVYVMVGADVPF SSCLREVENPQNQLRC SQEMEPVITCDKKFRT
                   QFYIDWCKISLVDKTK QVSTYQEVIRGEGILP DGGEYKPPSDSLKSRD
                   YYTDFLITLAVPSAVA LVLFLILAYIMCCRRE GVEKRNMQTPDIQLVH
                   HSAIQKSTKELRDMSK NREIAWPLSTLPVFHP VTGEIIPPLHTDNYDS
                   TNMPLMQTQQWSFAPV AQAGVQWRDLGSLQPP PPRNLPHQTQIPQQQT
                   TGKWYP
g13435153    39    MLGLRKAAAISLLLRN VGLQLATLLMSQKKLG FCGNFLFLNLAIIQTK
                   ISSSFFFFLRQSLTLS PRLECNGAISAHCHLR LPDSSNSPASASQVTG
                   ITGSHHHAWLIFVFLV ETGFCHVGQDGLELLT SGDPPASASQSAGITG
                   MSHHTWPTDLFFKTVL PARLGLWDSSV
g13489079    40    MHAVPRGFGKKVRVGV QSCPSPFSGQACPQPS SVFWSLLKNLPFLEHL
                   ELIGSNFSSAMPRNEP AIRNSLPPCSRAQSVG DSEVAAIGQLAFLRHL
                   TLAQLPSVLTGSGLVN IGPQCQQLRSLSLANL GMMGKVVYMPALSDML
                   KHCKRLRDLRLEQPYF SANAQFFQALSQCPSL QRLCLVSRSGTLQPDA
                   VLAFMARCLQVVMCHL FTGESLATCKSLQQSL LRRWGEVTGRRPQLFT
                   ELREEPSARTSRATGR RQPCLPDSGVVCCPCG RPLAVSGIILVGVSPS
                   LVVKTTCVYRVLFKNL DYASIFFLVCLFETES HSVVQAGVQWRDLSSL
                   QPLLSGLQPQPPEQLE NELEIGFSYCFVI
g13489081    41    MEEDEFIGEKTFQRYC AEFIKHSQQIGDSWEW RPSKDCSDGYMCKIHF
                   QIKNGSVMSHLGASTH GQTCLPMEVKSCSVTQ AGVQLRDLSSLQPPPS
                   GFKQFSCLSLPSNWDY RGSPLHLANFLYF
g13540498    42    MTTCEFEFIFLKEQVT RICNIAPLKAYFSVHK MGKILKKLSNFSFLTH
                   RQSLTLSPRLECSGAI SAHCNLHLLGSSNSAA SASRVAGTTGACHHAQ
                   LIFVFLVETGFHHVGQ DGLGLLTS
g13543287    43    MSCNPSFGGIGKGHLM REVDALDGLCSRICDQ SGVHYKVLNRRKGPAV
                   WGLRAQIDRKLYKQNM QKEILNTPLLTVQEGA VEDLILTEPEPEHTGK
                   CRVSGVVLVDGSTVYA ESVILTTGTFLRGMIV IGLETHPAGRLGDQPS
                   IGLAQTLEKLGFVVGR LKTGTPPRIAKESINF SILNKHIPDNPSIPFS
                   FTNETVWIKPEDQLPC YLTHTNPRVDEIVLKN LHLNSHVKETTRGPRY
                   CPSIESKVLRFPNRLH QVWLEPEGMDSDLIYP QGLSMTLPAELQEKMI
                   TCIRGLEKAKVIQPDG VLLLLPRMECNGAISA HHNLPLPGYGVQYDYL
                   DPRQITPSLETHLVQR LFFAGQINGTTGYEEA AAQGVIAGINASLRVS
                   RKPPFVVSRTEGYIGV LIDDLTTLGTSEPYRM FTSRVEFRLSLRPDNA
                   DSRLTLRGYKDAGCVS QQRYERACWMKSSLEE GISVLKSIEFLSSKWK
                   KLIPEASISTSRSLPV RALDVLKYEEVDMDSL AKAVPEPLKKYTKCRE
                   LAERLKIEATYESVLF HQLQEIKGVQQDEALQ LPKDLDYLTIRDVSLS
                   HEVREKLHFSRPQTIG AASRIPGVTPAAIINL LRFVKTTQRRQSAMNE
                   SSKTDQYLCDADRLQE REL
g13569856    44    MPFLYDISSCWTSFCF LFFSPLDGVLLCFPGW NAVARSQLTATSASQV
                   QAILLVSASGVAGIIG TCHHAQPIFVFLVEMG FHHVGQACLKLLNSGD
                   PPASASQSAGITGMSH HARPFFFFFSF
g13591868    45    MSEAENEFINWVATAA IEANCSQCWLCVELPE AAGNGLPWRIVPANIS
                   EWICQYQWEWDNTWFC FDFLSQSVSLSPRLEC SGTILAQCNLCLLGSS
                   DSPASASQVAGIIGAC RHAWLIFCIFSRDGVS PYCPG
g13591870    46    MALFLDKMGSLQKGNY SSQSGMIPGSWQHKMK LQLILKSSKAYYVLSD
                   AAMSLQKYGRALRYIK LALQSHDTYCCLCTNM LSEVLLFLSQYLTLCG
                   DIQLMLAQNANNRAAH LEEFHYQTKEDQEILH SLHRESSCQGVPQAWT
                   TWFTVGLCSLAHAYLS IQKRGRNIRVLIFALY LFIYFLRRSFALVAQA
                   GVQWCNLGSLKPPPPG FKQFSCLSLPSSWNYR HAPPCPASPPWPPKVL
                   GLQV
g1362993    47     RSLTLWPSLEYSGTIS AHCNLRLPGSSDSRAS ASRAAGITGVSHCARP
                   CMLFDPEFDLLAGVQL LPFEPPTGKALSRKD
g13631907    48    MEFRKLRGMETRPPAN TARLQPPRDLRSSSPR KQLSESSDDDYDDVDI
                   PTPAEDTPPPLPPKPK FRSPSDEGPGSMGDDG QLSPGVLVRCASGPPP
                   NSPRPGPPPSTSSPHL TAHSEPSLWNPPSREL DKPPLLPPKKEKMKRK
                   GCALLVKLFNGCPLRI HSTAAWTHPSTKDQHL LLGAEEGIFILNRNDQ
                   EATLEMLFPSRTTWVY SINNVLMSLSGKTPHL YSHSILGLLERKETRA
                   GNPIAHISPHRLLARK NMVSTKIQDTKGCRAC CVAEGASSGGPFLCGA
                   LETSVVLLQWYQPMNK FLLVRQVLFPLPTPLS VFALLTGPGSELPAVC
                   IGVSPGRPGKSVLFHT VRFGALSCWLGEMSTE HRGPVQVTQVEEDMVM
                   VLMDGSVKLVTPEGSP VRGLRTPEIPMTEAVE AVAMVGGQLQAFWKHG
                   VQVWALGSDQLLQELR DPTLTFRLLGSPRLEC SGTISPHCNLLLPGSS
                   NSPASASRVAGITGL
g13644612    49    MSMVLGGPFSKGHTAS DEYFQIFHNISFFETE SCSVAQAGVQWCNLGS
                   LQALPPRFTPFSCLSL PSSWDYRHPPPCPDNV FVFSVETGLHCVSQDG
                   LNLLTL
g13646055    50    MDCGSVGGQRTQRLPG RQRLLFLPVGLSGRPG GSETSARRCLSALSDG
                   LGALRPRAPAARGGVS RASPLLLLLLVPSPRL AAAAPRRQLGDWERSR
                   LGYAAPPAGRSSAWRC SPGVAAAAGALPQYHG PAPALVSCRRELSLSA
                   GSLQLERKRRDFTSSG SRKLYFDTHALVCLLE DNESHSFIQAGVQWHS
                   LGLLQPPPPGFKRSSH LILLSSWDYRHAPPHL DNFSVFLLETGFHHVG
                   QAGLKLLTSSDPPTLA S
g13646423    51    MNFFFKTEFLSVTQAG MQWHNFSSLQPLPPGF KQFSCLSLLSSWDYRH
                   TPPCPANFCIFSRGGV SPCWSGWSRTPDFMIH PPRPPKVLRLQK
g13648611    52    MPLAAYCYLRVVGKGS YGEVTLVKHRRDGKQY VIKKLNLRNASSRERR
                   AAEQEAQLLSQLKHPN IVTYKESWEGGDGLLY IVMGFCEGGDLYRKLK
                   EQKGQLLPENQVVEWF VQIAMALQYLHEKHIL HRDLKTQNVFLTRTNI
                   IKVGDLGIARVLENHC DMASTLIGTPYYMSPE LFSNKPYNYKSDVWAL
                   GCCVYEMATLKHAFNA KDMNSLVYRIIEGKLP PMPRDYSPELAELIRT
                   MLSKRPEERPSVRSIL RQPYIKRQISFFLEAT KIKTSKNNIKNGDSQS
                   KPFATVVSGEAESNHE VIHPQPLSSEGSQTYI MGEGKCLSQEKPRASG
                   LLKSPASLKAHTCKQD LSNTTELATISSVNID ILPAKGRDSVSDGFVQ
                   ENQPRYLDASNELGGI CSISQVEEEMLQDNTK SSAQPENLIPMWSSDI
                   VTGEKNEPVKPLQPLI KEQKPKDQSLALSPKL ECSGTILAHSNLRLLG
                   SSDSPASASRVAGITG VCHHAQDQVAGECIIE KQGRIHPDLQPHNSGS
                   EPSLSRQRRQKRREQT EHRGEKRQVRRDLFAF QESPPRFLPSHPIVGK
                   VDVTSTQKEAENQRRV VTGSVSSSRSSEMSSS KDRPLSARERRRLKQS
                   QEEMSSSGPSVRKASL SVAGPGKPQEEDQPLP ARRLSSDCSVTQERKQ
                   IHCLSEDELSSSTSST DKSDGDYGEGKGQTNE INALVQLMTQTLKLDS
                   KESCEDVPVANPVSEF KLHRKYRDTLILHGKV AEEAEEIHFKELPSAI
                   MPGSEKIRRLVEVLRT DVIRGLGVQLLEQVYD LLEEEDEFDREVRLRE
                   HMGEKYTTYSVKARQL KFFEENMNF
g13651342    53    MFISFGRLIFSFFLTW SLSLSPRLECSGTILA HCNPTSQVQAILPASA
                   SRVAGITGMHHHTCLI FVLLVKMGFCHVGHAG LELVT
g13652010    54    MESGQPSLSFYFLFIY FFEIGSHFVTQAGVQW HNLDSLQLSLASAPQV
                   AGTTGACHHARLIFGV FCRDWVLPC
g13653409    55    MLLVDADQPEPMRSGA RELALFLTPEPGAEAK EVEETIEGMLLRLEEF
                   CSLADLIRSDTSQILE ENIPVLKAKLTEMRGI YAKVDRLEAFVKMVGH
                   HVAFLEADVLQAERDH GAFPQALRRWLGSAGL PSFRNVECSGTIPARC
                   NLRLPGSSDSPASASQ VAGIPEVTCTGARDVR AAHTV
g13699916    56    MSRGNENRLTHRRQTV LREKGRRLANRGPAYM FNDHSTSLSIEEERFL
                   DAAEYGNIPVVRKMLE ECLSLNVNCVDYMGQN ALQLAVANEHLEITEL
                   LLKKENLSRVGDALLL AISKGYVRIVEAILNH PAFAEGKRLATSPSQS
                   ELQQDDFYAYDEDGTR FSHDVTPIILAAHCQE YEIVHTLLRKGARIER
                   PHDYFCKCTECSQKQK HDSFSHSRSRINAYKG LASPAYLSLSSEDPVM
                   TALELSNELAVLANIE KEFKNDYRKLSMQCKD FVVGLLDLCRNTEEVE
                   AILNGDAETRQPGDLA RPNLSRLKLAIKYEVK KFVAHPNCQQQLLSIW
                   YENLSGLRQQTMAVKF LVVLAVAIGLPFLALI YWCAPCSKMGKILRGP
                   FMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNARQLFRMK
                   TSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLA
                   IFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLAR
                   IKWDPTDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTV
                   KDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLF
                   WAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMI
                   NSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLLY
                   LLLKFKKWMSELIQGH KKGFQEDAEMNKRNEE KKFGILGSHEDLSKFS
                   LDRNQLAHNKQSSTRS SEDFHLNSFSNPPRQY QKIMKRLIKRYVLQAQ
                   IDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRKLGER
                   LSLESKQEESRR
g13702149    57    MSRGNENRLTHRRQTV LREKGRRLANRGPAYM FNDHSTSLSIEEERFL
                   DAAEYGNIPVVRKMLE ECLSLNVNCVDYMGQN ALQLAVANEHLEITEL
                   LLKKENLSRVGDALLL AISKGYVRIVEAILNH PAFAEGKRLATSPSQS
                   ELQQDDFYAYDEDGTR FSHDVTPIILAAHCQE YEIVHTLLRKGARIER
                   PHDYFCKCTECSQKQK HDSFSHSRSRINAYKG LASPAYLSLSSEDPVM
                   TALELSNELAVLANIE KEFKNDYRKLSMQCKD FVVGLLDLCRNTEEVE
                   AILNGDAETRQPGDLA RPNLSRLKLAIKYEVK KFVAHPNCQQQLLSIW
                   YENLSGLRQQTMAVKF LVVLAVAIGLPFLALI YWCAPCSKMGKILRGP
                   FMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNARQLFRMK
                   TSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLA
                   IFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLAR
                   IKWDPTDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTV
                   KDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLF
                   WAIFGLSEVRSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMI
                   NSSFQEI ERNEEKKFG ILGSHEDLSKFSLDRN QLAHNKQSSTRSSEDF
                   HLNSFSNPPRQYQKIM KRLIKRYVLQAQIDKE SDEVNEGELKEIKQDI
                   SSLRYELLEEKSQNTE DLAELIRRLGERLSLE SKQEESRR
g14043238    58    MESRSVAQAGVQWPDL GSLQPLPPRFKRFFCL SLQSSWDYRHAPPRPA
                   NFVFLVETGFCHVSQA GLELLTSSDPPPRPPK VLR
g14192931    59    MISVHCNLCLPGSSDP PASASQVAGITGVRHC MASGAVLNKVRRHQCS
                   GDLEVRGSHGSLGEAP WGKSVPGRGTASRKGP GAGVIGNSKEASTGRA
                   QWSAPVIPATQEAKAG GLLEPRSLISAWATYQ DLISINKLKEKRG
g14198309    60    MTRSLFKGNFWSADIL STIGYDNIIQHLNNGR KNCKEFEDFLKERAAI
                   EERYGKDLLNLSRKKP CGQSEINTLKRALEVF KQQVDNVAQCHIQLAQ
                   SLREEARKMEEFREKQ KLQRKKMESHSVTQAG AQWHDLGSLQALPPGF
                   MPFSCLSLPSSWNYRL PPPPRLAEPRNQDHGV A
g14249973    61    MESHSVTQAGVQWRDL GSLQPLPPGFKQFSHL SLPSSWDYRRVPPYLG
                   NFCIFSGEGVSPCWPG WS
g16226025    62    MGSLSTANVEFCLDVF KELNSNNIGDNIFFSS LSLLYALSMVLLGARG
                   ETAEQLEKVLHFSHTV DSLKPGFKDSPKCSQA GRIHSEFGVEFSQINQ
                   PDSNCTLSIANRLYGT KTMAFHQQYLSCSEKW YQARLQTVDFEQSTEE
                   TRKTINAWVENKTNGK VANLFGKSTIDPSSVM VLVNTIYFKGQRQNKF
                   QVRETVKSPFQLSEGK NVTVEMMYQIGTFKLA FVKEPQMQVLELPYVN
                   NKLSMIILLPVGIANL KQIEKQLNSGTFHEWT SSSNMMEREVEVHLPR
                   FKLEIKYELNSLLKPL GVTDLFNQVKADLSGM SPTKGLYLSKAIHKSY
                   LDVSEEGTEAAAATGD SIAVKSLPMRAQFKAN HPFLFFIRHTHTNTIL
                   FCGKLASP
g16517174    63    MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASV
                   KKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYV
                   GDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDIT
                   PIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRH
                   SRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSE
                   YEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLAR
                   LKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFII
                   GLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLAS
                   QHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHD
                   WWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEAL
                   FAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLL
                   AFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIF
                   GLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSY
                   QLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKW
                   IWTHLCKKKMRRKPES FGTIGVRTQHRRAADN LRRHHQYQEVMRNLVK
                   RYVAAMIRDAKTEEGL TEENFKELKQDISSFR FEVLGLLRGSKLSTIQ
                   SANASKESSNSADSDE KSDSEGNSKDKKKNFS LFDLTTLIHPRSAAIA
                   SERHNISNGSALVVQE PPREKQRKVNFVTDIK NFGLFHRRSKQNAAEQ
                   NANQIFSVSEEVARQQ AAGPLERNIQLESRGL ASRGDLSIPGLSEQCV
                   LVDHRERNTDTLGLQV GKRVCPFKSEKVVVED TVPIIPKEKHAKEEDS
                   SIDYDLNLPDTVTHED YVTTRL
g16517176    64    MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASV
                   KKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYV
                   GDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDIT
                   PIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRH
                   SRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSE
                   YEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLAR
                   LKLAIKYRQKEASYGE KLNRCGMADFRTTSMI GGI
g16758330    65    MSQSPGFVTRRGGSPK AAPGAGARRNESQDYL LMDELGDDGYPQLQQP
                   PYGYYPSFRGNENRLT HRRQTVLREKGRRLAN RGPAYMFNDHSTSLSI
                   EEERFLDAAEYGNIPV VRKMLEECLSLNVNCV DYMGQNALQLAVANEH
                   LEITELLLKKENLSRV GDALLLAISKGYVRIV EAILNHPAFAEGKRLA
                   TSPSQSELQQDDFYAY DEDGTRFSHDVTPIIL AAHCQEYEIVHTLLRK
                   GARIERPHDYFCKCTE CSQKQKHDSFSHSRSR INAYKGLASPAYLSLS
                   SEDPVMTALELSNELA VLANIEKEFKNDYRKL SMQCKDFVVGLLDLCR
                   NTEEVEAILNGDAETR QPGDLARPNLSRLKLA IKYEVKKFVAHPNCQQ
                   QLLSIWYENLSGLRQQ TMAVKFLVVLAVAIGL PFLALIYWCAPCSKMG
                   KILRGPFMKFVAHAAS FTIFLGLLVMNAADRF EGTKLLPNETSTDNAR
                   QLFRMKTSCFSWMEML IISWVIGMIWAECKEI WTQGPKEYLFELWNML
                   DFGMLAIFAASFIARF MAFWHASKAQSIIDAN DTLKDLTKVTLGDNVK
                   YYNLARIKWDPTDPQI ISEGLYAIAVVLSFSR IAYILPANESFGPLQI
                   SLGRTVKDIFKFMVIF IMVFVAFMIGMFNLYS YYIGAKQNEAFTTVEE
                   SFKTLFWAIFGLSEVK SVVINYNHKFIENIGY VLYGVYNVTMVIVLLN
                   MLIAMINSSFQEIEDD ADVEWKFARAKLWFSY FEEGRTLPVPFNLVPS
                   PKSLLYLLLKFKKWMS ELIQGHKKGFQEDAEM NKRNEEKKFGILGSHE
                   DLSKFSLDRNQLAHNK QSSTRSSEDFHLNSFS NPPRQYQKIMKRLIKR
                   YVLQAQIDKESDEVNE GELKEIKQDISSLRYE LLEEKSQNTEDLAELI
                   RKLGERLSLESKQEES RR
g1710216    66     MGHPRAIQPSVFFSPY DVHFLLYPIRCPYLKI GRFHIKLKGLHFLFSF
                   LFFFFETQSHSVTRLE CSGTISAHCNLCLPGS SNSPASASRVAGTAGT
                   CRRAQLIFVFLAEMGF HHVGRDGLDLNLVIHP PRSPKALGLQA
g17978303    67    MGSLSTANVEFCLDVF KELNSNNIGDNIFFSS LSLLYALSMVLLGARG
                   ETAEQLEKVLHFSHTV DSLKPGFKDSPKCSQA GRIHSEFGVEFSQINQ
                   PDSNCTLSIANRLYGT KTMAFHQQYLSCSEKW YQARLQTVDFEQSTEE
                   TRKMINAWVENKTNGK VANLFGKSTIDPSSVM VLVNTIYFKGQRQNKF
                   QVRETVKSPFQLSEGK NVTVEMMYQIGTFKLA FVKEPQMQVLELPYVN
                   NKLSMIILLPVGIANL KQIEKQLNSGTFHEWT SSSNMMEREVEVHLPR
                   FKLEIKYELNSLLKPL GVTDLFNQVKADLSGM SPTKGLYLSKAIHKSY
                   LDVSEEGTEAAAATGD SIAVKSLPMRAQFKAN HPFLFFIRHTHTNTIL
                   FCGKLASP
g18376629    68    MLRNSTFKNMQRRHTT LREKGRRQAIRGPAYM FNEKGTSLTPEEERFL
                   DSAEYGNIPVVRKMLE ESKTLNFNCVDYMGQN ALQLAVGNEHLEVTEL
                   LLKKENLARVGDALPL AISKGYVRIVEAILNH PAFAQGQRLTLSPLEQ
                   ELRDDDFYAYDEDGTR FSHDITPIILAAHCQE YEIVHILLLKGARIER
                   PHDYFCKCNECTEKQR KDSFSHSRSRMNAYKG LASAAYLSLSSEDPVL
                   TALELSNELARLANIE TEFKNDYRKLSMQCKD FVVGVLDLCRDTEEVE
                   AILNGDVNFQVWSDHH RPSLSRIKLAIKYEVK KFVAHPNCQQQLLTMW
                   YENLSGLRQQSIAVKF LAVFGVSIGLPFLAIA YWIAPCSKLGRTLRSP
                   FMKFVAHAVSFTIFLG LLVVNASDRFEGVKTL PNETFTDYPKQIFRVK
                   TTQFSWTEMLIMKWVL GMIWSECKEIWEEGPR EYVLHLWNLLDFGMLS
                   IFVASFTARFMAFLKA TEAQLYVDQHVQDDTL HNVSLPPEVAYFTYAR
                   DKWWPSDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTV
                   KDIFKFMVIFIMVFVA FMIGMFNLYSYYRGAK YNPAFTTVEESFKTLF
                   WSIFGLSEVISVVLKY DHKFIENIGYVLYGVY NVTMVVVLLNMLIAMI
                   NNSYQEIEEDADVEWK FARAKLWLSYFDEGRT LPAPFNLVPSPKSFYY
                   LIMRIKMCLIKLCKSK AKSCENDLEMGMLNSK FKKTRYQAGMRNSENL
                   TANNTLSKPTRYQKIM KRLIKRYVLKAQVDRE NDEVNEGELKEIKQDI
                   SSLRYELLEEKSQATG ELADLIQQLSEKFGKN LNKDHLRVNKGKDI
g1843388    69     MKVRLLRQLSAAAKVK APSGLQGPPQAHQFIS LLLEEYGALCQAARSI
                   STFLGTLENEHLKKFQ VTWELHNKHLFENLVF SEPLLQSNLPALVSQI
                   RLGTTTHDTCSEDTYS TLLQRYQRSEEELRRV AEEWLECQKRIDAYVD
                   EQMTMKTKQRMLTEDW ELFKQRRFIEEQLTNK KAVTGENNFTDTMRHV
                   LSSRLSMPDCPNCNYR RRCACDDCSLSHILTC GIMDPPVTDDIHIHQL
                   PLQVDPAPDYLAERSP PSVSSASSGSGSSSPI TIQQHPRLILTDSGSA
                   PTFCSDDEDVAPLSAK FADIYPLSNYDDTEVV ANMNGIHSELNGGGEN
                   MALKDESPQISSTSSS SSEADDEEADGESSGE PPGAPKEDGVLGSRSP
                   RTEESKADSPPPSYPT QQAEQAPNTCECHVCK QEASGLTPSAMTAGAL
                   PPGHQFLSPEKPTHPA LHLYPHIHGHVPLHTV PHLPRPLIHPTLYATP
                   PFTHSKALPPAPVQNH TNKHQVFNASLQDHIY PSCFGNTPEWNSSKFI
                   SLWGSEVMNDKNWNPG TFLPDTISGSEILGPT LSETRPEALPPPSSNE
                   TPAVSDSKEKKNAAKK KCLYNFQDAFMEANKV VMATSSATSSVSCTAT
                   TVQSSNSQFRVSSKRP PSVGDVFHGISKEDHR HSAPAAPRNSPTGLAP
                   LPALSPAALSPAALSP ASTPHLANLAAPSFPK TATTTPGFVDTRKSFC
                   PAPLPPATDGSISAPP SVCSDPDCEGHRCENG VYDPQQDDGDESADED
                   SCSEHSSSTSTSTNQK EGKYCDCCYCEFFGHG GPPAAPTSRNYAEMRE
                   KLRLRLTKRKEEQPKK MDQISERESVVDHRRV EDLLQFINSSETKPVS
                   STRAAKRARHKQRKLE EKARLEAEARAREHLH LQEEQRRREEEEDEEE
                   EEDRFKEEFQRLQELQ KLRAVKKKKKERPSKD CPKLDMLTRNFQAATE
                   SVPNSGNIHNGSLEQT EEPETSSHSPSRHMNH SEPRPGLGADGDAADP
                   VDTRDSKFLLPKEVNG KQHEPLSFFFDIMQHH KEGNGKQKLRQTSKAS
                   SEPARRPTEPPKATEG QSKPRAQTESKAKVVD LMSITEQKREERKVNS
                   NNNNKKQLNHIKDEKS NPTPMEPTSPGEHQQN SKLVLAESPQPKGKNK
                   KNKKKKGDRVNNSIDG VSLLLPSLGYNGAILA HCNLRLPGSSDCAASA
                   SQVVGITDDVFLPKDI DLDSVDMDETEREVEY FKRFCLDSARQTRQRL
                   SINWSNFSLKKATFAA H
g20140144    70    MGSLSTANVEFCLDVF KELNSNNIGDNIFFSS LSLLYALSMVLLGARG
                   ETAEQLEKVLHFSHTV DSLKPGFKDSPKCSQA GRIHSEFGVEFSQINQ
                   PDSNCTLSIANRLYGT KTMAFHQQYLSCSEKW YQARLQTVDFEQSTEE
                   TRKMINAWVENKTNGK VANLFGKSTIDPSSVM VLVNIIYFKGQRQNKF
                   QVRETVKSPFQLSEGK NVTVEMMYQIGTFKLA FVKEPQMQVLELPYVN
                   NKLSMIILLPVGIANL KQIEKQLNSGTFHEWT SSSNMMEREVEVHLPR
                   FKLEIKYELNSLLKPL GVTDLFNQVKADLSGM SPTKGLYLSKAIHKSY
                   LDVSEEGTEAAAATGD SIAVKSLPMRAQFKAN HPFLFFIRHTHTNTIL
                   FCGKLASP
g20476660    71    MMAALYPSTDLSGASS SSLPSSPSSSSPNEVM ALKDVREVKEENTLNE
                   KLFLLACDKGDYYMVK KILEENSSGDLNINCV DVLGRNAVTITIENEN
                   LDILQLLLDYGCQSAD ALLVAIDSEVVGAVDI LLNHRPKRSSRPTIVK
                   LMERIQNPEYSTTMDV APVILAAHRNNYEILT MLLKQDVSLPKPHAVG
                   CECTLCSAKNKKDSLR HSRFRLDIYRCLASPA LIMLTEEDPILRAFEL
                   SADLKELSLVEVEFRN DYEELARQCKMFAKDL LAQARNSRELEVILNH
                   TSSDEPLDKRGLLEER MNLSRLKLAIKYNQKE FVSQSNCQQFLNTVWF
                   GQMSGYRRKPTCKKIM TVLTVGIFWPVLSLCY LIAPKSQFGRIIHTPF
                   MKFIIHGASYFTFLLL LNLYSLVYNEDKKNTM GPALERIDYLLILWII
                   GMIWSDIKRLWYEGLE DFLEESRNQLSFVMNS LYLATFALKVVAHNKF
                   HDFADRKDWDAFHPTL VAEGLFAFANVLSYLR LFFMYTTSSILGPLQI
                   SMGQMLQDFGKFLGMF LLVLFSFTIGLTQLYD KGYTSKEQKDCVGIFC
                   EQQSNDTFHSFIGTCF ALFWYIFSLAHVAIFV TRFSYGEELQSFVGAV
                   IVGTYNVVVVIVLTKL LVAMLHKSFQLIANHE DKEWKFARAKLWLSYF
                   DDKCTLPPPFNIIPSP KTICYMISSLSKWICS HTSKGKVKRQNSLKEW
                   RNLKQKRDENYQKVMC CLVHRYLTSMRQKMQS TDQATVENLNELRQDL
                   SKFRNEIRDLLGFRTS KYAMFYPRN
g20546044    72    MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASV
                   KKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYV
                   GDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDIT
                   PIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRH
                   SRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSE
                   YEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLAR
                   LKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFII
                   GLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLAS
                   QHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHD
                   WWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEAL
                   FAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLL
                   AFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIF
                   GLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSY
                   QLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKW
                   IWTHLCKKKMRRKPES FGTIGVRTQHRRAADN LRRHHQYQVIMRNLVK
                   RYVAAMIRDAKTEEGL TEENFKELKQDISSFR FEVLGLLRGSKLSTIQ
                   SANASKESSNSADSDE KSDSEGNSKDKKKNFS LFDLTTLIHPRSAAIA
                   SERHNISNGSALVVQE PPREKQRKVNFVTDIK NFGLFHRRSKQNAAEQ
                   NANQIFSVSEEVARQQ AAGPLERNIQLESRGL ASRGDLSIPGLSEQCV
                   LVDHRERNTDTLGLQV GKRVCPFKSEKVVVED TVPIIPKEKHAKEEDS
                   SIDYDLNLPDTVTHED YVTTRL
g20881287    73    MSQSPRFVTRRGGSLK AAPGAGTRRNESQDYL LMDELGDDGYPQLPLP
                   PYGYYPSFRGNENRLT HRRQTILREKGRRLAN RGPAYMFNDHSTSLSI
                   EEERFLDAAEYGNIPV VRKMLEECHSLNVNCV DYMGQNALQLAVANEH
                   LEITELLLKKENLSRV GDALLLAISKGYVRIV EAILNHPAFAEGKRLA
                   TSPSQSELQQDDFYAY DEDGTRFSHDVTPIIL AAHCQEYEIVHTLLRK
                   GARIERPHDYFCKCTE CSQKQKHDSFSHSRSR INAYKGLASPAYLSLS
                   SEDPVMTALELSNELA VLANIEKEFKNDYRKL SMQCKDFVVGLLDLCR
                   NTEEVEAILNGDAETR QPGDFGRPNLSRLKLA IKYEVKKFVAHPNCQQ
                   QLLSIWYENLSGLRQQ TMAVKFLVVLAVAIGL PFLALIYWCAPCSKMG
                   KILRGPFMKFVAHAAS FTIFLGLLVMNAADRF EGTKLLPNETSTDNAR
                   QLFRMKTSCFSWMEML IISWVIGMIWAECKEI WTQGPKEYLFELWNML
                   DFGMLAIFAASFIARF MAFWHASKAQSIIDAN DTLKDLTKVTLGDNVK
                   YYNLARIKWDPTDPQI ISEGLYAIAVVLSFSR IAYILPANESFGPLQI
                   SLGRTVKDIFKFMVIF IMVFVAFMIGMFNLYS YYIGAKQNEAFTTVEE
                   SFKTLFWAIFGLSEVK SVVINYNHKFIENIGY VLYGVYNVTMVIVLLN
                   MLIAMINSSFQEIEDD ADVEWKFARAKLWFSY FEEGRTLPVPFNLVPS
                   PKSLLYLLLKFKKWMC ELIQGQKQGFQEDAEM NKRNEEKKFGISGSHE
                   DLSKFSLDKNQLAHNK QSSTRSSEDYHLNSFS NPPRQYQKIMKRLIKR
                   YVLQAQIDKESDEVNE GELKEIKQDISSLRYE LLEEKSQNTEDLAELI
                   RKLGERLSLEPKLEES RR
g2105420    74     PSGLPLLPVLFALGGL LLLSNASCVGGVLWQR RLRRLAEALNFPPHLH
                   PGRSEEDRVRNEYEES QWTGERDTQSSTVSTT EAEPYYRSLRDFSPQL
                   PPTQEEVSYSRGFTGE DEDMAFPGHLYDEVER TYPPSGAWGPLYDEVQ
                   MGPWDLHWPEDTYQDP RGIYDQVAGDLDTLEP DSLPFELRGHLVWGFN
                   HVSQAGLKLLASSDPP ASASQSAEITESHSVV QVGVQWRYFGSLHPLP
                   PGSRDSLASASRIAGI TAPWEAEVSRSPQGTQ DSPVTRSGPPSRGWQS
                   LSFDGGAFHLKGTGEL TRALLVLRLCAWPPLV THGLLLQAWSRRLLGS
                   RLSGAFLRASVYGQFV AGETAEEVKGCVQQLR TLSLRPLLAVPTEEEP
                   DSAAKRMRLHHVGQAG LELLTPAASGSVAQAG VQWRQSSDRGGGNQAA
                   ASRSSLLQEAAFSPPC GRLQLPAQPASRHGAR GRGSMKAKSLTSRHLL
                   ASQGQETIIKTKVRIP ALWKAEPGQHSKTPSQ QNKSQYVTTLWEADVG
                   RSLENLQVSCLNAEQN QHLRASLSRLHRVTPP AGTSTSGPPSAACIGW
                   HSRLHRVAQYARAQHV RLLVDAEYTSLNPALS LLVAALAVRWNSPGEG
                   GPWVWNTYQACLKDTF ERLGRDAEAAHRAGLA FGVKLVRGAYLDKERA
                   VAQLHGMEDPTQPDYE ATSELNRASPFSYSRC LELMLTHVARHGPMCH
                   LMVASHNEESVRQATK RMWELGIPLDGTVCFG QLLGMCDHVSLALGQA
                   GYVVYKSIPYGSLEEV IPYLIRRAQENRSVLQ GARREQELLSQELWRR
                   LLPGCRRIPH
g2119643    75     SCSVTLAGVQWRDLGL LQPLPPKFKRFSCLSF PSSWDYR
g2119644    76     EMEFNCESCSVTLAGV QWRDLGLLQPLPPKFK RFSCLSFPSSWDYR
g2136328    77     MCPGIPGPRAEAAVGT THPFSSPGAWLGSGSG SGPVGAPPPSPGLPPS
                   WAAMMAALYPSTDLSG ASSSSLPSSPSSSSPN EVMALKDVREVKEENT
                   LNEKLFLLACDKGDYY MVKKILEENSSGDLNI NCVDVLGRNAVTITIE
                   NENLDILQLLLDYGCQ KLMERIQNPEYSTTMD VAPVILAAHRNNYEIL
                   TMLLKQDVSLPKPHAV GCECTLCSAKNKKDSL RHSRFRLDIYRCLASP
                   ALIMLTEEDPILRAFE LSADLKELSLVEVEFR NDYEELARQCKMFAKD
                   LLAQARNSRELEVILN HTSSDEPLDKRGLLEE RMNLSRLKLAIKYNQK
                   EFVSQSNCQQFLNTVW FGQMSGYRRKPTCKKI MTVLTVGIFWPVLSLC
                   YLIAPKSQFGRIIHTP FMKFIIHGASYFTFLL LLNLYSLVYNEDKKNT
                   MGPALERIDYLLILWI IGMIWSDIKRLWYEGL EDFLEESRNQLSFVMN
                   SLYLATFALKVVAHNK FHDFADRKDWDAFHPT LVAEGLFAFANVLSYL
                   RLFFMYTTSSILGPLQ ISMGQMLQDFGKFLGM FLLVLFSFTIGLTQLY
                   DKGYTSKEQKDCVGIF CEQQSNDTFHSFIGTC FALFWYIFSLAHVAIF
                   VTRFSYGEELQSFVGA VIVGTYNVVVVIVLTK LLVAMLHKSFQLIANH
                   EDKEWKFARAKLWLSY FDDKCTLPPPFNIIPS PKTICYMISSLSKWIC
                   SHTSKGKVKRQNSLKE WRNLKQKRDENYQKVM CCLVHRYLTSMRQKMQ
                   STDQATVENLNELRQD LSKFRNEIRDLLGFRT SKYAMFYPRN
g3766191    78     MSRGNENRLTHRRQTI LREKGRRLANRGPAYM FNDHSTSLSIEEERFL
                   DAAEYGNIPVVRKMLE ECHSLNVNCVDYMGQD ALQLAVANEHLEITEL
                   LLKKENLSRVGDALLL AISKGYVRIVEAILNH PAFAEGKRLATSPSQS
                   ELQQDDFYAYDEDGTR FSHDVTPIILAAHCQE YEIVHTLLRKGARIER
                   PHDYFCKCTECSQKQK HDSFSHSRSRINAYKG LASPAYLSLSSEDPVM
                   TALELSNELAVLANIE KEFKNDYRKLSMQCKD FVVGLLDLCRNTEEVE
                   AILNGDAETRQPGDFG RPNLSRLKLAIKYEVK KFVAHPNCQQQLLSIW
                   YENLSGLRQQTMAVKF LVVLAVAIGLPFLALI YWCAPCSKMGKILRGP
                   FMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNARQLFRMK
                   TSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLA
                   IFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLAR
                   IKWDPTDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTV
                   KDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLF
                   WAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMI
                   NSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLLY
                   LLLKFKKWMCELIQGQ KQGFQEDAEMNKRNEE KKFGISGSHEDLSKFS
                   LDKNQLAHNKQSSTRS SEDYHLNSFSNPPRQY QKIMKRLIKRYVLQAQ
                   IDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRKLGER
                   LSLEPKLEESRR
g403460    79      DRLSLLSPRLECNGMI LAHCKLRLPGFKRFSC LSLPSSWDYRHVPPRQ
                   VHFVFSVETGFHRAGQ AGLELLTSSVPPTSAF PKCWDYRRDDQAWPTL
                   SSFRGLNKFAFLPKFF AHPISQFQRVECNVGC PILLAMKYLAYSSLPG
                   ADTMLYFYFYEQEASL AVCNICRQKFHWVLYQ ISHLYRGVIVDNFLLH
                   PDGRFTWTIFFLSWVK QNSLVDFFFGTESRSV ALLPRLECSGAMSTLH
                   TVLRPAYSHIYHPDVK EKTHFLGNVFNKRKLQ KKILKTPNPLCALHSA
                   PSPSLPPFLRCTGRLP FYLGLDDFLFVAGALM FLPVSFLNPHTLTWPP
                   QCCTRSDCNPLRGQRE ISALSHSLPTGLSMPL
g4200234    80     MAALYACTKCHQRFPF EALSQGQQLCKECRIA HPVVKCTYCRTEYQQE
                   RLECNGTISAHCNLHL PGSSDSPASSSRVAGI TGIKTNTICKKCAQNV
                   QLYGTPKPCQYCNIIA AFIGNKCQRCTNSEKK YGPPYSCEQCKQQCAF
                   DRKDDRKKVDGKLLCW LCTLSYKRVLQKTKEQ RKHLSSSSRAGHQEKE
                   QYSRLSGGGHYNSQKT LSTSSIQNEIPKKKSK FESITTNGDSFSPDLA
                   LDSPGTDHFVIIAQLK EEVATLKKMLHQKDQM ILEKEKKITELKADFQ
                   YQESQMRAKMNQMEKT HKEVTEQLQAKNRELL KQAAALSKSKKSEKSG
                   AITSP
g4200238    81     MAALYACTKCHQRFPF EALSQGQQLCKECRIA HPVVKCTYCRTEYQQE
                   RLECNGTISAHCNLHL PGSSDSPASSSRVAGI TGIKTNTICKKCAQNV
                   QLYGTPKPCQYCNIIA AFIGNKCQRCTNSEKK YGPPYSCEQCKQQCAF
                   DRKDDRKKVDGKLLCW LCTLSYKRVLQKTKEQ RKHLSSSSRAGHQEKE
                   QYSRLSGGGHYNSFSP DLALDSPGTDHFVIIA QLKEEVATLKKMLHQK
                   DQMILEKEKKITELKA DFQYQESQMRAKMNQM EKTHKEVTEQLQAKNR
                   ELLKQAAALSKSKKSE KSGAITSP
g423149    82      FFFFFFETESCSVAEA GVQWCDLGSLKSPPPG SSDSPASASRVAGITG
                   MHHHTQLIFVFLVETG SHMQLSDSTLVITTAQ NAKITARAPRDLFFFF
                   FFFF
g4336401    83     LPLLPRMECRGMISAH CNLCRSGSSDSPASAS RVAGITGTCHHAQLSF
                   PFFLFMRW
g4336402    84     LPLLPRMECRGMISAH CNLCRSGSSDSPASAS RVAGITGTCHHAQL
g4379098    85     MDIEDEENMSSSSTDV KENRNLDNVSPKDGST PGPGEGSQLSNGGGGG
                   PGRKRPLEEGSNGHSK YRLKKRRKTPGPVLPK NALMQLNEIKPGLQYT
                   LLSQTGPVHAPLFVMS VEVNGQVFEGSGPTKK KAKLHAAEKALRSFVQ
                   FPNASEAHLAMGRTLS VNTDFTSDQADFPDTL FNGFETPDKAEPPFYV
                   GSNGDDSFSSSGDLSL SASPVPASLAQPPLPV LPPFPPPSGKNPVMIL
                   NELRPGLKYDFLSESG ESHAKSFVMSVVVDGQ FFEGSGRNKKLAKARA
                   AQSALAAIFNLHLDQT PSRQPIPSEGLQLHLP QVLADAVSRLVLGKFG
                   DLTDNFSSPHARRKVL AGVVMTTGTDVKDAKV ISVSTGTKCINGEYMS
                   DRGLALNDCHAEIISR RSLLRFLYTQLELYLN NKDDQKRSIFQKSERG
                   GFRLKENVQFHLYIST SPCGDARIFSPHEPIL EGSRSYTQAGVQWCNH
                   GSLQPRPPGLLSDPST STFQGAGTTEPADRHP NRKARGQLRTKIESGE
                   GTIPVRSNASIQTWDG VLQGERLLTMSCSDKI ARWNVVGIQGSLLSIF
                   VEPIYFSSIILGSLYH GDHLSRAMYQRISNIE DLPPLYTLNKPLLSGI
                   SNAEARQPGKAPNFSV NWTVGDSAIEVINATT GKDELGRASRLCKHAL
                   YCRWXaAACARQGSLPLT TLQDYQAQRVP
g4504601    86     MLLSQNAFIVRSLNLV LMVYISLVFGISYDSP DYTDESCTFKISLRNF
                   RSILSWELKNHSIVPT HYTLLYTIMSKPEDLK VVKNCANTTRSFCDLT
                   DEWRSTHEAYVTVLEG FSGNTTLFSCSHNFWL AIDMSFEPPEFEIVGF
                   TNHINVMVKFPSIVEE ELQFDLSLVIEEQSEG IVKKHKPEIKGNMSGN
                   FTYIIDKLIPNTNYCV SVYLEHSDEQAVIKSP LKCTLLPPGQESESAE
                   SAKIGGIITVFLIALV LTSTIVTLKWIGYICL RNSLPKVLRQGLTKGW
                   NAVAIHRCSHNALQSE TPELKQSSCLSFPSSW DYKRASLCPSD
g4507277    87     MPLAAYCYLRVVGKGS YGEVTLVKHRRDGKQY VIKKLNLRNASSRERR
                   AAEQEAQLLSQLKHPN IVTYKESWEGGDGLLY IVMGFCEGGDLYRKLK
                   EQKGQLLPENQVVEWF VQIAMALQYLHEKHIL HRDLKTQNVFLTRTNI
                   IKVGDLGIARVLENHC DMASTLIGTPYYMSPE LFSNKPYNYKSDVWAL
                   GCCVYEMATLKHAFNA KDMNSLVYRIIEGKLP AMPRDYSPELAELIRT
                   MLSKRPEERPSVRSIL RQPYIKRQISFFLEAT KIKTSKNNIKNGDSQS
                   KPFATVVSGEAESNHE VIHPQPLSSEGSQTYI MGEGKCLSQEKPRASG
                   LLKSPASLKAHTCKQD LSNTTELATISSVNID ILPAKGRDSVSDGFVQ
                   ENQPRYLDASNELGGI CSISQVEEEMLQDNTK SSAQPENLIPMWSSDI
                   VTGEKNEPVKPLQPLI KEQKPKDQSLALSPKL ECSGTILAHSNLRLLG
                   SSDSPASASRVAGITG VCHHAQDQVAGECIIE KQGRIHPDLQPHNSGS
                   EPSLSRQRRQKRREQT EHRGEKRQVRRDLFAF QESPPRFLPSHPIVGK
                   VDVTSTQKEAENQRRV VTGSVSSSRSSEMSSS KDRPLSARERRRLKQS
                   QEEMSSSGPSVRKASL SVAGPGKPQEEDQPLP ARRLSSDCSVTQERKQ
                   IHCLSEDELSSSTSST DKSDGDYGEGKGQTNE INALVQLMTQTLKLDS
                   KESCEDVPVANPVSEF KLHRKYRDTLILHGKV AEEAEEIHFKELPSAI
                   MPGSEKIRRLVEVLRT DVIRGLGVQLLEQVYD LLEEEDEFDREVRLRE
                   HMGEKYTTYSVKARQL KFFEENMNF
g4507685    88     MMAALYPSTDLSGASS SSLPSSPSSSSPNEVM ALKDVREVKEENTLNE
                   KLFLLACDKGDYYMVK KILEENSSGDLNINCV DVLGRNAVTITIENEN
                   LDILQLLLDYGCQKLM ERIQNPEYSTTMDVAP VILAAHRNNYEILTML
                   LKQDVSLPKPHAVGCE CTLCSAKNKKDSLRHS RFRLDIYRCLASPALI
                   MLTEEDPILRAFELSA DLKELSLVEVEFRNDY EELARQCKMFAKDLLA
                   QARNSRELEVILNHTS SDEPLDKRGLLEERMN LSRLKLAIKYNQKEFV
                   SQSNCQQFLNTVWFGQ MSGYRRKPTCKKIMTV LTVGIFWPVLSLCYLI
                   APKSQFGRIIHTPFMK FIIHGASYFTFLLLLN LYSLVYNEDKKNTMGP
                   ALERIDYLLILWIIGM IWSDIKRLWYEGLEDF LEESRNQLSFVMNSLY
                   LATFALKVVAHNKFHD FADRKDWDAFHPTLVA EGLFAFANVLSYLRLF
                   FMYTTSSILGPLQISM GQMLQDFGKFLGMFLL VLFSFTIGLTQLYDKG
                   YTSKEQKDCVGIFCEQ QSNDTFHSFIGTCFAL FWYIFSLAHVAIFVTR
                   FSYGEELQSFVGAVIV GTYNVVVVIVLTKLLV AMLHKSFQLIANHEDK
                   EWKFARAKLWLSYFDD KCTLPPPFNI IPSPKT ICYMISSLSKWICSHT
                   SKGKVKRQNSLKEWRN LKQKRDENYQKVMCCL VHRYLTSMRQKMQSTD
                   QATVENLNELRQDLSK FRNEIRDLLGFRTSKY AMFYPRN
g4507687    89     MEGSPSLRRMTVMREK GRRQAVRGPAFMFNDR GTSLTAEEERFLDAAE
                   YGNIPVVRKMLEESKT LNVNCVDYMGQNALQL AVGNEHLEVTELLLKK
                   ENLARIGDALLLAISK GYVRIVEAILNHPGFA ASKRLTLSPCEQELQD
                   DDFYAYDEDGTRFSPD ITPIILAAHCQKYEVV HMLLMKGARIERPHDY
                   FCKCGDCMEKQRHDSF SHSRSRINAYKGLASP AYLSLSSEDPVLTALE
                   LSNELAKLANIEKEFK NDYRKLSMQCKDFVVG VLDLCRDSEEVEAILN
                   GDLESAEPLEVHRHKA SLSRVKLAIKYEVKKF VAHPNCQQQLLTIWYE
                   NLSGLREQTIAIKCLV VLVVALGLPFLAIGYW IAPCSRLGKILRSPFM
                   KFVAHAASFIIFLGLL VFNASDRFEGITTLPN ITVTDYPKQIFRVKTT
                   QFTWTEMLIMVWVLGM MWSECKELWLEGPREY ILQLWNVLDFGMLSIF
                   IAAFTARFLAFLQATK AQQYVDSYVQESDLSE VTLPPEIQYFTYARDK
                   WLPSDPQIISEGLYAI AVVLSFSRIAYILPAN ESFGPLQISLGRTVKD
                   IFKFMVLFIMVFFAFM IGMFILYSYYLGAKVN AAFTTVEESFKTLFWS
                   IFGLSEVTSVVLKYDH KFIENIGYVLYGIYNV TMVVVLLNMLIAMINS
                   SYQEIEDDSDVEWKFA RSKLWLSYFDDGKTLP PPFSLVPSPKSFVYFI
                   MRIVNFPKCRRRRLQK DIEMGMGNSKSRLNLF TQSNSRVFESHSFNSI
                   LNQPTRYQQIMKRLIK RYVLKAQVDKENDEVN EGELKEIKQDISSLRY
                   ELLEDKSQATEELAIL IHKLSEKLNPSMLRCE
g4885373    90     MSETVPPAPAASAAPE KPLAGKKAKKPAKAAA ASKKKPAGPSVSELIV
                   QAASSSKERGGVSLAA LKKALAAAGYDVEKNN SRIKLGIKSLVSKGTL
                   VQTKGTGASGSFKLNK KASSVETKPGASKVAT KTKATGASKKLKKATG
                   ASKKSVKTPKKAKKPA ATRKSSKNPKKPKTVK PKKVAKSPAKAKAVKP
                   KAAKARVTKPKTAKPK KAAPKKK
g5730102    91     MSQSPAFGPRRGSSPR GAAGAAARRNESQDYL LMDSELGEDGCPQAPL
                   PCYGYYPCFRGSDNRL AHRRQTVLREKGRRLA NRGPAYMFSDRSTSLS
                   IEEERFLDAAEYGNIP VVRKMLEECHSLNVNC VDYMGQNALQLAVANE
                   HLEITELLLKKENLSR VGDALLLAISKGYVRI VEAILSHPAFAEGKRL
                   ATSPSQSELQQDDFYA YDEDGTRFSHDVTPII LAAHCQEYEIVHTLLR
                   KGARIERPHDYFCKCN DCNQKQKHDSFSHSRS RINAYKGLASPAYLSL
                   SSEDPVMTALELSNEL AVLANIEKEFKNDYKK LSMQCKDFVVGLLDLC
                   RNTEEVEAILNGDVET LQSGDHGRPNLSRLKL AIKYEVKKFVAHPNCQ
                   QQLLSIWYENLSGLRQ QTMAVKFLVVLAVAIG LPFLALIYWFAPCSKM
                   GKIMRGPFMKFVAHAA SFTIFLGLLVMNAADR FEGTKLLPNETSTDNA
                   KQLFRMKTSCFSWMEM LIISWVIGMIWAECKE IWTQGPKEYLFELWNM
                   LDFGMLAIFAASFIAR FMAFWHASKAQSIIDA NDTLKDLTKVTLGDNV
                   KYYNLARIKWDPSDPQ IISEGLYAIAVVLSFS RIAYILPANESFGPLQ
                   ISLGRTVKDIFKFMVI FIMVFVAFMIGMFNLY SYYIGAKQNEAFTTVE
                   ESFKTLFWAIFGLSEV KSVVINYNHKFIENIG YVLYGVYNVTMVIVLL
                   NMLIAMINSSFQEIED DADVEWKFARAKLWFS YFEEGRTLPVPFNLVP
                   SPKSLFYLLLKLKKWI SELFQGHKKGFQEDAE MNKINEEKKLGILGSH
                   EDLSKLSLDKKQVGHN KQPSIRSSEDFHLNSF NNPPRQYQKIMKRLIK
                   RYVLQAQIDKESDEVN EGELKEIKQDISSLRY ELLEEKSQNTEDLAEL
                   IRELGEKLSMEPNQEE TNR
g5802234    93     SRDPPASASQVTGIR
g6005868    94     MASLSRALRVAAAHPR QSPTRGMGPCNLSSAA GPTAEKSVPYQRTLKE
                   GQGTSVVAQGPSRPLP STANVVVIGGGSLGCQ TLYHLAKLGMSGAVLL
                   ERERLTSGTTWHTAGL LWQLRPSDVEVELLAH TRRVVSRELEEETGLH
                   TGWIQNGGLFIASNRQ RLDEYKRLMSLGKAYG VESHVLSPAETKTLYP
                   LMNVDDLYGTLYVPHD GTMDPAGTCTTLARAA SARGAQVIENCPVTGI
                   RVWTDDFGVRRVAGVE TQHGSIQTPCVVNCAG VWASAVGRMAGVKVPL
                   VAMHHAYVVTERIEGI QSFTLLPTLEYSGTVS AHCNLRLPGSSNSRAS
                   ASHVAGIKCARHHTRL IFFCILVETEFHHVAK AGLELLSSGNPPISDF
                   QSARITGVSHHA
g604969    95      LLWVLLWATVLGLLCQ RLAARLGVVTGKDLGE VCHLYYPKSESRSVAQ
                   SGVQWCDVSSLQPLPP RCPAPSSG
g6650810   96      METESGSVAQAGVQWH NLGSLQPPPSRLKQLS YLSLPSSWDYRCTPPH
                   PANFLYFNRDGISPCC PGWSPTPKLTQSTHLG LSKC
g6665594    97     MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASV
                   KKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYV
                   GDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDIT
                   PIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRH
                   SRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSE
                   YEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLAR
                   LKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFII
                   GLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLAS
                   QHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHD
                   WWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEAL
                   FAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLL
                   AFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIF
                   GLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSY
                   QLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKW
                   IWTHLCKKKMRRKPES FGTIGRRAADNLRRHH QYQEVMRNLVKRYVAA
                   MIRDAKTEEVARQQAA GPLERNIQLESRGLAS RGDLSIPGLSEQCVLV
                   DHRERNTDTLGLQVGK RVCPFKSEKVVVEDTV PIIPKEKHAKEEDSSI
                   DYDLNLPDTVTHEDYV TTRL
g6665596    98     MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASV
                   KKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYV
                   GDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDIT
                   PIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRH
                   SRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSE
                   YEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLAR
                   LKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFII
                   GLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLAS
                   QHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHD
                   WWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEAL
                   FAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLL
                   AFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIF
                   GLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSY
                   QLIARRAADNLRRHHQ YQEVMRNLVKRYVAAM IRDAKTEEGLTEENFK
                   ELKQDISSFRFEVLGL LRGSKLSTIQSANASK ESSNSADSDEKSDSEE
                   EVARQQAAGPLERNIQ LESRGLASRGDLSIPG LSEQCVLVDHRERNTD
                   TLGLQVGKRVCPFKSE KVVVEDTVPIIPKEKH AKEEDSSIDYDLNLPD
                   TVTHEDYVTTRL
g6690167    99     MRTKSEREIHLCVLGF FXFFFETGSRSVAQAG VQRHSHGSLQPRPPGL
                   IQFSHLSLPSSWDYRH APPHLVNFL
g6690252    100    RFFFFFFFEESRSFAQ AGVQWRYLGSLQPPPP GFTRFSCLSLLSSWDY
                   RRPPPRPANFLYF
g7243280    101    ELSFPLLSLDFGAHQG LGSADMGDMKTPDFDD LLAAFDIPDIDANEAI
                   HSGPEENEGPGGPGKP EPGVGSESEDTAAASA GDGPGVPAQASDHGLP
                   PPDISVVSVIVKNTVC PEQSEALAGGSAGDGA QAAGVTKEGPVGPHRM
                   QNGFGSPEPSLPGTPH SPAPPSGGTWKEKGME GKTPLDLFAHFGPEPG
                   DHSDPLPPSAPSPTRE GALTPPPFPSSFELAQ ENGPGMQPPVSSPPLG
                   ALKQESCSPHHPQVLA QQGSGSSPKATDIPAS ASPPPVAGVPFFKQSP
                   GHQSPLASPKVPVCQP LKEEDDDEGPVDKSSP GSPQSPSSGAEAADED
                   SNDSPASSSSRPLKVR IKTIKTSCGNITRTVT QVPSDPDPPAPLAEGA
                   FLAEASLLKLSPATPT SEGPKVVSVQLGDGTR LKGTVLPVATIQNAST
                   AMLMAASVARKAVVLP GGTATSPKMIAKNVLG LVPQALPKADGRAGLG
                   TGGQKVNGASVVMVQP SKTATGPSTGGGTVIS RTQSSLVEAFNKILNS
                   KNLLPAYRPNLSPPAE AGLALPPTGYRCLECG DAFSLEKSLARHYDRR
                   SMRIEVTCNHCARRLV FFNKCSLLLHAREHKD KGLVMQCSHLVMRPVA
                   LDQMVGQPDITPLLPV AVPPVSGPLALPALGK GEGAITSSAITTVAAE
                   APVLPLSTEPPAAPAT SAYTCFRCLECKEQCR DKAGMAAHFQQLGPPA
                   PGATSNVCPTCPMMLP NRCSFSAHQRMHKNRP PHVCPECGGNFLQANF
                   QTHLREACLHVSRRVG YRCPSCSVVFGGVNSI KSHIQTSHCEVFHKCP
                   ICPMAFKSGPSAHAHL YSQHPSFQTQQAKLIY KCAMCDTVFTHKPLLS
                   SHFDQHLLPQRVSVFK CPSCPLLFAQKRTMLE HLKNTHQSGRLEETAG
                   KGAGGALLTPKTEPEE LAVSQGGAAPATEESS SSSEEEEVPSSPEPPR
                   PAKRPRRELGSKGLKG GGGGPGGWTCGLCHSW FPERDEYVAHMKKEHG
                   KSVKKFPCRLCERSFC SAPSLRRHVRVNHEGI KRVYPCRYCTEGKRTF
                   SSRLILEKHVQVRHGL QLGAQSPGRGTTLARG SSARAQGPGRKRRQSS
                   DSCSEEPDSTTPPAKS PRGGPGSGGHGPLRYR SSSSTEQSLMMGLRVE
                   DGAQQCLDCGLCFASP GSLSRHRFISHKKRRG VGKASALGLGDGEEEA
                   PPSRSDPDGGDSPLPA  SGGPLTCKVCGKSCDS PLNLKTHFRTHGMAFI
                   RARQGAVGDN
g7305597    102    MSQSPRFVTRRGGSLK AAPGAGTRRNESQDYL LMDELGDDGYPQLPLP
                   PYGYYPSFRGNENRLT HRRQTILREKGRRLAN RGPAYMFNDHSTSLSI
                   EEERFLDAVEYGNIPV VWKMLEECHSLNVNCV DYMGQNALQLAVANEH
                   LEITELLLKKENLSRV GDALLLAISKGYVRIV EAILNHPSFAEGKRLA
                   TSPSQSELQQDDFYAY DEDGTRFSHDVTPIIL AAHCQEYEIVHTLLRK
                   GARIERPHDYFCKCTE CSQKQKHDSFSHSRSR INAYKGLASPAYLSLS
                   SEDPVMTALELSNELA VLANIEKEFKNDYRKL SMQCKDFVVGLLDLCR
                   NTEEVEAILNGDAETR QPGDFGRPNLSRLKLA IKDEVKKFVAHPNCQQ
                   QLLSIWYENLSGLRQQ TMAVKFLVVLAVAIGL PFLALIYWCAPCSKMG
                   KILPRPFMKFVAHAAS FTIFLGLLVMNAADRF EGTKLLPNETSTDNAR
                   QLFRMKTSCFSWMEML IISWVIGMIWAECKEI WTQGPKEYLFELWNML
                   DFGMLAIFAASFIARF MAFWHASKAQSIIDAN DTLKDLTKVTLGDNVK
                   YYNLARIKWDPTDPQI ISEGLYAIAVVLSFSR IAYILPANESFGPLQI
                   SLGRTVKDIFKFMVIF IMVFVAFMIGMFNLYS YYIGAKQNEAFTTVEE
                   SFKTLFWAIFGLSEVK SVVINYNHKFIENIGY VLYGVYNVTMVIVLLN
                   MLIAMINSSFQEIEDD ADVEWKFARAKLWFSY FEEGRTLPVPFNLVPS
                   PKSLLYLLLKFKKWMC ELIQGQKQGFQEDAEM NKRNEEKKFGISGSHE
                   DLSKFSLDKNQLAHNK QSSTRSSEDYHLNSFS NPPRQYQKIMKRLIKR
                   YVLQAQIDKESDEVNE GELKEIKQDISSLRYE LLEEKSQNSEDLAELI
                   RKLGERLSLEPKLEES RR
g7512448    103    GFLPATKNLLNEKNHG VLHTSVVLLTEMCERS PDMLAHFRENEKLVPQ
                   LVRILKNLIMSGYSPG HDVSGISDPFLQVRIL RLLRILGRNDDDSSEA
                   MNDILAQVATNTETSK NVGNAILYETVLTIMD IKSESGLRVLAINILG
                   RFLLNNDKNIRYVALT SLLKTVQTDHNAVQRH RSTIVDCLKDLDVSIK
                   RRAMELSFALVNGNNI RGMMKELLYFLDSCEP EFKADCASGIFLAAEK
                   YAPSKRWHIDTIMRVL TTAGSYVRDDAVPNLI QLITNSVEMHAYTVQR
                   LYKAILGDYSQQPLVQ VAAWCIGEYGDLLVSG QCEEEEPIQVTEDEVL
                   DILESVLISNMSTSVT RGYALTAIMKLSTRFT CTVNRIKKVVSIYGSS
                   IDVELQRRAVEYNALF KKYDHMRSALLERMPV MEKVTTNGPTEIVQTN
                   GETEPAPLETKPPPSG PQPTSQANDLLDLLGG NDITPVIPTAPTSKPS
                   SAGGELLDLLGDINLT GSHSVSQAGVQWDYLG SLQPLPPAFR
g7522630    104    MWPNGSSLGPCFRPTN ITLEERRLIASPWFAA SFCVVGLASNLLALSV
                   LAGARQGGSHTRSSFL TFLCGLVLTDFLGLLV TGTIVVSQHAALFEWH
                   AVDPGCRLCRFMGVVM IFFGLSPLLLGAAMAS ERYLGITRPFSRPAVA
                   SQRRAWATVGLVWAAA LALGLLPLLGVGRYTV QYPGSWCFLTLGAESG
                   DVAFGLLFSMLGGLSV GLSFLLNTVSVATLCH VYHGQEAAQQRPRDSE
                   VEMMAQLLGIMVVASV CWLPLLVFIAQTVLRN PPAMSPAGQLSRTTEK
                   ELLIYLRVATWNQILD PWVYILFRRAVLRRLQ PRLSTRPRRSLTLWPS
                   LEYSGTISAHCNLRLP GSSDSRASASRAAG IT GVSHCARPCMLFDPEF
                   DLLAGVQLLPFEPPTG KALSRKD
g7669477    105    MDIEDEENMSSSSTDV KENRNLDNVSPKDGST PGPGEGSQLSNGGGGG
                   PGRKRPLEEGSNGHSK YRLKKRRKTPGPVLPK NALMQLNEIKPGLQYT
                   LLSQTGPVHAPLFVMS VEVNGQVFEGSGPTKK KAKLHAAEKALRSFVQ
                   FPNASEAHLAMGRTLS VNTDFTSDQADFPDTL FNGFETPDKAEPPFYV
                   GSNGDDSFSSSGDLSL SASPVPASLAQPPLPV LPPFPPPSGKNPVMIL
                   NELRPGLKYDFLSESG ESHAKSFVMSVVVDGQ FFEGSGRNKKLAKARA
                   AQSALAAIFNLHLDQT PSRQPIPSEGLQLHLP QVLADAVSRLVLGKFG
                   DLTDNFSSPHARRKVL AGVVMTTGTDVKDAKV ISVSTGTKCINGEYMS
                   DRGLALNDCHAEIISR RSLLRFLYTQLELYLN NKDDQKRSIFQKSERG
                   GFRLKENVQFHLYIST SPCGDARIFSPHEPIL EGSRSYTQAGVQWCNH
                   GSLQPRPPGLLSDPST STFQGAGTTEPADRHP NRKARGQLRTKIESGE
                   GTIPVRSNASIQTWDG VLQGERLLTMSCSDKI ARWNVVGIQGSLLSIF
                   VEPIYFSSIILGSLYH GDHLSRAMYQRISNIE DLPPLYTLNKPLLSGI
                   SNAEARQPGKAPNFSV NWTVGDSAIEVINATT GKDELGRASRLCKHAL
                   YCRWMRVHGKVPSHLL RSKITKPNVYHESKLA AKEYQAAKARLFTAFI
                   KAGLGAWVEKPTEQDQ FSLTP
g7669479    106    MDIEDEENMSSSSTDV KENRNLDNVSPKDGST PGPGEGSQLSNGGGGG
                   PGRKRPLEEGSNGHSK YRLKKRRKTPGPVLPK NALMQLNEIKPGLQYT
                   LLSQTGPVHAPLFVMS VEVNGQVFEGSGPTKK KAKLHAAEKALRSFVQ
                   FPNASEAHLAMGRTLS VNTDFTSDQADFPDTL FNGFETPDKAEPPFYV
                   GSNGDDSFSSSGDLSL SASPVPASLAQPPLPV LPPFPPPSGKNPVMIL
                   NELRPGLKYDFLSESG ESHAKSFVMSVVVDGQ FFEGSGRNKKLAKARA
                   AQSALAAIFNLHLDQT PSRQPIPSEGLQLHLP QVLADAVSRLVLGKFG
                   DLTDNFSSPHARRKVL AGVVMTTGTDVKDAKV ISVSTGTKCINGEYMS
                   DRGLALNDCHAEIISR RSLLRFLYTQLELYLN NKDDQKRSIFQKSERG
                   GFRLKENVQFHLYIST SPCGDARIFSPHEPIL EGSRSYTQAGVQWCNH
                   GSLQPRPPGLLSDPST STFQGAGTTEPADRHP NRKARGQLRTKIESGE
                   GTIPVRSNASIQTWDG VLQGERLLTMSCSDKI ARWNVVGIQGSLLSIF
                   VEPIYFSSIILGSLYH GDHLSRAMYQRISNIE DLPPLYTLNKPLLSGI
                   SNAEARQPGKAPNFSV NWTVGDSAIEVINATT GKDELGRASRLCKHAL
                   YCRWMRVHGKVPSHLL RSKITKPNVYHESKLA AKEYQAAKVH
g7770147    107    MEVLLFLFIFETESCS VIRLECSGSLQPPPPR FKQFSCLSLPSSWDYR
                   CPPPCPINFCIFGTDR VSPCWPGWSRSR
g7706747    108    MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASV
                   KKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYV
                   GDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDIT
                   PIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRH
                   SRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSE
                   YEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLAR
                   LKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFII
                   GLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLAS
                   QHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHD
                   WWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEAL
                   FAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLL
                   AFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIF
                   GLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSY
                   QLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKW
                   IWTHLCKKKMRRKPES FGTIGRRAADNLRRHH QYQEVMRNLVKRYVAA
                   MIRDAKTEEGLTEENF KELKQDISSFRFEVLG LLRGSKLSTIQSANAS
                   KESSNSADSDEKSDSE GNSKDKKKNFSLFDLT TLIHPRSAAIASERHN
                   ISNGSALVVQEPPREK QRKVNFVTDIKNFGLF HRRSKQNAAEQNANQI
                   FSVSEEVARQQAAGPL ERNIQLESRGLASRGD LSIPGLSEQCVLVDHR
                   ERNTDTLGLQVGKRVC PFKSEKVVVEDTVPII PKEKHAKEEDSSIDYD
                   LNLPDTVTHEDYVTTR L
g8922960    109    MESYSVTQAGVQWHEL CSLQPSPPRFREMCIE QDGRVHLTVVYFGKEE
                   INEVKGVLENTSKAAN FRNFTFIQLNGEFSRG KGLDVGARFWKGSNVL
                   LFFCDVDIYFTSEFLN TCRLNTQPGKKVFYPV LFSQYNPGIIYGHHDA
                   VPPLEQQLVIKKETGF WRDFGFGMTCQYRSDF INIGGFDLDIKGWGGE
                   DVHLYRKYLHSNLIVV RTPVRGLFHLWHEKRC MDELTPEQYKMCMQSK
                   AMNEASHGQLGMLVFR HEIEAHLRKQKQKTSS KKT
g8923251    110    MDITLVRKELQELQNL YKQNSTHTAQQAELIQ QLQVLNMDTQKVLRNQ
                   EDVHTAESISYQKLYN ELHICFETTKSNEAML RQSVTNLQDQLLQKEQ
                   ENAKLKEKLQESQGAP LPLPQESDPDYSAQVP HRPSLSSLETLMVSQK
                   SEIEYLQEKLKIANEK LSENISANKGFSRKSI MTSAEGKHKEPPVKRS
                   RSLSPKSSFTDSEELQ KLRKAERKIENLEKAL QLKSQENDELRDAHEK
                   RKERLQMLQTNYRAVK EQLKQWEEGSGMTEIR KIKRADPQQLRQEDSD
                   AVWNELAYFKRENQEL MIQKMNLEEELDELKV HISIDKAAIQELNRCV
                   AERREEQLFRSGEDDE VKRSTPEKNGKEMLEQ TLQKVIELENRLKSFE
                   KRSRKLKEGNKKLMKE NDFLKSLLKQQQEDTE TREKELEQIIKGSKDV
                   EKENTELQVKISELET EVTSLRRQVAEANALR NENEELINPMEKSHQS
                   ADRAKSEMATMKVRSG RYDCKTTMTKVKFKAA KKNCSVGRHHTVLNHS
                   IKVMSNVFENLSKDGW EDVSESSSDSEAQTSQ TLGTIIVETSQKISPT
                   EDGKDQKESDPTEDSQ TQGKEIVQTYLNIDGK TPKDYFHDKNAKKPTF
                   QKKNCKMQKSSHTAVP TRVNREKYKNITAQKS SSNIILLRERIISLQQ
                   QNSVLQNAKKTAELSV KEYKEVNEKLLHQQQV SDQRFQTSRQTIKKLN
                   LDLAGLRKEKEDLLKK LESSSEITSLAEENSQ VTFPRIQVTSLSPSRS
                   MDLEMKQLQYKLKNAT NELTKQSSNVKTLKFE LLAKEEHIKEMHEKIS
                   RMERDITMKRHLIEDL KFRQKVNLESNKSFSE MLQNLDKKVKTLTEEC
                   SNKKVSIDSLKQRLNV AVKEKSQYEQMYQKSK EELEKKDLKLTLLVSR
                   ISETESAMAEIETAAS KQLQELALQSEQVLEG AQKTLLLANEKVEEFT
                   TFVKALAKELQNDVHV VRRQIRELKKMKKNRD ACKTSTHKAQTLAASI
                   LNISRSDLEEILDTED QVEIEKTKIDAENDKE WMLYIQKLLEGQSLTL
                   SPRLKCNGAIMAHQNL RLPDSSSSASAS
g8923273    111    MKVVPEKNAVRILWGR ERGARAMGAQRLLQEL VEDKTRWMKWEGKRVE
                   LPDSPRSTFLLAFSPD RTLLASTHVNHNIYIT EVKTGKCVHSLIGHRR
                   TPWCVTFHPTISGLIA SGCLDGEVRIWDLHGG SESWFTDSNNAIASLA
                   FHPTAQLLLIATANEI HFWDRSRREPFAVVKT ASEMERVRLVRFDPLG
                   HYLLTAIVNPSNQQGD DEPEIPIDGTELSHYR QRALLQSQPVRRTPLL
                   HNFLHMLSSRSSGIQT EPFHPPEQASSTQQDQ GLLNRPSAFSTVQSST
                   AGNTLRNLSLGPTRRS LGGPLSSHPSRYHREI APGLTGSEWTRTVLSL
                   NSRSEAESMPPPRTSA SSVSLLSVLRQQEGGS QASVYTSATEGRGFPA
                   SGLATESDGGNGSSQN NSGSIRHELQCDLRRF FLEYDRLQELDQSLSG
                   EAPQTQQAQEMLNNNI ESERPGPSHQPTPHSS ENNSNLSRGHLNRCRA
                   CHNLLTFNNDTLRWER TTPNYSSGEASSSWQV PSSFESVPSSGSQLPP
                   LERTEGQTPSSSRLEL SSSASPQEERTVGVAF NQETGHWERIYTQSSR
                   SGTVSQEALHQDMPEE SSEEDSLRRRSLALSP RLEYSGAILAHCKLRL
                   PGSCHSPASASQVAGT TGAHHHARLIFAFLVE MEFHHVSQAGLELLTS
                   GDLPTSASQVLGLQA
g8923360    112    MVHSPRSLVANPSQVL FFLSFLFFFFLRQSFA LVAQAGVQWRNLGSLQ
                   PPPPGFKQFSCLSLLS SWDYRHAPPCPAYFVF LVDMGFPHVGQTGLEL
                   LTSGDPPASASQSAGI TGGSHRAQPTSSNPYG IVFFFLPVKTFSGMSQ
                   EAGDCRET
g8923452    113    MPTATGLTLLTSASSA ISDPGGEVSAPWGGLR TWTQPLRCWERLLPPP
                   GDPRTVAENTQQDECG LPGSCPARPLSRKPEC GREGILPCCSSSAWPE
                   GSFRPFQMNLFSFLSF FFLFFFFLRWSLTLSP RLECSSAISAHCNLRL
                   PGSSNSPALASQVAGI TGICHHARQIFVFLVE TGFCHVGQAGLELLIS
                   GDSPASAFQSAGIIGV SHRARPGSVFLARSEE SLYLRPGQQSQEVKV
g8923454    114    MLLVDADQPEPMRSGA RELALFLTPEPGAEAK EVEETIEGMLLRLEEF
                   CSLADLIRSDTSQILE ENIPVLKAKLTEMRGI YAKVDRLEAFVKMVGH
                   HVAFLEADVLQAERDH GAFPQALRRWLGSAGL PSFRNVECSGTIPARC
                   NLRLPGSSDSPASASQ VAGITEVTCTGARDVR AAHTV
g8923691    115    MSVYSGKVLLQTTPPH VIGQLDKLIREVSTLD GVLEVRNEHFWTLGFG
                   SLAGSVHVRIRRDANE QMVLAHVTNRLYTLVS TLTVQIFKDDWIRPAL
                   LSGPVAANVLNFSDHH VIPMPLLKGTDGLNPY VHFLWKINFFLFFDME
                   SLSVAQAGVQWHDLGS LQPHLPGSSNSACLSL PSSWDYRHAPPHLPNF
                   CIISKDGVLPCWPCWS
g8924071    116    MESRSVAQTGVHWHNL SSLQPLPPRFKQFSCL SLRSSWDYTHLPPCLA
                   NFFVFLVETAFRHVGQ AGLKLLTSGDQPTSAS QSAGITGISHRTQPVG
                   RFLITDSIFLFVTDLL KFSISS
g8924204    117    MSKVLGGPFSKGHTAS DKYFQIFHNISFFETE SCSVAQAGVQWCNLGS
                   LQALPPRFTPFSCLSL PSSWDYRHPPPCPDNV FVFSVETGFHCVSQDG
                   LNLLTL
g8980667    118    MAQGTLIRVTPEQPTH AVCVLGTLTQLDICSS APEDCTSFS INASPGV
                   VVDIAHSPPAKKKSTG SSTWPLDPGVEVTLTM KAASGSTGDQKVQISY
                   YGPKTPPVKALLYLTA VDGVSPCHPGWSAMHD LAHCNLRLQVQAILCF
                   SVPSSWTTGACHHAWL IFVFLVEMEFHHVGQA GLELLTSGDLPASGSQ
                   SARITGMNHCARPSIF LILKYL
g9716913    119    MSQSPAFGPRRGSSPR GAAGAAARRNESQDYL LMDSELGEDGCPQAPL
                   PCYGYYPCFRGSDNRL AHRRQTVLREKGRRLA NRGPAYMFSDRSTSLS
                   IEEERFLDAAEYGNIP VVRKMLEECHSLNVNC VDYMGQNALQLAVANE
                   HLEITELLLKKENLSR VGDALLLAISKGYVRI VEAILSHPAFAEGKRL
                   ATSPSQSELQQDDFYA YDEDGTRFSHDVTPII LAAHCQEYEIVHTLLR
                   KGARIERPHDYFCKCN DCNQKQKHDSFSHSRS RINAYKGLASPAYLSL
                   SSEDPVMTALELSNEL AVLANIEKEFKNDYKK LSMQCKDFVVGLLDLR
                   RNTEEVEAILNGDVET LQSGDHGRPNLSRLKL AIKYEVKKMGKIMRGP
                   FMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNAKQLFRMK
                   TSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLA
                   IFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLAR
                   IKWDPSDPQIISEGLY AIAVVLSFSRIAYTLP ANESFGPLQISLGRTV
                   KDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLF
                   WAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMI
                   NSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLFY
                   LLLKLKKWISELFQGH KKGFQEDAEMNKINEE KKLGILGSHEDLSKLS
                   LDKKQVGHNKQPSIRS SEDFHLNSFNNPPRQY QKIMKRLIKRYVLQAQ
                   IDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRELGEK
                   LSMEPNQEETNR
g9966865    120    MLRNSTFKNMQRRHTT LREKGRRQAIRGpAYM FNEKGTSLTPEEERFL
                   DSAEYGNIPVVRKMLE ESKTLNFNCVDYMGQN ALQLAVGNEHLEVTEL
                   LLKKENLARVGDALLL AISKGYVRIVEAILNH PAFAQGQRLTLSPLEQ
                   ELRDDDFYAYDEDGTR FSHDITPIILAAHCQE YEIVHILLLKGARIER
                   PHDYFCKCNECTEKQR KDSFSHSRSRMNAYKG LASAAYLSLSSEDPVL
                   TALELSNELARLANIE TEFKNDYRKLSMQCKD FVVGVLDLCRDTEEVE
                   AILNGDVNFQVWSDHH RPSLSRIKLAIKYEVK KFVAHPNCQQQLLTMW
                   YENLSGLRQQSIAVKF LAVFGVSIGLPFLAIA YWIAPCSKLGRTLRSP
                   FMKFVAHAVSFTIFLG LLVVNASDRFEGVKTL PNETFTDYPKQIFRVK
                   TTQFSWTEMLIMKWVL GMIWSECKEIWEEGPR EYVLHLWNLLDFGMLS
                   IFVASFTARFMAFLKA TEAQLYVDQHVQDDTL HNVSLPPEVAYFTYAR
                   DKWWPSDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTV
                   KDIFKFMVIFIMVFVA FMIGMFNLYSYYRGAK YNPAFTTVEESFKTLF
                   WSIFGLSEVISVVLKY DHKFIENIGYVLYGVY NVTMVVVLLNMLIAMI
                   NNSYQEIEEDADVEWK FARAKLWLSYFDEGRT LPAPFNLVPSPKSFYY
                   LIMRIKMCLIKLCKSK AKSCENDLEMGMLNSK FKKTRYQAGMRNSENL
                   TANNTLSKPTRYQKIM KRLIKRYVLKAQVDRE NDEVNEGELKEIKQDI
                   SSLRYELLEEKSQATG ELADLIQQLSEKFGKN LNKDHLRVNKGKDI
g9967846    121    MDDGCPQLPLPPHGYY PSLRGTDNRLTHRRQT VLREKGRRLANRGPAY
                   MFNDHSTTLSIEEERF LDAAEYGNIPVVRKML EECLSLNVNCVDYMGQ
                   NALQLAVANEHLEITE LLLKKENLSRVGDALL LAISKGYVRIVEAILS
                   HPAFAEGKRLATSPSQ SELQQDDFYAYDEDGT RFSHDVTPIILAAHCQ
                   EYEIVHTLLRKGARIE RPHDYFCKCSECNQKQ KHDSFSHSRSRINAYK
                   GLASPAYLSLSSEDPV MTALELSNELAVLANI EKEFKNDYKKLSMQCK
                   DFVVGLLDLCRNTEEV EAILNGDVETCQSGDQ GRPNLSRLKLAIKYEV
                   KKFVAHPNCQQQLLSI WYENLSGLRQQTMAVK FLVVLGVAIGLPFLAL
                   IYWCAPCSKMGKIMRG PFMKFVAHAASFTIFL GLLVMNAADRFEGTKL
                   RPNETSTDNAKQLFRM KTSCFSWMEMLIISWV IGMIWAECKEIWAQGP
                   KEYLFELWNMLDFGML AIFAASFIARFMAFWH ASKAQSIIDANDTLKD
                   LTKVTLGEDVKYYNLA RIKWDPSDPQIISEGL YAIAVVLSFSRIAYIL
                   PANESFGPLQISLGRT VKDIFKFMVIFIMVFV AFMIGMFNLYSYYIGA
                   KQNEAFTTVEESFKTL FWAIFGLSEVKSVVIN YNHKFIENIGYVLYGV
                   YNVTMVIVLLNMLIAM INSSFQEIEDDADVEW KFARAKLWFSYFEEGR
                   TLPVPFNLVPSPKSLL YLLLKFKKWGFELFQG HKKAFQEDAEMNKRNE
                   EKKFGILGSHEDLSKL SVDKKQLGQNKQSSIR SSEDFHLNSFNNPPRQ
                   YQKIMKRLIKRYVLQA QIDKESDEVNEGELKE IKQDISSLRYELLEEK
                   SQNTEDLAELIRKLGE KLSSEPKQEEINR
g9967886    122    MFNDHSTTLSIEEERF LDAAEYGNIPVVRKML EECLSLNVNCVDYMGQ
                   NALQLAVANEHLEITE LLLKKENLSRVGDALL LAISKGYVRIVEAILS
                   HPAFAEGKRLATSLSQ SELQQDDFYAYDEDGT RFSHDVTPIILAAHCQ
                   EYEIVHTLLRKGARIE RPHDYFCKCSECNQKQ KHDSFSHSRSRINAYK
                   GLASPAYLSLSSEDPV MTALELSNELAVLANI EKEFKNDYKKLSMQCK
                   DFVVGLLDLCRNTEEV EAILNGDIETCQPGDQ GRPNLSRLKLAIKYEV
                   KKFVAHPNCQQQLLSI WYENLSGLRQQTMAVK FLVVLGVA IGLPFLAL
                   IYWCAPCSKMGKIMRG PFMKFVAHAASFTIFL GLLVMNAADRFEGTKL
                   RPNETSTDNAKQLFRM KTSCFSWMEMLIISWV IGMVWAECKEIWAQGP
                   KEYLFELWNMLDFGML AIFAASFIARFMAFWH ASKAQSIIDANDTLKD
                   LTKVTLGEDVKYYNLA RIKWDPSDPQI ISEGL YAIAVVLSFSRIAYIL
                   PANESFGPLQISLGRT VKDIFKFMVIFIMVFV AFMIGMFNLYSHYIGA
                   KQNEAFTTYVISDVLT MEIAD
g9967888    123    MDDGCPQLPLPPHGYY PSLRGTDNRLTHRRQT VLREKGRRLANRGPAY
                   MFNDHSTTLSIEEERF LDAAEYGNIPVVRKML EECLSLNVNCVDYMGQ
                   NALQLAVANEHLEITE LLLKKENLSRVGDALL LAISKGYVRIVEAILS
                   HPAFAEGKRLATSPSQ SELQQDDFYAYDEDGT RFSHDVTPIILAAHCQ
                   EYEIVHTLLRKGARIE RPHDYFCECSECNQKQ KHDSFSHSRSRINAYK
                   GLASPAYLSLSSEDPV MTALELSNELAVLANI EKEFKNDYKKLSMQCK
                   DFVVGLLDLCRNTEEV EAILNGDVETCQPGDQ GRPNLSRLKLAIKYEV
                   KKFVAHPNCQQQLLSI WYENLSGLRQQTMAVK FLVVLGVAIGLPFLAL
                   IYWCAPCSKMGKIMRG PFMKFVAHAASFTIFL GLLVMNAADRFEGTKL
                   RPNETSTDNAKQLFRM KTSCFSWMEMLIISWV IARIKWDPSDPQIISE
                   GLYAIAVVLSFSRIAY ILPANESFGPLQISLG RTVKDIFKFMVIFIMV
                   FVAFMIGMFHLYSYYI GAKQNEAFTTVEESFK TLFWAIFGLSEVKSVV
                   INYNHKFIENIGYVLY GVYNVTMVIVLLNMLI AMINSSFQEIEDDADV
                   EWKFARAKLWFSYFEE GRTLPVPFNLVPSPKS LLYLLLKFKKWGFELF
                   QGHKKAFQEDAEMNKR NEEKKFGILGSHEDLS KLSVDKKQLGQNKQSS
                   IRSSEDFHLNSFNNPP RQYQKIMKRLIKRYVL QAQIDKESDEVNEGEL
                   KEIKQDISSLRYELLE EKSQNTEDLAELIRKL GEKLSSEPKQEEINR
g9716913    124    MSQSPAFGPRRGSSPR GAAGAAARRNESQDYL LMDSELGEDGCPQAPL
                   PCYGYYPCFRGSDNRL AHRRQTVLREKGRRLA NRGPAYMFSDRSTSLS
                   IEEERFLDAAEYGNIP VVRKMLEECHSLNVNC VDYMGQNALQLAVANE
                   HLEITELLLKKENLSR VGDALLLAISKGYVRI VEAILSHPAFAEGKRL
                   ATSPSQSELQQDDFYA YDEDGTRFSHDVTPII LAAHCQEYEIVHTLLR
                   KGARIERPHDYFCKCN DCNQKQKHDSFSHSRS RINAYKGLASPAYLSL
                   SSEDPVMTALELSNEL AVLANIEKEFKNDYKK LSMQCKDFVVGLLDLR
                   RNTEEVEAILNGDVET LQSGDHGRPNLSRLKL AIKYEVKKMGKIMRGP
                   FMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNAKQLFRMK
                   TSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLA
                   IFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLAR
                   IKWDPSDPQIISEGLY AIAVVLSFSRIAYTLP ANESFGPLQISLGRTV
                   KDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLF
                   WAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMI
                   NSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLFY
                   LLLKLKKWISELFQGH KKGFQEDAEMNKINEE KKLGILGSHEDLSKLS
                   LDKKQVGHNKQPSIRS SEDFHLNSFNNPPRQY QKIMKRLIKRYVLQAQ
                   IDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRELGEK
                   LSMEPNQEETNR
本发明的NTP肽、相关蛋白、相关肽及其片段、变体、衍生物、同源物和模拟物可用此领域技术人员已知的方法制备,如重组DNA技术、蛋白质合成和分离天然产生的NTP肽、相关蛋白、相关肽及其片段、变体、衍生物和同源物。
NTP肽、相关蛋白或相关肽可用熟知的重组DNA技术方法制备,如列于Sambrook等,(《分子克隆:实验室手册》(Molecular Cloning:A Laboratory Manual),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.[1989])和/或Ausubel等编,《新编分子生物学实验指南》(Current Protocols in Molecular Biology),GreenPublishers Inc.及Wiley和Sons,N.Y.[1994]的方法。
可获得编码NTP肽、相关蛋白或相关肽的基因或cDNA,例如通过筛选基因组或cDNA文库或通过PCR扩增。用于筛选文库的探针或引物可在其它已知基因或基因片段序列信息的基础上产生,这些基因或基因片段来自相同或相关基因家族,如在其它相关蛋白中发现的保守基序。此外,已鉴定了一种生物编码NTP肽、相关蛋白或相关肽的基因,该基因的所有或一部分可用作探针来鉴定其它生物的同源基因。此种探针或引物可用于筛选认为能表达NTP肽、相关蛋白或相关肽基因的多种组织来源的cDNA文库。通常,可采用高严谨性条件来尽可能减少筛选获得的假阳性数量。
另一种制备编码NTP肽、相关蛋白或相关肽的基因的方法采用化学合成,使用此领域技术人员熟知的方法,如Engels等(Angew.Chem.Intl.Ed.,28:716-734[1989])描述的方法。这些方法尤其包括磷酸三酯、亚磷酰胺、H-膦酸酯方法用于核酸合成。这种化学合成的优选方法是用标准亚磷酰胺化学的聚合物-支持的合成。一般,编码NTP肽、相关蛋白或相关肽的DNA长度为几百个核苷酸。可用这些方法将大于约100个核苷酸的核酸合成为几个片段。然后可将这些片段连接在一起形成全长NTP肽、相关蛋白或相关肽。通常,编码此蛋白质氨基末端的DNA片段具有编码甲硫氨酸的ATG。此甲硫氨酸可以或可不存在于相关蛋白、相关肽或NTP肽的成熟形式中,这取决于宿主细胞中产生的蛋白质是否设计成该细胞分泌的蛋白质。
可将编码相关蛋白、相关肽或NTP肽的基因、cDNA或其片段用标准连接技术插入合适的表达或扩增载体中。通常选择在所用具体宿主细胞中具有功能的载体(即载体与宿主细胞机制相容,从而其中的基因可扩增和/或表达)。编码相关蛋白、相关肽或NTP肽的基因、cDNA或其片段可在原核、酵母、昆虫(杆状病毒系统)和/或真核宿主细胞中扩增/表达。宿主细胞的选择部分取决于相关蛋白,相关肽或NTP肽是否糖基化和/或磷酸化。如果这样,优选酵母、昆虫或哺乳动物宿主细胞。
通常,用于任何宿主细胞的载体包含5’侧翼序列(也称为“启动子”)和其它调节元件如增强子、复制元件的起点、转录终止元件、含供体和受体剪接位点的完整内含子序列、信号肽序列、核糖体结合位点元件、聚腺苷酸化序列、用于插入编码待表达多肽的核酸的多接头区域、及可选择的标记元件。各个这些元件在下面讨论。任选的,载体可包含一尾序列,即位于相关蛋白、相关肽或NTP肽编码序列的5’或3’末端的寡核苷酸分子;该寡核苷酸分子编码聚组氨酸(如6个组氨酸)或其它标志如FLAG、HA(流感病毒血凝素)或存在可商业购买抗体的myc。此尾常在表达多肽时融合于该多肽,可作为从宿主细胞亲和纯化相关蛋白、相关肽或NTP肽的工具。例如可通过柱层析完成亲和纯化,此柱层析采用抗该尾巴的抗体抗作为亲和基质。任选地,随后可通过多种方法某些肽酶从纯化的相关蛋白、相关肽或NTP肽中去除该尾巴。
本领域技术人员可将人免疫球蛋白铰链区和Fc区融合于该相关蛋白、相关肽或NTP肽的N-或C-末端。随后Fc融合蛋白可用A蛋白亲和柱纯化。已知Fc体内可表现出长的药物动力学半衰期且发现融合Fc的蛋白质体内表现出的半衰期显著大于未融合蛋白质。同样,融合的Fc区使得一些分子可二聚化/多聚化而利用其生物活性。
5’侧翼序列可以是同源(即来自与宿主细胞相同的物种和/或品系)、异源(即来自与宿主细胞不同的物种或品质)、杂交的(即一个以上来源的5’侧翼序列的组合)、合成的,或可以是天然的相关蛋白、相关肽或NTP肽基因5’侧翼序列。同样,5’侧翼序列的来源可以是单细胞原核或真核生物、任何脊椎动物或无脊椎动物、或任何植物,只要此5’侧翼序列有功能且可被宿主细胞机制活化。
本发明载体中所用的5’侧翼序列可通过本领域熟知的一些方法来获得。通常,除了相关蛋白、相关肽或NTP肽基因侧翼序列外本文所用的5’侧翼序列前面已通过作图和/或限制性内切酶消化得到鉴定,因此可用合适的限制性内切酶从适当组织来源中分离得到。在一些情况中,此5′侧翼序列的全核苷酸序列可以是已知的。这里可用上述核酸合成或克隆的方法合成此5’侧翼序列。
当5’侧翼所有或仅部分序列已知时,它可用PCR和/或通过筛选基因组文库来获得,筛选所用的合适寡核苷酸和/或5’侧翼序列片段来自相同或另一物种。
当不知道5’侧翼序列时,含5’侧翼序列的DNA片段可从DNA的较大片断中分离,此DNA可包含例如编码序列或甚至另外的基因。分离可通过限制性内切酶消化完成,用一种或多种仔细选择的酶分离适当DNA片段。消化后,所需片段可通过琼脂糖凝胶纯化、Qiagen柱或其它本领域技术人员已知的方法来分离。选择适当酶以达到此目的对此领域的一般技术人员是不难懂得的。
复制元件的起点通常是商业购买的原核表达载体的一部分,可协助宿主细胞中载体的扩增。在一些情况中,载体扩增到一定拷贝数对最佳表达相关蛋白、相关肽或NTP肽很重要。如果所选载体不含有复制起始位点,可在已知序列基础上化学合成此起点并连接入载体。转录终止元件一般位于NTP蛋白或NTP/肽编码序列的3’末端,作用是终止相关蛋白、相关肽或NTP肽的转录。通常,原核细胞中的转录终止元件是后面有一聚T序列的富含G-c的片段。虽然可从文库克隆或商业购买此元件作为载体部分,也可用上述核酸合成方法容易地合成。
可选择性标记基因元件编码宿主细胞在选择性培养基中存活和生长所必需的蛋白质。典型的选择标记基因元件编码的蛋白质(a)赋予原核宿主细胞对抗生素或其它毒素的抗性,如氨苄青霉素、四环素或卡那霉素的抗性,(b)弥补细胞的营养缺陷;或(c)提供复合培养基没有的关键营养素。优选的可选择标记是卡那霉素抗性基因、氨苄青霉素抗性基因和四环素抗性基因。
一般称为SD序列(原核生物)或Kozak序列(真核核生物)的核糖体结合元件,是mRNA翻译起始通常必需的。此元件通常位于启动子3’端和待合成的相关蛋白、相关肽或NTP肽编码序列的5’端。各SD序列不同但一般是聚嘌呤(即有高A-G含量)。已鉴定到许多SD序列,本领域普通技术人员可不难用上述方法合成各种SD序列并用于原核载体中。
在需要相关蛋白、相关肽或NTP肽从宿主细胞分泌时,可利用信号序列引导相关蛋白,相关肽或NTP肽分泌到宿主细胞外,可缺失此蛋白质的羧基末端部分以防止膜锚定。通常,信号序列位于相关蛋白/相关肽/NTP肽基因或cDNA的编码区域中,或连接在相关蛋白/相关肽/NTP肽基因编码区的5’末端。已鉴定到许多信号序列,任何一种在所选宿主细胞中有功能的信号序列可与相关蛋白/相关肽/NTP肽基因或cDNA结合使用。因此,该信号序列可与相关蛋白/相关肽/NTP肽基因或cDNA同源或异源,可与相关蛋白/相关肽/NTP肽基因或cDNA同源或异源。另外,此信号序列可用上述方法化学合成。在大部分情况中,通过信号肽的存在宿主细胞分泌多肽时会导致从此多肽中去除氨基末端的甲硫氨酸。
在许多情况中,相关蛋白/相关肽/NTP肽基因或cDNA的转录,可通过载体中存在一个或多个内含子而增加;当相关蛋白、相关肽或NTP肽在真核宿主细胞中产具体是哺乳动物宿主细胞生时尤其如此。所用内含子可以是相关蛋白/相关肽/NTP肽基因中天然存在的,特别是当所用基因是全长基因组序列或其片段时。当基因中无天然产生的此内含子时(对于大部分cDNAs如此),该内含子可获自另外的来源。由于此内含子必须转录有效,关于其侧翼序列和相关蛋白/相关肽/NTP肽基因的相对位置通常很重要。同样,当插入表达载体中的相关蛋白/相关肽/NTP肽基因是cDNA分子时,该内含子的优选位置是转录起始位点的3’端和聚A转录终止序列的5’端。对于相关蛋白/相关肽/NTP肽cDNA,此内含子或这些内含子优选位于cDNA一侧或另一侧(即5’或3’),从而不会打断此编码序列。只要此内含子与其插入的宿主细胞相容,任何来源的任何内含子均可用于实施本发明,包括病毒、原核和真核(植物或动物)生物的内含子。还包括在本文中的合成内含子。任选地,在载体中可使用一个以上的内含子。
当上述一个或多个元件不存在于待使用的载体中时,它们可单独获得并连接入载体。用于获得各元件的方法是本领域技术人员熟知的,且可与上述方法相比较(即合成DNA、文库筛选等)。
用于实施本发明的最终载体可从起始载体构建,如商业购买的载体。这种载体可以或可不包含一些完整载体中所含的元件。如果起始载体中没有所需元件,各元件可单独连接入载体,通过用合适的限制性内切酶切割载体,使此元件待连接末端和载体末端适合于连接。在一些情况中,可能必须使待连接在一起的末端成为“平端”,以获得满意的连接。通过先用Klenow DNA聚合酶或T4 DNA聚合酶在所有四种核苷酸存在时填补“粘端”来获得平端。此过程是本领域熟知,其描述见例如Sambrook等,同上。另外,待插入此载体的两个或多个元件可先连接一起(如果它们的位置彼此相邻),随后连接入载体。
另一种构建此载体的方法是在一种反应混合物中同时进行多种元件的所有连接。这里,由于不适当的连接或插入元件将含产生许多无意义和无功能的载体。然而可通过限制性内切酶消化来鉴定和选择功能性载体。
实施本发明的优选载体是与细菌、昆虫和哺乳动物宿主细胞相容的那些载体。这种载体包括pCPII、pCR3和pcDNA3.1(Invitrogen Company,San Diego,Calif.)、pBSII(Strtagene Company,La Jolla,Calif.)、pET15b(Novagen,Madison,Wis.)、PGEX(Pharmacia Biotech,Piscataway,N.J.)、pEGFP-N2(Clontech,Palo Alto,Calif.)、pETL(BlueBacII;Invitrogen)和pFastBacDual(Gibco/BRL,Grand Island,N.Y.)。
在载体构建和编码全长或截短的相关蛋白、相关肽或NTP肽的核酸分子插入此载体的适当位点后,可将此完整的载体插入合适的宿主细胞用于扩增和/或多肽表达。宿主细胞可以是原核宿主细胞(如大肠杆菌)或真核宿主细胞(如酵母细胞、昆虫细胞或脊椎动物细胞)。当宿主细胞在合适条件下培养时,可合成相关蛋白、相关肽或NTP肽,随后从培养基收集(如果宿主细胞分泌它们到培养基中)或直接从产生它们的宿主细胞(如果它不被分泌)收集。
收集后,相关蛋白、相关肽或NTP肽可用分子筛层析、亲和层析等方法纯化。产生相关蛋白、相关肽或NTP肽的宿主细胞的选择部分取决于相关蛋白、相关肽或NTP肽是否糖基化或磷酸化(其中真核宿主细胞优选)、宿主细胞是否能折叠此蛋白质成其天然三级结构(如二硫桥的正确取向等)方式,从而通过具有生物活性的相关蛋白、相关肽或NTP肽而制备生物活性蛋白质。合成后可用下面讨论的合适化学条件折叠相关蛋白、相关肽或NTP肽。用于本发明的合适细胞或细胞系包括哺乳动物细胞,如中国仓鼠卵巢细胞(CHO)、人胚胎肾(HEK)293或293T细胞,或3T3细胞。选择合适的哺乳动物宿主细胞和转化、培养、扩增、筛选和产物生成及纯化的方法是本领域技术人员已知的。其它合适的哺乳动物细胞系包括猴COS-1和COS-7细胞系及CV-1细胞系。更具示范性的哺乳动物宿主细胞包括灵长类细胞系和啮齿动物细胞系,含转化的细胞系。正常二倍体细胞、衍生自原代组织体外培养的细胞株以及原代外植体也是合适的。候选细胞可以是在选择基因中有遗传型缺陷或可含有优势作用的选择基因。其它合适的哺乳动物细胞系包括但不限于小鼠成神经细胞瘤N2A细胞、海拉细胞、小鼠L-929细胞、衍生自Swiss、Balb-c或NIH小鼠的3T3系、BHK或HaK仓鼠细胞系。
与适合于本发明的宿主细胞同样有用的是细菌细胞。例如,多种大肠杆菌菌株(如HB101、DH5α、DH10和MC1061)是生物技术领域中熟知的宿主细胞。枯草芽孢杆菌(B.subtilis)、假单胞菌属(Pseudomonas spp.)、其它芽孢杆菌属(Bacillusspp.)、链霉菌属(Streptomyces spp.)等多种菌株可用于此方法。本领域技术人员已知的许多酵母细胞菌株也可作为表达本发明多肽的宿主细胞。
另外,需要时昆虫细胞系统可用于本发明的方法。这种系统已有描述,例如Kitts等(Biotechniques,14:810-817[1993])、Lucklow(Curr.Opin.Biotechnol.,4:564-572[1993])和Lucklow等(J.Virol.,67:4566-4579[1993])。优选的昆虫细胞是Sf-9和Hi5(Invitrogen,Carlsbad,Calif.)。
插入(也称为转化或转染)载体到所选宿主细胞中可用方法如氯化钙、电穿孔、显微注射、脂转染或DEAE-葡聚糖方法来完成。选择的方法部分利用所用类型宿主细胞的功能。这些方法和其它合适方法是本领域技术人员熟知的并被列出,例如见Sambrook等,同上。
含此载体(即转化的或转染的)的宿主细胞可用本领域技术人员熟知的标准培养基培养。此培养基通常含有细胞生长和存活必需的所有营养物。培养大肠杆菌细胞的合适培养基是例如Luria Broth(LB)和/或Terrific Broth(TB)。培养真核细胞的合适培养基是RPMI1640、MEM、DMEM,它们都添加有血清和/或培养特定细胞系所需的生长因子。培养昆虫的合适培养基是Grace培养基,添加有必需的yeastolate、乳白蛋白水解产物和/或胎牛血清。通常,培养基中加入抗生素或其它仅用于选择性生长转化细胞的化合物作为添加物。所用化合物将通过由转化宿主细胞的质粒上存在的可选择标记元件决定。例如,当可选择标记元件是卡那霉素抗性时,加入培养基的化合物是卡那霉素。
宿主细胞中产生的相关蛋白、相关肽或NTP肽的量可用本领域已知的标准方法评估。这种方法包括但不限于蛋白质印迹分析、SDS-聚丙烯酰胺凝胶电泳、非变性凝胶电泳、HPLC分离、质谱、免疫沉淀和/或活性试验如DNA结合凝胶移位试验。
如果相关蛋白、相关肽或NTP肽设计为从宿主细胞中分泌,大部分相关蛋白、相关肽或NTP肽可发现于细胞培养基中。以此方法制备的蛋白质通常不具有氨基末端甲硫氨酸,因为它在细胞分泌时被去除。然而如果相关蛋白、相关肽或NTP肽不从宿主细胞中分泌,它将存在于细胞质和/或核中(真核宿主细胞)或细胞溶质中(革兰阴性菌宿主细胞),且可具有氨基末端甲硫氨酸。
对位于宿主细胞细胞质和/或核中的相关蛋白、相关肽或NTP肽,通常先机械破碎宿主细胞或用洗涤剂释放胞内成分到缓冲溶液中。然后可从溶液中分离相关蛋白、相关肽或NTP肽。
从溶液中纯化相关蛋白、相关肽或NTP肽可采用多种技术完成。如果合成的蛋白质含有如6个组氨酸的钯(NTP蛋白/hexa His)或其它小肽如FLAG(Sigrna-Aldritch,St.Louis,MI)或在其羧基或氨基末端含有钙调蛋白-结合肽(Stratagene,LaJolla,CA),它可采用一步法使溶液通过亲和柱来纯化,柱中的柱基质对该尾巴或直接对该蛋白质有高亲和性(即特异性识别相关蛋白或相关肽的单克隆抗体)。例如,聚组氨酸能以高亲和力特异性结合镍、锌及钴;因而使用以镍为基础的亲和树脂(如Qiagen的QIAexpress system或Invitrogen的Xpress System中所用的)或以钴为基础的亲和树脂(如BD Biosciences-CLONTECH的Talon system中所用的)的固定金属离子亲和层析可用于纯化NTP相关蛋白/聚组氨酸。(参见例如,Ausubel等编,《新编分子生物学实验指南》,10.11.8章节,John Wiley&Sons,纽约[1993])。
当制备的相关蛋白、相关肽或NTP肽没有附着尾巴又不能得到其抗体时,可使用其它熟知的纯化方法。这种方法包括但不限于离子交换层析、羟基磷灰石层析、疏水作用层析、分子筛层析、HPLC、结合凝胶洗提的天然凝胶电泳以及制备型等电聚焦(Isoprime机器/技术,Hoefer Scientific)。在一些情况下可联合一种或多种技术以提高纯度。
如果预期相关蛋白、相关肽或NTP肽主要发现于胞内,可用本领域技术人员已知的标准技术提取宿主细胞中的胞内物质(包括革兰阴性菌的包含体)。例如可离心后通过弗氏压碎器、匀浆和/或超声裂解宿主细胞以释放周质/细胞质成分。如果相关蛋白、相关肽或NTP肽在细胞溶质中形成包含体,该包含体常结合于内和/或外细胞膜,因此离心后主要见于沉淀物中。然后在存在还原剂如碱性pH的二硫苏糖醇或酸性pH的三羧乙基膦时用极端pH或用离液剂如去污剂、胍、胍衍生物、尿素或尿素衍生物处理此沉淀物以释放、破裂和溶解此包含体。然后可对已是可溶形式的相关蛋白、相关肽或NTP肽用凝胶电泳、免疫沉淀等分析。如果需要分离相关蛋白、相关肽或NTP肽,可用标准方法完成分离,如下面和Marston等(Meth.Enz.,182:264-275[1990])列出的方法。
在一些情况中,相关蛋白、相关肽或NTP肽分离时可能没有生物活性。可采用重折叠或转变此多肽成其三级结构并产生二硫键的多种方法恢复其生物活性。这些方法包括使溶解的多肽暴露于通常高于7的pH和存在的特定浓度离液剂。离液剂的选择非常类似于用于包含体溶解的选择,但通常浓度较低且不一定是溶解所用的同一离液剂。在大部分情况中,重折叠/氧化溶液也包含还原剂或特定比例的还原剂加其氧化形式,以产生特定氧化还原电势使二硫化物改组形成蛋白质的半胱氨酸桥。一些常用的氧化还原对包括半胱氨酸/胱胺、谷胱甘肽(GSH)/二硫双GSH(dithiobis GSH)、氯化铜、二硫苏糖醇(DTT)/二噻烷DTT、2-巯基乙醇(bME)/二硫-b(ME)。在许多情况中,需要共溶剂以提高重折叠的效率,用于此目的较常用试剂包括甘油、不同分子量的聚乙二醇和精氨酸。
如果宿主细胞中不形成显著程度的相关蛋白、相关肽或NTP肽包含体,细胞匀浆离心后相关蛋白、相关肽或NTP肽主要见于上清液中,相关蛋白、相关肽或NTP肽可用如下方法从上清液中分离获得。
当优选部分或完全分离相关蛋白、相关肽或NTP肽的情况中,可用本领域技术人员熟知的标准方法完成纯化。这种方法包括但不限于电泳分离,接着电洗脱、多种类型的层析(免疫亲和、分子筛和/或离子交换)、和/或高压液相层析。在一些情况中,优选使用一种以上的这些方法来完全纯化。
除了用重组DNA技术制备和纯化相关蛋白、相关肽或NTP肽外,相关蛋白、相关肽或NTP肽和它们的片段、变体、同源物和衍生物可用化学合成方法制备(如固相肽合成),使用本领域已知技术如描述于Merrifield等,(J.Am.Chem.Soc.,85:2149[1963])、Houghten等(Proc.Natl.Acad.Sci.USA,85:5132[1985])、Stewart和Young(《固相肽合成》(Solid Phase Peptide Synthesis),Pierce Chemical Co.,Rockford,III.[1984])。可合成氨基末端有或没有甲硫氨酸的这些多肽。化学合成的相关蛋白、相关肽或NTP肽可用参考文献所列方法氧化以形成二硫桥。预期相关蛋白、相关肽或NTP肽具有相当于重组产生或纯化自天然来源的相关蛋白、相关肽或NTP肽相的生物活性,因此可与重组或天然的相关蛋白、相关肽或NTP肽交换使用。
化学修饰的相关蛋白、相关肽或NTP肽组合物中包含连接于一聚合物的相关蛋白、相关肽或NTP肽属于本发明范围内。所选聚合物通常可溶于水从而其结合的蛋白质在水环境,如生理环境中不会沉淀。所选聚合物通常经修饰而具有一个反应基团如用于酰化的活性酯或用于烷化的醛,这样可如本方法所提供的那样,控制聚合程度。聚合物可以是任何分子量,可以分支或不分支。相关蛋白/相关肽/NTP肽聚合物范围包括聚合物的混合物。
在一些情况中,需要制备天然产生的相关蛋白、相关肽或NTP肽的核酸和/或氨基酸变体。核酸变体可用定点诱变、PCR扩增或其它合适方法产生,其中引物具有所需的点突变(诱变技术的描述参见Sambrook等,同上,Ausubel等,同上)。采用Engels等(同上),所述的化学合成方法也可制备这种变体。其它本领域技术人员已知的方法也可使用。
优选的核酸变体是用于产生相关蛋白、相关肽或NTP肽的宿主细胞中含有密码子优先的核苷酸取代的那些变体。这种“密码子最优化”可通过计算机算法确定,此算法结合密码子频率表如“Ecohigh.Cod”作为高表达细菌基因的密码子优先,由University of Wisconsin包版本9.0,遗传学计算机组,Madison,Wis提供。其它有用的密码子频率表包括“Celegans high.cod”、“Celegans low.cod”、“Drosophila high.cod”、“Human high.cod”、“Maize high.cod”和“Yeast high.cod”。其它优选变体是编码上述与野生型相比保守性氨基酸变化(如其中天然产生的氨基酸侧链的电荷或极性没有因被不同氨基酸取代而显著改变)的变体、和/或设计为产生新的糖基化和/或磷酸化位点的变体、或设计为缺失现有糖基化和/或磷酸化位点的变体。
相关蛋白、相关肽、NTP肽、其片断、同源物、变体、衍生物及其盐类可用此领域的普通技术人员已知的常规肽合成技术产生。这些技术包括化学偶联方法(参见Wunch,E:“有机化学方法”,第15卷,Band 1+2,Synthese von Peptiden,thimeVerlag,Stuttgart(1974)和Barrany,G.;Marrifield,R.B.:“肽”(The Peptides),E.Gross,J.Meienhofer编,第2卷,第1章,1-284页,Academic Press(1980))、酶偶联方法(参见Widmer,F.Johansen,J.T.,Carlsverg Res.Commun.,第44卷,37-46页(1979)和Kullmann,W.:“酶促性肽合成”(Enzymatic Peptide Synthesis),CRC Press Inc.BocaRaton,Fla.(1987)和Widmer,F.,Johansen,J.T.,“生物和医学中的合成肽”(SyntheticPeptides in Biology and Medicines),Alitalo,K.,Partanen,P.,Vatieri,A.编,79-86页,Elsevier,Amsterdam(1985))、或化学和酶方法的组合,如果这具有加工设计和经济的优点。使用本文提供的指南,本领域技术人员能改变相关蛋白、相关肽或NTP肽的肽序列以产生具有与原始或天然相关蛋白、相关肽或NTP肽相同或类似生物活性的同源物。
采用给定的相关蛋白、相关肽或NTP肽的模拟物而不是此蛋白质本身有其优点。通常,与该蛋白质和肽相比,肽模拟物的生物利用度更高,具有较长的作用时间且生产成本较低。
因此,上述相关蛋白、相关肽和NTP肽可用于开发具有类似生物活性从而具有类似治疗作用的小化学化合物。可采用组合化学技术和本领域已知的其它技术开发相关蛋白、相关肽和NTP肽的肽模拟物(参见例如《第20届欧洲肽专题讨论会论文集》(Proceedings of the 20th European Peptide Symposium),G.Jung,E.Bayer编,289-336页,和其中的参考文献)。
结构上修饰本领域已知的肽以产生肽模拟物的方法的例子包括倒置主链手性中心产生D-氨基酸残基结构,具体是在N-末端,导致对蛋白酶降解的稳定性提高而对活性没有不利影响。在论文“含氚D-丙氨酸1-肽T结合”,Smith C.S.等,DrugDevelopment Res.,15,371-379页(1988)中给出了一个例子。
第二种方法是改变稳定性所需的环状结构,如N到C链间的二酰亚胺和内酰胺(Ede等,Smith和Rivier编,《肽:化学和生物学》,Escom,Leiden,1991,268-270页)。例子见构型限制的胸腺五肽样化合物,如美国专利号4,457,489(1985),Goldstein,G.等所公开的那样,其内容全部纳入本文供参考。
第三种方法是用能赋予蛋白水解抗性的假肽键替换相关蛋白、相关肽或NTP肽中的肽键。已报道了一些假肽键一般不影响肽的结构和生物活性。此方法的一个例子是取代逆一反假肽键(“胸腺五肽的生物活性逆反转同源物”,Sisto A等,Rivier,J.E.和Marshall,G.R.编,“肽、化学、结构和生物学”,Escom,Leiden,1990,722-773页)和Dalpozzo等(1993),Int.J.Peptide Protein Res.,41:561-566,纳入本文供参考)。根据此修饰,此肽的氨基酸序列可能与上述相关蛋白、相关肽和NTP肽的序列相同,除了一个或多个肽键被逆反转假肽键所取代外。优选大部分N-末端肽键被取代,由于这种取代将赋予对外肽酶作用于N-末端水解蛋白的抗性。
合成具有一个或多个还原的逆反转假肽键的肽是本领域已知的(Sisto(1990)和Dalpozzo等,(1993),见上)。因此肽键可用非肽键替代使肽模拟物获得与原始肽相似的结构,从而生物活性相似。也可用其它类似结构的化学基团替代氨基酸的化学基团作进一步修饰。另一种已知可提高对酶裂解的稳定性而生物活性没有或很少损失的合适假肽键,是还原型电子等排物假肽键(Couder等(1993),Int.J.PeptideProtein Res.,41:181-184,全部纳入本文供参考)。因此,这些肽的氨基酸序列可能与相关蛋白、相关肽或NTP肽序列相同,除了一个或多个肽键被电子等排物假肽键替代外。优选大部分N-末端肽键被取代,由于这种取代将赋予对外肽酶作用于N-末端水解蛋白的抗性。合成具有一个或多个还原型电子等排假肽键的肽是本领域已知的(Couder等1993,见上)。其他例子包括导入酮亚甲基键或甲硫键来替代肽键。
相关蛋白、相关肽和NTP肽的拟肽衍生物代表了另一类肽模拟物,拟肽保留了生物活性的重要结构决定簇,但去除了肽键,可赋予对蛋白水解的抗性(Simon等,1992,Proc.Natl.Acad.Sci.USA,89:9367-9371,全部纳入本文供参考)。拟肽是N-取代的甘氨酸的寡聚物。已报道了一些N-烷基基团,各对应于天然氨基酸的侧链(Simon等,1992,见上)。相关蛋白、相关肽或NTP肽的一些或所有氨基酸用对应于所替代氨基酸的N-取代甘氨酸替代。
可通过NMR谱、晶体图和/或计算机-辅助分子模型确定原始相关蛋白、相关肽或NTP肽的三级结构来协助开发肽模拟物。这些技术可帮助开发具有比原始肽更高效力和/或更高生物利用率和/或更高稳定性的新组合物(Dean(1994),BioEssays,16:683-687;Cohen和Shatzmiller(1993),J.Mol.Graph.,11:166-173;Wiley和Rich(1993),Med.Res.Rev.,13:327-384;Moore(1994),Trends Pharmacol.Sci.,15:124-129;Hruby(1993),Biopolymers.,33:1073-1082;Bugg等(1993)Sci.Am.,269:92-98,全部纳入本文供参考)。
一旦一种潜在的肽模拟物化合物被鉴定,它可以用下面例子中列出的方法合成和分析以评估其活性。用上述方法获得的肽模拟化合物包括在本发明范围内,该化合物具有相关蛋白、相关肽或NTP肽的生物活性和类似的三维结构。本领域技术人员不难明白,此肽模拟物可从任何携带上述一种或多种修饰的相关蛋白、相关肽或NTP肽中产生。还将明白,本发明的肽模拟物除了其作为治疗化合物的用途外,可进一步用于开发甚至更强的非肽化合物。
今天许多机构都能够合成本文所述的相关蛋白、相关肽和NTP肽。例如,有了一种NTP肽的序列,这些机构就能合成肽并为合成的肽提供相应的文件并证明肽的相同性。
本发明还包括使用相关蛋白、相关肽和NTP肽和它们相应的核酸分子进行试验,以定性或定量测定哺乳动物组织或体液样品中相关蛋白、相关肽、NTP肽、相关蛋白/相关肽/NTP肽的DNA或相应RNA的存在。相关蛋白、相关肽、NTP肽和它们相应的核酸分子可用于这些试验的准备,无论相关蛋白、相关肽或NTP肽或者编码的相关蛋白、相关肽或NTP肽是否显示生物活性。相关蛋白、相关肽或NTP肽的核酸序列可能是杂交探针有用的来源以定性或定量测定哺乳动物组织或体液样品中相关蛋白、相关肽或NTP肽DNA或相应RNA的存在。
本身不具生物活性的相关蛋白、相关肽或NTP肽可用于制备识别和/或结合相关蛋白、相关肽或NTP肽的抗体。这种抗体可用标准方法制备。因此,与相关蛋白、相关肽或NTP肽反应的抗体以及短链抗体片段和这种抗体的其它反应片段也在本发明范围内。抗体可以是多克隆、单克隆、重组、嵌合、单链和/或双特异性。通常,抗体或其片段是人来源或“人源化”,即制备后给予病人时可防止对抗体的免疫反应或减少到最低程度。优选的抗体是人抗体,多克隆或单克隆。抗体片段可以是能与本发明相关蛋白、相关肽或NTP肽反应的任何片断,如Fab、Fab’等。本发明还提供了杂交瘤,方法是通过呈递作为抗源的相关蛋白、相关肽或NTP肽给所选哺乳动物,接着用已知技术使该哺乳动物的细胞(如脾细胞)与一些癌细胞融合以产生无限增殖的细胞系。本发明还包括产生这种细胞系和产生抗所有或部分相关蛋白、相关肽或NTP肽的抗体的方法。
此种抗体可进一步用于体内和体外诊断或研究目的,如以标记形式来检测体液或细胞样品中相关蛋白、相关肽或NTP肽的存在。
本发明还包括使用一种或多种相关蛋白、相关肽或NTP肽作为试验中的校准标准品,以定性或定量测定哺乳动物组织或体液样品中相关蛋白、相关肽、NTP肽、相关蛋白/相关肽/NTP肽的DNA或相应RNA的存在。
本发明涉及治疗需要除去细胞的疾病的新方法,如良性或恶性肿瘤、腺体(如前列腺)增生、不想要的面部汗毛、疣和不想要的脂肪组织。这种方法包括将治疗有效量的相关蛋白、相关肽或NTP肽给予需要的哺乳动物。
这类疾病可以是例如肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴系统及其它器官的肿瘤。
如本文所用,术语“恶性肿瘤”包括人类癌、肉瘤和黑素瘤的所有形式,它们以低度分化、适度分化、高度分化的形式出现。
本发明满足本领域治疗的需要,可以除去良性肿瘤而风险较小、不良的手术副作用较少。特别需要在手术危险区如体内深处位(例如脑、心脏、肺和其它)去除良性肿瘤的方法。
治疗必须除去细胞的疾病的方法可与治疗这些疾病的常规方法如手术切除、化疗和放射治疗结合使用。相关蛋白、相关肽或NTP肽可在这些常规治疗之前、期间或之后施用。
待治疗的疾病也可以是选自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴系统的组织增生,肥大或过度生长。
可用本发明方法治疗的其它疾病是选自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴系统的病毒,细菌或寄生虫改变的组织。
待治疗的疾病也可以是选自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴系统的组织畸形或乱。
具体说,待治疗的疾病可以是扁桃体肥大、前列腺增生银屑病、湿疹、皮肤病或痔。待治疗的疾病可以是血管病如动脉粥样硬化或动脉硬化,或者是血管病如静脉曲张。待治疗的疾病也可以是以下组织的整容修饰,如皮肤、眼、耳、鼻、喉、口、肌肉、结缔组织、毛发或乳房组织。
相关蛋白、相关肽和/或NTP肽的治疗性组合物属于本发明范围内。这种组合物可包括治疗有效量的相关蛋白、相关肽或NTP肽与药学上可接受载体的混合物。载体物质可以是注射用水,优选在溶液中添加哺乳动物给药常用的其它物质。通常,用于治疗的相关蛋白、相关肽或NTP肽以组合物形式给药,该组合物包括纯化的相关蛋白、相关肽或NTP肽,加上一种或多种生理上可接受的载体、赋形剂或稀释剂。中性缓冲盐水或与血清白蛋白混合的盐水是适当载体的范例。优选此产物用合适的赋形剂(如蔗糖)制成冻干物。如果需要可包括其它标准载体、稀释剂和赋形剂。组合物包括此领域普通技术人员已知的pH值范围合适的缓冲液,包括pH7.0-8.5的Tris缓冲液、或pH 4.0-5.5的乙酸缓冲液,此缓冲液还可包括山梨醇或其合适的替代物。
对于靶向不想要的细胞成分的相关蛋白、相关肽或NTP肽偶联的或连接或结合的抗体、抗体片段、抗体样分子或对特异性肿瘤标记如细胞受体、信号肽或过度表达的酶有高亲和性的分子,也在发明范围内。这些抗体、抗体片段、抗体样分子或对特异性肿瘤标记有高亲和性的分子,可用于将所述相关蛋白、相关肽或NTP肽偶联物到特定细胞或靶组织。例如,具有特殊表面抗原或表达抗原的肿瘤可被这些抗体、抗体片段、抗体样结合分子靶向,因而肿瘤细胞可被相关蛋白、相关肽或NTP肽所杀死。这种采用抗体靶向的方法优点是降低剂量、增加结合和被靶细胞摄取的可能性、提高靶向和治疗转移性肿瘤和微小肿瘤的效率。
本发明还包括采用偶联于或连接或结合于蛋白质或其它分子的所述相关蛋白、相关肽和NTP肽以形成组合物,通过肿瘤-特异性或位点-特异性酶或蛋白酶或者通过靶向肿瘤或其它不想要的细胞的抗体偶联物,在肿瘤或其它不想要的细胞部位或附近裂解时,在肿瘤或其它不想要的细胞的部位或附近释放相关蛋白、相关肽或NTP肽。
本发明还包括采用偶联于或连接或结合于蛋白质或其它分子的所述相关蛋白、相关肽和NTP肽以形成组合物,在待治疗组织暴露于光(如激光疗法或其它光动力学或光活化疗法)、其它形式电磁辐射时,该组合物可释放相关蛋白、相关肽或NTP肽或相关蛋白、相关肽或NTP肽的一些生物活性片段,电磁辐射的其它形式有例如红外线辐射、紫外线辐射、x射线或γ射线辐射、局部加热、α或β辐射、超声波发射或其它局部能量源。
相关蛋白、相关肽或NTP肽可单独、一起或联合其它药物组合物使用,如对待治疗指征合适的细胞因子、生长因子、抗生素、细胞凋亡诱导剂、抗炎药物和/或化疗剂。
本发明还包括所述蛋白、相关肽或NTP肽的组合物,此组合物采用树状聚体、富勒烯和其它合成分子、聚合物及大分子,组合物中相关蛋白、相关肽或NTP肽和/或其相应DNA分子本身或与其它种类分子如肿瘤特异性标记偶联、结合于或包裹在上述分子、聚合物或大分子中。例如,美国专利号5,714,166《生物活性和/或靶树状聚体结合物》(Bioactive and/or Targeted Dendrimer Conjugates)提供了制备和利用靶树状聚合偶联物的方法,此种偶联物包括至少一种树状聚体和靶指示物以及至少一种与之偶联的生物活性剂剂。
本发明还包括所述相关蛋白、相关肽或NTP肽和/或基因及药物递送载体的治疗性组合物,递送载体有例如脂质乳剂、胶束聚合物、聚合物微球、电活化聚合物、水凝胶和脂质体。
采用可转运到不想要细胞的相关蛋白、相关肽或NTP肽或相关基因或基因同等物也在本发明范围内。肿瘤内过度表达所述相关蛋白、相关肽或NTP肽可用于诱导肿瘤中的细胞死亡并因而减少肿瘤细胞群。采用能转运所述相关蛋白、相关肽或NTP肽以治疗不想要的细胞成分的基因或基因同等物,其优点是所需剂量更少、可通过靶细胞分子的细胞后代传代,治疗次数必然减少、总体治疗减少。本发明还包括将编码含相关蛋白、相关肽或NTP肽的融合蛋白的基因转运给不想要的细胞或其邻近细胞,表达该基因及产生和/或分泌此融合蛋白后,此融合蛋白受到天然酶或蛋白酶或者前体药物的切割可释放出所述相关蛋白、相关肽或NTP肽到不想要的细胞或附近。
应用克隆的重组相关蛋白-、相关肽-或NTP肽-抗体偶联物;克隆的重组相关蛋白、、相关肽、或NTP肽-抗体片段偶联物;克隆的重组相关蛋白-、相关肽-或NTP肽-抗体样蛋白偶联物也包括在本发明范围内。与寻靶偶联物(如抗体、抗体片段、抗体样分子或者对癌特异性受体或其它肿瘤标记有高亲和性的分子)结合的克隆的所述相关蛋白、相关肽或NTP肽的优点,是这种分子兼有上述寻靶优点,及可制造和标准化生产克隆的偶联分子的优点。
口服给药的固体剂量形式包括但不限于胶囊、片剂、药丸、粉末和颗粒。在这种固体剂量形式中,优选将活性化合物与至少一种下列物质混合:(a)一种或多种惰性赋形剂(或载体),如柠檬酸钠或磷酸二钙;(b)填充剂或膨胀剂,如淀粉、乳糖、蔗糖、葡萄糖、甘露醇和硅酸;(c)粘合剂,如羧甲基纤维素、藻酸盐、明胶、聚乙烯吡咯烷酮、蔗糖和阿拉伯树胶;(d)保湿剂,如甘油;(e)崩解剂,如琼脂-琼脂、碳酸钙、马铃薯或木薯淀粉、褐藻酸、一些复合硅酸盐和碳酸钠;(f)溶液缓聚剂,如石蜡;(g)吸收加速剂,如季铵化合物;(h)润湿剂,如乙酰醇和甘油单硬脂酸盐;(i)吸收剂,如瓷土和斑脱土;(j)滑润剂,如滑石、硬脂酸钙、硬脂酸镁、固体聚乙二醇、月桂酰硫酸钠和它们的混合物。就胶囊、片剂、药丸而言,其剂量形式也可包括缓冲剂。
口服给药的液体剂量形式包括药学上可接受的乳剂、溶液、悬浮液、糖浆和酏剂。除了活性化合物外,液体剂量形式可包括本领域常用的惰性稀释剂如水或其它溶剂、增溶剂和乳化剂。乳化剂的范例是乙醇、异丙醇、碳酸乙酯、乙酸乙酯、苄醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺,油如棉子油、花生油、玉米胚芽油、橄榄油、蓖麻油和芝麻油,甘油、四氢糠醇、聚乙二醇、山梨聚糖的脂肪酸酯或这些物质的混合物等。
除了这种惰性稀释剂,该组合物也可包括辅佐剂,如润湿剂、乳化剂和悬浮剂、甜味剂、调味剂和香味剂。
本发明组合物中活性成分的实际剂量水平可以改变以得到治疗有效量的相关蛋白、相关肽或NTP肽从而获得对具体组合物和给药方法的理想治疗反应。因此选择剂量水平取决于所需的治疗效果、给药途径、所需治疗的持续时间以及其它因素。
哺乳动物包括人的有效量可根据体表面积给药。用于不同大小、种类的动物和人的剂量间的相互关系(以体表的mg/M2为基础)的描述见E.J.Freireich等,Cancer Chemother.Rep.,50(4):219(1966)。体表面积可从个体身高体重大约确定(参见例如《科学表》(Scientific Tables),Geigy Pharmaceuticals,Ardsley,N.Y.537-538页(1970))。
给予宿主的所述相关蛋白、相关肽或NTP肽的每日总剂量可以是单剂或分开的剂量。剂量单位组合物包含几分之一的量可用于构成每天剂量。然而要理解的是,任何具体病人的特定剂量水平取决于多种因素,包括体重、整体健康、性别、饮食、给药时间和途径、所给药物的效力、吸收和排泄的比例、联用的其它药物以及所治疗具体疾病的严重性。
给予本发明的相关蛋白、相关肽或NTP肽组合物的方法,包括但不限于肌肉内、口服、静脉内、腹膜内、大脑内(实质内)、脑心室内、肿瘤内、病灶内、皮内、鞘内、鼻内、眼内、动脉内、局部、透皮、通过气雾剂、输注、推射、植入装置、缓释系统等。
另一种给予本发明的相关蛋白、相关肽或NTP肽组合物的方法,是经皮或透皮途径。这种实施方案的一个例子是使用贴片。具体是,贴片可用相关蛋白、相关肽或NTP肽的精细悬浮液制备,例如二甲亚砜(DMSO)或DMSO与棉子油的混合物,使其接触携带肿瘤的哺乳动物皮肤,离开皮肤囊(pouch)内肿瘤定位部位。含有其它溶剂和固体支持物的其它介质或其混合物也可同样起作用。此贴片可包含溶液或悬浮液形式的所述相关蛋白、相关肽或NTP肽化合物。然后可将贴片应用于病人皮肤,例如将它插入病人的皮肤囊,此种皮肤囊可通过用缝针、夹子或其它夹持装置折叠皮肤并夹持在一起来形成。应确保囊与皮肤连续接触而不干扰哺乳动物。除了使用皮肤囊,可使用任何能保证牢固放置的贴片与皮肤接触的装置。例如,粘附绷带可用来保持贴片在皮肤上。
所述相关蛋白、相关肽或NTP肽可以缓释制剂或制品给药。缓释制剂的合适例子包括成形物质形式的半透性聚合物基质,如薄膜或微胶囊。缓释基质包括聚酯、水凝胶、聚交酯(美国3,773,919、EP58,481)、L-谷氨酸和γ乙基-L-谷氨酰胺的共聚物(Sidman等,Biopolymers,22:547-556[1983])、聚(2-羟乙基-甲基丙烯酸盐)(Langer等,J.Biomed.Mater.Res.,15:167-277[1981]和Langer等,Chem.Tech.,12:98-105[1982])、乙烯乙酸聚乙烯(Langer等,同上)或聚-D(-)-3-羟基丁酸(EP133,988)。缓释组合物也包括脂质体,可用本领域已知的一些方法之一来制备(如Eppstein等,Proc.Natl.Acad.Sci.USA,82:3688-3692[1985];EP 36,676;EP 88,046和EP 143,949)。
另一种给予本发明相关蛋白、相关肽或NTP肽的方法,是将相关蛋白、相关肽或NTP肽直接或间接输入到待治疗的肿瘤或其它组织中。这种实施方案的一个例子是直接注射相关蛋白、相关肽或NTP肽到待治疗的肿瘤或其它组织中。此种治疗可以是单次注射、一段时间多次注射或几小时、几天或几个月内一系列注射,待治疗肿瘤或其它组织的消退或破坏可通过活组织检查、摄像或其它监测组织生长的方法来监控。可通过插入孔中如鼻、口、耳、阴道、直肠或尿道中的装置注射到待治疗的肿瘤或其它组织中或穿过切口以到达体内的肿瘤或组织,此种注射可与摄像或光学系统如超声波或纤维光镜结合进行,以确定注射部位是不合适。这种实施方案的另一个例子是采用可使相关蛋白、相关肽或NTP肽恒定输入到该种组织的装置。
又一种给予本发明相关蛋白、相关肽或NTP肽的方法是,与手术或类似的用于物理切除、消融或者杀死或破坏需要去除或破坏的肿瘤或其它组织或细胞成分的方法相结合,其中将本发明的相关蛋白、相关肽或NTP肽给予待去除的肿瘤或其它组织的周围接近区域,以破坏或阻止肿瘤细胞的生长,或此方法不会除去或破坏其它的细胞成分。
另一种给予本发明相关蛋白、相关肽或NTP肽的方法是将装置植入到待治疗的肿瘤或其它组织中。这种实施方案的一个例子是将含相关蛋白、相关肽或NTP肽的薄片植入到待治疗的肿瘤或其它组织中。薄片随时可释放治疗剂量的相关蛋白、相关肽或NTP肽到该组织中。另外,该组合物可局部应用,通过植入吸附了相关蛋白、相关肽或NTP肽的膜、海绵或其它合适物质到受影响的区域。使用植入装置时,此装置可植入到任何合适的组织或器官中,相关蛋白、相关肽或NTP肽的输送可直接通过该装置,经推注或经连续给药或经导管连续输注。
另外一种给药方法是将一个或多个拷贝的相关蛋白-、相关肽-或NTP肽-编码基因导入靶细胞,如果必要,诱导此基因复制开始胞内产生所述相关蛋白、相关肽或NTP肽。一种可用于基因治疗的方式是采用相关蛋白-、相关肽-或NTP肽-编码基因(编码相关蛋白、相关肽或NTP肽(或其片断、变体、同源物或衍生物)的基因组DNA、cDNA和/或合成的DNA),可特此基因操作性连接于一组成型或可诱导启动子以形成“基因治疗DNA构建物”。只要该启动子在构建物插入的细胞或组织类型中具有活性,它可与内源性相关蛋白-、相关肽-或NTP肽-编码基因同源或异源。如果需要,该基因治疗DNA构建物的其它成分可任选地包括设计用于位点特异性整合的DNA分子(如用于同源重组的内源性侧翼序列),组织特异性启动子、增强子或沉默子,能提供选择性优于亲代细胞的DNA分子、用作鉴定转化细胞标记的DNA分子、阴性选择系统、细胞特异结合剂(例如用于细胞靶向)、细胞特异性内化因子、提高载体表达的转录因子以及能使载体生产的因子。
体内或活体外输送基因到细胞或组织中的方法,包括(但不限于)直接注射裸露DNA、弹道方法、脂质体介导的转运、受体介导的转运(配体-DNA复合体)、电穿孔和磷酸钙沉淀,参见美国专利号4,970,154、WO 96/40958、美国专利号5,679,559、美国专利号5,676,954和美国专利号5,593,875,其公开的内容全部纳入本文供参考。
相关蛋白-、相关肽-或NTP肽-编码基因可通过植入患者的某些细胞中来输送,患者的这种细胞已用本文所述方法在活体外进行了遗传工程改造能表达和分泌所述相关蛋白、相关肽或NTP肽或其片段、变体、同源物或衍生物。这种细胞可以是动物或人细胞,可获自病人自身组织或另外的人或非人来源。任选地此种细胞可以是无限增殖的细胞或可以是干细胞。然而为减少免疫应答的机会,优选包裹这种细胞以防止向周围组织渗透。包裹物质一般是生物相容的半透性聚合性封闭物或膜,能使蛋白产物释放但可阻止病人免疫系统细胞或周围组织的其它有害因素的破坏。用于膜包裹细胞的方法是该领域技术人员所熟悉的,可制备包裹的细胞并植入到病人中而不需要过多的实验。参见例如美国专利号4,892,538;5,001,472和5,106,627,它们公布的内容全部纳入本文供参考。包裹活细胞的系统描述见PCTWO 91/10425。制备多种其它持续或受控制递送方式的技术是本领域技术人员已知的,如脂质体载体、生物可侵蚀的颗粒或珠,这些技术描述见例如美国专利号5,653,975,其公开的内容全部纳入本文供参考。可装包裹或不包裹的细胞植入到病人的适当机体组织或器官中。
                         *  *  *  *
提供以下实施例以阐明本发明。然而应理解本发明不限于这些实施例中所述的具体条件和细节。在本说明书中,任何和所有公众可得到的文献纳入供参考,包括美国专利。
特别地,本发明特意包括了待审批美国专利申请序列号10/092,934:“用神经丝状蛋白治疗肿瘤和相关疾病的方法”中列出的实施例以供参考,此文显示完整的AD7c-NTP蛋白是在体外胶质瘤和成神经细胞瘤细胞培养物中以及体内正常啮齿动物肌肉组织、皮下结缔组织和真皮中,以及多种不同人和非人来源的肿瘤(包括乳腺癌、皮肤癌和乳头状瘤、结肠癌、脑胶质瘤和啮齿动物模型中的其它肿瘤)中造成细胞死亡的一种有效制剂。本发明还特意包括了待审批美国专利申请序列号10/153,334的实施例以供参考,该文显示NTP肽是在体内正常啮齿动物肌肉组织、皮下结缔组织、真皮和其它组织中造成细胞死亡的有效制剂。
实施例1
此实施例的目的是测定NTP肽#6对注射部位组织的作用。
用乙醚将雄性Sprague-Dawley大鼠(体重范围300克)麻醉,并在外科手术暴露前列腺后通过前列腺内灌输给予NTP肽#6。注射剂包括300μl NTP肽#6、1mg/mLPBS pH 7.4(1.0mg/kg)(n=8),对照仅注射PBS(n=6),并有未注射对照(n=2)。72小时后无痛处死动物。解剖前列腺,将其在10%的缓冲福尔马林中固定24小时,石蜡包埋,切片并用H&E染色。将每个动物的完整前列腺包埋并切片。所有染色切片进行组织学检测并进行测量。每个前列腺至少检测4张组织切片,测量每张组织切片相互垂直(90°)的两个截面的直径(每个前列腺总共测量8次或以上)。用每个前列腺这些测量值的平均直径,根据公式
V = 4 3 ( D 2 ) 3 估算体积。
结果:与对照(仅注射PBS的对照和未注射的对照没有可以觉察的变化)相比,注射了NTP肽#6的大鼠前列腺体积减小估计平均为45%。经过处理的大鼠前列腺显示腺上皮广泛丧失、扁平和萎缩。溶于PBS(pH7.4)的NTP肽#6通常以1.0mg/kg灌输到大鼠前列腺,在72小时时,与未处理或PBS处理的对照相比,估计前列腺体积减小40%以上。
实施例2
此实施例的目的是测定NTP肽#7对注射部位组织的作用。
给4只正常大鼠作皮内和皮下注射,各注射四个不同的点,四肢骨骼肌注射时,各注射两个不同的点,通过不锈钢26号针头从塑料注射器输注0.1-1mg/ml浓度的100-400ml盐水配的NTP肽#7。
观察动物24小时且在24小时后无痛处死动物。切取各渗透灶,固定在10%福尔马林中,石蜡包埋,染色并用标准组织病理学方法检测。
对照仅接受盐水注射。
结果:注射NTP肽#7后注射部位产生急性组织坏死。坏死在NTP肽#7注射部位的肌肉组织、皮下结缔组织和真皮中明显。坏死与注射区域相关连,似乎不扩散到离注射部分很远。
远离炎症的轻度区域,对照没有显示出坏死或细胞损失。对照显示出极少或没有肌肉变化。对照注射在注射部位有轻度至极小的急性炎症及针头引起的灶性微出血。
实施例3
此实施例的目的是测定相关肽#1对注射部位组织的作用。
如上述实施例2那样给大鼠作皮肤和皮下注射相关肽#1。
观察动物24小时且在24小时无痛处死动物。切取组织,固定在10%福尔马林中,石蜡包埋,染色并用标准组织病理学方法检测。
对照与实施例2相同。
结果:注射相关肽#1在注射部位产生细胞死亡和组织坏死。与上述实施例2类似,细胞死亡出现在注射了相关肽#1的肌肉组织、皮下结缔组织和真皮中。
远离炎症的轻度区域,对照显示出很轻微的坏死或细胞损失。对照注射在注射部位有轻度至很小的急性炎症偶有针头引起的灶性微出血。
实施例4
此实施例的目的是测定相关肽#2对注射部位组织的作用。
用乙醚将雄性Sprague-Dawley大鼠(体重范围300克)麻醉,并外科手术暴露前列腺后通过前列腺内灌输给予相关肽#2。注射剂包括300μl相关肽#2、1mg/mLPBS pH 7.4(1.0mg/kg)(n=8),对照仅注射PBS(n=6),并有未注射的对照(n=2)。72小时后无痛处死动物。解剖前列腺,将其在10%的缓冲福尔马林中固定24小时,石蜡包埋,切片并用H&E染色。将每个动物的完整前列腺包埋并切片。所有染色切片进行组织学检测并进行测量。每个前列腺至少检测4张组织切片,测量每张组织切片相互垂直(90°)的两个截面的直径(每个前列腺总共测量8次或以上)。用每个前列腺这些测量值的平均直径,根据公式
V = 4 3 ( D 2 ) 3 估算体积。
对照与实施例1相同。
结果:如上述实施例1所示,注射相关肽#2第72小时造成了前列腺中显著的细胞损失和萎缩。对照显示出最轻微的变化或没有变化,包括针头引起的轻度灶性炎症。
实施例5
此实施例的目的是测定相关肽#3对注射部位组织的作用。
如实施例1和4在正常大鼠的前列腺中注射相关肽#3。72小时后无痛处死动物并如上述实施例1和4检测前列腺。
结果:与对照相比,在72小时时发现显著的细胞损失和萎缩,而对照只有最轻微的变化。
                        *  *  *  *
已经参考特别优选的实施方案和例子描述了本发明。然而,此领域的技术人员应理解,可对本发明作出多种改变但不背离本发明的思路和或范围。

Claims (46)

1.一种选自SEQ ID NO:10-124中一种或多种的肽。
2.一种组合物,其特征在于,所述组合物含有一种或多种权利要求1所述的肽及其载体。
3.一种蛋白质,其特征在于,所述蛋白质含有权利要求1所述肽的同源物、衍生物、片段或变体。
4.一种蛋白质,其特征在于,所述蛋白质含有权利要求1所述肽的氨基酸序列的反-D顺序的氨基酸。
5.一种蛋白质,其特征在于,所述蛋白质包括权利要求1所述的肽,所述肽的3′或5′末端侧翼具有1到25个额外的氨基酸修饰。
6.一种蛋白质,其特征在于,所述蛋白质包含权利要求1所述的至少两个肽。
7.一种蛋白质,其特征在于,所述蛋白质包含权利要求1所述的至少两个肽的重复。
8.一种如权利要求1所述的肽的模拟物。
9.一种蛋白质,其特征在于,所述蛋白质包含与抗体、抗体片段或抗体样分子融合的权利要求1所述的肽。
10.一种核酸,其特征在于,所述核酸编码与权利要求1所述肽及其同源物、片段和变体相对应的氨基酸序列。
11.一种组合物,其特征在于,所述组合物包含权利要求10所述的一种或多种核酸以及其药学上可接受的载体。
12.一种肽,其特征在于,所述肽包含至少一段与权利要求1所述肽的部分氨基酸序列相对应的氨基酸序列。
13.一种组合物,其特征在于,所述组合物包含权利要求12所述的一种或多种肽以及其载体。
14.一种肽,其特征在于,所述肽包含权利要求12所述肽的同源物、衍生物、片段或变体。
15.一种肽,其特征在于,所述肽含有权利要求12所述肽的氨基酸序列的反-D顺序的氨基酸。
16.一种肽,其特征在于,所述肽包含权利要求12所述的肽,所述肽的3′或5′末端侧翼具有1到25个额外的氨基酸修饰。
17.一种肽,其特征在于,所述肽包含权利要求12所述的至少两个肽。
18.一种肽,其特征在于,所述肽包含权利要求12所述的至少两个肽的重复。
19.一种如权利要求12所述的肽的模拟物。
20.一种肽,其特征在于,所述肽包括与抗体、抗体片段或抗体样分子融合的权利要求12所述的肽。
21.一种核酸,其特征在于,所述核酸编码与权利要求12所述肽相对应的氨基酸序列。
22.一种组合物,其特征在于,所述组合物包含权利要求21所述的一种或多种核酸以及其药学上可接受的载体。
23.一种治疗患者疾病的方法,所述疾病需要除去或破坏细胞,其特征在于,所述方法包括给予需要治疗的哺乳动物治疗有效量的权利要求1-23中任一项所述的肽、模拟物、核酸或组合物。
24.如权利要求23所述的方法,其特征在于,所述给药方法选自口服、皮下、皮内、鼻内、静脉内、肌肉内、鞘内、鼻内、肿瘤内、局部和透皮。
25.如权利要求23所述的方法,其特征在于,所述治疗剂在选用手术切除、移植、嫁接、化疗、免疫治疗、疫苗接种、热或电消融、冷冻疗法和激光疗法、光疗、基因治疗和放射疗法治疗患者之前、期间或之后给予患者。
26.如权利要求23所述的方法,其特征在于,所述疾病是选自以下组织的良性或恶性肿瘤:即肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、心、脾、唾液腺、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴组织。
27.如权利要求23所述的方法,其特征在于,所述疾病是选自以下组织的增生、肥大或过度生长:即肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、心、脾、唾液腺、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴组织。
28.如权利要求23所述的方法,其特征在于,所述疾病是受病毒、细菌或寄生虫改变的组织,这些组织选自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、心、脾、唾液腺、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴组织。
29.如权利要求23所述的方法,其特征在于,所述疾病是选自以下组织的畸形:即肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮肤、肾、窦、结肠、肠、胃、直肠、食道、心、脾、唾液腺、血液、大脑和其覆盖物、脊髓和其覆盖物、肌肉、结缔组织、肾上腺、副甲状腺、甲状腺、子宫、睾丸、垂体、生殖器、肝脏、胆囊、眼、耳、鼻、喉、扁桃腺、口、淋巴结和淋巴组织。
30.如权利要求26所述的方法,其特征在于,所述组织是淋巴组织。
31.如权利要求23所述的方法,其特征在于,所述疾病是扁桃体肥大。
32.如权利要求23所述的方法,其特征在于,所述疾病是前列腺增生。
33.如权利要求23所述的方法,其特征在于,所述疾病是银屑病。
34.如权利要求23所述的方法,其特征在于,所述疾病是湿疹。
35.如权利要求23所述的方法,其特征在于,所述疾病是皮肤病。
36.如权利要求23所述的方法,其特征在于,所述疾病是对组织的整容修饰。
37.如权利要求26所述的方法,其特征在于,所述组织是皮肤、眼、耳、鼻、喉、口、肌肉、结缔组织、毛发和乳房。
38.如权利要求23所述的方法,其特征在于,所述疾病是血管病。
39.如权利要求23所述的方法,其特征在于,所述疾病是痔。
40.如权利要求23所述的方法,其特征在于,所述疾病是静脉曲张。
41.如权利要求38所述的方法,其特征在于,所述血管病是动脉粥样硬化或动脉硬化。
42.如权利要求23所述的方法,其特征在于,所述疾病选自炎性疾病、自身免疫疾病、代谢疾病、遗传疾病、创伤性疾病或身理损伤、营养缺乏性疾病、传染病、淀粉样变疾病、纤维变性病、贮积病、先天性畸形、酶缺乏性疾病、中毒、致醉、环境病、辐射病、内分泌疾病、变性疾病和机械性损伤疾病。
43.如权利要求23所述的方法,其特征在于,所述肽衍生自胰丝状蛋白的氨基酸序列。
44.如权利要求23所述的方法,其特征在于,所述肽偶联于、连接于或结合于选自抗体、抗体片段和抗体样结合分子的分子,其中所述分子与肿瘤或其它靶结合的亲和力高于与其它细胞结合的亲和力。
45.如权利要求23所述的方法,其特征在于,所述肽是一新克隆的重组分子的一部分,该重组分子由所述肽和选自抗体、抗体片段和抗体样结合分子的分子组成,其中所述分子与肿瘤或其它靶结合的亲和力高于与其它细胞结合的亲和力。
46.一种肽,其特征在于,所述肽含有至少一种选自以下的肽:
(i)具有SEQ ID NO:15(Ile-Asp-Gln-Gln-Val-Leu-Ser-Arg-Ile-Lys-Leu-Glu-Ile-Lys-Arg-Cys-Leu)所代表的氨基酸序列的肽;或
(ii)具有SEQ ID NO:18(Gln-Gln-Ser-Ile-Ala-Val-Lys-Phe-Leu-Ala-Val-Phe-Gly-Val-Ser-Ile)所代表的氨基酸序列的肽。
CNB028183320A 2001-07-19 2002-07-19 有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽 Expired - Lifetime CN100432103C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US30615001P 2001-07-19 2001-07-19
US60/306,150 2001-07-19
US60/306,161 2001-07-19
US60/331,477 2001-11-16

Publications (2)

Publication Number Publication Date
CN1714101A true CN1714101A (zh) 2005-12-28
CN100432103C CN100432103C (zh) 2008-11-12

Family

ID=34589902

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028183320A Expired - Lifetime CN100432103C (zh) 2001-07-19 2002-07-19 有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽

Country Status (1)

Country Link
CN (1) CN100432103C (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103966309A (zh) * 2013-02-04 2014-08-06 中国科学院上海生命科学研究院 外周血细胞TRPC6mRNA水平用于早期预测/诊断老年性痴呆
CN102088992B (zh) * 2008-04-24 2016-02-24 赛里姆耐克斯医药公司 肽基二酰基甘油酯
CN108135974A (zh) * 2015-06-12 2018-06-08 尼莫克斯股份有限公司 用于治疗需要去除或破坏不需要的细胞增殖的病症的联合组合物
CN112625113A (zh) * 2020-12-16 2021-04-09 熊猫乳品集团股份有限公司 一种生物活性肽agydveknnsriklglk及其制备方法和应用
CN112812150A (zh) * 2021-01-29 2021-05-18 深圳海创生物科技有限公司 一种活性环肽、活性环肽组合物及其在制备具有抗氧化或抗炎作用的产品中的应用
CN114099636A (zh) * 2015-01-27 2022-03-01 尼莫克斯制药公司 使用来源于神经丝蛋白的肽治疗需要破坏或移除细胞的病症的方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088992B (zh) * 2008-04-24 2016-02-24 赛里姆耐克斯医药公司 肽基二酰基甘油酯
US9662370B2 (en) 2008-04-24 2017-05-30 Therimunex Pharmaceuticals, Inc. Peptidyl diacylglycerides
CN103966309A (zh) * 2013-02-04 2014-08-06 中国科学院上海生命科学研究院 外周血细胞TRPC6mRNA水平用于早期预测/诊断老年性痴呆
WO2014117680A2 (zh) * 2013-02-04 2014-08-07 中国科学院上海生命科学研究院 外周血细胞TRPC6mRNA水平用于早期预测/诊断老年性痴呆
WO2014117680A3 (zh) * 2013-02-04 2014-09-25 中国科学院上海生命科学研究院 外周血细胞TRPC6mRNA水平用于早期预测/诊断老年性痴呆
US9790551B2 (en) 2013-02-04 2017-10-17 Aging Wise Biotechnology, Inc. Use of TRPC6 mRNA levels in peripheral blood cells for early detection/diagnosis of senile dementia
CN114099636A (zh) * 2015-01-27 2022-03-01 尼莫克斯制药公司 使用来源于神经丝蛋白的肽治疗需要破坏或移除细胞的病症的方法
CN108135974A (zh) * 2015-06-12 2018-06-08 尼莫克斯股份有限公司 用于治疗需要去除或破坏不需要的细胞增殖的病症的联合组合物
CN112625113A (zh) * 2020-12-16 2021-04-09 熊猫乳品集团股份有限公司 一种生物活性肽agydveknnsriklglk及其制备方法和应用
CN112812150A (zh) * 2021-01-29 2021-05-18 深圳海创生物科技有限公司 一种活性环肽、活性环肽组合物及其在制备具有抗氧化或抗炎作用的产品中的应用

Also Published As

Publication number Publication date
CN100432103C (zh) 2008-11-12

Similar Documents

Publication Publication Date Title
CN1649895A (zh) 有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽
CN1589279A (zh) 有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽
CN1259340C (zh) 作为免疫原治疗过敏症的肽组合物
CN1582301A (zh) 有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽
CN1309734C (zh) 与免疫应答有关的新颖多肽
CN1217956C (zh) 可溶性单链t细胞受体蛋白
CN1675362A (zh) Hla-a24限制性癌抗原肽
CN1293190C (zh) 介导细胞吸附和信号传递的细胞表面分子
CN1310942C (zh) 校正基因
CN1336935A (zh) 用于wt1特异性免疫治疗的组合物和方法
CN1526020A (zh) 重组融合蛋白的二聚体、三聚体、四聚体或五聚体的二聚物或寡聚物
CN1615440A (zh) 含有血管生成素-样蛋白质3angptl3的组合物及其使用方法
CN1151120A (zh) 用于抑制血管生成的方法和组合物
CN1836048A (zh) 可转导的dna结合蛋白
CN1283228A (zh) 多肽、其生产方法及应用
CN1529613A (zh) 使用神经丝蛋白治疗肿瘤和需要除去或破坏细胞的其它状况的方法
CN1150030C (zh) 重组人甲胎蛋白及其用途
CN1201003C (zh) 脂肪细胞特异性蛋白质同系物
CN101035806A (zh) 新的糊精家族多肽-6(afp-6)类似物和制备和使用它们的方法
CN101039953A (zh) 治疗和诊断剂
CN1493597A (zh) 分离树突状细胞膜蛋白基因
CN1116305C (zh) 肽衍生物
CN1527723A (zh) 用cd2-结合剂治疗或预防皮肤病症的方法
CN1297566C (zh) 编码新rg1多肽的dna
CN1264980C (zh) 新型肿瘤抗原蛋白sart-3及其肿瘤抗原肽

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20081112