CN116925205A - 激活Hippo信号通路的多肽及其用途 - Google Patents

激活Hippo信号通路的多肽及其用途 Download PDF

Info

Publication number
CN116925205A
CN116925205A CN202210360976.4A CN202210360976A CN116925205A CN 116925205 A CN116925205 A CN 116925205A CN 202210360976 A CN202210360976 A CN 202210360976A CN 116925205 A CN116925205 A CN 116925205A
Authority
CN
China
Prior art keywords
leu
ser
glu
arg
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210360976.4A
Other languages
English (en)
Inventor
余发星
祁思娴
钟振兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202210360976.4A priority Critical patent/CN116925205A/zh
Priority to PCT/CN2023/086440 priority patent/WO2023193739A1/zh
Publication of CN116925205A publication Critical patent/CN116925205A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/107General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Toxicology (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及生物医药领域。具体而言,本发明提供一种多肽,其包含WWC蛋白N端部分或其变体,所述多肽能够激活Hippo信号通路。本发明还提供所述多肽在制备用于治疗和/或预防Hippo通路失调相关疾病的药物中的用途。

Description

激活Hippo信号通路的多肽及其用途
技术领域
本发明涉及生物医药领域。具体而言,本发明提供一种多肽,其包含WWC蛋白N端部分或其变体,并能够激活Hippo信号通路。本发明还提供所述多肽在制备用于治疗和/或预防Hippo通路失调相关疾病的药物中的用途。
背景技术
Hippo通路最早发现于果蝇,是在调控多细胞动物器官大小方面发挥重要作用的信号通路。Hippo 通路与动物细胞的增殖、分化、凋亡和干细胞自我更新的调控紧密相关。Hippo通路在进化上非常保守性,它的组成主要为上游的激酶级联反应(在哺乳动物中由MST1/2(果蝇Hippo的同源蛋白)和 LATS1/2组成)和一些辅助蛋白(通常被称为支架(scaffold)蛋白或衔接(adaptor)蛋白,包括SAV、MOB1 (MOB1A和MOB1B)、NF2、AMOT、WWC等)以及下游的效应蛋白YAP和TAZ(二者为同源蛋白,同为转录共激活因子,可与TEAD等转录因子共同作用并调控靶基因的表达)。当Hippo通路被激活时,在辅助蛋白的参与下,MST1/2可以磷酸化并激活LATS1/2,LATS1/2进一步将YAP/TAZ磷酸化,磷酸化的YAP/TAZ处于失活状态,滞留在细胞质中,无法与转录因子(主要是TEAD)结合,从而抑制靶基因的表达;而当Hippo通路失活时,MST1/2和LATS1/2因去磷酸化而失活,YAP/TAZ在去磷酸化后被激活,从而迁移到细胞核中,与转录因子(主要是TEAD)相互作用并启动下游靶基因的表达。
正常的生理条件下,Hippo通路严格控制YAP/TAZ的活性,只在必需的时候(如胚胎发生和组织修复再生)才会激活YAP/TAZ;一旦Hippo通路失调(失活),YAP/TAZ会被异常地活化,导致本来被 Hippo信号抑制的基因表达,从而导致疾病。例如,大量研究发现在神经纤维瘤、恶性间皮瘤、肾癌 (例如乳头状肾细胞癌(PRCC))、结直肠癌、卵巢癌、乳腺癌、宫颈鳞癌和胃癌等不同类型癌症中都存在Hippo通路的异常失调(参见例如Zheng,Y.andD.Pan,Dev Cell,2019.50(3):p.264-282)。此外,Hippo 通路会在一定程度上受到代谢信号和代谢物的调控,反过来Hippo通路也能通过影响代谢相关的基因表达从而影响细胞和机体的新陈代谢。因此,Hippo通路失调也参与和代谢相关的疾病,包括Ⅱ型糖尿病、脂肪肝和心血管疾病等(参见例如Ibar,C.and K.D.Irvine,Dev Cell,2020.54(2):p.256-267;以及Ardestani,A.,B.Lupse,and K.Maedler,Trends Endocrinol Metab,2018.29(7):p.492-509)。
Hippo信号通路的失调与癌症等疾病有着密切联系,这提示着Hippo通路可以作为靶点进行疾病的治疗。目前靶向Hippo通路相关蛋白的尝试主要有以下几种:(1)靶向YAP/TAZ及其下游的转录复合物。Verteporfin(维替泊芬),一种FDA批准用于治疗年龄相关性黄斑变性(AMD)的小分子抑制剂,能有效地直接阻断YAP/TAZ同TEAD之间的相互作用,大大降低Hippo通路下游靶基因CYR61、CTGF、 AXL和BIRC-5的表达(参见Liu-Chittenden,Y.,etal.,Genes Dev,2012.26(12):p.1300-5)。但与此同时 Verteporfin也会导致某些参与主要细胞进程的蛋白的低聚反应,由此可能引起副作用(参见Brodowska, K.,et al.,ExpEye Res,2014.124:p.67-73;以及Gibault,F.,et al.,Curr Med Chem,2016.23(11):p.1171- 84)。另有一些化合物是通过抑制TEAD的棕榈酰化进而破坏YAP/TAZ与TEAD之间的相互作用(参见 Chan,P.,et al.,Nat Chem Biol,2016.12(4):p.282-9;Pobbati,A.V.,etal.,Structure,2015.23(11):p.2076- 86;Bum-Erdene,K.,et al.,Cell Chem Biol,2019.26(3):p.378-389e13;以及WO2017053706)。Super- TDU则是根据VGLL4蛋白设计的多肽,通过与YAP/TAZ竞争性结合TEAD,从而削弱YAP/TAZ与 TEAD的相互作用并抑制Hippo通路靶基因的表达(参见Jiao,S.,et al.,Cancer Cell,2014.25(2):p.166- 80)。(2)靶向Hippo通路上游的调控元件。SHAP(STRN3-derived Hippo-activating peptide,STRN3衍生的Hippo激活肽)是根据STRN3与PP2Aa相互作用的结构设计的多肽,能有效阻断STRN3-PP2Aa相互作用,从而激活MST1/2进而促进整个Hippo信号通路的活化(参见Tang,Y.,etal.,Cancer Cell,2020. 38(1):p.115-128e9)。除此之外,还有MST1/2的抑制剂XMU-MP-1(Fan,F.,et al.,Sci Transl Med,2016. 8(352):p.352ra108)和LATS的抑制剂6-6稠合双环杂芳基化合物(参见WO2018198077A2),都能通过抑制Hippo通路上游的信号促进YAP/TAZ靶基因的表达,从而促进组织再生修复。总的来说,虽然近年来尝试靶向Hippo通路相关蛋白的研究很多,但目前尚没有进入临床试验的成功方案。
发明内容
在一方面,本发明提供一种多肽,其包含WWC蛋白N端部分或其变体,并且所述多肽相对于全长WWC蛋白是截短的,其中
所述WWC蛋白N端部分包含以下氨基酸序列中的任一个:
i)SEQ ID NO:1的氨基酸6-180,
ⅱ)SEQ ID NO:3的氨基酸10-184,或
ⅱi)SEQ ID NO:5的氨基酸60-234;
所述变体与所述WWC蛋白N端部分具有至少50%、至少60%、至少70%、至少80%、至少 85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性;
并且所述WWC蛋白N端部分或其变体具有激活Hippo信号通路的活性。
在一些实施方案中,所述WWC蛋白N端部分包含以下氨基酸序列中的任一个:
ⅰ)SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
ⅱ)SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;或
ⅲ)SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、 1-244或1-254;
所述变体与以上氨基酸序列中的任一个具有至少50%、至少60%、至少70%、至少80%、至少 85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性。
在一些实施方案中,所述变体包含以下氨基酸序列中的任一个:
(1)SEQ ID NO:7、8、9、10、11或12的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
(2)SEQ ID NO:13的氨基酸49-223、50-250或1-250;
(3)SEQ ID NO:14、15、16、17或18的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;
(4)SEQ ID NO:19的氨基酸61-235、52-251或1-235;或者
(5)SEQ ID NO:20的氨基酸44-218、35-234或1-218。
在一些实施方案中,所述变体包含相对于以下氨基酸序列中的任一个具有一个或多个突变的氨基酸序列:
ⅰ)SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
ⅱ)SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;或
ⅲ)SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、 1-244或1-254;
其中所述突变包括氨基酸的取代和/或缺失。
在一些实施方案中,所述多肽进一步与选自以下的一个或多个功能性多肽连接:His6标签、FLAG 标签、HA标签、myc标签、SBP标签、StrepⅡ标签、SNAP标签、Halo标签、GST标签、n-肉豆蔻酰基转移酶(NMT)识别基序和荧光蛋白;优选地,所述功能性多肽为融合在所述多肽的N末端的 NMT识别基序;更优选地,所述多肽包含肉豆蔻酰化修饰。
在一些实施方案中,所述多肽:
(1)结合SAV1和LATS1/2;
(2)激活LATS1/2和/或促进LATS1/2的磷酸化;
(3)抑制YAP活性和/或促进YAP磷酸化;
(4)促进和/或增强YAP的细胞质定位,减少YAP的细胞核定位;
(5)激活、增强、促进Hippo信号转导;和/或
(6)抑制癌细胞的增殖;
优选地,所述癌细胞为其中包含高度活化的YAP或高表达YAP的癌细胞,或者其中包含NF2 基因缺陷的癌细胞。
在又一方面,本发明提供一种多核苷酸,其编码本发明的多肽,并且任选地是密码子优化的。
在一些实施方案中,所述多核苷酸包含以下核苷酸序列中的任一个:
SEQ ID NO:2的核苷酸16-540、16-570、16-600、1-540、1-570或1-600;
SEQ ID NO:4的核苷酸28-552、28-582、28-612、1-552、1-582或1-612;或
SEQ ID NO:6的核苷酸178-702、178-732、178-762、151-702、151-732、151-750、151-762、1- 702、154-762、1-732或1-762。
在一些实施方案中,所述多核苷酸为DNA或RNA。在一优选实施方案中,所述多核苷酸为 mRNA,并且任选地通过用修饰的尿苷取代一个或多个尿苷进行修饰。在一具体实施方案中,所述 mRNA包含SEQ ID NO:2的核苷酸1-600所示核苷酸序列。
本发明还提供一种表达载体,其包含本发明的多核苷酸。
本发明还提供一种宿主细胞,其包含本发明的多核苷酸或表达载体。
本发明还提供一种药物组合物,其包含本发明的多肽、多核苷酸或者表达载体以及药学上可接受的载剂。
在另一方面,本发明提供本发明的多肽、多核苷酸、表达载体或者药物组合物在制备用于治疗和/或预防Hippo通路失调相关疾病的药物中的用途。
本发明还涉及一种治疗和/或预防Hippo信号通路失调相关疾病的方法,其包括向有需要的受试者给药有效量的本发明的多肽、多核苷酸或者药物组合物。
在一些实施方案中,所述疾病为癌症。在一些实施方案中,所述癌症为实体瘤并且具有以下一个或多个特征:(1)YAP蛋白高表达;(2)YAP蛋白高度活化;(3)NF2基因缺陷;和(4)WWC1、WWC2 和/或WWC3蛋白低表达。在一些实施方案中,所述癌症为实体瘤并且以这样的癌细胞为表征,所述癌细胞包含高度活化的YAP或高表达YAP和/或NF2基因缺陷。在一些实施方案中,所述癌症选自肺癌、卵巢癌、膀胱癌、乳腺癌、淋巴瘤、恶性血液病、头颈癌、头颈部鳞状细胞癌、胶质瘤、鼻咽癌、喉癌、宫颈癌、子宫体瘤、骨癌、皮肤癌、前列腺癌、子宫癌、肛区癌、睾丸癌、输卵管癌、子宫内膜癌、阴道癌、霍奇金淋巴瘤、非霍奇金淋巴瘤、食道癌、小肠癌、内分泌系统癌、甲状腺癌、甲状旁腺癌、肾上腺癌、软组织肉瘤、尿道癌、阴茎癌、淋巴浆细胞淋巴瘤、膀胱癌、输尿管癌、肾盂癌、中枢神经系统肿瘤、原发性中枢神经系统淋巴瘤、脊柱肿瘤、脑干神经胶质瘤、垂体腺瘤、卡波西肉瘤、表皮状癌、鳞状细胞癌、间皮瘤、宫颈鳞癌、结直肠癌、骨肉瘤、非小细胞肺癌、肺腺癌、胰腺癌、慢性淋巴细胞白血病、急性淋巴细胞白血病、神经胶质瘤、胃癌、神经鞘瘤、脑膜瘤、三阴性乳腺癌、肾癌、乳头状肾细胞癌、透明细胞肾细胞癌、结直肠癌、黑色素瘤、肝癌、肝细胞癌、肝内胆管癌。
附图说明
图1:WWC蛋白和NF2平行调控Hippo信号通路。
(A)示出当前理解的哺乳动物中Hippo信号网络示意图。
(B)在野生型(WT)或者Hippo通路组分敲除的HEK293A细胞中,在Flag-WWC1存在或不存在的情况下过表达Ha-YAP;然后通过免疫印迹分析LATS1和YAP的磷酸化以及YAP靶基因CYR61 的表达。
(C)在野生型(WT)或者Hippo通路组分敲除的HEK293A细胞中过表达Flag-WWC1,将细胞裂解物用于anti-Flag免疫沉淀,然后通过免疫印迹分析细胞裂解物和免疫沉淀物。
(D-F)在HEK293A细胞中稳定表达Flag-WWC1、Flag-WWC2或Flag-WWC3,然后通过不同测定分析Hippo通路活性。
(D)通过蛋白免疫印迹检测细胞裂解物中LATS1/2、YAP和MOB1的磷酸化、YAP靶基因CYR61 的表达以及其它Hippo通路相关组分的表达。
(E)通过免疫荧光染色确定YAP的亚细胞定位。
(F)通过实时荧光定量PCR(qPCR)分析YAP靶基因CTGF和CYR61的mRNA水平。
(G-I)通过CRISPR/Cas9系统建立了两个WWC1-3三重敲除(WWC1/2/3tKO)单克隆HEK293A 细胞系(#1和#2),并通过蛋白免疫印迹(G)、免疫荧光染色(H)和qPCR(I)来分析Hippo通路活性。
(J)示出由两条Hippo信号通路(分别为经典的和替代的)组成的新Hippo信号网络示意图。
图2:SuperHippo在细胞中能充分且有效地激活Hippo通路。
(A)在HEK293A细胞中共转染Ha-YAP和野生型Flag-WWC1或标示的缺失突变体,通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(B)在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或截短突变体(1-100aa;或者1-200aa),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP磷酸化以及CYR61的表达。
(C)对过表达Flag-SuperHippo的HEK293A细胞进行免疫荧光染色来分析YAP的定位;anti- Flag(红色),anti-YAP(绿色),DAPI示出细胞核(蓝色);刻度尺:10μm。
(D)在HEK293A细胞中过表达Flag-SuperHippo或Flag-WWC1,通过qPCR检测YAP靶基因 CTGF、CYR61和ANKRD1的表达。
(E)在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或者缺失突变体),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(F)在WWC1/2/3tKO HEK293A细胞中共转染Ha-YAP和Flag-SuperHippo(野生型(SuperHippo) 或者缺失突变体),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(G)在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或标示的突变体),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(H)在HEK293A细胞中共转染Ha-YAP和Flag-WWC1的截短突变体(mutant)(1-140aa、1-150 aa、1-160aa、1-170aa或1-180aa),通过蛋白免疫印迹分析细胞裂解物中YAP的磷酸化。
(I)在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或标示的突变体),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(J)在HEK293A细胞中共转染Ha-SAV1、Ha-MST1、Ha-LATS1和Flag-WWC1(野生型(WT)或标示的突变体),将细胞裂解物用于anti-Flag免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物。
(K)在HEK293A细胞中共转染Ha-YAP和带有Flag标签的WWC1、kbr、kbr 1-250aa或者kbr 50-250aa,通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(L)在HEK293A细胞中过表达带有Flag标签的WWC蛋白N端部分WWC11-200、WWC21-204或WWC351-250,通过蛋白免疫印迹分析HEK293A细胞裂解物。
图3:SuperHippo的工作机制和全长WWC1类似。
(A)在HEK293A细胞(WT)中或Hippo通路组分基因缺陷的HEK293A细胞(KO细胞)中过表达 Ha-SuperHippo,将细胞裂解物用于anti-Ha免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物。
(B)在HEK293A细胞中过表达Flag-SuperHippo(野生型(WT);或者突变体:M95A、L96A、 Y99A或L100A),将细胞裂解物用于anti-Flag免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物。
(C)在HEK293A细胞中过表达Flag-SuperHippo(野生型(WT);或者突变体:WW1mut,W34A/P37A;WW2mut,P84A;WW1/2mut,W34A/P37A/P84A),将细胞裂解物用于anti-Flag免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物。
(D)在WWC1/2/3tKO HEK293A细胞中共表达Ha-YAP和Flag-SuperHippo(野生型(WT);或者突变体:WW1mut,W34A/P37A;WW2mut,P84A;WW1/2mut,W34A/P37A/P84A),然后通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(E)SuperHippo的赖氨酸突变体激活Hippo通路。在HEK293A细胞中过表达野生型Flag- SuperHippo(Flag-WT SuperHippo)或者其中赖氨酸突变成精氨酸的SuperHippo突变体(Flag-K0 SuperHippo),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(F)包含肉豆蔻酰化修饰的SuperHippo激活Hippo通路。在HEK293A细胞中过表达野生型Flag- SuperHippo或者N末端带有NMT识别基序的Flag-SuperHippo(Myr-Flag-SuperHippo),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。
(G)SuperHippo在Hippo信号通路中发挥功能的作用机制示意图。
图4:SuperHippo在小鼠中激活Hippo通路。
(A-C)示出野生型(WT)小鼠、SuperHippo小鼠和Yap-/-;Taz-/-小鼠的肝体比(A)、血清中谷草转氨酶(AST)含量(B)和谷丙转氨酶(ALT)含量(C)。平均值±SD(n≥3)。*p<0.05;**p<0.01;***p<0.001; ns:不显著,t检验。
(D)示出1月龄的WT小鼠、SuperHippo小鼠和Yap-/-;Taz-/-小鼠的肝脏整体图(左)以及肝的H&E 染色(中)和免疫组化(IHC)染色(右);比例尺:1cm(肝脏整体图),50μm(H&E和IHC)。
(E-G)示出通过RNA-seq分析的WT小鼠、SuperHippo小鼠和Yap-/-;Taz-/-小鼠的肝脏基因表达谱:PCA分析(E)、层次聚类分析(F)和GSEA分析(G)。
图5:靶向调控ACHN细胞系中的Hippo通路可影响其增殖速度。
(A)通过蛋白免疫印迹检测ACHN细胞中NF2和SAV1蛋白的存在。
(B-C)在ACHN细胞中过表达Flag-NF2、Flag-SAV1或Flag-NF2和Flag-SAV1,通过蛋白免疫印迹检测细胞裂解物中的YAP的磷酸化(B),利用CCK-8试剂盒检测活细胞数目并绘制细胞增殖曲线(C)。
图6:SuperHippo特异性地抑制依赖YAP活性的肿瘤细胞的增殖。
(A-B)分别在黑色素瘤细胞MEL-270、92.1、OCM1或OCM8中稳定表达GFP-SuperHippo,通过蛋白免疫印迹检测细胞裂解物中的LATS1和YAP的磷酸化以及CYR61的表达(A),利用CCK- 8测定检测活细胞数目并绘制细胞增殖曲线(B)。
图7:SuperHippo抑制Nf2基因突变引起的肿瘤发生
(A)在NF2缺失时过表达SuperHippo对Hippo通路影响的示意图(左)。8月龄的WT小鼠、 Nf2-/-小鼠和Nf2-/-;SuperHippo小鼠的表型(右):Nf2-/-小鼠出现的一系列异常,包括肝脏体重比增加和胆管上皮细胞异常增生等表型,这些在Nf2-/-;SuperHippo小鼠中都得到了很好的回复。
(B-D)通过RNA-seq分析的WT小鼠、Nf2-/-小鼠和Nf2-/-;SuperHippo小鼠的肝脏基因表达谱: PCA分析(B)、GSEA分析的气泡图(C)和层次聚类分析(D)。
图8:SuperHippo抑制Hippo通路组分基因突变引起的肿瘤发生。
(A)在NF2和WWC1/2缺失时过表达SuperHippo对Hippo通路影响的示意图。
(B)3周龄的WT小鼠、Nf2-/-;Wwc1+/-;Wwc2+/-小鼠和Nf2-/-;Wwc1+/-;Wwc2+/-;SuperHippo小鼠的肝体比、肝脏整体图、H&E染色和IHC染色。
(C)IHC染色所标志的标志物表明Nf2-/-;Wwc1+/-;Wwc2+/-小鼠中出现的肝纤维化、巨噬细胞浸润、卵原细胞增生、血管增生、细胞增殖加快和YAP/TAZ活化等表型都随着SuperHippo的表达得到很好的控制。
(D)在NF2完全缺失伴随Sav1部分缺失时过表达SuperHippo对Hippo通路影响的示意图。
(E)6周龄的WT小鼠、Nf2-/-;Sav1+/-小鼠和Nf2-/-;Sav1+/-;SuperHippo小鼠的肝体比、肝脏整体图、H&E染色和IHC染色。
(F)IHC染色所标志的标志物表明Nf2-/-;Sav1+/-小鼠中出现的肝纤维化、巨噬细胞浸润、卵原细胞增生、血管增生、细胞增殖加快和YAP/TAZ活化等表型都随着SuperHippo的表达得到很好的控制。
图9:SuperHippo治疗肝内胆管癌(ICC)。向成年SuperHippoF/F小鼠尾静脉高压注射表达转座酶 piggyBac(PB)、NICD和myr-AKT的质粒(NICD/AKT),或者在注射这些质粒的同时注射表达Cre重组酶的质粒以驱使SuperHippo的表达(NICD/AKT SuperHippo),仅注射空载体的SuperHippoF/F小鼠作为对照(Ctrl)。
(A)实验策略示意图。
(B)各组小鼠的生存曲线以及肝体比。
(C)各组小鼠的肝脏整体图、H&E染色以及免疫组化染色。
图10:SuperHippo治疗肝细胞癌(HCC)。向成年SuperHippoF/F小鼠尾静脉高压注射表达myr- AKT、N-RasV12和睡美人转座酶(SB)的质粒(AKT/Ras),或者在注射这些质粒前注射表达Cre重组酶的质粒(Adeno-Cre)以驱使SuperHippo的表达(SuperHippo AKT/Ras),仅注射空载体的SuperHippoF/F小鼠作为对照(Ctrl)。
(A)各组小鼠的生存曲线及肝体比。
(B)各组小鼠的肝脏整体图、H&E染色以及免疫组化染色。
图11:SuperHippo编码mRNA的体内和体外表达。
(A)向小鼠尾静脉注射携带有SuperHippo编码序列的腺相关病毒AAV8载体,3周后收取小鼠肝脏,并用蛋白免疫印迹检测其中SuperHippo(anti-Ha)的表达。
(B-D)用包裹SuperHippo的编码mRNA(未修饰的,mRNA;修饰的,mRNA(5-moUTP)、mRNA (N1-UTP)和mRNA(pseudo-UTP))的纳米脂质颗粒转染HEK293A,并通过免疫荧光染色(B和C)以及蛋白免疫印迹(D)检测SuperHippo mRNA的表达效率(Flag-SuperHippo)及对YAP出核定位的促进。
具体实施方式
定义
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学、免疫学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文所用,表述“包括”、“包含”、“含有”和“具有”是开放式的,表示包括所列举的元素、步骤或组分但不排除其他未列举的元素、步骤或组分。表述“由……组成”不包括未指定的任何元素、步骤或组分。表述“基本上由……组成”是指范围限于指定的元素、步骤或组分,加上不显著影响要求保护的主题的基本和新颖性质的任选存在的元素、步骤或组分。应当理解,表述“基本上由……组成”和“由……组成”涵盖在表述“包括”的含义之内。
术语“任选地”或“可选地”是指其后描述的事件或情况可能发生但不一定发生,该描述包括所述事件或情况发生或不发生的情况。
如本文所用,多个述及的元素之间的连接术语“和/或”应理解为包括单独的和组合的选项。例如,在两个元素由“和/或”连接的情况下,第一个选项是指在第一元素不存在的情况下适用第二元素。第二个选项是指在第二元素不存在的情况下适用第一元素。第三个选项是指第一和第二元素一起适用。这些选项中的任何一个都应理解为落入该含义内,并因此满足本文所用术语“和/或”的要求。不止一个选项的并行适用也应理解为在其含义之内,因此满足术语“和/或”的要求。
除非另有说明,否则任何数值或数值范围,例如浓度或浓度范围,在任何情况下均应理解为由术语“约”修饰。因此,数值通常包括所述值的±10%。例如,1mg/mL的浓度包括0.9mg/mL至1.1 mg/mL。同样的,1%至10%(w/v)的浓度范围包括0.9%(w/v)至11%(w/v)。如本文所用,数值范围的使用明确地包括所有可能的子范围,该范围内的所有单个数值,包括该范围内的整数和分数,除非上下文另外明确指出。
如本文所用,“至少一个(种)”或“一个(种)或多个(种)”可以表示1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19、20个(种)或更多个(种)。
如本文所用,“蛋白”或“多肽”是指通过肽键连接的两个或更多个氨基酸形成的聚合物。通常而言,多肽是指单链氨基酸序列。“蛋白”可以由一条或多条多肽链以共价或非共价方式形成。除非另有说明,否则术语“多肽”和“蛋白质”在本文可互换使用。
如本文所用,“野生型”多肽或蛋白是指天然存在的,未经人为改造的多肽或蛋白。多肽或蛋白的“突变体”可以相对于多肽或蛋白(例如“野生型”的多肽或蛋白)带有突变。如本文所用,术语“突变”是指多肽或蛋白中包含一个或多个氨基酸的取代、缺失(包括氨基和/或羧基末端的氨基酸缺失(截短)和在氨基酸序列中间的氨基酸的缺失(删除))和/或添加(插入)。
通常,多肽的变体可以通过对多肽进行氨基酸的添加、取代和/或缺失(例如使用DNA重组技术) 来获得。优先考虑在多肽的非保守氨基酸位置进行保守取代。多肽的变体还可以通过对多肽进行化学修饰(例如肉豆蔻酰化、聚乙二醇(PEG)化、生物素化、糖基化、磷酸化、酰胺化、硫酸酯化、乙酰化和脂肪酸化)来获得。在本文中,“变体”的定义涵盖“突变体”。
如本文所用,“氨基酸添加”是指将一个或多个氨基酸添加到氨基酸序列。氨基酸添加可以发生在氨基酸序列中的任何位置,包括但不限于氨基酸序列的中间、氨基末端和/或羧基末端。发生在氨基酸序列中间的氨基酸添加又可以称为“插入”。
如本文所用,“氨基酸缺失”是指从氨基酸序列去除一个或多个氨基酸。氨基酸缺失可以发生在氨基酸序列中的任何位置,包括但不限于氨基(N)末端、羧基(C)末端和/或氨基酸序列中间。由于在 N和/或C末端的氨基酸缺失产生的变体也可以称为“片段”。
如本文所用,“氨基酸取代”是指将特定氨基酸位置处的氨基酸替换为另一个氨基酸。取代可以是保守或非保守取代。在本文中,将取代一个位置上的氨基酸基序或一个氨基酸位置(位点)上的氨基酸的事件描述为取代一次。
在本文中,当指氨基酸位置时,第N位氨基酸指从多肽的氨基末端(即N末端)的第1个氨基酸开始数的第N个氨基酸。
本领域技术人员应当理解,通常可以修饰多肽,例如进行一个或多个氨基酸的取代、添加和/或缺失,并且一般不改变其生物活性(参见,例如Watson et al.,MolecularBiology of the Gene,4th Edition, 1987,The Benjamin/Cummings Pub.co.,p.224)。优选的修饰为保守取代。合适的保守取代是本领域技术人员熟知的。在下表中列出一些常见的氨基酸残基保守取代的非限制性实例。
原始残基 示例性的保守取代 优选的取代
Ala(A) Val,Leu,Ile Val
Arg(R) Lys,Gln,Asn Lys
Asn(N) Gln,His,Asp,Lys,Arg Gln
Asp(D) Glu,Asn Glu
Cys(C) Ser,Ala Ser
Gln(Q) Asn,Glu Asn
Glu(E) Asp,Gln Asp
Gly(G) Ala Ala
His(H) Asn,Gln,Lys,Arg Arg
Ile(I) Leu,Val,Met,Ala,Phe Leu
Leu(L) Ile,Val,Met,Ala,Phe Ile
Lys(K) Arg,Gln,Asn Arg
Met(M) Leu,Phe,Ile Leu
Phe(F) Trp,Leu,Val,Ile,Ala,Tyr Tyr
Pro(P) Ala Ala
Ser(S) Thr Thr
Thr(T) Val,Ser Ser
Trp(W) Tyr,Phe Tyr
Tyr(Y) Trp,Phe,Thr,Ser Phe
Val(V) Ile,Leu,Met,Phe,Ala Leu
如本文所用,氨基酸序列的“百分比(%)序列相同性”、“序列相同性”具有本领域公认的定义,其指通过序列比对(例如通过人工检视或可公知的算法)确定的两个多肽序列之间相同的百分比。可以使用本领域技术人员已知的方法确定,例如使用可公开获得的计算机软件如BLAST、BLAST-2、 Clustal Omega、Clustal W和Clustal X。
两个氨基酸序列之间的百分比序列相同性可以使用Meyers E.and Miller W.,(1988)Comput.Appl. Biosci.4,11-17中公开的算法确定,该算法已被并入ALIGN程序(版本2.0),使用PAM120权重残基表,空位长度罚分为12,空位罚分为4。另外,两个氨基酸序列之间的百分比相同性可以通过Needleman S.B.and Wunsch D.C.,(1970)J.Mol.Biol.48,444-453公开的算法确定,其已并入GCG软件包(可从http://www.gcg.com获得)中的GAP程序中,使用Blossum 62矩阵或PAM250矩阵,空隙权重为16、14、12、10、8、6或4,长度权重为1、2、3、4、5或6。
本文公开的序列可以进一步用作“查询序列”来执行针对公共数据库的搜索以获得与参考多肽同源的氨基酸序列。为了获得用于比较目的的空位比对,可使用空位BLAST,如Altschul et al.,(1997) Nucleic Acids Res.25(17):3389-3402中描述的。当使用BLAST和空位BLAST程序时,可以使用各个程序的默认参数,参见www.ncbi.nlm.nih.gov。
如本文所用,术语“多核苷酸”和“核酸”具有相同含义,是指包含至少两个连接的核苷酸或核苷酸衍生物的寡聚体或聚合物。多核苷酸可以是脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以是单链、双链、线性或者环状的。
如本文所用,术语“RNA”表示包含核糖核苷酸残基的分子,并且包括并优选涉及信使RNA (mRNA)。mRNA通常涉及可以利用DNA作为模板产生的转录物。根据本发明的实施方案,mRNA 优选涉及编码多肽的mRNA,并且通常包含5’非翻译区、多肽编码区以及3’非编码区。
本发明的多核苷酸和/或多肽可以是修饰的。术语“修饰”表示与未修饰的多核苷酸或多肽相比,修饰的多核苷酸和/或多肽包含天然存在或非天然存在的,特别是非天然存在的任何改变。
表述“分离的”指多肽、蛋白或多核苷酸可以例如是经过人工改造的,和/或与其天然存在的环境中的其他物质分离的。例如,可以通过DNA重组技术或化学合成制备分离的多核苷酸(例如DNA或 mRNA)和多肽,其基本上不含其他细胞物质或培养基,或者在化学合成时基本上不含化学前体或其他化学成分。本发明的多肽或多核苷酸可以是分离的。
如本文所用,“表达”指从多核苷酸进行转录和/或翻译的过程。表达可以导致mRNA和/或多肽的产生。可以利用本领域已知的任何方法检测多肽或mRNA的表达。对于多肽的检测,这类方法可以包括但不限于使用多肽的特异性抗体通过ELISA测定定量细胞裂解物中的多肽以及使用多肽的特异性抗体进行蛋白免疫印迹。对于mRNA的表达,可以使用例如定量PCR(qPCR)、半定量PCR或 RNA-Seq。
如本文所用,“宿主细胞”是用于接受、保持、复制或扩增载体的细胞。宿主细胞还可以用来表达多核苷酸或载体所编码的多肽。宿主细胞可以是真核细胞或原核细胞。原核细胞例如大肠杆菌(E.coli) 或枯草芽孢杆菌(Bacillus subtilis)、真菌细胞(例如酵母细胞或曲霉属)、昆虫细胞(如果蝇S2细胞或 Sf9)以及动物细胞(例如CHO细胞、COS细胞、HeLa细胞或HEK293细胞)。
如本文所用,“载体”是用于将外源核酸导入宿主细胞的媒介,当载体转化入适当的宿主细胞时,外源核酸得以扩增或表达。载体包括那些通常通过限制酶切消化和连接可以将编码多肽或其片段的核酸引入其中的载体。载体还包括那些包含编码多肽的核酸的载体。载体通常保持游离,但是可以设计为使基因或其部分整合入基因组的染色体。还考虑人工染色体的载体,例如酵母人工染色体和哺乳动物人工染色体。如本文所用,载体的定义涵盖质粒、线性化质粒、病毒载体、粘粒、噬菌体载体、噬菌粒、人工染色体(例如,酵母人工染色体和哺乳动物人工染色体)等。如本文所用,载体可以在宿主细胞中表达或复制。
如本文所用,“表达载体”包括能够表达多肽的载体,其包含编码目标多肽的多核苷酸序列。编码目标多肽的多核苷酸序列与能够影响其表达的调控序列可操作地连接。这类调控序列可以包括启动子和终止子序列,并且任选地可以包括一个或多个复制起点、一个或多个选择标记、增强子、多腺苷酸化信号等。表达载体可以是质粒、噬菌体载体、病毒载体或其他载体。适当的表达载体是本领域技术人员公知的,并且包括在真核细胞和/或原核细胞中可复制的表达载体以及保持游离的表达载体或者整合入宿主细胞基因组的表达载体。
如本文所用,术语“癌症”是指或描述个体中的生理状况,通常其特征在于细胞(称作癌细胞)生长不受控制。如本文所用,术语“肿瘤”是指形成肿胀或病变的细胞(称作肿瘤细胞)的异常生长。肿瘤通常缺少正常组织的结构组织和功能协调,并且通常形成可能是良性、前恶性或恶性的明显的组织块。在本文中,术语“肿瘤细胞”和“癌细胞”可以互换使用,用于表示异常细胞,其通过快速、不受控制的细胞增殖生长,并且在引发新生长的刺激停止之后继续生长。“癌症”的定义涵盖“肿瘤”。除非另有说明,否则术语“癌症”和“肿瘤”在本文中可互换使用。
如本文所用,术语“治疗”指对疾病/症状的改善,例如使疾病/症状减轻或消失,或者减缓疾病/症状的进展和/或恶化。如本文所用,术语“预防”是指防止疾病/症状发生。在一些实施方案中,治疗和 /或预防癌症包括抑制癌细胞的增殖。在一些实施方案中,治疗和/或预防癌症包括抑制肿瘤发生。在一些实施方案中,治疗和/或预防癌症包括减轻癌症症状或防止癌症症状发生。
如本文所用,“有效量”或“有效剂量”指施用于受试者之后,至少足以产生期望的治疗和/或预防效果的物质、化合物、材料或包含化合物的组合物的量。因此,其为防止、延迟、改善、阻滞或部分阻滞或者治愈疾病或病症的症状所必需的量。有效量可以在一次或多次施用中给药。对于癌症的治疗,相对于未接受治疗的对象,治疗有效量的本发明的多肽、多核苷酸或药物组合物优选地将癌细胞增殖或肿瘤生长抑制至少约10%,优选至少约20%,更优选至少约30%,更优选至少约 40%,更优选至少约50%,更优选至少约60%,更优选至少约70%,更优选至少约80%。可以利用本领域常规的肿瘤动物模型评估抑制肿瘤生长的效力,例如自发性肿瘤、诱发性肿瘤和移植性肿瘤动物模型。或者,也可以利用本领域公知的检测方法检查抑制细胞增殖的能力。在一些实施方案中,治疗有效量的本发明的多肽、多核苷酸或药物组合物能够减小肿瘤大小,或以其他方式缓解受试者的症状(如预防和/或治疗转移或复发)。本领域技术人员理解,有效量受到多种因素的影响,例如受试者的年龄、身体状况、症状的严重程度、特定组合物或给药途径等。
如本文中所使用的,术语“药学上可接受的载剂”是指在药理学和/或生理学上与受试者和活性成分相容的载剂,其是本领域公知的(参见例如Remington'sPharmaceutical Sciences.Edited by Gennaro AR,19th ed.Pennsylvania:MackPublishing Company,1995),并且包括但不限于:pH调节剂、表面活性剂、佐剂、离子强度增强剂、维持渗透压的试剂、延迟吸收的试剂、防腐剂和稀释剂。pH调节剂包括但不限于酒石酸、抗坏血酸、苹果酸、琥珀酸、磷酸、醋酸、组氨酸和柠檬酸。表面活性剂包括但不限于阳离子、阴离子和非离子型表面活性剂,特别是非离子表面活性剂,例如泊洛沙姆、聚山梨酯80、聚山梨酯20、辛基糖苷钠、聚乙二醇和聚丙二醇。离子强度增强剂包括但不限于氯化钠。防腐剂包括但不限于各种抗细菌试剂和抗真菌试剂,例如对羟苯甲酸酯、三氯叔丁醇、苯酚、山梨酸等。维持渗透压的试剂包括但不限于糖、氯化钠及其类似物。稀释剂包括但不限于水、水性缓冲液(如缓冲盐水)、醇和多元醇(如甘油)等。延迟吸收的试剂包括但不限于单硬脂酸盐和明胶。防腐剂包括但不限于各种抗细菌试剂和抗真菌试剂,例如硫柳汞、2-苯氧乙醇、对羟苯甲酸酯、三氯叔丁醇、苯酚、山梨酸等。药学上可接受的载剂还可以是稳定剂,其能够稳定药物中的活性成分的期望活性。稳定剂的非限制性实例包括谷氨酸钠、明胶、SPGA、糖类(如山梨醇、甘露醇、淀粉、蔗糖、乳糖、葡聚糖、或葡萄糖)、氨基酸(如谷氨酸、甘氨酸)、蛋白(如血清白蛋白)或其降解产物(如乳白蛋白水解物)等。
如本文所用,哺乳动物的实例包括但不限于人、非人灵长类动物、大鼠、小鼠、牛、马、猪、羊、羊驼、狗、猫等。在本文中,术语“受试者”是指哺乳动物,例如人。在一些实施方案中,受试者是人。在一些实施方案中,受试者是癌症患者。
多肽
在一方面,本发明提供一种具有激活Hippo信号通路的活性的多肽。
本发明的多肽包含WWC蛋白N端部分或其变体,并且所述多肽相对于全长WWC蛋白是截短的,其中
所述WWC蛋白N端部分包含以下氨基酸序列中的任一个:
ⅰ)SEQ ID NO:1的氨基酸6-180;
ⅱ)SEQ ID NO:3的氨基酸10-184;或
ⅲ)SEQ ID NO:5的氨基酸60-234;
所述变体与所述WWC蛋白N端部分具有至少50%、至少60%、至少70%、至少80%、至少 85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性;
并且所述WWC蛋白N端部分或其变体具有激活Hippo信号通路的活性。
如本文所用,“WWC(WW and C2 domain-containing)蛋白”是由WWC基因编码的、在进化上非常保守的一类蛋白,因含有WW(WW1和WW2)结构域和C2结构域而命名。从低等动物(例如果蝇) 到高等动物(例如哺乳动物,例如人),不同物种中的WWC直系同源物(例如人WWC1、黑猩猩WWC1、小鼠WWC1和果蝇Kibra等是直系同源物)以及同一基因组中的WWC旁系同源物(例如人WWC1、人WWC2和人WWC3是旁系同源物)之间具有高度的同源性,并且具有相似的结构和功能。
WWC蛋白是Hippo信号通路上游重要的调控蛋白。如本文所用,“Hippo信号通路”和“Hippo通路”可以互换使用,是指一条进化上高度保守的信号转导通路,主要通过调控Hippo通路靶基因的表达参与细胞增殖、分化和凋亡以及干细胞自我更新等细胞活动来实现对动物器官大小和组织稳态的控制。哺乳动物中的Hippo通路的示意图示于图1:由MST1/2(Mammalian STE20-like protein kinase 1和Mammalian STE20-like protein kinase2;Hippo激酶)或MAP4K1-7(mitogen-activated protein kinase kinase kinase kinase1-7;Hippo样激酶)和LATS1/2(large tumor suppressor kinase 1和large tumorsuppressor kinase 2)组成的上游的激酶级联反应,在辅助蛋白(通常被称为支架(scaffold)蛋白或衔接 (adaptor)蛋白,包括SAV(Salvador homolog 1)、MOB1(MOB1A和MOB1B)、NF2(neurofibromin 2,又称为Merlin)、AMOT和WWC等)的协助下,磷酸化并失活下游效应蛋白YAP(Yes相关蛋白)和 TAZ(具有PDZ结合基序的转录共激活因子);YAP和TAZ为同源的转录共激活因子,失活的 YAP/TAZ无法转位至细胞核与转录因子(例如TEAD)共同作用,从而抑制靶基因的表达。
已经在多种物种(例如人、非人灵长类动物(例如猕猴、恒河猴、食蟹猴、狒狒和大猩猩)、小鼠、大鼠、兔、羊、马、牛、豚鼠、斑马鱼和果蝇等)中发现WWC蛋白及其编码基因。在哺乳动物(小鼠除外)中,特别是人中,WWC蛋白可以包括WWC1蛋白、WWC2蛋白和WWC3蛋白。WWC蛋白的非限制性实例可以包括:人WWC1(示例性氨基酸序列示于GenBank登录号:NP_001155133.1; SEQ ID NO:1)、人WWC2(示例性氨基酸序列示于GenBank登录号:NP_079225.5;SEQ ID NO:3)、人WWC3(示例性氨基酸序列示于Uniprot Entry:T2C6S4-1(又参见GenBank登录号:AGV22437.1; SEQ ID NO:5)、黑猩猩WWC1(示例性氨基酸序列示于GenBank登录号:XP_009448370.3)、黑猩猩WWC2(示例性氨基酸序列示于GenBank登录号:XP_003310624.3)、黑猩猩WWC3(示例性氨基酸序列示于GenBank登录号:XP_016798817.2)、恒河猴WWC1(示例性氨基酸序列示于GenBank登录号:XP_014996857.1)、恒河猴WWC2(示例性氨基酸序列示于GenBank登录号:XP_014995064.2)、恒河猴WWC3(示例性氨基酸序列示于GenBank登录号:XP_014982410.2)、小鼠WWC1(示例性氨基酸序列示于GenBank登录号:NP_740749.1;SEQ ID NO:9)、小鼠WWC2(示例性氨基酸序列示于GenBank登录号:NP_598552.2;SEQ ID NO:16)以及果蝇Kibra蛋白(示例性氨基酸序列示于 NP_001034055.1;SEQ ID NO:13)。WWC蛋白的其他实例可以包括表1.1、1.2和1.3中列举的GenBank 登录号所代表的那些。
如本文所用,参考多肽的“同源物”或“同源蛋白”是指与参考多肽具有较高序列相同性(例如至少 60%、至少70%、至少80%、至少90%、至少95%、至少99%或至少100%相同性)以及基本相同的生物活性的多肽。可以通过对参考多肽进行工程化获得其同源物,例如通过进行一个或多个氨基酸的取代、添加和/或缺失,例如缺失参考多肽中的一个或多个氨基酸(例如缺失或截短突变体),或者进行丙氨酸扫描或定点突变。如本文所用,两条多肽之间的“同源性”可以通过比较氨基酸序列相同性进行判断。同源性可以在两条多肽的全长或片段之间进行比较。如本文所用,“对应于”或“相对应”是指两个或多个氨基酸序列之间是同源的(例如WWC1蛋白直系同源物之间,或者截短的WWC1蛋白与全长WWC1蛋白之间),或者根据最优比对(例如使用本领域公知的序列比对算法,例如采用空位罚分)结果,两个或更多个同源氨基酸序列中的氨基酸处于相对应的位置。多肽的变体可以与参考多肽在对应于参考多肽的氨基酸位置N处包含不同的氨基酸(取代)或者缺失位置N处的氨基酸,而其他位置的氨基酸可以与参考多肽的对应位置上的氨基酸相同或不同。
以下示出使用Cluastal Omega将hWWC11-200(SEQ ID NO:1的氨基酸1-200)、hWWC21-204(SEQ ID NO:3的氨基酸1-204)和hWWC31-254(SEQ ID NO:5的氨基酸1-254)进行序列比对的结果。基于该序列比对结果,本领域技术人员应当理解,SEQ ID NO:1的氨基酸6-200、SEQ ID NO:3的氨基酸10-204和SEQ ID NO:5的氨基酸60-254中包含的氨基酸相对应。
在本文中,除非另外指明,WWC1(或hWWC1或KIBRA)、WWC2(或hWWC2)和WWC3(或hWWC3)分别指野生型人WWC1蛋白(SEQ ID NO:1)、人WWC2蛋白(SEQ ID NO:3)和人WWC3蛋白(SEQ ID NO:5)。并且,这些蛋白的突变体的氨基酸序列基于其对应野生型蛋白的氨基酸序列定义,例如“WWC1的氨基酸1-200”、“WWC1的1-200aa”、“WWC11-200”与“WWC1的第1-200位氨基酸”同义,是指WWC1蛋白的N端部分(N端片段),其由SEQ ID NO:1的第1-200位氨基酸组成; WWC1Δ1-100或WWC1Δ1-100是指WWC1蛋白的缺失突变体,其中WWC1蛋白的第1-100位氨基酸缺失,即由SEQ ID NO:1的第101-1119位氨基酸组成;WWC1M95A是指WWC1蛋白的突变体,其中SEQ ID NO:1的第95位氨基酸由甲硫氨酸(M)突变成丙氨酸(A)。在本文中,除非另外指明,WWC1、WWC2和WWC3分别指人WWC1基因、人WWC2基因和人WWC3基因;Wwc1和Wwc2 分别指小鼠Wwc1基因和小鼠Wwc2基因。
根据本发明的一些实施方案,在WWC1蛋白直系同源物中,能够激活Hippo通路的WWC蛋白 N端部分可以至少包含对应于SEQ ID NO:1的氨基酸6-180所示的氨基酸序列,特别是包含对应于 SEQ ID NO:1的氨基酸1-180或1-200所示的氨基酸序列。根据本发明的一些实施方案,在WWC2 蛋白直系同源物中,能够激活Hippo通路的WWC蛋白N端部分可以至少包含对应于SEQ ID NO:3 的氨基酸10-184所示的氨基酸序列,特别是包含对应于SEQ IDNO:3的氨基酸1-184或1-204所示的氨基酸序列。根据本发明的一些实施方案,在WWC3蛋白直系同源物中,能够激活Hippo通路的 WWC蛋白N端部分可以至少包含对应于SEQ ID NO:5的氨基酸60-234所示的氨基酸序列,特别是包含对应于SEQ ID NO:5的氨基酸1-234或1-254所示的氨基酸序列。
本发明的多肽相对于全长WWC蛋白是C端截短的,并且包含本文所公开的WWC蛋白N端部分或其变体。如本文所用,本发明的多肽“相对于全长WWC蛋白是截短的”意思是,本发明的多肽不包含WWC蛋白的全长序列,特别是缺失WWC蛋白的C端的氨基酸序列。根据本发明,本发明的多肽可以相对于其对应的全长WWC蛋白在C端截短例如至少500、至少600、至少700、至少 800或至少900个氨基酸。所述全长WWC蛋白包括但不限于表1.1、1.2和1.3所示GenBank登录号代表的那些蛋白。
WWC蛋白N端部分
本文公开的WWC蛋白N端部分可以至少包含位于WWC蛋白N端的WW结构域(WW1和WW2结构域;大致对应于SEQ ID NO:1的氨基酸6-86)以及随后的包含大约100个氨基酸的卷曲螺旋(coiled coil)区,并且能够激活Hippo信号通路。
为了清楚,本文中将WWC蛋白N端部分定义为具有激活Hippo信号通路的活性的人WWC1 (序列如SEQ ID NO:1所示)、人WWC2(序列如SEQ ID NO:3)和人WWC3(序列如SEQ IDNO:3 所示)的截短形式。在一些实施方案中,WWC蛋白N端部分由SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5中包含的氨基酸的连续序列组成。在一些实施方案中,WWC蛋白N端部分可以起始于SEQ ID NO:1的第1-6位氨基酸中的任一个(例如第1、2、3、4、5或6位氨基酸),并且终止于SEQ ID NO:1的第180-1119位氨基酸中的任一个(例如第180、181、182、183、184、185、186、187、188、 189、190、191、192、193、194、195、196、197、198、199、200、210、215、220、230、240、250、 260、270、280、290、300、350、400、450、500、550、600、650、700、750、800、950、1000、1050、1100或1119位氨基酸)。在另一些实施方案中,WWC蛋白N端部分可以起始于SEQID NO:3的第 1-10位氨基酸中的任一个(例如第1、2、3、4、5、6、7、8、9或10位氨基酸),并且终止于SEQ ID NO:3的第184-1192位氨基酸中的任一个(例如第184、185、186、187、188、189、190、191、192、 193、194、195、196、197、198、199、200、201、202、203、204、205、210、215、220、230、240、 250、260、270、280、290、300、350、400、450、500、550、600、650、700、750、800、950、1000、 1050、1100、1150或1192位氨基酸)。在又一些实施方案中,WWC蛋白N端部分可以起始于SEQ ID NO:5的第1-60位氨基酸中任一个(例如第1、2、3、4、5、6、7、8、9、10、15、20、25、30、 35、40、45、50、51、52、55或60位氨基酸),并且终止于SEQ ID NO:5的第234-1217位氨基酸中的任一个(例如第234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、 249、250、251、252、253、254、255、260、270、280、290、300、350、400、450、500、550、600、 650、700、750、800、950、1000、1050、1100、1150、1200或1217位氨基酸)。
在一些实施方案中,所述WWC蛋白N端部分包含:
i)SEQ ID NO:1的氨基酸6-180所示的氨基酸序列;
ii)SEQ ID NO:3的氨基酸10-184所示的氨基酸序列;或
iii)SEQ ID NO:5的氨基酸60-234所示的氨基酸序列。
在一实施方案中,WWC蛋白N端部分包含以下氨基酸序列中的任一个:
ⅰ)SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
ⅱ)SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;或
ⅲ)SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、 1-244或1-254。
WWC蛋白N端部分的变体
WWC蛋白N端部分的变体具有激活Hippo信号通路的活性。
WWC蛋白N端部分的变体可以是人WWC1、WWC2或WWC3蛋白N端部分的同源物,包括但不限于人、非人灵长类动物(例如猕猴、恒河猴、食蟹猴、狒狒和大猩猩)、小鼠、大鼠、兔、羊、马、牛、豚鼠、斑马鱼和果蝇等物种中WWC蛋白同源物的截短形式。WWC蛋白N端部分的变体还可以通过本领域已知的各种方法(例如本发明实施例中描述的那些)获得。
在一些实施方案中,WWC蛋白N端部分的变体包含与以下氨基酸序列中的任一个具有至少 50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的氨基酸序列:
ⅰ)SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
ⅱ)SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;或
ⅲ)SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、 1-244或1-254。
根据本发明,WWC蛋白N端部分直系同源物之间具有较高的同源性,例如序列相同性可以为至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%。
作为示例,使用EMBOSS Needle成对比对SEQ ID NO:1的1-180aa与其直系同源物之间的序列相同性示于表1.1。
表1.1
作为另一示例,使用EMBOSS Needle成对比对SEQ ID NO:3的1-184aa与其直系同源物之间的序列相同性示于表1.2。
表1.2
作为另一示例,使用EMBOSS Needle成对比对SEQ ID NO:5的60-234aa与其直系同源物之间的序列相同性示于表1.3。
表1.3
在一些实施方案中,WWC蛋白N端部分的变体包含表1.1、1.2和1.3所示GenBank登录号代表的氨基酸序列中的任一个所包含的氨基酸的连续序列,所述连续序列相对于其对应的全长氨基酸序列是截短的。
在一些实施方案中,WWC蛋白N端部分的变体包含以下氨基酸序列中的任一个:
(1)SEQ ID NO:7、8、9、10、11或12的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
(2)SEQ ID NO:13的氨基酸49-223、50-250或1-250;
(3)SEQ ID NO:14、15、16、17或18的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;
(4)SEQ ID NO:19的氨基酸61-235、52-251或1-235;或者
(5)SEQ ID NO:20的氨基酸44-218、35-234或1-218。
在一些实施方案中,WWC蛋白N端部分的变体包含相对于以下氨基酸序列中的任一个具有一个或多个突变的氨基酸序列:
ⅰ)SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
ⅱ)SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;或
ⅲ)SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、 1-244或1-254。
在一些实施方案中,所述突变包括氨基酸的取代和/或缺失。氨基酸取代可以为保守取代或非保守取代。在一实施方案中,氨基酸取代包括1-50个(1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个)氨基酸的取代。在一实施方案中,氨基酸缺失包括1-50个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43、44、45、46、47、48、49或50个)氨基酸的缺失。
在一些实施方案中,所述突变包括相对于SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、 1-190或1-200所示的氨基酸序列包含氨基酸取代。在一实施方案中,所述取代包括对应于SEQ ID NO:1中以下位置处的一个或多个氨基酸的取代:87、88、89、90、91、92、93、94、97和98。在另一实施方案中,所述取代包括对应于SEQ ID NO:1的氨基酸101-150位置处的一个或多个氨基酸的取代。在一实施方案中,所述取代包括1-10个(例如1、2、3、4、5、6、7、8、9、10个)氨基酸的取代。
在一实施方案中,所述取代包括用丙氨酸取代对应于SEQ ID NO:1中以下位置处的一个或多个氨基酸:87、88、89、90、91、92、93、94、97和98。在一实施方案中,所述取代包括1-10个(例如1、2、3、4、5、6、7、8、9、10个)氨基酸的取代。
在一实施方案中,WWC蛋白N端部分的变体相对于SEQ ID NO:1的氨基酸6-180、6-190、6- 200、1-180、1-190或1-200包含赖氨酸至精氨酸的取代。在一实施方案中,WWC蛋白N端部分的变体包含SEQ ID NO:21的氨基酸序列,其相对于SEQ ID NO:1的氨基酸1-200包含赖氨酸至精氨酸的取代。
在一些实施方案中,所述突变包括相对于SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、 1-190或1-200所示的氨基酸序列包含氨基酸缺失。在一实施方案中,所述缺失包括对应于SEQ ID NO:1的氨基酸101-150位置处的一个或多个氨基酸的缺失。在一实施方案中,所述缺失包括1-20 个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个)氨基酸的缺失。在一实施方案中,所述缺失包括对应于SEQ ID NO:1的氨基酸101-110、111-120、121-130、 131-140或141-150位置处的1-10个氨基酸的缺失。
在一些实施方案中,所述突变包括相对于SEQ ID NO:3的氨基酸10-184、10-194、10-204、1- 184、1-194或1-204所示的氨基酸序列包含氨基酸取代。在一实施方案中,所述取代包括对应于SEQ ID NO:3中以下位置处的一个或多个氨基酸的取代:91、92、93、94、95、96、97、98、101、102。在一实施方案中,所述取代包括对应于SEQ ID NO:3的氨基酸105-154位置处的一个或多个氨基酸的取代。在一实施方案中,所述取代包括1-10个(例如1、2、3、4、5、6、7、8、9、10个)氨基酸的取代。
在一实施方案中,所述取代包括用丙氨酸取代对应于SEQ ID NO:3中以下位置处的一个或多个氨基酸:91、92、93、94、95、96、97、98、101和102。在一实施方案中,所述取代包括1-10个(例如1、2、3、4、5、6、7、8、9、10个)氨基酸的取代。
在一些实施方案中,所述突变包括相对于SEQ ID NO:3的氨基酸10-184、10-194、10-204、1- 184、1-194或1-204所示的氨基酸序列包含氨基酸缺失。在一实施方案中,所述缺失包括对应于SEQ ID NO:3的氨基酸105-154位置处的一个或多个氨基酸的缺失。在一实施方案中,所述缺失包括1- 20个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个)氨基酸的缺失。在一实施方案中,所述缺失包括对应于SEQ ID NO:3的氨基酸105-114、115-124、125- 134、135-144或145-154位置处的1-10个氨基酸的缺失。
在一些实施方案中,所述突变包括相对于SEQ ID NO:5的氨基酸60-234、60-244、60-254、51- 234、51-244、51-250、51-254、1-234、1-244或1-254所示的氨基酸序列包含氨基酸取代。在一实施方案中,所述取代包括对应于SEQ ID NO:5中以下位置处的一个或多个氨基酸的取代:141、142、 143、144、145、146、147、148、151和152。在一实施方案中,所述取代包括对应于SEQ ID NO:5 的氨基酸155-204位置处的一个或多个氨基酸的取代。在一实施方案中,所述取代包括1-10个(例如 1、2、3、4、5、6、7、8、9、10个)氨基酸的取代。
在一实施方案中,所述取代包括用丙氨酸取代对应于SEQ ID NO:5中以下位置处的一个或多个氨基酸:141、142、143、144、145、146、147、148、151和152。在一实施方案中,所述氨基酸取代包括1-10个(例如1、2、3、4、5、6、7、8、9、10个)氨基酸的取代。
在一些实施方案中,所述突变包括相对于SEQ ID NO:5的氨基酸60-234、60-244、60-254、51- 234、51-244、51-250、51-254、1-234、1-244或1-254所示的氨基酸序列包含氨基酸缺失。在一实施方案中,所述缺失包括对应于SEQ ID NO:5的氨基酸155-204位置处的一个或多个氨基酸的缺失。在一实施方案中,所述缺失包括1-20个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19或20个)氨基酸的缺失。在一实施方案中,所述缺失包括对应于SEQ ID NO:5 的氨基酸155-164、165-174、175-184、185-194或195-204位置处的1-10个氨基酸的缺失。
包含修饰的多肽
本发明的多肽可以是通过修饰本文公开的WWC蛋白N端部分或其变体的任何氨基酸序列获得的衍生物,其保留激活Hippo信号通路的活性。可以根据本领域公知的方法修饰多肽。修饰可以是化学修饰,例如肉豆蔻酰化、聚乙二醇(PEG)化、生物素化、糖基化、磷酸化、酰胺化、硫酸酯化、乙酰化和脂肪酸化。修饰可以包括但不限于C末端修饰、N末端修饰、中间残基修饰和环化修饰。修饰可以发生在体内,例如在适合蛋白表达的系统(例如表达WWC蛋白N端部分的靶细胞)中发生的翻译后修饰或共翻译修饰。在一些实施方案中,本发明的多肽包含肉豆蔻酰化修饰。
在一些实施方案中,本发明的多肽进一步与一个或多个功能性多肽连接。功能性多肽可以例如,促进本发明的多肽的表达、稳定性、检测和/或分离。功能性多肽的实例包括但不限于各种促溶标签、亲和/捕获标签(例如聚组氨酸标签(His6)、FLAG标签、HA标签、myc标签、SBP(链霉亲和素结合肽)标签、StrepⅡ标签、SNAP标签、Halo标签、谷胱甘肽S-转移酶(GST)标签)、包含蛋白酶(例如 Thrombin和PreScission)切割位点的短肽、蛋白酶的识别基序(例如n-肉豆蔻酰基转移酶(NMT)识别的基序(例如MGXXXS/T(K),其中X可以为任何氨基酸),其使得与之融合的多肽能够通过NMT进行肉豆蔻酰化修饰)以及报告蛋白(例如荧光蛋白,如GFP、RFP和mCherry等)。在优选的实施方案中,功能性多肽融合在本发明的多肽的N末端和/或C末端(例如直接与WWC蛋白N端部分或其变体的N末端和/或C末端融合)。在一实施方案中,功能性多肽选自:His6标签、FLAG标签、HA标签、myc标签、SBP标签、StrepⅡ标签、SNAP标签、Halo标签、GST标签、NMT识别基序和荧光蛋白。在一实施方案中,功能性多肽为融合在本发明的多肽的N末端的NMT识别基序。在一具体实施方案中,NMT识别基序为MGXXXS/T(K),其中X为任何氨基酸。在进一步的实施方案中, NMT识别基序为MGSNKSK(SEQ ID NO:22)。在一实施方案中,本发明的多肽与NMT识别基序融合,使得本发明的多肽包含豆蔻酰化修饰。
本文公开的WWC蛋白N端部分、其变体或包含所述WWC蛋白N端部分或其变体的多肽具有激活Hippo信号通路的活性。如本文所用,“激活Hippo信号通路”包括激活、增强、促进和/或活化Hippo信号转导。可以通过本领域已知的方法检测Hippo信号通路的激活,包括但不限于检测LATS1/2 的活化(例如LATS1的T1079的磷酸化增强,例如使用特异性识别磷酸化的T1079的抗体,通过体外激酶反应实验或在细胞裂解物中检测LATS1的T1079的磷酸化)、YAP的抑制(例如YAP的S127 的磷酸化增强,例如使用特异性识别磷酸化的S127的抗体,通过体外激酶反应实验或在细胞裂解物中检测YAP的S127的磷酸化;或者例如YAP的细胞质定位增强,例如通过特异性识别YAP(或其融合标签)的抗体进行免疫荧光染色)和Hippo通路靶基因表达的抑制(例如靶基因(例如CTGF、CYR61、 ANKRD1、AXL和BIRC-5)表达的mRNA或蛋白水平降低,例如利用定量PCR或RNA-seq检测mRNA 水平,或利用蛋白免疫印迹检测蛋白水平)。在一实施方案中,本发明的多肽通过激活Hippo信号通路抑制癌细胞增殖。
在一实施方案中,本发明的多肽:
(1)结合SAV1和LATS1/2;
(2)激活LATS1/2和/或促进LATS1/2的磷酸化;
(3)抑制YAP活性和/或促进YAP磷酸化;
(4)促进和/或增强YAP的细胞质定位,减少YAP的细胞核定位;
(5)激活、增强、促进和/或活化Hippo信号转导;和/或
(6)抑制癌细胞的增殖。
在一实施方案中,所述癌细胞为其中包含高度活化的YAP或高表达YAP的癌细胞。在一实施方案中,所述癌细胞为其中包含NF2基因缺陷的癌细胞。
鉴于本公开,本领域技术人员可以获得更多本发明的多肽的等同物,例如从公共可用的数据库 (例如Uniprot、GenBank或Ensembl)鉴定本发明的多肽的同源物或者对本发明的多肽进行修饰。这些等同物也在本发明的保护范围之内。
多核苷酸、载体和宿主细胞
在另一方面,本发明提供了一种多核苷酸,其编码本发明的多肽。
可以利用本领域已知的方法获得本发明的多核苷酸。例如,本发明的多核苷酸可以从公共可用的数据库(例如GenBank或Ensembl)获得或者化学合成。编码人WWC1的示例核苷酸序列示于SEQ ID NO:2。编码人WWC2的示例性核苷酸序列示于SEQ ID NO:4。编码人WWC3的示例性核苷酸序列示于SEQ ID NO:6。本发明的多核苷酸可以例如包含SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6所示核苷酸序列的至少部分。本领域技术人员应当理解,由于密码子的简并性,可以改变多核苷酸的序列而不改变其编码的多肽的序列。此外,本发明的多核苷酸可以针对用于表达的宿主细胞进行密码子优化。
在一些实施方案中,所述多核苷酸包含以下核苷酸序列中的任一个:SEQ ID NO:2的核苷酸16- 540、16-570、16-600、1-540、1-570或1-600;SEQ ID NO:4的核苷酸28-552、28-582、28-612、1- 552、1-582或1-612;或SEQ ID NO:6的核苷酸178-702、178-732、178-762、151-702、151-732、 151-750、151-762、1-702、1-732或1-762。在一优选实施方案中,所述多核苷酸包含SEQ ID NO:2 的核苷酸1-600所示核苷酸序列。
可使用本领域众所周知的技术制备本发明的多核苷酸。例如,可以利用例如化学合成和DNA重组技术(例如聚合酶链式反应(PCR)技术)(参见Sambrook,J.,E.F.Fritsch,and T.Maniatis.(1989). Molecular cloning:a laboratory manual,2nd ed.ColdSpring Harbor Laboratory,Cold Spring Harbor,N.Y.) 将本发明的多核苷酸制备成重组DNA的形式。对于mRNA,可以例如通过化学合成或者利用DNA 模板通过体外转录产生。
多核苷酸可以是DNA、RNA(例如mRNA)、cDNA。多核苷酸可以是线性的或环状的。在一些实施方案中,本发明的多核苷酸为DNA。在一些实施方案中,本发明的多核苷酸为mRNA。在一实施方案中,将本发明的多核苷酸制备成重组DNA或重组mRNA,其包含编码本发明多肽的DNA序列或mRNA序列,并且任选地包含表达本发明的多肽所需的元件和/或修饰。例如,可以在mRNA 编码序列的5’和3’末端添加合适的5’和3’非翻译区、在3’末端添加poly(A)尾、进行5’加帽以及用修饰的核苷代替一个或多个核糖核苷。例如,可以用一个或多个修饰的尿苷代替一个或多个尿苷 (UTP)。修饰的尿苷包括但不限于假尿苷、N1-甲基-假尿苷、5-甲氧基-尿苷和5-甲基尿苷。
在一些实施方案中,本发明的多核苷酸为mRNA。在一实施方案中,所述mRNA包含以下核苷酸序列中的任一个:SEQ ID NO:2的核苷酸16-540、16-570、16-600、1-540、1-570或1-600;SEQ ID NO:4的核苷酸28-552、28-582、28-612、1-552、1-582或1-612;或SEQ ID NO:6的核苷酸178- 702、178-732、178-762、151-702、151-732、151-750、151-762、1-702、1-732或1-762。在一优选实施方案中,所述mRNA包含SEQ ID NO:2的核苷酸1-600所示核苷酸序列。
在一些实施方案中,所述mRNA通过用修饰的尿苷取代一个或多个尿苷进行修饰。在一实施方案中,所述修饰的尿苷选自假尿苷、N1-甲基-假尿苷、5-甲氧基-尿苷和5-甲基尿苷。
在又一方面,本发明还提供了包含本发明的多核苷酸的载体。在一些实施方案中,所述载体为表达载体。表达载体可以进一步包含额外的多核苷酸序列,例如启动子、表达调控序列和抗生素抗性基因。
启动子可以是组成型或诱导型的。启动子的非限制性实例包括:EF-1α启动子、巨细胞病毒(CMV) 启动子、泛素C(UBC)启动子和磷酸甘油酸激酶(PGK)启动子。在一些实施方案中,启动子是组织特异性的,用于在特定组织/器官中驱动多核苷酸的表达。在一具体实施方案中,启动子是白蛋白(Alb) 启动子。
表达载体还可以包含编码额外的多肽的多核苷酸序列。额外的多肽可以是例如前文所述功能性多肽。在一些实施方案中,本发明的多核苷酸进一步包含编码功能性多肽的多核苷酸序列,其可操作地连接至编码WWC蛋白N端部分或其变体的多苷酸序列。在一具体实施方案中,所述多功能性多肽为NMT识别基序。
表达载体可以是非病毒载体,例如质粒DNA、细菌人工染色体、酵母人工染色体、噬菌体等。在一些实施方案中,表达载体为质粒DNA,例如用于在细菌、酵母或哺乳动物细胞中表达的质粒 DNA。在另一些实施方案中,表达载体为病毒载体。病毒载体的非限制性实例可以包括:慢病毒载体、腺病毒载体、痘病毒载体和腺相关病毒载体。
本发明还提供了一种宿主细胞,其包含至少一种如上所述的多核苷酸或载体。可以采用本领域已知的各种方法将本发明的多核苷酸或表达载体导入合适的宿主细胞中。这类方法包括但不限于脂质体转染、脂质纳米颗粒转染、病毒转导、电穿孔转染、稳定转染和磷酸钙转染等。
在一些实施方案中,宿主细胞用于表达本发明的多肽。宿主细胞的实例包括但不限于原核细胞 (例如细菌,例如大肠杆菌)和真核细胞(例如酵母、昆虫细胞和哺乳动物细胞)。适合于多肽表达的哺乳动物宿主细胞包括但不限于骨髓瘤细胞、HeLa细胞、HEK细胞(例如HEK 293细胞)、中国仓鼠卵巢(CHO)细胞和其他哺乳动物细胞。例如,可以将编码本发明的多肽的多核苷酸克隆到表达载体中并导入大肠杆菌BL21(DE3)中,然后从其中分离所述多肽。从宿主细胞或其培养基中分离和纯化多肽的技术是本领域技术人员所熟知的。
药物组合物
本发明还提供一种药物组合物,其包含本发明的多肽或者多核苷酸以及药学上可接受的载剂。更优选地,所述药物组合物用于治疗和/或预防如本文所述的癌症。
如本文所用,“药学上可接受的载剂”包括生理学相容的任何和所有的溶剂、分散介质、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等。优选地,所述载剂适合于静脉内、肌内、皮下、肠胃外、脊柱或表皮施用(如通过注射或输注)。可以将本发明的多肽或者本发明的多核苷酸,包裹于适合于动物或人体递送的材料(例如脂质体或纳米胶囊)中。
药学上可接受的载剂可以包括但不限于:稀释剂、粘合剂和胶粘剂、润滑剂、崩解剂、防腐剂、媒介物、分散剂、助流剂、甜味剂、包衣、赋形剂、防腐剂、抗氧化剂(如抗坏血酸、盐酸半胱氨酸、硫酸氢钠、焦亚硫酸钠、亚硫酸钠、抗坏血酸棕榈酸酯、丁羟茴醚(BHA)、丁羟甲苯(BHT)、卵磷脂、没食子酸丙酯、α-生育酚、柠檬酸、乙二胺四乙酸(EDTA)、山梨糖醇、酒石酸、磷酸等)、增溶剂、胶凝剂、软化剂、溶剂(例如,水、酒精、乙酸和糖浆)、缓冲剂(例如,磷酸盐缓冲剂、组氨酸缓冲剂和乙酸盐缓冲剂)、表面活性剂(例如非离子表面活性剂,例如聚山梨酯80、聚山梨酯 20、泊洛沙姆或聚乙二醇)、抗细菌剂、抗真菌剂、等渗剂(例如海藻糖、蔗糖、甘露醇、山梨醇、乳糖、葡萄糖)、吸收延迟剂、螯合剂和乳化剂。在一些实施方案中,所述载剂选自缓冲剂(例如柠檬酸盐缓冲液、乙酸盐缓冲液、磷酸盐缓冲液、组氨酸缓冲液、组氨酸盐缓冲液)、等渗剂(例如海藻糖、蔗糖、甘露醇、山梨醇、乳糖、葡萄糖)、非离子表面活性剂(例如聚山梨酯80、聚山梨酯20、泊洛沙姆)或其组合。
本文提供的药物组合物可以为多种剂型,包括但不限于固体、半固体和液体(例如溶液、乳液或悬浮液)。还可以将本发明的药物组合物配制为微乳液、脂质纳米颗粒(LNP)、脂质体复合物(Lipoplex) 或胶束(参见例如CN107108730A和WO2016113557A1)。在一实施方案中,本发明的多核苷酸(例如 mRNA)配制成脂质纳米颗粒。脂质纳米颗粒可以包含可电离的阳离子磷脂、固醇、非阳离子脂质、聚乙二醇修饰的磷脂,其中包裹本发明的多核苷酸(例如mRNA)。在一实施方案中,本发明的多核苷酸(例如mRNA)配制成脂质体复合物。
在一些实施方案中,在合适的媒介物中将本发明的多核苷酸递送至需要治疗的靶器官,然后从所述靶器官中表达本发明的多肽。在一些实施方案中,媒介物为如上所述的表达载体,例如病毒载体。在一些实施方案中,优先将表达载体靶向特定的靶器官(例如有需要的受试者的患病器官)。在这类实施方案中,优选以高效率靶向靶器官的表达载体。在一些实施方案中,靶器官为肝脏。在一实施方案中,表达载体为腺病毒相关病毒AAV7或AAV8载体。在另一些实施方案中,媒介物为脂质纳米颗粒或脂质体。
优选地,可以将药物组合物配制为适于需要的给药途径的剂型,特别是局部、皮肤、肠胃外(例如静脉内、肌内、胸骨内、皮下,例如通过注射或输注)和鼻内给药。
可通过本领域已知的任何方法,例如通过全身或局部施用,将本文提供的药物组合物给药于受试者。给药途径包括但不限于肠胃外(例如,静脉内、腹膜内、皮内、肌肉内、皮下或腔内)、局部(例如瘤内)、硬膜外或粘膜(例如鼻内、口服、阴道、直肠、舌下或局部)。如本文所用,“肠胃外给药”是指除肠和局部给药以外的给药模式,通常是注射,包括但不限于静脉内、肌内、动脉内、鞘内、囊内、眶内、心内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下、脊柱内、硬膜外和胸骨内注射和输注。本发明的多肽、多核苷酸或者药物组合物也可以通过非肠胃外途径给药,如局部、表皮或粘膜途径给药,例如,鼻内、经口、阴道、直肠、舌下或局部。
本领域技术人员应当理解,给药途径和/或方式根据期望的结果而不同。此外,本领域技术人员会理解,确切的给药剂量将取决于各种因素,例如药物组合物的代谢动力学性质、治疗的持续时间、特定化合物的排泄速率、治疗目的、给药途径和受试者的状况,例如患者的年龄、健康状况、体重、性别、饮食、病史,以及医学领域公知的其他因素。给药方法可以为例如注射或输注。
药物组合物可以使用在药物领域中公知的方法制备。例如,可以通过将本发明的结合分子与水组合从而形成溶液来制备预期通过注射施用的组合物。可以加入表面活性剂以促进均匀溶液或悬浮液的形成。药物组合物可以采取一个或多个剂量单位的形式。可以将药物组合物制备于安瓿瓶、一次性注射器或由玻璃、塑料或其他材料制成的多剂量小药瓶中。
治疗
本发明的多肽、多核苷酸和药物组合物可以用于治疗和/或预防Hippo信号通路失调相关疾病。因此,在另一方面,本发明还涉及本发明的多肽、多核苷酸或者药物组合物在制备用于治疗和/或预防Hippo信号通路失调相关疾病的药物中的用途。
本发明还涉及一种治疗和/或预防Hippo信号通路失调相关疾病的方法,其包括向有需要的受试者给药有效量的本发明的多肽、多核苷酸或者药物组合物。
在本文中,“Hippo通路失调”或“Hippo信号通路失调”是指Hippo信号转导的减弱、丧失或抑制,使得Hippo信号调控的下游靶基因的表达不受控制。Hippo信号通路失调通常可以表现为Hippo信号通路的上游调节基因(包括NF2、LATS1、LATS2、SAV1和WWC1-3等)的突变,或者在没有上游基因突变的情况下表现为YAP/TAZ异常高表达、异常活化或者细胞核内定位异常增加。
在一些实施方案中,Hippo信号通路失调包括YAP蛋白高度活化(Hyperactivation)和/或高表达。具体地,YAP蛋白高度活化可以包括YAP蛋白的磷酸化减弱、消失或受到抑制。不希望受任何特定理论束缚,已知YAP蛋白中可以被磷酸化的氨基酸可以包括S61、S109、S127、S164、S381和S397;其中,S127和S381的磷酸化对于抑制YAP的活性起主要作用。不希望受任何理论束缚,据认为YAP 蛋白中S127的磷酸化介导YAP与14-3-3蛋白的相互作用,从而将YAP滞留在细胞质中,导致YAP 不能作为转录共激活因子发挥作用。YAP高表达可以包括与其中Hippo信号通路行使正常功能的细胞、器官或组织相比,Hippo信号通路失调的细胞、器官或组织中YAP的表达(包括YAP蛋白和 mRNA)水平增加。YAP活化程度和表达水平可以通过本领域已知的方法来检测。
在一实施方案中,Hippo信号通路失调包括NF2基因缺陷。如本文所用,“基因缺陷”包括但不限于基因拷贝数减少以及基因突变(包括例如错义、插入、缺失和/或无义突变,其导致产生突变蛋白;与未突变蛋白相比,所述突变蛋白包含氨基酸的取代、添加和/或缺失,从而功能/活性丧失或者减弱)。 NF2基因缺陷包括但不限于NF2/Merlin蛋白的表达水平降低、功能减弱或丧失。在一实施方案中,所述NF2基因缺陷为NF2等位基因杂合性缺失(lossof heterozygosity)。如本文所用,“等位基因杂合性缺失”是指位于一对同源染色体上相同基因座的两个等位基因中的一个等位基因的缺失。
在一些实施方案中,Hippo信号通路失调包括Hippo通路组分蛋白低表达,所述Hippo通路组分蛋白包括SAV1、NF2、WWC1、WWC2和WWC3。
在一实施方案中,Hippo信号通路失调包括WWC1、WWC2和/或WWC3蛋白低表达。已在多种癌症类型中检测到WWC1的低表达,例如乳腺癌(特别是三阴性乳腺癌)、肾癌(例如透明细胞肾细胞癌(ccRCC))、结直肠癌(CRC)、骨肉瘤(OS)、非小细胞肺癌(NSCLC)、肺腺癌(LUAD)、肝细胞癌 (HCC)、急性淋巴细胞白血病(ALL)和慢性淋巴细胞白血病(CLL)。此外,在例如HCC、胰腺癌(PAC) 和LUAD中检测到WWC2的低表达。在例如NSCLC、神经胶质瘤(Glioma)和胃癌中检测到WWC3 的低表达。
在一实施方案中,Hippo信号通路失调包括SAV1蛋白低表达。在一实施方案中,Hippo信号通路失调包括SAV1基因的纯合突变。在一实施方案中,Hippo信号通路失调不包括SAV1基因的纯合突变。所述SAV1基因的纯合突变导致SAV1蛋白的功能完全缺失。
在一些实施方案中,Hippo信号通路失调相关疾病具有以下一个或多个特征:(1)YAP蛋白高表达;(2)YAP蛋白高度活化;(3)NF2基因缺陷;和(4)WWC1、WWC2和/或WWC3蛋白低表达。
在一些实施方案中,所述Hippo信号通路失调相关疾病为癌症。不希望受特定理论束缚,已经证实在人类和小鼠的疾病中发现Hippo信号通路失调相关的基因突变。例如,已经在髓母细胞瘤、肺癌、胰腺癌、食管癌、胃癌、肝癌和乳腺癌中发现YAP/TAZ的高表达和细胞核内定位增加。此外,在源于周围或中央神经系统(例如,与Ⅱ型神经纤维瘤病相关的神经鞘瘤、脑膜瘤和室管膜瘤 (Ependymoma))、间皮、胆管、肾和其他组织的恶性肿瘤中发现NF2基因异常。例如,在间皮瘤 (mesothelioma;例如恶性间皮瘤)、乳头状肾细胞癌(PRCC)、脑膜瘤(meningioma)和神经鞘瘤 (schwannoma)中,发现高频率的NF2基因缺陷,特别是NF2等位基因杂合性缺失。此外,在多种癌症类型中存在散发性的其他Hippo信号通路组分(例如WWC1/2/3、SAV1和LATS1/2)的异常(参见例如Yu,F.X.et al.,Cell 163,811-28(2015);以及Zheng,Y.&Pan,D.Dev Cell 50,264-282(2019))。在一些实施方案中,所述癌症具有以下一个或多个特征:(1)YAP蛋白高表达;(2)YAP蛋白高度活化; (3)NF2基因缺陷;和(4)WWC1、WWC2和/或WWC3蛋白低表达。在优选的实施方案中,所述癌症以这样的癌细胞为表征,所述癌细胞包含高度活化的YAP或高表达YAP和/或NF2基因缺陷。
在一些实施方案中,本发明的多肽抑制癌细胞的增殖。在一些实施方案中,本发明的多肽抑制肿瘤发生。在一些实施方案中,利用合适的媒介物(例如表达载体或脂质纳米颗粒)将本发明的多核苷酸递送至需要治疗的靶部位(例如靶器官,例如肝脏),使本发明的多肽在靶部位中表达用于治疗与 Hippo信号通路失调相关的疾病。
相应地,本发明还提供治疗和/或预防癌症的方法,其包括向有需要的受试者给药有效量的本发明的多肽、多核苷酸或者药物组合物。在另一方面,本发明还涉及本发明的多肽、多核苷酸或者药物组合物在制备用于治疗和/或预防癌症的药物中的用途。
本发明的多肽、多核苷酸或者药物组合物可以治疗的癌症的非限制性实例包括但不限于肺癌、卵巢癌、结肠癌、直肠癌、黑色素瘤、肾癌(例如乳头状肾细胞癌(PRCC)和透明细胞肾细胞癌(ccRCC))、膀胱癌、乳腺癌(特别是三阴性乳腺癌)、淋巴瘤、肝癌(特别是肝细胞癌和肝内胆管癌(ICC))、恶性血液病、头颈癌(例如头颈部鳞状细胞癌(HNSCC))、胶质瘤、胃癌、鼻咽癌、喉癌、宫颈癌、子宫体瘤和骨肉瘤。其他癌症的实例包括但不限于骨癌、胰腺癌、皮肤癌、前列腺癌、黑色素瘤(例如皮肤或眼内恶性黑色素瘤)、子宫癌、肛区癌、睾丸癌、输卵管癌、子宫内膜癌、阴道癌、何杰金病、非何杰金氏淋巴瘤、食道癌、小肠癌、内分泌系统癌、甲状腺癌、甲状旁腺癌、肾上腺癌、软组织肉瘤、尿道癌、阴茎癌、急性成淋巴细胞白血病、慢性淋巴细胞白血病、淋巴浆细胞淋巴瘤、膀胱癌、肾癌、输尿管癌、肾盂癌、中枢神经系统肿瘤、原发性中枢神经系统淋巴瘤、脊柱肿瘤、脑干神经胶质瘤、垂体腺瘤、卡波西肉瘤、表皮状癌、鳞状细胞癌和T细胞淋巴瘤。在一些实施方案中,所述癌症为实体瘤。在一些实施方案中,所述癌症为实体瘤并且具有以下一个或多个特征:(1)YAP蛋白高表达;(2)YAP蛋白高度活化;(3)NF2基因缺陷;和(4)WWC1、WWC2和/或WWC3蛋白低表达。在一些实施方案中,所述癌症为实体瘤并且以这样的癌细胞为表征,所述癌细胞包含高度活化的YAP 或高表达YAP和/或NF2基因缺陷。在一些实施方案中,所述癌症选自乳腺癌、肾癌、肝癌、卵巢癌、间皮瘤、宫颈鳞癌、结直肠癌、骨肉瘤、非小细胞肺癌、肺腺癌、胰腺癌、急性淋巴细胞白血病、慢性淋巴细胞白血病、神经胶质瘤、胃癌、神经鞘瘤、脑膜瘤、黑色素瘤和肝癌。在一优选实施方案中,所述癌症选自三阴性乳腺癌、乳头状肾细胞癌、透明细胞肾细胞癌、间皮瘤、神经鞘瘤、脑膜瘤、黑色素瘤、肝细胞癌和肝内胆管癌。
试剂盒
本发明还提供试剂盒,其包含本发明的多肽、多核苷酸或者药物组合物,以及使用说明。试剂盒还可以包含合适的容器。在某些实施方案中,试剂盒还包含给药的装置。通常,试剂盒还包括标签,其用于表明试剂盒内容物的预期用途和/或使用方法。术语“标签”包括在试剂盒上或与试剂盒一起提供的或以其他方式随试剂盒提供的任何书面的或记录的材料。
有益效果
本发明的多肽、多核苷酸或药物组合物可以实现以下一个或多个有益效果:
(1)有效性高
(a)本发明的多肽的过表达能显著地将失调的Hippo通路调整到正常甚至高于正常的水平,继而通过激活Hippo通路以治疗相关疾病。
(b)本发明的多肽作为分子平台招募Hippo通路核心组分(例如,SuperHippo结合LATS1/2和SAV1,并通过SAV1招募MST1/2),使得这些核心组分高度集中,故而显著提高激酶级联反应的效率。
(c)相比现有技术中公开的小分子或多肽,本发明的多肽更为彻底地抑制Hippo通路信号的输出。 Hippo通路的信号输出依赖细胞核定位的YAP/TAZ与一系列转录因子(例如TEAD1-4)的结合。虽然 TEAD是YAP/TAZ结合的主要转录因子,但是还有不少其他转录因子同YAP/TAZ结合,并在肿瘤发生中起到不可或缺的作用。相比现有技术中公开的小分子或多肽仅破坏YAP/TAZ和TEAD1-4的物理结合,本发明的多肽能直接抑制YAP/TAZ转位到细胞核中,进而抑制YAP/TAZ与所有相关的转录因子的结合,也因此更为彻底地抑制Hippo通路信号的输出。
(2)特异性强
本发明的多肽的长度远短于全长WWC蛋白,它在最大程度保留与Hippo通路核心组分结合能力的同时失去了大部分与其他蛋白的结合位点,因此高特异性靶向Hippo通路。同时,根据本发明,在 SAV1缺失的情况下,本发明的多肽既无法正常发挥功能也没有产生明显的副作用,这进一步说明本发明的多肽能特异性作用于Hippo通路且无明显副作用。
(3)可递送性强
相比全长的WWC蛋白,本发明的多肽非常短,大大降低了作为治疗剂进行体内递送的难度。
(4)适用性强
(a)本发明的多肽能在不同组织来源的细胞中显著激活Hippo通路,具有治疗不同组织来源的肿瘤的潜力。
(b)与Hippo通路失调相关的癌症可大致分为两类:一类是能检测到高活性的YAP/TAZ但并不含有Hippo通路组分基因突变的;另一类是能检测到高活性的YAP/TAZ且含有Hippo通路组分基因突变的;其中前者占多数。本发明首次揭示,WWC蛋白N端部分(例如SuperHippo)在YAP/TAZ异常活化的这两类癌症的小鼠模型中都表现出肿瘤抑制作用。因此,本发明的多肽、多核苷酸或药物组合物对于治疗与Hippo通路失调相关的癌症具有普遍的适用性。
实施例
通过参考在此给出的一些具体实施例可获得对本发明的进一步的理解,这些实施例仅用于说明本发明,其无意于对本发明的范围做出任何限制。显然,可以对本发明作出多种改动和变化而不脱离本发明的实质,因此,这些改动和变化同样在本申请要求保护的范围内。
除非另外指明,实施例部分中所用的试剂和仪器都是可商购的。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照制造商的说明进行。
材料与方法
小鼠
所有小鼠实验均经复旦大学上海医学院动物伦理委员会批准,并按照机构指南进行。本研究使用C57BL/6小鼠,并制备了Wwc1F/F、Wwc2F/F、Nf2F/F,以及SuperHippo(R26-e(CAG-LSL-3xFlag- SuperHippo)小鼠。以SuperHippo小鼠为例,采用CRISPR/Cas9技术,通过同源重组的方式,在Rosa26 基因位点定点插入CAG-LSL-3XFlag-SuperHippo表达框。简要过程如下:通过体外转录的方式,获得 Cas9mRNA和gRNA;通过In-Fusion cloning的方法构建同源重组载体(donor vector),该载体包含3.3 kb 5’同源臂、CAG-LSL-3XFlag-SuperHippo和3.3kb 3’同源臂。将Cas9mRNA、gRNA和donor vector 显微注射到C57BL/6J小鼠的受精卵中,获得F0代小鼠。
Sav1F/F、YapF/F和TazF/F小鼠按照文献方法获得(参见Lu,L.et al.,Proc NatlAcad Sci,107,1437-42 (2010);Ji,S.et al.,Dev Cell 48,460-474e9(2019);以及Xin,M.et al.,Proc Natl Acad Sci,110,13839- 44(2013))。Alb-cre小鼠(The JacksonLaboratory,#003574)用于敲除肝脏中的基因。在涉及肿瘤发生的实验中,当观察到严重的腹部增大或体重减轻(相比同窝出生的对照组变化70%)时,将小鼠安乐死。在所述月龄,取小鼠肝脏,用福尔马林溶液固定,石蜡包埋切片进行病理分析,或用液氮保存以用于基因表达分析。对1月龄以上小鼠,眼眶采血以制备血清。
本研究建立的遗传小鼠模型均由Alb-cre驱动,因此是肝脏特异性的。
细胞系与细胞培养
野生型、基因敲除(KO)或稳定地过表达基因的HEK293A细胞在以下条件下保持:DMEM (Corning)中加入10%FBS(Gibco),50μg/mL青霉素/链霉素,5%CO2,37℃。基因敲除(KO)细胞系 NF2-KO、SAV1-KO、LATS1/2-dKO(LATS1和LATS2双敲除)、MOB1A/B-dKO(MOB1A和MOB1B双敲除)和MAP4Ks-5KO(MAP4K3-7敲除)按照文献方法获得(参见Yin,F.et al.,Cell,154,1342-55(2013);以及Plouffe,S.W.et al.,Mol Cell,64,993-1008(2016))。MST1/2-dKO(MST1和MST2双敲除)和 WWC1/2/3tKO(WWC1/2/3三重敲除)用CRISPR/Cas9系统制备。通过蛋白免疫印迹验证每个基因敲除细胞系。通过慢病毒转导建立稳定表达WWC1(蛋白:SEQID NO:1;DNA:SEQ ID NO:2)、WWC2 (蛋白:SEQ ID NO:3;DNA:SEQ ID NO:4)、WWC3(蛋白:SEQ ID NO:5;DNA:SEQ ID NO:6) 或SuperHippo(SEQ ID NO:1的氨基酸1-200;DNA编码序列:SEQ ID NO:2的核苷酸1-600)的 HEK293A细胞。
CRISPR/Cas9基因敲除
pSpCas9(BB)-2A-Puro(PX459)V2.0(Addgene#62988)由张锋教授提供。用CRISPR设计工具 http://www.genome-engineering.org/crispr设计了基因特异性sgRNA。转染HEK293A细胞,并用嘌呤霉素筛选2-3天。单细胞接种于96孔板。通过蛋白免疫印迹和/或Sanger测序筛选单克隆。靶向单个基因的sgRNA序列如下(由5’到3’):WWC1#1,GGAAAAGCAAGATCTCATTA;WWC1#2, GTGAAGGGCTGGATAGGACA;WWC2#1,GATCTCCACTACAAGATTAA;WWC2#2, GCTCTGTCAGTAAACACCGA;WWC3#1,TAAGCAGCAGCGGTTCGAGC;WWC3#2, CTACAAACTGGATGAGGCGC。
质粒、转染和慢病毒制备
将Hippo信号网络中的基因克隆到带有Ha标签或Flag标签的pLVX-puro载体(Takara,#632164)中以获得用于在哺乳动物中瞬时过表达目标蛋白的质粒。按照制造商的说明,使用PolyJetTM DNA体外转染试剂(Signagen,#SL100688)进行转染。
对于慢病毒的制备,用基于pLVX-puro的质粒与PsPAX2和pMD.2g共转染HEK293T细胞,2天后,将含病毒培养基过滤后用于病毒转导。
尾静脉高压注射
对4周龄的SuperHippoF/F小鼠尾静脉注射piggyBac转座酶及相关质粒,建立ICC小鼠模型。混合质粒的配制:将25μg NICD,25μg肉豆蔻酰化AKT,30μg piggyBac转座酶和100μg Cre(或对照)质粒用2mL 0.9%NaCl稀释。注射:混合质粒经无菌过滤,通过侧尾静脉进行水动力注射,注射体积为 0.1mL/g总体重。监测小鼠肝肿瘤的发展。
对3周龄的SuperHippoF/F小鼠尾静脉注射Adeno-Cre以驱动SuperHippo表达,或注射等体积的0.9% NaCl作为对照。1周后,对上述SuperHippoF/F小鼠尾静脉注射睡美人转座酶及相关质粒,建立HCC模型。混合质粒的配制:将25μg myr-AKT,25ug N-RasV12,10μg睡美人转座酶质粒用2mL 0.9%NaCl 稀释。注射:混合质粒经无菌过滤,通过侧尾静脉进行水动力注射,注射体积为0.1mL/g总体重。监测小鼠肝肿瘤的发展。
蛋白免疫印迹
全细胞裂解产物(每份样品约含10μg蛋白)用SDS-PAGE分离,将蛋白质转移到硝酸纤维素膜上。在5%脱脂牛奶中封闭后,用5%BSA中的一抗于4℃孵育过夜,然后与5%的牛奶中的二抗于室温孵育 1小时。将High-sig ECL蛋白免疫印迹底物(Tanon,#180-501)施加于膜上,并用Tanon 5200S成像系统检测化学发光。
使用的抗体如下:VINCULIN(Cell Signaling Technology,13901S)、GAPDH-HRP(Abways, AB2000)、LATS1(Cell Signaling Technology,3477S)、p-LATS1(T1079,HM)(Cell Signaling Technology, 8654S)、p-LATS1(S909)(Cell Signaling Technology,9157S)、LATS2(Cell Signaling Technology,5888S)、 YAP(63.7)(Santa CruzBiotechnology,SC-101199)、YAP(Cell Signaling Technology,14074S)、p- YAP(S127)(Cell Signaling Technology,4911S)、active YAP(aYAP,Abcam,ab205270)、NF2(CellSignaling Technology,12888S)、MOB1(Cell Signaling Technology,13730S)、p-MOB1(T35)(Cell Signaling Technology,8699S)、SAV1(Cell Signaling Technology,13301S)、MST1(Cell Signaling Technology,3682S)、MST1(BD Biosciences,611052)、MST2(Abcam,ab52641)、p-MST1 (T183)/MST2(T180)(Cell Signaling Technology,3681S)、MAP4K4(Cell Signaling Technology,5146S)、 MOB1(Cell SignalingTechnology,3863S)、WWC2(Abcam,ab126356)、CYR61(Santa Cruz Biotechnology,sc-13100)、CTGF(Santa Cruz Biotechnology,sc-14939)、抗-Flag HRP(Sigma-Aldrich,A8592)、抗-Ha HRP(Cell Signaling Technology,14031S)、Myc-tag(MBL Life Science,M192-3)。WWC1 抗体获赠自内布拉斯加大学Jixin Dong博士。WWC3兔多克隆抗体为定制(以人WWC3 (Asp230~Arg344)为免疫原,由Cloud-Clone制备)。
LATS1的磷酸化(活化)使用LATS1疏水基序(HM)中T1079的磷酸化抗体,即p-LATS1(T1079,HM) 检测。YAP的磷酸化(抑制)使用pYAP(S127)和/或phostag凝胶电泳检测。还使用抗active YAP抗体检测YAP的活性。
免疫沉淀
制备全细胞裂解产物,裂解液为:温和的裂解缓冲液(50mM HEPES,pH 7.5,150mMNaCl,1 mM EDTA,1%NP-40,10mM焦磷酸盐,10mM甘油磷酸盐,50mM NaF和1.5mM Na3VO4),加入 1mM PMSF、蛋白酶和磷酸酶抑制剂(cocktail)(Biotool)。与抗LATS1、MST1或Ha-tag抗体于4℃孵育 1小时。加入蛋白A琼脂糖珠(Repligen,10-1003-02)或蛋白A/G磁珠(Pierce,88803),孵育1小时以捕获蛋白-抗体复合物。微珠用温和裂解缓冲液洗涤4次。将沉淀的蛋白溶于1×SDS-PAGE样品缓冲液中,用于蛋白免疫印迹分析。
使用的抗体如下:LATS1(Cell Signaling Technology,3477S)、MST1(CellSignaling Technology, 3682S)、MST1(ABclonal,A8043)、SAV1(Cell SignalingTechnology,13301S)、Flag-琼脂糖(Smart- Lifesciences,SA042C)、Ha-tag(BIOTBiology,0101006)。
免疫荧光染色
将盖玻片上生长的细胞用含4%甲醛的PBS固定10分钟。用0.1%Triton X-100处理15分钟。用3%山羊血清阻断。于4℃用含3%BSA的PBST中的一抗处理过夜,然后在室温下用二抗处理1小时。用含DAPI的ProLongTM Gold Antifade Mountant(ThermoFisher,P36935)染色、封固后,用Leica SP8共聚焦显微镜拍摄图像。
使用的抗体如下:anti-YAP(Cell Signaling Technology,14074S)、anti-YAP(63.7)(Santa Cruz Biotechnology,SC-101199)、anti-Ha-tag(F-7)(Santa CruzBiotechnology,sc-7392)、anti-Flag-tag(Cell Signaling Technology,14793S)。
免疫组化
将石蜡包埋的肝组织切片(5μm),水化,用10mM柠檬酸钠缓冲液进行热诱导抗原修复,然后用 3%H2O2处理30分钟以抑制内源性过氧化物酶活性。将切片与一抗于4℃孵育过夜,随后与Envision anti-Rabbit(DAKO,K4002)一起孵育,并用DAB试剂(GeneTech,GK500705)可视化。将切片用苏木素复染,封固。用Olympus VS120Virtual Slide显微镜拍摄图像。
使用的抗体如下:Flag-tag(Sigma-Aldrich,A8592)、SOX9(Cell SignalingTechnology,82630)、 YAP/TAZ(Cell Signaling Technology,8418S)、SMA(CellSignaling Technology,19245)、HNF4α(Cell Signaling Technology,3113S)、p-H3(CellSignaling Technology,9701)、CK19(Abcam,ab52625)、F4/80 (Cell SignalingTechnology,70076)、CD34(Abcam,ab81829)。
AST和ALT测量
采用来自Roche的ELISA试剂盒(#20764949322和#20764957322),按照制造商的说明测定小鼠血清中的谷丙转氨酶(ALT)和谷草转氨酶(AST)。
RNA提取、逆转录和实时荧光定量PCR
用RNeasy Plus mini试剂盒(Qiagen)提取总RNA。用PrimeScript RT试剂盒(TaKaRa)合成cDNA,用SYBR Green qPCR Master Mix(TaKaRa)在7500实时PCR系统(Applied Biosystems)上进行qPCR。PCR 中使用的引物如下:CYR61,F:5’-AGCCTCGCATCCTATACAACC-3’,R:5’- TTCTTTCACAAGGCGGCACTC-3’;CTGF,F:5’-CCAATGACAACGCCTCCTG-3’,R:5’- TGGTGCAGCCAGAAAGCTC-3’;ANKRD1,F:5’-CACTTCTAGCCCACCCTGTGA-3’,R:5’- CCACAGGTTCCGTAATGATTT-3’;βACTIN,F:5’-GCCGACAGGATGCAGAAGGAGATCA-3’,R:5’- AAGCATTTGCGGTGGACGATGGA-3’。
统计学
除非另有说明,用t检验(Student t-test)确定两组数据之间是否有显著差异。数据表示为均值±SD (n≥3),*表示p<0.05;**表示p<0.01;***表示p<0.005,****表示p<0.0001。NS表示无显著性。
RNA测序与分析
在构建RNA-seq文库之前,用VAHTS mRNA捕获磁珠(Vazyme)对小鼠肝脏总RNA样品(1μg)进行处理,以富集polyA+RNA。按照制造商的说明,用VAHTS mRNA-seq v2LibraryPrep Kit for Illumina (Vazyme)文库制备试剂盒制备RNA-seq文库。
简单地说,片段化polyA+RNA样品,然后使用随机六聚体引物合成第一和第二链cDNA。用DNA 末端修复试剂盒对cDNA片段进行末端修复,然后用Klenow修饰,在DNA片段的3'端增加一个A,最后连接到接头上。纯化的dsDNA用PCR扩增,12个循环。用Illumina测序平台对文库进行双端测序,读长150bp。以mm10_GRCm38小鼠基因组集合为参考基因组,用剪接读段比对工具HISAT2对RNA- seq数据中的测序读段进行比对。以FPKM(每百万比对到参考基因组上的读段中来自于特定基因每千碱基长度的读段数)计算基因表达水平。从GENCODE数据库中检索到小鼠基因组中mRNA的注释。用t检验分析基因在各组间的表达差异。提取差异倍数(均值)>2或<0.5的数据,这样的差异认为是显著的。用Database for Annotation,Visualization and Integrated Discovery(DAVID)v6.8对差异表达的基因进行KEGG通路富集分析。筛选p<0.01的富集通路。使用Molecular Signatures Database(MSigDB)基因集(小鼠基因和人类基因进行比对),用预先排序的基因集富集分析(GSEA)进行排序。
实施例1 WWC蛋白和NF2平行调控Hippo通路
当前对在哺乳动物中Hippo信号网络的理解为线性激酶级联反应调控的信号转导(图1A)。其中, STE20样蛋白激酶MST1/2(Hippo激酶)和MAP4K1-7(Hippo样激酶)磷酸化并激活LATS1/2,LATS1/2 转而磷酸化并失活YAP和TAZ。此外,支架蛋白或衔接蛋白,例如SAV1、WWC蛋白、MOB1以及NF2对于Hippo信号的转导至关重要。
为了解WWC蛋白在Hippo通路中的作用,通过CRISPR/Cas9系统建立了Hippo通路组分 LATS1/2(LATS1/2-dKO)、MST1/2(MST1/2-dKO)、MOB1A/B(MOB1A/B-dKO)、SAV1(SAV1-KO)、NF2 (NF2-KO)或MAP4K3-7(MAP4Ks-5KO)敲除的HEK293A细胞系。
在野生型(WT)或者Hippo通路组分基因敲除的HEK293A细胞中,在Flag-WWC1(SEQID NO: 1)存在或不存在的情况下过表达Ha-YAP。通过免疫印迹分析LATS1的激活(LATS1疏水基序的磷酸化,pLATS1(HM))、YAP的失活(抗磷酸化S127抗体,pYAP(S127);和phostag凝胶电泳)以及Hippo 通路靶基因CYR61的表达(图1B)。如图1B所示,在LATS1/2或其支架蛋白MOB1A/B敲除细胞中, WWC1的表达没有改变LATS1/2和YAP的磷酸化以及CYR61的表达,这是由于WWC蛋白在Hippo 通路中位于LATS1/2的上游。有趣的是,在SAV1或MST1/2敲除细胞中,WWC1的表达未能激活 LATS1/2。而在NF2或MAP4K3-7敲除的细胞中,WWC1有效地诱导了LATS1/2活性,增强了YAP 的磷酸化水平,降低CYR61的表达水平。
在野生型(WT)或者Hippo通路组分基因敲除的HEK293A细胞中过表达Flag-WWC1,将细胞裂解物用于anti-Flag免疫沉淀,然后通过免疫印迹分析细胞裂解物和免疫沉淀物(图1C)。如图1C所示,在MST1/2敲除细胞中,SAV1的稳定性大大降低,Flag-WWC1与SAV1的相互作用基本消失;在SAV1敲除细胞中,WWC1与MST1之间的相互作用显著减少,而LATS1/2、MOB1A/B或NF2的敲除对WWC1与MST1或SAV1的结合没有影响。
以上结果表明,SAV1介导WWC1和MST1/2之间的相互作用,并且WWC1以NF2非依赖的方式通过结合SAV1招募MST1/2,从而激活LATS1/2。
在HEK293A细胞中稳定表达Flag-WWC1、Flag-WWC2或Flag-WWC3,然后通过不同测定分析Hippo通路活性。
通过蛋白免疫印迹检测细胞裂解物中LATS1/2、YAP和MOB1的磷酸化水平以及CYR61的表达(图1D)。如图1D所示,Flag-WWC1、Flag-WWC2或Flag-WWC3的表达有效激活LATS1/2、抑制YAP活性并减少CYR61的表达。
通过免疫荧光染色确定YAP的亚细胞定位(图1E)。如图1E所示,在表达有Flag-WWC1、Flag- WWC1或Flag-WWC3的细胞中,YAP从细胞核转位至细胞质中。
通过实时荧光定量PCR分析Hippo通路靶基因CTGF和CYR61的mRNA水平(图1F)。如图1F 所示,Flag-WWC1、Flag-WWC2或Flag-WWC3的表达使CTGF和CYR61的mRNA水平显著降低。
这些结果表明,WWC1-3过表达失活YAP/TAZ,将YAP滞留在细胞质中。
通过CRISPR/Cas9系统建立了两个WWC1-3三重敲除(WWC1/2/3tKO)单克隆HEK293A细胞系 (#1和#2),并通过蛋白免疫印迹(图1G)、免疫荧光染色(图1H)和qPCR(图1I)来分析Hippo通路活性。
如图1G-1I所示,在WWC1-3tKO细胞中,YAP的磷酸化水平降低,活化的YAP的水平和CYR61 的表达显著增加(图1G),YAP在细胞核中定位增加(图1H),CTGF和CYR61的mRNA水平显著增加(图1I),表明敲除WWC1-3激活YAP/TAZ和失活Hippo通路。
图1J示出由两条Hippo通路(分别为经典的和替代的)组成的新Hippo信号网络示意图,其中 MST1/2–SAV1–WWC1/2/3和MAP4K1-7–NF2通过独立地激活LATS1/2控制YAP的活性,从而平行调控Hippo信号转导。
实施例2 WWC蛋白N端部分在细胞中激活Hippo通路
2.1 WWC11-200(SuperHippo)通过抑制YAP活性来激活Hippo通路
在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或缺失突变体Δ1-100、Δ101- 200、Δ201-300、Δ301-400、Δ401-500、Δ501-600、Δ601-700、Δ701-800、Δ801-900、Δ901-1000或Δ1001-1119),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化(图2A)。如图2A所示, WWC1促进LATS1和YAP的磷酸化;WWC1的第1-100位氨基酸和第101-200位氨基酸的缺失使 WWC1无法促进LATS1和YAP的磷酸化,表明第1-200位氨基酸对于WWC1在Hippo通路中的激活作用至关重要。
在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或截短突变体(1-100aa,WWC11-100;或者1-200aa,WWC11-200),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化以及 CYR61的表达(图2B)。如图2B所示,WWC1和WWC11-200促进YAP和LATS1磷酸化,并且显著减少活性YAP水平,并且降低CYR61的表达水平;而WWC11-100不足以实现对YAP的抑制。由此可见,WWC11-200可以激活LATS并抑制YAP活性,从而激活Hippo通路。因此,将WWC11-200(SEQ ID NO:1的氨基酸1-200)命名为SuperHippo。
对过表达Flag-SuperHippo的HEK293A细胞进行免疫荧光染色(图2C)。从图2C可见,HEK293A 细胞中一旦过表达SuperHippo(红色;anti-Flag抗体染色Flag标签),YAP(绿色;anti-YAP染色)就会大量定位在细胞质,而非细胞核(蓝色;DAPI染色DNA)。结果表明,SuperHippo能促进YAP在细胞质中的定位。
通过瞬时转染在HEK293A细胞中过表达Flag-SuperHippo或Flag-WWC1。提取转染后细胞的总RNA并反转录成cDNA,然后通过qPCR分析CTGF、CYR61和ANKRD1的表达水平(图2D)。 qPCR结果显示,SuperHippo能和WWC1一样在mRNA水平上抑制CTGF、CYR61和ANKRD1的表达。
2.2 SuperHippo中对于Hippo通路的激活关键的氨基酸
在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或缺失突变体Δ87-100、Δ101- 110、Δ111-120、Δ121-130、Δ131-140、Δ141-150、Δ151-160、Δ161-170、Δ171-180、Δ181-190或Δ191- 200),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化(图2E)。如图2E所示,WWC1 促进YAP和LATS1磷酸化并显著减少活性YAP水平;87-100aa、151-160aa或161-170aa缺失使 WWC1无法促进LATS1和YAP的磷酸化并且显著增加活性YAP水平,表明这些氨基酸对于WWC1 在Hippo通路中的激活作用至关重要。
在WWC1/2/3基因敲除(WWC1/2/3tKO)的HEK293A细胞中共转染Ha-YAP和Flag-SuperHippo (野生型(SuperHippo)或缺失突变体Δ87-100、Δ101-110、Δ111-120、Δ121-130、Δ131-140、Δ141-150、Δ151-160、Δ161-170、Δ171-180、Δ181-190或Δ191-200),通过蛋白免疫印迹分析细胞裂解物中LATS1 和YAP的磷酸化(图2F)。结果与图2A一致,第87-100位氨基酸以及第151-170位氨基酸的缺失使 SuperHippo无法促进LATS1和YAP的磷酸化,表明这些氨基酸对于SuperHippo在Hippo通路中的激活作用至关重要。此外,在WWC1/2/3基因敲除的细胞中表达SuperHippo有效地激活LATS1并抑制YAP的活性,即过表达SuperHippo挽救了WWC1/2/3基因缺陷造成的Hippo通路失调。
在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或突变体(mutant)。突变体相对于野生型WWC1分别包含以下氨基酸取代:M95A(95A)、L96A(96A)、Y99A(99A)、L100A(100A)、 L160A(160A)、E163A(163A)、I164A(164A)、M95AL96A(9596AA)、Y99AL100A(99100AA)、 I159AL160A(159160AA)或E163AI164A(163164AA)。通过蛋白免疫印迹分析细胞裂解物中LATS1 和YAP的磷酸化(图2G)。如图2G所示,将M95、L96、Y99、L100、L160、E163和I164中任一氨基酸突变成A,使LATS1和YAP的磷酸化无法增加,表明这些氨基酸对于Hippo通路的激活至关重要。
在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(Flag KIBRA)的截短突变体(mutant)(1-140 aa、1-150aa、1-160aa、1-170aa或1-180aa),通过蛋白免疫印迹分析细胞裂解物中YAP的磷酸化 (图2H)。如图2H所示,在测试的截短突变体中,WWC11-180可以有效促进YAP的磷酸化。因此,具有WWC1的约第1位至约第180位氨基酸的片段可能是抑制YAP的活性(激活Hippo通路)的最小片段。
在HEK293A细胞中共转染Ha-YAP和Flag-WWC1(野生型(WT)或突变体(Mut))。突变体分别相对于野生型WWC1包含以下氨基酸取代:Q87AW88A(87A88A)、R89AR90A(89A90A)、E91AQ92A (91A92A)、E93AH94A(93A94A)、M95AL96A(95A96A)、K97AD98A(97A98A)或Y99AL100A (99A100A)。通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化(图2I)。
在HEK293A细胞中共转染Ha-SAV1、Ha-MST1、Ha-LATS1和Flag-WWC1(野生型(WT)或标示的突变体),将细胞裂解物用于anti-Flag免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物(图2J)。如图2I和2J所示,将第87、88、89、90、91、92、93、94、97和98位氨基酸突变成丙氨酸(A),没有影响Flag-WWC1对LATS1和YAP磷酸化的促进,表明这些氨基酸可能对于 Hippo通路的激活作用不大。将第95和96位氨基酸(95A96A)或者第99和100位氨基酸(99A100A) 分别突变成A,使Flag-WWC1失去与Ha-SAV1和Ha-MST1的相互作用,同时LATS1和YAP的磷酸化消失,表明第95、96、99和100位氨基酸对于Hippo通路的激活至关重要。
2.3果蝇kbr 1-250aa和50-250aa激活Hippo通路
在HEK293A细胞中共转染Ha-YAP和带有Flag标签的WWC1(WWC1)、果蝇kbr(WWC1蛋白在果蝇中的同源蛋白;SEQ ID NO:13)、kbr 1-250aa(SEQ ID NO:13的氨基酸1-250)或者kbr 50- 250aa(SEQ ID NO:13的氨基酸50-250),通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化(图2K)。结果表明,果蝇kbr及其片段kbr 1-250aa和kbr 50-250aa可以激活LATS的激酶活性。
2.4 WWC21-204和WWC351-250激活Hippo通路
通过瞬时转染在HEK293A细胞中共表达Ha-YAP和带有Flag标签的WWC蛋白N端部分WWC11-200(SEQ ID NO:1的氨基酸1-200)、WWC21-204(SEQ ID NO:3的氨基酸1-204)或WWC351-250 (SEQ ID NO:5的氨基酸51-250),通过蛋白免疫印迹分析细胞裂解物(图2L)。结果表明,WWC21-204和WWC351-250具有与SuperHippo相似的功能,能够促进LATS1和YAP的磷酸化,从而激活Hippo 通路。
实施例3 SuperHippo的工作机制和全长WWC1类似
3.1 SuperHippo通过与SAV1相互作用招募MST1/2
通过瞬时转染在HEK293A细胞中或Hippo通路组分基因缺陷的HEK293A细胞中(LATS1/2、 MOB1A/B、MST1/2或SAV1基因敲除)过表达Ha-SuperHippo,将细胞裂解物用于anti-Ha免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物(图3A)。如图3A所示,SuperHippo与LATS1/2 和SAV1相互作用;在SAV1缺失的情况下,SuperHippo失去与MST1/2的结合,表明SuperHippo 通过与SAV1相互作用招募MST1/2。
通过瞬时转染在HEK293A细胞中过表达野生型Flag-SuperHippo和突变型Flag-SuperHippo (M95A、L96A、Y99A或L100A),将细胞裂解物用于anti-Flag免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物(图3B)。如图3B所示,将M95、L96、Y99和L100中任一个突变成A 都导致SuperHippo与SAV1的结合显著减弱,表明M95、L96、Y99和L100对于SuperHippo与SAV1 的结合起重要作用。这在一定程度上解释了这些突变体不能激活Hippo通路的原因(参见实施例2;图2G)。
3.2 SuperHippo与LATS1相互作用
通过瞬时转染在HEK293A细胞中过表达Flag-SuperHippo(野生型(WT);或者突变体:WW1mut, W34A/P37A;WW2mut,P84A;WW1/2mut,W34A/P37A/P84A),将细胞裂解物用于anti-Flag免疫沉淀,然后通过蛋白免疫印迹分析细胞裂解物和免疫沉淀物(图3C)。如图3C所示,SuperHippo通过其WW结构域(WW1结构域,6-39aa;WW2结构域,53-86aa)与LATS1相互作用,W34、P37和 P84突变成A使SuperHippo失去与LATS1相互作用的能力。
在WWC1/2/3三重敲除(WWC1/2/3tKO)的HEK293A细胞中共表达Ha-YAP和Flag-SuperHippo (野生型(WT);或者突变体:WW1mut,W34A/P37A;WW2mut,P84A;WW1/2mut,W34A/P37A/P84A),然后通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化(图3D)。如图3D所示,敲除 WWC1/2/3的细胞中,YAP和LATS1失去磷酸化,表明Hippo通路失活;Flag-SuperHippo(WT)的表达促进YAP和LATS1磷酸化,重新激活Hippo通路,挽救了WWC1/2/3tKO细胞中Hippo通路失活的缺陷;而突变体WW1mut、WW2mut和WW1/2mut重新激活Hippo通路的活性显著低于野生型 SuperHippo。
3.3 SuperHippo的赖氨酸突变体和肉豆蔻酰化修饰激活Hippo通路
通过瞬时转染在HEK293A细胞中过表达Flag-SuperHippo或者其中所有赖氨酸突变为精氨酸的 SuperHippo突变体(SEQ ID NO:21)(Flag-K0SuperHippo)(图3E)或者在N末端带有NMT识别基序 (SEQ ID NO:22)的Flag-SuperHippo(Myr-Flag-SuperHippo;其在共翻译时被肉豆蔻酰化修饰)(图3F),然后通过蛋白免疫印迹分析细胞裂解物中LATS1和YAP的磷酸化。如图3E所示,将SuperHippo中的所有赖氨酸突变成精氨酸后,激活Hippo通路的活性更高。如图3F所示,肉豆蔻酰化修饰的 SuperHippo激活Hippo通路的活性更高。
3.4 SuperHippo在Hippo通路中发挥功能的作用机制
图3G示出SuperHippo在Hippo通路中发挥功能的作用机制示意图。SuperHippo作为平台招募 LATS1/2和SAV1,随后SAV1诱导MST1/2的磷酸化并激活LATS1/2。
实施例4 SuperHippo在小鼠中激活Hippo通路
基于YapF/F和TazF/F小鼠,构建了肝脏特异性表达SuperHippo的转基因(SuperHippo)小鼠和 Yap/Taz双敲除(Yap-/-;Taz-/-)小鼠。
在所标示的年龄,分析了野生型(WT)小鼠、SuperHippo小鼠和Yap-/-;Taz-/-小鼠的肝体比(=肝重 /体重×100%)(图4A)、血清中谷草转氨酶(AST)含量(图4B)和谷丙转氨酶(ALT)含量(图4C)。结果显示,SuperHippo小鼠和Yap-/-;Taz-/-小鼠的肝体比、AST含量、ALT含量相比正常小鼠都有一定程度的上升,表明SuperHippo小鼠和Yap-/-;Taz-/-小鼠肝脏表型相似,且都存在一定程度的肝损伤。
解剖1月龄的WT小鼠、SuperHippo小鼠和Yap-/-;Taz-/-小鼠,收取肝脏并进行H&E染色和免疫组化(IHC)染色(图4D)。H&E染色显示SuperHippo小鼠和Yap-/-;Taz-/-小鼠一样都有弥散分布的肝细胞凋亡区域(图中*所示)。IHC染色显示,SuperHippo小鼠肝脏中的胆管上皮细胞(CK19阳性)分布同 Yap-/-;Taz-/-小鼠相似,即分布较为弥散并且胆管结构也很不规则以致胆管系统发育受到抑制。这些结果表明,与WT小鼠相比,SuperHippo小鼠和Yap-/-;Taz-/-小鼠的肝脏都存在肝细胞(HNF4α阳性)凋亡区域并且胆管发育异常。直到14月龄,SuperHippo小鼠身体正常,表明小鼠对于肝脏中SuperHippo 的持续表达耐受性良好。
提取WT小鼠、SuperHippo小鼠和Yap-/-;Taz-/-小鼠肝脏的总RNA并通过RNA-seq分析肝脏基因表达谱,结果示于图4E-4G。结果表明SuperHippo小鼠与Yap-/-;Taz-/-小鼠肝脏的转录表达谱十分相似,并且Hippo通路靶基因的表达都受到了相当程度的抑制。
以上结果证明在小鼠中表达SuperHippo导致与Yap/Taz缺陷小鼠相似的表型,表明SuperHippo 能激活Hippo信号通路并有效抑制YAP/TAZ的活性。
实施例5 Hippo通路可作为靶点调控肿瘤细胞的增殖
ACHN细胞是来源于人的肾腺癌细胞系,同时含有NF2基因和SAV1基因的突变,经蛋白免疫印迹确定其基本不表达NF2和SAV1(图5A)。
在ACHN细胞中过表达Flag-NF2、Flag-SAV1或Flag-NF2和Flag-SAV1。通过蛋白免疫印迹检测细胞裂解物中的YAP的磷酸化(图5B),并利用CCK-8试剂盒(YEASEN,40203ES60)检测活细胞数目并绘制细胞增殖曲线(图5C)。如图5B所示,ACHN细胞中YAP的磷酸化处在极低的水平,回补NF2或SAV1中的任一蛋白使YAP的磷酸化水平有所回升,而同时回补NF2和SAV1会在最大程度上提升YAP的磷酸化水平。由此可见,ACHN细胞中YAP的磷酸化受NF2和SAV1的协同调控。如图5C所示,正常ACHN细胞的增殖速度最快,回补NF2或SAV1中的任一蛋白都能在一定程度上抑制ACHN细胞增殖,而同时回补NF2和SAV1能最为显著地降低ACHN细胞的增殖速度。由此可见,ACHN细胞的增殖受NF2和SAV1的协同调控。
以上结果表明,分别由NF2和SAV1参与的两条Hippo通路(图1G)协同参与细胞增殖的调控,这两条Hippo通路中的成分也是限制YAP/TAZ在人类癌细胞中的致癌活性所必需的。因此,Hippo 通路可作为靶点调控肿瘤细胞的增殖。
实施例6 SuperHippo特异性地抑制依赖YAP活性的肿瘤细胞的增殖
为了了解SuperHippo对肿瘤细胞增殖的抑制作用,选取了四种黑色素瘤细胞系MEL-270、92.1、 OCM1和OCM8。其中MEL-270和92.1含有GNAQ突变(已知GNAQ突变以Hippo通路非依赖性的方式激活YAP;因此,MEL-270和92.1的生长依赖YAP的活性)。而OCM1和OCM8含有BRAF突变,它们的生长不依赖YAP的活性。
分别在这四种黑色素瘤细胞中稳定表达GFP-SuperHippo,通过蛋白免疫印迹检测细胞裂解物中的LATS1和YAP的磷酸化以及CYR61的表达(图6A),并利用CCK-8测定检测活细胞数目并绘制细胞增殖曲线(图6B)。如图6A所示,SuperHippo的表达使这四种细胞中LATS1和YAP的磷酸化都有显著的提升,CYR61的表达也都受到明显的抑制。有趣的是,如图6B所示,只有MEL-270和 92.1细胞的增殖受到抑制,而OCM1和OCM8细胞的增殖则并没有因为SuperHippo的过表达而受到影响。这些实验结果表明,SuperHippo能特异性地抑制依赖YAP活性的肿瘤细胞的增殖,即使该肿瘤细胞并不含有Hippo通路上游基因的突变。
实施例7 SuperHippo抑制Hippo通路组分基因突变引起的肿瘤发生
在Hippo通路失活相关的小鼠肿瘤模型中测试了SuperHippo的治疗效力。基于Wwc1F/F、Wwc2F/F、 Sav1F/F和Nf2F/F小鼠,构建了Hippo通路组分基因缺陷的小鼠模型:Nf2-/-(Nf2双等位基因敲除)小鼠、Nf2-/-;Wwc1+/-;Wwc2+/-(Nf2双等位基因敲除;Wwc1和Wwc2单等位基因敲除)小鼠和Nf2-/-;Sav1+/- (Nf2双等位基因敲除;Sav1单等位基因敲除)小鼠。将SuperHippo(R26-e(CAG-LSL-3xFlag- SuperHippo)引入这些小鼠,分别构建了Nf2-/-;SuperHippo小鼠、Nf2-/-;Wwc1+/-;Wwc2+/-;SuperHippo小鼠和Nf2-/-;Sav1+/-;SuperHippo小鼠。
7.1 Nf2-/-肿瘤模型
在NF2缺失时过表达SuperHippo对Hippo通路影响的示意图示于图7A(左)。
8月龄的Nf2-/-小鼠出现一系列与Nf2缺陷癌症相关的异常表型,包括肝体比增加、胆管上皮细胞异常增生(图7A,右图)。此外,Nf2-/-小鼠表现出转录组水平的基因表达谱异常(图7B-7D),尤其是 Hippo通路的靶基因上调,这些基因参与癌症、代谢、细胞外基质重塑和免疫应答。在Nf2-/-;SuperHippo 小鼠中,这些与Nf2缺陷相关的异常表型都得到了很好的回复。
以上结果表明,SuperHippo的表达抑制由Nf2缺陷驱动的肿瘤发生。
7.2 Nf2-/-;Wwc1+/-;Wwc2+/-肿瘤模型和Nf2-/-;Sav1+/--肿瘤模型
在NF2和WWC1/2缺失时过表达SuperHippo对Hippo通路影响的示意图示于图8A。在NF2完全缺失伴随Sav1部分缺失时过表达SuperHippo对Hippo通路影响的示意图示于图8D。
Nf2-/-;Wwc1+/-;Wwc2+/-小鼠和Nf2-/-;Sav1+/-小鼠分别在3周龄和6周龄时发展出严重的肝内胆管细胞癌(ICC)及相关表型,包括肝体比增加、胆管上皮细胞异常增生(图8B和8E),以及肝纤维化、巨噬细胞浸润、卵原细胞增生、血管增生、细胞增殖加快、YAP/TAZ活化(图8C和8F)。这些癌症相关的异常表型在Nf2-/-;Wwc1+/-;Wwc2+/-;SuperHippo小鼠和Nf2-/-;Sav1+/-;SuperHippo小鼠中都得到了有效的抑制。
以上结果表明,SuperHippo能够抑制Hippo通路组分基因突变引起的肿瘤发生。
实施例8在不含Hippo通路上游基因突变的小鼠模型中,SuperHippo依旧能抑制肿瘤发生
在不同类型的癌症中(例如肝癌、结直肠癌、肺癌),通常存在YAP/TAZ异常活化,而Hippo通路上游基因没有异常的情况。
在小鼠肝脏中表达Notch胞内结构域(NICD)和肉豆蔻酰化的AKT(myr-AKT)可以诱发严重的肝内胆管癌(ICC),其中YAP/TAZ高度活化而Hippo通路基因没有异常。这种NICD/AKT肝内胆管癌模型可以用于评价SuperHippo用于治疗其中YAP/TAZ异常活化而Hippo通路上游基因没有异常的癌症的效果。
在小鼠肝脏中表达myr-AKT和N-RasV12可以诱发肝细胞癌(HCC)(参见Liu et al.(2018)J. immunotherapy cancer 6,144)。
8.1肝内胆管癌
向成年SuperHippoF/F小鼠尾静脉高压注射表达转座酶piggyBac(PB)、NICD和myr-AKT的质粒(NICD/AKT小鼠),或者在注射这些质粒的同时注射表达Cre重组酶的质粒以驱使SuperHippo的表达(NICD/AKT SuperHippo小鼠),仅注射空载体的SuperHippoF/F小鼠作为对照(Ctrl),结果示于图 9A,9B和9C。与对照小鼠相比,NICD/AKT小鼠的肝体比显著增高。注射后8周,NICD/AKT小鼠开始出现腹部肿大的症状,并逐渐死亡。解剖NICD/AKT小鼠后发现其肝脏呈现严重的ICC症状,将肝脏切片染色后发现病灶部位呈CK19阳性并且高表达YAP/TAZ和Ki67(细胞增殖标志物)。而与之形成对比的是,NICD/AKT诱导的ICC症状在NICD/AKT SuperHippo小鼠中得到抑制。
8.2肝细胞癌
向成年SuperHippoF/F小鼠尾静脉高压注射表达myr-AKT、N-RasV12和睡美人转座酶(SB)的质粒(AKT/Ras小鼠),或者在注射这些质粒前注射带有Cre重组酶的腺病毒(Adeno-Cre)以驱使 SuperHippo的表达(SuperHippo AKT/Ras小鼠),仅注射空载体的SuperHippoF/F小鼠作为对照(ctrl小鼠),结果示于图10。
与对照小鼠相比,AKT/Ras小鼠的肝体比显著增高。注射后4-5周,AKT/Ras小鼠开始出现腹部肿大的症状,并逐渐死亡。解剖AKT/Ras小鼠后发现其肝脏呈现严重的HCC症状,将肝脏切片染色后发现病灶部位呈CK19阳性并且高表达YAP/TAZ和Ki67(细胞增殖标志物)。而与之形成对比的是,AKT/Ras诱导的HCC症状在SuperHippo AKT/Ras小鼠中得到显著抑制。
以上结果表明,除Hippo通路组分异常相关的癌症以外,SuperHippo还能够抑制一些常见癌症驱动基因(cancer driver)诱导的肿瘤生成。
实施例9 SuperHippo作为潜在的治疗工具在不同载体中的尝试
9.1腺相关病毒(AAV)
将SuperHippo的编码序列(SEQ ID NO:2的核苷酸1-600)构建于腺相关病毒AAV8载体(pAAV- CMV-2Ha-SuperHippo-P2A-NLS-CRE-3Flag)中,在小鼠中尾静脉注射。3周后收取小鼠肝脏,并用蛋白免疫印迹检测SuperHippo的表达(图11A)。结果显示3只实验小鼠(#1,#2,#3分别为3只实验小鼠的编号)的肝脏中都能检测到SuperHippo的表达。结果表明,利用腺相关病毒载体(特别是AAV8 载体)可以将SuperHippo递送至肝脏。
9.2脂质纳米颗粒(LNP)
通过包裹mRNA(通过DNA模板进行体外转录获得)的脂质纳米颗粒转染HEK293A细胞,实现 SuperHippo编码mRNA(编码区具有SEQ ID NO:2的核苷酸1-600的核苷酸序列)的过表达,并通过免疫荧光(图11B-C)和蛋白免疫印迹检测蛋白SuperHippo的表达效率(图11D)。图11B和11D显示带有不同修饰(在进行体外转录时,分别用5-甲氧基尿苷-5’-三磷酸(5-moUTP)、N1-甲基-假尿苷-5’- 三磷酸(N1-UTP)或假尿苷-5’-三磷酸(pseudo-UTP)代替尿苷-5’-三磷酸)的SuperHippo编码mRNA在 HEK293A细胞中的表达效率很高。图11C显示过表达有SuperHippo编码mRNA的细胞中YAP的亚细胞定位发生了变化。结果表明,带有不同修饰的SuperHippo编码mRNA在HEK293A细胞中的表达效率都很高,并且都是有功能的。
缩写和符号
序列表
1.WWC1(WW and C2 domain containing1)智人(Homo sapiens)
蛋白(protein KIBRA isoform 1;GenBank:NP 001155133.1;SEQ ID NO:1;1119aa):
MPRPELPLPEGWEEARDFDGKVYYIDHTNRTTSWIDPRDRYTKPLTFADCISDELPLGWEEAYDPQVGDYFIDHN TKTTQIEDPRVQWRREQEHMLKDYLVVAQEALSAQKEIYQVKQQRLELAQQEYQQLHAVWEHKLGSQVSLVSGSS SSSKYDPEILKAEIATAKSRVNKLKREMVHLQHELQFKERGFQTLKKIDKKMSDAQGSYKLDEAQAVLRETKAIK KAITCGEKEKQDLIKSLAMLKDGFRTDRGSHSDLWSSSSSLESSSFPLPKQYLDVSSQTDISGSFGINSNNQLAE KVRLRLRYEEAKRRIANLKIQLAKLDSEAWPGVLDSERDRLILINEKEELLKEMRFISPRKWTQGEVEQLEMARK RLEKDLQAARDTQSKALTERLKLNSKRNQLVRELEEATRQVATLHSQLKSLSSSMQSLSSGSSPGSLTSSRGSLV ASSLDSSTSASFTDLYYDPFEQLDSELQSKVEFLLLEGATGFRPSGCITTIHEDEVAKTQKAEGGGRLQALRSLS GTPKSMTSLSPRSSLSSPSPPCSPLMADPLLAGDAFLNSLEFEDPELSATLCELSLGNSAQERYRLEEPGTEGKQ LGQAVNTAQGCGLKVACVSAAVSDESVAGDSGVYEASVQRLGASEAAAFDSDESEAVGATRIQIALKYDEKNKQF AILIIQLSNLSALLQQQDQKVNIRVAVLPCSESTTCLFRTRPLDASDTLVFNEVFWVSMSYPALHQKTLRVDVCT TDRSHLEECLGGAQISLAEVCRSGERSTRWYNLLSYKYLKKQSRELKPVGVMAPASGPASTDAVSALLEQTAVEL EKRQEGRSSTQTLEDSWRYEETSENEAVAEEEEEEVEEEEGEEDVFTEKASPDMDGYPALKVDKETNTETPAPSP TVVRPKDRRVGTPSQGPFLRGSTIIRSKTFSPGPQSQYVCRLNRSDSDSSTLSKKPPFVRNSLERRSVRMKRPSP PPQPSSVKSLRSERLIRTSLDLELDLQATRTWHSQLTQEISVLKELKEQLEQAKSHGEKELPQWLREDERFRLLL RMLEKRQMDRAEHKGELQTDKMMRAAAKDVHRLRGQSCKEPPEVQSFREKMAFFTRPRMNIPALSADDV
DNA(GenBank:CCDS54945.1;SEQ ID NO:2):
ATGCCCCGGCCGGAGCTGCCCCTGCCGGAGGGCTGGGAGGAGGCGCGCGACTTCGACGGCAAGGTCTACTACATA GACCACACGAACCGCACCACCAGCTGGATCGACCCGCGGGACAGGTACACCAAACCGCTCACCTTTGCTGACTGC ATTAGTGATGAGTTGCCGCTAGGATGGGAAGAGGCATATGACCCACAGGTTGGAGATTACTTCATAGACCACAAC ACCAAAACCACTCAGATTGAGGATCCTCGAGTACAATGGCGGCGGGAGCAGGAACATATGCTGAAGGATTACCTG GTGGTGGCCCAGGAGGCTCTGAGTGCACAAAAGGAGATCTACCAGGTGAAGCAGCAGCGCCTGGAGCTTGCACAG CAGGAGTACCAGCAACTGCATGCCGTCTGGGAGCATAAGCTGGGCTCCCAGGTCAGCTTGGTCTCTGGTTCATCA TCCAGCTCCAAGTATGACCCTGAGATCCTGAAAGCTGAAATTGCCACTGCAAAATCCCGGGTCAACAAGCTGAAG AGAGAGATGGTTCACCTCCAGCACGAGCTGCAGTTCAAAGAGCGTGGCTTTCAGACCCTGAAGAAAATCGATAAG AAAATGTCTGATGCTCAGGGCAGCTACAAACTGGATGAAGCTCAGGCTGTCTTGAGAGAAACAAAAGCCATCAAA AAGGCTATTACCTGTGGGGAAAAGGAAAAGCAAGATCTCATTAAGAGCCTTGCCATGTTGAAGGACGGCTTCCGC ACTGACAGGGGGTCTCACTCAGACCTGTGGTCCAGCAGCAGCTCTCTGGAGAGTTCGAGTTTCCCGCTACCGAAA CAGTACCTGGATGTGAGCTCCCAGACAGACATCTCGGGAAGCTTCGGCATCAACAGCAACAATCAGTTGGCAGAG AAGGTCAGATTGCGCCTTCGATATGAAGAGGCTAAGAGAAGGATCGCCAACCTGAAGATCCAGCTGGCCAAGCTT GACAGTGAGGCCTGGCCTGGGGTGCTGGACTCAGAGAGGGACCGGCTGATCCTTATCAACGAGAAGGAGGAGCTG CTGAAGGAGATGCGCTTCATCAGCCCCCGCAAGTGGACCCAGGGGGAGGTGGAGCAGCTGGAGATGGCCCGGAAG CGGCTGGAAAAGGACCTGCAGGCAGCCCGGGACACCCAGAGCAAGGCGCTGACGGAGAGGTTAAAGTTAAACAGT AAGAGGAACCAGCTTGTGAGAGAACTGGAGGAAGCCACCCGGCAGGTGGCAACTCTGCACTCCCAGCTGAAAAGT CTCTCAAGCAGCATGCAGTCCCTGTCCTCAGGCAGCAGCCCCGGATCCCTCACGTCCAGCCGGGGCTCCCTGGTT GCATCCAGCCTGGACTCCTCCACTTCAGCCAGCTTCACTGACCTCTACTATGACCCCTTTGAGCAGCTGGACTCA GAGCTGCAGAGCAAGGTGGAGTTCCTGCTCCTGGAGGGGGCCACCGGCTTCCGGCCCTCAGGCTGCATCACCACC ATCCACGAGGATGAGGTGGCCAAGACCCAGAAGGCAGAGGGAGGTGGCCGCCTGCAGGCTCTGCGTTCCCTGTCT GGCACCCCAAAGTCCATGACCTCCCTATCCCCACGTTCCTCTCTCTCCTCCCCCTCCCCACCCTGTTCCCCTCTC ATGGCTGACCCCCTCCTGGCTGGTGATGCCTTCCTCAACTCCTTGGAGTTTGAAGACCCGGAGCTGAGTGCCACT CTTTGTGAACTGAGCCTTGGTAACAGCGCCCAGGAAAGATACCGGCTGGAGGAACCAGGAACGGAGGGCAAGCAG CTGGGCCAAGCTGTGAATACGGCCCAGGGGTGTGGCCTGAAAGTGGCCTGTGTCTCAGCCGCCGTATCGGACGAG TCAGTGGCTGGAGACAGTGGTGTGTACGAGGCTTCCGTGCAGAGACTGGGTGCTTCAGAAGCTGCTGCATTTGAC AGTGACGAATCGGAAGCAGTGGGTGCGACCCGAATTCAGATTGCCCTGAAGTATGATGAGAAGAATAAGCAATTT GCAATATTAATCATCCAGCTGAGTAACCTTTCTGCTCTGTTGCAGCAACAAGACCAGAAAGTGAATATCCGCGTG GCTGTCCTTCCTTGCTCTGAAAGCACAACCTGCCTGTTCCGGACCCGGCCTCTGGACGCCTCAGACACTCTAGTG TTCAATGAGGTGTTCTGGGTATCCATGTCCTATCCAGCCCTTCACCAGAAGACCTTAAGAGTCGATGTCTGTACC ACCGACAGGAGCCATCTGGAAGAGTGCCTGGGAGGCGCCCAGATCAGCCTGGCGGAGGTCTGCCGGTCTGGGGAG AGGTCGACTCGCTGGTACAACCTTCTCAGCTACAAATACTTGAAGAAACAGAGCAGGGAGCTCAAGCCAGTGGGA GTCATGGCCCCTGCCTCAGGGCCTGCCAGCACGGACGCTGTGTCTGCTCTGTTGGAACAGACAGCAGTGGAGCTG GAGAAGAGGCAGGAGGGCAGGAGCAGCACACAGACACTGGAAGACAGCTGGAGGTATGAGGAGACCAGTGAGAAT GAGGCAGTAGCCGAGGAAGAGGAGGAGGAGGTGGAGGAGGAGGAGGGAGAAGAGGATGTTTTCACCGAGAAAGCC TCACCTGATATGGATGGGTACCCAGCATTAAAGGTGGACAAAGAGACCAACACGGAGACCCCGGCCCCATCCCCC ACAGTGGTGCGACCTAAGGACCGGAGAGTGGGCACCCCGTCCCAGGGGCCATTTCTTCGAGGGAGCACCATCATC CGCTCTAAGACCTTCTCCCCAGGACCCCAGAGCCAGTACGTGTGCCGGCTGAATCGGAGTGATAGTGACAGCTCC ACTCTGTCCAAAAAGCCACCTTTTGTTCGAAACTCCCTGGAGCGACGCAGCGTCCGGATGAAGCGGCCGTCCCCA CCCCCACAGCCTTCCTCGGTCAAGTCGCTGCGCTCCGAGCGTCTGATCCGTACCTCGCTGGACCTGGAGTTAGAC CTGCAGGCGACAAGAACCTGGCACAGCCAATTGACCCAGGAGATCTCGGTGCTGAAGGAGCTCAAGGAGCAGCTG GAACAAGCCAAGAGCCACGGGGAGAAGGAGCTGCCACAGTGGTTGCGTGAGGACGAGCGTTTCCGCCTGCTGCTG AGGATGCTGGAGAAGCGGCAGATGGACCGAGCGGAGCACAAGGGTGAGCTTCAGACAGACAAGATGATGAGGGCA GCTGCCAAGGATGTGCACAGGCTCCGAGGCCAGAGCTGTAAGGAACCCCCAGAAGTTCAGTCTTTCAGGGAGAAG ATGGCATTTTTCACCCGGCCTCGGATGAATATCCCAGCTCTCTCTGCAGATGACGTCTAA
2.WWC2(WW and C2 domain containing 2)智人(Homo sapiens)
蛋白(protein WWC2;GenBank:NP_079225.5;SEQ ID NO:3):
MPRRAGSGQLPLPRGWEEARDYDGKVFYIDHNTRRTSWIDPRDRLTKPLSFADCVGDELPWGWEAGFDPQIGVYY IDHINKTTQIEDPRKQWRGEQEKMLKDYLSVAQDALRTQKELYHVKEQRLALALDEYVRLNDAYKEKSSSHTSLF SGSSSSTKYDPDILKAEISTTRLRVKKLKRELSQMKQELLYKEQGFETLQQIDKKMSGGQSGYELSEAKAILTEL KSIRKAISSGEKEKQDLMQSLAKLQERFHLDQNIGRSEPDLRCSPVNSHLCLSRQTLDAGSQTSISGDIGVRSRS NLAEKVRLSLQYEEAKRSMANLKIELSKLDSEAWPGALDIEKEKLMLINEKEELLKELQFVTPQKRTQDELERLE AERQRLEEELLSVRGTPSRALAERLRLEERRKELLQKLEETTKLTTYLHSQLKSLSASTLSMSSGSSLGSLASSR GSLNTSSRGSLNSLSSTELYYSSQSDQIDVDYQYKLDFLLQEKSGYIPSGPITTIHENEVVKSPSQPGQSGLCGV AAAATGHTPPLAEAPKSVASLSSRSSLSSLSPPGSPLVLEGTFPMSSSHDASLHQFTADFEDCELSSHFADISLI ENQILLDSDSGGASQSLSEDKDLNECAREPLYEGTADVEKSLPKRRVIHLLGEKTTCVSAAVSDESVAGDSGVYE AFVKQPSEMEDVTYSEEDVAIVETAQVQIGLRYNAKSSSFMVIIAQLRNLHAFLIPHTSKVYFRVAVLPSSTDVS CLFRTKVHPPTESILFNDVFRVAISQTALQQKTLRVDLCSVSKHRREECLAGTQISLADLPFSSEVFTLWYNLLP SKQMPCKKNEENEDSVFQPNQPLVDSIDLDAVSALLARTSAELLAVEQELAQEEEEESGQEEPRGPDGDWLTMLR EASDEIVAEKEAEVKLPEDSSCTEDLSSCTSVPEMNEDGNRKESNCAKDLRSQPPTRIPTLVDKETNTDEAANDN MAVRPKERSSLSSRQHPFVRSSVIVRSQTFSPGERNQYICRLNRSDSDSSTLAKKSLFVRNSTERRSLRVKRTVC QSVLRRTTQECPVRTSLDLELDLQASLTRQSRLNDELQALRDLRQKLEELKAQGETDLPPGVLEDERFQRLLKQA EKQAEQSKEEQKQGLNAEKLMRQVSKDVCRLREQSQKVPRQVQSFREKIAYFTRAKISIPSLPADDV
DNA(GenBank:CCDS34109.2;SEQ ID NO:4):
ATGCCTAGGAGGGCCGGGAGCGGTCAGCTGCCGCTGCCCCGGGGCTGGGAGGAGGCCAGGGACTACGACGGCAAG GTCTTCTACATTGACCACAACACCAGGAGGACCAGCTGGATCGACCCCCGGGACAGGTTAACGAAGCCCTTGTCA TTTGCTGATTGTGTTGGGGATGAGCTGCCGTGGGGATGGGAAGCAGGGTTTGACCCTCAGATTGGTGTCTACTAC ATCGATCACATCAACAAAACCACGCAGATAGAAGATCCAAGAAAACAATGGAGGGGGGAACAGGAGAAGATGCTC AAGGACTACCTCTCTGTGGCACAGGATGCCCTCCGGACACAGAAGGAACTGTACCATGTGAAGGAGCAGAGGCTG GCGCTGGCCCTGGATGAATACGTGCGATTAAATGATGCCTATAAGGAAAAGTCAAGTTCTCACACAAGCTTATTC TCAGGATCTTCATCCAGTACTAAATATGATCCCGATATTTTAAAAGCTGAGATCTCCACTACAAGATTAAGGGTT AAAAAGCTAAAGAGAGAGCTCTCACAGATGAAGCAGGAACTGCTCTATAAAGAACAAGGCTTTGAAACATTGCAG CAAATTGATAAAAAAATGTCTGGAGGCCAGAGCGGGTATGAACTCAGTGAAGCCAAAGCCATTCTAACAGAACTA AAATCTATCAGAAAGGCAATTAGCTCAGGAGAAAAAGAAAAACAAGATCTGATGCAGAGTCTTGCTAAGCTGCAG GAGCGGTTTCATTTGGATCAGAACATTGGCAGATCTGAGCCAGATTTGAGATGTAGTCCTGTGAACTCTCATTTA TGTCTCTCCAGACAGACCCTTGATGCTGGGTCACAAACAAGCATTTCCGGAGATATTGGAGTAAGAAGTAGATCA AATTTAGCTGAAAAGGTCAGGCTAAGCCTACAGTATGAAGAAGCCAAAAGAAGTATGGCCAACTTAAAAATTGAA CTGTCAAAATTGGACAGTGAGGCCTGGCCTGGGGCACTGGATATTGAGAAGGAAAAACTGATGCTGATTAATGAA AAAGAAGAACTTTTGAAAGAGCTTCAGTTCGTCACCCCACAGAAACGTACCCAAGATGAATTAGAACGCCTAGAA GCTGAAAGGCAGCGGCTGGAAGAAGAGTTGCTGTCTGTGAGGGGAACACCAAGCAGAGCTCTGGCCGAGAGATTG AGATTGGAAGAGAGAAGAAAAGAGCTGCTACAGAAACTTGAAGAAACTACTAAATTAACTACTTATTTGCATTCA CAACTTAAAAGCCTCTCTGCCAGCACCCTGTCCATGTCATCTGGGAGCAGCCTGGGTTCCCTGGCATCGAGTCGG GGCTCTCTGAACACCTCCAGCAGAGGGTCACTCAACTCCCTCAGTTCCACCGAACTCTATTACAGCAGTCAAAGT GATCAGATAGATGTGGATTATCAGTATAAACTGGACTTCCTTCTGCAAGAGAAAAGCGGTTACATTCCTTCTGGA CCCATCACCACCATCCATGAAAACGAGGTGGTCAAGTCCCCTAGCCAGCCTGGCCAGAGTGGACTCTGTGGAGTG GCAGCTGCAGCAACAGGCCACACTCCTCCACTGGCTGAGGCCCCGAAGTCTGTGGCCTCCCTGTCCTCGAGGTCC TCCCTTTCCTCCTTGTCTCCTCCAGGCTCTCCCTTGGTTTTGGAAGGCACGTTTCCCATGTCTTCTTCTCATGAT GCCTCTCTCCATCAGTTCACTGCTGACTTTGAAGACTGTGAGTTGAGTAGCCATTTTGCAGATATCAGCCTCATC GAAAATCAGATTTTGCTGGATTCTGATTCAGGAGGAGCCTCCCAGTCTCTTTCAGAGGATAAAGACCTTAATGAA TGTGCTAGGGAGCCATTATATGAAGGAACTGCAGATGTGGAAAAATCATTACCAAAAAGAAGAGTGATCCACTTG CTTGGGGAGAAAACCACTTGTGTGTCGGCTGCTGTGTCTGATGAGTCTGTGGCTGGAGACAGTGGGGTCTATGAA GCTTTCGTGAAACAACCTAGTGAAATGGAAGATGTCACATACAGTGAAGAGGATGTAGCCATTGTAGAGACCGCC CAGGTTCAGATAGGACTCAGATACAATGCAAAAAGTTCAAGTTTCATGGTGATTATAGCACAGCTCCGAAACCTT CATGCCTTCTTGATACCTCATACTTCAAAAGTATATTTTAGGGTTGCCGTTCTTCCTTCCTCAACTGATGTCAGC TGTCTGTTTCGCACAAAAGTTCATCCGCCCACAGAATCCATTTTATTCAATGATGTGTTCAGAGTCGCCATTTCC CAAACAGCCTTACAACAGAAGACACTGAGGGTAGACCTTTGCTCTGTCAGTAAACACCGAAGGGAAGAATGCCTG GCTGGAACTCAGATCAGCCTGGCAGATTTACCATTTTCCAGTGAGGTTTTCACTCTATGGTATAACTTGCTTCCT TCCAAGCAAATGCCTTGCAAAAAGAATGAAGAAAATGAGGACTCTGTATTTCAACCAAACCAGCCGTTAGTAGAT TCTATAGACTTGGATGCAGTGTCAGCCTTACTTGCAAGAACATCAGCTGAGTTGTTAGCTGTGGAACAAGAATTA GCACAAGAAGAAGAAGAAGAATCAGGACAAGAAGAGCCAAGGGGCCCAGATGGAGACTGGCTAACAATGCTAAGA GAGGCCTCTGATGAAATTGTGGCTGAAAAAGAGGCTGAAGTTAAATTGCCAGAGGACAGTAGCTGTACAGAAGAT TTAAGTTCATGCACTAGTGTGCCTGAGATGAATGAAGACGGGAACAGGAAAGAAAGCAACTGTGCCAAAGACCTC AGAAGTCAGCCACCTACTAGAATACCAACACTGGTTGACAAAGAGACAAACACTGATGAAGCCGCTAATGACAAT ATGGCAGTTCGCCCCAAAGAGCGCAGCAGCCTGAGCTCTAGACAGCATCCGTTTGTGAGGAGCAGTGTGATAGTG CGCTCACAGACCTTTTCTCCAGGAGAGCGGAACCAGTACATCTGCAGGTTAAATCGGAGTGACAGTGACAGTTCA ACCCTGGCTAAAAAATCACTGTTTGTGAGAAACTCCACCGAACGCCGCAGTTTGAGGGTCAAAAGGACGGTTTGC CAGTCAGTCCTTAGAAGAACAACACAGGAATGCCCAGTGCGGACATCTCTAGACTTAGAACTGGACCTTCAGGCA TCTCTGACCCGGCAGAGCCGCCTCAATGATGAGCTGCAGGCGCTGAGGGACTTGCGGCAGAAGCTGGAGGAACTG AAAGCTCAGGGAGAGACTGACCTTCCACCAGGCGTGCTGGAGGATGAGAGGTTCCAGAGGCTTCTGAAGCAAGCT GAGAAGCAGGCTGAACAGTCCAAAGAAGAGCAGAAGCAAGGTCTGAATGCAGAGAAGTTGATGAGGCAAGTCTCC AAGGACGTGTGTCGGCTCCGGGAGCAGAGCCAGAAGGTGCCTCGGCAGGTGCAGTCCTTCAGGGAGAAGATTGCC TACTTCACCAGAGCAAAGATAAGCATCCCATCCCTGCCAGCTGATGATGTGTGA
3.WWC3(WWC family member 3)智人(Homo sapiens)
蛋白(protein WWC3;Uniprot:T2C6S4-1;SEQ ID NO:5):
MPWLSGGRRRRRGQPREAPREPPPSAQPQREPPPPAPPAAVPTPPAPSAPPPRARESAELPLPAGWEEARDYDGR VFYIDHNTRQTSWIDPRDRITKPLTFADCVGDELPLGWETVYDKQIGVYYMDHINKLTQIEDPREQWRREQERML KEYLIVAQEALNAKKEIYQIKQQRFELAQEEYQQLHKMCEDDSRSYASSFSGYSTNTKYDPHQIKAEIASRRDRL SRLKRELTQMKQELQYKEKGVETLQEIDRKMSSTHTSYKLDEAQAIMSELRTIKKAICTGEKERRDLMHSLAKLT DSFKNSCSVTDSLVDFPHHVGVPGDAGVPQQFCDAGSQTDIIGEFVFDDKTRLVDRVRLNWQYEEARKRVANIQQ QLARLDNESWPSTAEADRDRLQLIKEKEALLQELQLIIAQRRSAGDVARLEEERERLEEELRRARATSAQGATER ILLQEKRNCLLMQLEEATRLTSYLQSQLKSLCASTLTVSSGSSRGSLASSRGSLASSRGSLSSVSFTDIYGLPQY EKPDAEGSQLLRFDLIPFDSLGRDAPFSEPPGPSGFHKQRRSLDTPQSLASLSSRSSLSSLSPPSSPLDTPFLPA SRDSPLAQLADSCEGPGLGALDRLRAHASAMGDEDLPGMAALQPHGVPGDGEGPHERGPPPASAPVGGTVTLRED SAKRLERRARRISACLSDYSLASDSGVFEPLTKRNEDAEEPAYGDTASNGDPQIHVGLLRDSGSECLLVHVLQLK NPAGLAVKEDCKVHIRVYLPPLDSGTPNTYCSKALEFQVPLVFNEVFRIPVHSSALTLKSLQLYVCSVTPQLQEE LLGIAQINLADYDSLSEMQLRWHSVQVFTSSEPSRTREAGCAGESSARDPAHTISISGKTDAVTVLLARTTAQLQ AVERELAEERAKLEYTEEEVLEMERKEEQAEAISERSWQADSVDSGCSNCTQTSPPYPEPCCMGIDSILGHPFAA QAGPYSPEKFQPSPLKVDKETNTEDLFLEEAASLVKERPSRRARGSPFVRSGTIVRSQTFSPGARSQYVCRLYRS DSDSSTLPRKSPFVRNTLERRTLRYKQSCRSSLAELMARTSLDLELDLQASRTRQRQLNEELCALRELRQRLEDA QLRGQTDLPPWVLRDERLRGLLREAERQTRQTKLDYRHEQAAEKMLKKASKEIYQLRGQSHKEPIQVQTFREKIA FFTRPRINIPPLPADDV
DNA(GenBank:KC987947.1,编码序列;SEQ ID NO:6):
ATGCCTTGGCTGAGCGGCGGCCGGCGGCGACGGCGGGGACAGCCGCGCGAGGCCCCGCGGGAGCCGCCGCCGTCC GCGCAGCCCCAGCGGGAACCGCCGCCGCCGGCGCCCCCCGCCGCGGTCCCCACGCCCCCAGCTCCTTCCGCGCCG CCGCCGCGGGCCCGGGAGAGCGCCGAGCTGCCGCTGCCCGCCGGCTGGGAGGAGGCGCGAGACTACGACGGTCGC GTCTTTTACATTGACCACAACACGCGCCAGACGTCGTGGATCGACCCCCGCGACCGGATAACAAAGCCATTGACC TTTGCCGATTGTGTTGGGGACGAACTTCCTTTAGGATGGGAAACCGTATATGATAAACAAATTGGAGTTTATTAC ATGGACCACATAAATAAACTTACCCAGATTGAGGATCCAAGAGAACAGTGGAGGCGAGAGCAAGAGCGCATGTTG AAGGAATATTTAATTGTAGCTCAGGAGGCTCTCAATGCCAAGAAAGAAATCTACCAGATTAAGCAGCAGCGGTTC GAGCTGGCCCAGGAGGAATACCAGCAGCTGCACAAAATGTGTGAGGATGACAGCCGCTCGTACGCCAGCTCATTC TCTGGATATTCAACAAATACAAAGTATGACCCACACCAAATTAAAGCAGAAATAGCAAGTCGTCGGGATAGGCTT TCCAGATTAAAACGAGAGCTGACCCAGATGAAGCAGGAACTGCAGTACAAAGAAAAGGGGGTGGAGACCCTGCAA GAGATTGATCGGAAGATGTCAAGTACTCACACCAGCTACAAACTGGATGAGGCGCAGGCTATCATGAGTGAGCTC CGGACCATCAAGAAGGCCATTTGCACAGGCGAGAAGGAGAGGCGGGACCTGATGCATAGCCTGGCCAAGCTGACC GATAGCTTCAAGAACAGCTGCTCCGTTACCGACTCTCTAGTGGACTTCCCTCACCATGTAGGCGTGCCTGGCGAT GCTGGTGTACCCCAGCAGTTCTGCGATGCCGGCTCCCAGACTGATATCATCGGGGAGTTTGTCTTTGATGATAAA ACAAGACTTGTAGACCGAGTCAGACTTAATTGGCAATATGAAGAAGCCAGAAAGAGAGTCGCCAACATCCAGCAG CAGCTGGCCCGGCTTGACAATGAGTCCTGGCCAAGCACGGCCGAGGCTGACAGGGACCGGCTGCAGCTCATCAAG GAGAAGGAGGCCCTGCTGCAGGAGCTTCAGCTCATCATTGCACAGCGCCGCTCTGCGGGAGATGTGGCCCGGCTG GAGGAGGAGCGGGAGCGCCTAGAGGAGGAGCTGCGGCGTGCACGGGCCACCTCCGCACAGGGCGCCACGGAGAGG ATTCTGCTTCAGGAAAAAAGGAATTGTCTACTTATGCAGCTGGAAGAAGCCACCCGCTTAACATCCTACCTCCAG TCCCAGTTAAAAAGCCTGTGTGCCAGCACCCTGACGGTGTCCTCGGGGAGCAGCCGCGGGTCCCTAGCCTCCAGC CGTGGGTCTCTGGCCTCCAGCCGGGGCTCCCTGAGCTCGGTCAGCTTCACGGACATCTACGGCCTCCCGCAGTAC GAGAAGCCCGACGCTGAGGGCAGCCAGCTTCTACGCTTCGACCTCATTCCCTTCGACTCTCTGGGGCGAGATGCT CCCTTTTCAGAGCCCCCAGGCCCCTCGGGCTTCCACAAGCAGAGGCGGTCCCTGGACACGCCCCAGTCCCTGGCA TCGCTGTCCTCCCGCTCCTCGCTGTCCTCGCTGTCGCCCCCAAGCTCGCCCCTGGACACGCCCTTCCTCCCTGCC TCACGGGACTCGCCGCTGGCGCAGCTGGCGGACAGCTGTGAGGGGCCAGGCCTGGGCGCCCTAGACAGACTGCGG GCACACGCCTCGGCTATGGGGGACGAAGACTTACCAGGCATGGCGGCCCTTCAGCCACACGGGGTCCCCGGGGAT GGGGAAGGGCCGCACGAGCGAGGACCCCCACCAGCCAGCGCTCCCGTGGGTGGAACAGTGACTCTTCGAGAAGAC AGTGCCAAGAGGTTGGAGAGGAGGGCACGCCGCATCTCCGCATGTCTGTCGGATTATTCGCTAGCCAGCGACAGT GGGGTGTTTGAACCTCTAACCAAAAGGAACGAAGATGCCGAGGAGCCTGCCTACGGAGACACGGCCAGTAACGGA GATCCCCAGATCCACGTGGGACTCCTGCGCGACAGTGGCAGCGAGTGTCTCCTCGTGCACGTGCTGCAGCTGAAG AACCCGGCGGGGCTGGCGGTGAAGGAAGACTGCAAAGTCCACATCCGAGTCTATTTGCCCCCACTGGACTCGGGC ACGCCCAACACTTACTGCTCCAAGGCTCTGGAGTTCCAAGTGCCGCTGGTGTTTAACGAAGTGTTCAGAATCCCC GTGCATTCCAGCGCGTTGACACTGAAGTCACTTCAGTTATACGTGTGTTCAGTGACTCCGCAGCTGCAGGAAGAA CTGCTGGGCATTGCTCAGATTAACCTGGCTGACTATGACAGTTTGAGTGAGATGCAGCTGCGCTGGCATTCCGTG CAGGTGTTCACCAGCTCTGAACCATCAAGGACGCGGGAGGCTGGGTGTGCAGGAGAGAGCTCCGCCCGGGACCCT GCACACACCATCTCCATCTCCGGCAAGACGGATGCGGTGACGGTGCTCCTGGCCAGAACCACGGCACAGCTGCAG GCGGTGGAGAGGGAACTGGCCGAGGAGCGGGCCAAGCTGGAGTACACGGAGGAGGAGGTCCTGGAGATGGAGCGC AAGGAGGAGCAGGCCGAGGCCATATCCGAGCGGAGTTGGCAAGCGGACTCGGTGGATAGCGGCTGTAGCAACTGC ACCCAGACCAGCCCTCCGTACCCAGAGCCCTGTTGCATGGGTATCGACTCCATCCTGGGCCACCCATTTGCTGCT CAGGCAGGGCCTTACAGCCCCGAGAAATTTCAGCCCTCGCCTCTTAAGGTTGATAAGGAAACCAACACGGAAGAT CTCTTTCTGGAAGAAGCAGCCAGCCTCGTGAAGGAGCGGCCCAGCCGCCGGGCCCGAGGGTCGCCTTTTGTTCGG AGTGGCACGATTGTCCGTTCCCAGACATTCTCGCCTGGAGCACGAAGCCAGTATGTTTGCAGACTTTATCGTAGT GACAGCGACAGTTCAACGCTGCCCCGGAAGTCCCCCTTTGTCCGAAATACTTTGGAAAGACGAACCCTTCGCTAT AAGCAGTCATGCAGGTCTTCCCTGGCTGAGCTCATGGCCCGCACCTCCCTGGACTTGGAGCTGGATCTCCAGGCG TCGAGAACACGGCAGAGGCAGCTGAATGAGGAGCTCTGCGCCCTCCGTGAGCTGCGGCAGCGGTTGGAGGACGCC CAGCTCCGTGGCCAGACTGACCTCCCACCCTGGGTGCTTCGGGACGAGCGGCTCCGTGGCCTGCTGCGGGAGGCC GAGCGGCAGACAAGACAGACCAAACTTGACTACCGTCATGAGCAGGCGGCTGAGAAGATGCTGAAGAAGGCCTCC AAGGAGATCTACCAGCTGCGTGGGCAGAGCCACAAAGAGCCCATCCAAGTGCAGACCTTTAGGGAGAAGATAGCA TTCTTCACAAGGCCAAGGATCAACATACCTCCTCTCCCAGCCGACGACGTCTGA
4.WWC1乌干达红疣猴(Piliocolobus tephrosceles)
蛋白(protein KIBRA isoform X3;GenBank:XP_023074665.1;SEQ ID NO:7):
MPRPELPLPEGWEEARDFDGKVYYIDHTNRTTSWIDPRDRYTKPLTFADCISDELPLGWEEAYDPQVGDYFIDHN TKTTQIEDPRVQWRQEQEHMLKDYLVVAQEALSAQKEIYQVKQQRLELAQQEYQQLHAVWEHKLGSQVSLVSGSS SSSKYDPEILKAEIATAKSRVNKLKREMVHLQHELQFKERGFQTLKKIDKKMSDAQGSYKLDEAQAVLRETKAIK KAITCGEKEKQDLIKSLAMLKDGFHTDRGSHSDLWSSSSSLESSSFPLPKQYLDVSSQTDISGSFSINSNNQLAE KVRLRLRYEEAKRRIANLKIQLAKLDSEAWPGVLDSERDRLILINEKEELLKEMRFISPRKWTQGEVEQLEMARK RLEKDLQAARDTQSKALTERLKLNSKRNQLVRELEEATRQVATLHSQLKSLSSSMQSLSSGSSPGSLTSSRGSLV ASSLDSSTSASFTDLYYDPFEQLDSELQSKVEFLLLEGATGFRPSGCITTIHEDEVAKTQKAEGGGRLQALRSLS GTPKSMTSLSPRSSLSSPSPPCSPLMADPLLAGDAFLNSLEFEDPELSATLCELSLGNSTQERYRLEEPGTEGKQ LGQAVNTAQGCGLKVACVSAAVSDESVAGDSGVYEASVQRLGASEAAAFDSDESEALGAARVQIALKYDEKNKQF AILIIQLSNLSALLQQQDQKVNIRVAVLPCSESTTCLFRTRPLDASDTLVFNEVFWVSMSYPALHQKTLRVDVCT TDRSHLEECLGGAQISLAEVCRSGERSTRWYNLLSYKYLKKQSRELKPVGVTAPAPGPASTDAVSALLEQTAVEL EKRQEGRSSTQTLEDSWRYEETSENEAVAEEEEEEVEEEEEEEDVFTEKASPDMDGYPALKVDKETNTETPAPSP TVVRPKDRRVGTPSPGPFLRGSTIIRSKTFSPGPQSQYVCRLNRSDSDSSTLSKKPPFVRNSLERRSVRMKRPSS VKSLRSERLIRTSLDLELDLQATRTWHSQLTQEISVLKELKEQLEQAKSHGEKELPQWLREDERFRLLLRMLEKR QMDQAEHKGELQTDKMMRAAAKDVHRLRGQSCKEPPEVQSFREKMAFFTRPRMNIPALSADDV
5.WWC1马(Equus caballus)
蛋白(protein KIBRA;GenBank:XP_001500247.3;SEQ ID NO:8):
MPRPELPLPEGWEEARDFDGKVYYIDHTSRTTSWIDPRDRYTKPLTFADCIRDELPLGWEEAYDPQVGDYFIDHN TKTTQIEDPRVQWRREQEHMLKDYLVVAQEALSAQKEIYQVKQQRLELAQQEYQQLHAVWEHKLGSQVSLISGSS SSSKYDPEILKAEIATAKSRVNKLKREMVHLQQELQFKERGFQTLKTIDKKMSDAQGSYKLDEAQAVLRETKAIK KAITCGEKEKQDLIKSLAMLKDGFRTDRGSHSDLWSSSSSLESSSFPLSKQYLDVSSQTDISGGCGTSSNNQLAE KVRLRLRYEEAKRRIANLKIQLAKLDSEAWPGVLDSERDRLILINEKEELLKEMRFISPRKWTQGEVEQLEMARK RLEKDLQAARDTQSKALTERLKFNSKRNQLVRELEEATRQLAALHSQLKSLSSSMQSLSSGSSPGSLTSSRGSLA ASSLDSSTSASFTDLYYDPFEQLDSELQSKVEFLLLEGATGFRPSGCITTIHEDEVAKTQKAEGGSRLQALRSLS GTPKSMTSLSPRSSLSSPSPPCSPLIADPLLAGDAFLSALEFEDPELSATLCGLSLGSSTRERCRLEEPGTEGKQ PGQAVNSAPGCTLKVACVSAAVSDESVAGDSGVYEASVQRLGASEAAAFDSDESEAVGATRVQIALKYDEKNKQF AILIIQLSNLSALLLQQDQKVNIRVAILPCSESTTCLFRTRPLDASDALVFNEVFWVSMSYPALHQKTLRVDVCT TDRSHLEECLGGAQISLAEVCRSGERSTRWYNLLSYKYLKKQSREPKPVGATAATPGPESTDAVSALLEQTAVEL EKRQEGRSSTQTLEDSWRYEEEASENEAAAEEEDGEEEEEGEEDVFAEKASPDMDECPASKVDKETNTETPTPSP TVVRPKDRRVGTPSSGPFLRGSTIIRSKTFSPGPQSQYVCRLNRSDSDSSTLSKKPPFVRNSLERRSVRMKRPSS VKSVRAERLMRTSLDLELDLQATRTWHSQLTQEISVLKEFKEQLEQAKSHGEKELPQWLREDERFRLLLRMLEKR MDRAEHKGELQTDKMMRAAAKDVHRLRGQSCKEPPEVQSFREKMAFFTRPRMNVPALSADDV
6.Wwc1小鼠(Mus musculus)
蛋白(protein KIBRA;GenBank:NP_740749.1;SEQ ID NO:9):
MPRPELPLPEGWEEARDFDGKVYYIDHRNRTTSWIDPRDRYTKPLTFADCISDELPLGWEEAYDPQVGDYFIDHN TKTTQIEDPRVQWRREQEHMLKDYLVVAQEALSAQKEIYQVKQQRLELAQQEYQQLHAVWEHKLGSQVSLVSGSS SSSKYDPEILKAEIATAKSRVNKLKREMVHLQHELQFKERGFQTLKKIDERMSDAQGGYKLDEAQAVLRETKAIK KAITCGEKEKQDLIKSLAMLKDGFRTDRGSHSDLWSSSSSLESSSFPMPKQFLDVSSQTDISGSFSTSSNNQLAE KVRLRLRYEEAKRRIANLKIQLAKLDSEAWPGVLDSERDRLILINEKEELLKEMRFISPRKWTQGEVEQLEMARR RLEKDLQAARDTQSKALTERLKLNSKRNQLVRELEEATRQVATLHSQLKSLSSSMQSLSSGSSPGSLTSSRGSLA ASSLDSSTSASFTDLYYDPFEQLDSELQSKVELLFLEGATGFRPSGCITTIHEDEVAKTQKAEGGSRLQALRSLS GTPRSMTSLSPRSSLSSPSPPCSPLITDPLLTGDAFLAPLEFEDTELSTTLCELNLGGSGTQERYRLEEPGPEGK PLGQAASVAPGCGLKVACVSAAVSDESVAGDSGVYEASAQRPGTSEAAAFDSDESEAVGATRVQIALKYDEKNKQ FAILIIQLSHLSALSLQQDQKVNIRVAILPCSESSTCLFRTRPLDSANTLVFNEAFWVSISYPALHQKTLRVDVC TTDRSHTEECLGGAQISLAEVCRSGERSTRWYNLLSYKYLKKQCREPQPTEAPGPDHVDAVSALLEQTAVELEKR QEGRSSSQTLEGSWTYEEEASENEAVAEEEEEGEEDVFTEKVSPEAEECPALKVDRETNTDSVAPSPTVVRPKDR RVGAPSTGPFLRGNTIIRSKTFSPGPQSQYVCRLNRSDSDSSTLSKKPPFVRNSLERRSVRMKRPSSVKSLRTER LIRTSLDLELDLQATRTWHSQLTQEISVLKELKEHLEQAKNHGEKELPQWLREDERFRLLLRMLEKKVDRGEHKS ELQADKMMRAAAKDVHRLRGQSCKEPPEVQSFREKMAFFTRPRMNIPALSADDV
7.WWC1原鸡(Gallus gallus)
蛋白(protein KIBRA;GenBank:NP_001264079.1;SEQ ID NO:10):
MPRKELPLPAGWEEARDYDGKVYYIDHGSRTTSWIDPRDRYTKPLTFADCISDELPLGWEEAYDPQVGVYYIDHN TKTTQIEDPRVQWRREQEHMLKDYLVLAQEAIAAQKEIYQVKQQRLELAQQEYRQLHDVWEHKLGSQTSLLSGSS SSSKYDPEILKAEIATTKSRVNKLKREVAHMKQEIQYKEHGFQTLKNIDMKMSDTQGGYKLDEAQAILSEMKALK KAITSGEKEKQDLIQSLARLKDSFVNDRGSQSDLWASSVSLESSSPSLPRQYLDVSSQTDVSGNFITSSNNQLAE KVRLRLRYEEAKRRIGNLKIQLAKLDSEAWPGVLDSERDRLILINEKEELLKEMRFISPRKWTRGEVERLETERK RLEEDLQAARDTQSKALTERLKLNSKRNQLVRELEETTRLVAMLHTQLKSLSASMLSLSSSSSPGSLASSRGSLA TSSQDSSTSASFTDLYCEHMEQLEQLEQLDSDYQNKLDLLLEGATGFRPSGCITTIHENEVAKTHKTDATSRIQA LRSLSGTPKSMTSLSPRSSLSSPSPPCSPLVIDPLLGGDAFSSHMDFDDTEISTNLSELTLNIESGNCRLEEPRA GDKHLDQGVNTAGGTALKVACVSAAVSDESVAGDSGVYEASVQRPCASEVMVFDSDDTEAAGTAKVQIAMRYDEK NKQFAILVIQLSNVQALLLQQDQKVNIRVAVLPCLESTSCLFRTRPLEVSDNLMYNEVFWVSISYPALRQKTLRV DVCTVDKSRLEECLGGAQISLAEICRSGEKSTRWYNLLSSKYLQKQNRKSKQGTIHSEIACTDKTDSVSALLEQT AVELEAVEKKLEESRTTLTSGESWRDEEVAEQEELDEISENEAEEEEEFCAGKLLWETEESLNSHPHVEMAVKVD KETNTESLAQSSAVVRPKDKRAANPPQTQFVRGSTIIRSKTFSPGPQSQYVCRLNRSDSDSSTLSKKTPFVRNAM ERRSVRVKRPSIKSAGTERLIRTSLDLELDLQASKTWHDRLVQEISVLRELKEQLEQAQSQGEKELPQWVKDDER FRLLLRLVEKRVEKTEHRCELKADKMMRAAAKDVHRLRGQSRKEPLEVQSFREKMAFFTRPRINIPTLSADDV
8.wwc1.S非洲爪蟾(Xenopus laevis)
蛋白(protein KIBRA;GenBank:XP_018111691.1;SEQ ID NO:11):
MIRKELPLPDGWEEAHDVDGKVYYIDHASKTTSWIDPRDRFTKPLTFADCIGDELPLGWEECYDPQVGVYYIDHN SQTTQIEDPRVQWRREQERMLKDYLVLAQEALLAQKEIYQVKQQRLELAQKEYRTLNDVWKHKVGSQTSLVSGSS SSSKYDPDILKAEIATTKSRVKKLKRETVFLRQELQYKENGYQTLKEIDLKMSGNHCAYKLDEAQAILNEMKAIK KAITSGEREKQDLIQSLAELKNGFLIDKGSQSDLWASDTSLASSANSLPRHYLNVSSQTDISGHLSVVSNNHLAE KVRLQLRYEEAKRRIANIKIQLSKIDTDAWPGVLDSERDRLILISEKEELLKEMRFISPRKWSQSEVERLESEKN RLEEDLQAVRDTQSKALTERLKMSSKRNQLVKELEETTRLIASLQAQLKCLSTSMQSLSSGSSPGSLASSRGSLA TSSQDSSTSTSVSDLYYEQLDHFDSVYQNKVDFFIQEGAIGYRPSGCITTIHENEVVRPRKPDPANRVQALRSLS GTPKSMTSLSPRSSLSSPSPPCSPLVTDPLLTVDAFLSQIDFEDIDLPLSFTERDVNAGRDGYQHQTDGKPSGQG LNCLGESSLNVARVSAAVSDESVTGDSGVYEATNQRTLIENAVFDGEDSETMDTAKIKIRMKYDEKNKQFVVFVI QLDNSAALLLDQDEKLYIRVAVLPCSESTSCLFRTRALEQSDTLLYNEMFLVATSHTDLRQKTLRVDVCTRQNNH HEECLGGSQISLADVCHSEGQEAHWYNLLSYRYLKRQSKISKQKMSSSEESGIGNPESVSALLKQTAAELEAVRK QIGESTEAPEYNWPEKKDNVPDQDGFGENEGEEEFDEEVQCETEESDKQAATDSDFVKVDKETNTEGLALPSSSV RPKDKRAANPMQAPFIRGSTIIRSKTFSPGPQSQYICRLNRSDSDSSTLSKKPPFVRSAVERRSVRVKRPPVKSS GSERLIRTSLDLELDLQASRMWNHQLTQEISVLRELKEQLEQAKRLGENELPQRVKDDDTFKLLLRQVEKQVHKI EQKYEMQADKMMRAAAKDVHRLRGQSSKEPLEVQSFREKMAFFTRPRMNLPTLTADDV
9.wwc1斑马鱼(Danio rerio)
蛋白(protein KIBRA;GenBank:XP_689275.5;SEQ ID NO:12):
MPRKELPLPEGWEEARDFDGKVYYIDHINQTTSWIDPRDRQTKPLTFADCIGDELPVGWEEAYDPHVGAYYVDHN TKSTQLEDPRAQWQREQELMLHDYLNVVQEALSAQKEIYQVKEQRLRLAQQEYRQLNDAWRDKSSSQTSLNSRSS SSSKYDPEILKAEIVTAKSRVNKLKRDLAYMKQELHYKEQGFETLKEIDHKVSSASHGYKLHEAQAILKEVKSIK DAISSGEKEKQELMRKLAVLKDGFQLDYGSQSDLWASNPSLANSNLSLPRLYSDAESQTDIPAQFVSSSNKLAEK VRLSLKYEEAKRRIANIEVQIAKLDSEAWPGLLDPERDRLILINEKEELLKELQYVRPCKRAPNEAEKIESEKKR LEKDLQAARDNQSKALTERLRLHYRRNKLVKELEETVRVASSLHTQLKSLSASTLSCSSGSSRGSLTSSRGSLAN SSLGSTSSLSFTDVYLEQPELGDPDFQNKLDSILQEGSTSGYRPSSSITTIHENEVSSSSVQIGGGPGVGQRTQV LRLSETPHSMNSLSPRSSLSSLSPPCSPLVTEASFLSGEVFSGPASQLDLDLQTRLMELRLEEDQQQGQLNYQDN KQESIMAVESSKDAVTQTRGSGPGSKKAGVTSAVSDESVAGDSGVYEPSEKRPGLPVEQLLAFDDGSSASSAQIK LGLKYEVKEKRFTVFVMQLSNYSALSLPANQNIYVRVVVLPCSETVRCLFRTHCALPQEPVELKEAFSLQVSSTA LRQKTLRIDVCTTSKSGREHCLAGAQISLADEEYSEEWCTKWYNLLNCTYMPEMDGKQKETEMPALQELTPASSE NAASCMENVPLEDWPAETLEGDVFVDEEGSDGEEGEEFYPDDCQWEQEEEPLKAGPTTVIAEKVNKETSMDGLPH STSVVRPKERRHDVHQQNPFMRGNTIIRSKTFSPGPQSQYICRINRSDSDSSTLSKKSPFVRNASERRSVRMKKP PMQVKGLDGLLRTSLDLELDLQVTRTRHSRLTEELRVLRELKEQMEKARQQGQHVLPTWVQEDERFCLLLKHAER QTQEEQLQEKRVEKMMRAAAKDVHKIRGQSLKEVPGVQSFREKMAFFTRAKINVPDLPADDV
10.Kibra(kbr)黑腹果蝇(Drosophila melanogaster)
蛋白(protein Kibra isoform A;GenBank:NP_001034055.1;SEQ ID NO:13)
MPNLQQTASQSQHHLHPHHLRPQQQQQQHHHHHQQQQQQQHTHHQQQQQHHSDFPLPDGWDIAKDFDGKTYYIDH INKKTTWLDPRDCYTKPQTFEDCVGDELPMGWEESYDPNIGPYYINHLAQSTQLEDPRQEWKTVQEQMLSDYLSA AQDQLENKREMFDVKQQRLLWAQEEYNHLKLAASRSSLCSSSSSMSRHDPELLRADLMLARERVHQLKQELTHIT NDISYTERGMNTLYSVGEKINARENGCYDIAEVHAIREEMLKVHKSLVSGEKVREELMRSLVQIKNELGRQQISE ENSDLASPFDRVCVASQTDLCGSSGENLNGGARFAEMAKTKWQYAEWRKHIKKLQQQLADHVERIEPGQLESDKD RILLIQEKEKLLNDLNSISLKSRSEEEKRVIHQTRHKLEEDLKEAYEANNTCVANRLRFHEEKQLLLDKLQEALK STKLLEERLKSFSSESTFSISSGSSLGSLSTASSKSALSFTDIYIDPFAVDSPIDVVDLRRRSQRLFQQHQQQRL HPVHPVLQQQQSAEVTLSPRSSLSMETPPASPMKYNAGADQTPQALKEEPTYANALPAPPAYTAPPPVPISGVRA RPYDLDSTVLDCMMLEAKLQKLNMGTPLNLAVAPLSPISEKPSLLDLPQEMLSRSSSTSNTRSVSAAVSNESVAG DSGVFEASRAHLPRKELAQVQIGLKYLKQEGVLVVSLERANNLLALWTASADNSQVYLRAALLPNSLTSIRTKAL GDFQKPVFNDTFAVPITLDKLLTKSLQVTVVTMTGQKEEIIGTVQISMAEFNPEDSTLKWYNVLSSKFIPSFESL DIPSTSAAAAAAAVAASNAPNPGNNREESSDESTITSSQTSTLTRNQAPCMELQEQMAAELLGLGPLNEPECSDD DDDDEEEELDDKQLVSDVGLMNSSSMLHAYLQNMKQEFADKETNTDRAYLPEKSRGQSQLMDDRPVKRSQTFTPS EAFSKNRYNCRLNRSDSDSAMHCGVAPHTFQRGAAERRSLRFHSKAPKSVTKLHHTHIPRTSLDLELDLQAQHSK LYFLNDQIAKLQNLKEVLQKACENKDPLVAAWAIENEEFQRLVARADPAKCPEERQLQKLLMKTAKEIHKLRKTK VPKGCPDLVSFKEKITFFTRKGLSVPELPSEFTLPEANPIEEEEEEEDENEFYNSAETAIAINTALVASSNRNKN LSEHPHRATSGAVPKIPAPVVTPAATPAATPAATPAATSAATPAATPVVSPAAQPDAKPADAPIPVASNDAEQQR FDYVVDRNYGVEV
11.WWC2乌干达红疣猴(Piliocolobus tephrosceles)
蛋白(protein WWC2;GenBank:XP_023076792.1;SEQ ID NO:14)
MPRRAGSGQLPLPRGWEEARDYDGKVFYIDHNTRRTSWIDPRDRLTKPLSFADCVGDELPWGWEAGFDPQIGVYY IDHINKTTQIEDPRKQWRGEQEKMLKDYLSVAQDALRTQKELYHVKEQRLALALDEYVRLNDAYKEKSSSRTSLF SGSSSSTKYDPDILKAEISTTRLRVKKLKRELSQMKQELLYKEQGFETLQQIDKKMSGGQSGYELSEAKAILTEL KSIRKAISSGEKEKQDLMQSLAKLQERFHLDQNIGRSEPDLRSSPVNSHLSLSRQTLDAGSQTSISGDIGVRSRS NLAEKVRLSLQYEEAKRSMANLKIELSKLDSEAWPGALDIEKEKLMLINEKEELLKELQFVTPQKRTQDELECLE AERQRLEEELLSVRGAPSRALAERLRLEERRKELLQKLEETTKLTTYLHSQLKSLSASTLSMSSGSSLGSLASSR GSLNTSSRGSLNSLSSTELYYSSQSDQIDVDYQYKLDFLLQEKSGYIPSGPITTIHENEVVKSPSQPGQSGLCGV AVAATGHSPPLAEAPKSVASLSSRSSLSSLSPPGSPLVLEGTFPLSSHDASLHQFSADFEDCELSSHFADISLVE NQILLDSDSGGASQSLSEDKDLNECAGEPLYEGTADVEKSLPKRRVIHLLGEKTTCVSAAVSDESVAGDSGVYEA FVKQPSEIEDVTYSEEDIAIVETAQVQIGLRYNAKSSSFMVIIAQLRNLHAFLIPHTSKVYFRVAVLPSSTDVSC LFRTKVHPPTESILFNDVFRVAISQTALQQKTLRVDLCSVSRHRREECLAGTQISLADLPFSSEVFTLWYNLLPS KQMPCKKNEENEDCVFQPNQPLGDTIDLDAVSALLARTSAELLAVEQELAQEEEEEESRQEEQRGPDGDWLTMLR EASNEIVAKKEAEVKLPEDSNCTEDLNSCTSVPEMNEDGNRKENNCAKDLRSQPPTGTPTLVDKETNTDEAANDN MTVRPKERSSLSSRQHPFVRSSVIVRSQTFSPGERSQYICRLNRSDSDSSTLAKKSLFVRNSTERRSLRVKRTVC QSVLRRTAQECPVRTSLDLELDLQASLTRQSRLNDELQALRDLRQKLEELKAQGETDLPPGMLEDERFQKLLKQA EKQAEQSKEEQKQGLNAEKLMRQVSKDVCRLREQSQKVPRQVQSFREKIAYFTRAKISIPSLPADDV
12.WWC2牛(Bos taurus)
蛋白(protein WWC2 isoform X1;GenBank:XP_024842231.1;SEQ ID NO:15)
MPRRAGSGQLPLPRGWEEARDYDGKVFYIDHNTRRTSWIDPRDRLTKPLSFADCVGDELPWGWEAGFDPQIGVYY IDHINKTTQIEDPRKQWRREQEKMLKDYLSVAQDALQTQQELYHVKEQRLALALDEYVRLNDAYKEKSSSRTSLF SGSSSSTKYDPEILKAEISTTRLRVKNLKRELSQMKQELLYKEQGFATLKQIDKKMSGGQSGYELSEAKAILMEL KSIRKAISSGEKEKQDLMQSLAKLQGRFHVDQSIGTSEPDLRSSPVSSRLSLSRQTLDVGSQTSISGDIGVRSRS NLAEKVRLSLQYEEAKRSMANLKIELSKLDSEAWPGTLDVEKEKLMLIHEKEELLKELQFVTPQRRTQDELESLE AERQRLEAELLAVRGVPSQALAERLKLEEQRKALLQKLEETTKLTTCLHSQLKNLSASTLSVSSGSSLGSLASSR GSLNTSSRGSLNSLSSSELYYTSQGDQLDADYQYKLDFLLQEKGGYMPSGPITTIHEHEVAKSPSQPGQSGSGGA AAAAAAPGHPAPLAEPPKSVTSLSSRSSLSSLSPPGSPLVLEGAFPMSTHGSPLHQFSADFEDCELSSHFADISL REHQLLLDPDPGGAPSSLLDENKELGECAQEPLYEGPADVEKSLPKRRGIHLPGEKTACVSAAVSDESVAGDSGV YEAFVKQPSEAEDVPYSEEDAVVMETAQVQIGLRYDAKRSSFVVTVAQLRNLHAFLIPHSSKVYFRVALLPSSSD VSCLFRTKVHPAAESLLFSDVFRVAISQTALQQKTLRVDLCSVGKHRREECLAGTQISLADLPFSSGVFTLWYNL LPSKQMPCKKKEEETEDSVFQPSQPLVDSVDLDAVSALLARTSAELLAVEQELAQEKEPGQEEEHRGPDGDWLAM LREASDEIVAKEGAEVKLAEGSRCVEDASSCPSVPKMSEDTSRKDSSCASDLGTQPPAGTLALVDKETNTDEAGG ASMVVRPKDHSSLSARQRPFMRSSVIVRSQTFSPGERSQYVCRLNRSDSDSSTLAKKSLFVRNSTERRSLRVKRA VCQPVLRRAAPECPVRTSLDLELDLQASLTRQSRLNDELQALRGLRQKLEDLKAQGETDLPPGMLDDERFQKLLR QAGKQAEQSEEEQKQDLNAEKLMRQVSKDVCRLREQSHKVPRQVQSFREKIAYFTRAKITIPSLSADDV
13.Wwc2小家鼠(Mus musculus)
蛋白(protein WWC2;GenBank:NP_598552.2;SEQ ID NO:16):
MPRRAGSGQLPLPRGWEEARDYDGKVFYIDHNTRRTSWIDPRDRLTKPLSFADCVGDELPWGWEAGFDPQIGAYY IDHINKTTQIEDPRKQWRGEQEKMLKDYLSVAQDALRTQKELYHVKEQRLALALDEYVRLNDAYKEKSSSHTSLF SGSSSSTKYDPDILKAEISTTQLRVKKLKRELSHMKQELLYKQQGFETLQQIDEKMSGGQSGYELNEAKAILTEL KSIRKAISSGEKEKQDLMQSLAKLQERFHLDQNMGSSEPDLRSSPVNSHLSLSRQTLDAGSQTSISGDIGVRSRS NLAEKVRLSLQYEEAKRSMANLKIELSKLDGEAWPGALDIEKEKLMLINEKEELLKELQFITPQKRSQEELERLE AERQHLEEELMAARGSPSRALTERLKLEEKRKELLQKLEETTKLTTSLYSQLQSLSSSTLSMSSGSSLGSLASSR GSLNTSSRGSLNSLSSSELYYSSQGDQMDTDYQYKLDFLLQEKGGYIPSGPITTIHENEVVKSPSQPGQSGLCGV GVTASSHTTPLTEASKSVASLSSRSSLSSLSPPGSPLVLDSVFPGSSHDTSPHQFPTDFEDCELSRRFADVGLGE NQALLDSDSGGASQPLLEDKGLSDCPGELLCEGATDVEKSLPKRRGLHLRGDKTTRVSAAASDESVAGDSGVYEA SMKQPGEMEDVPYSEEDVTIVETAQVQIGLRYDTKSSSFMVIIAQLRNLHAFSIPHSSKVYFRVALLPSSADVSC LFRTKVHPPTESVLYNDVFRVAVSQAALQQKTLRVDLCSASKHRREECLAGTQISLADLPFSNEIFMLWYNLLPS KQMPCKKNEDGNEEPGARSQQPMLDPIDLDAVSALLARTSAELLAVEQELAQEEEEEELRPERRGPGRDCLTMLR EASDEPAALRESGVPLAEGSRCTEDPKPCPRGPETSQCRKEPAEDPGQLPSGLPTLVDKETNTDEVVDSNMAVRP KDRSSLSSRQHPFVRNSVIVRSQTFSPGERSQYICRLNRSDSDSSTLAKKSLFVRNSTERRSLRVKRAVCQPTLR RTAQECPVRTSLDLELDLQASLTRQSRLNDELQALRGLRQKLEELKAQGETDLPPGVLEDERFQKLLKQAEKQAE QTKEEQKQDLNAERLMRQVSKDVCRLREQSQKEPRQVQSFREKIAYFTRAKISIPSLPADDV
14.WWC2原鸡(Gallus gallus)
蛋白(protein WWC2 isoform X1;GenBank:XP_015132030.2;SEQ ID NO:17):
MPRKAGNGQLPLPDGWEEARDYDGKVFYIDHNTKQTSWIDPRDRLTKPLSFADCVGDELPWGWEAAYDPQIGVYY IDHINQTTQIEDPRKQWRQEQERMLKDYLMVAQDALSTQKELYQVKEQRLALALDEYVRLNDAYKEKSSSRTSLF SGSSSSTKYDPDILKAEISTTRLRVKKLKRELSQMKQELLYKEQGFETLQQIDQKMSGGQSGYELCEAKAILSEL KSIRKAISSGEREKQDLMKSLAKLKEKFSLDRNIGTSEPDLSFSSVNSQLCFSRQTLDTGSQTDISGEVGTRSRS NLAEKVRLSLQYEEAKRSMANLKIELSKLDGEAWPGALDVEKEKLMLINEKEELLKELQFITPRKRTQDELEQLE AERKRLEEELHSVKSAPSQALAERLKLEERRKELVQKLEETTKLTTYLHSQLRSLSASTLSVSSGSSLGSLASSR GSLNTSSRGSLNSLSSTDLYYNQGDQITDLDYQYKLDFILQEKSGYIPSGPITTIHENEVVSSHGRLGYSDSPSA TEQPKLTEPPKSVTSLSSRSSLSSLSPPGSPLVLEAAFSVSAQNSPLHHLSTDFEDCDFAGISLCENQILLDSEA RAGSQIPTDDKDLNESIRQPLSSLHEGSSGIDLPRRAASHLLAEKTACVSAAVSDESVAGDSGVYEASVKHLNET EDIVYSEDDATALEAAQVQIGLRYDHSNSSFVIIIVQLRNLPVFSVPLGSKVYIRVAVLPSSADTSCLFRTRVHP AMETILLNEIFRVAISQGTLLQKTLRVDVCAVSRSRREECLAGTQISLADLSFSDETCTLWYNLLSCKQVPGKKN KDQNEEPMFLLSKQSSDSLDLDAVSALLERTSAELEAVEQELAEDEEEEDEQEQRGSEEDWLEMLAEASDEIGDE EEDGIKLAVEGNCTDDTGLFIDAVETEEDENRQNRDEARESQQAAVILTLVDKETNTEESVNENATVRPKDRASW SSRQRPFVRNSMIVRSQTFSPGERNQYICRLSRSDSDSSTLAKKSLFVRNATERRSLRVKRPVCQPIMRRATQEC PARTSLDLELDLQASRTRQNRLNDELQALRDLKQKLEEMKGRGETDLPLCVLEDERFQKLLKQAEKQAEQSKEEQ KRGLTAEKLMRKASKDVCRLREQSQKVPLQVQSFREKIAYFTRAKISIPALPADDV
15.wwc2热带爪蟾(Xenopus tropicalis)
蛋白(protein WWC2;GenBank:NP_001004872.1;SEQ ID NO:18):
MPRKGNGQLPLPDGWEEARDYDGKVFYIDHNSRQTSWIDPRDRLTKPLSFADCVGNELPWGWESSYDPQIGVYFI NHINQTTQIEDPRKLWRNEQERMLKDYLMVAQDALSTQKELYHIKEQRLALALDEYVRLNDAYKEKSSSRTSLFS GSSSSTKYDPDILKAEISTTKVRVKKLKRELSQMKQELLYKEQGFETLQRIDQKMSGGQSGYELREAKDILSELK SIRKAISTGEKEKQDLMQSLVKLKERFHLEEARGRSEPDLRSNLANSHLSLSRQTLDAGSQTDISGDIGVRSRSN LAEKVRLSLQYEEAKRSMANLKIELAKLDSEAWPGALDVEKEKLMLINEKEELLKELQFVTTRRRTQGEIERLEG ERRRLEEELLSVKSSPSKALAEQLKIQEKKKELVKKLEEVTKSATYLHSQLKSLSASTLSVSSGSSIGSLASSRG SLNTSSRGSLNSLSSTDLYYNQNEPAADLDYQYKLDFLLQEKSGYIPCGPITTIHENEVVHCHERIDYTNSPTAQ QDTQDAKPPKSVTSLSSLSSLSSLSPPGSPPVLEGVFSLCTQDSLRTGFEISELPESFADMNLHENLQLMESVAG ESQALAERKSTGEGLRHQSSASQEGRTDIEFPRKNPDRVQEEKAMCVSAAVSDESVAGDSGVYEPSVKPPGEDPV FNDDYSILGAAQAQLILRYDSGNSSFVIIIVKARNNLSYVQFGSRIYFRVAVLPSSNDTSCLFRTKVYPATESVL FNELFRVSISQTTLQQKTLRVDMCSVGKTHREDCLAGTQISLADFSFSNDVHTQWYTLLPSRTIPLHKEQLEKSV LSASNTQTAALDLDAVSALLERTSAELEAVEQELAQEDDDQEQLCPGDDWPEMAPEESFSTLEEHEADLLLSGEY YAVPLQLSSETTEKSEELYGETSNWDSVVSPLPQAELPTLVDKETNTEEALQENLSVRPKERANLGSRQRPFVRN SMIVRSQTFSPGEKNQYICRLNRSDSDSSTLAKKSPFIRNANERRSLRVKRPICQPMTRRTVHECRERTSLDLEL DLQASLTRQSRLNDELQSLRDLKQRLEEMKARGETELPTCVLEDERFQRLLKQAEKQAEQSKEEQKQGLNAEKLM RKASKDVCRLREQSQKVPLQVQSFREKITYFTRAKISIPSLSADDV
16.WWC3恒河猴(Macaca mulatta)
蛋白(protein WWC3 isoform X1;GenBank:XP_014982410.2;SEQ ID NO:19):
MPWLSGGRRRRRGQPREAPREPPPSAQPQREPPPPPAPPAAVPTPPAPSAQQPRARESAELPLPAGWEEARDYDG RVFYIDHNTRQTSWIDPRDRITKPLTFADCVGDELPLGWETVYDKQIGVYYMDHINKLTQIEDPREQWRREQERM LKEYLIVAQEALNAKKEIYQIKQQRFELAQEEYQQLHKMCEDDSRSHASSFSGYSTNTKYDPHQIKAEIASRRDR LSRLKRELTQMKQELQYKEKGVETLQEIDRKMSSTHTSYKLDEAQAIMSELRTIKKAICTGEKERRDLMHSLAKL TDSFKNSCSVTDSLVDFPHHAGVPGDAGLPQQFCDAGSQTDIIGEFVFDDKTRLVDRVRLNWQYEEARKRVANIQ QQLARLDNESWPGTAEADRDRLQLIKEKEALMQELQLIIAQRRSAGDVARLEEERERLEEELRRARATSAQGATE RILLQEKRNCLLMQLEEATRLTSYLQSQLKSLCASTLTVSSGSSRGSLASSRGSLASSRGSLSSVSFTDIYGLPQ YEKPDAEGGQLLRFDLIPFDSLGRDATFTEPAGPSGFHKQRRSLDTPQSLASLSSRSSLSSLSPPSSPLDTPFLP ASRDSPLAQLADSCEGPGLGALDRLRVHASALGDEDLPGMAALQPHGVPGDGEGPHEPGPPPASAPVGGTVTLRE DSAKRLERRARRISACLSDYSLASDSGVFEPLTKRNEDAEEPAYGDTASNGDPQIHVGLLRDSGNECLLVHVLQL KNPAGLAVKEDCKVHIRVYLPPLDLGTPNTYCSKALEFQVPLVFNEVFRIPVHSSALTLKSLQLYVCSVTPQLQE ELLGIAQINLADYDSLSEMQLRWHSVQVFTSSEPSRTREPGCAGDSSARDPAHATSISGKTDAVTVLLARTTAQL QAVERELAEERAKLEYTEEEVLEMERKEEQTEAVSERSWQADSVDSGCSNCTQTSPPYPEPCCVGIDSILGHPFA AQAGPYSPEKFQPSPLKVDKETNTEDLFPEEAASLLKERSSRRARGSPFVRSGTIVRSQTFSPGARSQYVCRLYR SDSDSSTLPRKSPFIRNTLERRTLRYKQSCRSSLAELMARTSLDLELDLQASRTRQRQLNEELCALRELRQRLED AQLRGQTDLPPWVLRDERLRGLLREAERQTRQTKLDYRHEQAAEKMLKKASKEIYQLRGQSHKEPIQVQTFREKI AFFTRPRINIPPLPADDV
17.wwc3热带爪蟾(Xenopus tropicalis)
蛋白(protein WWC3 isoform X1;GenBank:XP_002932841.2;SEQ ID NO:20):
MPWLSGGRRRRRQQQQQQQPQAPSEQQRCPSPGPSSCRRGSSELPLPAGWEEARDYDGRVFYIDHNTRQTSWIDP RDRITKPLTFADCVGNELPLGWEIVRDQQIGVYYMDHINQLTQVEDPREQWRREQERMLKEYLVVAQEALNAKKE IYQIKQQRFELAQEEFQQLHDLCEDDSRSYVSSFSGFSANTKYDPYQIKAEIANRRDRLSRLKRELTVMKQELQY KEKGVETLQEIDRKMSSAHTNYKLDEAQAIMSELRTLRQAICMGEKERRDLMQSLAKLTDGFRNSCCISDSLYGA QHNSGSLTDSCLPQQYCDACSQTDNIGEFGFDDKSRLADRVRLNWQYEEAKKRVSSIQHQLALLDNETWPVMAEA DRDHLQLIKEKEALLQDLQLICQQRRSPEDLSRMEEEMRRLSDEIQRAHATSAQGITERLLLQEKRNSLLRCLEE ATRLASYLHTQIKSLSASTLTVSSGSSRGSLASSRGSLASSRGSLSSISFTDIYGLPHYEKAETQVEYGQQMRFD MIPLDALSKDCQYSETGGLPNLNKQKISMDTPQSLASLSSRSSLSSLSPPSSPLDTPFLSASCDSPLTQMSEGLE EIMSIGSLDMIRGNSLTLGEENNQGTSSQTQGYNTENKGKNLSGPLLSRLQMSAASPIQEVCTTRLQGACRVSAG LSDDSLTSDSGVFETLNKRNGNVDDSVLKNSAKNEEPQVHVGIVYDSESECLLVHVLQLKNLSCAFFKQGCKIHI RVYLPSLDSSTPSTYCSKALEFHMPLMFNEIFQIPMHASILKQSSLQLYICSVCPQLQEKLLGIAQIGLADYEGS TEMHLQWYPIQMYSSTDPQKVSEIEDSMQPAENVTETKTDAVSILLARTTAQLEAVERELAVERVKLEYTEEEIL EMERKEDQTEAISERSWQAESVDSGCHSNYNQLSPHYSEGCYGDAVQGSAQTGQANLYDPVKTHNEPIKVDKETN TEDVFPDEVTNLPKERTCHRSRGSPFVRSSTIVRSQTFSPGARSQYVCRLYRSDSDSSTLPRKSPFIRNTLERRT LRYKQQSCQSSMAEIMARTSLDLELDLQASRTRQRQLNEEINALRELKHRLEEVQLRGQSDLPQWVLRDERFRSL LLEAERQTRQTKLEHHQEQAAEKMLKKASKEIFHLRGQNQKEPFQVQTFREKIAFFTRPRINIPPLPADDV
18.hWWC11-200,赖氨酸至精氨酸取代;SEQ ID NO:21
MPRPELPLPEGWEEARDFDGRVYYIDHTNRTTSWIDPRDRYTRPLTFADCISDELPLGWEEAYDPQVGDYFIDHN TRTTQIEDPRVQWRREQEHMLRDYLVVAQEALSAQREIYQVRQQRLELAQQEYQQLHAVWEHRLGSQVSLVSGSS SSSRYDPEILRAEIATARSRVNRLRREMVHLQHELQFRERGFQTLRRIDR
19.N端NMT识别基序;SEQ ID NO:22
MGSNKSK。
序列表
<110> 复旦大学
<120> 激活Hippo信号通路的多肽及其用途
<130> I2021TC5758CS
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 1119
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
Met Pro Arg Pro Glu Leu Pro Leu Pro Glu Gly Trp Glu Glu Ala Arg
1 5 10 15
Asp Phe Asp Gly Lys Val Tyr Tyr Ile Asp His Thr Asn Arg Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Tyr Thr Lys Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Ser Asp Glu Leu Pro Leu Gly Trp Glu Glu Ala Tyr Asp
50 55 60
Pro Gln Val Gly Asp Tyr Phe Ile Asp His Asn Thr Lys Thr Thr Gln
65 70 75 80
Ile Glu Asp Pro Arg Val Gln Trp Arg Arg Glu Gln Glu His Met Leu
85 90 95
Lys Asp Tyr Leu Val Val Ala Gln Glu Ala Leu Ser Ala Gln Lys Glu
100 105 110
Ile Tyr Gln Val Lys Gln Gln Arg Leu Glu Leu Ala Gln Gln Glu Tyr
115 120 125
Gln Gln Leu His Ala Val Trp Glu His Lys Leu Gly Ser Gln Val Ser
130 135 140
Leu Val Ser Gly Ser Ser Ser Ser Ser Lys Tyr Asp Pro Glu Ile Leu
145 150 155 160
Lys Ala Glu Ile Ala Thr Ala Lys Ser Arg Val Asn Lys Leu Lys Arg
165 170 175
Glu Met Val His Leu Gln His Glu Leu Gln Phe Lys Glu Arg Gly Phe
180 185 190
Gln Thr Leu Lys Lys Ile Asp Lys Lys Met Ser Asp Ala Gln Gly Ser
195 200 205
Tyr Lys Leu Asp Glu Ala Gln Ala Val Leu Arg Glu Thr Lys Ala Ile
210 215 220
Lys Lys Ala Ile Thr Cys Gly Glu Lys Glu Lys Gln Asp Leu Ile Lys
225 230 235 240
Ser Leu Ala Met Leu Lys Asp Gly Phe Arg Thr Asp Arg Gly Ser His
245 250 255
Ser Asp Leu Trp Ser Ser Ser Ser Ser Leu Glu Ser Ser Ser Phe Pro
260 265 270
Leu Pro Lys Gln Tyr Leu Asp Val Ser Ser Gln Thr Asp Ile Ser Gly
275 280 285
Ser Phe Gly Ile Asn Ser Asn Asn Gln Leu Ala Glu Lys Val Arg Leu
290 295 300
Arg Leu Arg Tyr Glu Glu Ala Lys Arg Arg Ile Ala Asn Leu Lys Ile
305 310 315 320
Gln Leu Ala Lys Leu Asp Ser Glu Ala Trp Pro Gly Val Leu Asp Ser
325 330 335
Glu Arg Asp Arg Leu Ile Leu Ile Asn Glu Lys Glu Glu Leu Leu Lys
340 345 350
Glu Met Arg Phe Ile Ser Pro Arg Lys Trp Thr Gln Gly Glu Val Glu
355 360 365
Gln Leu Glu Met Ala Arg Lys Arg Leu Glu Lys Asp Leu Gln Ala Ala
370 375 380
Arg Asp Thr Gln Ser Lys Ala Leu Thr Glu Arg Leu Lys Leu Asn Ser
385 390 395 400
Lys Arg Asn Gln Leu Val Arg Glu Leu Glu Glu Ala Thr Arg Gln Val
405 410 415
Ala Thr Leu His Ser Gln Leu Lys Ser Leu Ser Ser Ser Met Gln Ser
420 425 430
Leu Ser Ser Gly Ser Ser Pro Gly Ser Leu Thr Ser Ser Arg Gly Ser
435 440 445
Leu Val Ala Ser Ser Leu Asp Ser Ser Thr Ser Ala Ser Phe Thr Asp
450 455 460
Leu Tyr Tyr Asp Pro Phe Glu Gln Leu Asp Ser Glu Leu Gln Ser Lys
465 470 475 480
Val Glu Phe Leu Leu Leu Glu Gly Ala Thr Gly Phe Arg Pro Ser Gly
485 490 495
Cys Ile Thr Thr Ile His Glu Asp Glu Val Ala Lys Thr Gln Lys Ala
500 505 510
Glu Gly Gly Gly Arg Leu Gln Ala Leu Arg Ser Leu Ser Gly Thr Pro
515 520 525
Lys Ser Met Thr Ser Leu Ser Pro Arg Ser Ser Leu Ser Ser Pro Ser
530 535 540
Pro Pro Cys Ser Pro Leu Met Ala Asp Pro Leu Leu Ala Gly Asp Ala
545 550 555 560
Phe Leu Asn Ser Leu Glu Phe Glu Asp Pro Glu Leu Ser Ala Thr Leu
565 570 575
Cys Glu Leu Ser Leu Gly Asn Ser Ala Gln Glu Arg Tyr Arg Leu Glu
580 585 590
Glu Pro Gly Thr Glu Gly Lys Gln Leu Gly Gln Ala Val Asn Thr Ala
595 600 605
Gln Gly Cys Gly Leu Lys Val Ala Cys Val Ser Ala Ala Val Ser Asp
610 615 620
Glu Ser Val Ala Gly Asp Ser Gly Val Tyr Glu Ala Ser Val Gln Arg
625 630 635 640
Leu Gly Ala Ser Glu Ala Ala Ala Phe Asp Ser Asp Glu Ser Glu Ala
645 650 655
Val Gly Ala Thr Arg Ile Gln Ile Ala Leu Lys Tyr Asp Glu Lys Asn
660 665 670
Lys Gln Phe Ala Ile Leu Ile Ile Gln Leu Ser Asn Leu Ser Ala Leu
675 680 685
Leu Gln Gln Gln Asp Gln Lys Val Asn Ile Arg Val Ala Val Leu Pro
690 695 700
Cys Ser Glu Ser Thr Thr Cys Leu Phe Arg Thr Arg Pro Leu Asp Ala
705 710 715 720
Ser Asp Thr Leu Val Phe Asn Glu Val Phe Trp Val Ser Met Ser Tyr
725 730 735
Pro Ala Leu His Gln Lys Thr Leu Arg Val Asp Val Cys Thr Thr Asp
740 745 750
Arg Ser His Leu Glu Glu Cys Leu Gly Gly Ala Gln Ile Ser Leu Ala
755 760 765
Glu Val Cys Arg Ser Gly Glu Arg Ser Thr Arg Trp Tyr Asn Leu Leu
770 775 780
Ser Tyr Lys Tyr Leu Lys Lys Gln Ser Arg Glu Leu Lys Pro Val Gly
785 790 795 800
Val Met Ala Pro Ala Ser Gly Pro Ala Ser Thr Asp Ala Val Ser Ala
805 810 815
Leu Leu Glu Gln Thr Ala Val Glu Leu Glu Lys Arg Gln Glu Gly Arg
820 825 830
Ser Ser Thr Gln Thr Leu Glu Asp Ser Trp Arg Tyr Glu Glu Thr Ser
835 840 845
Glu Asn Glu Ala Val Ala Glu Glu Glu Glu Glu Glu Val Glu Glu Glu
850 855 860
Glu Gly Glu Glu Asp Val Phe Thr Glu Lys Ala Ser Pro Asp Met Asp
865 870 875 880
Gly Tyr Pro Ala Leu Lys Val Asp Lys Glu Thr Asn Thr Glu Thr Pro
885 890 895
Ala Pro Ser Pro Thr Val Val Arg Pro Lys Asp Arg Arg Val Gly Thr
900 905 910
Pro Ser Gln Gly Pro Phe Leu Arg Gly Ser Thr Ile Ile Arg Ser Lys
915 920 925
Thr Phe Ser Pro Gly Pro Gln Ser Gln Tyr Val Cys Arg Leu Asn Arg
930 935 940
Ser Asp Ser Asp Ser Ser Thr Leu Ser Lys Lys Pro Pro Phe Val Arg
945 950 955 960
Asn Ser Leu Glu Arg Arg Ser Val Arg Met Lys Arg Pro Ser Pro Pro
965 970 975
Pro Gln Pro Ser Ser Val Lys Ser Leu Arg Ser Glu Arg Leu Ile Arg
980 985 990
Thr Ser Leu Asp Leu Glu Leu Asp Leu Gln Ala Thr Arg Thr Trp His
995 1000 1005
Ser Gln Leu Thr Gln Glu Ile Ser Val Leu Lys Glu Leu Lys Glu
1010 1015 1020
Gln Leu Glu Gln Ala Lys Ser His Gly Glu Lys Glu Leu Pro Gln
1025 1030 1035
Trp Leu Arg Glu Asp Glu Arg Phe Arg Leu Leu Leu Arg Met Leu
1040 1045 1050
Glu Lys Arg Gln Met Asp Arg Ala Glu His Lys Gly Glu Leu Gln
1055 1060 1065
Thr Asp Lys Met Met Arg Ala Ala Ala Lys Asp Val His Arg Leu
1070 1075 1080
Arg Gly Gln Ser Cys Lys Glu Pro Pro Glu Val Gln Ser Phe Arg
1085 1090 1095
Glu Lys Met Ala Phe Phe Thr Arg Pro Arg Met Asn Ile Pro Ala
1100 1105 1110
Leu Ser Ala Asp Asp Val
1115
<210> 2
<211> 3360
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
atgccccggc cggagctgcc cctgccggag ggctgggagg aggcgcgcga cttcgacggc 60
aaggtctact acatagacca cacgaaccgc accaccagct ggatcgaccc gcgggacagg 120
tacaccaaac cgctcacctt tgctgactgc attagtgatg agttgccgct aggatgggaa 180
gaggcatatg acccacaggt tggagattac ttcatagacc acaacaccaa aaccactcag 240
attgaggatc ctcgagtaca atggcggcgg gagcaggaac atatgctgaa ggattacctg 300
gtggtggccc aggaggctct gagtgcacaa aaggagatct accaggtgaa gcagcagcgc 360
ctggagcttg cacagcagga gtaccagcaa ctgcatgccg tctgggagca taagctgggc 420
tcccaggtca gcttggtctc tggttcatca tccagctcca agtatgaccc tgagatcctg 480
aaagctgaaa ttgccactgc aaaatcccgg gtcaacaagc tgaagagaga gatggttcac 540
ctccagcacg agctgcagtt caaagagcgt ggctttcaga ccctgaagaa aatcgataag 600
aaaatgtctg atgctcaggg cagctacaaa ctggatgaag ctcaggctgt cttgagagaa 660
acaaaagcca tcaaaaaggc tattacctgt ggggaaaagg aaaagcaaga tctcattaag 720
agccttgcca tgttgaagga cggcttccgc actgacaggg ggtctcactc agacctgtgg 780
tccagcagca gctctctgga gagttcgagt ttcccgctac cgaaacagta cctggatgtg 840
agctcccaga cagacatctc gggaagcttc ggcatcaaca gcaacaatca gttggcagag 900
aaggtcagat tgcgccttcg atatgaagag gctaagagaa ggatcgccaa cctgaagatc 960
cagctggcca agcttgacag tgaggcctgg cctggggtgc tggactcaga gagggaccgg 1020
ctgatcctta tcaacgagaa ggaggagctg ctgaaggaga tgcgcttcat cagcccccgc 1080
aagtggaccc agggggaggt ggagcagctg gagatggccc ggaagcggct ggaaaaggac 1140
ctgcaggcag cccgggacac ccagagcaag gcgctgacgg agaggttaaa gttaaacagt 1200
aagaggaacc agcttgtgag agaactggag gaagccaccc ggcaggtggc aactctgcac 1260
tcccagctga aaagtctctc aagcagcatg cagtccctgt cctcaggcag cagccccgga 1320
tccctcacgt ccagccgggg ctccctggtt gcatccagcc tggactcctc cacttcagcc 1380
agcttcactg acctctacta tgaccccttt gagcagctgg actcagagct gcagagcaag 1440
gtggagttcc tgctcctgga gggggccacc ggcttccggc cctcaggctg catcaccacc 1500
atccacgagg atgaggtggc caagacccag aaggcagagg gaggtggccg cctgcaggct 1560
ctgcgttccc tgtctggcac cccaaagtcc atgacctccc tatccccacg ttcctctctc 1620
tcctccccct ccccaccctg ttcccctctc atggctgacc ccctcctggc tggtgatgcc 1680
ttcctcaact ccttggagtt tgaagacccg gagctgagtg ccactctttg tgaactgagc 1740
cttggtaaca gcgcccagga aagataccgg ctggaggaac caggaacgga gggcaagcag 1800
ctgggccaag ctgtgaatac ggcccagggg tgtggcctga aagtggcctg tgtctcagcc 1860
gccgtatcgg acgagtcagt ggctggagac agtggtgtgt acgaggcttc cgtgcagaga 1920
ctgggtgctt cagaagctgc tgcatttgac agtgacgaat cggaagcagt gggtgcgacc 1980
cgaattcaga ttgccctgaa gtatgatgag aagaataagc aatttgcaat attaatcatc 2040
cagctgagta acctttctgc tctgttgcag caacaagacc agaaagtgaa tatccgcgtg 2100
gctgtccttc cttgctctga aagcacaacc tgcctgttcc ggacccggcc tctggacgcc 2160
tcagacactc tagtgttcaa tgaggtgttc tgggtatcca tgtcctatcc agcccttcac 2220
cagaagacct taagagtcga tgtctgtacc accgacagga gccatctgga agagtgcctg 2280
ggaggcgccc agatcagcct ggcggaggtc tgccggtctg gggagaggtc gactcgctgg 2340
tacaaccttc tcagctacaa atacttgaag aaacagagca gggagctcaa gccagtggga 2400
gtcatggccc ctgcctcagg gcctgccagc acggacgctg tgtctgctct gttggaacag 2460
acagcagtgg agctggagaa gaggcaggag ggcaggagca gcacacagac actggaagac 2520
agctggaggt atgaggagac cagtgagaat gaggcagtag ccgaggaaga ggaggaggag 2580
gtggaggagg aggagggaga agaggatgtt ttcaccgaga aagcctcacc tgatatggat 2640
gggtacccag cattaaaggt ggacaaagag accaacacgg agaccccggc cccatccccc 2700
acagtggtgc gacctaagga ccggagagtg ggcaccccgt cccaggggcc atttcttcga 2760
gggagcacca tcatccgctc taagaccttc tccccaggac cccagagcca gtacgtgtgc 2820
cggctgaatc ggagtgatag tgacagctcc actctgtcca aaaagccacc ttttgttcga 2880
aactccctgg agcgacgcag cgtccggatg aagcggccgt ccccaccccc acagccttcc 2940
tcggtcaagt cgctgcgctc cgagcgtctg atccgtacct cgctggacct ggagttagac 3000
ctgcaggcga caagaacctg gcacagccaa ttgacccagg agatctcggt gctgaaggag 3060
ctcaaggagc agctggaaca agccaagagc cacggggaga aggagctgcc acagtggttg 3120
cgtgaggacg agcgtttccg cctgctgctg aggatgctgg agaagcggca gatggaccga 3180
gcggagcaca agggtgagct tcagacagac aagatgatga gggcagctgc caaggatgtg 3240
cacaggctcc gaggccagag ctgtaaggaa cccccagaag ttcagtcttt cagggagaag 3300
atggcatttt tcacccggcc tcggatgaat atcccagctc tctctgcaga tgacgtctaa 3360
<210> 3
<211> 1192
<212> PRT
<213> 智人(Homo sapiens)
<400> 3
Met Pro Arg Arg Ala Gly Ser Gly Gln Leu Pro Leu Pro Arg Gly Trp
1 5 10 15
Glu Glu Ala Arg Asp Tyr Asp Gly Lys Val Phe Tyr Ile Asp His Asn
20 25 30
Thr Arg Arg Thr Ser Trp Ile Asp Pro Arg Asp Arg Leu Thr Lys Pro
35 40 45
Leu Ser Phe Ala Asp Cys Val Gly Asp Glu Leu Pro Trp Gly Trp Glu
50 55 60
Ala Gly Phe Asp Pro Gln Ile Gly Val Tyr Tyr Ile Asp His Ile Asn
65 70 75 80
Lys Thr Thr Gln Ile Glu Asp Pro Arg Lys Gln Trp Arg Gly Glu Gln
85 90 95
Glu Lys Met Leu Lys Asp Tyr Leu Ser Val Ala Gln Asp Ala Leu Arg
100 105 110
Thr Gln Lys Glu Leu Tyr His Val Lys Glu Gln Arg Leu Ala Leu Ala
115 120 125
Leu Asp Glu Tyr Val Arg Leu Asn Asp Ala Tyr Lys Glu Lys Ser Ser
130 135 140
Ser His Thr Ser Leu Phe Ser Gly Ser Ser Ser Ser Thr Lys Tyr Asp
145 150 155 160
Pro Asp Ile Leu Lys Ala Glu Ile Ser Thr Thr Arg Leu Arg Val Lys
165 170 175
Lys Leu Lys Arg Glu Leu Ser Gln Met Lys Gln Glu Leu Leu Tyr Lys
180 185 190
Glu Gln Gly Phe Glu Thr Leu Gln Gln Ile Asp Lys Lys Met Ser Gly
195 200 205
Gly Gln Ser Gly Tyr Glu Leu Ser Glu Ala Lys Ala Ile Leu Thr Glu
210 215 220
Leu Lys Ser Ile Arg Lys Ala Ile Ser Ser Gly Glu Lys Glu Lys Gln
225 230 235 240
Asp Leu Met Gln Ser Leu Ala Lys Leu Gln Glu Arg Phe His Leu Asp
245 250 255
Gln Asn Ile Gly Arg Ser Glu Pro Asp Leu Arg Cys Ser Pro Val Asn
260 265 270
Ser His Leu Cys Leu Ser Arg Gln Thr Leu Asp Ala Gly Ser Gln Thr
275 280 285
Ser Ile Ser Gly Asp Ile Gly Val Arg Ser Arg Ser Asn Leu Ala Glu
290 295 300
Lys Val Arg Leu Ser Leu Gln Tyr Glu Glu Ala Lys Arg Ser Met Ala
305 310 315 320
Asn Leu Lys Ile Glu Leu Ser Lys Leu Asp Ser Glu Ala Trp Pro Gly
325 330 335
Ala Leu Asp Ile Glu Lys Glu Lys Leu Met Leu Ile Asn Glu Lys Glu
340 345 350
Glu Leu Leu Lys Glu Leu Gln Phe Val Thr Pro Gln Lys Arg Thr Gln
355 360 365
Asp Glu Leu Glu Arg Leu Glu Ala Glu Arg Gln Arg Leu Glu Glu Glu
370 375 380
Leu Leu Ser Val Arg Gly Thr Pro Ser Arg Ala Leu Ala Glu Arg Leu
385 390 395 400
Arg Leu Glu Glu Arg Arg Lys Glu Leu Leu Gln Lys Leu Glu Glu Thr
405 410 415
Thr Lys Leu Thr Thr Tyr Leu His Ser Gln Leu Lys Ser Leu Ser Ala
420 425 430
Ser Thr Leu Ser Met Ser Ser Gly Ser Ser Leu Gly Ser Leu Ala Ser
435 440 445
Ser Arg Gly Ser Leu Asn Thr Ser Ser Arg Gly Ser Leu Asn Ser Leu
450 455 460
Ser Ser Thr Glu Leu Tyr Tyr Ser Ser Gln Ser Asp Gln Ile Asp Val
465 470 475 480
Asp Tyr Gln Tyr Lys Leu Asp Phe Leu Leu Gln Glu Lys Ser Gly Tyr
485 490 495
Ile Pro Ser Gly Pro Ile Thr Thr Ile His Glu Asn Glu Val Val Lys
500 505 510
Ser Pro Ser Gln Pro Gly Gln Ser Gly Leu Cys Gly Val Ala Ala Ala
515 520 525
Ala Thr Gly His Thr Pro Pro Leu Ala Glu Ala Pro Lys Ser Val Ala
530 535 540
Ser Leu Ser Ser Arg Ser Ser Leu Ser Ser Leu Ser Pro Pro Gly Ser
545 550 555 560
Pro Leu Val Leu Glu Gly Thr Phe Pro Met Ser Ser Ser His Asp Ala
565 570 575
Ser Leu His Gln Phe Thr Ala Asp Phe Glu Asp Cys Glu Leu Ser Ser
580 585 590
His Phe Ala Asp Ile Ser Leu Ile Glu Asn Gln Ile Leu Leu Asp Ser
595 600 605
Asp Ser Gly Gly Ala Ser Gln Ser Leu Ser Glu Asp Lys Asp Leu Asn
610 615 620
Glu Cys Ala Arg Glu Pro Leu Tyr Glu Gly Thr Ala Asp Val Glu Lys
625 630 635 640
Ser Leu Pro Lys Arg Arg Val Ile His Leu Leu Gly Glu Lys Thr Thr
645 650 655
Cys Val Ser Ala Ala Val Ser Asp Glu Ser Val Ala Gly Asp Ser Gly
660 665 670
Val Tyr Glu Ala Phe Val Lys Gln Pro Ser Glu Met Glu Asp Val Thr
675 680 685
Tyr Ser Glu Glu Asp Val Ala Ile Val Glu Thr Ala Gln Val Gln Ile
690 695 700
Gly Leu Arg Tyr Asn Ala Lys Ser Ser Ser Phe Met Val Ile Ile Ala
705 710 715 720
Gln Leu Arg Asn Leu His Ala Phe Leu Ile Pro His Thr Ser Lys Val
725 730 735
Tyr Phe Arg Val Ala Val Leu Pro Ser Ser Thr Asp Val Ser Cys Leu
740 745 750
Phe Arg Thr Lys Val His Pro Pro Thr Glu Ser Ile Leu Phe Asn Asp
755 760 765
Val Phe Arg Val Ala Ile Ser Gln Thr Ala Leu Gln Gln Lys Thr Leu
770 775 780
Arg Val Asp Leu Cys Ser Val Ser Lys His Arg Arg Glu Glu Cys Leu
785 790 795 800
Ala Gly Thr Gln Ile Ser Leu Ala Asp Leu Pro Phe Ser Ser Glu Val
805 810 815
Phe Thr Leu Trp Tyr Asn Leu Leu Pro Ser Lys Gln Met Pro Cys Lys
820 825 830
Lys Asn Glu Glu Asn Glu Asp Ser Val Phe Gln Pro Asn Gln Pro Leu
835 840 845
Val Asp Ser Ile Asp Leu Asp Ala Val Ser Ala Leu Leu Ala Arg Thr
850 855 860
Ser Ala Glu Leu Leu Ala Val Glu Gln Glu Leu Ala Gln Glu Glu Glu
865 870 875 880
Glu Glu Ser Gly Gln Glu Glu Pro Arg Gly Pro Asp Gly Asp Trp Leu
885 890 895
Thr Met Leu Arg Glu Ala Ser Asp Glu Ile Val Ala Glu Lys Glu Ala
900 905 910
Glu Val Lys Leu Pro Glu Asp Ser Ser Cys Thr Glu Asp Leu Ser Ser
915 920 925
Cys Thr Ser Val Pro Glu Met Asn Glu Asp Gly Asn Arg Lys Glu Ser
930 935 940
Asn Cys Ala Lys Asp Leu Arg Ser Gln Pro Pro Thr Arg Ile Pro Thr
945 950 955 960
Leu Val Asp Lys Glu Thr Asn Thr Asp Glu Ala Ala Asn Asp Asn Met
965 970 975
Ala Val Arg Pro Lys Glu Arg Ser Ser Leu Ser Ser Arg Gln His Pro
980 985 990
Phe Val Arg Ser Ser Val Ile Val Arg Ser Gln Thr Phe Ser Pro Gly
995 1000 1005
Glu Arg Asn Gln Tyr Ile Cys Arg Leu Asn Arg Ser Asp Ser Asp
1010 1015 1020
Ser Ser Thr Leu Ala Lys Lys Ser Leu Phe Val Arg Asn Ser Thr
1025 1030 1035
Glu Arg Arg Ser Leu Arg Val Lys Arg Thr Val Cys Gln Ser Val
1040 1045 1050
Leu Arg Arg Thr Thr Gln Glu Cys Pro Val Arg Thr Ser Leu Asp
1055 1060 1065
Leu Glu Leu Asp Leu Gln Ala Ser Leu Thr Arg Gln Ser Arg Leu
1070 1075 1080
Asn Asp Glu Leu Gln Ala Leu Arg Asp Leu Arg Gln Lys Leu Glu
1085 1090 1095
Glu Leu Lys Ala Gln Gly Glu Thr Asp Leu Pro Pro Gly Val Leu
1100 1105 1110
Glu Asp Glu Arg Phe Gln Arg Leu Leu Lys Gln Ala Glu Lys Gln
1115 1120 1125
Ala Glu Gln Ser Lys Glu Glu Gln Lys Gln Gly Leu Asn Ala Glu
1130 1135 1140
Lys Leu Met Arg Gln Val Ser Lys Asp Val Cys Arg Leu Arg Glu
1145 1150 1155
Gln Ser Gln Lys Val Pro Arg Gln Val Gln Ser Phe Arg Glu Lys
1160 1165 1170
Ile Ala Tyr Phe Thr Arg Ala Lys Ile Ser Ile Pro Ser Leu Pro
1175 1180 1185
Ala Asp Asp Val
1190
<210> 4
<211> 3579
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
atgcctagga gggccgggag cggtcagctg ccgctgcccc ggggctggga ggaggccagg 60
gactacgacg gcaaggtctt ctacattgac cacaacacca ggaggaccag ctggatcgac 120
ccccgggaca ggttaacgaa gcccttgtca tttgctgatt gtgttgggga tgagctgccg 180
tggggatggg aagcagggtt tgaccctcag attggtgtct actacatcga tcacatcaac 240
aaaaccacgc agatagaaga tccaagaaaa caatggaggg gggaacagga gaagatgctc 300
aaggactacc tctctgtggc acaggatgcc ctccggacac agaaggaact gtaccatgtg 360
aaggagcaga ggctggcgct ggccctggat gaatacgtgc gattaaatga tgcctataag 420
gaaaagtcaa gttctcacac aagcttattc tcaggatctt catccagtac taaatatgat 480
cccgatattt taaaagctga gatctccact acaagattaa gggttaaaaa gctaaagaga 540
gagctctcac agatgaagca ggaactgctc tataaagaac aaggctttga aacattgcag 600
caaattgata aaaaaatgtc tggaggccag agcgggtatg aactcagtga agccaaagcc 660
attctaacag aactaaaatc tatcagaaag gcaattagct caggagaaaa agaaaaacaa 720
gatctgatgc agagtcttgc taagctgcag gagcggtttc atttggatca gaacattggc 780
agatctgagc cagatttgag atgtagtcct gtgaactctc atttatgtct ctccagacag 840
acccttgatg ctgggtcaca aacaagcatt tccggagata ttggagtaag aagtagatca 900
aatttagctg aaaaggtcag gctaagccta cagtatgaag aagccaaaag aagtatggcc 960
aacttaaaaa ttgaactgtc aaaattggac agtgaggcct ggcctggggc actggatatt 1020
gagaaggaaa aactgatgct gattaatgaa aaagaagaac ttttgaaaga gcttcagttc 1080
gtcaccccac agaaacgtac ccaagatgaa ttagaacgcc tagaagctga aaggcagcgg 1140
ctggaagaag agttgctgtc tgtgagggga acaccaagca gagctctggc cgagagattg 1200
agattggaag agagaagaaa agagctgcta cagaaacttg aagaaactac taaattaact 1260
acttatttgc attcacaact taaaagcctc tctgccagca ccctgtccat gtcatctggg 1320
agcagcctgg gttccctggc atcgagtcgg ggctctctga acacctccag cagagggtca 1380
ctcaactccc tcagttccac cgaactctat tacagcagtc aaagtgatca gatagatgtg 1440
gattatcagt ataaactgga cttccttctg caagagaaaa gcggttacat tccttctgga 1500
cccatcacca ccatccatga aaacgaggtg gtcaagtccc ctagccagcc tggccagagt 1560
ggactctgtg gagtggcagc tgcagcaaca ggccacactc ctccactggc tgaggccccg 1620
aagtctgtgg cctccctgtc ctcgaggtcc tccctttcct ccttgtctcc tccaggctct 1680
cccttggttt tggaaggcac gtttcccatg tcttcttctc atgatgcctc tctccatcag 1740
ttcactgctg actttgaaga ctgtgagttg agtagccatt ttgcagatat cagcctcatc 1800
gaaaatcaga ttttgctgga ttctgattca ggaggagcct cccagtctct ttcagaggat 1860
aaagacctta atgaatgtgc tagggagcca ttatatgaag gaactgcaga tgtggaaaaa 1920
tcattaccaa aaagaagagt gatccacttg cttggggaga aaaccacttg tgtgtcggct 1980
gctgtgtctg atgagtctgt ggctggagac agtggggtct atgaagcttt cgtgaaacaa 2040
cctagtgaaa tggaagatgt cacatacagt gaagaggatg tagccattgt agagaccgcc 2100
caggttcaga taggactcag atacaatgca aaaagttcaa gtttcatggt gattatagca 2160
cagctccgaa accttcatgc cttcttgata cctcatactt caaaagtata ttttagggtt 2220
gccgttcttc cttcctcaac tgatgtcagc tgtctgtttc gcacaaaagt tcatccgccc 2280
acagaatcca ttttattcaa tgatgtgttc agagtcgcca tttcccaaac agccttacaa 2340
cagaagacac tgagggtaga cctttgctct gtcagtaaac accgaaggga agaatgcctg 2400
gctggaactc agatcagcct ggcagattta ccattttcca gtgaggtttt cactctatgg 2460
tataacttgc ttccttccaa gcaaatgcct tgcaaaaaga atgaagaaaa tgaggactct 2520
gtatttcaac caaaccagcc gttagtagat tctatagact tggatgcagt gtcagcctta 2580
cttgcaagaa catcagctga gttgttagct gtggaacaag aattagcaca agaagaagaa 2640
gaagaatcag gacaagaaga gccaaggggc ccagatggag actggctaac aatgctaaga 2700
gaggcctctg atgaaattgt ggctgaaaaa gaggctgaag ttaaattgcc agaggacagt 2760
agctgtacag aagatttaag ttcatgcact agtgtgcctg agatgaatga agacgggaac 2820
aggaaagaaa gcaactgtgc caaagacctc agaagtcagc cacctactag aataccaaca 2880
ctggttgaca aagagacaaa cactgatgaa gccgctaatg acaatatggc agttcgcccc 2940
aaagagcgca gcagcctgag ctctagacag catccgtttg tgaggagcag tgtgatagtg 3000
cgctcacaga ccttttctcc aggagagcgg aaccagtaca tctgcaggtt aaatcggagt 3060
gacagtgaca gttcaaccct ggctaaaaaa tcactgtttg tgagaaactc caccgaacgc 3120
cgcagtttga gggtcaaaag gacggtttgc cagtcagtcc ttagaagaac aacacaggaa 3180
tgcccagtgc ggacatctct agacttagaa ctggaccttc aggcatctct gacccggcag 3240
agccgcctca atgatgagct gcaggcgctg agggacttgc ggcagaagct ggaggaactg 3300
aaagctcagg gagagactga ccttccacca ggcgtgctgg aggatgagag gttccagagg 3360
cttctgaagc aagctgagaa gcaggctgaa cagtccaaag aagagcagaa gcaaggtctg 3420
aatgcagaga agttgatgag gcaagtctcc aaggacgtgt gtcggctccg ggagcagagc 3480
cagaaggtgc ctcggcaggt gcagtccttc agggagaaga ttgcctactt caccagagca 3540
aagataagca tcccatccct gccagctgat gatgtgtga 3579
<210> 5
<211> 1217
<212> PRT
<213> 智人(Homo sapiens)
<400> 5
Met Pro Trp Leu Ser Gly Gly Arg Arg Arg Arg Arg Gly Gln Pro Arg
1 5 10 15
Glu Ala Pro Arg Glu Pro Pro Pro Ser Ala Gln Pro Gln Arg Glu Pro
20 25 30
Pro Pro Pro Ala Pro Pro Ala Ala Val Pro Thr Pro Pro Ala Pro Ser
35 40 45
Ala Pro Pro Pro Arg Ala Arg Glu Ser Ala Glu Leu Pro Leu Pro Ala
50 55 60
Gly Trp Glu Glu Ala Arg Asp Tyr Asp Gly Arg Val Phe Tyr Ile Asp
65 70 75 80
His Asn Thr Arg Gln Thr Ser Trp Ile Asp Pro Arg Asp Arg Ile Thr
85 90 95
Lys Pro Leu Thr Phe Ala Asp Cys Val Gly Asp Glu Leu Pro Leu Gly
100 105 110
Trp Glu Thr Val Tyr Asp Lys Gln Ile Gly Val Tyr Tyr Met Asp His
115 120 125
Ile Asn Lys Leu Thr Gln Ile Glu Asp Pro Arg Glu Gln Trp Arg Arg
130 135 140
Glu Gln Glu Arg Met Leu Lys Glu Tyr Leu Ile Val Ala Gln Glu Ala
145 150 155 160
Leu Asn Ala Lys Lys Glu Ile Tyr Gln Ile Lys Gln Gln Arg Phe Glu
165 170 175
Leu Ala Gln Glu Glu Tyr Gln Gln Leu His Lys Met Cys Glu Asp Asp
180 185 190
Ser Arg Ser Tyr Ala Ser Ser Phe Ser Gly Tyr Ser Thr Asn Thr Lys
195 200 205
Tyr Asp Pro His Gln Ile Lys Ala Glu Ile Ala Ser Arg Arg Asp Arg
210 215 220
Leu Ser Arg Leu Lys Arg Glu Leu Thr Gln Met Lys Gln Glu Leu Gln
225 230 235 240
Tyr Lys Glu Lys Gly Val Glu Thr Leu Gln Glu Ile Asp Arg Lys Met
245 250 255
Ser Ser Thr His Thr Ser Tyr Lys Leu Asp Glu Ala Gln Ala Ile Met
260 265 270
Ser Glu Leu Arg Thr Ile Lys Lys Ala Ile Cys Thr Gly Glu Lys Glu
275 280 285
Arg Arg Asp Leu Met His Ser Leu Ala Lys Leu Thr Asp Ser Phe Lys
290 295 300
Asn Ser Cys Ser Val Thr Asp Ser Leu Val Asp Phe Pro His His Val
305 310 315 320
Gly Val Pro Gly Asp Ala Gly Val Pro Gln Gln Phe Cys Asp Ala Gly
325 330 335
Ser Gln Thr Asp Ile Ile Gly Glu Phe Val Phe Asp Asp Lys Thr Arg
340 345 350
Leu Val Asp Arg Val Arg Leu Asn Trp Gln Tyr Glu Glu Ala Arg Lys
355 360 365
Arg Val Ala Asn Ile Gln Gln Gln Leu Ala Arg Leu Asp Asn Glu Ser
370 375 380
Trp Pro Ser Thr Ala Glu Ala Asp Arg Asp Arg Leu Gln Leu Ile Lys
385 390 395 400
Glu Lys Glu Ala Leu Leu Gln Glu Leu Gln Leu Ile Ile Ala Gln Arg
405 410 415
Arg Ser Ala Gly Asp Val Ala Arg Leu Glu Glu Glu Arg Glu Arg Leu
420 425 430
Glu Glu Glu Leu Arg Arg Ala Arg Ala Thr Ser Ala Gln Gly Ala Thr
435 440 445
Glu Arg Ile Leu Leu Gln Glu Lys Arg Asn Cys Leu Leu Met Gln Leu
450 455 460
Glu Glu Ala Thr Arg Leu Thr Ser Tyr Leu Gln Ser Gln Leu Lys Ser
465 470 475 480
Leu Cys Ala Ser Thr Leu Thr Val Ser Ser Gly Ser Ser Arg Gly Ser
485 490 495
Leu Ala Ser Ser Arg Gly Ser Leu Ala Ser Ser Arg Gly Ser Leu Ser
500 505 510
Ser Val Ser Phe Thr Asp Ile Tyr Gly Leu Pro Gln Tyr Glu Lys Pro
515 520 525
Asp Ala Glu Gly Ser Gln Leu Leu Arg Phe Asp Leu Ile Pro Phe Asp
530 535 540
Ser Leu Gly Arg Asp Ala Pro Phe Ser Glu Pro Pro Gly Pro Ser Gly
545 550 555 560
Phe His Lys Gln Arg Arg Ser Leu Asp Thr Pro Gln Ser Leu Ala Ser
565 570 575
Leu Ser Ser Arg Ser Ser Leu Ser Ser Leu Ser Pro Pro Ser Ser Pro
580 585 590
Leu Asp Thr Pro Phe Leu Pro Ala Ser Arg Asp Ser Pro Leu Ala Gln
595 600 605
Leu Ala Asp Ser Cys Glu Gly Pro Gly Leu Gly Ala Leu Asp Arg Leu
610 615 620
Arg Ala His Ala Ser Ala Met Gly Asp Glu Asp Leu Pro Gly Met Ala
625 630 635 640
Ala Leu Gln Pro His Gly Val Pro Gly Asp Gly Glu Gly Pro His Glu
645 650 655
Arg Gly Pro Pro Pro Ala Ser Ala Pro Val Gly Gly Thr Val Thr Leu
660 665 670
Arg Glu Asp Ser Ala Lys Arg Leu Glu Arg Arg Ala Arg Arg Ile Ser
675 680 685
Ala Cys Leu Ser Asp Tyr Ser Leu Ala Ser Asp Ser Gly Val Phe Glu
690 695 700
Pro Leu Thr Lys Arg Asn Glu Asp Ala Glu Glu Pro Ala Tyr Gly Asp
705 710 715 720
Thr Ala Ser Asn Gly Asp Pro Gln Ile His Val Gly Leu Leu Arg Asp
725 730 735
Ser Gly Ser Glu Cys Leu Leu Val His Val Leu Gln Leu Lys Asn Pro
740 745 750
Ala Gly Leu Ala Val Lys Glu Asp Cys Lys Val His Ile Arg Val Tyr
755 760 765
Leu Pro Pro Leu Asp Ser Gly Thr Pro Asn Thr Tyr Cys Ser Lys Ala
770 775 780
Leu Glu Phe Gln Val Pro Leu Val Phe Asn Glu Val Phe Arg Ile Pro
785 790 795 800
Val His Ser Ser Ala Leu Thr Leu Lys Ser Leu Gln Leu Tyr Val Cys
805 810 815
Ser Val Thr Pro Gln Leu Gln Glu Glu Leu Leu Gly Ile Ala Gln Ile
820 825 830
Asn Leu Ala Asp Tyr Asp Ser Leu Ser Glu Met Gln Leu Arg Trp His
835 840 845
Ser Val Gln Val Phe Thr Ser Ser Glu Pro Ser Arg Thr Arg Glu Ala
850 855 860
Gly Cys Ala Gly Glu Ser Ser Ala Arg Asp Pro Ala His Thr Ile Ser
865 870 875 880
Ile Ser Gly Lys Thr Asp Ala Val Thr Val Leu Leu Ala Arg Thr Thr
885 890 895
Ala Gln Leu Gln Ala Val Glu Arg Glu Leu Ala Glu Glu Arg Ala Lys
900 905 910
Leu Glu Tyr Thr Glu Glu Glu Val Leu Glu Met Glu Arg Lys Glu Glu
915 920 925
Gln Ala Glu Ala Ile Ser Glu Arg Ser Trp Gln Ala Asp Ser Val Asp
930 935 940
Ser Gly Cys Ser Asn Cys Thr Gln Thr Ser Pro Pro Tyr Pro Glu Pro
945 950 955 960
Cys Cys Met Gly Ile Asp Ser Ile Leu Gly His Pro Phe Ala Ala Gln
965 970 975
Ala Gly Pro Tyr Ser Pro Glu Lys Phe Gln Pro Ser Pro Leu Lys Val
980 985 990
Asp Lys Glu Thr Asn Thr Glu Asp Leu Phe Leu Glu Glu Ala Ala Ser
995 1000 1005
Leu Val Lys Glu Arg Pro Ser Arg Arg Ala Arg Gly Ser Pro Phe
1010 1015 1020
Val Arg Ser Gly Thr Ile Val Arg Ser Gln Thr Phe Ser Pro Gly
1025 1030 1035
Ala Arg Ser Gln Tyr Val Cys Arg Leu Tyr Arg Ser Asp Ser Asp
1040 1045 1050
Ser Ser Thr Leu Pro Arg Lys Ser Pro Phe Val Arg Asn Thr Leu
1055 1060 1065
Glu Arg Arg Thr Leu Arg Tyr Lys Gln Ser Cys Arg Ser Ser Leu
1070 1075 1080
Ala Glu Leu Met Ala Arg Thr Ser Leu Asp Leu Glu Leu Asp Leu
1085 1090 1095
Gln Ala Ser Arg Thr Arg Gln Arg Gln Leu Asn Glu Glu Leu Cys
1100 1105 1110
Ala Leu Arg Glu Leu Arg Gln Arg Leu Glu Asp Ala Gln Leu Arg
1115 1120 1125
Gly Gln Thr Asp Leu Pro Pro Trp Val Leu Arg Asp Glu Arg Leu
1130 1135 1140
Arg Gly Leu Leu Arg Glu Ala Glu Arg Gln Thr Arg Gln Thr Lys
1145 1150 1155
Leu Asp Tyr Arg His Glu Gln Ala Ala Glu Lys Met Leu Lys Lys
1160 1165 1170
Ala Ser Lys Glu Ile Tyr Gln Leu Arg Gly Gln Ser His Lys Glu
1175 1180 1185
Pro Ile Gln Val Gln Thr Phe Arg Glu Lys Ile Ala Phe Phe Thr
1190 1195 1200
Arg Pro Arg Ile Asn Ile Pro Pro Leu Pro Ala Asp Asp Val
1205 1210 1215
<210> 6
<211> 3654
<212> DNA
<213> 智人(Homo sapiens)
<400> 6
atgccttggc tgagcggcgg ccggcggcga cggcggggac agccgcgcga ggccccgcgg 60
gagccgccgc cgtccgcgca gccccagcgg gaaccgccgc cgccggcgcc ccccgccgcg 120
gtccccacgc ccccagctcc ttccgcgccg ccgccgcggg cccgggagag cgccgagctg 180
ccgctgcccg ccggctggga ggaggcgcga gactacgacg gtcgcgtctt ttacattgac 240
cacaacacgc gccagacgtc gtggatcgac ccccgcgacc ggataacaaa gccattgacc 300
tttgccgatt gtgttgggga cgaacttcct ttaggatggg aaaccgtata tgataaacaa 360
attggagttt attacatgga ccacataaat aaacttaccc agattgagga tccaagagaa 420
cagtggaggc gagagcaaga gcgcatgttg aaggaatatt taattgtagc tcaggaggct 480
ctcaatgcca agaaagaaat ctaccagatt aagcagcagc ggttcgagct ggcccaggag 540
gaataccagc agctgcacaa aatgtgtgag gatgacagcc gctcgtacgc cagctcattc 600
tctggatatt caacaaatac aaagtatgac ccacaccaaa ttaaagcaga aatagcaagt 660
cgtcgggata ggctttccag attaaaacga gagctgaccc agatgaagca ggaactgcag 720
tacaaagaaa agggggtgga gaccctgcaa gagattgatc ggaagatgtc aagtactcac 780
accagctaca aactggatga ggcgcaggct atcatgagtg agctccggac catcaagaag 840
gccatttgca caggcgagaa ggagaggcgg gacctgatgc atagcctggc caagctgacc 900
gatagcttca agaacagctg ctccgttacc gactctctag tggacttccc tcaccatgta 960
ggcgtgcctg gcgatgctgg tgtaccccag cagttctgcg atgccggctc ccagactgat 1020
atcatcgggg agtttgtctt tgatgataaa acaagacttg tagaccgagt cagacttaat 1080
tggcaatatg aagaagccag aaagagagtc gccaacatcc agcagcagct ggcccggctt 1140
gacaatgagt cctggccaag cacggccgag gctgacaggg accggctgca gctcatcaag 1200
gagaaggagg ccctgctgca ggagcttcag ctcatcattg cacagcgccg ctctgcggga 1260
gatgtggccc ggctggagga ggagcgggag cgcctagagg aggagctgcg gcgtgcacgg 1320
gccacctccg cacagggcgc cacggagagg attctgcttc aggaaaaaag gaattgtcta 1380
cttatgcagc tggaagaagc cacccgctta acatcctacc tccagtccca gttaaaaagc 1440
ctgtgtgcca gcaccctgac ggtgtcctcg gggagcagcc gcgggtccct agcctccagc 1500
cgtgggtctc tggcctccag ccggggctcc ctgagctcgg tcagcttcac ggacatctac 1560
ggcctcccgc agtacgagaa gcccgacgct gagggcagcc agcttctacg cttcgacctc 1620
attcccttcg actctctggg gcgagatgct cccttttcag agcccccagg cccctcgggc 1680
ttccacaagc agaggcggtc cctggacacg ccccagtccc tggcatcgct gtcctcccgc 1740
tcctcgctgt cctcgctgtc gcccccaagc tcgcccctgg acacgccctt cctccctgcc 1800
tcacgggact cgccgctggc gcagctggcg gacagctgtg aggggccagg cctgggcgcc 1860
ctagacagac tgcgggcaca cgcctcggct atgggggacg aagacttacc aggcatggcg 1920
gcccttcagc cacacggggt ccccggggat ggggaagggc cgcacgagcg aggaccccca 1980
ccagccagcg ctcccgtggg tggaacagtg actcttcgag aagacagtgc caagaggttg 2040
gagaggaggg cacgccgcat ctccgcatgt ctgtcggatt attcgctagc cagcgacagt 2100
ggggtgtttg aacctctaac caaaaggaac gaagatgccg aggagcctgc ctacggagac 2160
acggccagta acggagatcc ccagatccac gtgggactcc tgcgcgacag tggcagcgag 2220
tgtctcctcg tgcacgtgct gcagctgaag aacccggcgg ggctggcggt gaaggaagac 2280
tgcaaagtcc acatccgagt ctatttgccc ccactggact cgggcacgcc caacacttac 2340
tgctccaagg ctctggagtt ccaagtgccg ctggtgttta acgaagtgtt cagaatcccc 2400
gtgcattcca gcgcgttgac actgaagtca cttcagttat acgtgtgttc agtgactccg 2460
cagctgcagg aagaactgct gggcattgct cagattaacc tggctgacta tgacagtttg 2520
agtgagatgc agctgcgctg gcattccgtg caggtgttca ccagctctga accatcaagg 2580
acgcgggagg ctgggtgtgc aggagagagc tccgcccggg accctgcaca caccatctcc 2640
atctccggca agacggatgc ggtgacggtg ctcctggcca gaaccacggc acagctgcag 2700
gcggtggaga gggaactggc cgaggagcgg gccaagctgg agtacacgga ggaggaggtc 2760
ctggagatgg agcgcaagga ggagcaggcc gaggccatat ccgagcggag ttggcaagcg 2820
gactcggtgg atagcggctg tagcaactgc acccagacca gccctccgta cccagagccc 2880
tgttgcatgg gtatcgactc catcctgggc cacccatttg ctgctcaggc agggccttac 2940
agccccgaga aatttcagcc ctcgcctctt aaggttgata aggaaaccaa cacggaagat 3000
ctctttctgg aagaagcagc cagcctcgtg aaggagcggc ccagccgccg ggcccgaggg 3060
tcgccttttg ttcggagtgg cacgattgtc cgttcccaga cattctcgcc tggagcacga 3120
agccagtatg tttgcagact ttatcgtagt gacagcgaca gttcaacgct gccccggaag 3180
tccccctttg tccgaaatac tttggaaaga cgaacccttc gctataagca gtcatgcagg 3240
tcttccctgg ctgagctcat ggcccgcacc tccctggact tggagctgga tctccaggcg 3300
tcgagaacac ggcagaggca gctgaatgag gagctctgcg ccctccgtga gctgcggcag 3360
cggttggagg acgcccagct ccgtggccag actgacctcc caccctgggt gcttcgggac 3420
gagcggctcc gtggcctgct gcgggaggcc gagcggcaga caagacagac caaacttgac 3480
taccgtcatg agcaggcggc tgagaagatg ctgaagaagg cctccaagga gatctaccag 3540
ctgcgtgggc agagccacaa agagcccatc caagtgcaga cctttaggga gaagatagca 3600
ttcttcacaa ggccaaggat caacatacct cctctcccag ccgacgacgt ctga 3654
<210> 7
<211> 1113
<212> PRT
<213> 乌干达红疣猴(Piliocolobus tephrosceles)
<400> 7
Met Pro Arg Pro Glu Leu Pro Leu Pro Glu Gly Trp Glu Glu Ala Arg
1 5 10 15
Asp Phe Asp Gly Lys Val Tyr Tyr Ile Asp His Thr Asn Arg Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Tyr Thr Lys Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Ser Asp Glu Leu Pro Leu Gly Trp Glu Glu Ala Tyr Asp
50 55 60
Pro Gln Val Gly Asp Tyr Phe Ile Asp His Asn Thr Lys Thr Thr Gln
65 70 75 80
Ile Glu Asp Pro Arg Val Gln Trp Arg Gln Glu Gln Glu His Met Leu
85 90 95
Lys Asp Tyr Leu Val Val Ala Gln Glu Ala Leu Ser Ala Gln Lys Glu
100 105 110
Ile Tyr Gln Val Lys Gln Gln Arg Leu Glu Leu Ala Gln Gln Glu Tyr
115 120 125
Gln Gln Leu His Ala Val Trp Glu His Lys Leu Gly Ser Gln Val Ser
130 135 140
Leu Val Ser Gly Ser Ser Ser Ser Ser Lys Tyr Asp Pro Glu Ile Leu
145 150 155 160
Lys Ala Glu Ile Ala Thr Ala Lys Ser Arg Val Asn Lys Leu Lys Arg
165 170 175
Glu Met Val His Leu Gln His Glu Leu Gln Phe Lys Glu Arg Gly Phe
180 185 190
Gln Thr Leu Lys Lys Ile Asp Lys Lys Met Ser Asp Ala Gln Gly Ser
195 200 205
Tyr Lys Leu Asp Glu Ala Gln Ala Val Leu Arg Glu Thr Lys Ala Ile
210 215 220
Lys Lys Ala Ile Thr Cys Gly Glu Lys Glu Lys Gln Asp Leu Ile Lys
225 230 235 240
Ser Leu Ala Met Leu Lys Asp Gly Phe His Thr Asp Arg Gly Ser His
245 250 255
Ser Asp Leu Trp Ser Ser Ser Ser Ser Leu Glu Ser Ser Ser Phe Pro
260 265 270
Leu Pro Lys Gln Tyr Leu Asp Val Ser Ser Gln Thr Asp Ile Ser Gly
275 280 285
Ser Phe Ser Ile Asn Ser Asn Asn Gln Leu Ala Glu Lys Val Arg Leu
290 295 300
Arg Leu Arg Tyr Glu Glu Ala Lys Arg Arg Ile Ala Asn Leu Lys Ile
305 310 315 320
Gln Leu Ala Lys Leu Asp Ser Glu Ala Trp Pro Gly Val Leu Asp Ser
325 330 335
Glu Arg Asp Arg Leu Ile Leu Ile Asn Glu Lys Glu Glu Leu Leu Lys
340 345 350
Glu Met Arg Phe Ile Ser Pro Arg Lys Trp Thr Gln Gly Glu Val Glu
355 360 365
Gln Leu Glu Met Ala Arg Lys Arg Leu Glu Lys Asp Leu Gln Ala Ala
370 375 380
Arg Asp Thr Gln Ser Lys Ala Leu Thr Glu Arg Leu Lys Leu Asn Ser
385 390 395 400
Lys Arg Asn Gln Leu Val Arg Glu Leu Glu Glu Ala Thr Arg Gln Val
405 410 415
Ala Thr Leu His Ser Gln Leu Lys Ser Leu Ser Ser Ser Met Gln Ser
420 425 430
Leu Ser Ser Gly Ser Ser Pro Gly Ser Leu Thr Ser Ser Arg Gly Ser
435 440 445
Leu Val Ala Ser Ser Leu Asp Ser Ser Thr Ser Ala Ser Phe Thr Asp
450 455 460
Leu Tyr Tyr Asp Pro Phe Glu Gln Leu Asp Ser Glu Leu Gln Ser Lys
465 470 475 480
Val Glu Phe Leu Leu Leu Glu Gly Ala Thr Gly Phe Arg Pro Ser Gly
485 490 495
Cys Ile Thr Thr Ile His Glu Asp Glu Val Ala Lys Thr Gln Lys Ala
500 505 510
Glu Gly Gly Gly Arg Leu Gln Ala Leu Arg Ser Leu Ser Gly Thr Pro
515 520 525
Lys Ser Met Thr Ser Leu Ser Pro Arg Ser Ser Leu Ser Ser Pro Ser
530 535 540
Pro Pro Cys Ser Pro Leu Met Ala Asp Pro Leu Leu Ala Gly Asp Ala
545 550 555 560
Phe Leu Asn Ser Leu Glu Phe Glu Asp Pro Glu Leu Ser Ala Thr Leu
565 570 575
Cys Glu Leu Ser Leu Gly Asn Ser Thr Gln Glu Arg Tyr Arg Leu Glu
580 585 590
Glu Pro Gly Thr Glu Gly Lys Gln Leu Gly Gln Ala Val Asn Thr Ala
595 600 605
Gln Gly Cys Gly Leu Lys Val Ala Cys Val Ser Ala Ala Val Ser Asp
610 615 620
Glu Ser Val Ala Gly Asp Ser Gly Val Tyr Glu Ala Ser Val Gln Arg
625 630 635 640
Leu Gly Ala Ser Glu Ala Ala Ala Phe Asp Ser Asp Glu Ser Glu Ala
645 650 655
Leu Gly Ala Ala Arg Val Gln Ile Ala Leu Lys Tyr Asp Glu Lys Asn
660 665 670
Lys Gln Phe Ala Ile Leu Ile Ile Gln Leu Ser Asn Leu Ser Ala Leu
675 680 685
Leu Gln Gln Gln Asp Gln Lys Val Asn Ile Arg Val Ala Val Leu Pro
690 695 700
Cys Ser Glu Ser Thr Thr Cys Leu Phe Arg Thr Arg Pro Leu Asp Ala
705 710 715 720
Ser Asp Thr Leu Val Phe Asn Glu Val Phe Trp Val Ser Met Ser Tyr
725 730 735
Pro Ala Leu His Gln Lys Thr Leu Arg Val Asp Val Cys Thr Thr Asp
740 745 750
Arg Ser His Leu Glu Glu Cys Leu Gly Gly Ala Gln Ile Ser Leu Ala
755 760 765
Glu Val Cys Arg Ser Gly Glu Arg Ser Thr Arg Trp Tyr Asn Leu Leu
770 775 780
Ser Tyr Lys Tyr Leu Lys Lys Gln Ser Arg Glu Leu Lys Pro Val Gly
785 790 795 800
Val Thr Ala Pro Ala Pro Gly Pro Ala Ser Thr Asp Ala Val Ser Ala
805 810 815
Leu Leu Glu Gln Thr Ala Val Glu Leu Glu Lys Arg Gln Glu Gly Arg
820 825 830
Ser Ser Thr Gln Thr Leu Glu Asp Ser Trp Arg Tyr Glu Glu Thr Ser
835 840 845
Glu Asn Glu Ala Val Ala Glu Glu Glu Glu Glu Glu Val Glu Glu Glu
850 855 860
Glu Glu Glu Glu Asp Val Phe Thr Glu Lys Ala Ser Pro Asp Met Asp
865 870 875 880
Gly Tyr Pro Ala Leu Lys Val Asp Lys Glu Thr Asn Thr Glu Thr Pro
885 890 895
Ala Pro Ser Pro Thr Val Val Arg Pro Lys Asp Arg Arg Val Gly Thr
900 905 910
Pro Ser Pro Gly Pro Phe Leu Arg Gly Ser Thr Ile Ile Arg Ser Lys
915 920 925
Thr Phe Ser Pro Gly Pro Gln Ser Gln Tyr Val Cys Arg Leu Asn Arg
930 935 940
Ser Asp Ser Asp Ser Ser Thr Leu Ser Lys Lys Pro Pro Phe Val Arg
945 950 955 960
Asn Ser Leu Glu Arg Arg Ser Val Arg Met Lys Arg Pro Ser Ser Val
965 970 975
Lys Ser Leu Arg Ser Glu Arg Leu Ile Arg Thr Ser Leu Asp Leu Glu
980 985 990
Leu Asp Leu Gln Ala Thr Arg Thr Trp His Ser Gln Leu Thr Gln Glu
995 1000 1005
Ile Ser Val Leu Lys Glu Leu Lys Glu Gln Leu Glu Gln Ala Lys
1010 1015 1020
Ser His Gly Glu Lys Glu Leu Pro Gln Trp Leu Arg Glu Asp Glu
1025 1030 1035
Arg Phe Arg Leu Leu Leu Arg Met Leu Glu Lys Arg Gln Met Asp
1040 1045 1050
Gln Ala Glu His Lys Gly Glu Leu Gln Thr Asp Lys Met Met Arg
1055 1060 1065
Ala Ala Ala Lys Asp Val His Arg Leu Arg Gly Gln Ser Cys Lys
1070 1075 1080
Glu Pro Pro Glu Val Gln Ser Phe Arg Glu Lys Met Ala Phe Phe
1085 1090 1095
Thr Arg Pro Arg Met Asn Ile Pro Ala Leu Ser Ala Asp Asp Val
1100 1105 1110
<210> 8
<211> 1112
<212> PRT
<213> 马(Equus caballus)
<400> 8
Met Pro Arg Pro Glu Leu Pro Leu Pro Glu Gly Trp Glu Glu Ala Arg
1 5 10 15
Asp Phe Asp Gly Lys Val Tyr Tyr Ile Asp His Thr Ser Arg Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Tyr Thr Lys Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Arg Asp Glu Leu Pro Leu Gly Trp Glu Glu Ala Tyr Asp
50 55 60
Pro Gln Val Gly Asp Tyr Phe Ile Asp His Asn Thr Lys Thr Thr Gln
65 70 75 80
Ile Glu Asp Pro Arg Val Gln Trp Arg Arg Glu Gln Glu His Met Leu
85 90 95
Lys Asp Tyr Leu Val Val Ala Gln Glu Ala Leu Ser Ala Gln Lys Glu
100 105 110
Ile Tyr Gln Val Lys Gln Gln Arg Leu Glu Leu Ala Gln Gln Glu Tyr
115 120 125
Gln Gln Leu His Ala Val Trp Glu His Lys Leu Gly Ser Gln Val Ser
130 135 140
Leu Ile Ser Gly Ser Ser Ser Ser Ser Lys Tyr Asp Pro Glu Ile Leu
145 150 155 160
Lys Ala Glu Ile Ala Thr Ala Lys Ser Arg Val Asn Lys Leu Lys Arg
165 170 175
Glu Met Val His Leu Gln Gln Glu Leu Gln Phe Lys Glu Arg Gly Phe
180 185 190
Gln Thr Leu Lys Thr Ile Asp Lys Lys Met Ser Asp Ala Gln Gly Ser
195 200 205
Tyr Lys Leu Asp Glu Ala Gln Ala Val Leu Arg Glu Thr Lys Ala Ile
210 215 220
Lys Lys Ala Ile Thr Cys Gly Glu Lys Glu Lys Gln Asp Leu Ile Lys
225 230 235 240
Ser Leu Ala Met Leu Lys Asp Gly Phe Arg Thr Asp Arg Gly Ser His
245 250 255
Ser Asp Leu Trp Ser Ser Ser Ser Ser Leu Glu Ser Ser Ser Phe Pro
260 265 270
Leu Ser Lys Gln Tyr Leu Asp Val Ser Ser Gln Thr Asp Ile Ser Gly
275 280 285
Gly Cys Gly Thr Ser Ser Asn Asn Gln Leu Ala Glu Lys Val Arg Leu
290 295 300
Arg Leu Arg Tyr Glu Glu Ala Lys Arg Arg Ile Ala Asn Leu Lys Ile
305 310 315 320
Gln Leu Ala Lys Leu Asp Ser Glu Ala Trp Pro Gly Val Leu Asp Ser
325 330 335
Glu Arg Asp Arg Leu Ile Leu Ile Asn Glu Lys Glu Glu Leu Leu Lys
340 345 350
Glu Met Arg Phe Ile Ser Pro Arg Lys Trp Thr Gln Gly Glu Val Glu
355 360 365
Gln Leu Glu Met Ala Arg Lys Arg Leu Glu Lys Asp Leu Gln Ala Ala
370 375 380
Arg Asp Thr Gln Ser Lys Ala Leu Thr Glu Arg Leu Lys Phe Asn Ser
385 390 395 400
Lys Arg Asn Gln Leu Val Arg Glu Leu Glu Glu Ala Thr Arg Gln Leu
405 410 415
Ala Ala Leu His Ser Gln Leu Lys Ser Leu Ser Ser Ser Met Gln Ser
420 425 430
Leu Ser Ser Gly Ser Ser Pro Gly Ser Leu Thr Ser Ser Arg Gly Ser
435 440 445
Leu Ala Ala Ser Ser Leu Asp Ser Ser Thr Ser Ala Ser Phe Thr Asp
450 455 460
Leu Tyr Tyr Asp Pro Phe Glu Gln Leu Asp Ser Glu Leu Gln Ser Lys
465 470 475 480
Val Glu Phe Leu Leu Leu Glu Gly Ala Thr Gly Phe Arg Pro Ser Gly
485 490 495
Cys Ile Thr Thr Ile His Glu Asp Glu Val Ala Lys Thr Gln Lys Ala
500 505 510
Glu Gly Gly Ser Arg Leu Gln Ala Leu Arg Ser Leu Ser Gly Thr Pro
515 520 525
Lys Ser Met Thr Ser Leu Ser Pro Arg Ser Ser Leu Ser Ser Pro Ser
530 535 540
Pro Pro Cys Ser Pro Leu Ile Ala Asp Pro Leu Leu Ala Gly Asp Ala
545 550 555 560
Phe Leu Ser Ala Leu Glu Phe Glu Asp Pro Glu Leu Ser Ala Thr Leu
565 570 575
Cys Gly Leu Ser Leu Gly Ser Ser Thr Arg Glu Arg Cys Arg Leu Glu
580 585 590
Glu Pro Gly Thr Glu Gly Lys Gln Pro Gly Gln Ala Val Asn Ser Ala
595 600 605
Pro Gly Cys Thr Leu Lys Val Ala Cys Val Ser Ala Ala Val Ser Asp
610 615 620
Glu Ser Val Ala Gly Asp Ser Gly Val Tyr Glu Ala Ser Val Gln Arg
625 630 635 640
Leu Gly Ala Ser Glu Ala Ala Ala Phe Asp Ser Asp Glu Ser Glu Ala
645 650 655
Val Gly Ala Thr Arg Val Gln Ile Ala Leu Lys Tyr Asp Glu Lys Asn
660 665 670
Lys Gln Phe Ala Ile Leu Ile Ile Gln Leu Ser Asn Leu Ser Ala Leu
675 680 685
Leu Leu Gln Gln Asp Gln Lys Val Asn Ile Arg Val Ala Ile Leu Pro
690 695 700
Cys Ser Glu Ser Thr Thr Cys Leu Phe Arg Thr Arg Pro Leu Asp Ala
705 710 715 720
Ser Asp Ala Leu Val Phe Asn Glu Val Phe Trp Val Ser Met Ser Tyr
725 730 735
Pro Ala Leu His Gln Lys Thr Leu Arg Val Asp Val Cys Thr Thr Asp
740 745 750
Arg Ser His Leu Glu Glu Cys Leu Gly Gly Ala Gln Ile Ser Leu Ala
755 760 765
Glu Val Cys Arg Ser Gly Glu Arg Ser Thr Arg Trp Tyr Asn Leu Leu
770 775 780
Ser Tyr Lys Tyr Leu Lys Lys Gln Ser Arg Glu Pro Lys Pro Val Gly
785 790 795 800
Ala Thr Ala Ala Thr Pro Gly Pro Glu Ser Thr Asp Ala Val Ser Ala
805 810 815
Leu Leu Glu Gln Thr Ala Val Glu Leu Glu Lys Arg Gln Glu Gly Arg
820 825 830
Ser Ser Thr Gln Thr Leu Glu Asp Ser Trp Arg Tyr Glu Glu Glu Ala
835 840 845
Ser Glu Asn Glu Ala Ala Ala Glu Glu Glu Asp Gly Glu Glu Glu Glu
850 855 860
Glu Gly Glu Glu Asp Val Phe Ala Glu Lys Ala Ser Pro Asp Met Asp
865 870 875 880
Glu Cys Pro Ala Ser Lys Val Asp Lys Glu Thr Asn Thr Glu Thr Pro
885 890 895
Thr Pro Ser Pro Thr Val Val Arg Pro Lys Asp Arg Arg Val Gly Thr
900 905 910
Pro Ser Ser Gly Pro Phe Leu Arg Gly Ser Thr Ile Ile Arg Ser Lys
915 920 925
Thr Phe Ser Pro Gly Pro Gln Ser Gln Tyr Val Cys Arg Leu Asn Arg
930 935 940
Ser Asp Ser Asp Ser Ser Thr Leu Ser Lys Lys Pro Pro Phe Val Arg
945 950 955 960
Asn Ser Leu Glu Arg Arg Ser Val Arg Met Lys Arg Pro Ser Ser Val
965 970 975
Lys Ser Val Arg Ala Glu Arg Leu Met Arg Thr Ser Leu Asp Leu Glu
980 985 990
Leu Asp Leu Gln Ala Thr Arg Thr Trp His Ser Gln Leu Thr Gln Glu
995 1000 1005
Ile Ser Val Leu Lys Glu Phe Lys Glu Gln Leu Glu Gln Ala Lys
1010 1015 1020
Ser His Gly Glu Lys Glu Leu Pro Gln Trp Leu Arg Glu Asp Glu
1025 1030 1035
Arg Phe Arg Leu Leu Leu Arg Met Leu Glu Lys Arg Met Asp Arg
1040 1045 1050
Ala Glu His Lys Gly Glu Leu Gln Thr Asp Lys Met Met Arg Ala
1055 1060 1065
Ala Ala Lys Asp Val His Arg Leu Arg Gly Gln Ser Cys Lys Glu
1070 1075 1080
Pro Pro Glu Val Gln Ser Phe Arg Glu Lys Met Ala Phe Phe Thr
1085 1090 1095
Arg Pro Arg Met Asn Val Pro Ala Leu Ser Ala Asp Asp Val
1100 1105 1110
<210> 9
<211> 1104
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 9
Met Pro Arg Pro Glu Leu Pro Leu Pro Glu Gly Trp Glu Glu Ala Arg
1 5 10 15
Asp Phe Asp Gly Lys Val Tyr Tyr Ile Asp His Arg Asn Arg Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Tyr Thr Lys Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Ser Asp Glu Leu Pro Leu Gly Trp Glu Glu Ala Tyr Asp
50 55 60
Pro Gln Val Gly Asp Tyr Phe Ile Asp His Asn Thr Lys Thr Thr Gln
65 70 75 80
Ile Glu Asp Pro Arg Val Gln Trp Arg Arg Glu Gln Glu His Met Leu
85 90 95
Lys Asp Tyr Leu Val Val Ala Gln Glu Ala Leu Ser Ala Gln Lys Glu
100 105 110
Ile Tyr Gln Val Lys Gln Gln Arg Leu Glu Leu Ala Gln Gln Glu Tyr
115 120 125
Gln Gln Leu His Ala Val Trp Glu His Lys Leu Gly Ser Gln Val Ser
130 135 140
Leu Val Ser Gly Ser Ser Ser Ser Ser Lys Tyr Asp Pro Glu Ile Leu
145 150 155 160
Lys Ala Glu Ile Ala Thr Ala Lys Ser Arg Val Asn Lys Leu Lys Arg
165 170 175
Glu Met Val His Leu Gln His Glu Leu Gln Phe Lys Glu Arg Gly Phe
180 185 190
Gln Thr Leu Lys Lys Ile Asp Glu Arg Met Ser Asp Ala Gln Gly Gly
195 200 205
Tyr Lys Leu Asp Glu Ala Gln Ala Val Leu Arg Glu Thr Lys Ala Ile
210 215 220
Lys Lys Ala Ile Thr Cys Gly Glu Lys Glu Lys Gln Asp Leu Ile Lys
225 230 235 240
Ser Leu Ala Met Leu Lys Asp Gly Phe Arg Thr Asp Arg Gly Ser His
245 250 255
Ser Asp Leu Trp Ser Ser Ser Ser Ser Leu Glu Ser Ser Ser Phe Pro
260 265 270
Met Pro Lys Gln Phe Leu Asp Val Ser Ser Gln Thr Asp Ile Ser Gly
275 280 285
Ser Phe Ser Thr Ser Ser Asn Asn Gln Leu Ala Glu Lys Val Arg Leu
290 295 300
Arg Leu Arg Tyr Glu Glu Ala Lys Arg Arg Ile Ala Asn Leu Lys Ile
305 310 315 320
Gln Leu Ala Lys Leu Asp Ser Glu Ala Trp Pro Gly Val Leu Asp Ser
325 330 335
Glu Arg Asp Arg Leu Ile Leu Ile Asn Glu Lys Glu Glu Leu Leu Lys
340 345 350
Glu Met Arg Phe Ile Ser Pro Arg Lys Trp Thr Gln Gly Glu Val Glu
355 360 365
Gln Leu Glu Met Ala Arg Arg Arg Leu Glu Lys Asp Leu Gln Ala Ala
370 375 380
Arg Asp Thr Gln Ser Lys Ala Leu Thr Glu Arg Leu Lys Leu Asn Ser
385 390 395 400
Lys Arg Asn Gln Leu Val Arg Glu Leu Glu Glu Ala Thr Arg Gln Val
405 410 415
Ala Thr Leu His Ser Gln Leu Lys Ser Leu Ser Ser Ser Met Gln Ser
420 425 430
Leu Ser Ser Gly Ser Ser Pro Gly Ser Leu Thr Ser Ser Arg Gly Ser
435 440 445
Leu Ala Ala Ser Ser Leu Asp Ser Ser Thr Ser Ala Ser Phe Thr Asp
450 455 460
Leu Tyr Tyr Asp Pro Phe Glu Gln Leu Asp Ser Glu Leu Gln Ser Lys
465 470 475 480
Val Glu Leu Leu Phe Leu Glu Gly Ala Thr Gly Phe Arg Pro Ser Gly
485 490 495
Cys Ile Thr Thr Ile His Glu Asp Glu Val Ala Lys Thr Gln Lys Ala
500 505 510
Glu Gly Gly Ser Arg Leu Gln Ala Leu Arg Ser Leu Ser Gly Thr Pro
515 520 525
Arg Ser Met Thr Ser Leu Ser Pro Arg Ser Ser Leu Ser Ser Pro Ser
530 535 540
Pro Pro Cys Ser Pro Leu Ile Thr Asp Pro Leu Leu Thr Gly Asp Ala
545 550 555 560
Phe Leu Ala Pro Leu Glu Phe Glu Asp Thr Glu Leu Ser Thr Thr Leu
565 570 575
Cys Glu Leu Asn Leu Gly Gly Ser Gly Thr Gln Glu Arg Tyr Arg Leu
580 585 590
Glu Glu Pro Gly Pro Glu Gly Lys Pro Leu Gly Gln Ala Ala Ser Val
595 600 605
Ala Pro Gly Cys Gly Leu Lys Val Ala Cys Val Ser Ala Ala Val Ser
610 615 620
Asp Glu Ser Val Ala Gly Asp Ser Gly Val Tyr Glu Ala Ser Ala Gln
625 630 635 640
Arg Pro Gly Thr Ser Glu Ala Ala Ala Phe Asp Ser Asp Glu Ser Glu
645 650 655
Ala Val Gly Ala Thr Arg Val Gln Ile Ala Leu Lys Tyr Asp Glu Lys
660 665 670
Asn Lys Gln Phe Ala Ile Leu Ile Ile Gln Leu Ser His Leu Ser Ala
675 680 685
Leu Ser Leu Gln Gln Asp Gln Lys Val Asn Ile Arg Val Ala Ile Leu
690 695 700
Pro Cys Ser Glu Ser Ser Thr Cys Leu Phe Arg Thr Arg Pro Leu Asp
705 710 715 720
Ser Ala Asn Thr Leu Val Phe Asn Glu Ala Phe Trp Val Ser Ile Ser
725 730 735
Tyr Pro Ala Leu His Gln Lys Thr Leu Arg Val Asp Val Cys Thr Thr
740 745 750
Asp Arg Ser His Thr Glu Glu Cys Leu Gly Gly Ala Gln Ile Ser Leu
755 760 765
Ala Glu Val Cys Arg Ser Gly Glu Arg Ser Thr Arg Trp Tyr Asn Leu
770 775 780
Leu Ser Tyr Lys Tyr Leu Lys Lys Gln Cys Arg Glu Pro Gln Pro Thr
785 790 795 800
Glu Ala Pro Gly Pro Asp His Val Asp Ala Val Ser Ala Leu Leu Glu
805 810 815
Gln Thr Ala Val Glu Leu Glu Lys Arg Gln Glu Gly Arg Ser Ser Ser
820 825 830
Gln Thr Leu Glu Gly Ser Trp Thr Tyr Glu Glu Glu Ala Ser Glu Asn
835 840 845
Glu Ala Val Ala Glu Glu Glu Glu Glu Gly Glu Glu Asp Val Phe Thr
850 855 860
Glu Lys Val Ser Pro Glu Ala Glu Glu Cys Pro Ala Leu Lys Val Asp
865 870 875 880
Arg Glu Thr Asn Thr Asp Ser Val Ala Pro Ser Pro Thr Val Val Arg
885 890 895
Pro Lys Asp Arg Arg Val Gly Ala Pro Ser Thr Gly Pro Phe Leu Arg
900 905 910
Gly Asn Thr Ile Ile Arg Ser Lys Thr Phe Ser Pro Gly Pro Gln Ser
915 920 925
Gln Tyr Val Cys Arg Leu Asn Arg Ser Asp Ser Asp Ser Ser Thr Leu
930 935 940
Ser Lys Lys Pro Pro Phe Val Arg Asn Ser Leu Glu Arg Arg Ser Val
945 950 955 960
Arg Met Lys Arg Pro Ser Ser Val Lys Ser Leu Arg Thr Glu Arg Leu
965 970 975
Ile Arg Thr Ser Leu Asp Leu Glu Leu Asp Leu Gln Ala Thr Arg Thr
980 985 990
Trp His Ser Gln Leu Thr Gln Glu Ile Ser Val Leu Lys Glu Leu Lys
995 1000 1005
Glu His Leu Glu Gln Ala Lys Asn His Gly Glu Lys Glu Leu Pro
1010 1015 1020
Gln Trp Leu Arg Glu Asp Glu Arg Phe Arg Leu Leu Leu Arg Met
1025 1030 1035
Leu Glu Lys Lys Val Asp Arg Gly Glu His Lys Ser Glu Leu Gln
1040 1045 1050
Ala Asp Lys Met Met Arg Ala Ala Ala Lys Asp Val His Arg Leu
1055 1060 1065
Arg Gly Gln Ser Cys Lys Glu Pro Pro Glu Val Gln Ser Phe Arg
1070 1075 1080
Glu Lys Met Ala Phe Phe Thr Arg Pro Arg Met Asn Ile Pro Ala
1085 1090 1095
Leu Ser Ala Asp Asp Val
1100
<210> 10
<211> 1123
<212> PRT
<213> 原鸡(Gallus gallus)
<400> 10
Met Pro Arg Lys Glu Leu Pro Leu Pro Ala Gly Trp Glu Glu Ala Arg
1 5 10 15
Asp Tyr Asp Gly Lys Val Tyr Tyr Ile Asp His Gly Ser Arg Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Tyr Thr Lys Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Ser Asp Glu Leu Pro Leu Gly Trp Glu Glu Ala Tyr Asp
50 55 60
Pro Gln Val Gly Val Tyr Tyr Ile Asp His Asn Thr Lys Thr Thr Gln
65 70 75 80
Ile Glu Asp Pro Arg Val Gln Trp Arg Arg Glu Gln Glu His Met Leu
85 90 95
Lys Asp Tyr Leu Val Leu Ala Gln Glu Ala Ile Ala Ala Gln Lys Glu
100 105 110
Ile Tyr Gln Val Lys Gln Gln Arg Leu Glu Leu Ala Gln Gln Glu Tyr
115 120 125
Arg Gln Leu His Asp Val Trp Glu His Lys Leu Gly Ser Gln Thr Ser
130 135 140
Leu Leu Ser Gly Ser Ser Ser Ser Ser Lys Tyr Asp Pro Glu Ile Leu
145 150 155 160
Lys Ala Glu Ile Ala Thr Thr Lys Ser Arg Val Asn Lys Leu Lys Arg
165 170 175
Glu Val Ala His Met Lys Gln Glu Ile Gln Tyr Lys Glu His Gly Phe
180 185 190
Gln Thr Leu Lys Asn Ile Asp Met Lys Met Ser Asp Thr Gln Gly Gly
195 200 205
Tyr Lys Leu Asp Glu Ala Gln Ala Ile Leu Ser Glu Met Lys Ala Leu
210 215 220
Lys Lys Ala Ile Thr Ser Gly Glu Lys Glu Lys Gln Asp Leu Ile Gln
225 230 235 240
Ser Leu Ala Arg Leu Lys Asp Ser Phe Val Asn Asp Arg Gly Ser Gln
245 250 255
Ser Asp Leu Trp Ala Ser Ser Val Ser Leu Glu Ser Ser Ser Pro Ser
260 265 270
Leu Pro Arg Gln Tyr Leu Asp Val Ser Ser Gln Thr Asp Val Ser Gly
275 280 285
Asn Phe Ile Thr Ser Ser Asn Asn Gln Leu Ala Glu Lys Val Arg Leu
290 295 300
Arg Leu Arg Tyr Glu Glu Ala Lys Arg Arg Ile Gly Asn Leu Lys Ile
305 310 315 320
Gln Leu Ala Lys Leu Asp Ser Glu Ala Trp Pro Gly Val Leu Asp Ser
325 330 335
Glu Arg Asp Arg Leu Ile Leu Ile Asn Glu Lys Glu Glu Leu Leu Lys
340 345 350
Glu Met Arg Phe Ile Ser Pro Arg Lys Trp Thr Arg Gly Glu Val Glu
355 360 365
Arg Leu Glu Thr Glu Arg Lys Arg Leu Glu Glu Asp Leu Gln Ala Ala
370 375 380
Arg Asp Thr Gln Ser Lys Ala Leu Thr Glu Arg Leu Lys Leu Asn Ser
385 390 395 400
Lys Arg Asn Gln Leu Val Arg Glu Leu Glu Glu Thr Thr Arg Leu Val
405 410 415
Ala Met Leu His Thr Gln Leu Lys Ser Leu Ser Ala Ser Met Leu Ser
420 425 430
Leu Ser Ser Ser Ser Ser Pro Gly Ser Leu Ala Ser Ser Arg Gly Ser
435 440 445
Leu Ala Thr Ser Ser Gln Asp Ser Ser Thr Ser Ala Ser Phe Thr Asp
450 455 460
Leu Tyr Cys Glu His Met Glu Gln Leu Glu Gln Leu Glu Gln Leu Asp
465 470 475 480
Ser Asp Tyr Gln Asn Lys Leu Asp Leu Leu Leu Glu Gly Ala Thr Gly
485 490 495
Phe Arg Pro Ser Gly Cys Ile Thr Thr Ile His Glu Asn Glu Val Ala
500 505 510
Lys Thr His Lys Thr Asp Ala Thr Ser Arg Ile Gln Ala Leu Arg Ser
515 520 525
Leu Ser Gly Thr Pro Lys Ser Met Thr Ser Leu Ser Pro Arg Ser Ser
530 535 540
Leu Ser Ser Pro Ser Pro Pro Cys Ser Pro Leu Val Ile Asp Pro Leu
545 550 555 560
Leu Gly Gly Asp Ala Phe Ser Ser His Met Asp Phe Asp Asp Thr Glu
565 570 575
Ile Ser Thr Asn Leu Ser Glu Leu Thr Leu Asn Ile Glu Ser Gly Asn
580 585 590
Cys Arg Leu Glu Glu Pro Arg Ala Gly Asp Lys His Leu Asp Gln Gly
595 600 605
Val Asn Thr Ala Gly Gly Thr Ala Leu Lys Val Ala Cys Val Ser Ala
610 615 620
Ala Val Ser Asp Glu Ser Val Ala Gly Asp Ser Gly Val Tyr Glu Ala
625 630 635 640
Ser Val Gln Arg Pro Cys Ala Ser Glu Val Met Val Phe Asp Ser Asp
645 650 655
Asp Thr Glu Ala Ala Gly Thr Ala Lys Val Gln Ile Ala Met Arg Tyr
660 665 670
Asp Glu Lys Asn Lys Gln Phe Ala Ile Leu Val Ile Gln Leu Ser Asn
675 680 685
Val Gln Ala Leu Leu Leu Gln Gln Asp Gln Lys Val Asn Ile Arg Val
690 695 700
Ala Val Leu Pro Cys Leu Glu Ser Thr Ser Cys Leu Phe Arg Thr Arg
705 710 715 720
Pro Leu Glu Val Ser Asp Asn Leu Met Tyr Asn Glu Val Phe Trp Val
725 730 735
Ser Ile Ser Tyr Pro Ala Leu Arg Gln Lys Thr Leu Arg Val Asp Val
740 745 750
Cys Thr Val Asp Lys Ser Arg Leu Glu Glu Cys Leu Gly Gly Ala Gln
755 760 765
Ile Ser Leu Ala Glu Ile Cys Arg Ser Gly Glu Lys Ser Thr Arg Trp
770 775 780
Tyr Asn Leu Leu Ser Ser Lys Tyr Leu Gln Lys Gln Asn Arg Lys Ser
785 790 795 800
Lys Gln Gly Thr Ile His Ser Glu Ile Ala Cys Thr Asp Lys Thr Asp
805 810 815
Ser Val Ser Ala Leu Leu Glu Gln Thr Ala Val Glu Leu Glu Ala Val
820 825 830
Glu Lys Lys Leu Glu Glu Ser Arg Thr Thr Leu Thr Ser Gly Glu Ser
835 840 845
Trp Arg Asp Glu Glu Val Ala Glu Gln Glu Glu Leu Asp Glu Ile Ser
850 855 860
Glu Asn Glu Ala Glu Glu Glu Glu Glu Phe Cys Ala Gly Lys Leu Leu
865 870 875 880
Trp Glu Thr Glu Glu Ser Leu Asn Ser His Pro His Val Glu Met Ala
885 890 895
Val Lys Val Asp Lys Glu Thr Asn Thr Glu Ser Leu Ala Gln Ser Ser
900 905 910
Ala Val Val Arg Pro Lys Asp Lys Arg Ala Ala Asn Pro Pro Gln Thr
915 920 925
Gln Phe Val Arg Gly Ser Thr Ile Ile Arg Ser Lys Thr Phe Ser Pro
930 935 940
Gly Pro Gln Ser Gln Tyr Val Cys Arg Leu Asn Arg Ser Asp Ser Asp
945 950 955 960
Ser Ser Thr Leu Ser Lys Lys Thr Pro Phe Val Arg Asn Ala Met Glu
965 970 975
Arg Arg Ser Val Arg Val Lys Arg Pro Ser Ile Lys Ser Ala Gly Thr
980 985 990
Glu Arg Leu Ile Arg Thr Ser Leu Asp Leu Glu Leu Asp Leu Gln Ala
995 1000 1005
Ser Lys Thr Trp His Asp Arg Leu Val Gln Glu Ile Ser Val Leu
1010 1015 1020
Arg Glu Leu Lys Glu Gln Leu Glu Gln Ala Gln Ser Gln Gly Glu
1025 1030 1035
Lys Glu Leu Pro Gln Trp Val Lys Asp Asp Glu Arg Phe Arg Leu
1040 1045 1050
Leu Leu Arg Leu Val Glu Lys Arg Val Glu Lys Thr Glu His Arg
1055 1060 1065
Cys Glu Leu Lys Ala Asp Lys Met Met Arg Ala Ala Ala Lys Asp
1070 1075 1080
Val His Arg Leu Arg Gly Gln Ser Arg Lys Glu Pro Leu Glu Val
1085 1090 1095
Gln Ser Phe Arg Glu Lys Met Ala Phe Phe Thr Arg Pro Arg Ile
1100 1105 1110
Asn Ile Pro Thr Leu Ser Ala Asp Asp Val
1115 1120
<210> 11
<211> 1108
<212> PRT
<213> 非洲爪蟾(Xenopus laevis)
<400> 11
Met Ile Arg Lys Glu Leu Pro Leu Pro Asp Gly Trp Glu Glu Ala His
1 5 10 15
Asp Val Asp Gly Lys Val Tyr Tyr Ile Asp His Ala Ser Lys Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Phe Thr Lys Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Gly Asp Glu Leu Pro Leu Gly Trp Glu Glu Cys Tyr Asp
50 55 60
Pro Gln Val Gly Val Tyr Tyr Ile Asp His Asn Ser Gln Thr Thr Gln
65 70 75 80
Ile Glu Asp Pro Arg Val Gln Trp Arg Arg Glu Gln Glu Arg Met Leu
85 90 95
Lys Asp Tyr Leu Val Leu Ala Gln Glu Ala Leu Leu Ala Gln Lys Glu
100 105 110
Ile Tyr Gln Val Lys Gln Gln Arg Leu Glu Leu Ala Gln Lys Glu Tyr
115 120 125
Arg Thr Leu Asn Asp Val Trp Lys His Lys Val Gly Ser Gln Thr Ser
130 135 140
Leu Val Ser Gly Ser Ser Ser Ser Ser Lys Tyr Asp Pro Asp Ile Leu
145 150 155 160
Lys Ala Glu Ile Ala Thr Thr Lys Ser Arg Val Lys Lys Leu Lys Arg
165 170 175
Glu Thr Val Phe Leu Arg Gln Glu Leu Gln Tyr Lys Glu Asn Gly Tyr
180 185 190
Gln Thr Leu Lys Glu Ile Asp Leu Lys Met Ser Gly Asn His Cys Ala
195 200 205
Tyr Lys Leu Asp Glu Ala Gln Ala Ile Leu Asn Glu Met Lys Ala Ile
210 215 220
Lys Lys Ala Ile Thr Ser Gly Glu Arg Glu Lys Gln Asp Leu Ile Gln
225 230 235 240
Ser Leu Ala Glu Leu Lys Asn Gly Phe Leu Ile Asp Lys Gly Ser Gln
245 250 255
Ser Asp Leu Trp Ala Ser Asp Thr Ser Leu Ala Ser Ser Ala Asn Ser
260 265 270
Leu Pro Arg His Tyr Leu Asn Val Ser Ser Gln Thr Asp Ile Ser Gly
275 280 285
His Leu Ser Val Val Ser Asn Asn His Leu Ala Glu Lys Val Arg Leu
290 295 300
Gln Leu Arg Tyr Glu Glu Ala Lys Arg Arg Ile Ala Asn Ile Lys Ile
305 310 315 320
Gln Leu Ser Lys Ile Asp Thr Asp Ala Trp Pro Gly Val Leu Asp Ser
325 330 335
Glu Arg Asp Arg Leu Ile Leu Ile Ser Glu Lys Glu Glu Leu Leu Lys
340 345 350
Glu Met Arg Phe Ile Ser Pro Arg Lys Trp Ser Gln Ser Glu Val Glu
355 360 365
Arg Leu Glu Ser Glu Lys Asn Arg Leu Glu Glu Asp Leu Gln Ala Val
370 375 380
Arg Asp Thr Gln Ser Lys Ala Leu Thr Glu Arg Leu Lys Met Ser Ser
385 390 395 400
Lys Arg Asn Gln Leu Val Lys Glu Leu Glu Glu Thr Thr Arg Leu Ile
405 410 415
Ala Ser Leu Gln Ala Gln Leu Lys Cys Leu Ser Thr Ser Met Gln Ser
420 425 430
Leu Ser Ser Gly Ser Ser Pro Gly Ser Leu Ala Ser Ser Arg Gly Ser
435 440 445
Leu Ala Thr Ser Ser Gln Asp Ser Ser Thr Ser Thr Ser Val Ser Asp
450 455 460
Leu Tyr Tyr Glu Gln Leu Asp His Phe Asp Ser Val Tyr Gln Asn Lys
465 470 475 480
Val Asp Phe Phe Ile Gln Glu Gly Ala Ile Gly Tyr Arg Pro Ser Gly
485 490 495
Cys Ile Thr Thr Ile His Glu Asn Glu Val Val Arg Pro Arg Lys Pro
500 505 510
Asp Pro Ala Asn Arg Val Gln Ala Leu Arg Ser Leu Ser Gly Thr Pro
515 520 525
Lys Ser Met Thr Ser Leu Ser Pro Arg Ser Ser Leu Ser Ser Pro Ser
530 535 540
Pro Pro Cys Ser Pro Leu Val Thr Asp Pro Leu Leu Thr Val Asp Ala
545 550 555 560
Phe Leu Ser Gln Ile Asp Phe Glu Asp Ile Asp Leu Pro Leu Ser Phe
565 570 575
Thr Glu Arg Asp Val Asn Ala Gly Arg Asp Gly Tyr Gln His Gln Thr
580 585 590
Asp Gly Lys Pro Ser Gly Gln Gly Leu Asn Cys Leu Gly Glu Ser Ser
595 600 605
Leu Asn Val Ala Arg Val Ser Ala Ala Val Ser Asp Glu Ser Val Thr
610 615 620
Gly Asp Ser Gly Val Tyr Glu Ala Thr Asn Gln Arg Thr Leu Ile Glu
625 630 635 640
Asn Ala Val Phe Asp Gly Glu Asp Ser Glu Thr Met Asp Thr Ala Lys
645 650 655
Ile Lys Ile Arg Met Lys Tyr Asp Glu Lys Asn Lys Gln Phe Val Val
660 665 670
Phe Val Ile Gln Leu Asp Asn Ser Ala Ala Leu Leu Leu Asp Gln Asp
675 680 685
Glu Lys Leu Tyr Ile Arg Val Ala Val Leu Pro Cys Ser Glu Ser Thr
690 695 700
Ser Cys Leu Phe Arg Thr Arg Ala Leu Glu Gln Ser Asp Thr Leu Leu
705 710 715 720
Tyr Asn Glu Met Phe Leu Val Ala Thr Ser His Thr Asp Leu Arg Gln
725 730 735
Lys Thr Leu Arg Val Asp Val Cys Thr Arg Gln Asn Asn His His Glu
740 745 750
Glu Cys Leu Gly Gly Ser Gln Ile Ser Leu Ala Asp Val Cys His Ser
755 760 765
Glu Gly Gln Glu Ala His Trp Tyr Asn Leu Leu Ser Tyr Arg Tyr Leu
770 775 780
Lys Arg Gln Ser Lys Ile Ser Lys Gln Lys Met Ser Ser Ser Glu Glu
785 790 795 800
Ser Gly Ile Gly Asn Pro Glu Ser Val Ser Ala Leu Leu Lys Gln Thr
805 810 815
Ala Ala Glu Leu Glu Ala Val Arg Lys Gln Ile Gly Glu Ser Thr Glu
820 825 830
Ala Pro Glu Tyr Asn Trp Pro Glu Lys Lys Asp Asn Val Pro Asp Gln
835 840 845
Asp Gly Phe Gly Glu Asn Glu Gly Glu Glu Glu Phe Asp Glu Glu Val
850 855 860
Gln Cys Glu Thr Glu Glu Ser Asp Lys Gln Ala Ala Thr Asp Ser Asp
865 870 875 880
Phe Val Lys Val Asp Lys Glu Thr Asn Thr Glu Gly Leu Ala Leu Pro
885 890 895
Ser Ser Ser Val Arg Pro Lys Asp Lys Arg Ala Ala Asn Pro Met Gln
900 905 910
Ala Pro Phe Ile Arg Gly Ser Thr Ile Ile Arg Ser Lys Thr Phe Ser
915 920 925
Pro Gly Pro Gln Ser Gln Tyr Ile Cys Arg Leu Asn Arg Ser Asp Ser
930 935 940
Asp Ser Ser Thr Leu Ser Lys Lys Pro Pro Phe Val Arg Ser Ala Val
945 950 955 960
Glu Arg Arg Ser Val Arg Val Lys Arg Pro Pro Val Lys Ser Ser Gly
965 970 975
Ser Glu Arg Leu Ile Arg Thr Ser Leu Asp Leu Glu Leu Asp Leu Gln
980 985 990
Ala Ser Arg Met Trp Asn His Gln Leu Thr Gln Glu Ile Ser Val Leu
995 1000 1005
Arg Glu Leu Lys Glu Gln Leu Glu Gln Ala Lys Arg Leu Gly Glu
1010 1015 1020
Asn Glu Leu Pro Gln Arg Val Lys Asp Asp Asp Thr Phe Lys Leu
1025 1030 1035
Leu Leu Arg Gln Val Glu Lys Gln Val His Lys Ile Glu Gln Lys
1040 1045 1050
Tyr Glu Met Gln Ala Asp Lys Met Met Arg Ala Ala Ala Lys Asp
1055 1060 1065
Val His Arg Leu Arg Gly Gln Ser Ser Lys Glu Pro Leu Glu Val
1070 1075 1080
Gln Ser Phe Arg Glu Lys Met Ala Phe Phe Thr Arg Pro Arg Met
1085 1090 1095
Asn Leu Pro Thr Leu Thr Ala Asp Asp Val
1100 1105
<210> 12
<211> 1112
<212> PRT
<213> 斑马鱼(Danio rerio)
<400> 12
Met Pro Arg Lys Glu Leu Pro Leu Pro Glu Gly Trp Glu Glu Ala Arg
1 5 10 15
Asp Phe Asp Gly Lys Val Tyr Tyr Ile Asp His Ile Asn Gln Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Gln Thr Lys Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Gly Asp Glu Leu Pro Val Gly Trp Glu Glu Ala Tyr Asp
50 55 60
Pro His Val Gly Ala Tyr Tyr Val Asp His Asn Thr Lys Ser Thr Gln
65 70 75 80
Leu Glu Asp Pro Arg Ala Gln Trp Gln Arg Glu Gln Glu Leu Met Leu
85 90 95
His Asp Tyr Leu Asn Val Val Gln Glu Ala Leu Ser Ala Gln Lys Glu
100 105 110
Ile Tyr Gln Val Lys Glu Gln Arg Leu Arg Leu Ala Gln Gln Glu Tyr
115 120 125
Arg Gln Leu Asn Asp Ala Trp Arg Asp Lys Ser Ser Ser Gln Thr Ser
130 135 140
Leu Asn Ser Arg Ser Ser Ser Ser Ser Lys Tyr Asp Pro Glu Ile Leu
145 150 155 160
Lys Ala Glu Ile Val Thr Ala Lys Ser Arg Val Asn Lys Leu Lys Arg
165 170 175
Asp Leu Ala Tyr Met Lys Gln Glu Leu His Tyr Lys Glu Gln Gly Phe
180 185 190
Glu Thr Leu Lys Glu Ile Asp His Lys Val Ser Ser Ala Ser His Gly
195 200 205
Tyr Lys Leu His Glu Ala Gln Ala Ile Leu Lys Glu Val Lys Ser Ile
210 215 220
Lys Asp Ala Ile Ser Ser Gly Glu Lys Glu Lys Gln Glu Leu Met Arg
225 230 235 240
Lys Leu Ala Val Leu Lys Asp Gly Phe Gln Leu Asp Tyr Gly Ser Gln
245 250 255
Ser Asp Leu Trp Ala Ser Asn Pro Ser Leu Ala Asn Ser Asn Leu Ser
260 265 270
Leu Pro Arg Leu Tyr Ser Asp Ala Glu Ser Gln Thr Asp Ile Pro Ala
275 280 285
Gln Phe Val Ser Ser Ser Asn Lys Leu Ala Glu Lys Val Arg Leu Ser
290 295 300
Leu Lys Tyr Glu Glu Ala Lys Arg Arg Ile Ala Asn Ile Glu Val Gln
305 310 315 320
Ile Ala Lys Leu Asp Ser Glu Ala Trp Pro Gly Leu Leu Asp Pro Glu
325 330 335
Arg Asp Arg Leu Ile Leu Ile Asn Glu Lys Glu Glu Leu Leu Lys Glu
340 345 350
Leu Gln Tyr Val Arg Pro Cys Lys Arg Ala Pro Asn Glu Ala Glu Lys
355 360 365
Ile Glu Ser Glu Lys Lys Arg Leu Glu Lys Asp Leu Gln Ala Ala Arg
370 375 380
Asp Asn Gln Ser Lys Ala Leu Thr Glu Arg Leu Arg Leu His Tyr Arg
385 390 395 400
Arg Asn Lys Leu Val Lys Glu Leu Glu Glu Thr Val Arg Val Ala Ser
405 410 415
Ser Leu His Thr Gln Leu Lys Ser Leu Ser Ala Ser Thr Leu Ser Cys
420 425 430
Ser Ser Gly Ser Ser Arg Gly Ser Leu Thr Ser Ser Arg Gly Ser Leu
435 440 445
Ala Asn Ser Ser Leu Gly Ser Thr Ser Ser Leu Ser Phe Thr Asp Val
450 455 460
Tyr Leu Glu Gln Pro Glu Leu Gly Asp Pro Asp Phe Gln Asn Lys Leu
465 470 475 480
Asp Ser Ile Leu Gln Glu Gly Ser Thr Ser Gly Tyr Arg Pro Ser Ser
485 490 495
Ser Ile Thr Thr Ile His Glu Asn Glu Val Ser Ser Ser Ser Val Gln
500 505 510
Ile Gly Gly Gly Pro Gly Val Gly Gln Arg Thr Gln Val Leu Arg Leu
515 520 525
Ser Glu Thr Pro His Ser Met Asn Ser Leu Ser Pro Arg Ser Ser Leu
530 535 540
Ser Ser Leu Ser Pro Pro Cys Ser Pro Leu Val Thr Glu Ala Ser Phe
545 550 555 560
Leu Ser Gly Glu Val Phe Ser Gly Pro Ala Ser Gln Leu Asp Leu Asp
565 570 575
Leu Gln Thr Arg Leu Met Glu Leu Arg Leu Glu Glu Asp Gln Gln Gln
580 585 590
Gly Gln Leu Asn Tyr Gln Asp Asn Lys Gln Glu Ser Ile Met Ala Val
595 600 605
Glu Ser Ser Lys Asp Ala Val Thr Gln Thr Arg Gly Ser Gly Pro Gly
610 615 620
Ser Lys Lys Ala Gly Val Thr Ser Ala Val Ser Asp Glu Ser Val Ala
625 630 635 640
Gly Asp Ser Gly Val Tyr Glu Pro Ser Glu Lys Arg Pro Gly Leu Pro
645 650 655
Val Glu Gln Leu Leu Ala Phe Asp Asp Gly Ser Ser Ala Ser Ser Ala
660 665 670
Gln Ile Lys Leu Gly Leu Lys Tyr Glu Val Lys Glu Lys Arg Phe Thr
675 680 685
Val Phe Val Met Gln Leu Ser Asn Tyr Ser Ala Leu Ser Leu Pro Ala
690 695 700
Asn Gln Asn Ile Tyr Val Arg Val Val Val Leu Pro Cys Ser Glu Thr
705 710 715 720
Val Arg Cys Leu Phe Arg Thr His Cys Ala Leu Pro Gln Glu Pro Val
725 730 735
Glu Leu Lys Glu Ala Phe Ser Leu Gln Val Ser Ser Thr Ala Leu Arg
740 745 750
Gln Lys Thr Leu Arg Ile Asp Val Cys Thr Thr Ser Lys Ser Gly Arg
755 760 765
Glu His Cys Leu Ala Gly Ala Gln Ile Ser Leu Ala Asp Glu Glu Tyr
770 775 780
Ser Glu Glu Trp Cys Thr Lys Trp Tyr Asn Leu Leu Asn Cys Thr Tyr
785 790 795 800
Met Pro Glu Met Asp Gly Lys Gln Lys Glu Thr Glu Met Pro Ala Leu
805 810 815
Gln Glu Leu Thr Pro Ala Ser Ser Glu Asn Ala Ala Ser Cys Met Glu
820 825 830
Asn Val Pro Leu Glu Asp Trp Pro Ala Glu Thr Leu Glu Gly Asp Val
835 840 845
Phe Val Asp Glu Glu Gly Ser Asp Gly Glu Glu Gly Glu Glu Phe Tyr
850 855 860
Pro Asp Asp Cys Gln Trp Glu Gln Glu Glu Glu Pro Leu Lys Ala Gly
865 870 875 880
Pro Thr Thr Val Ile Ala Glu Lys Val Asn Lys Glu Thr Ser Met Asp
885 890 895
Gly Leu Pro His Ser Thr Ser Val Val Arg Pro Lys Glu Arg Arg His
900 905 910
Asp Val His Gln Gln Asn Pro Phe Met Arg Gly Asn Thr Ile Ile Arg
915 920 925
Ser Lys Thr Phe Ser Pro Gly Pro Gln Ser Gln Tyr Ile Cys Arg Ile
930 935 940
Asn Arg Ser Asp Ser Asp Ser Ser Thr Leu Ser Lys Lys Ser Pro Phe
945 950 955 960
Val Arg Asn Ala Ser Glu Arg Arg Ser Val Arg Met Lys Lys Pro Pro
965 970 975
Met Gln Val Lys Gly Leu Asp Gly Leu Leu Arg Thr Ser Leu Asp Leu
980 985 990
Glu Leu Asp Leu Gln Val Thr Arg Thr Arg His Ser Arg Leu Thr Glu
995 1000 1005
Glu Leu Arg Val Leu Arg Glu Leu Lys Glu Gln Met Glu Lys Ala
1010 1015 1020
Arg Gln Gln Gly Gln His Val Leu Pro Thr Trp Val Gln Glu Asp
1025 1030 1035
Glu Arg Phe Cys Leu Leu Leu Lys His Ala Glu Arg Gln Thr Gln
1040 1045 1050
Glu Glu Gln Leu Gln Glu Lys Arg Val Glu Lys Met Met Arg Ala
1055 1060 1065
Ala Ala Lys Asp Val His Lys Ile Arg Gly Gln Ser Leu Lys Glu
1070 1075 1080
Val Pro Gly Val Gln Ser Phe Arg Glu Lys Met Ala Phe Phe Thr
1085 1090 1095
Arg Ala Lys Ile Asn Val Pro Asp Leu Pro Ala Asp Asp Val
1100 1105 1110
<210> 13
<211> 1288
<212> PRT
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 13
Met Pro Asn Leu Gln Gln Thr Ala Ser Gln Ser Gln His His Leu His
1 5 10 15
Pro His His Leu Arg Pro Gln Gln Gln Gln Gln Gln His His His His
20 25 30
His Gln Gln Gln Gln Gln Gln Gln His Thr His His Gln Gln Gln Gln
35 40 45
Gln His His Ser Asp Phe Pro Leu Pro Asp Gly Trp Asp Ile Ala Lys
50 55 60
Asp Phe Asp Gly Lys Thr Tyr Tyr Ile Asp His Ile Asn Lys Lys Thr
65 70 75 80
Thr Trp Leu Asp Pro Arg Asp Cys Tyr Thr Lys Pro Gln Thr Phe Glu
85 90 95
Asp Cys Val Gly Asp Glu Leu Pro Met Gly Trp Glu Glu Ser Tyr Asp
100 105 110
Pro Asn Ile Gly Pro Tyr Tyr Ile Asn His Leu Ala Gln Ser Thr Gln
115 120 125
Leu Glu Asp Pro Arg Gln Glu Trp Lys Thr Val Gln Glu Gln Met Leu
130 135 140
Ser Asp Tyr Leu Ser Ala Ala Gln Asp Gln Leu Glu Asn Lys Arg Glu
145 150 155 160
Met Phe Asp Val Lys Gln Gln Arg Leu Leu Trp Ala Gln Glu Glu Tyr
165 170 175
Asn His Leu Lys Leu Ala Ala Ser Arg Ser Ser Leu Cys Ser Ser Ser
180 185 190
Ser Ser Met Ser Arg His Asp Pro Glu Leu Leu Arg Ala Asp Leu Met
195 200 205
Leu Ala Arg Glu Arg Val His Gln Leu Lys Gln Glu Leu Thr His Ile
210 215 220
Thr Asn Asp Ile Ser Tyr Thr Glu Arg Gly Met Asn Thr Leu Tyr Ser
225 230 235 240
Val Gly Glu Lys Ile Asn Ala Arg Glu Asn Gly Cys Tyr Asp Ile Ala
245 250 255
Glu Val His Ala Ile Arg Glu Glu Met Leu Lys Val His Lys Ser Leu
260 265 270
Val Ser Gly Glu Lys Val Arg Glu Glu Leu Met Arg Ser Leu Val Gln
275 280 285
Ile Lys Asn Glu Leu Gly Arg Gln Gln Ile Ser Glu Glu Asn Ser Asp
290 295 300
Leu Ala Ser Pro Phe Asp Arg Val Cys Val Ala Ser Gln Thr Asp Leu
305 310 315 320
Cys Gly Ser Ser Gly Glu Asn Leu Asn Gly Gly Ala Arg Phe Ala Glu
325 330 335
Met Ala Lys Thr Lys Trp Gln Tyr Ala Glu Trp Arg Lys His Ile Lys
340 345 350
Lys Leu Gln Gln Gln Leu Ala Asp His Val Glu Arg Ile Glu Pro Gly
355 360 365
Gln Leu Glu Ser Asp Lys Asp Arg Ile Leu Leu Ile Gln Glu Lys Glu
370 375 380
Lys Leu Leu Asn Asp Leu Asn Ser Ile Ser Leu Lys Ser Arg Ser Glu
385 390 395 400
Glu Glu Lys Arg Val Ile His Gln Thr Arg His Lys Leu Glu Glu Asp
405 410 415
Leu Lys Glu Ala Tyr Glu Ala Asn Asn Thr Cys Val Ala Asn Arg Leu
420 425 430
Arg Phe His Glu Glu Lys Gln Leu Leu Leu Asp Lys Leu Gln Glu Ala
435 440 445
Leu Lys Ser Thr Lys Leu Leu Glu Glu Arg Leu Lys Ser Phe Ser Ser
450 455 460
Glu Ser Thr Phe Ser Ile Ser Ser Gly Ser Ser Leu Gly Ser Leu Ser
465 470 475 480
Thr Ala Ser Ser Lys Ser Ala Leu Ser Phe Thr Asp Ile Tyr Ile Asp
485 490 495
Pro Phe Ala Val Asp Ser Pro Ile Asp Val Val Asp Leu Arg Arg Arg
500 505 510
Ser Gln Arg Leu Phe Gln Gln His Gln Gln Gln Arg Leu His Pro Val
515 520 525
His Pro Val Leu Gln Gln Gln Gln Ser Ala Glu Val Thr Leu Ser Pro
530 535 540
Arg Ser Ser Leu Ser Met Glu Thr Pro Pro Ala Ser Pro Met Lys Tyr
545 550 555 560
Asn Ala Gly Ala Asp Gln Thr Pro Gln Ala Leu Lys Glu Glu Pro Thr
565 570 575
Tyr Ala Asn Ala Leu Pro Ala Pro Pro Ala Tyr Thr Ala Pro Pro Pro
580 585 590
Val Pro Ile Ser Gly Val Arg Ala Arg Pro Tyr Asp Leu Asp Ser Thr
595 600 605
Val Leu Asp Cys Met Met Leu Glu Ala Lys Leu Gln Lys Leu Asn Met
610 615 620
Gly Thr Pro Leu Asn Leu Ala Val Ala Pro Leu Ser Pro Ile Ser Glu
625 630 635 640
Lys Pro Ser Leu Leu Asp Leu Pro Gln Glu Met Leu Ser Arg Ser Ser
645 650 655
Ser Thr Ser Asn Thr Arg Ser Val Ser Ala Ala Val Ser Asn Glu Ser
660 665 670
Val Ala Gly Asp Ser Gly Val Phe Glu Ala Ser Arg Ala His Leu Pro
675 680 685
Arg Lys Glu Leu Ala Gln Val Gln Ile Gly Leu Lys Tyr Leu Lys Gln
690 695 700
Glu Gly Val Leu Val Val Ser Leu Glu Arg Ala Asn Asn Leu Leu Ala
705 710 715 720
Leu Trp Thr Ala Ser Ala Asp Asn Ser Gln Val Tyr Leu Arg Ala Ala
725 730 735
Leu Leu Pro Asn Ser Leu Thr Ser Ile Arg Thr Lys Ala Leu Gly Asp
740 745 750
Phe Gln Lys Pro Val Phe Asn Asp Thr Phe Ala Val Pro Ile Thr Leu
755 760 765
Asp Lys Leu Leu Thr Lys Ser Leu Gln Val Thr Val Val Thr Met Thr
770 775 780
Gly Gln Lys Glu Glu Ile Ile Gly Thr Val Gln Ile Ser Met Ala Glu
785 790 795 800
Phe Asn Pro Glu Asp Ser Thr Leu Lys Trp Tyr Asn Val Leu Ser Ser
805 810 815
Lys Phe Ile Pro Ser Phe Glu Ser Leu Asp Ile Pro Ser Thr Ser Ala
820 825 830
Ala Ala Ala Ala Ala Ala Val Ala Ala Ser Asn Ala Pro Asn Pro Gly
835 840 845
Asn Asn Arg Glu Glu Ser Ser Asp Glu Ser Thr Ile Thr Ser Ser Gln
850 855 860
Thr Ser Thr Leu Thr Arg Asn Gln Ala Pro Cys Met Glu Leu Gln Glu
865 870 875 880
Gln Met Ala Ala Glu Leu Leu Gly Leu Gly Pro Leu Asn Glu Pro Glu
885 890 895
Cys Ser Asp Asp Asp Asp Asp Asp Glu Glu Glu Glu Leu Asp Asp Lys
900 905 910
Gln Leu Val Ser Asp Val Gly Leu Met Asn Ser Ser Ser Met Leu His
915 920 925
Ala Tyr Leu Gln Asn Met Lys Gln Glu Phe Ala Asp Lys Glu Thr Asn
930 935 940
Thr Asp Arg Ala Tyr Leu Pro Glu Lys Ser Arg Gly Gln Ser Gln Leu
945 950 955 960
Met Asp Asp Arg Pro Val Lys Arg Ser Gln Thr Phe Thr Pro Ser Glu
965 970 975
Ala Phe Ser Lys Asn Arg Tyr Asn Cys Arg Leu Asn Arg Ser Asp Ser
980 985 990
Asp Ser Ala Met His Cys Gly Val Ala Pro His Thr Phe Gln Arg Gly
995 1000 1005
Ala Ala Glu Arg Arg Ser Leu Arg Phe His Ser Lys Ala Pro Lys
1010 1015 1020
Ser Val Thr Lys Leu His His Thr His Ile Pro Arg Thr Ser Leu
1025 1030 1035
Asp Leu Glu Leu Asp Leu Gln Ala Gln His Ser Lys Leu Tyr Phe
1040 1045 1050
Leu Asn Asp Gln Ile Ala Lys Leu Gln Asn Leu Lys Glu Val Leu
1055 1060 1065
Gln Lys Ala Cys Glu Asn Lys Asp Pro Leu Val Ala Ala Trp Ala
1070 1075 1080
Ile Glu Asn Glu Glu Phe Gln Arg Leu Val Ala Arg Ala Asp Pro
1085 1090 1095
Ala Lys Cys Pro Glu Glu Arg Gln Leu Gln Lys Leu Leu Met Lys
1100 1105 1110
Thr Ala Lys Glu Ile His Lys Leu Arg Lys Thr Lys Val Pro Lys
1115 1120 1125
Gly Cys Pro Asp Leu Val Ser Phe Lys Glu Lys Ile Thr Phe Phe
1130 1135 1140
Thr Arg Lys Gly Leu Ser Val Pro Glu Leu Pro Ser Glu Phe Thr
1145 1150 1155
Leu Pro Glu Ala Asn Pro Ile Glu Glu Glu Glu Glu Glu Glu Asp
1160 1165 1170
Glu Asn Glu Phe Tyr Asn Ser Ala Glu Thr Ala Ile Ala Ile Asn
1175 1180 1185
Thr Ala Leu Val Ala Ser Ser Asn Arg Asn Lys Asn Leu Ser Glu
1190 1195 1200
His Pro His Arg Ala Thr Ser Gly Ala Val Pro Lys Ile Pro Ala
1205 1210 1215
Pro Val Val Thr Pro Ala Ala Thr Pro Ala Ala Thr Pro Ala Ala
1220 1225 1230
Thr Pro Ala Ala Thr Ser Ala Ala Thr Pro Ala Ala Thr Pro Val
1235 1240 1245
Val Ser Pro Ala Ala Gln Pro Asp Ala Lys Pro Ala Asp Ala Pro
1250 1255 1260
Ile Pro Val Ala Ser Asn Asp Ala Glu Gln Gln Arg Phe Asp Tyr
1265 1270 1275
Val Val Asp Arg Asn Tyr Gly Val Glu Val
1280 1285
<210> 14
<211> 1192
<212> PRT
<213> 乌干达红疣猴(Piliocolobus tephrosceles)
<400> 14
Met Pro Arg Arg Ala Gly Ser Gly Gln Leu Pro Leu Pro Arg Gly Trp
1 5 10 15
Glu Glu Ala Arg Asp Tyr Asp Gly Lys Val Phe Tyr Ile Asp His Asn
20 25 30
Thr Arg Arg Thr Ser Trp Ile Asp Pro Arg Asp Arg Leu Thr Lys Pro
35 40 45
Leu Ser Phe Ala Asp Cys Val Gly Asp Glu Leu Pro Trp Gly Trp Glu
50 55 60
Ala Gly Phe Asp Pro Gln Ile Gly Val Tyr Tyr Ile Asp His Ile Asn
65 70 75 80
Lys Thr Thr Gln Ile Glu Asp Pro Arg Lys Gln Trp Arg Gly Glu Gln
85 90 95
Glu Lys Met Leu Lys Asp Tyr Leu Ser Val Ala Gln Asp Ala Leu Arg
100 105 110
Thr Gln Lys Glu Leu Tyr His Val Lys Glu Gln Arg Leu Ala Leu Ala
115 120 125
Leu Asp Glu Tyr Val Arg Leu Asn Asp Ala Tyr Lys Glu Lys Ser Ser
130 135 140
Ser Arg Thr Ser Leu Phe Ser Gly Ser Ser Ser Ser Thr Lys Tyr Asp
145 150 155 160
Pro Asp Ile Leu Lys Ala Glu Ile Ser Thr Thr Arg Leu Arg Val Lys
165 170 175
Lys Leu Lys Arg Glu Leu Ser Gln Met Lys Gln Glu Leu Leu Tyr Lys
180 185 190
Glu Gln Gly Phe Glu Thr Leu Gln Gln Ile Asp Lys Lys Met Ser Gly
195 200 205
Gly Gln Ser Gly Tyr Glu Leu Ser Glu Ala Lys Ala Ile Leu Thr Glu
210 215 220
Leu Lys Ser Ile Arg Lys Ala Ile Ser Ser Gly Glu Lys Glu Lys Gln
225 230 235 240
Asp Leu Met Gln Ser Leu Ala Lys Leu Gln Glu Arg Phe His Leu Asp
245 250 255
Gln Asn Ile Gly Arg Ser Glu Pro Asp Leu Arg Ser Ser Pro Val Asn
260 265 270
Ser His Leu Ser Leu Ser Arg Gln Thr Leu Asp Ala Gly Ser Gln Thr
275 280 285
Ser Ile Ser Gly Asp Ile Gly Val Arg Ser Arg Ser Asn Leu Ala Glu
290 295 300
Lys Val Arg Leu Ser Leu Gln Tyr Glu Glu Ala Lys Arg Ser Met Ala
305 310 315 320
Asn Leu Lys Ile Glu Leu Ser Lys Leu Asp Ser Glu Ala Trp Pro Gly
325 330 335
Ala Leu Asp Ile Glu Lys Glu Lys Leu Met Leu Ile Asn Glu Lys Glu
340 345 350
Glu Leu Leu Lys Glu Leu Gln Phe Val Thr Pro Gln Lys Arg Thr Gln
355 360 365
Asp Glu Leu Glu Cys Leu Glu Ala Glu Arg Gln Arg Leu Glu Glu Glu
370 375 380
Leu Leu Ser Val Arg Gly Ala Pro Ser Arg Ala Leu Ala Glu Arg Leu
385 390 395 400
Arg Leu Glu Glu Arg Arg Lys Glu Leu Leu Gln Lys Leu Glu Glu Thr
405 410 415
Thr Lys Leu Thr Thr Tyr Leu His Ser Gln Leu Lys Ser Leu Ser Ala
420 425 430
Ser Thr Leu Ser Met Ser Ser Gly Ser Ser Leu Gly Ser Leu Ala Ser
435 440 445
Ser Arg Gly Ser Leu Asn Thr Ser Ser Arg Gly Ser Leu Asn Ser Leu
450 455 460
Ser Ser Thr Glu Leu Tyr Tyr Ser Ser Gln Ser Asp Gln Ile Asp Val
465 470 475 480
Asp Tyr Gln Tyr Lys Leu Asp Phe Leu Leu Gln Glu Lys Ser Gly Tyr
485 490 495
Ile Pro Ser Gly Pro Ile Thr Thr Ile His Glu Asn Glu Val Val Lys
500 505 510
Ser Pro Ser Gln Pro Gly Gln Ser Gly Leu Cys Gly Val Ala Val Ala
515 520 525
Ala Thr Gly His Ser Pro Pro Leu Ala Glu Ala Pro Lys Ser Val Ala
530 535 540
Ser Leu Ser Ser Arg Ser Ser Leu Ser Ser Leu Ser Pro Pro Gly Ser
545 550 555 560
Pro Leu Val Leu Glu Gly Thr Phe Pro Leu Ser Ser His Asp Ala Ser
565 570 575
Leu His Gln Phe Ser Ala Asp Phe Glu Asp Cys Glu Leu Ser Ser His
580 585 590
Phe Ala Asp Ile Ser Leu Val Glu Asn Gln Ile Leu Leu Asp Ser Asp
595 600 605
Ser Gly Gly Ala Ser Gln Ser Leu Ser Glu Asp Lys Asp Leu Asn Glu
610 615 620
Cys Ala Gly Glu Pro Leu Tyr Glu Gly Thr Ala Asp Val Glu Lys Ser
625 630 635 640
Leu Pro Lys Arg Arg Val Ile His Leu Leu Gly Glu Lys Thr Thr Cys
645 650 655
Val Ser Ala Ala Val Ser Asp Glu Ser Val Ala Gly Asp Ser Gly Val
660 665 670
Tyr Glu Ala Phe Val Lys Gln Pro Ser Glu Ile Glu Asp Val Thr Tyr
675 680 685
Ser Glu Glu Asp Ile Ala Ile Val Glu Thr Ala Gln Val Gln Ile Gly
690 695 700
Leu Arg Tyr Asn Ala Lys Ser Ser Ser Phe Met Val Ile Ile Ala Gln
705 710 715 720
Leu Arg Asn Leu His Ala Phe Leu Ile Pro His Thr Ser Lys Val Tyr
725 730 735
Phe Arg Val Ala Val Leu Pro Ser Ser Thr Asp Val Ser Cys Leu Phe
740 745 750
Arg Thr Lys Val His Pro Pro Thr Glu Ser Ile Leu Phe Asn Asp Val
755 760 765
Phe Arg Val Ala Ile Ser Gln Thr Ala Leu Gln Gln Lys Thr Leu Arg
770 775 780
Val Asp Leu Cys Ser Val Ser Arg His Arg Arg Glu Glu Cys Leu Ala
785 790 795 800
Gly Thr Gln Ile Ser Leu Ala Asp Leu Pro Phe Ser Ser Glu Val Phe
805 810 815
Thr Leu Trp Tyr Asn Leu Leu Pro Ser Lys Gln Met Pro Cys Lys Lys
820 825 830
Asn Glu Glu Asn Glu Asp Cys Val Phe Gln Pro Asn Gln Pro Leu Gly
835 840 845
Asp Thr Ile Asp Leu Asp Ala Val Ser Ala Leu Leu Ala Arg Thr Ser
850 855 860
Ala Glu Leu Leu Ala Val Glu Gln Glu Leu Ala Gln Glu Glu Glu Glu
865 870 875 880
Glu Glu Ser Arg Gln Glu Glu Gln Arg Gly Pro Asp Gly Asp Trp Leu
885 890 895
Thr Met Leu Arg Glu Ala Ser Asn Glu Ile Val Ala Lys Lys Glu Ala
900 905 910
Glu Val Lys Leu Pro Glu Asp Ser Asn Cys Thr Glu Asp Leu Asn Ser
915 920 925
Cys Thr Ser Val Pro Glu Met Asn Glu Asp Gly Asn Arg Lys Glu Asn
930 935 940
Asn Cys Ala Lys Asp Leu Arg Ser Gln Pro Pro Thr Gly Thr Pro Thr
945 950 955 960
Leu Val Asp Lys Glu Thr Asn Thr Asp Glu Ala Ala Asn Asp Asn Met
965 970 975
Thr Val Arg Pro Lys Glu Arg Ser Ser Leu Ser Ser Arg Gln His Pro
980 985 990
Phe Val Arg Ser Ser Val Ile Val Arg Ser Gln Thr Phe Ser Pro Gly
995 1000 1005
Glu Arg Ser Gln Tyr Ile Cys Arg Leu Asn Arg Ser Asp Ser Asp
1010 1015 1020
Ser Ser Thr Leu Ala Lys Lys Ser Leu Phe Val Arg Asn Ser Thr
1025 1030 1035
Glu Arg Arg Ser Leu Arg Val Lys Arg Thr Val Cys Gln Ser Val
1040 1045 1050
Leu Arg Arg Thr Ala Gln Glu Cys Pro Val Arg Thr Ser Leu Asp
1055 1060 1065
Leu Glu Leu Asp Leu Gln Ala Ser Leu Thr Arg Gln Ser Arg Leu
1070 1075 1080
Asn Asp Glu Leu Gln Ala Leu Arg Asp Leu Arg Gln Lys Leu Glu
1085 1090 1095
Glu Leu Lys Ala Gln Gly Glu Thr Asp Leu Pro Pro Gly Met Leu
1100 1105 1110
Glu Asp Glu Arg Phe Gln Lys Leu Leu Lys Gln Ala Glu Lys Gln
1115 1120 1125
Ala Glu Gln Ser Lys Glu Glu Gln Lys Gln Gly Leu Asn Ala Glu
1130 1135 1140
Lys Leu Met Arg Gln Val Ser Lys Asp Val Cys Arg Leu Arg Glu
1145 1150 1155
Gln Ser Gln Lys Val Pro Arg Gln Val Gln Ser Phe Arg Glu Lys
1160 1165 1170
Ile Ala Tyr Phe Thr Arg Ala Lys Ile Ser Ile Pro Ser Leu Pro
1175 1180 1185
Ala Asp Asp Val
1190
<210> 15
<211> 1194
<212> PRT
<213> 牛(Bos taurus)
<400> 15
Met Pro Arg Arg Ala Gly Ser Gly Gln Leu Pro Leu Pro Arg Gly Trp
1 5 10 15
Glu Glu Ala Arg Asp Tyr Asp Gly Lys Val Phe Tyr Ile Asp His Asn
20 25 30
Thr Arg Arg Thr Ser Trp Ile Asp Pro Arg Asp Arg Leu Thr Lys Pro
35 40 45
Leu Ser Phe Ala Asp Cys Val Gly Asp Glu Leu Pro Trp Gly Trp Glu
50 55 60
Ala Gly Phe Asp Pro Gln Ile Gly Val Tyr Tyr Ile Asp His Ile Asn
65 70 75 80
Lys Thr Thr Gln Ile Glu Asp Pro Arg Lys Gln Trp Arg Arg Glu Gln
85 90 95
Glu Lys Met Leu Lys Asp Tyr Leu Ser Val Ala Gln Asp Ala Leu Gln
100 105 110
Thr Gln Gln Glu Leu Tyr His Val Lys Glu Gln Arg Leu Ala Leu Ala
115 120 125
Leu Asp Glu Tyr Val Arg Leu Asn Asp Ala Tyr Lys Glu Lys Ser Ser
130 135 140
Ser Arg Thr Ser Leu Phe Ser Gly Ser Ser Ser Ser Thr Lys Tyr Asp
145 150 155 160
Pro Glu Ile Leu Lys Ala Glu Ile Ser Thr Thr Arg Leu Arg Val Lys
165 170 175
Asn Leu Lys Arg Glu Leu Ser Gln Met Lys Gln Glu Leu Leu Tyr Lys
180 185 190
Glu Gln Gly Phe Ala Thr Leu Lys Gln Ile Asp Lys Lys Met Ser Gly
195 200 205
Gly Gln Ser Gly Tyr Glu Leu Ser Glu Ala Lys Ala Ile Leu Met Glu
210 215 220
Leu Lys Ser Ile Arg Lys Ala Ile Ser Ser Gly Glu Lys Glu Lys Gln
225 230 235 240
Asp Leu Met Gln Ser Leu Ala Lys Leu Gln Gly Arg Phe His Val Asp
245 250 255
Gln Ser Ile Gly Thr Ser Glu Pro Asp Leu Arg Ser Ser Pro Val Ser
260 265 270
Ser Arg Leu Ser Leu Ser Arg Gln Thr Leu Asp Val Gly Ser Gln Thr
275 280 285
Ser Ile Ser Gly Asp Ile Gly Val Arg Ser Arg Ser Asn Leu Ala Glu
290 295 300
Lys Val Arg Leu Ser Leu Gln Tyr Glu Glu Ala Lys Arg Ser Met Ala
305 310 315 320
Asn Leu Lys Ile Glu Leu Ser Lys Leu Asp Ser Glu Ala Trp Pro Gly
325 330 335
Thr Leu Asp Val Glu Lys Glu Lys Leu Met Leu Ile His Glu Lys Glu
340 345 350
Glu Leu Leu Lys Glu Leu Gln Phe Val Thr Pro Gln Arg Arg Thr Gln
355 360 365
Asp Glu Leu Glu Ser Leu Glu Ala Glu Arg Gln Arg Leu Glu Ala Glu
370 375 380
Leu Leu Ala Val Arg Gly Val Pro Ser Gln Ala Leu Ala Glu Arg Leu
385 390 395 400
Lys Leu Glu Glu Gln Arg Lys Ala Leu Leu Gln Lys Leu Glu Glu Thr
405 410 415
Thr Lys Leu Thr Thr Cys Leu His Ser Gln Leu Lys Asn Leu Ser Ala
420 425 430
Ser Thr Leu Ser Val Ser Ser Gly Ser Ser Leu Gly Ser Leu Ala Ser
435 440 445
Ser Arg Gly Ser Leu Asn Thr Ser Ser Arg Gly Ser Leu Asn Ser Leu
450 455 460
Ser Ser Ser Glu Leu Tyr Tyr Thr Ser Gln Gly Asp Gln Leu Asp Ala
465 470 475 480
Asp Tyr Gln Tyr Lys Leu Asp Phe Leu Leu Gln Glu Lys Gly Gly Tyr
485 490 495
Met Pro Ser Gly Pro Ile Thr Thr Ile His Glu His Glu Val Ala Lys
500 505 510
Ser Pro Ser Gln Pro Gly Gln Ser Gly Ser Gly Gly Ala Ala Ala Ala
515 520 525
Ala Ala Ala Pro Gly His Pro Ala Pro Leu Ala Glu Pro Pro Lys Ser
530 535 540
Val Thr Ser Leu Ser Ser Arg Ser Ser Leu Ser Ser Leu Ser Pro Pro
545 550 555 560
Gly Ser Pro Leu Val Leu Glu Gly Ala Phe Pro Met Ser Thr His Gly
565 570 575
Ser Pro Leu His Gln Phe Ser Ala Asp Phe Glu Asp Cys Glu Leu Ser
580 585 590
Ser His Phe Ala Asp Ile Ser Leu Arg Glu His Gln Leu Leu Leu Asp
595 600 605
Pro Asp Pro Gly Gly Ala Pro Ser Ser Leu Leu Asp Glu Asn Lys Glu
610 615 620
Leu Gly Glu Cys Ala Gln Glu Pro Leu Tyr Glu Gly Pro Ala Asp Val
625 630 635 640
Glu Lys Ser Leu Pro Lys Arg Arg Gly Ile His Leu Pro Gly Glu Lys
645 650 655
Thr Ala Cys Val Ser Ala Ala Val Ser Asp Glu Ser Val Ala Gly Asp
660 665 670
Ser Gly Val Tyr Glu Ala Phe Val Lys Gln Pro Ser Glu Ala Glu Asp
675 680 685
Val Pro Tyr Ser Glu Glu Asp Ala Val Val Met Glu Thr Ala Gln Val
690 695 700
Gln Ile Gly Leu Arg Tyr Asp Ala Lys Arg Ser Ser Phe Val Val Thr
705 710 715 720
Val Ala Gln Leu Arg Asn Leu His Ala Phe Leu Ile Pro His Ser Ser
725 730 735
Lys Val Tyr Phe Arg Val Ala Leu Leu Pro Ser Ser Ser Asp Val Ser
740 745 750
Cys Leu Phe Arg Thr Lys Val His Pro Ala Ala Glu Ser Leu Leu Phe
755 760 765
Ser Asp Val Phe Arg Val Ala Ile Ser Gln Thr Ala Leu Gln Gln Lys
770 775 780
Thr Leu Arg Val Asp Leu Cys Ser Val Gly Lys His Arg Arg Glu Glu
785 790 795 800
Cys Leu Ala Gly Thr Gln Ile Ser Leu Ala Asp Leu Pro Phe Ser Ser
805 810 815
Gly Val Phe Thr Leu Trp Tyr Asn Leu Leu Pro Ser Lys Gln Met Pro
820 825 830
Cys Lys Lys Lys Glu Glu Glu Thr Glu Asp Ser Val Phe Gln Pro Ser
835 840 845
Gln Pro Leu Val Asp Ser Val Asp Leu Asp Ala Val Ser Ala Leu Leu
850 855 860
Ala Arg Thr Ser Ala Glu Leu Leu Ala Val Glu Gln Glu Leu Ala Gln
865 870 875 880
Glu Lys Glu Pro Gly Gln Glu Glu Glu His Arg Gly Pro Asp Gly Asp
885 890 895
Trp Leu Ala Met Leu Arg Glu Ala Ser Asp Glu Ile Val Ala Lys Glu
900 905 910
Gly Ala Glu Val Lys Leu Ala Glu Gly Ser Arg Cys Val Glu Asp Ala
915 920 925
Ser Ser Cys Pro Ser Val Pro Lys Met Ser Glu Asp Thr Ser Arg Lys
930 935 940
Asp Ser Ser Cys Ala Ser Asp Leu Gly Thr Gln Pro Pro Ala Gly Thr
945 950 955 960
Leu Ala Leu Val Asp Lys Glu Thr Asn Thr Asp Glu Ala Gly Gly Ala
965 970 975
Ser Met Val Val Arg Pro Lys Asp His Ser Ser Leu Ser Ala Arg Gln
980 985 990
Arg Pro Phe Met Arg Ser Ser Val Ile Val Arg Ser Gln Thr Phe Ser
995 1000 1005
Pro Gly Glu Arg Ser Gln Tyr Val Cys Arg Leu Asn Arg Ser Asp
1010 1015 1020
Ser Asp Ser Ser Thr Leu Ala Lys Lys Ser Leu Phe Val Arg Asn
1025 1030 1035
Ser Thr Glu Arg Arg Ser Leu Arg Val Lys Arg Ala Val Cys Gln
1040 1045 1050
Pro Val Leu Arg Arg Ala Ala Pro Glu Cys Pro Val Arg Thr Ser
1055 1060 1065
Leu Asp Leu Glu Leu Asp Leu Gln Ala Ser Leu Thr Arg Gln Ser
1070 1075 1080
Arg Leu Asn Asp Glu Leu Gln Ala Leu Arg Gly Leu Arg Gln Lys
1085 1090 1095
Leu Glu Asp Leu Lys Ala Gln Gly Glu Thr Asp Leu Pro Pro Gly
1100 1105 1110
Met Leu Asp Asp Glu Arg Phe Gln Lys Leu Leu Arg Gln Ala Gly
1115 1120 1125
Lys Gln Ala Glu Gln Ser Glu Glu Glu Gln Lys Gln Asp Leu Asn
1130 1135 1140
Ala Glu Lys Leu Met Arg Gln Val Ser Lys Asp Val Cys Arg Leu
1145 1150 1155
Arg Glu Gln Ser His Lys Val Pro Arg Gln Val Gln Ser Phe Arg
1160 1165 1170
Glu Lys Ile Ala Tyr Phe Thr Arg Ala Lys Ile Thr Ile Pro Ser
1175 1180 1185
Leu Ser Ala Asp Asp Val
1190
<210> 16
<211> 1187
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 16
Met Pro Arg Arg Ala Gly Ser Gly Gln Leu Pro Leu Pro Arg Gly Trp
1 5 10 15
Glu Glu Ala Arg Asp Tyr Asp Gly Lys Val Phe Tyr Ile Asp His Asn
20 25 30
Thr Arg Arg Thr Ser Trp Ile Asp Pro Arg Asp Arg Leu Thr Lys Pro
35 40 45
Leu Ser Phe Ala Asp Cys Val Gly Asp Glu Leu Pro Trp Gly Trp Glu
50 55 60
Ala Gly Phe Asp Pro Gln Ile Gly Ala Tyr Tyr Ile Asp His Ile Asn
65 70 75 80
Lys Thr Thr Gln Ile Glu Asp Pro Arg Lys Gln Trp Arg Gly Glu Gln
85 90 95
Glu Lys Met Leu Lys Asp Tyr Leu Ser Val Ala Gln Asp Ala Leu Arg
100 105 110
Thr Gln Lys Glu Leu Tyr His Val Lys Glu Gln Arg Leu Ala Leu Ala
115 120 125
Leu Asp Glu Tyr Val Arg Leu Asn Asp Ala Tyr Lys Glu Lys Ser Ser
130 135 140
Ser His Thr Ser Leu Phe Ser Gly Ser Ser Ser Ser Thr Lys Tyr Asp
145 150 155 160
Pro Asp Ile Leu Lys Ala Glu Ile Ser Thr Thr Gln Leu Arg Val Lys
165 170 175
Lys Leu Lys Arg Glu Leu Ser His Met Lys Gln Glu Leu Leu Tyr Lys
180 185 190
Gln Gln Gly Phe Glu Thr Leu Gln Gln Ile Asp Glu Lys Met Ser Gly
195 200 205
Gly Gln Ser Gly Tyr Glu Leu Asn Glu Ala Lys Ala Ile Leu Thr Glu
210 215 220
Leu Lys Ser Ile Arg Lys Ala Ile Ser Ser Gly Glu Lys Glu Lys Gln
225 230 235 240
Asp Leu Met Gln Ser Leu Ala Lys Leu Gln Glu Arg Phe His Leu Asp
245 250 255
Gln Asn Met Gly Ser Ser Glu Pro Asp Leu Arg Ser Ser Pro Val Asn
260 265 270
Ser His Leu Ser Leu Ser Arg Gln Thr Leu Asp Ala Gly Ser Gln Thr
275 280 285
Ser Ile Ser Gly Asp Ile Gly Val Arg Ser Arg Ser Asn Leu Ala Glu
290 295 300
Lys Val Arg Leu Ser Leu Gln Tyr Glu Glu Ala Lys Arg Ser Met Ala
305 310 315 320
Asn Leu Lys Ile Glu Leu Ser Lys Leu Asp Gly Glu Ala Trp Pro Gly
325 330 335
Ala Leu Asp Ile Glu Lys Glu Lys Leu Met Leu Ile Asn Glu Lys Glu
340 345 350
Glu Leu Leu Lys Glu Leu Gln Phe Ile Thr Pro Gln Lys Arg Ser Gln
355 360 365
Glu Glu Leu Glu Arg Leu Glu Ala Glu Arg Gln His Leu Glu Glu Glu
370 375 380
Leu Met Ala Ala Arg Gly Ser Pro Ser Arg Ala Leu Thr Glu Arg Leu
385 390 395 400
Lys Leu Glu Glu Lys Arg Lys Glu Leu Leu Gln Lys Leu Glu Glu Thr
405 410 415
Thr Lys Leu Thr Thr Ser Leu Tyr Ser Gln Leu Gln Ser Leu Ser Ser
420 425 430
Ser Thr Leu Ser Met Ser Ser Gly Ser Ser Leu Gly Ser Leu Ala Ser
435 440 445
Ser Arg Gly Ser Leu Asn Thr Ser Ser Arg Gly Ser Leu Asn Ser Leu
450 455 460
Ser Ser Ser Glu Leu Tyr Tyr Ser Ser Gln Gly Asp Gln Met Asp Thr
465 470 475 480
Asp Tyr Gln Tyr Lys Leu Asp Phe Leu Leu Gln Glu Lys Gly Gly Tyr
485 490 495
Ile Pro Ser Gly Pro Ile Thr Thr Ile His Glu Asn Glu Val Val Lys
500 505 510
Ser Pro Ser Gln Pro Gly Gln Ser Gly Leu Cys Gly Val Gly Val Thr
515 520 525
Ala Ser Ser His Thr Thr Pro Leu Thr Glu Ala Ser Lys Ser Val Ala
530 535 540
Ser Leu Ser Ser Arg Ser Ser Leu Ser Ser Leu Ser Pro Pro Gly Ser
545 550 555 560
Pro Leu Val Leu Asp Ser Val Phe Pro Gly Ser Ser His Asp Thr Ser
565 570 575
Pro His Gln Phe Pro Thr Asp Phe Glu Asp Cys Glu Leu Ser Arg Arg
580 585 590
Phe Ala Asp Val Gly Leu Gly Glu Asn Gln Ala Leu Leu Asp Ser Asp
595 600 605
Ser Gly Gly Ala Ser Gln Pro Leu Leu Glu Asp Lys Gly Leu Ser Asp
610 615 620
Cys Pro Gly Glu Leu Leu Cys Glu Gly Ala Thr Asp Val Glu Lys Ser
625 630 635 640
Leu Pro Lys Arg Arg Gly Leu His Leu Arg Gly Asp Lys Thr Thr Arg
645 650 655
Val Ser Ala Ala Ala Ser Asp Glu Ser Val Ala Gly Asp Ser Gly Val
660 665 670
Tyr Glu Ala Ser Met Lys Gln Pro Gly Glu Met Glu Asp Val Pro Tyr
675 680 685
Ser Glu Glu Asp Val Thr Ile Val Glu Thr Ala Gln Val Gln Ile Gly
690 695 700
Leu Arg Tyr Asp Thr Lys Ser Ser Ser Phe Met Val Ile Ile Ala Gln
705 710 715 720
Leu Arg Asn Leu His Ala Phe Ser Ile Pro His Ser Ser Lys Val Tyr
725 730 735
Phe Arg Val Ala Leu Leu Pro Ser Ser Ala Asp Val Ser Cys Leu Phe
740 745 750
Arg Thr Lys Val His Pro Pro Thr Glu Ser Val Leu Tyr Asn Asp Val
755 760 765
Phe Arg Val Ala Val Ser Gln Ala Ala Leu Gln Gln Lys Thr Leu Arg
770 775 780
Val Asp Leu Cys Ser Ala Ser Lys His Arg Arg Glu Glu Cys Leu Ala
785 790 795 800
Gly Thr Gln Ile Ser Leu Ala Asp Leu Pro Phe Ser Asn Glu Ile Phe
805 810 815
Met Leu Trp Tyr Asn Leu Leu Pro Ser Lys Gln Met Pro Cys Lys Lys
820 825 830
Asn Glu Asp Gly Asn Glu Glu Pro Gly Ala Arg Ser Gln Gln Pro Met
835 840 845
Leu Asp Pro Ile Asp Leu Asp Ala Val Ser Ala Leu Leu Ala Arg Thr
850 855 860
Ser Ala Glu Leu Leu Ala Val Glu Gln Glu Leu Ala Gln Glu Glu Glu
865 870 875 880
Glu Glu Glu Leu Arg Pro Glu Arg Arg Gly Pro Gly Arg Asp Cys Leu
885 890 895
Thr Met Leu Arg Glu Ala Ser Asp Glu Pro Ala Ala Leu Arg Glu Ser
900 905 910
Gly Val Pro Leu Ala Glu Gly Ser Arg Cys Thr Glu Asp Pro Lys Pro
915 920 925
Cys Pro Arg Gly Pro Glu Thr Ser Gln Cys Arg Lys Glu Pro Ala Glu
930 935 940
Asp Pro Gly Gln Leu Pro Ser Gly Leu Pro Thr Leu Val Asp Lys Glu
945 950 955 960
Thr Asn Thr Asp Glu Val Val Asp Ser Asn Met Ala Val Arg Pro Lys
965 970 975
Asp Arg Ser Ser Leu Ser Ser Arg Gln His Pro Phe Val Arg Asn Ser
980 985 990
Val Ile Val Arg Ser Gln Thr Phe Ser Pro Gly Glu Arg Ser Gln Tyr
995 1000 1005
Ile Cys Arg Leu Asn Arg Ser Asp Ser Asp Ser Ser Thr Leu Ala
1010 1015 1020
Lys Lys Ser Leu Phe Val Arg Asn Ser Thr Glu Arg Arg Ser Leu
1025 1030 1035
Arg Val Lys Arg Ala Val Cys Gln Pro Thr Leu Arg Arg Thr Ala
1040 1045 1050
Gln Glu Cys Pro Val Arg Thr Ser Leu Asp Leu Glu Leu Asp Leu
1055 1060 1065
Gln Ala Ser Leu Thr Arg Gln Ser Arg Leu Asn Asp Glu Leu Gln
1070 1075 1080
Ala Leu Arg Gly Leu Arg Gln Lys Leu Glu Glu Leu Lys Ala Gln
1085 1090 1095
Gly Glu Thr Asp Leu Pro Pro Gly Val Leu Glu Asp Glu Arg Phe
1100 1105 1110
Gln Lys Leu Leu Lys Gln Ala Glu Lys Gln Ala Glu Gln Thr Lys
1115 1120 1125
Glu Glu Gln Lys Gln Asp Leu Asn Ala Glu Arg Leu Met Arg Gln
1130 1135 1140
Val Ser Lys Asp Val Cys Arg Leu Arg Glu Gln Ser Gln Lys Glu
1145 1150 1155
Pro Arg Gln Val Gln Ser Phe Arg Glu Lys Ile Ala Tyr Phe Thr
1160 1165 1170
Arg Ala Lys Ile Ser Ile Pro Ser Leu Pro Ala Asp Asp Val
1175 1180 1185
<210> 17
<211> 1181
<212> PRT
<213> 原鸡(Gallus gallus)
<400> 17
Met Pro Arg Lys Ala Gly Asn Gly Gln Leu Pro Leu Pro Asp Gly Trp
1 5 10 15
Glu Glu Ala Arg Asp Tyr Asp Gly Lys Val Phe Tyr Ile Asp His Asn
20 25 30
Thr Lys Gln Thr Ser Trp Ile Asp Pro Arg Asp Arg Leu Thr Lys Pro
35 40 45
Leu Ser Phe Ala Asp Cys Val Gly Asp Glu Leu Pro Trp Gly Trp Glu
50 55 60
Ala Ala Tyr Asp Pro Gln Ile Gly Val Tyr Tyr Ile Asp His Ile Asn
65 70 75 80
Gln Thr Thr Gln Ile Glu Asp Pro Arg Lys Gln Trp Arg Gln Glu Gln
85 90 95
Glu Arg Met Leu Lys Asp Tyr Leu Met Val Ala Gln Asp Ala Leu Ser
100 105 110
Thr Gln Lys Glu Leu Tyr Gln Val Lys Glu Gln Arg Leu Ala Leu Ala
115 120 125
Leu Asp Glu Tyr Val Arg Leu Asn Asp Ala Tyr Lys Glu Lys Ser Ser
130 135 140
Ser Arg Thr Ser Leu Phe Ser Gly Ser Ser Ser Ser Thr Lys Tyr Asp
145 150 155 160
Pro Asp Ile Leu Lys Ala Glu Ile Ser Thr Thr Arg Leu Arg Val Lys
165 170 175
Lys Leu Lys Arg Glu Leu Ser Gln Met Lys Gln Glu Leu Leu Tyr Lys
180 185 190
Glu Gln Gly Phe Glu Thr Leu Gln Gln Ile Asp Gln Lys Met Ser Gly
195 200 205
Gly Gln Ser Gly Tyr Glu Leu Cys Glu Ala Lys Ala Ile Leu Ser Glu
210 215 220
Leu Lys Ser Ile Arg Lys Ala Ile Ser Ser Gly Glu Arg Glu Lys Gln
225 230 235 240
Asp Leu Met Lys Ser Leu Ala Lys Leu Lys Glu Lys Phe Ser Leu Asp
245 250 255
Arg Asn Ile Gly Thr Ser Glu Pro Asp Leu Ser Phe Ser Ser Val Asn
260 265 270
Ser Gln Leu Cys Phe Ser Arg Gln Thr Leu Asp Thr Gly Ser Gln Thr
275 280 285
Asp Ile Ser Gly Glu Val Gly Thr Arg Ser Arg Ser Asn Leu Ala Glu
290 295 300
Lys Val Arg Leu Ser Leu Gln Tyr Glu Glu Ala Lys Arg Ser Met Ala
305 310 315 320
Asn Leu Lys Ile Glu Leu Ser Lys Leu Asp Gly Glu Ala Trp Pro Gly
325 330 335
Ala Leu Asp Val Glu Lys Glu Lys Leu Met Leu Ile Asn Glu Lys Glu
340 345 350
Glu Leu Leu Lys Glu Leu Gln Phe Ile Thr Pro Arg Lys Arg Thr Gln
355 360 365
Asp Glu Leu Glu Gln Leu Glu Ala Glu Arg Lys Arg Leu Glu Glu Glu
370 375 380
Leu His Ser Val Lys Ser Ala Pro Ser Gln Ala Leu Ala Glu Arg Leu
385 390 395 400
Lys Leu Glu Glu Arg Arg Lys Glu Leu Val Gln Lys Leu Glu Glu Thr
405 410 415
Thr Lys Leu Thr Thr Tyr Leu His Ser Gln Leu Arg Ser Leu Ser Ala
420 425 430
Ser Thr Leu Ser Val Ser Ser Gly Ser Ser Leu Gly Ser Leu Ala Ser
435 440 445
Ser Arg Gly Ser Leu Asn Thr Ser Ser Arg Gly Ser Leu Asn Ser Leu
450 455 460
Ser Ser Thr Asp Leu Tyr Tyr Asn Gln Gly Asp Gln Ile Thr Asp Leu
465 470 475 480
Asp Tyr Gln Tyr Lys Leu Asp Phe Ile Leu Gln Glu Lys Ser Gly Tyr
485 490 495
Ile Pro Ser Gly Pro Ile Thr Thr Ile His Glu Asn Glu Val Val Ser
500 505 510
Ser His Gly Arg Leu Gly Tyr Ser Asp Ser Pro Ser Ala Thr Glu Gln
515 520 525
Pro Lys Leu Thr Glu Pro Pro Lys Ser Val Thr Ser Leu Ser Ser Arg
530 535 540
Ser Ser Leu Ser Ser Leu Ser Pro Pro Gly Ser Pro Leu Val Leu Glu
545 550 555 560
Ala Ala Phe Ser Val Ser Ala Gln Asn Ser Pro Leu His His Leu Ser
565 570 575
Thr Asp Phe Glu Asp Cys Asp Phe Ala Gly Ile Ser Leu Cys Glu Asn
580 585 590
Gln Ile Leu Leu Asp Ser Glu Ala Arg Ala Gly Ser Gln Ile Pro Thr
595 600 605
Asp Asp Lys Asp Leu Asn Glu Ser Ile Arg Gln Pro Leu Ser Ser Leu
610 615 620
His Glu Gly Ser Ser Gly Ile Asp Leu Pro Arg Arg Ala Ala Ser His
625 630 635 640
Leu Leu Ala Glu Lys Thr Ala Cys Val Ser Ala Ala Val Ser Asp Glu
645 650 655
Ser Val Ala Gly Asp Ser Gly Val Tyr Glu Ala Ser Val Lys His Leu
660 665 670
Asn Glu Thr Glu Asp Ile Val Tyr Ser Glu Asp Asp Ala Thr Ala Leu
675 680 685
Glu Ala Ala Gln Val Gln Ile Gly Leu Arg Tyr Asp His Ser Asn Ser
690 695 700
Ser Phe Val Ile Ile Ile Val Gln Leu Arg Asn Leu Pro Val Phe Ser
705 710 715 720
Val Pro Leu Gly Ser Lys Val Tyr Ile Arg Val Ala Val Leu Pro Ser
725 730 735
Ser Ala Asp Thr Ser Cys Leu Phe Arg Thr Arg Val His Pro Ala Met
740 745 750
Glu Thr Ile Leu Leu Asn Glu Ile Phe Arg Val Ala Ile Ser Gln Gly
755 760 765
Thr Leu Leu Gln Lys Thr Leu Arg Val Asp Val Cys Ala Val Ser Arg
770 775 780
Ser Arg Arg Glu Glu Cys Leu Ala Gly Thr Gln Ile Ser Leu Ala Asp
785 790 795 800
Leu Ser Phe Ser Asp Glu Thr Cys Thr Leu Trp Tyr Asn Leu Leu Ser
805 810 815
Cys Lys Gln Val Pro Gly Lys Lys Asn Lys Asp Gln Asn Glu Glu Pro
820 825 830
Met Phe Leu Leu Ser Lys Gln Ser Ser Asp Ser Leu Asp Leu Asp Ala
835 840 845
Val Ser Ala Leu Leu Glu Arg Thr Ser Ala Glu Leu Glu Ala Val Glu
850 855 860
Gln Glu Leu Ala Glu Asp Glu Glu Glu Glu Asp Glu Gln Glu Gln Arg
865 870 875 880
Gly Ser Glu Glu Asp Trp Leu Glu Met Leu Ala Glu Ala Ser Asp Glu
885 890 895
Ile Gly Asp Glu Glu Glu Asp Gly Ile Lys Leu Ala Val Glu Gly Asn
900 905 910
Cys Thr Asp Asp Thr Gly Leu Phe Ile Asp Ala Val Glu Thr Glu Glu
915 920 925
Asp Glu Asn Arg Gln Asn Arg Asp Glu Ala Arg Glu Ser Gln Gln Ala
930 935 940
Ala Val Ile Leu Thr Leu Val Asp Lys Glu Thr Asn Thr Glu Glu Ser
945 950 955 960
Val Asn Glu Asn Ala Thr Val Arg Pro Lys Asp Arg Ala Ser Trp Ser
965 970 975
Ser Arg Gln Arg Pro Phe Val Arg Asn Ser Met Ile Val Arg Ser Gln
980 985 990
Thr Phe Ser Pro Gly Glu Arg Asn Gln Tyr Ile Cys Arg Leu Ser Arg
995 1000 1005
Ser Asp Ser Asp Ser Ser Thr Leu Ala Lys Lys Ser Leu Phe Val
1010 1015 1020
Arg Asn Ala Thr Glu Arg Arg Ser Leu Arg Val Lys Arg Pro Val
1025 1030 1035
Cys Gln Pro Ile Met Arg Arg Ala Thr Gln Glu Cys Pro Ala Arg
1040 1045 1050
Thr Ser Leu Asp Leu Glu Leu Asp Leu Gln Ala Ser Arg Thr Arg
1055 1060 1065
Gln Asn Arg Leu Asn Asp Glu Leu Gln Ala Leu Arg Asp Leu Lys
1070 1075 1080
Gln Lys Leu Glu Glu Met Lys Gly Arg Gly Glu Thr Asp Leu Pro
1085 1090 1095
Leu Cys Val Leu Glu Asp Glu Arg Phe Gln Lys Leu Leu Lys Gln
1100 1105 1110
Ala Glu Lys Gln Ala Glu Gln Ser Lys Glu Glu Gln Lys Arg Gly
1115 1120 1125
Leu Thr Ala Glu Lys Leu Met Arg Lys Ala Ser Lys Asp Val Cys
1130 1135 1140
Arg Leu Arg Glu Gln Ser Gln Lys Val Pro Leu Gln Val Gln Ser
1145 1150 1155
Phe Arg Glu Lys Ile Ala Tyr Phe Thr Arg Ala Lys Ile Ser Ile
1160 1165 1170
Pro Ala Leu Pro Ala Asp Asp Val
1175 1180
<210> 18
<211> 1171
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 18
Met Pro Arg Lys Gly Asn Gly Gln Leu Pro Leu Pro Asp Gly Trp Glu
1 5 10 15
Glu Ala Arg Asp Tyr Asp Gly Lys Val Phe Tyr Ile Asp His Asn Ser
20 25 30
Arg Gln Thr Ser Trp Ile Asp Pro Arg Asp Arg Leu Thr Lys Pro Leu
35 40 45
Ser Phe Ala Asp Cys Val Gly Asn Glu Leu Pro Trp Gly Trp Glu Ser
50 55 60
Ser Tyr Asp Pro Gln Ile Gly Val Tyr Phe Ile Asn His Ile Asn Gln
65 70 75 80
Thr Thr Gln Ile Glu Asp Pro Arg Lys Leu Trp Arg Asn Glu Gln Glu
85 90 95
Arg Met Leu Lys Asp Tyr Leu Met Val Ala Gln Asp Ala Leu Ser Thr
100 105 110
Gln Lys Glu Leu Tyr His Ile Lys Glu Gln Arg Leu Ala Leu Ala Leu
115 120 125
Asp Glu Tyr Val Arg Leu Asn Asp Ala Tyr Lys Glu Lys Ser Ser Ser
130 135 140
Arg Thr Ser Leu Phe Ser Gly Ser Ser Ser Ser Thr Lys Tyr Asp Pro
145 150 155 160
Asp Ile Leu Lys Ala Glu Ile Ser Thr Thr Lys Val Arg Val Lys Lys
165 170 175
Leu Lys Arg Glu Leu Ser Gln Met Lys Gln Glu Leu Leu Tyr Lys Glu
180 185 190
Gln Gly Phe Glu Thr Leu Gln Arg Ile Asp Gln Lys Met Ser Gly Gly
195 200 205
Gln Ser Gly Tyr Glu Leu Arg Glu Ala Lys Asp Ile Leu Ser Glu Leu
210 215 220
Lys Ser Ile Arg Lys Ala Ile Ser Thr Gly Glu Lys Glu Lys Gln Asp
225 230 235 240
Leu Met Gln Ser Leu Val Lys Leu Lys Glu Arg Phe His Leu Glu Glu
245 250 255
Ala Arg Gly Arg Ser Glu Pro Asp Leu Arg Ser Asn Leu Ala Asn Ser
260 265 270
His Leu Ser Leu Ser Arg Gln Thr Leu Asp Ala Gly Ser Gln Thr Asp
275 280 285
Ile Ser Gly Asp Ile Gly Val Arg Ser Arg Ser Asn Leu Ala Glu Lys
290 295 300
Val Arg Leu Ser Leu Gln Tyr Glu Glu Ala Lys Arg Ser Met Ala Asn
305 310 315 320
Leu Lys Ile Glu Leu Ala Lys Leu Asp Ser Glu Ala Trp Pro Gly Ala
325 330 335
Leu Asp Val Glu Lys Glu Lys Leu Met Leu Ile Asn Glu Lys Glu Glu
340 345 350
Leu Leu Lys Glu Leu Gln Phe Val Thr Thr Arg Arg Arg Thr Gln Gly
355 360 365
Glu Ile Glu Arg Leu Glu Gly Glu Arg Arg Arg Leu Glu Glu Glu Leu
370 375 380
Leu Ser Val Lys Ser Ser Pro Ser Lys Ala Leu Ala Glu Gln Leu Lys
385 390 395 400
Ile Gln Glu Lys Lys Lys Glu Leu Val Lys Lys Leu Glu Glu Val Thr
405 410 415
Lys Ser Ala Thr Tyr Leu His Ser Gln Leu Lys Ser Leu Ser Ala Ser
420 425 430
Thr Leu Ser Val Ser Ser Gly Ser Ser Ile Gly Ser Leu Ala Ser Ser
435 440 445
Arg Gly Ser Leu Asn Thr Ser Ser Arg Gly Ser Leu Asn Ser Leu Ser
450 455 460
Ser Thr Asp Leu Tyr Tyr Asn Gln Asn Glu Pro Ala Ala Asp Leu Asp
465 470 475 480
Tyr Gln Tyr Lys Leu Asp Phe Leu Leu Gln Glu Lys Ser Gly Tyr Ile
485 490 495
Pro Cys Gly Pro Ile Thr Thr Ile His Glu Asn Glu Val Val His Cys
500 505 510
His Glu Arg Ile Asp Tyr Thr Asn Ser Pro Thr Ala Gln Gln Asp Thr
515 520 525
Gln Asp Ala Lys Pro Pro Lys Ser Val Thr Ser Leu Ser Ser Leu Ser
530 535 540
Ser Leu Ser Ser Leu Ser Pro Pro Gly Ser Pro Pro Val Leu Glu Gly
545 550 555 560
Val Phe Ser Leu Cys Thr Gln Asp Ser Leu Arg Thr Gly Phe Glu Ile
565 570 575
Ser Glu Leu Pro Glu Ser Phe Ala Asp Met Asn Leu His Glu Asn Leu
580 585 590
Gln Leu Met Glu Ser Val Ala Gly Glu Ser Gln Ala Leu Ala Glu Arg
595 600 605
Lys Ser Thr Gly Glu Gly Leu Arg His Gln Ser Ser Ala Ser Gln Glu
610 615 620
Gly Arg Thr Asp Ile Glu Phe Pro Arg Lys Asn Pro Asp Arg Val Gln
625 630 635 640
Glu Glu Lys Ala Met Cys Val Ser Ala Ala Val Ser Asp Glu Ser Val
645 650 655
Ala Gly Asp Ser Gly Val Tyr Glu Pro Ser Val Lys Pro Pro Gly Glu
660 665 670
Asp Pro Val Phe Asn Asp Asp Tyr Ser Ile Leu Gly Ala Ala Gln Ala
675 680 685
Gln Leu Ile Leu Arg Tyr Asp Ser Gly Asn Ser Ser Phe Val Ile Ile
690 695 700
Ile Val Lys Ala Arg Asn Asn Leu Ser Tyr Val Gln Phe Gly Ser Arg
705 710 715 720
Ile Tyr Phe Arg Val Ala Val Leu Pro Ser Ser Asn Asp Thr Ser Cys
725 730 735
Leu Phe Arg Thr Lys Val Tyr Pro Ala Thr Glu Ser Val Leu Phe Asn
740 745 750
Glu Leu Phe Arg Val Ser Ile Ser Gln Thr Thr Leu Gln Gln Lys Thr
755 760 765
Leu Arg Val Asp Met Cys Ser Val Gly Lys Thr His Arg Glu Asp Cys
770 775 780
Leu Ala Gly Thr Gln Ile Ser Leu Ala Asp Phe Ser Phe Ser Asn Asp
785 790 795 800
Val His Thr Gln Trp Tyr Thr Leu Leu Pro Ser Arg Thr Ile Pro Leu
805 810 815
His Lys Glu Gln Leu Glu Lys Ser Val Leu Ser Ala Ser Asn Thr Gln
820 825 830
Thr Ala Ala Leu Asp Leu Asp Ala Val Ser Ala Leu Leu Glu Arg Thr
835 840 845
Ser Ala Glu Leu Glu Ala Val Glu Gln Glu Leu Ala Gln Glu Asp Asp
850 855 860
Asp Gln Glu Gln Leu Cys Pro Gly Asp Asp Trp Pro Glu Met Ala Pro
865 870 875 880
Glu Glu Ser Phe Ser Thr Leu Glu Glu His Glu Ala Asp Leu Leu Leu
885 890 895
Ser Gly Glu Tyr Tyr Ala Val Pro Leu Gln Leu Ser Ser Glu Thr Thr
900 905 910
Glu Lys Ser Glu Glu Leu Tyr Gly Glu Thr Ser Asn Trp Asp Ser Val
915 920 925
Val Ser Pro Leu Pro Gln Ala Glu Leu Pro Thr Leu Val Asp Lys Glu
930 935 940
Thr Asn Thr Glu Glu Ala Leu Gln Glu Asn Leu Ser Val Arg Pro Lys
945 950 955 960
Glu Arg Ala Asn Leu Gly Ser Arg Gln Arg Pro Phe Val Arg Asn Ser
965 970 975
Met Ile Val Arg Ser Gln Thr Phe Ser Pro Gly Glu Lys Asn Gln Tyr
980 985 990
Ile Cys Arg Leu Asn Arg Ser Asp Ser Asp Ser Ser Thr Leu Ala Lys
995 1000 1005
Lys Ser Pro Phe Ile Arg Asn Ala Asn Glu Arg Arg Ser Leu Arg
1010 1015 1020
Val Lys Arg Pro Ile Cys Gln Pro Met Thr Arg Arg Thr Val His
1025 1030 1035
Glu Cys Arg Glu Arg Thr Ser Leu Asp Leu Glu Leu Asp Leu Gln
1040 1045 1050
Ala Ser Leu Thr Arg Gln Ser Arg Leu Asn Asp Glu Leu Gln Ser
1055 1060 1065
Leu Arg Asp Leu Lys Gln Arg Leu Glu Glu Met Lys Ala Arg Gly
1070 1075 1080
Glu Thr Glu Leu Pro Thr Cys Val Leu Glu Asp Glu Arg Phe Gln
1085 1090 1095
Arg Leu Leu Lys Gln Ala Glu Lys Gln Ala Glu Gln Ser Lys Glu
1100 1105 1110
Glu Gln Lys Gln Gly Leu Asn Ala Glu Lys Leu Met Arg Lys Ala
1115 1120 1125
Ser Lys Asp Val Cys Arg Leu Arg Glu Gln Ser Gln Lys Val Pro
1130 1135 1140
Leu Gln Val Gln Ser Phe Arg Glu Lys Ile Thr Tyr Phe Thr Arg
1145 1150 1155
Ala Lys Ile Ser Ile Pro Ser Leu Ser Ala Asp Asp Val
1160 1165 1170
<210> 19
<211> 1218
<212> PRT
<213> 恒河猴(Macaca mulatta)
<400> 19
Met Pro Trp Leu Ser Gly Gly Arg Arg Arg Arg Arg Gly Gln Pro Arg
1 5 10 15
Glu Ala Pro Arg Glu Pro Pro Pro Ser Ala Gln Pro Gln Arg Glu Pro
20 25 30
Pro Pro Pro Pro Ala Pro Pro Ala Ala Val Pro Thr Pro Pro Ala Pro
35 40 45
Ser Ala Gln Gln Pro Arg Ala Arg Glu Ser Ala Glu Leu Pro Leu Pro
50 55 60
Ala Gly Trp Glu Glu Ala Arg Asp Tyr Asp Gly Arg Val Phe Tyr Ile
65 70 75 80
Asp His Asn Thr Arg Gln Thr Ser Trp Ile Asp Pro Arg Asp Arg Ile
85 90 95
Thr Lys Pro Leu Thr Phe Ala Asp Cys Val Gly Asp Glu Leu Pro Leu
100 105 110
Gly Trp Glu Thr Val Tyr Asp Lys Gln Ile Gly Val Tyr Tyr Met Asp
115 120 125
His Ile Asn Lys Leu Thr Gln Ile Glu Asp Pro Arg Glu Gln Trp Arg
130 135 140
Arg Glu Gln Glu Arg Met Leu Lys Glu Tyr Leu Ile Val Ala Gln Glu
145 150 155 160
Ala Leu Asn Ala Lys Lys Glu Ile Tyr Gln Ile Lys Gln Gln Arg Phe
165 170 175
Glu Leu Ala Gln Glu Glu Tyr Gln Gln Leu His Lys Met Cys Glu Asp
180 185 190
Asp Ser Arg Ser His Ala Ser Ser Phe Ser Gly Tyr Ser Thr Asn Thr
195 200 205
Lys Tyr Asp Pro His Gln Ile Lys Ala Glu Ile Ala Ser Arg Arg Asp
210 215 220
Arg Leu Ser Arg Leu Lys Arg Glu Leu Thr Gln Met Lys Gln Glu Leu
225 230 235 240
Gln Tyr Lys Glu Lys Gly Val Glu Thr Leu Gln Glu Ile Asp Arg Lys
245 250 255
Met Ser Ser Thr His Thr Ser Tyr Lys Leu Asp Glu Ala Gln Ala Ile
260 265 270
Met Ser Glu Leu Arg Thr Ile Lys Lys Ala Ile Cys Thr Gly Glu Lys
275 280 285
Glu Arg Arg Asp Leu Met His Ser Leu Ala Lys Leu Thr Asp Ser Phe
290 295 300
Lys Asn Ser Cys Ser Val Thr Asp Ser Leu Val Asp Phe Pro His His
305 310 315 320
Ala Gly Val Pro Gly Asp Ala Gly Leu Pro Gln Gln Phe Cys Asp Ala
325 330 335
Gly Ser Gln Thr Asp Ile Ile Gly Glu Phe Val Phe Asp Asp Lys Thr
340 345 350
Arg Leu Val Asp Arg Val Arg Leu Asn Trp Gln Tyr Glu Glu Ala Arg
355 360 365
Lys Arg Val Ala Asn Ile Gln Gln Gln Leu Ala Arg Leu Asp Asn Glu
370 375 380
Ser Trp Pro Gly Thr Ala Glu Ala Asp Arg Asp Arg Leu Gln Leu Ile
385 390 395 400
Lys Glu Lys Glu Ala Leu Met Gln Glu Leu Gln Leu Ile Ile Ala Gln
405 410 415
Arg Arg Ser Ala Gly Asp Val Ala Arg Leu Glu Glu Glu Arg Glu Arg
420 425 430
Leu Glu Glu Glu Leu Arg Arg Ala Arg Ala Thr Ser Ala Gln Gly Ala
435 440 445
Thr Glu Arg Ile Leu Leu Gln Glu Lys Arg Asn Cys Leu Leu Met Gln
450 455 460
Leu Glu Glu Ala Thr Arg Leu Thr Ser Tyr Leu Gln Ser Gln Leu Lys
465 470 475 480
Ser Leu Cys Ala Ser Thr Leu Thr Val Ser Ser Gly Ser Ser Arg Gly
485 490 495
Ser Leu Ala Ser Ser Arg Gly Ser Leu Ala Ser Ser Arg Gly Ser Leu
500 505 510
Ser Ser Val Ser Phe Thr Asp Ile Tyr Gly Leu Pro Gln Tyr Glu Lys
515 520 525
Pro Asp Ala Glu Gly Gly Gln Leu Leu Arg Phe Asp Leu Ile Pro Phe
530 535 540
Asp Ser Leu Gly Arg Asp Ala Thr Phe Thr Glu Pro Ala Gly Pro Ser
545 550 555 560
Gly Phe His Lys Gln Arg Arg Ser Leu Asp Thr Pro Gln Ser Leu Ala
565 570 575
Ser Leu Ser Ser Arg Ser Ser Leu Ser Ser Leu Ser Pro Pro Ser Ser
580 585 590
Pro Leu Asp Thr Pro Phe Leu Pro Ala Ser Arg Asp Ser Pro Leu Ala
595 600 605
Gln Leu Ala Asp Ser Cys Glu Gly Pro Gly Leu Gly Ala Leu Asp Arg
610 615 620
Leu Arg Val His Ala Ser Ala Leu Gly Asp Glu Asp Leu Pro Gly Met
625 630 635 640
Ala Ala Leu Gln Pro His Gly Val Pro Gly Asp Gly Glu Gly Pro His
645 650 655
Glu Pro Gly Pro Pro Pro Ala Ser Ala Pro Val Gly Gly Thr Val Thr
660 665 670
Leu Arg Glu Asp Ser Ala Lys Arg Leu Glu Arg Arg Ala Arg Arg Ile
675 680 685
Ser Ala Cys Leu Ser Asp Tyr Ser Leu Ala Ser Asp Ser Gly Val Phe
690 695 700
Glu Pro Leu Thr Lys Arg Asn Glu Asp Ala Glu Glu Pro Ala Tyr Gly
705 710 715 720
Asp Thr Ala Ser Asn Gly Asp Pro Gln Ile His Val Gly Leu Leu Arg
725 730 735
Asp Ser Gly Asn Glu Cys Leu Leu Val His Val Leu Gln Leu Lys Asn
740 745 750
Pro Ala Gly Leu Ala Val Lys Glu Asp Cys Lys Val His Ile Arg Val
755 760 765
Tyr Leu Pro Pro Leu Asp Leu Gly Thr Pro Asn Thr Tyr Cys Ser Lys
770 775 780
Ala Leu Glu Phe Gln Val Pro Leu Val Phe Asn Glu Val Phe Arg Ile
785 790 795 800
Pro Val His Ser Ser Ala Leu Thr Leu Lys Ser Leu Gln Leu Tyr Val
805 810 815
Cys Ser Val Thr Pro Gln Leu Gln Glu Glu Leu Leu Gly Ile Ala Gln
820 825 830
Ile Asn Leu Ala Asp Tyr Asp Ser Leu Ser Glu Met Gln Leu Arg Trp
835 840 845
His Ser Val Gln Val Phe Thr Ser Ser Glu Pro Ser Arg Thr Arg Glu
850 855 860
Pro Gly Cys Ala Gly Asp Ser Ser Ala Arg Asp Pro Ala His Ala Thr
865 870 875 880
Ser Ile Ser Gly Lys Thr Asp Ala Val Thr Val Leu Leu Ala Arg Thr
885 890 895
Thr Ala Gln Leu Gln Ala Val Glu Arg Glu Leu Ala Glu Glu Arg Ala
900 905 910
Lys Leu Glu Tyr Thr Glu Glu Glu Val Leu Glu Met Glu Arg Lys Glu
915 920 925
Glu Gln Thr Glu Ala Val Ser Glu Arg Ser Trp Gln Ala Asp Ser Val
930 935 940
Asp Ser Gly Cys Ser Asn Cys Thr Gln Thr Ser Pro Pro Tyr Pro Glu
945 950 955 960
Pro Cys Cys Val Gly Ile Asp Ser Ile Leu Gly His Pro Phe Ala Ala
965 970 975
Gln Ala Gly Pro Tyr Ser Pro Glu Lys Phe Gln Pro Ser Pro Leu Lys
980 985 990
Val Asp Lys Glu Thr Asn Thr Glu Asp Leu Phe Pro Glu Glu Ala Ala
995 1000 1005
Ser Leu Leu Lys Glu Arg Ser Ser Arg Arg Ala Arg Gly Ser Pro
1010 1015 1020
Phe Val Arg Ser Gly Thr Ile Val Arg Ser Gln Thr Phe Ser Pro
1025 1030 1035
Gly Ala Arg Ser Gln Tyr Val Cys Arg Leu Tyr Arg Ser Asp Ser
1040 1045 1050
Asp Ser Ser Thr Leu Pro Arg Lys Ser Pro Phe Ile Arg Asn Thr
1055 1060 1065
Leu Glu Arg Arg Thr Leu Arg Tyr Lys Gln Ser Cys Arg Ser Ser
1070 1075 1080
Leu Ala Glu Leu Met Ala Arg Thr Ser Leu Asp Leu Glu Leu Asp
1085 1090 1095
Leu Gln Ala Ser Arg Thr Arg Gln Arg Gln Leu Asn Glu Glu Leu
1100 1105 1110
Cys Ala Leu Arg Glu Leu Arg Gln Arg Leu Glu Asp Ala Gln Leu
1115 1120 1125
Arg Gly Gln Thr Asp Leu Pro Pro Trp Val Leu Arg Asp Glu Arg
1130 1135 1140
Leu Arg Gly Leu Leu Arg Glu Ala Glu Arg Gln Thr Arg Gln Thr
1145 1150 1155
Lys Leu Asp Tyr Arg His Glu Gln Ala Ala Glu Lys Met Leu Lys
1160 1165 1170
Lys Ala Ser Lys Glu Ile Tyr Gln Leu Arg Gly Gln Ser His Lys
1175 1180 1185
Glu Pro Ile Gln Val Gln Thr Phe Arg Glu Lys Ile Ala Phe Phe
1190 1195 1200
Thr Arg Pro Arg Ile Asn Ile Pro Pro Leu Pro Ala Asp Asp Val
1205 1210 1215
<210> 20
<211> 1196
<212> PRT
<213> 热带爪蟾(Xenopus tropicalis)
<400> 20
Met Pro Trp Leu Ser Gly Gly Arg Arg Arg Arg Arg Gln Gln Gln Gln
1 5 10 15
Gln Gln Gln Pro Gln Ala Pro Ser Glu Gln Gln Arg Cys Pro Ser Pro
20 25 30
Gly Pro Ser Ser Cys Arg Arg Gly Ser Ser Glu Leu Pro Leu Pro Ala
35 40 45
Gly Trp Glu Glu Ala Arg Asp Tyr Asp Gly Arg Val Phe Tyr Ile Asp
50 55 60
His Asn Thr Arg Gln Thr Ser Trp Ile Asp Pro Arg Asp Arg Ile Thr
65 70 75 80
Lys Pro Leu Thr Phe Ala Asp Cys Val Gly Asn Glu Leu Pro Leu Gly
85 90 95
Trp Glu Ile Val Arg Asp Gln Gln Ile Gly Val Tyr Tyr Met Asp His
100 105 110
Ile Asn Gln Leu Thr Gln Val Glu Asp Pro Arg Glu Gln Trp Arg Arg
115 120 125
Glu Gln Glu Arg Met Leu Lys Glu Tyr Leu Val Val Ala Gln Glu Ala
130 135 140
Leu Asn Ala Lys Lys Glu Ile Tyr Gln Ile Lys Gln Gln Arg Phe Glu
145 150 155 160
Leu Ala Gln Glu Glu Phe Gln Gln Leu His Asp Leu Cys Glu Asp Asp
165 170 175
Ser Arg Ser Tyr Val Ser Ser Phe Ser Gly Phe Ser Ala Asn Thr Lys
180 185 190
Tyr Asp Pro Tyr Gln Ile Lys Ala Glu Ile Ala Asn Arg Arg Asp Arg
195 200 205
Leu Ser Arg Leu Lys Arg Glu Leu Thr Val Met Lys Gln Glu Leu Gln
210 215 220
Tyr Lys Glu Lys Gly Val Glu Thr Leu Gln Glu Ile Asp Arg Lys Met
225 230 235 240
Ser Ser Ala His Thr Asn Tyr Lys Leu Asp Glu Ala Gln Ala Ile Met
245 250 255
Ser Glu Leu Arg Thr Leu Arg Gln Ala Ile Cys Met Gly Glu Lys Glu
260 265 270
Arg Arg Asp Leu Met Gln Ser Leu Ala Lys Leu Thr Asp Gly Phe Arg
275 280 285
Asn Ser Cys Cys Ile Ser Asp Ser Leu Tyr Gly Ala Gln His Asn Ser
290 295 300
Gly Ser Leu Thr Asp Ser Cys Leu Pro Gln Gln Tyr Cys Asp Ala Cys
305 310 315 320
Ser Gln Thr Asp Asn Ile Gly Glu Phe Gly Phe Asp Asp Lys Ser Arg
325 330 335
Leu Ala Asp Arg Val Arg Leu Asn Trp Gln Tyr Glu Glu Ala Lys Lys
340 345 350
Arg Val Ser Ser Ile Gln His Gln Leu Ala Leu Leu Asp Asn Glu Thr
355 360 365
Trp Pro Val Met Ala Glu Ala Asp Arg Asp His Leu Gln Leu Ile Lys
370 375 380
Glu Lys Glu Ala Leu Leu Gln Asp Leu Gln Leu Ile Cys Gln Gln Arg
385 390 395 400
Arg Ser Pro Glu Asp Leu Ser Arg Met Glu Glu Glu Met Arg Arg Leu
405 410 415
Ser Asp Glu Ile Gln Arg Ala His Ala Thr Ser Ala Gln Gly Ile Thr
420 425 430
Glu Arg Leu Leu Leu Gln Glu Lys Arg Asn Ser Leu Leu Arg Cys Leu
435 440 445
Glu Glu Ala Thr Arg Leu Ala Ser Tyr Leu His Thr Gln Ile Lys Ser
450 455 460
Leu Ser Ala Ser Thr Leu Thr Val Ser Ser Gly Ser Ser Arg Gly Ser
465 470 475 480
Leu Ala Ser Ser Arg Gly Ser Leu Ala Ser Ser Arg Gly Ser Leu Ser
485 490 495
Ser Ile Ser Phe Thr Asp Ile Tyr Gly Leu Pro His Tyr Glu Lys Ala
500 505 510
Glu Thr Gln Val Glu Tyr Gly Gln Gln Met Arg Phe Asp Met Ile Pro
515 520 525
Leu Asp Ala Leu Ser Lys Asp Cys Gln Tyr Ser Glu Thr Gly Gly Leu
530 535 540
Pro Asn Leu Asn Lys Gln Lys Ile Ser Met Asp Thr Pro Gln Ser Leu
545 550 555 560
Ala Ser Leu Ser Ser Arg Ser Ser Leu Ser Ser Leu Ser Pro Pro Ser
565 570 575
Ser Pro Leu Asp Thr Pro Phe Leu Ser Ala Ser Cys Asp Ser Pro Leu
580 585 590
Thr Gln Met Ser Glu Gly Leu Glu Glu Ile Met Ser Ile Gly Ser Leu
595 600 605
Asp Met Ile Arg Gly Asn Ser Leu Thr Leu Gly Glu Glu Asn Asn Gln
610 615 620
Gly Thr Ser Ser Gln Thr Gln Gly Tyr Asn Thr Glu Asn Lys Gly Lys
625 630 635 640
Asn Leu Ser Gly Pro Leu Leu Ser Arg Leu Gln Met Ser Ala Ala Ser
645 650 655
Pro Ile Gln Glu Val Cys Thr Thr Arg Leu Gln Gly Ala Cys Arg Val
660 665 670
Ser Ala Gly Leu Ser Asp Asp Ser Leu Thr Ser Asp Ser Gly Val Phe
675 680 685
Glu Thr Leu Asn Lys Arg Asn Gly Asn Val Asp Asp Ser Val Leu Lys
690 695 700
Asn Ser Ala Lys Asn Glu Glu Pro Gln Val His Val Gly Ile Val Tyr
705 710 715 720
Asp Ser Glu Ser Glu Cys Leu Leu Val His Val Leu Gln Leu Lys Asn
725 730 735
Leu Ser Cys Ala Phe Phe Lys Gln Gly Cys Lys Ile His Ile Arg Val
740 745 750
Tyr Leu Pro Ser Leu Asp Ser Ser Thr Pro Ser Thr Tyr Cys Ser Lys
755 760 765
Ala Leu Glu Phe His Met Pro Leu Met Phe Asn Glu Ile Phe Gln Ile
770 775 780
Pro Met His Ala Ser Ile Leu Lys Gln Ser Ser Leu Gln Leu Tyr Ile
785 790 795 800
Cys Ser Val Cys Pro Gln Leu Gln Glu Lys Leu Leu Gly Ile Ala Gln
805 810 815
Ile Gly Leu Ala Asp Tyr Glu Gly Ser Thr Glu Met His Leu Gln Trp
820 825 830
Tyr Pro Ile Gln Met Tyr Ser Ser Thr Asp Pro Gln Lys Val Ser Glu
835 840 845
Ile Glu Asp Ser Met Gln Pro Ala Glu Asn Val Thr Glu Thr Lys Thr
850 855 860
Asp Ala Val Ser Ile Leu Leu Ala Arg Thr Thr Ala Gln Leu Glu Ala
865 870 875 880
Val Glu Arg Glu Leu Ala Val Glu Arg Val Lys Leu Glu Tyr Thr Glu
885 890 895
Glu Glu Ile Leu Glu Met Glu Arg Lys Glu Asp Gln Thr Glu Ala Ile
900 905 910
Ser Glu Arg Ser Trp Gln Ala Glu Ser Val Asp Ser Gly Cys His Ser
915 920 925
Asn Tyr Asn Gln Leu Ser Pro His Tyr Ser Glu Gly Cys Tyr Gly Asp
930 935 940
Ala Val Gln Gly Ser Ala Gln Thr Gly Gln Ala Asn Leu Tyr Asp Pro
945 950 955 960
Val Lys Thr His Asn Glu Pro Ile Lys Val Asp Lys Glu Thr Asn Thr
965 970 975
Glu Asp Val Phe Pro Asp Glu Val Thr Asn Leu Pro Lys Glu Arg Thr
980 985 990
Cys His Arg Ser Arg Gly Ser Pro Phe Val Arg Ser Ser Thr Ile Val
995 1000 1005
Arg Ser Gln Thr Phe Ser Pro Gly Ala Arg Ser Gln Tyr Val Cys
1010 1015 1020
Arg Leu Tyr Arg Ser Asp Ser Asp Ser Ser Thr Leu Pro Arg Lys
1025 1030 1035
Ser Pro Phe Ile Arg Asn Thr Leu Glu Arg Arg Thr Leu Arg Tyr
1040 1045 1050
Lys Gln Gln Ser Cys Gln Ser Ser Met Ala Glu Ile Met Ala Arg
1055 1060 1065
Thr Ser Leu Asp Leu Glu Leu Asp Leu Gln Ala Ser Arg Thr Arg
1070 1075 1080
Gln Arg Gln Leu Asn Glu Glu Ile Asn Ala Leu Arg Glu Leu Lys
1085 1090 1095
His Arg Leu Glu Glu Val Gln Leu Arg Gly Gln Ser Asp Leu Pro
1100 1105 1110
Gln Trp Val Leu Arg Asp Glu Arg Phe Arg Ser Leu Leu Leu Glu
1115 1120 1125
Ala Glu Arg Gln Thr Arg Gln Thr Lys Leu Glu His His Gln Glu
1130 1135 1140
Gln Ala Ala Glu Lys Met Leu Lys Lys Ala Ser Lys Glu Ile Phe
1145 1150 1155
His Leu Arg Gly Gln Asn Gln Lys Glu Pro Phe Gln Val Gln Thr
1160 1165 1170
Phe Arg Glu Lys Ile Ala Phe Phe Thr Arg Pro Arg Ile Asn Ile
1175 1180 1185
Pro Pro Leu Pro Ala Asp Asp Val
1190 1195
<210> 21
<211> 200
<212> PRT
<213> Artificial Sequence
<220>
<223> hWWC11-200,赖氨酸至精氨酸取代
<400> 21
Met Pro Arg Pro Glu Leu Pro Leu Pro Glu Gly Trp Glu Glu Ala Arg
1 5 10 15
Asp Phe Asp Gly Arg Val Tyr Tyr Ile Asp His Thr Asn Arg Thr Thr
20 25 30
Ser Trp Ile Asp Pro Arg Asp Arg Tyr Thr Arg Pro Leu Thr Phe Ala
35 40 45
Asp Cys Ile Ser Asp Glu Leu Pro Leu Gly Trp Glu Glu Ala Tyr Asp
50 55 60
Pro Gln Val Gly Asp Tyr Phe Ile Asp His Asn Thr Arg Thr Thr Gln
65 70 75 80
Ile Glu Asp Pro Arg Val Gln Trp Arg Arg Glu Gln Glu His Met Leu
85 90 95
Arg Asp Tyr Leu Val Val Ala Gln Glu Ala Leu Ser Ala Gln Arg Glu
100 105 110
Ile Tyr Gln Val Arg Gln Gln Arg Leu Glu Leu Ala Gln Gln Glu Tyr
115 120 125
Gln Gln Leu His Ala Val Trp Glu His Arg Leu Gly Ser Gln Val Ser
130 135 140
Leu Val Ser Gly Ser Ser Ser Ser Ser Arg Tyr Asp Pro Glu Ile Leu
145 150 155 160
Arg Ala Glu Ile Ala Thr Ala Arg Ser Arg Val Asn Arg Leu Arg Arg
165 170 175
Glu Met Val His Leu Gln His Glu Leu Gln Phe Arg Glu Arg Gly Phe
180 185 190
Gln Thr Leu Arg Arg Ile Asp Arg
195 200
<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> N端NMT识别基序
<400> 22
Met Gly Ser Asn Lys Ser Lys
1 5

Claims (18)

1.一种多肽,其包含WWC蛋白N端部分或其变体,并且所述多肽相对于全长WWC蛋白是截短的,其中
所述WWC蛋白N端部分包含以下氨基酸序列中的任一个:
i)SEQ ID NO:1的氨基酸6-180,
ⅱ)SEQ ID NO:3的氨基酸10-184,或
ⅱi)SEQ ID NO:5的氨基酸60-234;
所述变体与所述WWC蛋白N端部分具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性;
并且所述WWC蛋白N端部分或其变体具有激活Hippo信号通路的活性。
2.权利要求1的多肽,其中所述WWC蛋白N端部分包含以下氨基酸序列中的任一个:
ⅰ)SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
ⅱ)SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;或
ⅲ)SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、1-244或1-254;
所述变体与以上氨基酸序列中的任一个具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性。
3.权利要求2的多肽,其中所述变体包含以下氨基酸序列中的任一个:
(1)SEQ ID NO:7、8、9、10、11或12的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
(2)SEQ ID NO:13的氨基酸49-223、50-250或1-250;
(3)SEQ ID NO:14、15、16、17或18的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;
(4)SEQ ID NO:19的氨基酸61-235、52-251或1-235;或者
(5)SEQ ID NO:20的氨基酸44-218、35-234或1-218。
4.权利要求2的多肽,其中所述变体包含相对于以下氨基酸序列中的任一个具有一个或多个突变的氨基酸序列:
ⅰ)SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200;
ⅱ)SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204;或
ⅲ)SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、1-244或1-254;
其中所述突变包括氨基酸的取代和/或缺失。
5.权利要求4的多肽,其中所述突变包括:
ⅰ)相对于SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200所示的氨基酸序列包含氨基酸取代;优选地,所述取代包括对应于SEQ ID NO:1中以下位置处的一个或多个氨基酸的取代:87、88、89、90、91、92、93、94、97、98以及101-150;
ⅱ)相对于SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204所示的氨基酸序列包含氨基酸取代;优选地,所述取代包括对应于SEQ ID NO:3中以下位置处的一个或多个氨基酸的取代:91、92、93、94、95、96、97、98、101、102以及105-154;
ⅲ)相对于SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、1-244或1-254所示的氨基酸序列包含氨基酸取代;优选地,所述取代包括对应于SEQ ID NO:5中以下位置处的一个或多个氨基酸的取代:141、142、143、144、145、146、147、148、151、152以及155-204。
6.权利要求5的多肽,其中所述取代包括
ⅰ)用丙氨酸取代对应于SEQ ID NO:1中以下位置处的一个或多个氨基酸:87、88、89、90、91、92、93、94、97和98;
ⅱ)用丙氨酸取代对应于SEQ ID NO:3中以下位置处的一个或多个氨基酸:91、92、93、94、95、96、97、98、101和102;或
ⅲ)用丙氨酸取代对应于SEQ ID NO:5中以下位置处的一个或多个氨基酸:141、142、143、144、145、146、147、148、151和152。
7.权利要求4的多肽,其中所述突变包括:
ⅰ)相对于SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200所示的氨基酸序列包含氨基酸缺失;优选地,所述缺失包括对应于SEQ ID NO:1的氨基酸101-150位置处的一个或多个氨基酸的缺失;
ⅱ)相对于SEQ ID NO:3的氨基酸10-184、10-194、10-204、1-184、1-194或1-204所示的氨基酸序列包含氨基酸缺失;优选地,所述缺失包括对应于SEQ ID NO:3的氨基酸105-154位置处的一个或多个氨基酸的缺失;或
ⅲ)相对于SEQ ID NO:5的氨基酸60-234、60-244、60-254、51-234、51-244、51-250、51-254、1-234、1-244或1-254所示氨基酸序列包含氨基酸缺失;优选地,所述缺失包括对应于SEQ ID NO:5的氨基酸155-204位置处的一个或多个氨基酸的缺失。
8.权利要求7的多肽,其中所述缺失包括:
ⅰ)对应于SEQ ID NO:1的氨基酸101-110、111-120、121-130、131-140或141-150位置处的1-10个氨基酸的缺失;
ⅱ)对应于SEQ ID NO:3的氨基酸105-114、115-124、125-134、135-144或145-154位置处的1-10个氨基酸的缺失;或
ⅲ)对应于SEQ ID NO:5的氨基酸155-164、165-174、175-184、185-194或195-204位置处的1-10个氨基酸的缺失。
9.权利要求4的多肽,其中所述变体相对于SEQ ID NO:1的氨基酸6-180、6-190、6-200、1-180、1-190或1-200包含赖氨酸至精氨酸的取代。
10.权利要求1-9中任一项的多肽,其进一步与选自以下的一个或多个功能性多肽连接:His6标签、FLAG标签、HA标签、myc标签、SBP标签、StrepⅡ标签、SNAP标签、Halo标签、GST标签、n-肉豆蔻酰基转移酶(NMT)识别基序和荧光蛋白;优选地,所述功能性多肽为融合在所述多肽的N末端的NMT识别基序;更优选地,所述多肽包含肉豆蔻酰化修饰。
11.权利要求1-10中任一项的多肽,其:
(1)结合SAV1和LATS1/2;
(2)激活LATS1/2和/或促进LATS1/2的磷酸化;
(3)抑制YAP活性和/或促进YAP磷酸化;
(4)促进和/或增强YAP的细胞质定位,减少YAP的细胞核定位;
(5)激活、增强、促进Hippo信号转导;和/或
(6)抑制癌细胞的增殖;
优选地,所述癌细胞为其中包含高度活化的YAP或高表达YAP的癌细胞,或者其中包含NF2基因缺陷的癌细胞。
12.一种多核苷酸,其编码权利要求1-11中任一项的多肽,并且任选地是密码子优化的。
13.权利要求12的多核苷酸,其包含以下核苷酸序列中的任一个:
SEQ ID NO:2的核苷酸16-540、16-570、16-600、1-540、1-570或1-600;
SEQ ID NO:4的核苷酸28-552、28-582、28-612、1-552、1-582或1-612;或
SEQ ID NO:6的核苷酸178-702、178-732、178-762、151-702、151-732、151-750、151-762、1-702、154-762、1-732或1-762。
14.权利要求12或13的多核苷酸,其为DNA或RNA;
优选地,所述多核苷酸为mRNA,并且任选地通过用修饰的尿苷取代一个或多个尿苷进行修饰;
更优选地,所述mRNA包含SEQ ID NO:2的核苷酸1-600所示核苷酸序列。
15.一种表达载体,其包含权利要求12-14中任一项的多核苷酸;优选地,所述表达载体为病毒载体。
16.一种宿主细胞,其包含权利要求12-14中任一项的多核苷酸或权利要求15的表达载体。
17.一种药物组合物,其包含权利要求1-11中任一项的多肽、权利要求12-14中任一项的多核苷酸或者权利要求15的表达载体以及药学上可接受的载剂。
18.权利要求1-11中任一项的多肽、权利要求12-14中任一项多核苷酸、权利要求15的表达载体或者权利要求17的药物组合物在制备用于治疗和/或预防Hippo通路失调相关疾病的药物中的用途;
优选地,所述疾病为癌症;
更优选地,所述癌症选自肺癌、卵巢癌、膀胱癌、乳腺癌、淋巴瘤、恶性血液病、头颈癌、头颈部鳞状细胞癌、胶质瘤、鼻咽癌、喉癌、宫颈癌、子宫体瘤、骨癌、皮肤癌、前列腺癌、子宫癌、肛区癌、睾丸癌、输卵管癌、子宫内膜癌、阴道癌、霍奇金淋巴瘤、非霍奇金淋巴瘤、食道癌、小肠癌、内分泌系统癌、甲状腺癌、甲状旁腺癌、肾上腺癌、软组织肉瘤、尿道癌、阴茎癌、淋巴浆细胞淋巴瘤、膀胱癌、输尿管癌、肾盂癌、中枢神经系统肿瘤、原发性中枢神经系统淋巴瘤、脊柱肿瘤、脑干神经胶质瘤、垂体腺瘤、卡波西肉瘤、表皮状癌、鳞状细胞癌、间皮瘤、宫颈鳞癌、结直肠癌、骨肉瘤、非小细胞肺癌、肺腺癌、胰腺癌、慢性淋巴细胞白血病、急性淋巴细胞白血病、神经胶质瘤、胃癌、神经鞘瘤、脑膜瘤、三阴性乳腺癌、肾癌、乳头状肾细胞癌、透明细胞肾细胞癌、结直肠癌、黑色素瘤、肝癌、肝细胞癌、肝内胆管癌。
CN202210360976.4A 2022-04-07 2022-04-07 激活Hippo信号通路的多肽及其用途 Pending CN116925205A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210360976.4A CN116925205A (zh) 2022-04-07 2022-04-07 激活Hippo信号通路的多肽及其用途
PCT/CN2023/086440 WO2023193739A1 (zh) 2022-04-07 2023-04-06 激活hippo信号通路的多肽及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210360976.4A CN116925205A (zh) 2022-04-07 2022-04-07 激活Hippo信号通路的多肽及其用途

Publications (1)

Publication Number Publication Date
CN116925205A true CN116925205A (zh) 2023-10-24

Family

ID=88244072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210360976.4A Pending CN116925205A (zh) 2022-04-07 2022-04-07 激活Hippo信号通路的多肽及其用途

Country Status (2)

Country Link
CN (1) CN116925205A (zh)
WO (1) WO2023193739A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7993836B2 (en) * 2006-01-27 2011-08-09 Translational Genomics Research Institute Genes affecting human memory performance
CN106540258B (zh) * 2015-09-22 2019-09-24 北京师范大学 Hippo通路在调控癌细胞S100A7、S100A8和S100A9表达中的应用
CN106492191A (zh) * 2016-12-08 2017-03-15 中国医科大学 Wwc3蛋白分子在制备抗肿瘤药物中的应用

Also Published As

Publication number Publication date
WO2023193739A1 (zh) 2023-10-12

Similar Documents

Publication Publication Date Title
Garbers et al. Species specificity of ADAM10 and ADAM17 proteins in interleukin-6 (IL-6) trans-signaling and novel role of ADAM10 in inducible IL-6 receptor shedding
KR102619197B1 (ko) Hsd17b13 변종 및 이것의 용도
JP4351896B2 (ja) p38/JTV−1を有効成分とする癌治療用薬学的組成物及び癌治療用薬学的組成物のスクリーニング方法
US8999660B2 (en) Methods Relating to Mammalian Rictor Polypeptide
US7541431B2 (en) Cristin/R-spondin ligands active in the Wnt signaling pathway and methods, compositions and kits relating thereto
US20110189097A1 (en) Use of WNT inhibitor to inhibit angiogenesis in the CNS
JP2006523209A (ja) アペリン組成物によって血管新生を調節するための方法
TW202142254A (zh) 用於治療或預防纖維化、肥大或心臟衰竭之骨髓源性生長因子
JPWO2007004325A1 (ja) S1−5を含有するタンパク質製剤
CN113209303B (zh) Wwp1通过溶酶体途径降解癌蛋白muc1抑制肿瘤及其应用
US20040253728A1 (en) New method
KR20160048103A (ko) Vegf-c 및 ccbe1의 치료적 용도
TW201200151A (en) Methods and compositions related to reduced MET phosphorylation by leukocyte cell-derived chemotaxin 2 in tumor cells
CN116925205A (zh) 激活Hippo信号通路的多肽及其用途
Kong et al. Isoform-specific disruption of the TP73 gene reveals a critical role for TAp73γ in tumorigenesis via leptin
WO2017214296A1 (en) Junctophilin-2 fragments and uses therefor
TW201639879A (zh) 似胰島素生長因子2(igf2)之傳訊和調節
Wang et al. Difference in an intermolecular disulfide-bond between two highly homologous serum proteins Leg1a and Leg1b implicates their functional differentiation
JP5093578B2 (ja) 受容体型プロテインチロシンホスファターゼPtprzによるErbB4シグナルの抑制
JP4488720B2 (ja) アポトーシス関連蛋白質およびその用途
US20090226929A1 (en) Titinic ion channel, compositions and methods of use
Racz et al. In vivo secretion of the mouse immunoglobulin G Fc fragment from rat submandibular glands
Coppola The role of Furin in type 2 diabetes and obesity
KR20220011698A (ko) P2x7 수용체 발현 조절제
이지선 Role of SENP2 on browning of white adipose tissue

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination