CN111499760A - 嵌合因子viii多肽及其用途 - Google Patents

嵌合因子viii多肽及其用途 Download PDF

Info

Publication number
CN111499760A
CN111499760A CN201911266598.8A CN201911266598A CN111499760A CN 111499760 A CN111499760 A CN 111499760A CN 201911266598 A CN201911266598 A CN 201911266598A CN 111499760 A CN111499760 A CN 111499760A
Authority
CN
China
Prior art keywords
fviii
vwf
protein
chimeric protein
hours
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911266598.8A
Other languages
English (en)
Inventor
伊克塔·赛思·切布拉
刘童瑶
罗伯特·彼得斯
江海燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biobelli Therapeutics
Biogen Inc
Biogen MA Inc
Original Assignee
Biobelli Therapeutics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biobelli Therapeutics filed Critical Biobelli Therapeutics
Publication of CN111499760A publication Critical patent/CN111499760A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/36Blood coagulation or fibrinolysis factors
    • A61K38/37Factors VIII
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/94Stability, e.g. half-life, pH, temperature or enzyme-resistance
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Diabetes (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明提供包含VWF的D’结构域和D3结构域的VWF片段、包含所述VWF片段和异源部分的嵌合蛋白或包含所述VWF片段和FVIII蛋白的嵌合蛋白及其使用方法。包含本发明的VWF片段的多肽链结合包含FVIII蛋白的多肽链或与之缔合,并且包含所述VWF片段的所述多肽链可阻止或抑制内源性VWF与所述FVIII蛋白的结合。通过阻止或抑制作为FVIII的半衰期限制因子的内源性VWF与所述FVIII的结合,所述VWF片段可诱导所述FVIII蛋白的半衰期延长。本发明还包括核苷酸、载体、宿主细胞、使用所述VWF片段或所述嵌合蛋白的方法。

Description

嵌合因子VIII多肽及其用途
本申请是申请日为2013年1月12日、中国专利申请号为201380013452.7(国际申请号为PCT/US2013/021330)、发明名称为“嵌合因子VIII多肽及其用途”的发明专利申请的分案申请。
发明背景
凝血是血液形成凝块的复杂过程。它是止血即阻止受损血管的失血的重要部分,其中受损血管壁被含血小板和血纤维蛋白的凝块覆盖,以终止流血并开始修复受损血管。凝血障碍可导致出血(溢血)或阻塞性凝血(血栓形成)的风险增加。
凝血几乎在血管损伤破坏血管的内皮细胞内衬后的瞬间开始。血液暴露于蛋白质例如组织因子引发了血小板和血浆蛋白凝血因子血纤维蛋白原的变化。血小板立即在损伤部位形成血塞;这称为初期止血。二期止血与此同时进行:血浆中称为凝血因子或凝固因子的蛋白质在复杂的级联反应中响应,形成增强血小板栓的血纤维蛋白链。非限制性凝血因子包括但不限于:因子I(血纤维蛋白原)、因子II(凝血酶原)、组织因子、因子V(促凝血球蛋白原、不稳定因子)、因子VII(稳定因子、前转变素)、因子VIII(抗血友病因子A)、因子IX(抗血友病因子B或克雷司马斯因子(Christmas factor))、因子X(斯图亚特因子(Stuart-Prower factor))、因子XI(血浆促凝血酶原激酶先质)、因子XII(接触因子(Hagemanfactor))、因子XIII(血纤维蛋白稳定因子)、VWF、前激肽释放酶(弗莱彻因子(Flectcherfactor))、高分子量激肽原(HMWK)(菲茨杰拉德因子)、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白C、蛋白S、蛋白Z、血纤维蛋白溶酶原、α2-抗血纤维蛋白溶酶、组织血纤维蛋白溶酶原激活物(tPA)、尿激酶、血纤维蛋白溶酶原激活物抑制剂-1(PAI1)和血纤维蛋白溶酶原激活物抑制剂-2(PAI2)。
甲型血友病是编码凝血因子VIII(FVIII)的基因缺陷导致的出血性病症,并且在10,000例出生男性中有1-2例受其影响。Graw等,Nat.Rev.Genet.6(6):488-501(2005)。受甲型血友病影响的患者可通过输注纯化的或重组产生的FVIII治疗。然而,所有市售FVIII产品已知具有约8-12小时的半衰期,因此需要频繁向患者静脉内施用。参见Weiner M.A.和Cairo,M.S.,Pediatric Hematology Secrets,Lee,M.T.,12.Disorders of Coagulation,Elsevier Health Sciences,2001;Lillicrap,D.Thromb.Res.122增刊4:S2-8(2008)。此外,为延长FVIII半衰期已尝试过多种方法。例如,在开发中延长凝血因子半衰期的方法包括聚乙二醇化、糖聚乙二醇化以及与白蛋白缀合作用。参见Dumont等,Blood.119(13):3024-3030(2012年1月13日在线发表)。然而,不考虑所用的蛋白质工程,目前正在开发的长效FVIII产品具有提高的半衰期,但据报道半衰期有限—在临床前动物模型中仅提高约1.5至2倍。出处同上。在人类中显示出一致的结果,例如,据报道在甲型血友病患者中与
Figure BDA0002313018640000021
相比,rFVIIIFc提高半衰期最多约1.7倍。出处同上。因此,尽管提高量很小,半衰期增加可表明存在其它T1/2限制因素。参见Liu,T.等,2007ISTH会议,摘要#P-M-035;Henrik,A.等,2011ISTH会议,摘要#P=MO-181;Liu,T.等,2011ISTH会议,摘要#P-WE-131。
血浆血管性血友病因子(VWF)具有大约12小时(在9至15小时的范围内)的半衰期。http://www.nhlbi.nih.gov/guidelines/vwd/2_scientificoverview.htm(最近访问2011年10月22日)。VWF半衰期可受到多种因素的影响:糖基化模式、ADAMTS-13(具有血小板反应蛋白基序-13的解聚素和金属蛋白酶)以及VWF中的各种突变。
在血浆中,95-98%的FVIII在具有全长VWF的紧密非共价复合物中循环。该复合物的形成对于在体内维持适当的FVIII血浆水平是重要的。Lenting等,Blood.92(11):3983-96(1998);Lenting等,J.Thromb.Haemost.5(7):1353-60(2007)。全长野生型FVIII主要以具有重链(MW 200kd)和轻链(MW 73kd)的异源二聚体存在。当FVIII由于重链第372和740位和轻链第1689位的蛋白水解而活化时,结合到FVIII的VWF从活化的FVIII移除。活化的FVIII连同活化的因子IX、钙和磷脂(“因子X酶复合物(tenase complex)”)一起参与因子X的活化,从而生成大量凝血酶。凝血酶继而切割血纤维蛋白原,形成可溶性血纤维蛋白单体,所述可溶性血纤维蛋白单体然后自发聚合形成可溶性血纤维蛋白聚合物。凝血酶还活化因子XIII,其连同钙一起用于交联并且稳定可溶性血纤维蛋白聚合物,形成交联(不溶性)血纤维蛋白。活化的FVIII通过蛋白水解从循环迅速清除。
由于频繁给药以及给药方案造成的不便,仍需要开发不需要频繁施用的FVIII产品,即半衰期长于1.5至2倍半衰期限制的FVIII产品。
发明概述
本发明涉及包含因子VIII("FVIII")蛋白和辅助部分("AM")的嵌合蛋白,其中所述辅助部分抑制或阻止内源性VWF结合所述FVIII蛋白。所述FVIII蛋白和所述辅助部分通过共价键彼此连接,以阻止在内源性VWF存在下所述辅助部分的解离。在一个实施方案中,所述共价键是肽键、二硫键或连接基(linker),其强度足以阻止在内源性VWF存在下所述辅助部分从所述FVIII蛋白解离。在另一个实施方案中,所述辅助部分阻止所述FVIII蛋白通过VWF清除途径被清除。在其它实施方案中,所述辅助部分通过屏蔽或阻断所述FVIII蛋白上的VWF结合位点抑制或阻止内源性VWF结合所述FVIII蛋白。例如,VWF结合位点位于所述FVIII蛋白的所述A3结构域或所述C2结构域或所述A3结构域和所述C2结构域二者。
在一些实施方案中,所述嵌合蛋白包括包含通过共价键彼此连接的FVIII蛋白和辅助部分的构建体,其中所述嵌合蛋白不包括引起所述FVIII蛋白的半衰期限制的FVIII半衰期限制因子,如全长VWF蛋白或成熟VWF蛋白。因此,在一些实施方案中,在内源性VWF存在下,所述嵌合蛋白的所述FVIII蛋白的所述半衰期可延长超过所述FVIII蛋白的所述半衰期限制。
在某些实施方案中,所述辅助部分具有至少一种VWF样FVIII保护特性。所述VWF样FVIII保护特性的实例包括但不限于:保护所述FVIII蛋白不被一种或多种蛋白酶切割、保护所述FVIII蛋白不被活化、稳定所述FVIII蛋白的所述重链和/或所述轻链或防止所述FVIII蛋白被一种或多种清除剂受体清除。在一个实施方案中,所述辅助部分包括多肽、非多肽部分或它们二者。在另一个实施方案中,所述辅助部分可以是包含长度为至少约40个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约110个、至少约120个、至少约130个、至少约140个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、至少约500个、至少约550个、至少约600个、至少约650个、至少约700个、至少约750个、至少约800个、至少约850个、至少约900个、至少约950个或至少约1000个氨基酸的氨基酸序列的多肽。在某些实施方案中,所述辅助部分包括VWF片段、免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的任何组合。在其它实施方案中,所述辅助部分是包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合的非多肽部分。
在某些实施方案中,所述辅助部分包括包含VWF的D'结构域和D3结构域的VWF片段,其中所述VWF片段通过除所述FVIII蛋白和所述辅助部分(VWF片段)之间的所述共价键之外的非共价键与所述FVIII蛋白缔合。在一个实例中,所述VWF片段是单体。在另一个实例中,所述VWF片段包括彼此之间一个或多个连接的两个、三个、四个、五个或六个VWF片段。
在一个方面,所述嵌合蛋白包含辅助部分如VWF片段和至少一个异源部分(H1)以及所述辅助部分如VWF片段和所述异源部分(H1)之间任选的连接基。在一个实施方案中,所述异源部分(H1)可包括延长所述FVIII蛋白的所述半衰期的部分,如选自由以下组成的组的多肽:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合;或选自自由以下组成的组的非多肽部分:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。在一个实施方案中,所述异源部分(H1)包括第一Fc区。在另一个实施方案中,所述异源部分(H1)包括包含至少约50个氨基酸、至少约100个氨基酸、至少约150个氨基酸、至少约200个氨基酸、至少约250个氨基酸、至少约300个氨基酸、至少约350个氨基酸、至少约400个氨基酸、至少约450个氨基酸、至少约500个氨基酸、至少约550个氨基酸、至少约600个氨基酸、至少约650个氨基酸、至少约700个氨基酸、至少约750个氨基酸、至少约800个氨基酸、至少约850个氨基酸、至少约900个氨基酸、至少约950个氨基酸或至少约1000个氨基酸的氨基酸序列。在其它实施方案中,所述嵌合蛋白包含所述辅助部分如VWF片段和所述异源部分(H1)之间的连接基,所述连接基是可切割的连接基。
在另一个方面,所述嵌合蛋白中的所述FVIII蛋白包含FVIII和至少一个异源部分(H2)。在一个实施方案中,所述异源部分(H2)能够延长所述FVIII蛋白的所述半衰期,如选自由免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合组成的组的多肽或包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合的非多肽部分。在具体实施方案中,所述异源部分(H2)包括第二Fc区。
在一些实施方案中,所述嵌合蛋白包含第一多肽链和第二多肽链,所述第一多肽链包含所述VWF片段、第一异源部分和连接基,所述第二多肽链包含所述FVIII蛋白和第二异源部分,其中所述第一多肽链和所述第二多肽链通过共价键彼此连接。在一个实例中,所述第一异源部分和所述第二异源部分通过所述共价键,如二硫键、肽键或连接基彼此连接,其中所述共价键防止体内所述第一多肽链中的所述VWF片段被内源性VWF替换。在一些实施方案中,所述FVIII蛋白和所述第二异源部分之间的所述连接基是可切割的连接基。
在某些实施方案中,连接至所述VWF片段的所述第一异源部分(H1)和连接至所述FVIII蛋白的所述第二异源部分(H2)通过连接基,如scFc连接基连接,所述连接基是可加工的连接基。
在其它实施方案中,所述嵌合蛋白中的所述FVIII蛋白还包含第三异源部分(H3)、第四异源部分(H4)、第五异源部分(H5)、第六异源部分(H6)或它们的任何组合。在一个实施方案中,所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)、所述第六异源部分(H6)中的一者或多者能够延长所述FVIII蛋白的所述半衰期。在另一个实施方案中,所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)和所述第六异源部分(H6)连接至FVIII的所述C末端或N末端或插入FVIII的两个氨基酸之间。在其它实施方案中,所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)或所述第六异源部分(H6)中的一者或多者包括包含至少约50个氨基酸、至少约100个氨基酸、至少约150个氨基酸、至少约200个氨基酸、至少约250个氨基酸、至少约300个氨基酸、至少约350个氨基酸、至少约400个氨基酸、至少约450个氨基酸、至少约500个氨基酸、至少约550个氨基酸、至少约600个氨基酸、至少约650个氨基酸、至少约700个氨基酸、至少约750个氨基酸、至少约800个氨基酸、至少约850个氨基酸、至少约900个氨基酸、至少约950个氨基酸或至少约1000个氨基酸的氨基酸序列。
在一些实施方案中,所述FVIII蛋白和所述第二异源部分之间的所述连接基或所述VWF片段和所述第一异源部分之间的所述连接基还包含位于所述连接基的所述N-末端区的第一切割位点(P1)、位于所述连接基的所述C-末端区的第二切割位点(P2)或它们二者。在其它实施方案中,所述FVIII蛋白和所述辅助部分之间的所述连接基、所述FVIII蛋白和所述第二异源部分之间的所述连接基以及所述VWF片段和所述第一异源部分之间的所述连接基中的一者或多者具有约1至约2000个氨基酸的长度。
在其它实施方案中,所述嵌合蛋白包含FVIII蛋白和辅助部分,它们通过所述FVIII蛋白和所述辅助部分之间的连接基连接,其中所述连接基还包含分选酶识别基序,如所述序列LPXTG(SEQ ID NO:106)。
本发明涉及血管性血友病因子(von Willebrand Factor,VWF)片段,所述血管性血友病因子片段包含VWF的所述D’结构域和所述D3结构域,其中所述VWF片段结合因子VIII(FVIII)并且抑制内源性VWF与FVIII蛋白结合。在一个实施方案中,本发明的所述VWF片段不是SEQ ID NO:2的第764至1274位氨基酸。在一个实施方案中,无所述VWF片段的所述FVIII蛋白具有相当于野生型FVIII的半衰期。在另一个实施方案中,所述FVIII蛋白是包含FVIII和能够延长FVIII的半衰期的异源部分的融合蛋白。所述异源部分可以是多肽、非多肽部分或它们二者。所述异源多肽部分可选自由以下组成的组:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合。在其它实施方案中,所述异源部分是免疫球蛋白恒定区或其部分,如Fc区。在其它实施方案中,所述非多肽部分选自由以下组成的组:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。在某些实施方案中,所述FVIII蛋白包含第一多肽链和第二多肽链,其中所述第一多肽链包含FVIII和第一Fc区,并且所述第二多肽链包含无FVIII的第二Fc区。
在另一个实施方案中,所述VWF片段延长FVIII的半衰期。所述D’结构域的所述氨基酸序列与SEQ ID NO:2的第764至866位氨基酸可具有至少90%、95%、96%、97%、98%、99%或100%的同一性。另外,所述D3结构域的所述氨基酸序列与SEQ ID NO:2的第867至1240位氨基酸可具有至少90%、95%、96%、97%、98%、99%或100%的同一性。在某些实施方案中,所述VWF片段包含在对应于SEQ ID NO:2的第1099位残基、第1142位残基或它们二者的残基处的至少一个氨基酸取代。在具体实施方案中,VWF片段包含、基本上由或由SEQID NO:2的第764至1240位氨基酸组成。所述VWF片段还可包含VWF的所述D1结构域、所述D2结构域或所述D1和D2结构域。在一些实施方案中,所述VWF片段还包含选自由以下组成的组的VWF结构域:所述A1结构域、所述A2结构域、所述A3结构域、所述D4结构域、所述B1结构域、所述B2结构域、所述B3结构域、所述C1结构域、所述C2结构域、所述CK结构域、它们的一个或多个片段以及它们的任何组合。在其它实施方案中,所述VWF片段是聚乙二醇化的、糖基化的、羟乙基淀粉化的(hesylated)或聚唾液酸化的。
本发明还涉及包含本文所述的VWF片段、异源部分以及所述VWF片段和所述异源部分之间的任选的连接基的嵌合蛋白。所述异源部分可以是多肽、非多肽部分或它们二者。在一个实施方案中,所述异源多肽部分选自由以下组成的组:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合。在另一个实施方案中,所述异源非多肽部分选自由以下组成的组:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。在具体实施方案中,所述异源部分是第一Fc区。所述嵌合蛋白还可包含第二Fc区,其中所述第二Fc区连接至所述第一Fc区或与所述第一Fc区缔合,或连接至所述VWF片段或与所述VWF片段缔合。
在一个方面,本发明的嵌合蛋白包含选自由以下组成的组的式:
(aa)V-L1-H1-L2-H2,
(bb)H2-L2-H1-L1-V,
(cc)H1-L1-V-L2-H2,和
(dd)H2-L2-V-L1-H1,
其中V是本文所述的一个或多个VWF片段,
L1和L2中的每个是任选的连接基;
H1是第一异源部分;
(-)是肽键或一个或多个氨基酸;并且
H2是任选的第二异源部分。
在一个实施方案中,H1是第一异源部分,如本领域已知的半衰期延长分子。在一个实施方案中,所述第一异源部分是多肽。所述第一异源多肽部分选自由以下组成的组:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合。在另一个实施方案中,H1是选自由以下组成的组的非多肽部分:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。H2是任选的第二异源部分,如本领域已知的半衰期延长分子。在一个实施方案中,所述第二异源部分可选自由以下组成的组:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合。在另一个实施方案中,H2是选自由以下组成的组的非多肽部分:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。在某些实施方案中,H1是第一Fc区,并且H2是第二Fc区。所述第一Fc区和所述第二Fc区可以是相同的或不同的,并且可以通过连接基或共价键如二硫键彼此连接。在另一个实施方案中,所述第二Fc区连接至因子VIII蛋白或与因子VIII蛋白缔合。任选地,可存在作为半衰期延长因子的第三异源部分H3,其连接至所述VWF片段、所述第一异源部分或所述第二异源部分。所述第三异源部分的非限制性实例可包括多肽或非多肽部分或它们二者。在一个实施方案中,所述第三异源多肽部分可选自由以下组成的组:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的任何组合。在另一个实施方案中,H2是选自由以下组成的组的非多肽部分:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。在一些实施方案中,H3通过可切割的连接基如凝血酶可切割连接基连接至所述VWF片段或所述第一或所述第二异源部分。所述连接基的非限制性实例在本文别处有所公开。
在另一个方面,本发明提供包含本文所述的VWF片段、FVIII蛋白以及所述VWF片段和所述FVIII蛋白之间的任选的连接基的嵌合蛋白。所述VWF片段与所述FVIII蛋白结合。在一个实施方案中,嵌合蛋白包含本文所述的VWF片段,其连接至异源部分。所述异源部分可以是延长所述蛋白质的所述半衰期的部分,所述异源部分包括多肽、非多肽部分或它们二者。此类异源多肽部分的实例包括,如免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、其任何衍生物或变体或它们的任何组合。非多肽部分的实例包括,如聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。在另一个实施方案中,所述异源部分是连接至所述VWF片段的第一Fc区。在其它实施方案中,所述嵌合蛋白还包含连接至所述FVIII蛋白的第二Fc区。所述VWF片段或所述FVIII蛋白可通过连接基分别连接至所述第一Fc区或所述第二Fc区。在其它实施方案中,嵌合蛋白包含连接至第一异源部分如第一Fc区的本文所述的VWF片段,以及连接至第二异源部分如第二Fc区的FVIII蛋白,其中所述VWF片段还通过连接基或通过共价键连接至所述第二异源部分(如,第二Fc区)或所述FVIII蛋白,或所述第一异源部分(如,Fc区)还通过连接基或通过共价键连接至所述FVIII蛋白或所述第二异源部分(如,第二Fc区)。在一些实施方案中,所述嵌合蛋白的所述FVIII具有部分B-结构域。在一些实施方案中,具有部分B-结构域的所述FVIII蛋白是FVIII198(SEQ ID NO:105)。在其它实施方案中,所述嵌合蛋白还包含分选酶识别基序。
在一些实施方案中,作为本发明的结果,与无所述VWF片段的FVIII蛋白或野生型FVIII相比,所述FVIII蛋白的所述半衰期延长。所述FVIII蛋白的所述半衰期比无所述VWF片段的FVIII蛋白的所述半衰期长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。在一个实施方案中,FVIII的所述半衰期比野生型FVIII的所述半衰期长约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍至约10倍。在另一个实施方案中,与野生型FVIII或无所述VWF片段的FVIII蛋白相比,所述FVIII的所述半衰期延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。在其它实施方案中,FVIII的所述半衰期为至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。在其它实施方案中,FVIII的所述半衰期为约15小时至约两周、约16小时至约一周、约17小时至约一周、约18小时至约一周、约19小时至约一周、约20小时至约一周、约21小时至约一周、约22小时至约一周、约23小时至约一周、约24小时至约一周、约36小时至约一周、约48小时至约一周、约60小时至约一周、约24小时至约六天、约24小时至约五天、约24小时至约四天、约24小时至约三天或约24小时至约两天。
在一些实施方案中,每个受试者的所述FVIII蛋白的所述平均半衰期为约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约六天、约七天(一周)、约八天、约九天、约10天、约11天、约12天、约13天或约14天。
在另一个方面,本发明的嵌合蛋白包含选自由以下组成的组的式:
(a)V-L1-H1-L3-C-L2-H2,
(b)H2-L2-C-L3-H1-L1-V,
(c)C-L2-H2-L3-V-L1-H1,
(d)H1-L1-V-L3-H2-L2-C,
(e)H1-L1-V-L3-C-L2-H2,
(f)H2-L2-C-L3-V-L1-H1,
(g)V-L1-H1-L3-H2-L2-C,
(h)C-L2-H2-L3-H1-L1-V,
(i)H2-L3-H1-L1-V-L2-C,
(j)C-L2-V-L1-H1-L3-H2,
(k)V-L2-C-L1-H1-L3-H2,和
(l)H2-L3-H1-L1-C-L2-V,
其中V是本文所述的VWF片段;
L1或L2中的每个是任选的连接基,如凝血酶可切割连接基;
L3是任选的连接基,如scFc连接基,如可加工的连接基;
H1或H2中的每个是任选的异源部分;并且
C是FVIII蛋白;并且
(-)是肽键或一个或多个氨基酸。
在其它方面,本发明的嵌合蛋白包含选自由以下组成的组的式:
(m)V-L1-H1:H2-L2-C,
(n)V-L1-H1:C-L2-H2,
(o)H1-L1-V:H2-L2-C,
(p)H1-L1-V:C-L2-H2,
(q)V:C-L1-H1:H2,
(r)V:H1-L1-C:H2,
(s)H2:H1-L1-C:V,
(t)C:V-L1-H1:H2,和
(u)C:H1-L1-V:H2,
其中V是本文所述的VWF片段;
L1或L2中的每个是任选的连接基,如凝血酶可切割连接基;
H1或H2中的每个是任选的异源部分;并且
C是FVIII蛋白;
(-)是肽键或一个或多个氨基酸;并且
(:)是H1和H2之间、V和C之间以及V和H1和C和H2之间的化学或物理缔合。(:)表示化学缔合,如至少一个非肽键。在某些实施方案中,所述化学缔合即(:)是共价键。在一些实施方案中,H1和H2之间的所述缔合是共价键,如二硫键。在其它实施方案中,所述化学缔合即(:)是非共价相互作用,如离子相互作用、疏水相互作用、亲水相互作用、范德华相互作用、氢键。在某些实施方案中,所述FVIII蛋白和所述VWF片段之间的所述缔合是非共价键。在其它实施方案中,(:)是非肽共价键。在其它实施方案中,(:)是肽键。在一个实施方案中,H1是第一异源部分。在一个实施方案中,所述第一异源部分能够延长所述FVIII活性的半衰期。在另一个实施方案中,所述第一异源部分是多肽、非多肽部分或它们二者。在一个实施方案中,所述第一异源多肽部分可选自由以下组成的组:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合。在另一个实施方案中,所述非多肽部分选自:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。在一些实施方案中,H2是第二异源部分。所述第二异源部分也可以是本领域已知的半衰期延长因子(half-life extender),并且可以是多肽、非多肽部分或它们二者的组合。在一个实施方案中,所述第二异源部分选自由以下组成的组:免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段以及它们的任何组合。在某些实施方案中,所述非多肽部分选自由以下组成的组:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物以及它们的任何组合。在具体实施方案中,H1是第一Fc区。在一些实施方案中,H2是第二Fc区。任选地,可存在半衰期延长因子第三异源部分H3。H3可通过任选的连接基,如可切割的连接基,如凝血酶可切割连接基连接至V、C、H1或H2中的一者或多者。所述第三异源部分的非限制性实例可包括免疫球蛋白恒定区或其部分、白蛋白或其片段、聚乙二醇(PEG)、PAS序列和羟乙基淀粉(HES)或其衍生物。
在某些实施方案中,用于使式(a)至(u)的所述VWF片段、所述FVIII蛋白、所述第一异源部分和/或所述第二异源部分彼此连接的一个或多个所述连接基是可切割的连接基。用于所述嵌合蛋白的一个或多个所述切割位点可被选自由以下组成的组的蛋白酶切割:因子XIa、因子XIIa、激肽释放酶、因子VIIa、因子IXa、因子Xa、因子IIa(凝血酶)、弹性蛋白酶-2、粒酶-B、TEV、肠激酶、蛋白酶3C、分选酶A、MMP-12、MMP-13、MMP-17和MMP-20。在其它实施方案中,用于式(a)至(l)的一个或多个连接基(如,L3)包括可加工的连接基。所述可加工的连接基可在分泌时被胞内酶切割。所述可加工的连接基可包含位于所述连接基的所述N-末端区的第一切割位点(P1)、位于所述连接基的所述C-末端区的第二切割位点(P2)或它们二者。
在一些实施方案中,一个或多个用于本发明的所述连接基具有至少约1至2000个氨基酸的长度。在具体实施方案中,一个或多个用于本发明的所述连接基具有至少约20、35、42、48、73、98、144、288、324、576或864个氨基酸的长度。在具体实施方案中,一个或多个所述连接基包含gly/ser肽。所述gly/ser肽可以是(Gly4Ser)3或(Gly4Ser)4
在其它方面,嵌合蛋白中的FVIII蛋白是功能性因子VIII蛋白。所述FVIII蛋白可包含一个或多个其选自由以下组成的组的FVIII结构域:所述A1结构域、所述A2结构域、所述B结构域、所述A3结构域、所述C1结构域、所述C2结构域、一个或多个其片段以及它们的任何组合。在一个实施方案中,所述FVIII蛋白包含所述B结构域或其部分。在另一个实施方案中,所述FVIII蛋白是SQ B结构域缺失的FVIII。在其它实施方案中,所述FVIII蛋白包含单链FVIII。在其它实施方案中,所述FVIII蛋白包含FVIII的重链和因子VIII的轻链,其中所述重链和所述轻链通过金属键彼此缔合。在某些实施方案中,所述FVIII蛋白具有对低密度脂蛋白受体相关蛋白(LRP)的低亲合力或不与低密度脂蛋白受体相关蛋白(LRP)结合。例如,用于本发明的FVIII蛋白可包含降低对LRP的所述亲合力或消除与所述LRP的结合的至少一个氨基酸取代。所述至少一个氨基酸取代的非限制性实例位于与全长成熟FVIII的第471位残基、第484位残基、第487位残基、第490位残基、第497位残基、第2092位残基、第2093位残基或两个或更多个其组合对应的残基处。在一些实施方案中,本发明的嵌合蛋白中的所述FVIII蛋白包含至少一个氨基酸取代,其使得所述FVIII蛋白比无所述取代的FVIII蛋白更稳定。在其它实施方案中,所述FVIII蛋白包含所述A2结构域中的至少一个氨基酸取代和所述A3结构域中的至少一个氨基酸取代,其中所述A2结构域和所述A3结构域通过共价键彼此缔合。所述A2结构域中的所述氨基酸取代的非限制性实例位于与全长成熟FVIII的第662或664位残基对应的残基处。此外,所述A3结构域中的所述氨基酸取代的非限制性实例位于与全长成熟的聚唾液酸化FVIII的第1826或1828位残基对应的残基处。
在另外的方面,本发明提供编码本文所述的VWF片段或本文所述的嵌合蛋白的多核苷酸,或一组包含第一核苷酸链和第二核苷酸链的多核苷酸,其中所述第一核苷酸链编码所述VWF片段,并且所述第二核苷酸链编码所述第二Fc区或所述嵌合蛋白的所述凝血因子或其片段。在一个实施方案中,所述多核苷酸组还包含第三多核苷酸链,其编码属于所述枯草杆菌蛋白酶样前蛋白转化酶家族的前蛋白转化酶。所述前蛋白转化酶的非限制性实例包括前蛋白转化酶枯草杆菌蛋白酶/kexin 3型(PACE或PCSK3)、前蛋白转化酶枯草杆菌蛋白酶/kexin 5型(PCSK5或PC5)、前蛋白转化酶枯草杆菌蛋白酶/kexin 7型(PCSK7或PC7)或酵母Kex 2。在其它方面,本发明包括包含所述多核苷酸或所述多核苷酸组和一个或多个可操作地连接至所述多核苷酸或所述多核苷酸组的启动子的载体,或一组包括第一载体和第二载体的载体,其中所述第一载体编码所述多核苷酸组的所述第一多核苷酸链,并且所述第二载体编码所述多核苷酸组的所述第二多核苷酸链。所述载体组还可包含第三载体,其包含编码PC5或PC7的第三多核苷酸链。在一些实施方案中,所述载体还包含PACE。在一些实施方案中,PACE切割所述VWF片段的所述D1D2结构域。
在一些方面,本发明涉及包含所述VWF片段、所述嵌合蛋白、所述多核苷酸、所述多核苷酸组、所述载体或所述载体组以及可药用载体的药物组合物。本发明的组合物可延长因子VIII的半衰期。在其它方面,本发明包括包含所述多核苷酸、所述多核苷酸组、所述载体或所述载体组的宿主细胞。
在其它方面,本发明涉及包含FVIII蛋白、辅助部分和任选的连接基的嵌合蛋白,其中所述辅助部分抑制或阻止内源性VWF结合所述FVIII蛋白,并且具有至少一种VWF样FVIII保护特性。所述VWF样FVIII保护特性包括保护所述FVIII蛋白不被一种或多种蛋白酶切割,保护所述FVIII蛋白不被活化,稳定所述FVIII蛋白的所述重链和/或所述轻链或防止所述FVIII蛋白被一种或多种清除剂受体清除。
所述嵌合蛋白中的所述辅助部分可通过屏蔽或阻断所述FVIII蛋白上的VWF结合位点抑制或阻止内源性VWF结合所述FVIII蛋白。在一些实施方案中,所述VWF结合位点位于所述FVIII蛋白的所述A3结构域或所述C2结构域或所述FVIII蛋白的A3结构域和C2结构域二者。在另一个实施方案中,所述VWF结合位点是与SEQ ID NO:16的第1669至1689位和第2303至2332位氨基酸对应的所述氨基酸序列。在一些实施方案中,所述辅助部分是多肽、非多肽部分或它们二者。用作所述辅助部分的所述多肽可包含长度为至少40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个或1000个氨基酸的氨基酸序列。例如,用作辅助部分的所述多肽可选自由以下组成的组:VWF片段、免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、其它半衰期延长技术以及它们的任何组合。用作辅助部分的所述非多肽部分可选自由以下组成的组:聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)或其衍生物以及它们的任何组合。在一个实施方案中,所述辅助部分是本文描述的所述VWF片段。所述辅助部分和所述FVIII蛋白可例如通过连接基连接或彼此缔合。所述连接基可包括可切割的连接基,如凝血酶可切割连接基。
在一个方面,本发明提供阻止或抑制FVIII蛋白与内源性VWF结合的方法,所述方法包括将有效量的所述VWF片段、所述嵌合蛋白、所述多核苷酸或所述多核苷酸组加入到包含FVIII蛋白或编码所述FVIII蛋白的多核苷酸的细胞,其中所述VWF片段结合所述FVIII蛋白。在另一个方面,本发明包括阻止或抑制所述FVIII蛋白与内源性VWF结合的方法,所述方法包括将有效量的所述嵌合蛋白、所述多核苷酸或所述多核苷酸组加入到需要其的受试者,其中所述VWF片段结合所述FVIII蛋白,并且从而阻止或抑制所述FVIII蛋白的结合。在一些方面,本发明包括延长或增加FVIII蛋白的半衰期的方法,其中所述方法包括将有效量的所述VWF片段、所述嵌合蛋白、所述多核苷酸或所述多核苷酸组加入到包含FVIII蛋白或编码所述FVIII蛋白的多核苷酸的细胞或加入到需要其的受试者,其中所述VWF片段结合所述FVIII蛋白。在其它方面,本发明涉及阻止或抑制FVIII蛋白从细胞清除的方法,其中所述方法包括将有效量的所述VWF片段、所述嵌合蛋白、所述多核苷酸或所述多核苷酸组加入到包含FVIII蛋白或编码所述FVIII蛋白的多核苷酸的细胞或加入到需要其的受试者,其中所述VWF片段结合所述FVIII蛋白。
在另一个方面,本发明涉及治疗需要其的受试者的出血性疾病或病症的方法,所述方法包括施用有效量的所述VWF片段、所述嵌合蛋白、所述多核苷酸或所述多核苷酸组,其中所述出血性疾病或病症选自由以下组成的组:出血性凝血障碍、关节出血症、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、头部创伤、胃肠出血、颅内溢血、腹腔内溢血、胸腔溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血以及髂腰肌鞘出血。在其它实施方案中,所述治疗是预防性的或按需的。在其它实施方案中,本发明涉及治疗需要其的受试者的与2N型血管性血友病相关的疾病或病症的方法,所述方法包括施用有效量的所述VWF片段、所述嵌合蛋白、所述多核苷酸或所述多核苷酸组,其中所述疾病或病症得以治疗。
附图简述
图1A-F.VWF蛋白的示意图。图1A示出了包含SEQ ID NO:73的第1至276位氨基酸(SEQ ID NO:2的第764至1039位氨基酸)的两个VWF片段。VWF-001在不存在VWF的前/原肽序列的情况下合成,而VWF-009在存在前/原肽序列(D1和D2结构域)的情况下合成。VWF-009的前肽在合成期间被切割,并且VWF-009包含具有D’和D3结构域序列的原肽。图1B示出了包含SEQ ID NO:73的第1至477位氨基酸(SEQ ID NO:2的第764至1240位氨基酸)的三个VWF片段。VWF-002在不存在前/原肽序列的情况下合成。除D’D3结构域之外,VWF-010还包含D1D2结构域。除在SEQ ID NO:72的第336和379位残基处取代半胱氨酸的丙氨酸残基之外,VWF-013还包含D1D2D’D3结构域。图1C示出了包含D’D3结构域和A1结构域的一部分的两个VWF片段。VWF-003具有SEQ ID NO:2的第764至1274位氨基酸。除D’D3结构域之外,VWF-011还包含D1D2结构域。图1D示出了两个构建体VWF-004和VWF-012。VWF-004包含D’D3结构域和A1结构域的完整序列。VWF-012包含D1D2D’D3结构域和A1结构域的完整序列。图1E示出了三个构建体。VWF-006包含D1D2D’D3结构域和VWF的CK结构域(半胱氨酸结结构域)。VWF-008是全长VWF。VWF-031(VWF-Fc)示出了包含通过可切割的连接基连接至单Fc区的D1D2D’D3结构域的构建体。VWF-053是D1D2结构域。图1F示出了包含原肽(D1和D2结构域)和成熟亚基(D’、D3、A1、A2、A3、D4、B1-3、C1-2结构域)的全长VWF蛋白。VWF蛋白为约250kDa蛋白质,并且通过二硫键形成多聚体(>20MDa)。在非共价复合物中VWF蛋白与FVIII(95-98%)缔合,然后通过保护FVIII不被蛋白酶切割/活化,稳定重链和轻链以及阻止FVIII被清除剂受体清除来延长FVIII的半衰期。VWF蛋白还可通过VWF受体清除FVIII-VWF复合物以及阻止胞饮和rFVIIIFc循环来限制FVIII的半衰期。
图2.VWF:FVIII异源二聚体构建体的实例的示意图。左边构建体示出了具有全长VWF的D’D3结构域(SEQ ID NO:73的第1-477位氨基酸)并且包含SEQ ID NO:72的第336和379位残基处的丙氨酸取代的VWF片段。嵌合蛋白构建体(FVIII 064/065)包含通过连接基连接至第一Fc区的VWF片段的C-末端,并且FVIII连接至第二Fc区,其中第二Fc区还通过连接基连接至VWF片段的N-末端(如,式C-H1-L1-V-L2-H2,其中V为VWF片段,C为FVIII,H1和H2为Fc区,并且L1和L2为可切割的连接基)。图2b中的构建体是在细胞内加工的VWF:FVIII异源二聚体构建体,其中第二Fc和VWF片段的N-末端之间的连接基被切割。FVIII-064包含VWF的D’D3结构域(具有C336A和C379取代的SEQ ID NO:73的第1至477位氨基酸)。FVIII-065包含VWF的D’D3结构域(SEQ ID NO:73的第1至276位氨基酸)。FVIII-136包含通过可被胞内蛋白酶加工的连接基连接至D’D3片段-Fc的FVIIIFc。当FVIII-136表达时,酶切割第二Fc(融合至FVIII-LC)和VWF D’D3片段(融合至第一Fc)之间的连接基,而融合至(或连接至)FVIII-LC的Fc区与融合至(或连接至)VWF片段的第一Fc形成共价键(如,二硫键)。FVIII-148是具有D’D3片段的单链FVIIIFc(通过将R1645A/R1648A突变引入FVIII基因而形成的单链FVIII)。
图3.包含VWF和Fc之间的可变连接基实例的VWF:FVIII异源二聚体构建体实例的示意图。构建体(FVIII-064、FVIII-159、FVIII-160、FVIII-178和FVIII-179)具有如式C-H1-L1-V-L2-H2表示的通用结构,但包含不同连接基或氨基酸取代的实例。所示构建体包含相同的VWF片段,该片段为VWF的D’和D3结构域(即,具有氨基酸取代C336A和C379A的SEQ IDNO:73的第1至477位氨基酸)。构建体FVIII 64具有VWF片段和Fc(即,H2)之间的凝血酶可切割连接基(即,L2),该连接基具有20个氨基酸。构建体FVIII 159具有VWF片段和Fc(即,H2)之间的凝血酶可切割连接基(即,L2),该连接基具有35个氨基酸。构建体FVIII 160具有VWF片段和Fc(即,H2)之间的凝血酶可切割连接基(即,L2),该连接基具有48个氨基酸。构建体FVIII-180、FVIII-181和FVIII-182分别为包含FVIII C1结构域中的K2092A突变、FVIII C1结构域中的K2093A突变以及FVIII C1结构域中的K2092A/K2093A突变的FVIII-160的衍生物。构建体FVIII 178具有VWF片段和Fc(即,H2)之间的凝血酶可切割连接基(即,L2),该连接基具有73个氨基酸。构建体FVIII 179具有VWF片段和Fc(即,H2)之间的凝血酶可切割连接基(即,L2),该连接基具有98个氨基酸。
图4:FVIII-VWF构建体的实例的示意图,其中VWF是VWF的D1D2D’D3片段,连接基是包含切割位点如凝血酶切割位点的可变长度连接基,SC FVIII是包含R1645A/R1648A取代的单链FVIII,H是异源部分,如免疫球蛋白恒定区或其部分、缀合聚乙二醇(PEG)和/或PEG的部分、白蛋白或白蛋白片段、白蛋白结合部分、HAP序列、聚唾液酸化和/或聚唾液酸部分、羟乙基淀粉(HES)和/或HES部分或PAS序列等,HC FVIII是FVIII的重链,LC FVIII是FVIII的轻链,并且Fc是免疫球蛋白恒定区的Fc区。图4A具有式VWF-连接基-SC FVIII。图4B具有式VWF-连接基-H-连接基-SC FVIII。连接基(VWF和H之间的第一连接基和H和SC FVIII之间的第二连接基)可以是相同的或不同的。图4C具有式VWF-连接基-SC FVIII-连接基-H。连接基(VWF和SC FVIII之间的第一连接基和SC FVIII和H之间的第二连接基)可以是相同的或不同的。图4D具有式VWF-连接基-HC FVIII-H-连接基-LC FVIII。连接基(VWF和HC FVIII之间的第一连接基和H和LC FVIII之间的第二连接基)可以是相同的或不同的。图4E具有式HCFVIII-H-LC FVIII-连接基-第一Fc-连接基-VWF-连接基-第二Fc。连接基(LC FVIII和第一Fc之间的第一连接基、第一Fc和VWF之间的第二连接基和VWF和第二Fc之间的第三连接基)可以是相同的或不同的。连接基可以是可切割的连接基。例如,第一Fc和VWF之间的连接基可以是包含在连接基的N-末端和/或C-末端的切割位点的可切割的连接基。第一Fc和第二Fc可以是相同的或不同的。图4F具有式HC FVIII-H-LC FVIII-连接基-第一Fc-连接基-VWF-连接基-第二Fc。连接基(LC FVIII和第一Fc之间的第一连接基、第一Fc和VWF之间的第二连接基和VWF和第二Fc之间的第三连接基)可以是相同的或不同的。一个或多个连接基可以是可切割的连接基。例如,第一Fc和VWF之间的连接基可以是包含在连接基的N-末端和/或C-末端的切割位点的可切割的连接基。第一Fc和第二Fc可以是相同的或不同的。图4G具有式SC FVIII-连接基-Fc-连接基-VWF-H-连接基-Fc。图4H具有式聚乙二醇化或羟乙基淀粉化SC FVIII-连接基-Fc-连接基-VWF-H-连接基-Fc。连接基(SC FVIII和第一Fc之间的第一连接基、第一Fc和VWF之间的第二连接基以及H和第二Fc之间的第三连接基)可以是相同的或不同的。一个或多个连接基可以是可切割的连接基。例如,第一Fc和VWF之间的连接基可以是包含在连接基的N-末端和/或C-末端的切割位点的可切割的连接基。第一Fc和第二Fc可以是相同的或不同的。
图5.FVIII-VWF异源二聚体共转染系统的示意图。构建体FVIII-155包含连接至Fc区的全长FVIII序列(丙氨酸残基取代第1645和1648位的精氨酸残基)。VWF-031包含D1D2D’D3片段(丙氨酸残基取代第336和379位的半胱氨酸残基),其连接至具有48凝血酶可切割连接基的另一个Fc区。在细胞内加工后,构建体FVIII-155生成融合至一个Fc片段的全长单链FVIII(SCFVIII),构建体VWF-031生成连接至另一个Fc片段的477个氨基酸的D’D3片段。两个共价键可在连接至SC FVIII或D’D3片段的Fc片段之间形成,这继而允许FVIII和D’D3的共价缔合,这是所需最终产物的主要特征。
图6是VWF-009(D1D2D’D3 1-276aa×6HIS)的非还原和还原SDS PAGE,其显示出VWF-009以单体存在。未加工意指VVF-009具有原肽(D1D2结构域)。
图7是VWF-002(D’D3 1-477aa×6his)或VWF-010(D1D2D’D3 1-477aa×6his)的非还原和还原SDS PAGE,其显示出VWF-002以单体存在,且VWF-010以二聚体存在。
图8示出了图2(b)中示出的FVIII-VWF异源二聚体的凝血酶消化。第1泳道示出分子量标准。第2泳道是无凝血酶的rFVIII-Fc。第3泳道是有凝血酶的rFVIII-Fc。第5泳道是FVIIIFc-VWF。第6泳道示出了FVIIIFc-VWF和凝血酶。A1表示FVIII的A1结构域,A2表示FVIII的A2结构域,并且Δa3 LC表示FVIII的轻链。
图9A-B示出了通过FVIII显色测定法测量的FVIII活性。图9A示出了HemA小鼠中rFVIII和rFVIIIFc的药代动力学曲线。图9B示出了FVIII/VWF双敲除(DKO)小鼠中rFVIII和rFVIIIFc的PK曲线。Y轴示出FVIII活性,单位为mIU/mL,X轴示出时间。
图10A-B示出了D’D3片段对FVIII的保护,其通过质粒注射48小时后mFVIII血浆水平(mIU/mL)和VWF表达水平(nM/mL)示出。用于示出FVIII保护的VWF片段为VWF-001(276aa,单体)、VWF-009(276aa,单体)、VWF-002(477aa,单体)、VWF-010(477aa,二聚体)、VWF-003(511aa,单体)、VWF-011(511aa,二聚体)、VWF-004(716aa,单体)、VWF-012(716aa,二聚体)、VWF-006和VWF-008。
图11示出了共施用D’D3片段时FVIII-VWF DKO小鼠中rBDD-FVIII的药代动力学曲线。图11A示出了rBDD-FVIII和VWF-002或rBDD-FVIII和VWF-010共施用或rBDD-FVIII单独施用后FVIII/VWF DKO小鼠中通过FVIII显色测定测量的FVIII活性(mIU/mL)。图11B示出了施用后VWF-002和VWF-010的血浆水平(ng/mL)。X轴表示时间,单位为小时。
图12示出了表达VWF D’D3的小鼠中rFVIIIFc的药代动力学曲线。图12A示出了编码D’D3结构域质粒DNA的高压注射(hydrodynamic injection,HDI)(第-5天)、rFVIIIFc的静脉内给药(第0天)和PK样品收集(第0天-第3天)的时间轴。图12B示出了通过FVIII显色测定测量的D1D2D’D3结构域(477aa)HDI(圆形)的FVIII/VWF DKO小鼠中和具有半胱氨酸取代的D1D2D’D3结构域(477aa)(矩形)的FVIII/VWF DKO小鼠中rFVIIIFc注入后血浆FVIII活性(mIU/mL)。无D’D3结构域HDI的对照小鼠中FVIII活性以三角形示出。图12C示出了D1D2D’D3二聚体或D1D2D’D3单体DNA构建体的HDI施用后D’D3血浆水平(ng/mL)。X轴表示时间,单位为小时。
图13示出了FVIII/VWF DKO小鼠中通过HDI的D’D3-Fc连接基选择。将不同长度连接基(20aa(FVIII-064)、35aa(FVIII-159)或48aa(FVIII-160))插入D’D3结构域和Fc区之间。FVIII/VWF DKO小鼠中HDI后的FVIII活性(mIU/ml)通过FVIII显色测定测量。
图14示出了FVIII/VWF DKO小鼠中单链FVIIIFc/D’D3异源二聚体的HDI。加工(双链)rFVIIIFc-D’D3(pSYN-FVIII-136)和单链rFVIIIFc-D’D3(pSYN-FVIII-148)的FVIII活性在HDI 24小时和48小时后测量。
图15示出了通过Octet测定测量的FVIII-155/VWF-031异源二聚体与固定化hVWF的结合亲合力。FVIIIFc、FVIII和IgG也用作对照。x-轴显示时间,单位为秒,并且y-轴显示结合,单位为纳米(nm)。
图16示出了FVIII/VWF缺陷(FVIII/VWF DKO)小鼠中FVIII-155/VWF-031的药代动力学。x-轴表示时间,单位为小时,并且y-轴表示相对于输入的FVIII回收率,单位为%。
图17:VWF片段构建体实例的示意图,其中VWF是VWF的D1D2D’D3片段;连接基是包含切割位点如凝血酶切割位点的可变长度连接基;H是异源部分,如免疫球蛋白恒定区或其部分、缀合聚乙二醇(PEG)的部分和/或PEG、白蛋白或白蛋白片段、白蛋白结合部分、HAP序列、聚唾液酸化部分和/或聚唾液酸、羟乙基淀粉(HES)部分和/或HES或PAS序列等;并且Fc是免疫球蛋白的Fc区。图17A具有式D1D2-D’部分D3-H-部分D3-连接基-Fc。图17B具有式D1D2-部分D’-H-部分D'D3-连接基-Fc。图17C具有式D1D2-聚乙二醇化或羟乙基淀粉化D’D3-连接基-Fc。连接基可任选地被切割。
图18:A)示出了HemA(菱形)和DKO(正方形)血浆二者中FVIIIFc随时间推移丧失FVIII活性。FVIII活性通过显色测定测量。X-轴显示时间,单位为小时,y-轴显示相对活性。B)示出了FVIII活性由于重链(HC)的解离或降解而丧失。左图示出了使用绵羊抗-FVIII多克隆抗体在Bio-rad 4-15%凝胶中进行的免疫沉淀测定。凝胶为还原的,并且通过Bio-rad系统成像。第1泳道示出Bio-rad未染色的分子量标准;第2泳道示出FVIIIFc和PBS;第3泳道示出FVIIIFc和DKO血浆;第5泳道示出单独的绵羊抗-FVIII多克隆抗体。右图示出了使用FVIII抗重链抗体(GMA012)进行的凝胶蛋白质印迹分析。第1泳道示出Bio-rad未染色的分子量标准;第2泳道示出FVIIIFc和PBS;第3泳道示出FVIIIFc和DKO血浆;第4泳道示出单独的绵羊抗-FVIII多克隆抗体。
图19示出了通过显色测定测量的DKO小鼠血浆(左图)和HemA小鼠血浆(右图)中野生型FVIIIFc(圆形)、scFVIIIFc(单链FVIII)(实心三角形)或FVIII:VWF异源二聚体(如,FVIII155/VWF31)(空心三角形)随时间变化的FVIII活性。Y轴示出了相对FVIII活性。野生型FVIIIFc包含FVIII的双链(即,非共价结合的FVIII重链和FVIII轻链),从而具有三条链,即FVIII重链、融合至Fc的FVIII轻链以及单独Fc。ScFVIIIFc包含FVIII单链,并且从而具有两条链,一条具有融合至Fc的单链FVIII,另一条具有单独Fc。FVIII:VWF异源二聚体(如,FVIII155/VWF031)包含融合至Fc的单链FVIII和融合至Fc的VWF片段(D'D3)。
图20示出了通过不同浓度的PC5或PACE(弗林蛋白酶)进行的由VWF片段(如,VWF-031(D1D2D'D3Fc))的D1D2结构域的加工。D1D2加工在还原条件的Bio-rad 4-15%凝胶上通过Bio-rad成像仪示出。第1泳道示出单独VWF031;第2泳道示出单独PC5;第3泳道示出单独PACE;第4泳道示出2.5%的VWF031和PC5;第5泳道示出5%的VWF031和PC5;第6泳道示出7.5%的VWF031和PC5;第7泳道示出10%的VWF031和PC5;第8泳道示出2.5%的VWF031和PACE;第9泳道示出5%的VWF031和PACE;第10泳道示出7.5%的VWF031;并且第11泳道示出10%的VWF031和PACE。
图21:A)示出了通过ForteBio octet仪器进行的FVIII:VWF异源二聚体(如,FVIII-155/VWF-031)的结合测定。对于该测定,全长VWF使用APS传感器捕集。FVIIIFc和FVIII与全长VWF的结合在左下左图示出。未结合的FVIIIY1680(不具有对VWF的亲合力的突变体)和FVIII:VWF异源二聚体(FVIII155/VWF031)在右下图示出。B)示出了FVIII:VWF异源二聚体(如,FVIII-155/VWF-031)的另一个结合测定。在该测定中,构建体(VWF031构建体、FVIII-155/VWF031或FVIII)固定在蛋白G传感器上。测量构建体与FVIII的结合。
图22示出了通过表面等离子共振实验测量的VWF D'D3结构域与FVIII分子的结合亲合力。VWF031构建体(100RU)通过1000RU抗人IgG捕集。B-结构域缺失的FVIII以1:1拟合以单周期动力学模式施加。总数为4。
图23示出了当施用于FVIII/VWF DKO小鼠时,FVIIIFc/VWF异源二聚体构建体中不同连接基长度对药代动力学的影响。三个不同的连接基(48aa、73aa或98aa),即VWF031、VWF035和VWF036插入D'D3和Fc之间。归一化为5分钟值(%)的FVIII活性在Y-轴中示出。
图24示出了VWF片段与FVIII的分选酶连接实例。A)示出了两个连接构建体,(1)C-末端融合至分选酶识别基序(如,LPXTG)的VWF片段以及(2)N-末端具有甘氨酸(n)的FVIII。在与分选酶反应后,VWF片段和分选酶识别基序连接至FVIII的N-末端。B)示出了两个连接构建体,(1)其C-末端融合至分选酶识别基序的FVIII以及(2)其N-末端具有甘氨酸(n)的VWF片段。在与分选酶反应后,FVIII和分选酶识别基序在VWF片段的N-末端融合至VWF片段。C)示出了两个连接构建体,(1)通过可变长度连接基融合至分选酶识别基序的VWF片段以及(2)其N-末端融合至甘氨酸(n)的FVIII。在与分选酶反应后,通过连接基融合至分选酶识别基序的VWF连接至FVIII的N-末端。D)示出了两个连接构建体,(1)通过可变长度连接基融合至分选酶识别基序的FVIII以及(2)其N-末端融合至甘氨酸(n)的VWF。在与分选酶反应后,通过连接基融合至分选酶识别基序的FVIII连接至VWF片段的N-末端。E)示出了包含通过可变长度连接基融合至分选酶识别基序的VWF片段的连接构建体,所述分选酶识别基序还融合至蛋白酶切割位点(如,凝血酶切割位点),该位点通过可变长度连接基融合至Fc。
图25示出了FVIII155和FVIII198的比较示意图。FVIII155编码单链FVIIIFc蛋白。FVIII198是包含部分B-结构域的单链FVIIIFc分子-226N6。226表示FVIII B-结构域的N-末端226个氨基酸,并且N6表示B-结构域中的六个N-糖基化位点。
图26A)示出了测量DKO血浆中FVIII155和FVIII198随时间变化的相对活性的稳定性测定。如图所示,部分B-结构域存在于FVIII198中增加了单链FVIIIFc相对于FVIII155的稳定性;B)示出了DKO小鼠中FVIII198、FVIII155和双链(dcFVIIIFc)的半衰期比较。如图所示,与双链FVIII相比,单链FVIII(FVIII155)半衰期增加1.5倍。具有266N6 B-结构域的单链FVIII(FVIII198)半衰期也增加1.5倍。曲线图示出了FVIII回收率对5分钟值(%)随时间的变化。
发明详述
定义
值得注意的是,术语“一个”或“一种”实体是指该实体的一者或多者;例如,“核苷酸序列”应理解为表示一个或多个核苷酸序列。因此,术语“一个”(或“一种”)、“一个或多个”和“至少一个”在本文中可互换使用。
术语“多核苷酸”或“核苷酸”旨在涵盖单个核酸以及多个核酸,并且指分离的核酸分子或构建体,如信使RNA(mRNA)或质粒DNA(pDNA)。在某些实施方案中,多核苷酸包含常规磷酸二酯键或非常规键(如,酰胺键,例如可见于肽核酸(PNA)中)。术语“核酸”是指任何一种或多种存在于多核苷酸中的核酸片段,如DNA或RNA片段。所谓“分离的”核酸或多核苷酸意指从其天然环境移除的核酸分子、DNA或RNA。例如,出于本发明的目的,包含于载体中的编码因子VIII多肽的重组多核苷酸被认为是分离的。分离的多核苷酸的另外实例包括保持在异源宿主细胞中或从溶液中的其它多核苷酸纯化(部分或基本上)的重组多核苷酸。分离的RNA分子包括本发明多核苷酸的体内或体外RNA转录物。根据本发明的分离的多核苷酸或核酸还包括此类合成产生的分子。此外,多核苷酸或核酸可包括调控元件,例如启动子、增强子、核糖体结合位点或转录终止信号。
如本文所用,“编码区”或“编码序列”是由可翻译为氨基酸的密码子组成的多核苷酸的一部分。虽然“终止密码子”(TAG、TGA或TAA)通常不翻译为氨基酸,但其可视为编码区的部分,但任何侧翼序列,例如启动子、核糖体结合位点、转录终止子、内含子等不是编码区的部分。编码区的边界通常通过编码所得多肽的氨基末端的处于5’末端的起始密码子,和编码所得多肽的羧基末端的处于3’末端的翻译终止密码子确定。本发明的两个或更多个编码区可存在于单个多核苷酸构建体中,如单个载体上,或单独的多核苷酸构建体中,如单独的(不同的)载体上。然后,它遵循单个载体可以仅包含单个编码区,或包含两个或更多个编码区,如单个载体可独立地编码结合结构域-A和结合结构域-B,如下所述。此外,本发明的载体、多核苷酸或核酸可编码融合或未融合至编码本发明的结合结构域的核酸的异源编码区。异源编码区包括不限于特化元件或基序,例如分泌信号肽或异源功能结构域。
哺乳动物细胞分泌的某些蛋白质与分泌信号肽缔合,一旦延长的蛋白质链开始跨过糙面内质网输出,所述信号肽即从成熟蛋白质切割。本领域的普通技术人员认识到,信号肽通常融合至多肽的N-末端,并且从完整的或“全长”多肽切割,以产生分泌或“成熟”形式的多肽。在某些实施方案中,使用天然信号肽,如免疫球蛋白重链或轻链信号肽,或保持指导与其可操作地缔合的多肽分泌的能力的该序列功能衍生物。或者,可使用异源哺乳动物信号肽,如人组织血纤维蛋白溶酶原激活物(TPA)或小鼠β-葡糖醛酸酶信号肽,或其功能衍生物。
术语“下游”是指位于参考核苷酸序列的3’端的核苷酸序列。在某些实施方案中,下游核苷酸序列涉及沿着转录的起始点的序列。例如,基因的翻译起始密码子位于转录的起始位点下游。
术语“上游”是指位于参考核苷酸序列的5’端的核苷酸序列。在某些实施方案中,上游核苷酸序列涉及位于编码区的5’侧或转录的起始点的序列。例如,大多数启动子位于转录的起始位点上游。
如本文所用,术语“调控区”是指位于编码区的上游(5'非编码序列)内,或下游(3'非编码序列)的核苷酸序列,并且其影响转录、RNA加工、稳定性或缔合编码区的翻译。调控区可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎-环结构。如果预期编码区在真核细胞中表达,则多腺苷酸化信号和转录终止序列将通常位于编码序列的3’端。
编码基因产物如多肽的多核苷酸可包括可操作地与一个或多个编码区缔合的启动子和/或其它转录或翻译控制元件。在可操作缔合中,基因产物如多肽的编码区与一个或多个调控区缔合,这样将基因产物的表达置于调控区的影响或控制下。例如,如果启动子功能的诱导引起编码基因产物的mRNA的转录,该基因产物由编码区编码,并且如果启动子和编码区之间的连接的性质不干扰启动子指导基因产物表达的能力,或干扰DNA模板被转录的能力,则编码区和启动子是“可操作地缔合的”。除启动子之外的其它转录控制元件,例如增强子、操纵子、阻遏子和转录终止信号也可操作地与编码区缔合,以指导基因产物表达。
多个转录控制区是本领域技术人员已知的。这些包括但不限于在脊椎动物细胞发挥功能的转录控制区,例如但不限于来自巨细胞病毒(与内含子-A结合的立即早期启动子)、猿猴病毒40(早期启动子)和逆转录病毒(例如劳氏肉瘤病毒)的启动子和增强子片段。其它转录控制区包括来源于脊椎动物基因,例如肌动蛋白、热休克蛋白、牛生长激素和兔β-球蛋白的那些,以及能够控制真核细胞中基因表达的其它序列。另外的合适转录控制区包括组织特异性启动子和增强子以及淋巴因子诱导型启动子(如,干扰素或白介素诱导的启动子)。
相似地,多种翻译控制元件是本领域普通技术人员已知的。这些包括但不限于核糖体结合位点、翻译起始和终止密码子,以及来源于小RNA病毒的元件(特别是内部核糖体进入位点或IRES,也称为CITE序列)。
如本文所用,术语“表达”是指多核苷酸产生基因产物,例如RNA或多肽的过程。其包括但不限于多核苷酸转录为信使RNA(mRNA)、转运RNA(tRNA)、小发夹RNA(shRNA)、小干扰RNA(siRNA)或任何其它RNA产物,以及mRNA翻译为多肽。表达生成“基因产物”。如本文所用,基因产物可为核酸,如基因转录生成的信使RNA,或从转录物翻译的多肽。本文所述的基因产物还包括具有转录后修饰,如多腺苷酸化或剪接的核酸,或具有翻译后修饰,如甲基化、糖基化、添加脂质、与其它蛋白亚基缔合或蛋白酶切割的多肽。
“载体”是指用于将核酸克隆和/或转移至宿主细胞的任何媒介物。载体可以是另一个核酸片段可与其连接,以便形成连接片段的复制的复制子。“复制子”是指作为体内自主复制单元起作用,即能够在其自身控制下复制的任何遗传元件(如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括用于在体外、离体或在体内将核酸引入细胞的病毒和非病毒媒介物二者。大量载体是本领域已知和使用的,包括例如质粒、修饰的真核病毒或修饰的细菌病毒。多核苷酸插入合适的载体可通过将适当的多核苷酸片段连接至所选择的具有互补粘性末端的载体实现。
载体可被工程化以编码选择性标记或报告基因,所述选择性标记或报告基因提供掺入载体的细胞的选择或识别。选择性标记或报告基因的表达允许识别和/或选择宿主细胞,该宿主细胞掺入并且表达包含于载体的其它编码区。本领域已知和使用的选择性标记基因的实例包括:提供对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨膦除草剂、磺酰胺等抗性的基因;以及用作表型标记的基因,即花色素苷调控基因、异戊烯基转移酶基因等。本领域已知和使用的报告基因的实例包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、-半乳糖苷酶(LacZ)、-葡糖醛酸酶(Gus)等。选择性标记也可视为报告基因。
术语“质粒”是指通常携带不作为细胞的中央代谢部分的基因,并且通常为环状双链DNA分子形式的染色体外元件。此类元件可为自主复制序列、基因组整合序列、噬菌体或核苷酸序列、任何来源的线性、环状或超螺旋的单链或双链DNA或RNA,其中多个核苷酸序列连接或重组为能够将所选择基因产物的启动子片段和DNA序列以及适当的3'未翻译序列引入细胞的独特结构。
可使用的真核病毒载体包括但不限于:腺病毒载体、逆转录病毒载体、腺相关病毒载体、痘病毒如牛痘病毒载体、杆状病毒载体或疱疹病毒载体。非病毒载体包括质粒、脂质体、带电荷脂质(细胞转染剂(cytofectin))、DNA-蛋白质复合物和生物聚合物。
“克隆载体”是指“复制子”,它是连续复制的单位长度核酸,并且包含复制起点,例如质粒、噬菌体或粘粒,另一个核酸片段可连接到其上,以便导致连接片段的复制。某些克隆载体能够在一种细胞类型,如细菌中复制,并且在另一种细胞类型,如真核细胞中表达。克隆载体通常包含可用于选择包含载体的细胞一个或多个序列和/或用于插入所关注的核酸序列的一个或多个多克隆位点。
术语“表达载体”是指设计为使得插入的核酸序列在插入宿主细胞后表达的载体。插入的核酸序列设置为与调控区可操作缔合,如上所述。
载体通过本领域已知的方法,如转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂质转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白引入宿主细胞。
如本文所用,“培养”意指在允许细胞生长或分裂或保持细胞活动状态的体外条件下温育细胞。如本文所用,“培养的细胞”意指体外繁殖的细胞。
如本文所用,术语“多肽”旨在涵盖单个“多肽”以及多个“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并且不是指具体长度的产物。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一条或多条链的任何其它术语,包括在“多肽”的定义内,并且术语“多肽”可用于代替任何这些术语,或可与任何这些术语互换。术语“多肽”还意指多肽的表达后修饰产物,所述表达后修饰包括但不限于糖基化、乙酰化、磷酸化、酰胺化、通过已知保护/封端基团的衍生化、蛋白酶裂解或通过非天然存在的氨基酸的修饰。多肽可衍生自天然生物来源或重组制备技术,但不必从指定的核酸序列翻译。它可以任何方式生成,包括化学合成。
“分离的”多肽或片段、变体、或其衍生物是指不处于其天然环境的多肽。不需要具体水平的纯化。例如,分离的多肽可以仅仅从其天然或自然环境移除。出于本发明的目的,在宿主细胞中表达的重组产生的多肽和蛋白质被视为分离的,通过任何合适的技术分离、分级或部分或基本上纯化的天然或重组多肽也一样。
本发明还包括多肽的片段或变体,以及它们的任何组合。当涉及本发明的多肽结合结构域或结合分子时,术语“片段”或“变体”包括保持参考多肽的至少一些特性(如,对FcRn结合结构域或Fc变体的FcRn结合亲合力、对FVIII变体的凝血活性或VWF片段的FVIII结合活性)的任何多肽。除本文别处讨论的具体抗体片段之外,多肽片段还包括蛋白酶水解片段,以及缺失片段,但不包括天然存在的全长多肽(或成熟多肽)。本发明的多肽结合结构域或结合分子的变体包括上述片段,以及具有由于氨基酸取代、缺失或插入而改变的氨基酸序列的多肽。变体可以是天然或非天然存在的。非天然存在的变体可使用本领域已知的诱变技术产生。变体多肽可包含保守或非保守氨基酸取代、缺失或添加。
如本文所用,术语一个或多个“VWF片段”意指与FVIII相互作用并且保持全长VWF通常提供给FVIII的至少一种或多种特性的任何VWF片段,所述特性如防止FVIIIa的过早活化,防止过早蛋白水解,防止可导致过早清除的与磷脂膜的缔合,防止与可结合裸露FVIII而非VWF结合FVIII的FVIII清除受体的结合,和/或稳定FVIII重链和轻链相互作用。如本文所用,术语“VWF片段”不包括全长或成熟VWF蛋白。在具体实施方案中,如本文所用,“VWF片段”包含VWF蛋白的D’结构域和D3结构域,但不包括VWF蛋白的A1结构域、A2结构域、A3结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域和CK结构域。
如本文所用,术语“半衰期限制因子”或“FVIII半衰期限制因子”表示防止FVIII蛋白的半衰期长于野生型FVIII(如,
Figure BDA0002313018640000231
Figure BDA0002313018640000232
)的1.5倍或2倍的因子。例如,全长或成熟VWF可通过诱导FVIII和VWF复合物通过一条或多条VWF清除通路从系统清除而充当FVIII半衰期限制因子。在一个实例中,内源性VWF是FVIII半衰期限制因子。在另一个实例中,非共价结合至FVIII蛋白的全长重组VWF分子是FVIII半衰期限制因子。
如本文所用,术语“内源性VWF”表示天然存在于血浆中的VWF分子。内源性VWF分子可以是多聚体,但可以是单体或二聚体。血浆中的内源性VWF结合至FVIII,并且与FVIII形成非共价复合物。
“保守氨基酸取代”是其中氨基酸残基被具有类似侧链的氨基酸残基替代的取代。具有类似侧链的氨基酸残基家族在本领域中有所定义,包括碱性侧链(如,赖氨酸、精氨酸、组氨酸)、酸性侧链(如,天冬氨酸、谷氨酸)、不带电极性侧链(如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如,苏氨酸、缬氨酸、异亮氨酸)和芳基侧链(如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果多肽中的氨基酸被来自相同侧链家族的另一个氨基酸替代,则取代被视为保守的。在另一个实施方案中,氨基酸链可被侧链家族成员的顺序和/或组成不同、结构类似的链保守替代。
如本领域已知,两个多肽之间的“序列同一性”通过比较一个多肽的氨基酸序列与第二个多肽的序列确定。在本文中讨论时,任何特定多肽是否与另一条多肽具有至少约50%、60%、70%、75%、80%、85%、90%、95%、99%或100%同一性可使用本领域已知的方法和计算机程序/软件确定,例如但不限于BESTFIT程序(Wisconsin Sequence AnalysisPackage,Version 8for Unix,Genetics Computer Group,University Research Park,575Science Drive,Madison,WI 53711)。BESTFIT使用Smith and Waterman,Advances inApplied Mathematics 2:482-489(1981)的局部同源性算法查找两个序列之间的最佳同源性片段。当根据本发明使用BESTFIT或任何其它序列比对程序确定特定序列是否与参考序列具有例如95%同一性时,参数的设置毫无疑问使得同一性的百分比针对参考多肽序列全长计算,并且允许参考序列中氨基酸总数的最多5%的同源性空位。
如本文所用,VWF序列或FVIII蛋白序列中的“对应氨基酸”或“等同氨基酸”通过比对识别以使第一VWF或FVIII序列和第二VWF或FVIII序列之间的同一性或相似性最大化。用于识别第二VWF或FVIII序列中的等同氨基酸的数量基于用于识别第一VWF或FVIII序列中的对应氨基酸的数量。
“融合”或“嵌合”蛋白包含连接至第二氨基酸序列的第一氨基酸序列,其在自然状态下不会天然连接。通常存在于单独蛋白质中的氨基酸序列可集合于融合多肽中,或通常存在于相同蛋白质中的氨基酸序列在融合多肽中可置于新排列,如本发明的因子VIII结构域与免疫球蛋白Fc结构域的融合。例如,通过化学合成或通过创建和翻译其中肽区以所需关系编码的多核苷酸来创建融合蛋白。嵌合蛋白还可包含通过共价非肽键或非共价键与第一氨基酸序列缔合的第二氨基酸序列。
如本文所用,术语“半衰期”是指特定多肽在体内的生物半衰期。半衰期可通过施用给受试者的量的一半从动物中的循环和/或其它组织清除所需的时间来表示。当给定多肽的清除曲线构建为时间的函数时,曲线通常具有快速α-相和较长β-相两相。α-相通常表示所施用的Fc多肽在血管内腔和血管外间隙之间的平衡,并且部分通过多肽的大小确定。β-相通常表示血管内腔中多肽的分解代谢。在一些实施方案中,FVIII和包含FVIII的嵌合蛋白是单相的,并且因此不具有α-相,而只有单个β-相。因此,在某些实施方案中,如本文所用,术语半衰期是指β-相中多肽的半衰期。人抗体在人体中的典型β相半衰期为21天。
应用于多核苷酸或多肽的术语“异源”意指多核苷酸或多肽来源于与其进行比较的实体不同的实体。因此,连接至VWF片段的异源多肽意指连接至VWF片段的多肽链,并且不是VWF片段的天然存在部分。例如,异源多核苷酸或抗原可来源于不同的物种、个体的不同细胞类型或不同个体的相同或不同类型细胞。
如本文所用,术语“连接”是指分别共价或非共价连接至第二氨基酸序列或核苷酸序列的第一氨基酸序列或核苷酸序列。术语“共价连接”或“共价键合”是指共价键,如二硫键、肽键,或连接在一起的两个部分之间的一个或多个氨基酸,如连接基。第一氨基酸或核苷酸序列可直接连接第二氨基酸或核苷酸序列或与其并置,或者插入序列可将第一序列共价连接至第二序列。术语“连接”不仅意指第一氨基酸序列C-末端或N-末端融合至第二氨基酸序列,而且包括整个第一氨基酸序列(或第二氨基酸序列)插入第二氨基酸序列(或分别地第一氨基酸序列)中的任何两个氨基酸。在一个实施方案中,第一氨基酸序列可通过肽键或连接基连接至第二氨基酸序列。第一核苷酸序列可通过磷酸二酯键或连接基连接至第二核苷酸序列。连接基可以是肽或多肽(对于多肽链)或核苷酸或核苷酸链(对于核苷酸链)或任何化学部分(对于多肽和多核苷酸链二者)。共价键合有时以(-)或连字符表示。
如本文所用,术语“与…缔合”指第一氨基酸链和第二氨基酸链之间形成的共价或非共价键。在一个实施方案中,术语“与…缔合”意指共价非肽键或非共价键。在一些实施方案中,该缔合以冒号即(:)表示。在另一个实施方案中,其意指除肽键之外的共价键。在其它实施方案中,如本文所用,术语“共价缔合”意指两个部分之间通过共价键,如二硫键、肽键或一个或多个氨基酸(如,连接基)缔合。例如,氨基酸半胱氨酸包含可形成二硫键或与第二半胱氨酸残基上的巯基桥接的巯基。在大多数天然存在的IgG分子中,CH1和CL区通过二硫键缔合,并且两条重链通过两个二硫键在对应于使用Kabat编号系统的第239和242位(第226或229位,EU编号系统)的位置结合。共价键的实例包括但不限于:肽键、金属键、氢键、二硫键、σ键、π键、δ键、糖苷键、抓氢键(agnostic bond)、弯键、偶极键、π主链、双键、三键、四键、五键、六键、缀合作用、超缀合作用、芳香作用、哈普托数(hapticity)或反键。非共价键的非限制性实例包括离子键(如,阳离子-π键或盐键)、金属键、氢键(如,二氢键、二氢配合(dihydrogen complex)、低能障氢键或对称氢键)、范德华力、色散力(London dispersionforce)、机械结合、卤键、亲金作用、嵌入、堆叠、熵力或化学极性。
如本文所用,术语“单体-二聚体杂合物”是指包含通过二硫键彼此缔合的第一多肽链和第二多肽链的嵌合蛋白,其中第一链包含凝血因子,如因子VIII和Fc区,并且第二链包含、基本上由或由无凝血因子的Fc区组成。因此,单体-二聚体杂合构建体是包含只具有一个凝血因子的单体方面和具有两个Fc区的二聚体方面的杂合物。
如本文所用,术语“切割位点”或“酶切割位点”是指酶识别的位点。某些酶切割位点包含细胞内加工位点。在一个实施方案中,多肽具有由在凝血级联反应期间活化的酶切割的酶切割位点,使得此类位点的切割在凝血形成部位进行。此类示例性位点包括例如由凝血酶、因子XIa或因子Xa识别的那些位点。示例性FXIa切割位点包括例如TQSFNDFTR(SEQID NO:47)和SVSQTSKLTR(SEQ ID NO:48)。示例性凝血酶切割位点包括例如DFLAEGGGVR(SEQ ID NO:49)、TTKIKPR(SEQ ID NO:50)、LVPRG(SEQ ID NO:55)和ALRPR(SEQ ID NO:51的第1至5位氨基酸)。其它酶切割位点是本领域已知的。
如本文所用,术语“加工位点”或“细胞内加工位点”是指作为在多肽翻译后发挥功能的酶的靶标的多肽中的一种类型的酶切割位点。在一个实施方案中,此类酶在从高尔基腔至反面高尔基隔室的转运期间发挥功能。细胞内加工酶在蛋白质从细胞分泌之前切割多肽。此类加工位点的实例包括例如由PACE/弗林蛋白酶(其中PACE是成对碱性氨基酸裂解酶的缩写)家族内切肽酶靶向的那些。这些酶定位于高尔基体膜,并且切割序列基序Arg-[任何残基]-(Lys或Arg)-Arg的羧基末端侧的蛋白质。如本文所用,“弗林蛋白酶”家族酶包括例如PCSK1(也称为PC1/Pc3)、PCSK2(也称为PC2)、PCSK3(也称为弗林蛋白酶或PACE)、PCSK4(也称为PC4)、PCSK5(也称为PC5或PC6)、PCSK6(也称为PACE4)或PCSK7(也称为PC7/LPC、PC8或SPC7)。其它加工位点是本领域已知的。
术语“弗林蛋白酶”是指对应于EC No.3.4.21.75的酶。弗林蛋白酶是枯草杆菌蛋白酶样前蛋白转化酶,其也称为PACE(成对碱性氨基酸裂解酶)。弗林蛋白酶缺失了失活前体蛋白的部分以将它们转化为生物活性蛋白。在其细胞内转运期间,原肽通过高尔基体中的弗林蛋白酶从成熟VWF分子切割。
在包括超过一个加工或切割位点的构建体中,应当理解此类位点可以是相同的或不同的。
如本文所用,止血病症意指特征在于由于形成血纤维蛋白凝块的能力受损或无能,具有自发或作为创伤结果的溢血趋势的基因遗传或获得的病症。此类疾病的实例包括血友病。三种主要形式是甲型血友病(因子VIII缺失)、乙型血友病(因子IX缺失或“克雷司马疾病”)和丙型血友病(因子XI缺失,轻度出血趋势)。其它止血病症包括例如血管性血友病、因子XI缺失(PTA缺失)、因子XII缺失、血纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII缺失或结构异常、GPIb缺陷或缺失的巨血小板综合征(Bernard-Soulier)。VWF的受体GPIb可为缺陷的,并导致初期凝块形成(初期止血)缺乏和出血趋势增加,以及格-尼二氏血小板无力症(thrombasthenia of Glanzman and Naegeli)(Glanzmannthrombasthenia)。在肝功能衰竭(急性和慢性形式)中,肝脏产生的凝血因子不足;这可增加出血风险。
本发明的嵌合分子可预防地使用。如本文所用,术语“预防性治疗”是指在出血发作之前施用分子。在一个实施方案中,需要一般止血剂的受试者正在经历或将要经历外科手术。本发明的嵌合蛋白可在手术之前或之后作为预防即施用。本发明的嵌合蛋白可在外科手术期间或之后施用以控制急性出血发作。外科手术可包括但不限于肝脏移植、肝脏切除、牙科手术或干细胞移植。
本发明的嵌合蛋白还用于按需(也称为“发病期”)治疗。术语“按需治疗”或“发病期治疗”是指响应出血发作的症状或在可引起出血的活动之前施用嵌合分子。在一个方面,当出血开始时,例如受伤后,或当预期要出血时,例如在外科手术之前,可给予受试者按需(发病期)治疗。在另一个方面,在增加出血风险的活动,例如接触运动之前可给予按需治疗。
如本文所用,术语“急性出血”是指与根本原因无关的出血发作。例如,受试者可具有创伤、尿毒症、遗传性出血疾病(如,因子VII缺失)、血小板疾病或由于凝血因子抗体的发展而产生的抗性。
如本文所用,治疗是指例如疾病或病症的严重性减少;病程的持续时间减少;与疾病或病症相关的一个或多个症状改善;为患有疾病或病症的受试者提供有益效果,而不必治愈疾病或病症,或与疾病或病症相关的一个或多个症状的预防。在一个实施方案中,术语“治疗”意指通过施用本发明的嵌合蛋白或VWF片段保持受试者中至少约1IU/dL、2IU/dL、3IU/dL、4IU/dL、5IU/dL、6IU/dL、7IU/dL、8IU/dL、9IU/dL、10IU/dL、11IU/dL、12IU/dL、13IU/dL、14IU/dL、15IU/dL、16IU/dL、17IU/dL、18IU/dL、19IU/dL或20IU/dL的FVIII谷底水平。在另一个实施方案中,治疗意指保持约1和约20IU/dL、约2和约20IU/dL、约3和约20IU/dL、约4和约20IU/dL、约5和约20IU/dL、约6和约20IU/dL、约7和约20IU/dL、约8和约20IU/dL、约9和约20IU/dL或约10和约20IU/dL之间的FVIII谷底水平。疾病或病症的治疗也可包括保持受试者中FVIII活性相当于非血友病受试者中FVIII活性的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%的水平。治疗所需的最小谷底水平可通过一种或多种已知方法测量,并且可为每个人调整(增加或减少)。
嵌合蛋白
本发明涉及通过阻止或抑制FVIII半衰期限制因子(如内源性VWF)在体内与FVIII蛋白缔合而延长因子VIII蛋白的半衰期。内源性VWF与非共价复合物中约95%至约98%的FVIII缔合。结合至FVIII蛋白的内源性VWF已知以各种方式保护FVIII。例如,全长VWF(作为具有约250kDa的多聚体)可保护FVIII不被蛋白酶切割和FVIII活化,稳定FVIII重链和/或轻链以及防止FVIII被清除剂受体清除。然而,同时,内源性VWF通过阻止胞饮以及通过VWF清除途径从系统清除FVIII-VWF复合物限制FVIII半衰期。据信,如实例中所示,内源性VWF是半衰期限制因子,其防止融合至半衰期延长因子的FVIII蛋白的半衰期长于野生型FVIII的约两倍。因此,本发明使用辅助部分阻止或抑制内源性VWF和FVIII蛋白之间的相互作用,从而阻止FVIII蛋白被通过VWF清除途径清除和/或诱导胞饮。在一个实施方案中,辅助部分能够阻止或抑制FVIII蛋白与内源性VWF结合,并且具有至少一种VWF样FVIII保护特性。此外,辅助部分通过阻止或抑制与内源性VWF的相互作用减少FVIII从系统清除。本发明的辅助部分结合或缔合(如,通过非共价键合)FVIII蛋白和/或物理或化学阻断FVIII蛋白上的VWF结合位点。因此,与野生型FVIII或不与辅助部分缔合的FVIII相比,与辅助部分缔合的FVIII蛋白通过一个或多个VWF清除受体更缓慢地从循环清除。
本发明辅助部分的实例包括例如多肽或FVIII蛋白的化学或物理修饰、添加、缺失或变型。用于本发明的辅助部分可包括多肽、非多肽部分或它们二者。作为辅助部分的多肽的非限制性实例包括例如本文所述的VWF片段、免疫球蛋白恒定区或其部分、转铁蛋白或其片段、白蛋白或其片段、白蛋白结合部分、HAP序列、PAS序列或它们的任何组合。非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。本发明使用的其它此类部分也是本领域已知的。
在一个实施方案中,辅助部分通过共价或非共价键与FVIII蛋白缔合(或连接)。然而,在一些情况下,在内源性VWF存在下,辅助部分和FVIII蛋白之间的物理封闭或化学缔合(如,非共价键合)的强度可能不足以提供包含FVIII蛋白和辅助部分的稳定复合物。例如,在内源性VWF存在下,与FVIII蛋白形成无任何其它连接的非共价键的VWF片段可易于在体内从FVIII蛋白解离,从而用内源性VWF替代VWF片段(如,重组VWF,即rVWF)。因此,非共价结合内源性VWF的FVIII蛋白可经历VWF清除途径并从系统清除。为了阻止辅助部分与FVIII蛋白解离,在一些实施方案中,FVIII蛋白和辅助部分之间的键合是共价键,如肽键、一个或多个氨基酸或二硫键。在某些实施方案中,辅助部分和FVIII蛋白之间的缔合(即,键合)是肽键或FVIII蛋白和辅助部分之间的连接基(“FVIII/AM连接基”)。连接基的非限制性实例在本文别处有所描述。在一些实施方案中,辅助部分是包含、基本上由或由至少约10个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、1100个、1200个、1300个、1400个、1500个、1600个、1700个、1800个、1900个、2000个、2500个、3000个或4000个氨基酸组成的多肽。在其它实施方案中,辅助部分是包含、基本上由或由约100至约200个氨基酸、约200至约300个氨基酸、约300至约400个氨基酸、约400至约500个氨基酸、约500至约600个氨基酸、约600至约700个氨基酸、约700至约800个氨基酸、约800至约900个氨基酸或约900至约1000个氨基酸组成的多肽。在一些实施方案中,与FVIII蛋白共价缔合的辅助部分是本文别处所述的VWF片段。
在某些实施方案中,辅助部分化学(如,非共价)结合或物理阻断FVIII蛋白上的一个或多个VWF结合位点。FVIII蛋白上的VWF结合位点位于FVIII蛋白的A3结构域或C2结构域内。在其它实施方案中,FVIII蛋白上的VWF结合位点位于A3结构域和C2结构域内。例如,FVIII蛋白上的VWF结合位点可对应于SEQ ID NO:16[全长成熟FVIII]的第1669至1689位和/或第2303至2332位氨基酸。
在其它实施方案中,本发明的嵌合蛋白包含连接至辅助部分的FVIII蛋白,其中辅助部分是VWF分子,如包含D’结构域和D3结构域,但不包含VWF清除受体结合位点的VWF片段,并且屏蔽或保护FVIII蛋白上的VWF结合位点,从而抑制或阻止FVIII蛋白与内源性VWF的相互作用。在某些实施方案中,辅助部分是VWF片段。用于本发明的VWF片段包含D’结构域和D3结构域,仍为FVIII蛋白提供VWF样特性的一个或多个优势,但VWF片段不经历VWF清除途径。FVIII蛋白和辅助部分可通过连接基(如,FVIII/AM连接基)共价缔合。在一个实施方案中,连接基可以是可切割的连接基。连接基的非限制性实例在本文别处有所公开。
在其它实施方案中,本发明的嵌合蛋白包含FVIII蛋白和免疫球蛋白恒定区或其部分(即,辅助部分),其中免疫球蛋白恒定区或其部分屏蔽或保护FVIII蛋白上的VWF结合位点,从而抑制或阻止FVIII蛋白与内源性VWF的相互作用。在其它实施方案中,免疫球蛋白恒定区或其部分是Fc区。
在一个方面,本发明涉及嵌合或融合蛋白或包含本文所公开的一个或多个VWF片段的杂合物及其用途。嵌合或融合蛋白可融合或连接至一个或多个异源部分(本文有时以H或H1表示)。在一个实施方案中,异源部分(H1)是天然不与VWF片段一起存在和/或连接至VWF片段的异源肽或异源多肽。在另一个实施方案中,异源部分(H1)是非多肽部分,如肽或多肽与非多肽部分的化学修饰或组合。在一些实施方案中,VWF片段通过连接基(本文也称为“VWF连接基”)连接或键合至异源部分(H1)。在一个实施方案中,VWF连接基是可切割的连接基。VWF片段和异源部分(H1)之间的连接基的非限制性实例在本文别处有所公开。
在一个实施方案中,用于本发明的异源部分(H1)改善了VWF片段的一种或多种药代动力学特性,而不显著影响VWF片段的生物学活性或功能(如,其与FVIII蛋白的结合或缔合)。在另一个实施方案中,连接至VWF片段的异源部分(H1)可延长VWF片段的半衰期。异源多肽部分的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的两种或多种组合。异源非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。
在一些实施方案中,异源部分(H1)可用于通过共价键连接VWF片段和FVIII蛋白。可提供共价键合的异源部分的实例包括但不限于包含铰链区如Fc区或FcRn结合伴侣的免疫球蛋白恒定区或其部分。在具体实例中,FVIII蛋白连接至第一Fc区,并且VWF片段连接至第二Fc区,其中第一Fc区和第二Fc区形成一个或多个二硫键。
在一些实施方案中,异源部分(在本文中有时以“H”或“H1”表示)是免疫球蛋白恒定区或其部分。免疫球蛋白恒定区或其部分的非限制性实例可选自由以下组成的组:CH1结构域、CH2结构域、CH3结构域、CH4结构域、铰链结构域以及它们的两种或多种组合。在一个实施方案中,免疫球蛋白恒定区或其部分包含至少一个CH1结构域、至少一个CH2结构域、至少一个CH3结构域、至少一个CH4结构域或其功能片段。在另一个实施方案中,免疫球蛋白恒定区或其部分包含至少一个铰链结构域或其部分,以及至少一个CH2结构域或其部分(如,铰链-CH2方向)。在其它实施方案中,免疫球蛋白恒定结构域或其部分包含至少一个CH2结构域或其部分,以及至少一个CH3结构域或其部分(如,CH2-CH3方向)。组合的实例包括但不限于:CH2结构域、CH3结构域和铰链结构域,它们也称为Fc区(或Fc结构域),如第一Fc区。在其它实施方案中,异源部分(H1)通过连接基连接至VWF片段。在某些实施方案中,异源部分(H1)是本文别处所述的FcRn结合伴侣。在其它实施方案中,异源部分(H1)是铰链区。
在某些实施方案中,嵌合蛋白还包含第二(或另外的)异源部分(在本文中有时以“H2”表示)。值得注意的是,第一异源部分(H1)和第二异源部分(H2)可互换使用,并且可以是相同的或不同的。第二异源部分(H2)可通过肽键、一个或多个氨基酸,或通过连接基(如,FVIII连接基(如果连接至FVIII))连接至FVIII蛋白或嵌合蛋白的别处。此类构建体有时可称为FVIII/VWF异源二聚体。在一个实施方案中,异源部分(H2)包含异源多肽。在另一个实施方案中,异源部分(H2)包括非多肽部分。在其它实施方案中,异源部分(H2)包括异源部分和非多肽部分的组合。第二异源部分(H2)可以是半衰期延长因子。第二异源多肽部分(H2)的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的两种或多种组合。异源非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。在某些实施方案中,第一异源部分(H1)和第二异源部分是相同的或不同的。第一异源部分(H1)和第二异源部分(H2)的任一者或两者可赋予嵌合蛋白中FVIII蛋白的半衰期延长,提供比非共价缔合更强的连接,即通过嵌合蛋白中FVIII蛋白和VWF片段或它们二者之间的一个或多个共价键。一旦融合或连接至第一异源部分(H1)的VWF片段通过阻止或抑制FVIII蛋白和内源性VWF蛋白之间的相互作用移除半衰期上限,则融合至异源部分的FVIII蛋白可发挥其全部潜力,并且可具有长于野生型FVIII两倍的半衰期。
在某些实施方案中,连接至VWF片段的第一异源部分(如,第一Fc区)和连接至FVIII蛋白的第二异源部分(如,第二Fc区)彼此缔合,使得该缔合阻止VWF片段在体内被内源性VWF替代。在一个实施方案中,第二异源部分是第二Fc区,其中第二Fc区通过共价键,如二硫键、肽键或连接基(一个或多个氨基酸)连接至第一异源部分,如第一Fc区或与之缔合。例如,在一个末端连接至FVIII蛋白的第二异源部分(如,第二Fc区)还可连接至第一异源部分(如,第一Fc区),所述第一异源部分通过连接基(如,scFc连接基)连接至VWF片段,或通过共价或非共价键与第一异源部分缔合。在另一个实施方案中,第二异源部分(如,第二Fc区)连接至VWF片段,所述VWF片段已连接至第一异源部分。在一些实施方案中,嵌合蛋白包含第一多肽链和第二多肽链,所述第一多肽链包含VWF片段和第一异源部分,所述第二多肽链包含FVIII蛋白和第二异源部分,其中第一多肽链和第二多肽链缔合,其中包含第一异源部分的第一多肽链和包含第二异源部分的第二多肽链之间的缔合是共价键,因此允许VWF片段和FVIII蛋白保持其彼此相互作用。同时,可与FVIII蛋白形成非共价键的内源性VWF不能替代包含VWF片段的共价连接多肽链。
第一异源部分(H1)和VWF片段(如,VWF连接基)之间的连接基可以是可切割的连接基,如凝血酶可切割连接基。可切割的连接基可被选自由以下组成的组的蛋白酶切割:因子XIa、因子XIIa、激肽释放酶、因子VIIa、因子IXa、因子Xa、因子IIa(凝血酶)、弹性蛋白酶-2、粒酶-B、TEV、肠激酶、蛋白酶3C、分选酶A、MMP-12、MMP-13、MMP-17、MMP-20以及它们的任何组合。在凝血级联反应活化时,这些可切割的连接基允许切割VWF片段,并且从FVIII蛋白解离,从而产生具有完全活性潜力的FVIII蛋白。
在其它实施方案中,嵌合蛋白作为包含任何顺序的VWF片段、可切割的连接基、第一异源部分(H1)、可加工的连接基、FVIII蛋白和第二异源部分(H2)的单多肽链产生。在合成后,可加工的连接基可在分泌前被胞内蛋白酶切割,从而产生上述两条多肽链。在分泌前的单链构建体中,第二异源部分(如,第二Fc区)可通过可加工的连接基连接至VWF片段。在某些实施方案中,一个或多个连接基可包含一个或多个切割位点。
在一些实施方案中,本发明的嵌合蛋白还包含第三异源部分(本文有时以“H3”表示)。第三异源部分(H3)可以是半衰期延长因子。异源部分(H3)可包括异源多肽、非多肽部分或二者的组合。第三异源部分(H3)的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段、其任何衍生物或变体或它们的两种或多种组合。非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。连接至VWF片段的第一异源部分(H1)、连接至FVIII蛋白的第二异源部分(H2)和第三异源部分(H3)可以是相同的或不同的。在一个实施方案中,第一异源部分(H1)与第二异源部分(H2)相同,但不同于第三异源部分(H3)。在另一个实施方案中,第三异源部分(H3)融合或连接至嵌合蛋白的FVIII蛋白或VWF片段。在一些实施方案中,第三异源部分插入FVIII蛋白的一个或多个结构域中或FVIII蛋白的两个结构域之间。
在一个实施方案中,嵌合蛋白包含第一多肽链和第二多肽链,其中第一链包含通过任选的连接基(如,FVIII连接基)连接至第一异源部分(H1)如第一Fc区的FVIII蛋白,并且第二链包含通过任选的连接基(如,VWF连接基)连接至第二异源部分(H2)如第二Fc区的VWF片段。FVIII蛋白还可包含第三异源部分(H3),如任何半衰期延长部分,如白蛋白,或FVIII重链和FVIII轻链之间的PAS序列(即,SEQ ID NO:16的第1648位氨基酸残基),从而作为单链FVIII蛋白。或者,FVIII蛋白可以是双链蛋白,即通过共价或非共价键(如,金属键)彼此缔合的FVIII重链和FVIII轻链,其中重链还连接至第三异源部分(H3),如非结构半衰期延长多肽、白蛋白或其片段或PAS序列。在另一个实施方案中,嵌合蛋白包含第一多肽链和第二多肽链,其中第一链包含通过任选的连接基(如,FVIII连接基)连接至第一异源部分(H1)如第一Fc区的FVIII蛋白,并且第二链包含连接至第三异源部分(H3)如非结构半衰期延长多肽、白蛋白或PAS序列的VWF片段,其通过任选的连接基连接至第二异源部分(H2)如第二Fc区。在一些实施方案中,第三异源部分(H3)(如,半衰期延长多肽)可连接至FVIII蛋白的C-末端或N-末端或插入FVIII蛋白的两个结构域之间或FVIII蛋白的结构域中的两个氨基酸之间。
在其它实施方案中,本发明的嵌合蛋白还包含第四异源部分(本文有时以“H4”表示)和/或第五异源部分(本文有时以“H5”表示)。第四或第五异源部分也可以是半衰期延长因子。第四异源部分和/或第五异源部分可与第三异源部分相同或不同。异源部分可包括异源多肽、非多肽部分或二者的组合。第四或第五异源部分的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段、其任何衍生物或变体或它们的两种或多种组合。非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。第一异源部分、第二异源部分、第三异源部分、第四异源部分和第五异源部分可以是相同的或不同的。在一些实施方案中,第四异源部分(如,半衰期延长多肽)可连接至FVIII蛋白的C-末端或N-末端或插入FVIII蛋白的两个结构域之间或FVIII蛋白的结构域中的两个氨基酸之间。在其它实施方案中,第五异源部分(如,半衰期延长多肽)也可连接至FVIII蛋白的C-末端或N-末端或插入FVIII蛋白的两个结构域之间或FVIII蛋白的结构域中的两个氨基酸之间。
在某些实施方案中,嵌合蛋白包含FVIII蛋白、VWF片段、第一异源部分、第二异源部分、第三异源部分、第四异源部分和第五异源部分,其中第一异源部分和第二异源部分形成包含FVIII蛋白的链和包含VWF片段的链之间的键(如,共价键),并且第三异源部分、第四异源部分和第五异源部分是半衰期延长因子,并且其中包含FVIII蛋白的链和包含VWF片段的链之间的键强于FVIII和VWF片段之间的非共价相互作用,从而阻止内源性VWF在体内、体外或离体与FVIII蛋白结合。
在其它实施方案中,嵌合蛋白包含FVIII蛋白、VWF片段、第一异源部分、第二异源部分、第三异源部分、第四异源部分、第五异源部分和第六异源部分(本文有时以“H6”表示),其中第一异源部分和第二异源部分形成包含FVIII蛋白的链和包含VWF片段的链之间的键,并且第三异源部分、第四异源部分、第五异源部分和第六异源部分是半衰期延长因子,并且其中包含FVIII蛋白的链和包含VWF片段的链之间的键强于FVIII和VWF片段之间的相互作用,从而阻止内源性VWF在体内、体外或离体与FVIII蛋白结合。
在一些实施方案中,嵌合蛋白包含选自由以下组成的组的式:
(aa)V-L1-H1-L2-H2,
(bb)H2-L2-H1-L1-V,
(cc)H1-L1-V-L2-H2,和
(dd)H2-L2-V-L1-H1,
其中V包含本文所述的VWF片段;
L1和L2中的每个包含任选的连接基;并且
H1包含第一异源部分;并且
H2包含任选的第二异源部分。第一异源部分和第二异源部分的任一者或两者可以是半衰期延长部分。在一个实施方案中,H1包括多肽、非多肽部分或它们二者。用作H1的多肽可包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、任何衍生物或变体或它们的任何组合。非多肽部分可包括聚乙二醇(PEG)、聚唾液酸、和羟乙基淀粉(HES)、其衍生物或变体或它们的任何组合。在另一个实施方案中,H2包括多肽、非多肽部分或它们二者。用作H2的多肽可包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、任何衍生物或变体或它们的任何组合。非多肽部分可包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或变体或它们的任何组合。在某些实施方案中,式(aa)和(bb)中H1和H2之间的连接基是可加工的连接基。在其它实施方案中,式(aa)和(bb)中VWF片段和H1之间的连接基是可切割的连接基,如可被凝血酶切割的凝血酶可切割连接基。
本文的式中多肽的方向从N-末端(左)至C-末端(右)列出。例如,式H-L-V意指式NH2-H-L-V-COOH。在一个实施方案中,本文所述的式可包含两个部分之间的另外序列。例如,式V-L1-H1-L2-H2还可包含在V的N-末端、V和L1之间、L1和H1之间、H1或L2之间、L2或H2之间或在H2的C-末端的序列,除非另外指明。在另一个实施方案中,连字符(-)表示肽键或一个或多个氨基酸。
在具体实施方案中,嵌合蛋白包含、基本上由或由选自由以下组成的组的式中的一者或多者组成:(a1)V-H、(a2)H-V、(a3)V-L-H、(a4)H-L-V、(a5)V-L1-H1-H2、(a6)H2-H1-L1-V、(a7)V-L1-H1:H2、(a8)H2:H1-L1-V、(a9)V-H1:H2、(b1)H2:H1-V、(b2)V-L1-H1-L2-H2、(b3)H2-L2-H1-L1-V、(b4)H1-V-H2、(b5)H1-L1-V-L2-H2和(b6)H2-L2-V-L1-H1,其中V包含本文所述的VWF片段中的一者或多者,L、L1或L2包含连接基,H或H1包含第一异源部分。在一个实施方案中,第一异源部分(H1)可以是多肽、非多肽部分或它们二者。异源多肽部分可包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列或它们的任何组合。用作H1的非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。在另一个实施方案中,H2包含第二异源部分。第二异源部分可以是多肽、非多肽部分或它们二者。异源多肽部分可包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列或它们的任何组合。用作H1的非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。在某些实施方案中,第一异源部分和第二异源部分之间的连接基是可加工的连接基。在其它实施方案中,VWF片段和第一异源部分或第二异源部分之间的连接基是可切割的连接基,其包含一个或多个切割位点,如凝血酶可切割连接基。
本发明的嵌合蛋白包含选自由以下组成的组的式:(aa)、(bb)、(cc)、(dd)、(a1)、(a2)、(a3)、(a4)、(a5)、(a6)、(a7)、(a8)、(a9)、(b1)、(b2)、(b3)、(b4)、(b5)和(b6)以及FVIII蛋白,其共价连接至式中的VWF片段、第一异源部分(如,第一Fc区)、或第二异源部分(如,第二Fc区)或与其共价缔合。在一个实施方案中,FVIII蛋白通过共价或非共价键或通过连接基连接至VWF片段或与其缔合。在另一个实施方案中,FVIII蛋白可通过共价或非共价键或通过连接基连接至第一异源部分或第二异源部分。
在一个实施方案中,本发明的嵌合蛋白包含共价连接至FVIII蛋白或与其共价缔合的本文所述VWF片段。例如,嵌合蛋白可包含VWF片段和FVIII蛋白,其中VWF片段和FVIII蛋白通过共价非肽键、肽键、非共价键,或通过连接基如可切割的连接基结合。在具体实施方案中,VWF片段和FVIII蛋白通过一个或多个二硫键结合或彼此相互作用。在另一个具体实施方案中,VWF片段通过非共价键结合位于FVIII的A3结构域、FVIII的C2结构域或FVIII的A3结构域和C2结构域二者的FVIII蛋白或与其相互作用。在另一个实施方案中,结合FVIII蛋白或与其相互作用的VWF片段连接或融合至第一异源部分。在其它实施方案中,结合VWF片段或与其相互作用的FVIII蛋白还连接至第二异源部分。在一些实施方案中,结合FVIII蛋白或与其相互作用的VWF片段还连接至第一异源部分,并且FVIII蛋白还连接至第二异源部分。在某些实施方案中,包含VWF片段和第一异源部分的第一多肽链以及包含FVIII蛋白和第二异源部分的第二多肽链彼此缔合,使得缔合不允许FVIII蛋白与其它部分如内源性VWF的相互作用。在一个实施方案中,缔合是共价键,如二硫键。
每个VWF片段或FVIII蛋白可通过连接基,如可切割的连接基,如凝血酶可切割连接基结合或连接至第一和第二异源部分。VWF片段和第一异源部分之间的连接基在本文中可以VWF连接基表示。FVIII蛋白和第二异源部分之间的连接基在本文中可以FVIII连接基表示。或者,VWF片段或FVIII蛋白二者可通过连接基,如可切割的连接基,如凝血酶可切割连接基结合或连接至第一和第二异源部分。在某些实施方案中,连接至VWF片段的第一异源部分包括多肽、非多肽部分或它们二者。第一异源多肽部分的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的两种或多种组合。非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES或HAES)、其衍生物或变体或它们的任何组合。在其它实施方案中,连接至FVIII蛋白的第二异源部分包括多肽、非多肽部分或它们二者。第二异源部分的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的两种或多种组合。非多肽部分的非限制性实例包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES或HAES)、其衍生物或变体或它们的任何组合。在一些实施方案中,VWF片段使用分选酶介导的体外蛋白连接而连接至FVIII。在一些实施方案中,使用分选酶识别基序。
在一个实施方案中,第一异源部分是免疫球蛋白恒定区或其部分。在具体实施方案中,第一异源部分是第一Fc区。在一些实施方案中,第二异源部分是免疫球蛋白恒定区或其部分。在具体实施方案中,第二异源部分是第二Fc区。在具体实施方案中,嵌合蛋白包含本文所述的VWF片段和FVIII蛋白,其中VWF片段连接至免疫球蛋白恒定区或其部分,其为Fc区。在另一个实施方案中,嵌合蛋白包含本文所述的VWF片段和FVIII蛋白,其中FVIII蛋白连接至免疫球蛋白恒定区或其部分,其为Fc区。在其它实施方案中,嵌合蛋白包含本文所述的VWF片段和FVIII蛋白,其中VWF片段连接至第一免疫球蛋白恒定区,其为第一Fc区,并且FVIII蛋白连接至第二免疫球蛋白恒定区,其为第二Fc区,并且其中VWF片段和FVIII蛋白通过非共价键彼此结合或相互作用,或第一Fc区或第二Fc区通过共价键彼此缔合。在其它实施方案中,连接至第一异源部分的VWF片段还通过连接基如可加工的连接基连接至第二异源部分如第二Fc区。在一个方面,VWF片段通过连接基如VWF连接基如可切割的连接基连接至第一异源部分。在另一个方面,FVIII蛋白通过连接基如FVIII连接基如可切割的连接基连接至第二异源部分。异源部分的非限制性实例在本文别处有所公开,如第[0165]-[0193]段的免疫球蛋白恒定区或其部分、第[0194]-[0198]段的白蛋白片段或其变体、第[0293]段的HAP序列、第[0204]-[0205]段的转铁蛋白片段或其变体、第[0206]-[0213]段的聚合物如聚乙二醇、第[0214]-[0219]段的HES或第[0220]段的PSA以及第[0199]-[0202]段的PAS序列。
在一些实施方案中,本发明的嵌合蛋白包含、基本上由或由选自由以下组成的组的式组成:
(a)V-L1-H1-L3-C-L2-H2,
(b)H2-L2-C-L3-H1-L1-V,
(c)C-L2-H2-L3-V-L1-H1,
(d)H1-L1-V-L3-H2-L2-C,
(e)H1-L1-V-L3-C-L2-H2,
(g)H2-L2-C-L3-V-L1-H1,
(g)V-L1-H1-L3-H2-L2-C,
(g)C-L2-H2-L3-H1-L1-V,
(i)H2-L3-H1-L1-V-L2-C,
(j)C-L2-V-L1-H1-L3-H2,
(k)V-L2-C-L1-H1-L3-H2,和
(l)H2-L3-H1-L1-C-L2-V,
其中V是本文所述的VWF片段;
L1或L2中的每个是任选的连接基,如可切割的连接基,如凝血酶可切割连接基;
L3是任选的连接基,如可加工的连接基
H1和H2中的每个是任选的异源部分;
C是FVIII蛋白;并且
(-)是肽键或一个或多个氨基酸。
在其它方面,本发明的嵌合蛋白包含选自由以下组成的组的式:
(m)V-L1-H1:H2-L2-C,
(n)V-L1-H1:C-L2-H2;
(o)H1-L1-V:H2-L2-C;
(p)H1-L1-V:C-L2-H2;
(q)V:C-L1-H1:H2;
(r)V:H1-L1-C:H2;
(s)H2:H1-L1-C:V,
(t)C:V-L1-H1:H2,和
(u)C:H1-L1-V:H2。
其中V是本文所述的VWF片段;
L1或L2中的每个是任选的连接基,如凝血酶可切割连接基;
H1或H2中的每个是任选的异源部分;
(-)是肽键或一个或多个氨基酸;并且
C是FVIII蛋白;并且(:)是H1和H2之间的化学或物理缔合。
在一个实施方案中,一个或多个异源部分是半衰期延长因子。半衰期延长因子是本领域已知的,并且此类半衰期延长因子的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段、其衍生物或变体或它们的两种或多种组合。非多肽部分可包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。
在一个实施方案中,式(m)至(u)中的(:)表示化学缔合,如至少一个非肽键。在某些实施方案中,所述化学缔合即(:)是共价键。在其它实施方案中,所述化学缔合即(:)是非共价相互作用,如离子相互作用、疏水相互作用、亲水相互作用、范德华相互作用、氢键。在其它实施方案中,(:)是非肽共价键。在其它实施方案中,(:)是肽键。在其它实施方案中,式(m)至(u)中的(:)表示两个序列之间的物理缔合,其中第一序列的一部分靠近第二序列,使得第一序列屏蔽或阻断第二序列的一部分与另一部分的相互作用,并且还保持该物理缔合,而不允许第二序列与其它部分相互作用。
本文中包括的式(a)至(u)仅仅作为本发明构建体的非限制性实例。式中多肽的方向从N-末端(左)至C-末端(右)示出。例如,式V-L1-H1-L3-C-L2-H2意指式NH2-V-L1-H1-L3-C-L2-H2-COOH。此外,(:)可以是两条多肽链通过第一链的任何部分和第二链的任何部分之间的共价键或非共价键之间的缔合或相互作用,除非另外指明。例如,式V-H1:H2-C具有两条多肽链,第一链是V-H1,并且第二链是C-H2,其中第一链中的V与第二链中的C相互作用或缔合和/或第一链中的H1与第二链中的H2相互作用或缔合。在一些实施方案中,(:)意指共价非肽键或非共价键。
在某些实施方案中,嵌合蛋白包含、基本上由或由选自由以下组成的组的式组成:
(1)V:C, (2)H-V:C或C:V-H,
(3)V:C-H或H-C:V, (4)V-H1:H2-C或H1-V:C-H2,
(5)V:C-H1:H2或H2:H1-C:V, (6)H2:H1-V:C或C:V-H1:H2,
(7)H-L-V:C或C:V-L-H, (8)V:C-L-H或H-L-C:V,
(9)V-C或C-V, (10)H-V-C或C-V-H,
(11)V-H-C或C-H-V, (12)V-C-H或H-C-V,
(13)V-H1-C-H2或H2-C-H1-V, (14)H1-V-C-H2或H2-C-V-H1,
(15)H1-V-H2-C或C-H2-V-H1, (16)V-H1-H2-C或C-H2-H1-V,
(17)V-L-C或C-L-V, (18)H-L-V-C或C-V-L-H,
(19)H-V-L-C或C-L-V-H, (20)V-L-H-C或C-H-L-V,
(21)V-H-L-C或C-L-H-V, (22)V-L-C-H或H-C-L-V,
(23)V-C-L-H或H-L-C-V, (24)H-L1-V-L2-C或C-L2-V-L1-H,
(25)V-L-H1:H2-C或C-H2:H1-L-V,
(26)V-H1:H2-L-C或C-L-H2:H1-V,
(27)V:C-H1-H2或H2-H1-C:V,
(28)H2-H1-V:C或C:V-H1-H2,
(29)V:C-L-H1:H2或H2:H1-L-C:V,
(30)H2:H1-L-V:C或C:V-L-H1:H2,
(31)V-L1-H1:H2-L2-C或L-L2-H2:H1-L1-V,
(32)V:C-L-H1-H2或H2-H1-L-C:V,
(33)V:C-H1-L-H2或H2-L-H1-C:V,
(34)V:C-L1-H1-L2-H2或H2-L2-H1-L1-C:V,
(35)H2-H1-V:C或C:V-H1-H2,
(36)H2-H1-L-V:C或C:V-L-H1-H2,
(37)H2-L-H1-V:C或C:V-H1-L-H2,
(38)H2-L2-H1-L1-V:C或C:V-L1-H1-L2-H2,
(39)V-L1-H-L2-C或C-L2-H-L1-V,
(40)V-L1-C-L2-H或H-L2-C-L1-V,
(41)V-L-H1-C-H2或H2-C-H1-L-V,
(42)V-H1-C-L-H2或H2-L-C-H1-V,
(43)V-H1-L-C-H2或H2-C-L-H1-V,
(44)H1-L-V-C-H2或H2-C-V-L-H1,
(45)H1-V-L-C-H2或H2-C-L-V-H1,
(46)H1-V-C-L-H或H-L-C-V-H1,
(47)H1-L-V-H2-C或C-H2-V-L-H1,
(48)H1-V-L-H2-C或C-H2-L-V-H1,
(49)H1-V-H2-L-C或C-L-H2-V-H1,
(50)V-L-H1-H2-C或C-H2-H1-L-V,
(51)V-H1-L-H2-C或C-H2-L-H1-V,
(52)V-H1-H2-L-C或C-L-H2-H1-V,
(53)V-L1-H1-L2-C-H2或H2-C-L2-H1-L1-V,
(54)V-L1-H1-C-L2-H2或H2-L2-C-H1-L1-V,
(55)V-L1-H1-L2-C-L3-H2或H2-L3-C-L2-H1-L1-V,
(56)V-H1-L1-C-L2-H2或H2-L2-C-L1-H1-V,
(57)H1-L1-V-L2-C-H2或H2-C-L2-V-L1-H1,
(58)H1-L1-V-C-L2-H2或H2-L2-C-V-L1-H1,
(59)H1-L1-V-L2-C-L3-H2或H2-L3-C-L2-V-L1-H1,
(60)H1-V-L1-C-L2-H2或H2-L2-C-L1-V-H1,
(61)H1-L1-V-L2-H2-C或C-H2-L2-V-L1-H1,
(62)H1-L1-V-H2-L2-C或C-L2-H2-V-L1-H1,
(63)H1-L1-V-L2-H2-L3-C或C-L3-H2-L2-V-L1-H1,
(64)H1-V-L1-H2-L2-C或C-L2-H2-L1-V-H1,
(65)V-L1-H1-L2-H2-C或C-H2-L2-H1-L1-V,
(66)V-L1-H1-H2-L2-C或C-L2-H2-H1-L1-V,
(67)V-L1-H1-L2-H2-L3-C或C-L3-H2-L2-H1-L1-V,以及
(68)V-H1-L1-H2-L2-C或C-L2-H2-L1-H1-V,
V是本文所述的VWF片段;
C是FVIII蛋白;
H或H1是异源部分或第一异源部分;
H2是第二异源部分;第一和第二异源部分可以是相同的或不同的;
L、L1或L2中的每个是任选的连接基;
(-)是肽键或一个或多个氨基酸;并且
(:)是化学或物理缔合。每个连接基可以是相同的或不同的,并且每个可以是包含一个或多个酶切割位点的可切割的连接基。异源部分可以是本领域已知的半衰期延长技术、多肽、非多肽部分或它们二者。多肽部分可包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、其任何衍生物或变体或它们的任何组合(如,Fc区)。非多肽部分可包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或变体或它们的任何组合。H、H1或H2中的每个可独立地根据特性选择,并且可以是全部相同的,或每一个是不同的。异源部分的非限制性实例在本文别处有所公开,如第[0126]-[0153]段的免疫球蛋白恒定区或其部分、第[0154]-[0157]段的白蛋白或其片段或变体、第[0166]-[0173]段的聚合物如聚乙二醇以及第[0159]-[0162]段的PAS序列。本文中包括式(1)至(68)仅仅作为本发明构建体的非限制性实例。
在一个实施方案中,(:)表示化学缔合,如至少一个非肽键。在某些实施方案中,所述化学缔合即(:)是共价键。在其它实施方案中,所述化学缔合即(:)是非共价相互作用,如离子相互作用、疏水相互作用、亲水相互作用、范德华相互作用、氢键。在其它实施方案中,(:)是非肽共价键。在其它实施方案中,(:)是肽键。在其它实施方案中,(:)表示两个序列之间的物理缔合,其中第一序列的一部分靠近第二序列,使得第一序列屏蔽或阻断第二序列的一部分与另一部分的相互作用,并且还保持该物理缔合,而不允许第二序列与其它部分相互作用。
在一个实施方案中,连接至嵌合蛋白中的VWF片段的第一异源部分(H或H1)是第一Fc区。在另一个实施方案中,连接至嵌合蛋白中的FVIII蛋白的第二异源部分(或H2)是第二Fc区。
在某些实施方案中,本发明的嵌合蛋白包含两条多肽链,第一链包含、基本上由或由编码FVIII(如,单链FVIII)的氨基酸序列和第一异源部分(如,第一Fc区)组成,并且第二链包含、基本上由或由编码包含D’结构域和D3结构域的VWF片段的氨基酸序列、第二异源部分(如,第二Fc区)以及VWF片段和第二Fc结构域之间的连接基(如,VWF连接基)组成。VWF片段和第二Fc结构域之间的连接基可以是凝血酶可切割连接基。在一些实施方案中,单链FVIII蛋白包含第三异源部分,如半衰期延长因子,其连接至N-末端、C-末端或FVIII序列内的一个或多个位点。
在其它实施方案中,本发明的嵌合蛋白包含三条多肽链,其中第一链包含、基本上由或由FVIII的重链组成,第二链包含、基本上由或由融合至第一异源部分(如,第一Fc区)的FVIII的轻链组成,并且第三多肽链包含、基本上由或由包含D’结构域和D3结构域的VWF片段、第二异源部分(如,第二Fc区)和连接基组成。VWF片段和第二异源部分之间的连接基可以是凝血酶可切割连接基。在一些实施方案中,重链FVIII连接至第三异源部分,如半衰期延长因子,其可连接至N-末端、C-末端或FVIII序列内的一个或多个位点。
在其它实施方案中,本发明的嵌合蛋白包含两条多肽链,第一链包含、基本上由或由FVIII的重链组成,并且第二链包含、基本上由或由FVIII的轻链、第一异源部分(如,第一Fc区)、第一连接基(如,包含一个或多个细胞内加工位点的蛋白酶切割位点)、VWF片段、第二连接基(如,凝血酶可切割连接基)和第二异源部分(如,第二Fc区)组成,其中FVIII的轻链连接至第一异源部分(如,第一Fc区),其还通过第一连接基(如,具有包含一个或多个细胞内加工位点的蛋白酶切割位点的可加工的连接基)连接至VWF片段,并且其中VWF片段通过第二连接基(如,凝血酶可切割连接基)连接至第二Fc区。在某些实施方案中,第一连接基和第二连接基是相同的或不同的。
在某些实施方案中,本发明的嵌合蛋白包含一条多肽链,其包含单链FVIII蛋白、第一异源部分(如,第一Fc区)、第一连接基(如,凝血酶可切割连接基)、VWF片段、第二连接基(如,凝血酶可切割连接基)和第二异源部分(如,第二Fc区),其中单链FVIII蛋白连接至第一异源部分,所述第一异源部分还通过第一连接基连接至VWF片段,并且VWF片段通过第二连接基连接至第二Fc区。在一个实施方案中,第一连接基是包含第一可切割位点和第二可切割位点的可切割的连接基。在另一个实施方案中,第二连接基是包含一个或两个可切割位点的可切割的连接基。在具体实施方案中,第二连接基是凝血酶可切割连接基。用于本发明的连接基可具有任何长度,如至少10个、50个、100个、200个、300个、400个、500个、600个或700个氨基酸。例如,连接基可具有20个氨基酸、35个氨基酸、42个氨基酸、73个氨基酸或98个氨基酸。
在某些实施方案中,VWF片段通过肽键或连接基直接连接至FVIII蛋白。作为直接或通过连接基连接VWF片段和FVIII蛋白的一种方式,可利用酶连接(如,分选酶)。例如,分选酶是指通过识别和切割羧基末端分选信号来修饰表面蛋白的一组原核生物酶。对于分选酶的大多数底物,识别信号由基序LPXTG(Leu-Pro-任何残基-Thr-Gly(SEQ ID NO:106)和高度疏水的跨膜序列以及碱性残基簇例如精氨酸组成。切割在Thr和Gly之间进行,其中瞬间结合从连接伴侣的Thr残基至活化位点Cys残基进行,然后是将蛋白质共价结合至细胞壁的转肽作用。在一些实施方案中,连接伴侣包含Gly(n)。
在一个实施方案中,通过任选的连接基连接至分选酶识别基序的VWF片段可通过分选酶融合至连接至Gly(n)的FVIII蛋白,其中n可以是任何整数。连接构建体包含VWF片段(构建体的N-末端部分)和FVIII蛋白(构建体的C-末端部分),其中分选酶识别基序插入其间。示例性构建体如图24(A)中所示。另一个连接构建体包含VWF片段(构建体的N-末端部分)、连接基、分选酶识别基序和FVIII蛋白(构建体的C-末端部分)(如,图24(C))。在另一个实施方案中,通过任选的连接基连接至分选酶识别基序的FVIII蛋白可通过分选酶融合至连接至Gly(n)的VWF片段,其中n是任何整数。所得的连接构建体包含FVIII蛋白(构建体的N-末端部分)和VWF片段(构建体的C-末端部分),其中分选酶识别基序插入其间。示例性构建体如图24(B)中所示。另一个所得的连接构建体包含FVIII蛋白(构建体的N-末端部分)、连接基、分选酶识别基序和VWF片段(构建体的C-末端部分)(如,图24(D))。在其它实施方案中,通过第一任选的连接基连接至分选酶识别基序的VWF片段可融合至异源部分,如免疫球蛋白恒定区或其部分,如通过第二任选的连接基连接至凝血酶切割位点的Fc区。所得的构建体可包含VWF片段(N-末端部分)、第一连接基、分选酶识别基序、蛋白酶切割位点、第二任选的连接基和异源部分(如,图24(E))。在某些实施方案中,该所得的构建体是包含FVIII蛋白和第二异源部分,如免疫球蛋白恒定区或其部分,如第二Fc区的嵌合蛋白的部分。在一个实例中,在另一个实例中,嵌合包含三条多肽链,包含VWF片段、第一连接基、分选酶识别基序、蛋白酶切割位点、第二任选的连接基、第一异源部分的第一链,包含FVIII蛋白的轻链和第二异源部分的第二链,以及包含FVIII蛋白的重链的第三链。
在其它实施方案中,本发明的嵌合蛋白包含VWF片段和FVIII蛋白,其中彼此共价缔合或彼此共价连接的VWF片段和FVIII蛋白具有的免疫原性小于无VWF片段的FVIII蛋白。免疫原性减小包括但不限于体液免疫响应减少,如中和抗体滴定度减小,或针对FVIII的细胞介导免疫响应,如生成各种细胞因子减少。
在其它实施方案中,作为本发明的结果,与无VWF片段的FVIII蛋白或野生型FVIII相比,FVIII蛋白(或嵌合蛋白)的半衰期延长。FVIII蛋白的半衰期比无VWF片段的FVIII蛋白的半衰期长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。在一个实施方案中,FVIII的半衰期比野生型FVIII的半衰期长约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍至约10倍。在另一个实施方案中,与野生型FVIII或无VWF片段的FVIII蛋白相比,FVIII的半衰期延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。在其它实施方案中,FVIII的半衰期为至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。在其它实施方案中,FVIII的半衰期为约15小时至约两周、约16小时至约一周、约17小时至约一周、约18小时至约一周、约19小时至约一周、约20小时至约一周、约21小时至约一周、约22小时至约一周、约23小时至约一周、约24小时至约一周、约36小时至约一周、约48小时至约一周、约60小时至约一周、约24小时至约六天、约24小时至约五天、约24小时至约四天、约24小时至约三天或约24小时至约两天。
在一些实施方案中,每个受试者的FVIII蛋白的平均半衰期为约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约六天、约七天(一周)、约八天、约九天、约10天、约11天、约12天、约13天或约14天。
在某些实施方案中,与由FVIII或FVIII单体-二聚体杂合物组成的多肽相比,共价连接至VWF片段的FVIII蛋白的半衰期在FVIII/VWF双敲除(“DKO”)小鼠中可延长。
A)血管性血友病因子(VWF)片段
VWF(也称为F8VWF)是存在于血浆中的大多聚体糖蛋白,并且主要组成型地产生于内皮细胞(Weibel-Palade小体中)、巨核细胞(血小板的α颗粒)和内皮下结缔组织中。碱性VWF单体是具有2813个氨基酸的蛋白质。每个单体包含多个具有特定功能的特定结构域,D'和D3结构域(共同结合因子VIII)、A1结构域(结合血小板GPIb-受体、肝素和/或可能结合胶原)、A3结构域(结合胶原)、C1结构域(其中RGD结构域在活化时结合血小板整联蛋白αIIbβ3)和蛋白质C-末端的“半胱氨酸结”结构域(VWF与血小板衍生生长因子(PDGF)、转化生长因子-β(TGFβ)和β-人绒毛膜促性腺素(βHCG)共有)。
人VWF的2813个单体氨基酸序列在Genbank中以登录号_NP_000543.2_报告。编码人VWF的核苷酸序列在Genbank中以登录号_NM_000552.3_报告。人VWF的核苷酸序列指定为SEQ ID NO:1。SEQ ID NO:2是由SEQ ID NO:1编码的氨基酸序列。VWF的每个结构域在表1中列出。
表1
Figure BDA0002313018640000441
Figure BDA0002313018640000451
Figure BDA0002313018640000461
Figure BDA0002313018640000471
Figure BDA0002313018640000481
Figure BDA0002313018640000491
Figure BDA0002313018640000501
Figure BDA0002313018640000511
本发明涉及血管性血友病因子(VWF)片段,所述血管性血友病因子片段包含VWF的D’结构域和D3结构域,其中VWF片段抑制内源性VWF(全长VWF)与FVIII蛋白结合。在一个实施方案中,VWF片段结合或缔合FVIII蛋白。通过结合或缔合FVIII蛋白,本发明的VWF片段保护FVIII不被蛋白酶切割而且FVIII不被活化,稳定FVIII的重链和轻链,并且阻止FVIII被清除剂受体清除。在另一个实施方案中,VWF片段结合FVIII蛋白或与之缔合,并且阻断或防止FVIII蛋白与磷脂和活化的蛋白C结合。通过阻止或抑制FVIII蛋白与内源性、全长VWF结合,本发明的VWF片段减少VWF清除受体对FVIII的清除,并且从而延长FVIII的半衰期。因此,FVIII蛋白的半衰期延长是由于缺乏VWF清除受体结合位点的VWF片段与FVIII蛋白的结合或缔合,以及通过VWF片段屏蔽或保护FVIII蛋白不被包含VWF清除受体结合位点的内源性VWF清除。结合至VWF片段或受其保护的FVIII蛋白也可允许FVIII蛋白的循环。因此,VWF片段可不为全长成熟VWF。通过消除全长VWF分子中包含的VWF清除途径受体结合位点,本发明的FVIII/VWF异源二聚体从VWF清除途径解离,这允许FVIII半衰期进一步延长。
包含D’结构域和D3结构域的VWF片段还可包含选自由以下组成的组的VWF结构域:A1结构域、A2结构域、A3结构域、D1结构域、D2结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、它们的一个或多个片段以及它们的任何组合。在一个实施方案中,VWF片段包含、基本上由或由(1)VWF的D'和D3结构域或其片段;(2)VWF的D1、D'和D3结构域或其片段;(3)VWF的D2、D'和D3结构域或其片段;(4)VWF的D1、D2、D'和D3结构域或其片段;或(5)VWF的D1、D2、D'、D3和A1结构域或其片段组成。本文所述的VWF片段不包含结合VWF清除受体的位点。在另一个实施方案中,本文所述的VWF片段不是SEQ ID NO:2第764至1274位氨基酸。本发明的VWF片段可包含连接至或融合至VWF片段的任何其它序列,但不是全长VWF。例如,本文所述的VWF片段还可包含信号肽。
在一个实施方案中,本发明的VWF片段包含VWF的D’结构域和D3结构域,其中D’结构域与SEQ ID NO:2的第764至866位氨基酸具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性,其中VWF片段结合FVIII蛋白,屏蔽、抑制或阻止内源性VWF片段与FVIII蛋白结合。在另一个实施方案中,VWF片段包含VWF的D’结构域和D3结构域,其中D3结构域与SEQ ID NO:2的第867至1240位氨基酸具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性,其中VWF片段结合FVIII蛋白或抑制或阻止内源性VWF片段与FVIII蛋白结合。在一些实施方案中,本文所述的VWF片段包含、基本上由或由VWF的D’结构域和D3结构域组成,所述结构域与SEQ ID NO:2的第764至1240位氨基酸具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性,其中VWF片段结合FVIII蛋白,或抑制或阻止内源性VWF片段与FVIII蛋白结合。在其它实施方案中,VWF片段包含、基本上由或由D1、D2、D’和D3结构域组成,所述结构域与SEQID NO:2的第23至1240位氨基酸具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性,其中VWF片段结合FVIII蛋白,或抑制或阻止内源性VWF片段与FVIII蛋白结合。在其它实施方案中,VWF片段还包含与其可操作地连接的信号肽。
在一些实施方案中,本发明的VWF片段基本上由或由(1)D’D3结构域、D1D’D3结构域、D2D’D3结构域或D1D2D’D3结构域以及(2)最多约10个氨基酸(如,从SEQ ID NO:2的第764至1240位氨基酸至SEQ ID NO:2的第764至1250位氨基酸的任何序列)、最多约15个氨基酸(如,从SEQ ID NO:2的第764至1240位氨基酸至SEQ ID NO:2的第764至1255位氨基酸的任何序列)、最多约20个氨基酸(如,从SEQ ID NO:2的第764至1240位氨基酸至SEQ ID NO:2的第764至1260位氨基酸的任何序列)、最多约25个氨基酸(如,从SEQ ID NO:2的第764至1240位氨基酸至SEQ ID NO:2的第764至1265位氨基酸的任何序列)或最多约30个氨基酸(如,从SEQ ID NO:2的第764至1240位氨基酸至SEQ ID NO:2的第764至1260位氨基酸的任何序列)的另外的VWF序列组成。在具体实施方案中,包含或基本上由D’结构域和D3结构域组成的VWF片段既不是SEQ ID NO:2的第764至1274位氨基酸也不是全长成熟VWF。
在其它实施方案中,包含连接至D1D2结构域的D’D3结构域的VWF片段还包含细胞内切割位点,(如,PACE或PC5的切割位点),以允许在表达时D1D2结构域从D’D3结构域切割。细胞内切割位点的非限制性实例在本文别处有所公开。
在其它实施方案中,VWF片段包含D’结构域和D3结构域,但不包含选自由以下组成的组的氨基酸序列:(1)SEQ ID NO:2的第1241至2813位氨基酸、(2)SEQ ID NO:2的第1270位氨基酸至第2813位氨基酸、(3)SEQ ID NO:2的第1271位氨基酸至第2813位氨基酸、(4)SEQ ID NO:2的第1272位氨基酸至第2813位氨基酸、(5)SEQ ID NO:2的第1273位氨基酸至第2813位氨基酸以及(6)SEQ ID NO:2的第1274位氨基酸至第2813位氨基酸。
在其它实施方案中,本发明的VWF片段包含、基本上由或由与D’结构域、D3结构域和A1结构域对应的氨基酸序列组成,其中氨基酸序列与SEQ ID NO:2的第764至1479位氨基酸具有至少60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性,其中VWF结合FVIII。在具体实施方案中,VWF片段不是SEQ ID NO:2的第764至1274位氨基酸。
在一些实施方案中,本发明的VWF片段包含D’结构域和D3结构域,但不包含选自由以下组成的组的至少一个VWF结构域:(1)A1结构域、(2)A2结构域、(3)A3结构域、(4)D4结构域、(5)B1结构域、(6)B2结构域、(7)B3结构域、(8)C1结构域、(9)C2结构域、(10)CK结构域、(11)CK结构域和C2结构域、(12)CK结构域、C2结构域和C1结构域、(13)CK结构域、C2结构域、C1结构域、B3结构域、(14)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、(15)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域和B1结构域、(16)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域和D4结构域、(17)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域、D4结构域和A3结构域、(18)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域、D4结构域、A3结构域和A2结构域、(19)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域、D4结构域、A3结构域、A2结构域和A1结构域以及(20)它们的任何组合。
在其它实施方案中,VWF片段包含D’D3结构域和一个或多个结构域或模块。此类结构域或模块的实例包括但不限于Zhour等,Blood published online 2012年4月6日:DOI10.1182/blood-2012-01-405134中公开的结构域和模块。例如,VWF片段可包含D’D3结构域和一个或多个选自由以下组成的组的结构域或模块:A1结构域、A2结构域、A3结构域、D4N模块、VWD4模块、C8-4模块、TIL-4模块、C1模块、C2模块、C3模块、C4模块、C5模块、C5模块、C6模块以及它们的任何组合。
在其它实施方案中,VWF片段连接至异源部分,其中异源部分连接至VWF片段的N-末端或C-末端,或插入VWF片段中的两个氨基酸之间。例如,VWF片段中异源部分的插入位点可位于D’结构域、D3结构域或它们二者中。异源部分可以是半衰期延长因子。
在某些实施方案中,本发明的VWF片段形成多聚体,如二聚体、三聚体、四聚体、五聚体、六聚体、七聚体或高阶多聚体。在其它实施方案中,VWF片段是仅具有一个VWF片段的单体。在一些实施方案中,本发明的VWF片段可具有一个或多个氨基酸取代、缺失、添加或修饰。在一个实施方案中,VWF片段可包括氨基酸取代、缺失、添加或修饰,使得VWF片段不能形成二硫键或形成二聚体或多聚体。在另一个实施方案中,氨基酸取代在D’结构域和D3结构域内。在具体实施方案中,本发明的VWF片段包含在于SEQ ID NO:2的第1099位残基、第1142位残基或第1099和1142位残基二者对应的残基处的至少一个氨基酸取代。至少一个氨基酸取代可以是非天然存在于野生型VWF中的任何氨基酸。例如,氨基酸取代可以是除半胱氨酸之外的任何氨基酸,如异亮氨酸、丙氨酸、亮氨酸、天冬酰胺、赖氨酸、天冬氨酸、甲硫氨酸、苯丙氨酸、谷氨酸、苏氨酸、谷氨酰胺、色氨酸、甘氨酸、缬氨酸、脯氨酸、丝氨酸、酪氨酸、精氨酸或组氨酸。在另一个实例中,氨基酸取代具有阻止或抑制VWF片段形成多聚体的一个或多个氨基酸。
在某些实施方案中,可进一步修饰本文所用的VWF片段,以提高其与FVIII的相互作用,如提高与FVIII的结合亲合力。作为非限制性实例,VWF片段包含在与SEQ ID NO:2的第764位氨基酸对应的残基处的丝氨酸残基以及在与SEQ ID NO:2的第773位氨基酸对应的残基处的赖氨酸残基。第764和/或773位残基可有助于VWF片段与FVIII的结合亲合力。在其它实施方案中,VWF片段可具有其它修饰,如片段可以是聚乙二醇化的、糖基化的、羟乙基淀粉化的或聚唾液酸化的。
B)异源部分
异源部分可以是异源多肽或异源非多肽部分。在某些实施方案中,异源部分是本领域已知的半衰期延长分子,并且包括多肽、非多肽部分或它们二者的组合。异源多肽部分可包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白或其片段、PAS序列、HAP序列、它们的衍生物或变体或它们的任何组合。在一些实施方案中,非多肽结合部分包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。在某些实施方案中,可存在一个、两个、三个或更多个异源部分,每个可以是相同的或不同的分子。
1)免疫球蛋白恒定区或其部分
免疫球蛋白恒定区由CH(恒定重)结构域表示的结构域(CH1、CH2等)组成。取决于同种型(即IgG、IgM、IgA IgD或IgE),恒定区可包含三个或四个CH结构域。一些同种型(如IgG)恒定区也包含铰链区。参见Janeway等2001,Immunobiology,Garland Publishing,N.Y.,N.Y.。
用于产生本发明嵌合蛋白的免疫球蛋白恒定区或其部分可从多个不同的来源获得。在优选的实施方案中,免疫球蛋白恒定区或其部分来源于人免疫球蛋白。然而,应当理解免疫球蛋白恒定区或其部分可来源于另一个哺乳动物物种,包括例如啮齿类(如,小鼠、大鼠、兔、豚鼠)或非人类灵长类(如,黑猩猩、猕猴)物种的免疫球蛋白。此外,免疫球蛋白恒定区或其部分可来源于任何免疫球蛋白种类,包括IgM、IgG、IgD、IgA和IgE,和任何免疫球蛋白同种型,包括IgG1、IgG2、IgG3和IgG4。在一个实施方案中,使用人同种型IgG1。
多种免疫球蛋白恒定区基因序列(如,人恒定区基因序列)可以可公开获取的保藏物的形式获得。可选择具有特定效应子功能(或缺乏特定效应子功能)或具有特定修饰的恒定区域序列,以减小免疫原性。已公布多个抗体和抗体编码基因的序列,并且合适的Ig恒定区序列(如,铰链、CH2和/或CH3序列或其部分)可使用本领域已知的技术来源于这些序列。然后,可改变或合成使用任何上述法获得的遗传物质,以获得本发明的多肽。还应当理解,本发明的范围涵盖恒定区DNA序列的等位基因、变体和突变。
可例如使用聚合酶链式反应和引物克隆免疫球蛋白恒定区或其部分的序列,选择该引物以扩增所关注的结构域。为从抗体克隆免疫球蛋白恒定区或其部分的序列,可从杂交瘤、脾脏或淋巴细胞分离mRNA,逆转录为DNA,并且通过PCR扩增抗体基因。PCR扩增法在美国专利号4,683,195、4,683,202、4,800,159、4,965,188;以及例如“PCR Protocols:AGuide to Methods and Applications”Innis等编著,Academic Press,San Diego,CA(1990);Ho等1989.Gene 77:51;Horton等1993.Methods Enzymol.217:270)中详细描述。PCR可根据公布的重链和轻链DNA和氨基酸序列,通过共有恒定区引物或通过更多具体引物引发。如上所讨论,PCR也可用于分离编码抗体轻链和重链的DNA克隆。在这种情况下,可通过共有引物或较大同源探针,例如小鼠恒定区探针筛选文库。适于抗体基因扩增的多组引物是本领域已知的(如,基于纯化抗体的N-末端序列的5’引物(Benhar和Pastan.1994.Protein Engineering7:1509)、cDNA末端的快速扩增(Ruberti,F.等1994.J.Immunol.Methods 173:33)、抗体前导序列(Larrick等1989Biochem.Biophys.Res.Commun.160:1250))。抗体序列的克隆在Newman等提交于1995年1月25日的美国专利号5,658,570中进一步描述,该专利以引用方式并入本文。
本文所用的免疫球蛋白恒定区可包括所有结构域和铰链区或其部分。在一个实施方案中,免疫球蛋白恒定区或其部分包含CH2结构域、CH3结构域和铰链区,即Fc区或FcRn结合伴侣。
如本文所用,术语“Fc区”定义为对应于天然免疫球蛋白Fc区的多肽的部分,即通过其两条重链的各自Fc结构域的二聚体缔合形成。天然Fc区与另一个Fc区形成同源二聚体。相比之下,如本文所用,术语“遗传融合的Fc区”或“单链Fc区”(scFc区)是指合成二聚体Fc区,其包含单条多肽链内遗传连接的Fc结构域(即,在单个邻接基因序列中编码)。
在一个实施方案中,“Fc区”是指始于铰链区、恰好在木瓜蛋白酶切割位点(即,IgG中的第216位残基,重链恒定区的第一个残基为第114位)上游并且结束于抗体C-末端的单个免疫球蛋白重链的部分。因此,完整的Fc结构域包含至少铰链结构域、CH2结构域和CH3结构域。
取决于免疫球蛋白同种型,免疫球蛋白恒定区的Fc区可包括CH2、CH3和CH4结构域以及铰链区。包含免疫球蛋白的Fc区的嵌合蛋白赋予嵌合蛋白多个所需特性,包括增加的稳定性、增加的血清半衰期(参见Capon等,1989,Nature 337:525)以及结合Fc受体例如新生儿Fc受体(FcRn)(美国专利号6,086,875、6,485,726、6,030,613、WO 03/077834、US2003-0235536A1),这些文献和专利全文以引用方式并入本文中。
免疫球蛋白恒定区或其部分可以是FcRn结合伴侣。FcRn在成体上皮组织中具有活性,并且在肠道内腔、肺部气道、鼻面、阴道表面、结肠和直肠表面中表达(美国专利号6,485,726)。FcRn结合伴侣是结合FcRn的免疫球蛋白的一部分。
FcRn受体已从多个哺乳动物物种包括人分离。人FcRn、猴FcRn、大鼠FcRn和小鼠FcRn的序列是已知的(Story等1994,J.Exp.Med.180:2377)。FcRn受体在相对较低pH下结合IgG(而非其它免疫球蛋白种类,例如IgA、IgM、IgD和IgE),在内腔至浆膜方向穿过细胞主动运输IgG,然后在间质液中发现的相对较高pH下释放IgG。其在成体上皮组织(美国专利号6,485,726、6,030,613、6,086,875、WO 03/077834、US2003-0235536A1),包括肺和肠上皮细胞(Israel等1997,Immunology 92:69)、肾脏近端小管上皮细胞(Kobayashi等2002,Am.J.Physiol.Renal Physiol.282:F358)以及鼻腔上皮细胞、阴道表面和胆管树表面中表达。
用于本发明的FcRn结合伴侣涵盖可被FcRn受体特异性结合的分子,包括完整IgG、IgG的Fc片段以及包括FcRn受体的完整结合区的其它片段。结合FcRn受体的IgG的Fc部分的区域根据X-射线结晶学进行了描述(Burmeister等1994,Nature 372:379)。Fc与FcRn的主要接触区域靠近CH2和CH3结构域的接合处。Fc-FcRn接触均在单Ig重链内。FcRn结合伴侣包括完整IgG、IgG的Fc片段以及包括FcRn的完整结合区的IgG其它片段。主要接触位点包括CH2结构域的第248、250-257、272、285、288、290-291、308-311和314位氨基酸残基和CH3结构域的第385-387、428和433-436位氨基酸残基。对免疫球蛋白或免疫球蛋白片段或区域的氨基酸编号的参考均根据Kabat等1991,Sequences of Proteins of ImmunologicalInterest,U.S.Department of Public Health,Bethesda,Md进行。
结合至FcRn的Fc区或FcRn结合伴侣可通过FcRn有效穿梭跨过上皮屏障,从而提供全身施用所需治疗分子的无创方式。另外,包含Fc区或FcRn结合伴侣的融合蛋白被表达FcRn的细胞内吞。但除被标记为降解之外,这些融合蛋白被回收再次进入循环,从而增加这些蛋白质的体内半衰期。在某些实施方案中,免疫球蛋白恒定区的部分是通常通过二硫键和其它非特异性相互作用与另一个Fc区或另一个FcRn结合伴侣缔合以形成二聚体和高阶多聚体的Fc区或FcRn结合伴侣。
两种FcRn受体可结合单个Fc分子。晶体学数据表明每个FcRn分子结合Fc同源二聚体的单个多肽。在一个实施方案中,使FcRn结合伴侣如IgG的Fc片段连接至生物活性分子提供了口服、口腔含化、舌下、直肠、阴道递送,作为气雾剂鼻腔施用或通过肺部途径,或通过眼部途径递送生物活性分子的方式。在另一个实施方案中,嵌合蛋白可侵入性施用,如皮下、静脉内施用。
FcRn结合伴侣区是可被FcRn受体特异性结合,随后通过Fc区的FcRn受体主动运输的分子或其部分。特异性结合是指形成在生理条件下相对稳定的复合物的两个分子。与通常具有低亲合力和中等至高容量的非特异结合不同,特异性结合的特征在于高亲合力和低至中等容量。通常,当亲合力常数KA大于106M-1,或大于108M-1时,结合被认为是特异性的。如有需要,可通过改变结合条件来减少非特异性结合,而基本上不影响特异性结合。技术人员可使用常规技术优化适当的结合条件,例如分子的浓度、溶液的离子强度、温度、结合时间、阻断剂(如,血清白蛋白、牛奶酪蛋白)的浓度等。
在某些实施方案中,本发明的嵌合蛋白包含一个或多个截短Fc区,但足以将Fc受体(FcR)结合特性赋予Fc区。例如,结合FcRn的Fc区的部分(即,FcRn结合部分)包含IgG1的约第282-438位氨基酸,EU编号,主要接触位点是CH2结构域的第248、250-257、272、285、288、290-291、308-311和314位氨基酸和CH3结构域的第385-387、428和433-436位氨基酸残基。因此,本发明的Fc区可包含或由FcRn结合部分组成。FcRn结合部分可来源于任何同种型,包括IgG1、IgG2、IgG3和IgG4的重链。在一个实施方案中,使用来自人同种型IgG1的抗体的FcRn结合部分。在另一个实施方案中,使用来自人同种型IgG4的抗体的FcRn结合部分。
在另一个实施方案中,“Fc区”包括Fc结构域或来源于Fc结构域的氨基酸序列。在某些实施方案中,Fc区包含以下中的至少一者:铰链(如,上、中和/或下铰链区)结构域(根据EU编号抗体Fc区的约第216-230位氨基酸)、CH2结构域(根据EU编号抗体Fc区的约第231-340位氨基酸)、CH3结构域(根据EU编号抗体Fc区的约第341-438位氨基酸)、CH4结构域中,或它们的变体、部分或片段。在其它实施方案中,Fc区包含完整Fc结构域(即,铰链结构域、CH2结构域和CH3结构域)。在一些实施方案中,Fc区包含、基本上由或由融合至CH3结构域(或其部分)的铰链结构域(或其部分)、融合至CH2结构域(或其部分)的铰链结构域(或其部分)、融合至CH3结构域(或其部分)的CH2结构域(或其部分)、融合至铰链结构域(或其部分)和CH3结构域(或其部分)二者的CH2结构域(或其部分)组成。在其它实施方案中,Fc区缺乏CH2结构域的至少一部分(如,CH2结构域的所有或部分)。在具体实施方案中,Fc区包含或由与EU编号第221至447位对应的氨基酸组成。
本文中以F、F1或F2表示的Fc区可得自多个不同的来源。在一个实施方案中,多肽的Fc区来源于人免疫球蛋白。然而,应当理解Fc区可来源于另一个哺乳动物物种,包括例如啮齿类(如,小鼠、大鼠、兔、豚鼠)或非人类灵长类(如,黑猩猩、猕猴)物种的免疫球蛋白。此外,Fc结构域的多肽或其部分可来源于任何免疫球蛋白种类,包括IgM、IgG、IgD、IgA和IgE,和任何免疫球蛋白同种型,包括IgG1、IgG2、IgG3和IgG4。在另一个实施方案中,使用人同种型IgG1。
在某些实施方案中,Fc变体赋予由包含所述野生型Fc结构域的Fc区所给予的至少一个效应子功能的变化(如,Fc区结合Fc受体(如FcγRI、FcγRII或FcγRIII)或补体蛋白(如C1q),或触发抗体依赖性细胞毒性(ADCC)、吞噬作用或补体依赖性细胞毒性(CDCC)的能力增加或减少)。在其它实施方案中,Fc变体提供工程化的半胱氨酸残基。
本发明的Fc区可利用本领域公认的Fc变体,所述变体已知赋予效应子功能和/或FcR或FcRn结合的变化(如,增加或减少)。具体地讲,本发明的结合分子可包括例如国际PCT公布WO88/07089A1、WO96/14339A1、WO98/05787A1、WO98/23289A1、WO99/51642A1、WO99/58572A1、WO00/09560A2、WO00/32767A1、WO00/42072A2、WO02/44215A2、WO02/060919A2、WO03/074569A2、WO04/016750A2、WO04/029207A2、WO04/035752A2、WO04/063351A2、WO04/074455A2、WO04/099249A2、WO05/040217A2、WO04/044859、WO05/070963A1、WO05/077981A2、WO05/092925A2、WO05/123780A2、WO06/019447A1、WO06/047350A2和WO06/085967A2、美国专利公布号US2007/0231329、US2007/0231329、US2007/0237765、US2007/0237766、US2007/0237767、US2007/0243188、US20070248603、US20070286859、US20080057056或美国专利5,648,260、5,739,277、5,834,250、5,869,046、6,096,871、6,121,022、6,194,551、6,242,195、6,277,375、6,528,624、6,538,124、6,737,056、6,821,505、6,998,253、7,083,784、7,404,956和7,317,091中公开的一个或多个氨基酸位置处的变化(如,取代),每个专利以引用方式并入本文。在一个实施方案中,具体变化(如,本领域公开的一个或多个氨基酸的具体取代)可在一个或多个所公开的氨基酸位置处进行。在另一个实施方案中,可进行一个或多个所公开的氨基酸位置处的不同变化(如,本领域公开的一个或多个氨基酸位置的不同取代)。
可根据熟知的程序,例如定点诱变等修饰IgG的Fc区或FcRn结合伴侣,以产生将由FcRn结合的修饰IgG或Fc片段或其部分。此类修饰包括远离FcRn接触位点的修饰,以及保持或甚至增强与FcRn的结合的接触位点内的修饰。例如,可取代人IgG1 Fc(Fcγ1)中的如下单个氨基酸残基,而不导致Fc对FcRn的结合亲合力显著丧失:P238A、S239A、K246A、K248A、D249A、M252A、T256A、E258A、T260A、D265A、S267A、H268A、E269A、D270A、E272A、L274A、N276A、Y278A、D280A、V282A、E283A、H285A、N286A、T289A、K290A、R292A、E293A、E294A、Q295A、Y296F、N297A、S298A、Y300F、R301A、V303A、V305A、T307A、L309A、Q311A、D312A、N315A、K317A、E318A、K320A、K322A、S324A、K326A、A327Q、P329A、A330Q、P331A、E333A、K334A、T335A、S337A、K338A、K340A、Q342A、R344A、E345A、Q347A、R355A、E356A、M358A、T359A、K360A、N361A、Q362A、Y373A、S375A、D376A、A378Q、E380A、E382A、S383A、N384A、Q386A、E388A、N389A、N390A、Y391F、K392A、L398A、S400A、D401A、D413A、K414A、R416A、Q418A、Q419A、N421A、V422A、S424A、E430A、N434A、T437A、Q438A、K439A、S440A、S444A和K447A,其中例如P238A表示第238位的野生型脯氨酸被丙氨酸取代。例如,具体实施方案包括N297A突变,其移除了高度保守的N-糖基化位点。除丙氨酸之外,上述指定位置的其它氨基酸可被野生型氨基酸取代。突变可单独引入Fc,从而产生超过一百个不同于天然Fc的Fc区。另外,两个、三个或更多个这些单个突变的组合可一起引入,从而产生数百个Fc区。此外,可突变本发明的构建体的一个Fc区,而构建体的其它Fc区完全不突变,或它们二者均突变,但突变是不同。
某些上述突变可赋予Fc区或FcRn结合伴侣新功能。例如,一个实施方案包括N297A,其移除了高度保守的N-糖基化位点。该突变的效应是减小免疫原性,从而增加Fc区的循环半衰期,并且使得Fc区不能结合FcγRI、FcγRIIA、FcγRIIB和FcγRIIIA,但不损坏FcRn的亲合力(Routledge等1995,Transplantation 60:847;Friend等1999,Transplantation 68:1632;Shields等1995,J.Biol.Chem.276:6591)。作为从上述突变产生的新功能的另一个实例,可增加对FcRn的亲合力,超过一些情况下的野生型。所述亲合力增加可反映“结合”速率增加,“解离”速率降低,或“结合”速率增加和“解离”速率降低同时出现。据信突变的实例赋予对FcRn的亲合力增加,包括但不限于T256A、T307A、E380A和N434A(Shields等2001,J.Biol.Chem.276:6591)。
另外,至少三个人Fcγ受体似乎识别低铰链区内IgG上的结合位点,通常为第234-237位氨基酸。因此,新功能和免疫原性潜在减小的另一个实例可来源于该区域的突变,例如通过替换人IgG1"ELLG"的第233-236位氨基酸为IgG2"PVA"(具有一个氨基酸缺失)的对应序列。据显示,当引入此类突变时,介导各种效应子功能的FcγRI、FcγRII和FcγRIII不结合IgG1。Ward和Ghetie 1995,Therapeutic Immunology 2:77和Armour等1999,Eur.J.Immunol.29:2613。
在一个实施方案中,免疫球蛋白恒定区或其部分如Fc区是包括序列PKNSSMISNTP(SEQ ID NO:3),并且任选地还包括选自HQSLGTQ(SEQ ID NO:4)、HQNLSDGK(SEQ ID NO:5)、HQNISDGK(SEQ ID NO:6)或VISSHLGQ(SEQ ID NO:7)的序列的多肽(美国专利号5,739,277)。
在另一个实施方案中,免疫球蛋白恒定区或其部分包含铰链区中的氨基酸序列或其部分,其与另一个免疫球蛋白恒定区或其部分形成一个或多个二硫键。免疫球蛋白恒定区或其部分的二硫键将包含FVIII的第一多肽和包含VWF片段的第二多肽放置在一起,使得内源性VWF不替代VWF片段,并且不结合FVIII。因此,第一免疫球蛋白恒定区或其部分和第二免疫球蛋白恒定区或其部分之间的二硫键阻止内源性VWF和FVIII蛋白之间的相互作用。所述VWF和FVIII蛋白之间的相互作用的抑制允许FVIII蛋白的半衰期超过两倍极限。铰链区或其部分还可连接至CH1、CH2、CH3的一个或多个结构域,或其片段以及它们的任何组合。在具体实例中,免疫球蛋白恒定区或其部分包含铰链区和CH2区(如,Fc区的第221-340位氨基酸)。
在某些实施方案中,免疫球蛋白恒定区或其部分是半糖基化的。例如,包含两个Fc区或FcRn结合伴侣的嵌合蛋白可包含第一糖基化Fc区(如,糖基化CH2区)或FcRn结合伴侣和第二糖基化Fc区(如,糖基化CH2区)或FcRn结合伴侣。在一个实施方案中,连接基可插入糖基化和非糖基化Fc区之间。在另一个实施方案中,Fc区或FcRn结合伴侣是完全糖基化的,即所有Fc区均为糖基化的。在其它实施方案中,Fc区可以是非糖基化的,即Fc部分均不糖基化。
在某些实施方案中,本发明的嵌合蛋白包含免疫球蛋白恒定区或其部分(如,Fc变体)的氨基酸取代,其改变了Ig恒定区的抗原非依赖性效应子功能,尤其是蛋白质的循环半衰期。
当与缺乏这些取代的蛋白质比较时,此类蛋白质表现出与FcRn结合的增加或减少,因此在血清中半衰期分别增加或减少。预期对FcRn的具有增加的亲合力的Fc变体具有更长的血清半衰期,并且此类分子应用于治疗其中所施用多肽的长半衰期为所期望的哺乳动物的方法,如治疗慢性疾病或病症(参见如美国专利7,348,004、7,404,956和7,862,820)。相比之下,预期具有减少的FcRn的结合亲合力的Fc变体具有更短的半衰期,并且此类分子还用于例如施用至其中循环时间缩短可为有利的哺乳动物,例如用于体内诊断成像或当长期存在于循环中时起始多肽具有毒性副作用的情况。具有减少的FcRn结合亲合力的Fc变体也不太可能穿过胎盘,并且因此也用于治疗孕妇的疾病或病症。此外,其中FcRn的结合亲合力减少的其它应用可为所期望的,包括其中定位脑、肾脏和/或肝脏为所期望的那些应用。在一个示例性实施方案中,本发明的嵌合蛋白表现出从脉管系统跨过肾小球上皮运输的减少。在另一个实施方案中,本发明的嵌合蛋白表现出从大脑跨过血脑屏障(BBB)至血管间隙的运输减少。在一个实施方案中,FcRn的结合改变的蛋白质包含至少一个Fc区或FcRn结合伴侣(如,一个或两个Fc区或FcRn结合伴侣),Ig恒定区的“FcRn结合环”内具有一个或多个氨基酸取代。FcRn结合环由野生型全长Fc区的第280-299位氨基酸(根据EU编号)组成。在其它实施方案中,本发明的具有改变的FcRn的结合亲合力的嵌合蛋白中的Ig恒定区或其部分包含至少一个Fc区或FcRn结合伴侣,
Figure BDA0002313018640000611
FcRn“接触区”内具有一个或多个氨基酸取代。如本文所用,术语
Figure BDA0002313018640000612
FcRn“接触区”包括在野生型全长Fc部分以下位置的残基:第243-261位、第275-280位、第282-293位、第302-319位、第336-348位、第367位、第369位、第372-389位、第391位、第393位、第408位、第424位、第425-440位(EU编号)。在其它实施方案中,本发明的具有改变的FcRn结合亲合力的Ig恒定区或其部分包含至少一个Fc区或FcRn结合伴侣,其在与以下EU位置中的任何一者对应的氨基酸位置处具有一个或多个氨基酸取代:第256位、第277-281位、第283-288位、第303-309位、第313位、第338位、第342位、第376位、第381位、第384位、第385位、第387位、第434位(如,N434A或N434K)和第438位。改变FcRn结合活性的示例性氨基酸取代在国际PCT公布号WO05/047327中有所公开,该专利公布以引用方式并入本文。
用于本发明的Fc区或FcRn结合伴侣也可包含本领域公认的氨基酸取代,其改变了嵌合蛋白的糖基化。例如,连接至VWF片段或FVIII蛋白的嵌合蛋白的Fc区或FcRn结合伴侣可包含具有导致糖基化(如,N-或O-连接糖基化)减少的突变的Fc区,或可包含野生型Fc部分的改变糖型(如,低岩藻糖或无岩藻糖聚糖)。
在一个实施方案中,本发明的未加工嵌合蛋白可包含遗传融合的Fc区(即,scFc区),其具有独立地选自本文所述的Ig恒定区或其部分的两个或更多个其组成型Ig恒定区或其部分。在一个实施方案中,二聚体Fc区的Fc区是相同的。在另一个实施方案中,至少两个Fc区是不同的。例如,本发明的蛋白质的Fc区或FcRn结合伴侣包含相同数量的氨基酸残基,或它们的长度可具有一个或多个氨基酸残基(如,约5个氨基酸残基(如,1个、2个、3个、4个或5个氨基酸残基)、约10个残基、约15个残基、约20个残基、约30个残基、约40个残基或约50个残基)的差异。在其它实施方案中,本发明的蛋白质的Fc区或FcRn结合伴侣可在一个或多个氨基酸位置处具有序列差异。例如,至少两个Fc区或FcRn结合伴侣可在约5个氨基酸位置(如,1个、2个、3个、4个或5个氨基酸位置)、约10个位置、约15个位置、约20个位置、约30个位置、约40个位置或约50个位置)处具有差异。
2)白蛋白或片段或其变体
在某些实施方案中,连接至VWF片段或连接至FVIII蛋白的异源部分是白蛋白或其功能片段。在其它实施方案中,本发明的嵌合蛋白包含FVIII蛋白和白蛋白或其片段,其中白蛋白或其片段屏蔽或保护FVIII蛋白上的VWF结合位点,从而抑制或阻止FVIII蛋白与内源性VWF的相互作用。
人血清白蛋白(HSA或HA)是全长形式为609个氨基酸的蛋白质,负责大部分血清渗透压,并且还作为内源性和外源性配体的载体起作用。如本文所用,术语“白蛋白”包括全长白蛋白或其功能片段、变体、衍生物或类似物。
在一个实施方案中,嵌合蛋白包含本文所述的VWF片段和白蛋白、其片段或变体,其中VWF片段连接至白蛋白或其片段或变体。在另一个实施方案中,嵌合蛋白包含彼此结合的VWF片段和FVIII蛋白,其中VWF片段连接至白蛋白或其片段或变体,具有VIII活性的蛋白质连接至白蛋白或其片段或变体,或VWF片段和具有VIII活性的蛋白质二者连接至白蛋白或其片段或变体。在其它实施方案中,包含连接至白蛋白或其片段或变体的VWF片段的嵌合蛋白还连接至选自由以下组成的组的异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES和PEG。在其它实施方案中,嵌合蛋白包含彼此结合的VWF片段和FVIII蛋白,其中FVIII蛋白连接至白蛋白或其片段或变体,并且还连接至选自由以下组成的组的异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES和PEG。在其它实施方案中,嵌合蛋白包含连接至白蛋白或其片段或变体的VWF片段和连接至白蛋白或其片段或变体的FVIII蛋白,所述VWF片段和所述FVIII蛋白彼此结合,其中VWF片段活性还连接至选自由以下组成的组的第一异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES和PEG,并且其中FVIII蛋白活性还连接至选自由以下组成的组的第二异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES和PEG。
在其它实施方案中,连接至VWF片段或FVIII蛋白的异源部分是白蛋白或其片段或变体,其延长(或能够延长)VWF片段或FVIII蛋白的半衰期。白蛋白或其片段或变体的另外实例在美国专利公布号2008/0194481A1、2008/0004206A1、2008/0161243A1、2008/0261877A1或2008/0153751A1或PCT申请公布号2008/033413A2、2009/058322A1或2007/021494A2中有所公开。
3)白蛋白结合部分
在某些实施方案中,连接至VWF片段或FVIII蛋白的异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白结合结构域、白蛋白结合抗体片段或它们的任何组合。例如,白蛋白结合蛋白可以是细菌白蛋白结合蛋白、包括结构域抗体的抗体或抗体片段(参见美国专利号6,696,245)。例如,白蛋白结合蛋白可以是细菌白蛋白结合结构域,例如链球菌蛋白G的白蛋白结合结构域(Konig,T.和Skerra,A.(1998)J.Immunol.Methods 218,73-83)。可用作缀合伴侣的白蛋白结合肽的其它实例为例如具有Cys-Xaa 1-Xaa 2-Xaa 3-Xaa4-Cys共有序列的那些,其中Xaa 1为Asp、Asn、Ser、Thr或Trp,Xaa 2为Asn、Gln,H为Ile、Leu或Lys,Xaa 3为Ala、Asp、Phe、Trp或Tyr,并且Xaa 4为Asp、Gly、Leu、Phe、Ser或Thr,如美国专利申请2003/0069395或Dennis等(Dennis等(2002)J.Biol.Chem.277,35035-35043)所述。
4)PAS序列
在其它实施方案中,连接至VWF片段或FVIII蛋白的异源部分是PAS序列。在一个实施方案中,嵌合蛋白包含本文所述的VWF片段和PAS序列,其中VWF片段连接至PAS序列。在另一个实施方案中,本发明的嵌合蛋白包含FVIII蛋白和PAS序列,其中PAS序列屏蔽或保护FVIII蛋白上的VWF结合位点,从而抑制或阻止FVIII蛋白与内源性VWF的相互作用。
如本文所用,PAS序列意指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,所述氨基酸序列在生理条件下形成无规卷曲构象。因此,PAS序列是包含、基本上由或由丙氨酸、丝氨酸和脯氨酸组成的结构单元(buildingblock)、氨基酸聚合物或序列盒,其可用作嵌合蛋白中异源部分的一部分。但是,技术人员知道当加入除丙氨酸、丝氨酸和脯氨酸之外的残基,作为PAS序列中的微量组分时,氨基酸聚合物也可形成无规卷曲构象。如本文所用,术语“微量组分”意指除丙氨酸、丝氨酸和脯氨酸之外的氨基酸可加入PAS序列以达到某种程度,如最多约12%即约12/100个PAS序列的氨基酸,最多约10%即约10/100个PAS序列的氨基酸,最多约9%即约9/100个氨基酸,最多约8%即约8/100个氨基酸,约6%即约6/100个氨基酸,约5%即约5/100个氨基酸,约4%即约4/100个氨基酸,约3%即约3/100个氨基酸,约2%即约2/100个氨基酸,约1%即约1/100个氨基酸。不同于丙氨酸、丝氨酸和脯氨酸的氨基酸可选自由以下组成的组:Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Thr、Trp、Tyr和Val。
在生理条件下,PAS序列段形成无规卷曲构象,并且从而可介导VWF因子或凝血活性蛋白增加的体内和/或体外稳定性。由于无规卷曲结构域不采取稳定结构,或通过自身起作用,由与其融合的VWF片段或FVIII蛋白介导的生物活性基本上得以保持。在其它实施方案中,形成无规卷曲结构域的PAS序列是生物惰性的,尤其是对于血浆中的蛋白水解、免疫原性、等电点/静电行为、结合细胞表面受体或内化,但仍然是生物可降解的,这提供了相对于合成聚合物例如PEG的显著优势。
形成无规卷曲构象的PAS序列的非限制性实例包括选自由以下组成的组的氨基酸序列:ASPAAPAPASPAAPAPSAPA(SEQ ID NO:8)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO:9)、APSSPSPSAPSSPSPASPSS(SEQ ID NO:10)、APSSPSPSAPSSPSPASPS(SEQ ID NO:11)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO:12)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO:13)和ASAAAPAAASAAASAPSAAA(SEQ ID NO:14)或它们的任何组合。PAS序列的另外实例已知来自例如美国专利公布号2010/0292130 A1和PCT申请公布号WO 2008/155134A1。
5)HAP序列
在某些实施方案中,连接至VWF片段或FVIII蛋白的异源部分是富含甘氨酸的均聚氨基酸聚合物(HAP)。HAP序列可包含甘氨酸的重复序列,具有的长度为至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸或500个氨基酸。在一个实施方案中,HAP序列能够延长融合至或连接至HAP序列的部分的半衰期。HAP序列的非限制性实例包括但不限于:(Gly)n、(Gly4Ser)n或S(Gly4Ser)n,其中n为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一个实施方案中,n为20、21、22、23、24、25、26、26、28、29、30、31、32、33、34、35、36、37、38、39或40。在另一个实施方案中,n为50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200。参见例如Schlapschy M等,ProteinEng.Design Selection,20:273-284(2007)。
6)转铁蛋白或其片段
在某些实施方案中,连接至VWF片段或FVIII蛋白的异源部分是转铁蛋白或其片段。任何转铁蛋白均可用于制备本发明的嵌合蛋白。例如,野生型人Tf(Tf)是679个氨基酸的蛋白质,大约75KDa(不计算糖基化),具有两个主要结构域N(约330个氨基酸)和C(约340个氨基酸),它们似乎起源于基因复制。参见GenBank登录号NM001063、XM002793、M12530、XM039845、XM 039847和S95936(www.ncbi.nlm.nih.gov/),它们全文均以引用方式并入本文。转铁蛋白包含两个结构域:N结构域和C结构域。N结构域包含两个亚结构域:N1结构域和N2结构域,并且C结构域包含两个亚结构域:C1结构域和C2结构域。
在一个实施方案中,嵌合蛋白的转铁蛋白部分包括转铁蛋白剪接变体。在一个实例中,转铁蛋白剪接变体可以是人转铁蛋白的剪接变体,如Genbank登录号AAA61140。在另一个实施方案中,嵌合蛋白的转铁蛋白部分包括转铁蛋白序列的一个或多个结构域,如N结构域、C结构域、N1结构域、N2结构域、C1结构域、C2结构域或它们的任何组合。
7)聚合物,如聚乙二醇(PEG)
在其它实施方案中,连接至VWF片段的异源部分或具有凝血活性如FVIII活性的蛋白质是本领域已知的可溶性聚合物,包括但不限于:聚乙二醇、乙二醇/丙二醇共聚物、羧甲基纤维素、葡聚糖或聚乙烯醇。异源部分例如可溶性聚合物可连接至VWF片段或FVIII蛋白内或N-或C-末端的任何位置。在其它实施方案中,本发明的嵌合蛋白包含FVIII蛋白和PEG,其中PEG屏蔽或保护FVIII蛋白上的VWF结合位点,从而抑制或阻止FVIII蛋白与内源性VWF的相互作用。
在某些实施方案中,嵌合蛋白包含本文所述的VWF片段和PEG,其中VWF片段连接至PEG。在另一个实施方案中,嵌合蛋白包含彼此结合的VWF片段和FVIII蛋白,其中VWF片段连接至PEG,FVIII蛋白连接至PEG,或VWF片段和FVIII蛋白二者均连接至PEG。在其它实施方案中,包含连接至PEG的VWF片段的嵌合蛋白还连接至选自由以下组成的组的异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES以及白蛋白、其片段或变体。在其它实施方案中,嵌合蛋白包含彼此结合的VWF片段和FVIII蛋白,其中FVIII蛋白还连接至选自由以下组成的组的异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES和白蛋白、其片段或变体。在其它实施方案中,嵌合蛋白包含连接至PEG的VWF片段和连接至PEG的FVIII蛋白,所述VWF片段和所述FVIII蛋白彼此结合,其中VWF片段活性还连接至选自由以下组成的组的第一异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES和白蛋白、其片段或变体,并且其中FVIII蛋白活性还连接至选自由以下组成的组的第二异源部分:免疫球蛋白恒定区或其部分(如,Fc区)、PAS序列、HES和白蛋白、其片段或变体。
本发明还提供本发明嵌合蛋白的化学修饰衍生物,该衍生物可提供另外的优势,例如多肽的溶解度、稳定性和循环时间增加,或免疫原性减小(参见美国专利号4,179,337)。修饰的化学部分可选自由以下组成的组:水溶性聚合物包括但不限于聚乙二醇、乙二醇/丙二醇共聚物、羧甲基纤维素、葡聚糖和聚乙烯醇。嵌合蛋白可在分子内的随机位置或N-或C-末端,或分子内的预定位置修饰,并且可包括一个、两个、三个或更多个连接的化学部分。
聚合物可具有任何分子量,并且可以是支化的或非支化的。对于聚乙二醇,在一个实施方案中,为便于处理和制备,分子量在约1kDa和约100kDa之间。可使用其它大小,取决于所需的特征(如,所需的持续释放的持续时间、对生物活性的影响(如果有的话)、易于处理、抗原性程度或缺乏抗原性以及聚乙二醇对蛋白质或类似物的其它已知影响)。例如,聚乙二醇可具有约200、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10,000、10,500、11,000、11,500、12,000、12,500、13,000、13,500、14,000、14,500、15,000、15,500、16,000、16,500、17,000、17,500、18,000、18,500、19,000、19,500、20,000、25,000、30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95,000或100,000kDa的平均分子量。
在一些实施方案中,聚乙二醇可具有支化结构。支化的聚乙二醇例如在美国专利号5,643,575;Morpurgo等,Appl.Biochem.Biotechnol.56:59-72(1996);Vorobjev等,Nucleosides Nucleotides 18:2745-2750(1999);和Caliceti等,Bioconjug.Chem.10:638-646(1999)中有所描述,这些专利和文献全文各自以引用方式并入本文。
连接至本发明的每个嵌合蛋白、VWF片段或FVIII蛋白的聚乙二醇部分的数量(即,取代度)也可变化。例如,本发明的聚乙二醇化蛋白质可连接至平均1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、12个、15个、17个、20个或更多个聚乙二醇分子。相似地,平均取代度在例如1-3个、2-4个、3-5个、4-6个、5-7个、6-8个、7-9个、8-10个、9-11个、10-12个、11-13个、12-14个、13-15个、14-16个、15-17个、16-18个、17-19个或18-20个聚乙二醇部分/蛋白质分子的范围内。确定取代度的方法在例如Delgado等,Crit.Rev.Thera.Drug CarrierSys.9:249-304(1992)中讨论。
在一些实施方案中,FVIII蛋白可以是聚乙二醇化的。聚乙二醇化的因子VIII可以指因子VIII和至少一个聚乙二醇(PEG)分子之间形成的缀合物。
在其它实施方案中,用于本发明的FVIII蛋白缀合至一种或多种聚合物。聚合物可以是水溶性的,并且共价或非共价连接至因子VIII或缀合至因子VIII的其它部分。聚合物的非限制性实例可以是聚(环氧烷)、聚(乙烯基吡咯烷酮)、聚(乙烯醇)、聚噁唑啉或聚(丙烯酰吗啉)。另外类型的聚合物缀合FVIII在美国专利号7,199,223中有所公开。
8)羟乙基淀粉(HES)
在某些实施方案中,连接至VWF片段或FVIII蛋白的异源部分是聚合物,如羟乙基淀粉(HES)或其衍生物。在一个实施方案中,嵌合蛋白包含本文所述的VWF片段和HES,其中VWF片段连接至HES。在其它实施方案中,本发明的嵌合蛋白包含融合至羟乙基淀粉(HES)的FVIII蛋白,其中羟乙基淀粉或其衍生物屏蔽或保护FVIII蛋白上的VWF结合位点免受内源性VWF的作用,从而抑制或阻止FVIII蛋白与内源性VWF的相互作用。
羟乙基淀粉(HES)是天然存在的支链淀粉的衍生物,并且在体内被α-淀粉酶降解。HES是碳水化合物聚合物支链淀粉的取代衍生物,以最高95重量%的浓度存在于玉米淀粉中。HES表现出有利的生物特性,并且在临床血液稀释治疗中用作血浆代用剂(bloodvolume replacement agent)(Sommermeyer等,Krankenhauspharmazie,8(8),271-278(1987)和Weidler等,Arzneim.-Forschung/Drug Res.,41,494-498(1991))。
支链淀粉包含葡萄糖部分,其中α-1,4-糖苷键存在于主链中,α-1,6-糖苷键存在于支化部位。该分子的物理-化学性质主要通过糖苷键的类型确定。由于切口α-1,4-糖苷键,生成具有约六个葡萄糖单体/转的螺旋结构。聚合物的物理-化学以及生物化学特性可通过取代修改。羟乙基的引入可通过碱性羟乙基化作用实现。通过修改反应条件,可采用相对于羟乙基化作用的未取代葡萄糖单体中相应羟基的不同反应性。由于这个事实,技术人员能够在有限范围内影响取代类型。
HES的主要特征在于分子量分布和取代度。取代度以DS表示,涉及技术人员已知的摩尔取代。参见如上文,尤其是第273页引用的Sommermeyer等,Krankenhauspharmazie,8(8),271-278(1987)。
在一个实施方案中,羟乙基淀粉具有从1至300kD、从2至200kD、从3至100kD或从4至70kD的平均分子量(分子量平均值)。羟乙基淀粉还可表现出从0.1至3,优选地0.1至2,更优选地0.1至0.9,优选地0.1至0.8的摩尔取代度,以及相对于羟乙基从2至20范围内的C2:C6取代比率。具有约130kD的平均分子量的HES的非限制性实例是具有取代度为0.2至0.8,例如0.2、0.3、0.4、0.5、0.6、0.7或0.8,优选地0.4至0.7,例如0.4、0.5、0.6或0.7的HES。在具体实施方案中,具有约130kD的平均分子量的HES是得自Fresenius的
Figure BDA0002313018640000681
Figure BDA0002313018640000682
是人工胶体,作为例如血浆代用剂,用于血容量不足治疗和预防的治疗指示。
Figure BDA0002313018640000683
的特性是平均分子量为130,000+/-20,000D、摩尔取代为0.4,以及C2:C6比率为约9:1。在其它实施方案中,羟乙基淀粉的平均分子量范围为例如约4至70kD或10至70kD或12至70kD或18至70kD或50至70kD或4至50kD或10至50kD或12至50kD或18至50kD或4至18kD或10至18kD或12至18kD或4至12kD或10至12kD或4至10kD。在其它实施方案中,所用的羟乙基淀粉的平均分子量在大于4kD和小于70kD的范围内例如约10kD,或在从9至10kD或从10至11kD或从9至11kD的范围内或约12kD,或在从11至12kD)或从12至13kD或从11至13kD的范围内或约18kD,或在从17至18kD或从18至19kD或从17至19kD的范围内或约30kD,或在从29至30或从30至31kD的范围内或约50kD,或在从49至50kD或从50至51kD或从49至51kD的范围内。
在某些实施方案中,异源部分可以是具有不同平均分子量和/或不同取代度和/或不同C2:C6取代比率的羟乙基淀粉混合物。因此,可使用具有不同平均分子量和不同取代度和不同C2:C6取代比率,或具有不同平均分子量和不同取代度和相同或大约相同C2:C6取代比率,或具有不同平均分子量和相同或大约相同取代度和不同C2:C6取代比率,或具有相同或大约相同平均分子量和不同取代度和不同C2:C6取代比率,或具有不同平均分子量和相同或大约相同取代度和相同或大约相同C2:C6取代比率,或具有相同或大约相同平均分子量和不同取代度和相同或大约相同C2:C6取代比率,或具有相同或大约相同平均分子量和相同或大约相同取代度和不同C2:C6取代比率,或具有大约相同平均分子量和大约相同取代度和大约相同C2:C6取代比率的羟乙基淀粉的混合物。
9)聚唾液酸(PSA)
在某些实施方案中,连接至VWF片段或FVIII蛋白的非多肽异源部分是聚合物,如聚唾液酸(PSA)或其衍生物。聚唾液酸(PSA)是由某些细菌菌株和哺乳动物某些细胞中产生的天然存在的唾液酸的非支链聚合物,Roth J.,等(1993)Polysialic Acid:FromMicrobes to Man,Roth J.,Rutishauser U.,Troy F.A.编辑
Figure BDA0002313018640000691
Verlag,Basel,Switzerland),335-348页。它们可以从n=约80或更多的唾液酸残基至n=2的各种聚合度通过有限酸水解或通过神经氨酸酶消化,或通过天然、细菌来源形式的聚合物分离产生。不同聚唾液酸的组合物可变化,使得存在均聚形式,即包含大肠杆菌(E.coli)菌株K1和B-群脑膜炎球菌的荚膜多糖的α-2,8-连接聚唾液酸,其还见于神经细胞粘附分子(N-CAM)的雏形。还存在杂聚形式,例如大肠杆菌菌株K92和脑膜炎双球菌(N.meningitidis)的C群多糖的交替α-2,8α-2,9-聚唾液酸。唾液酸也可见于具有除唾液酸之外的单体的交替共聚物,例如脑膜炎双球菌的W135群或Y群。聚唾液酸具有重要生物学功能,包括通过病原菌逃离免疫和补体系统,以及胎儿发育期间未成熟神经元的胶质粘附调节(其中聚合物具有抗粘附功能),Cho和Troy,P.N.A.S.,USA,91(1994)11427-11431,但哺乳动物中不存在聚唾液酸的已知受体。大肠杆菌菌株K1的α-2,8-连接聚唾液酸也称为“多聚乙酰神经氨酸”,并且用于(以各种长度)举例说明本发明。将聚唾液酸连接或缀合至多肽的各种方法已有所描述(例如参见美国专利号5,846,951、WO-A-0187922和US 2007/0191597 A1,这些专利全文以引用方式并入本文中。
C)FVIII蛋白
如本文所用,除非另外指明,“FVIII蛋白”意指具有正常凝血作用的功能FVIII多肽。术语FVIII蛋白包括保持凝血途径中全长野生型因子VIII的功能的功能片段、其变体、类似物或衍生物。“FVIII蛋白”与FVIII多肽(或蛋白质)或FVIII可互换使用。FVIII功能的实例包括但不限于:活化凝血的能力、充当因子IX的辅因子的能力或在Ca2+和磷脂存在下与因子IX形成因子X酶复合物,然后将因子X转化为活化形式Xa的能力。FVIII蛋白可以是人、猪、狗、大鼠或鼠FVIII蛋白。此外,来自人和其它物种的FVIII之间的比较识别出可能为功能必须的保守残基(Cameron等,Thromb.Haemost.79:317-22(1998);US6,251,632)。
多个测试可用于评估凝血系统的功能:活化部分促凝血酶原激酶时间(aPTT)测试、显色测定、ROTEM测定、凝血酶原时间(PT)测试(还用于确定INR)、血纤维蛋白原测试(通常通过Clauss法进行)、血小板计数、血小板功能测试(通常通过PFA-100进行)、TCT、出血时间、混合测试(如果患者的血浆与正常血浆混合,是否纠正异常)、凝血因子测定、抗磷脂抗体、D-二聚体、基因测试(如因子V Leiden、凝血酶原突变G20210A)、稀释Russell蝰蛇毒时间(dRVVT)、血小板多种功能测试、凝血弹性描记(TEG或Sonoclot)、凝血弹性测量(thromboelastometry)(
Figure BDA0002313018640000701
Figure BDA0002313018640000702
)或优球蛋白裂解时间(ELT)。
aPTT测试是测量“内因性”(也称为接触活化途径)和共同凝血途径二者功效的性能指标。该测试通常用于测量市售重组凝血因子如FVIII或FIX的凝血活性。它结合测量外因性途径的凝血酶原时间(PT)使用。
ROTEM分析提供关于止血:凝血时间的完整动力学、凝块形成、凝块稳定性和裂解的信息。凝血弹性测量的不同参数取决于血浆凝血系统的活性、血小板功能、血纤维蛋白溶解或影响这些相互作用的多个因素。该测定可提供二期止血的完整观察。
FVIII多肽和多核苷酸序列是已知的,正如多个功能片段、突变和修饰型式。人FVIII序列(全长)的实例以SEQ ID NO:16或18的子序列示出。
表2.全长FVIII(FVIII信号肽以下划线表示;FVIII重链以双下划线表示;B结构域以斜体表示;并且FVIII轻链以纯文本表示)
信号肽:(SEQ ID NO:15)
Figure BDA0002313018640000703
成熟因子VIII(SEQ ID NO:16)*
Figure BDA0002313018640000711
表3.编码全长FVIII的核苷酸序列(SEQ ID NO:17)*
Figure BDA0002313018640000712
Figure BDA0002313018640000721
Figure BDA0002313018640000731
*加下划线的核酸编码信号肽。
FVIII多肽包括全长FVIII、N-末端减去Met的全长FVIII、成熟FVIII(减去信号序列)、N-末端具有另外Met的成熟FVIII和/或B结构域完全或部分缺失的FVIII。在某些实施方案中,FVIII变体包括部分或完全缺失的B结构域缺失。
分离人FVIII基因并在哺乳动物细胞中表达(Toole,J.J.,等,Nature 312:342-347(1984);Gitschier,J.,等,Nature 312:326-330(1984);Wood,W.I.,等,Nature 312:330-337(1984);Vehar,G.A.,等,Nature 312:337-342(1984);WO 87/04187、WO 88/08035、WO 88/03558和美国专利号4,757,006)。FVIII氨基酸序列从cDNA推导,如美国专利号4,965,199中所示。此外,部分或完全B-结构域缺失的FVIII如美国专利号4,994,371和4,868,112中所示。在一些实施方案中,人FVIII B-结构域被人因子V B-结构域替代,如美国专利号5,004,803中所示。编码人因子VIII和氨基酸序列的cDNA序列分别如美国申请公布号2005/0100990的SEQ ID NO:17和16所示。
猪FVIII序列在Toole,J.J.,等,Proc.Natl.Acad.Sci.USA 83:5939-5942(1986)中公开。另外,从猪脾脏cDNA文库PCR扩增FVIII序列得到的完整猪cDNA序列在Healey,J.F.,等,Blood 88:4209-4214(1996)中报道。具有所有结构域、所有亚基和具体氨基酸序列的取代的杂合人/猪FVIII在Lollar和Runge的美国专利号5,364,771和WO 93/20093中有所公开。最近,猪FVIII和猪A1和/或A2结构域被对应的人结构域取代的嵌合FVIII的A1和A2结构域的核苷酸和对应氨基酸序列在WO 94/11503中报道。Lollar,J.S.的美国专利号5,859,204还公开了猪cDNA和推导氨基酸序列。美国专利号6,458,563公开了B-结构域缺失的猪FVIII。
Lollar,J.S.的美国专利号5,859,204报道了抗原性减少和免疫反应性减少的FVIII的功能突变体。Lollar,J.S.的美国专利号6,376,463还报道了免疫反应性减少的FVIII的突变体。Saenko等的美国申请公布号2005/0100990报道了FVIII的A2结构域的功能突变。
在一个实施方案中,FVIII(或嵌合蛋白的FVIII部分)与SEQ ID NO:18的第1至1438位氨基酸或SEQ ID NO:16(不含信号序列)的第1至2332位氨基酸的FVIII氨基酸序列或SEQ ID NO:15和SEQ ID NO:18的第-19至1438位氨基酸或SEQ ID NO:15和SEQ ID NO:16(含信号序列)的第-19至2332位氨基酸的FVIII氨基酸序列可具有至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的同一性,其中FVIII具有凝血活性,如活化作为辅因子的因子IX,以将因子X转化为活化的因子X。FVIII(或嵌合蛋白的FVIII部分)可与SEQ ID NO:18的第1至1438位氨基酸或SEQ ID NO:16(不含信号序列)的第1至2332位氨基酸的FVIII氨基酸序列相同。FVIII还可包含信号序列。
如本文所用,FVIII的“B-结构域”与本领域已知的由内部氨基酸序列同一性和蛋白酶裂解位点,如全长人FVIII的Ser741-Arg1648残基确定的B-结构域相同。其它人FVIII结构域通过如下氨基酸残基确定:A1,Ala1-Arg372残基;A2,Ser373-Arg740残基;A3,Ser1690-Asn2019残基;C1,Lys2020-Asn2172残基;C2,Ser2173-Tyr2332残基。A3-C1-C2序列包括Ser1690-Tyr2332残基。其余序列Glu1649-Arg1689残基通常称为a3酸性区。所有结构域包括猪、小鼠和狗FVIII的B-结构域的边界位置也是本领域已知的。在一个实施方案中,FVIII的B结构域是缺失的(“B-结构域缺失的因子VIII”或“BDD FVIII”)。BDD FVIII的实例是
Figure BDA0002313018640000741
(重组BDD FVIII),其具有与表4中序列的因子VIII部分相同的序列。(BDD FVIII重链以双下划线表示;B结构域以斜体表示;并且BDD FVIII轻链以纯文本表示)。
表4
BDD FVIII(SEQ ID NO:18)
Figure BDA0002313018640000751
表5.编码BDD FVIII的核苷酸序列(SEQ ID NO:19)*
Figure BDA0002313018640000761
Figure BDA0002313018640000771
*加下划线的核酸编码信号肽。
“B-结构域缺失的FVIII”可具有美国专利号6,316,226、6,346,513、7,041,635、5,789,203、6,060,447、5,595,886、6,228,620、5,972,885、6,048,720、5,543,502、5,610,278、5,171,844、5,112,950、4,868,112和6,458,563中公开的完全或部分缺失。在一些实施方案中,本发明的B-结构域缺失的FVIII序列包含美国专利号6,316,226(以及US 6,346,513)的第4段第4行至第5段第28行和实施例1-5中公开的缺失的任一者。在另一个实施方案中,B-结构域缺失的因子VIII是S743/Q1638 B-结构域缺失的因子VIII(SQ BDD FVIII)(如,具有第744位氨基酸至第1637位氨基酸的缺失的因子VIII,如具有SEQ ID NO:16,即SEQ ID NO:18的第1-743位氨基酸和第1638-2332位氨基酸的因子VIII)。在一些实施方案中,本发明的B-结构域缺失的FVIII具有美国专利号5,789,203(以及US 6,060,447、US 5,595,886和US 6,228,620)的第2段第26-51行和实施例5-8中公开的缺失。在一些实施方案中,B-结构域缺失的因子VIII具有美国专利号5,972,885的第1段第25行至第2段第40行、美国专利号6,048,720的第6段第1-22行和实施例1、美国专利号5,543,502的第2段第17-46行、美国专利号5,171,844的第4段第22行至第5段第36行、美国专利号5,112,950的第2段第55-68行、图2和实施例1、美国专利号4,868,112的第2段第2行至第19段第21行和表2、美国专利号7,041,635的第2段第1行至第3段第19行、第3段第40行至第4段第67行、第7段第43行至第8段第26行和第11段第5行至第13段第39行或美国专利号6,458,563的第4段第25-53行中描述的缺失。
在一些实施方案中,B-结构域缺失的FVIII具有大多数B结构域的缺失,但仍包含对于体内将初级翻译产物蛋白酶加工为两条多肽链必须的B结构域的氨基末端序列,如WO91/09122中所公开。在一些实施方案中,B-结构域缺失的FVIII通过第747-1638位氨基酸缺失,即实际上B结构域的完整缺失而构建。Hoeben R.C.,等J.Biol.Chem.265(13):7318-7323(1990)。B-结构域缺失的因子VIII也可包含FVIII的第771-1666位氨基酸或第868-1562位氨基酸缺失。Meulien P.,等Protein Eng.2(4):301-6(1988)。作为本发明部分的另外B结构域缺失包括:第982至1562位或第760至1639位(Toole等,Proc.Natl.Acad.Sci.U.S.A.(1986)83,5939-5942)、第797至1562位(Eaton,等Biochemistry(1986)25:8343-8347)、第741至1646位(Kaufman(PCT公布专利申请号WO 87/04187))、第747-1560位(Sarver,等,DNA(1987)6:553-564)、第741至1648位(Pasek(PCT专利申请号88/00831))或第816至1598位或第741至1648位(Lagner(Behring Inst.Mitt.(1988)No 82:16-25,EP 295597))氨基酸缺失。在其它实施方案中,BDD FVIII包括包含保持一个或多个N-连接糖基化位点,如对应于全长FVIII序列的氨基酸序列的第757、784、828、900、963或任选地943位残基的B-结构域的片段的FVIII多肽。B-结构域片段的实例包括B-结构域的226个氨基酸或163个氨基酸,如Miao,H.Z.,等,Blood 103(a):3412-3419(2004)、Kasuda,A,等,J.Thromb.Haemost.6:1352-1359(2008)和Pipe,S.W.,等,J.Thromb.Haemost.9:2235-2242(2011)中所公开(即,保持B结构域的前226个氨基酸或163个氨基酸)。在一些实施方案中,具有部分B-结构域的FVIII是FVIII198(SEQ ID NO:105)。FVIII198是包含部分B-结构域的单链FVIIIFc分子-226N6。226表示FVIII B-结构域的N-末端226个氨基酸,并且N6表示B-结构域中的六个N-糖基化位点。在其它实施方案中,BDDFVIII还包含第309位残基的点突变(从Phe突变为Ser),以提高BDD FVIII蛋白的表达。参见Miao,H.Z.,等,Blood 103(a):3412-3419(2004)。在其它实施方案中,BDD FVIII包括包含B-结构域的一部分,但不包含一个或多个弗林蛋白酶切割位点(如,Arg1313和Arg1648)的FVIII多肽。参见Pipe,S.W.,等,J.Thromb.Haemost.9:2235-2242(2011)。每个上述缺失可在任何FVIII序列中制备。
用于本发明的FVIII蛋白可包括其中具有不影响FVIII凝血活性的一个或多个另外的异源序列或化学或物理修饰的FVIII。此类异源序列或化学或物理修饰可融合至FVIII蛋白的C-末端或N-末端或插入FVIII蛋白中两个氨基酸残基的一个或多个之间。此类插入FVIII蛋白不影响FVIII凝血活性或或FVIII功能。在一个实施方案中,插入改善了FVIII蛋白的药代动力学特性(如,半衰期)。在另一个实施方案中,插入可以是多于两个、三个、四个、五个或六个位点。
在一个实施方案中,FVIII在第1648位氨基酸(全长因子VIII或SEQ ID NO:16中)、第754位氨基酸(S743/Q1638 B-结构域缺失的因子VIII或SEQ ID NO:16中)的精氨酸或对应的精氨酸残基(其它变体中)之后切割,从而产生重链和轻链。在另一个实施方案中,FVIII包含通过金属离子介导的非共价键连接或缔合的重链和轻链。
在其它实施方案中,FVIII是未在第1648位氨基酸(全长FVIII或SEQ ID NO:16中)、第754位氨基酸(S743/Q1638 B-结构域缺失的FVIII或SEQ ID NO:18中)的精氨酸或对应的精氨酸残基(其它变体中)之后切割的单链FVIII。单链FVIII可包含一个或多个氨基酸取代。在一个实施方案中,氨基酸取代位于与全长成熟因子VIII多肽(SEQ ID NO:16)的第1648位残基、第1645位残基或它们二者或SQ BDD因子VIII(SEQ ID NO:18)的第754位残基、第751位残基或它们二者对应的残基。氨基酸取代可以是除精氨酸之外的任何氨基酸,如异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、苏氨酸、色氨酸、缬氨酸、丙氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、硒半胱氨酸、丝氨酸、酪氨酸、组氨酸、鸟氨酸、吡咯赖氨酸或牛磺酸。
FVIII还可被凝血酶切割,然后活化为FVIIIa,作为活化因子IX(FIXa)的辅因子。并且活化的FIX与活化的FVIII一起形成因子X酶复合物,并且将因子X转化为活化的因子X(FXa)。对于活化而言,FVIII在三个精氨酸残基后的第372、740和1689位氨基酸(对应于B-结构域缺失的FVIII序列中的第372、740和795位氨基酸)被凝血酶切割,切割生成具有50kDa A1、43kDa A2和73kDa A3-C1-C2链的FVIIIa。在一个实施方案中,用于本发明的FVIII蛋白是非活化的FVIII。在另一个实施方案中,FVIII蛋白是活化的FVIII。
具有连接至VWF片段或与之缔合的FVIII多肽的蛋白质可包含与SEQ ID NO:16或18具有至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的同一性的序列,其中该序列具有FVIII凝血活性,如活化因子IX,作为将因子X转化为活化因子X(FXa)的辅因子。
如本文所用,“杂合”多肽和蛋白质意指第一多肽链如VWF片段(任选地融合至第一异源部分)与第二多肽链如FVIII蛋白(任选地融合至第二异源部分)组合,从而形成的异源二聚体。在一个实施方案中,杂合物中的第一多肽和第二多肽通过蛋白质-蛋白质相互作用,例如电荷-电荷或疏水相互作用彼此缔合。在另一个实施方案中,杂合物中的第一多肽和第二多肽通过二硫键或其它共价键彼此缔合。杂合物在例如US 2004/101740和US2006/074199中有所描述。第二多肽可以是第一多肽的相同拷贝或不同的多肽。在一个实施方案中,第一多肽是VWF片段-Fc融合蛋白,第二多肽是包含、基本上由或由FcRn结合结构域组成的多肽,其中第一多肽和第二多肽彼此缔合。在另一个实施方案中,第一多肽包含VWF片段-Fc融合蛋白,并且第二多肽包含FVIII-Fc融合蛋白,从而使杂合物为异源二聚体。第一多肽和第二多肽可通过共价键,如第一Fc区和第二Fc区之间的二硫键缔合。第一多肽和第二多肽还可通过VWF片段和FVIII蛋白之间的结合彼此缔合。
D)连接基
本发明的嵌合蛋白还包含连接基。一个或多个连接基可存在于任何两个蛋白质之间,如辅助部分和FVIII蛋白之间(有时也称为“FVIII/AM连接基”)、VWF片段和第一异源部分之间(有时也称为“VWF连接基”)如第一Fc区、FVIII蛋白和第二异源部分之间(有时也称为“FVIII连接基”)如第二Fc区、VWF片段和FVIII蛋白之间(如,FVIII/AM连接基)、VWF片段和第二异源部分之间和/或FVIII蛋白和第一异源部分之间。每个连接基可具有相同或不同的序列。在一个实施方案中,连接基是多肽连接基。在另一个实施方案中,连接基是非多肽连接基。
用于本发明的连接基可包括任何有机分子。在一个实施方案中,连接基是聚合物,如聚乙二醇(PEG)或羟乙基淀粉(HES)。在另一个实施方案中,连接基是氨基酸序列(如,多肽连接基)。多肽连接基可包含至少约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、1100个、1200个、1300个、1400个、1500个、1600个、1700个、1800个、1900个或2000个氨基酸。连接基可包含1-5个氨基酸、1-10个氨基酸、1-20个氨基酸、10-50个氨基酸、50-100个氨基酸、100-200个氨基酸、200-300个氨基酸、300-400个氨基酸、400-500个氨基酸、500-600个氨基酸、600-700个氨基酸、700-800个氨基酸、800-900个氨基酸或900-1000个氨基酸。
多肽连接基的实例是本领域熟知的。在一个实施方案中,连接基包含序列Gn。连接基可包含序列(GA)n。连接基可包含序列(GGS)n。在其它实施方案中,连接基包含(GGGS)n(SEQ ID NO:20)。在其它实施方案中,连接基包含序列(GGS)n(GGGGS)n(SEQ ID NO:21)。在这些实例中,n可以是1-100的整数。在其它实例中,n可以是1-20的整数,即1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。连接基的实例包括但不限于:GGG、SGGSGGS(SEQ ID NO:22)、GGSGGSGGSGGSGGG(SEQ ID NO:23)、GGSGGSGGGGSGGGGS(SEQ ID NO:24)、GGSGGSGGSGGSGGSGGS(SEQ ID NO:25)、GGGGSGGGGSGGGGS(SEQ ID NO:26)、表13中的连接基(SEQ ID NO:92、93和94)和表14A中的连接基(SEQ ID NO:95、96和97)。连接基不消除或减弱VWF片段活性或因子VIII的凝血活性。任选地,连接基增强VWF片段活性或因子VIII蛋白的凝血活性,如通过进一步减弱空间位阻效应并且使VWF片段或因子VIII部分更易于接触其靶结合位点。
在一个实施方案中,用于嵌合蛋白的连接基的长度为15-25个氨基酸。在另一个实施方案中,用于嵌合蛋白连接基的长度为15-20个氨基酸。在一些实施方案中,用于嵌合蛋白的连接基的长度为10-25个氨基酸。在其它实施方案中,用于嵌合蛋白的连接基的长度为15个氨基酸。在其它实施方案中,用于嵌合蛋白的连接基是(GGGGS)n(SEQ ID NO:27),其中G表示甘氨酸,S表示丝氨酸,并且n为1-20的整数。
E)切割位点
连接基也可结合能够被化学(如,酯键的水解)、酶促(即,结合蛋白酶切割序列)或光解(如,发色团例如3-氨基-3-(2-硝基苯基)丙酸(ANP))切割,以便从另一个分子释放一个分子的部分。
在一个实施方案中,连接基是可切割的连接基。可切割的连接基可包含N-末端或C-末端或它们二者的一个或多个切割位点。在另一个实施方案中,可切割的连接基基本上由或由一个或多个可切割位点组成。在其它实施方案中,可切割的连接基包含本文所述的异源氨基酸连接基序列或聚合物以及一个或多个可切割位点。
在某些实施方案中,可切割的连接基包含一个或多个可在宿主细胞(即,细胞内加工位点)中切割的切割位点。切割位点的非限制性实例包括RRRR(SEQ ID NO:52)、RKRRKR(SEQ ID NO:53)和RRRRS(SEQ ID NO:54)。
在其它实施方案中,可切割的连接基包含一个或多个在包含可切割的连接基的嵌合蛋白施用至受试者之后被蛋白酶切割的切割位点。在一个实施方案中,切割位点被选自由以下组成的组的蛋白酶切割:因子XIa、因子XIIa、激肽释放酶、因子VIIa、因子IXa、因子Xa、因子IIa(凝血酶)、弹性蛋白酶-2、MMP-12、MMP-13、MMP-17和MMP-20。在另一个实施方案中,切割位点选自由以下组成的组:FXIa切割位点(如,KLTR↓AET(SEQ ID NO:29))、FXIa切割位点(如,DFTR↓VVG(SEQ ID NO:30))、FXIIa切割位点(如,TMTR↓IVGG(SEQ ID NO:31))、激肽释放酶切割位点(如,SPFR↓STGG(SEQ ID NO:32))、FVIIa切割位点(如,LQVR↓IVGG(SEQID NO:33))、FIXa切割位点(如,PLGR↓IVGG(SEQ ID NO:34))、FXa切割位点(如,IEGR↓TVGG(SEQ ID NO:35))、FIIa(凝血酶)切割位点(如,LTPR↓SLLV(SEQ ID NO:36))、弹性蛋白酶-2切割位点(如,LGPV↓SGVP(SEQ ID NO:37))、粒酶-B切割(如,VAGD↓SLEE(SEQ ID NO:38))、MMP-12切割位点(如,GPAG↓LGGA(SEQ ID NO:39))、MMP-13切割位点(如,GPAG↓LRGA(SEQ IDNO:40))、MMP-17切割位点(如,APLG↓LRLR(SEQ ID NO:41))、MMP-20切割位点(如,PALP↓LVAQ(SEQ ID NO:42))、TEV切割位点(如,ENLYFQ↓G(SEQ ID NO:43))、肠激酶切割位点(如,DDDK↓IVGG(SEQ ID NO:44))、蛋白酶3C(PRESCISSIONTM)切割位点(如,LEVLFQ↓GP(SEQ IDNO:45))和分选酶A切割位点(如,LPKT↓GSES(SEQ ID NO:46))。在某些实施方案中,FXIa切割位点包括但不限于例如TQSFNDFTR(SEQ ID NO:47)和SVSQTSKLTR(SEQ ID NO:48)。非限制性示例性凝血酶切割位点包括例如DFLAEGGGVR(SEQ ID NO:49)、TTKIKPR(SEQ ID NO:50)或LVPRG(SEQ ID NO:55)以及包含、基本上由或由ALRPR组成的序列(如,ALRPRVVGGA(SEQ ID NO:51))。
在具体实施方案中,切割位点是TLDPRSFLLRNPNDKYEPFWEDEEK(SEQ ID NO:56)。
多核苷酸、载体、宿主细胞及其制备方法
本发明还提供编码本文所述的VWF片段的多核苷酸、包含VWF片段和异源部分的嵌合蛋白、包含FVIII蛋白和辅助部分的嵌合蛋白或包含VWF片段和FVIII蛋白的嵌合蛋白。当VWF片段作为单多肽链连接至嵌合蛋白中的异源部分或FVIII蛋白时,本发明涉及编码连接至异源部分或FVIII蛋白的VWF片段的多核苷酸。当嵌合蛋白包含第一和第二多肽链,第一多肽链包含VWF片段和第一异源部分(如,第一Fc区),并且第二多肽链包含第二异源部分(如,第二Fc区),其中第一多肽链和第二多肽链彼此缔合时,多核苷酸可包含第一核苷酸序列和第二核苷酸序列。在一个实施方案中,第一核苷酸序列和第二核苷酸序列在相同的多核苷酸上。在另一个实施方案中,第一核苷酸序列和第二核苷酸序列在两个不同的多核苷酸上(如,不同的载体)。在某些实施方案中,本发明涉及一组包含第一核苷酸链和第二核苷酸链的的多核苷酸,其中第一核苷酸链编码嵌合蛋白的VWF片段,并且第二核苷酸链编码FVIII蛋白。
在其它实施方案中,所述多核苷酸组还包含编码蛋白质转化酶的另外核苷酸链(如,当嵌合多肽被单条多核苷酸链编码时为第二核苷酸链或当嵌合蛋白被两条多核苷酸链编码时为第三核苷酸链)。蛋白质转化酶可选自由以下组成的组:前蛋白转化酶枯草杆菌蛋白酶/kexin 5型(PCSK5或PC5)、前蛋白转化酶枯草杆菌蛋白酶/kexin 7型(PCSK7或PC5)、酵母Kex 2、前蛋白转化酶枯草杆菌蛋白酶/kexin 3型(PACE或PCSK3)以及它们的两种或多种组合。在一些实施方案中,蛋白质转化酶是PACE、PC5或PC7。在具体实施方案中,蛋白质转化酶是PC5或PC7。参见国际专利申请号PCT/US2011/043568,该申请以引用方式并入本文。在另一个实施方案中,蛋白质转化酶是PACE/弗林蛋白酶。
在某些实施方案中,本发明包括一组包含第一核苷酸序列、第二核苷酸序列和第三核苷酸序列的多核苷酸,所述第一核苷酸序列编码包含VWF的D'结构域和D3结构域的VWF片段,所述第二核苷酸序列编码FVIII蛋白,并且所述第三核苷酸序列编码VWF的D1结构域和D2结构域。在该实施方案中,D1结构域和D2结构域独立地表达(不连接至VWF片段的D'D3结构域)以便形成正确的二硫键以及D'D3结构域折叠。D1D2结构域表达可以是顺式的或反式的。
如本文所用,表达载体是指包含用于插入的编码序列的转录和翻译的必要元件,或在RNA病毒载体的情况下用于引入适当的宿主细胞时复制和翻译的必要元件的任何核酸构建体。表达载体可包括质粒、噬菌粒、病毒及其衍生物。
本发明的表达载体将包括编码VWF片段的多核苷酸或包含VWF片段的嵌合蛋白。
在一个实施方案中,VWF片段的编码序列、第二异源部分(如,第二Fc区)或FVIII蛋白可操作地连接至表达调控序列。如本文所用,当两个核酸序列共价连接以允许每个组件核酸序列保持其功能时它们是可操作地连接的。当编码序列和基因表达控制序列共价连接时,以将编码序列的表达或转录和/或翻译置于基因表达控制序列的影响或控制下,据说它们是可操作地连接的。据说,如果5'基因表达序列中的启动子的诱导导致编码序列的转录,并且如果两个DNA序列之间的连接的性质不(1)导致引入移码突变,(2)妨碍启动子区指导编码序列转录的能力或(3)妨碍对应的RNA转录物翻译为蛋白质的能力,则两个DNA序列是可操作地连接的。因此,如果基因表达序列能够影响该编码核酸序列的转录,使得所得的转录物翻译为所需蛋白质或多肽,则基因表达序列可操作地连接至编码核酸序列。
如本文所用,基因表达控制序列是任何调控核苷酸序列,例如启动子序列或启动子-增强子组合,它们促进与其可操作连接的编码核酸的有效转录和翻译。基因表达控制序列可以是例如哺乳动物或病毒启动子,例如组成型或诱导型启动子。组成型哺乳动物启动子包括但不限于如下基因的启动子:次黄嘌呤磷酸核糖基转移酶(HPRT)、腺苷脱氨酶、丙酮酸激酶、β-肌动蛋白启动子以及其它组成型启动子。在真核细胞中发挥组成型作用的示例性病毒启动子包括例如来自巨细胞病毒(CMV)、猿猴病毒(如,SV40)、乳头状瘤病毒、腺病毒、人免疫缺陷病毒(HIV)、劳氏肉瘤病毒、巨细胞病毒、莫洛尼氏白血病病毒的长末端重复(LTR)以及其它逆转录病毒的启动子,以及单纯疱疹病毒的胸苷激酶启动子。其它组成型启动子是本领域普通技术人员已知的。用作本发明的基因表达序列的启动子还包括诱导型启动子。诱导型启动子在诱导剂存在下表达。例如,金属硫蛋白启动子在某些金属离子存在下被诱导以促进转录和翻译。其它诱导型启动子是本领域普通技术人员已知的。
一般来讲,基因表达控制序列应包括(如果必要)分别参与转录和翻译起始的5'非转录和5'非翻译序列,例如TATA框、加帽序列、CAAT序列等。特别地,此类5'非转录序列将包括启动子区,所述启动子区包括用于可操作地连接的编码核酸的转录控制的启动子序列。基因表达序列任选地根据需要包括增强子序列或上游激活序列。
病毒载体包括但不限于来自如下病毒的核酸序列:逆转录病毒例如莫洛尼氏鼠白血病病毒、哈维鼠肉瘤病毒、鼠乳腺肿瘤病毒和劳氏肉瘤病毒;腺病毒、腺相关病毒;SV40-型病毒;多瘤病毒;爱泼斯坦-巴尔病毒(Epstein-Barr virus);乳头状瘤病毒、疱疹病毒;牛痘病毒;脊髓灰质炎病毒;以及RNA病毒例如逆转录病毒。可轻松地采用本领域熟知的其它载体。某些病毒载体基于非细胞病变真核细胞病毒,其中非必需基因被所关注的基因替代。非细胞病变病毒包括逆转录病毒,其生活周期涉及基因组病毒RNA逆转录为DNA,随后原病毒整合到宿主细胞DNA。逆转录病毒已经批准用于人类基因治疗试验。最有用的是那些复制缺陷型逆转录病毒(即,能够指导所需蛋白质的合成,但不能制备感染性颗粒)。此类遗传改变的逆转录病毒表达载体通常用于基因的体内高效转导。用于制备复制缺陷型逆转录病毒的标准方案(包括如下步骤:将外源性遗传物质掺入质粒、用质粒转染包装细胞系、通过包装细胞系产生重组逆转录病毒、从组织培养基收集病毒颗粒以及用病毒颗粒感染靶细胞)在Kriegler,M.,Gene Transfer and Expression,A Laboratory Manual,W.H.FreemanCo.,New York(1990)和Murry,E.J.,Methods in Molecular Biology,第7卷,HumanaPress,Inc.,Cliffton,N.J.(1991)中提供。
在一个实施方案中,病毒是腺相关病毒,其为双链DNA病毒。腺相关病毒可工程化为复制缺陷型,并且能够感染多种细胞类型和物种。它还具有多个优点,例如热和脂溶剂稳定性;各种谱系细胞包括造血细胞中的高转导频率;以及缺乏重复感染抑制从而允许多个系列转导。据报道,腺相关病毒可以位点特异性方式整合进人细胞DNA,从而使逆转录病毒感染特征性的插入诱变可能性和插入基因表达可变性降至最小。此外,野生型腺相关病毒感染在不存在选择压力的情况下在组织培养基中传代大于100次,意味着腺相关病毒基因组整合是相对稳定的事件。腺相关病毒也可以染色体外的方式发挥功能。
其它载体包括质粒载体。质粒载体在本领域中广泛描述,并且是本领域技术人员熟知的。参见例如Sambrook等,Molecular Cloning:A Laboratory Manual,第二版,ColdSpring Harbor Laboratory Press,1989。最近几年发现,质粒载体对于在体内将基因递送至细胞特别有利,因为其不能在宿主基因组内复制并整合进宿主基因组。然而,这些具有与宿主细胞兼容的启动子的质粒可由在质粒内可操作地编码的基因表达肽。一些可商购获得的常用质粒包括pBR322、pUC18、pUC19、各种pcDNA质粒、pRC/CMV、各种pCMV质粒、pSV40和pBlueScript。具体质粒的另外实例包括pcDNA3.1,目录号V79020;pcDNA3.1/hygro,目录号V87020;pcDNA4/myc-His,目录号V86320;以及pBudCE4.1,目录号V53220,它们均得自Invitrogen(Carlsbad,CA)。其它质粒是本领域普通技术人员熟知的。另外,质粒可使用标准分子生物学技术定制设计,以移除和/或添加特定DNA片段。
在一种可用于制备本发明的蛋白质的昆虫表达系统中,苜蓿银纹夜蛾(Autographa californica)核多角体病毒(AcNPV)用作表达外源基因的载体。病毒在草地贪夜蛾(Spodoptera frugiperda)细胞中生长。编码序列可克隆至病毒的非必需区(例如,多角体基因),并且置于ACNPV启动子(例如,多角体启动子)的控制下。编码序列的成功插入将导致多角体基因的失活和非包涵型重组病毒(即,缺乏多角体基因编码的蛋白质性外壳的病毒)的生成。然后,这些重组病毒用于感染插入基因在其中表达的草地贪夜蛾细胞。(参见例如Smith等(1983)J Virol 46:584;美国专利号4,215,051)。该表达系统的其它实例可见于Ausubel等编著(1989)Current Protocols in Molecular Biology,第2卷,GreenePublish.Assoc.&Wiley Interscience。
可用于表达本发明的蛋白质的另一个系统是谷氨酰胺合成酶基因表达系统,也称为“GS表达系统”(Lonza Biologics PLC,Berkshire UK)。该表达系统在美国专利号5,981,216中详细描述。
在哺乳动物宿主细胞中,可使用多个基于病毒的表达系统。在其中腺病毒用作表达载体的情况下,编码序列可连接至腺病毒转录/翻译控制复合物,如晚期启动子和三重前导序列。然后,该嵌合基因可通过体外或体内重组插入腺病毒基因组。插入病毒基因组的非必需区(如,E1或E3区)将产生可存活并且能够在感染宿主中表达肽的重组病毒。参见例如Logan&Shenk(1984)Proc Natl Acad Sci USA 81:3655。或者,可使用牛痘7.5K启动子。参见例如Mackett等(1982)Proc Natl Acad Sci USA 79:7415;Mackett等(1984)J Virol49:857;Panicali等(1982)Proc Natl Acad Sci USA 79:4927。
为增加制备效率,多核苷酸可设计为编码本发明蛋白质的多个由酶切割位点分隔的单元。可切割所得的多肽(如,用适当的酶处理)以回收多肽单元。这可增加单个启动子驱动的多肽的产量。当用于适当病毒表达系统时,由mRNA编码的每条多肽的翻译在转录物内部引导;如通过内部核糖体进入位点IRES。因此,多顺反子构建体指导单个大多顺反子mRNA的转录,继而指导多个单条多肽的翻译。该方法消除了多蛋白的产生和酶促加工,并且可显著增加由单个启动子驱动的多肽的产量。
用于转化的载体将通常包含用于识别转化子的选择性标记。在细菌系统中,这可包括抗生素抗性基因,例如氨苄青霉素或卡那霉素。用于培养的哺乳动物细胞的选择性标记包括赋予对药物例如新霉素、潮霉素和甲氨蝶呤抗性的基因。选择性标记可以是可扩增的选择性标记。一个可扩增的选择性标记是二氢叶酸还原酶(DHFR)基因。Simonsen C C等(1983)Proc Natl Acad Sci USA 80:2495-9。选择性标记在Thilly(1986)Mammalian CellTechnology,Butterworth Publishers,Stoneham,Mass.中有所评述,并且选择性标记的选择在本领域的普通技术人员的水平内。
选择性标记可在单独的质粒上与所关注的基因同时引入细胞,或它们可在相同的质粒上引入。如果在相同的质粒上,选择性标记和所关注的基因可在不同启动子或相同启动子的控制下,后一个排列产生双顺反子信息。该类型的构建体是本领域已知的(例如,美国专利号4,713,339)。
表达载体可编码允许易于纯化重组产生的蛋白质的标签。实例包括但不限于:载体pUR278(Ruther等(1983)EMBO J 2:1791),其中要表达的蛋白质的编码序列可连接至载体的lac z编码区框内,以生成标签融合蛋白;pGEX载体可用于表达本发明的具有谷胱甘肽S-转移酶(GST)标签的蛋白质。这些蛋白质通常是可溶性的,并且可通过吸附到谷胱甘肽-琼脂糖珠粒,然后在谷胱甘肽存在下洗脱而轻松地从细胞纯化。载体包括纯化后易于移除标签的切割位点(凝血酶或因子Xa蛋白酶或PRESCISSION PROTEASETM(Pharmacia,Peapack,N.J.))。
然后,表达载体转染或共转染至合适的靶细胞,该靶细胞表达多肽。本领域已知的转染技术包括但不限于:磷酸钙沉淀(Wigler等(1978)Cell 14:725)、电穿孔(Neumann等(1982)EMBO J 1:841)和基于脂质体的试剂。可使用多种宿主表达载体系统表达本文所述的蛋白质,包括原核和真核细胞二者。这些包括但不限于:微生物例如转化有包含适当编码序列的重组噬菌体DNA或质粒DNA表达载体的细菌(如,大肠杆菌);转化有包含适当编码序列的重组酵母或真菌表达载体的酵母或丝状真菌;转染有包含适当编码序列的重组病毒表达载体(如,杆状病毒)的昆虫细胞系统;转染有重组病毒表达载体(如,花椰菜花叶病毒或烟草花叶病毒)或转化有包含适当编码序列的重组质粒表达载体(如,Ti质粒)的植物细胞系统;或动物细胞系统,包括哺乳动物细胞(如,HEK 293、CHO、Cos、HeLa、HKB11和BHK细胞)。
在一个实施方案中,宿主细胞是真核细胞。如本文所用,真核细胞是指具有明确细胞核的任何动物或植物细胞。动物的真核细胞包括脊椎动物如哺乳动物细胞和无脊椎动物如昆虫的细胞。植物的真核细胞可特别地包括但不限于酵母细胞。真核细胞不同于原核细胞,如细菌。
在某些实施方案中,真核细胞是哺乳动物细胞。哺乳动物细胞是来源于哺乳动物的任何细胞。哺乳动物细胞特别地包括但不限于哺乳动物细胞系。在一个实施方案中,哺乳动物细胞是人细胞。在另一个实施方案中,哺乳动物细胞是HEK 293细胞,它是人胚肾细胞系。HEK 293细胞以CRL-1533得自美国菌种保藏中心(American Type CultureCollection,Manassas,VA),以及以293-H细胞(目录号11631-017)或293-F细胞(目录号11625-019)得自Invitrogen(Carlsbad,Calif.)。在一些实施方案中,哺乳动物细胞是
Figure BDA0002313018640000871
细胞,它是来源于视网膜的人细胞系。
Figure BDA0002313018640000872
细胞得自Crucell(Leiden,TheNetherlands)。在其它实施方案中,哺乳动物细胞是中国仓鼠卵巢(CHO)细胞。CHO细胞得自美国菌种保藏中心(American Type Culture Collection,Manassas,VA.)(如,CHO-K1、CCL-61)。在其它实施方案中,哺乳动物细胞是幼仓鼠肾(BHK)细胞。BHK细胞得自美国菌种保藏中心(American Type Culture Collection,Manassas,Va.)(如,CRL-1632)。在一些实施方案中,哺乳动物细胞是HKB11细胞,它是HEK 293细胞和人B细胞系的杂合细胞系。Mei等,Mol.Biotechnol.34(2):165-78(2006)。
在一个实施方案中,编码本发明的VWF片段或嵌合蛋白的质粒还包括选择性标记,如zeocin抗性,并且转染至HEK 293细胞,用于纯化VWF片段或嵌合蛋白。
在另一个实施方案中,将包含因子VIII-Fc融合编码序列和第一选择性标记如zeocin抗性基因的第一质粒和包含VWF片段-Fc编码序列和第二选择性标记如新霉素抗性基因的第二质粒共转染至HEK 293细胞,用于纯化因子VIII-Fc和VWF-Fc杂合物。第一和第二质粒可等量(即,1:1比例)引入,或它们可不等量引入。
在一些实施方案中,包括因子VIII-Fc融合编码序列和第一选择性标记如zeocin抗性基因的第一质粒和包括VWF片段-Fc编码序列和第二选择性标记如新霉素抗性基因的第二质粒以及包括蛋白质转化酶编码序列(如,PC5或弗林蛋白酶)和第三选择性标记如潮霉素抗性基因的第三质粒共转染至HEK 293细胞,用于纯化因子VIII-VWF片段杂合物。第一和第二质粒可等量(即,1:1摩尔比)引入,或它们可不等量引入。在某些实施方案中,包括因子VIII-Fc融合编码序列、VWF片段-Fc编码序列和第一选择性标记如zeocin抗性基因的第一质粒和包括蛋白质转化酶编码序列(如,PC5或弗林蛋白酶)和第二选择性标记如潮霉素抗性基因的第二质粒共转染至HEK 293细胞,用于纯化因子VIII-VWF片段杂合物。在一个实施方案中,编码FVIII-Fc序列和VWF片段-Fc序列的核苷酸序列可连接,以编码一个单条多肽。在另一个实施方案中,编码FVIII-Fc序列和VWF片段-Fc序列的核苷酸序列可编码为两条多肽链。因子VIII-Fc融合编码序列和VWF片段-Fc编码序列的启动子可以是不同的,或它们可以是相同的。
在一些实施方案中,包含弗林蛋白酶的质粒与包含因子VIII-Fc编码序列和/或VWF片段-Fc编码序列的质粒共转染。在一些实施方案中,弗林蛋白酶蛋白质在包含因子VIII-Fc融合编码序列的相同质粒上。在一些实施方案中,弗林蛋白酶蛋白质在包含VWF片段-Fc编码序列的相同质粒上。在一些实施方案中,弗林蛋白酶蛋白质在单独的质粒上。
在其它实施方案中,转染细胞是稳定转染的。可使用本领域技术人员已知的常规技术选择这些细胞并保持为稳定的细胞系。
使包含蛋白质的DNA构建体的宿主细胞在适当的生长培养基中生长。如本文所用,术语“适当的生长培养基”意指包含细胞生长所需的营养物质的培养基。细胞生长所需的营养物质可包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。任选地,培养基可包含一种或多种选择因子。任选地,培养基可包含牛血清或胎牛血清(FCS)。在一个实施方案中,培养基基本上不包含IgG。生长培养基将通常通过例如药物选择或必需营养物质的缺失来选择包含DNA构建体的细胞,所述缺失被DNA构建体上的选择性标记补充或用DNA构建体共转染。培养的哺乳动物细胞通常在市售含血清或无血清培养基(如,MEM、DMEM、DMEM/F12)中生长。在一个实施方案中,培养基是CD293(Invitrogen,Carlsbad,CA.)。在另一个实施方案中,培养基是CD17(Invitrogen,Carlsbad,CA.)。适于所用的具体细胞系的培养基的选择在本领域的普通技术人员的水平内。
为了共表达VWF片段和第二异源部分或FVIII蛋白,将宿主细胞在允许VWF片段和第二异源部分或FVIII蛋白二者表达的条件下培养。如本文所用,培养是指在体外保持活细胞至少一定的时间。保持可以是但不必包括活细胞群的增加。例如,保持在培养物中的细胞在群中可以是静止的,但仍然是活的,并且能够生成所需的产物,如重组蛋白或重组融合蛋白。用于培养真核细胞的合适条件是本领域熟知的,并且包括培养基、培养基补充剂、温度、pH、氧饱和度等的适当选择。出于商业目的,培养可包括使用各种类型的放大系统中的任何一种,包括摇瓶、滚瓶、中空纤维生物反应器、搅拌槽生物反应器、气升式生物反应器、Wave生物反应器等。
也可选择细胞培养条件以允许VWF片段与第二异源部分或FVIII蛋白缔合。允许VWF片段和/或FVIII蛋白表达的条件可包括存在维生素K源。例如,在一个实施方案中,将稳定转染的HEK 293细胞在补充有4mM谷氨酰胺的CD293培养基(Invitrogen,Carlsbad,CA)或OptiCHO培养基(Invitrogen,Carlsbad,CA)中培养。
在一个方面,本发明涉及表达、制备或生成本发明的VWF片段的方法,其包括a)用编码VWF片段的多核苷酸转染宿主细胞,以及b)在培养基中适于表达VWF片段的条件下培养宿主细胞,其中VWF片段得以表达。在一个实施方案中,本发明涉及生成成熟VWF蛋白或其片段的方法,其包括a)用编码融合至VWF的原肽的VWF蛋白或其片段的第一多核苷酸和编码蛋白质转化酶如PC5、PC7或弗林蛋白酶的第二多核苷酸转染宿主细胞,以及b)在培养基中适于表达成熟VWF蛋白或其片段的条件下培养宿主细胞。编码VWF蛋白或其片段的多核苷酸也可融合至VWF的前肽。前肽序列可在分泌前插入内质网期间被切割。
在另一个方面,本发明涉及表达、制备或生成包含连接至异源部分或FVIII蛋白或与之缔合的VWF片段的嵌合蛋白的方法,其包括a)用编码嵌合蛋白的多核苷酸或多核苷酸组转染一个或多个宿主细,胞以及b)在培养基中适于表达嵌合蛋白的条件下培养宿主细胞。在一个实施方案中,本发明涉及表达、制备或生成嵌合蛋白的方法,其包括a)用编码连接至异源部分的VWF片段的第一多核苷酸和编码连接至异源部分的FVIII蛋白的第二多核苷酸转染宿主细胞,以及b)在培养基中适于表达嵌合蛋白的条件下培养宿主细胞。第一多核苷酸和第二多核苷酸可在一个载体或两个载体中。在另一个实施方案中,本发明涉及表达、制备或生成嵌合蛋白的方法,其包括a)用编码连接至异源部分的VWF片段的第一多核苷酸、编码连接至异源部分的FVIII蛋白的第二多核苷酸以及编码蛋白质转化酶的第三多核苷酸转染宿主细胞,以及b)在培养基中适于表达嵌合蛋白的条件下培养宿主细胞。在其它实施方案中,本发明涉及表达、制备或生成嵌合蛋白的方法,其包括a)用编码包含连接至异源部分的D'结构域和D3结构域的VWF片段的第一多核苷酸、编码连接至异源部分的FVIII蛋白的第二多核苷酸以及编码VWF的D1结构域和D2结构域的第三多核苷酸转染宿主细胞,以及b)在培养基中适于表达嵌合蛋白的条件下培养宿主细胞。在一个实施方案中,第一多核苷酸、第二多核苷酸和第三多核苷酸可在一个载体或单独的载体中。在另一个实施方案中,第一多核苷酸和第二多核苷酸可在一个载体中,并且第三多核苷酸可在另一个载体中。在其它实施方案中,第一多核苷酸和第三多核苷酸可在一个载体中,并且第二多核苷酸可在另一个载体中。在一些实施方案中,第二多核苷酸和第三多核苷酸可在一个载体中,并且第一多核苷酸可在另一个载体中。
在另外的实施方案中,包含VWF片段的蛋白质产物或包含VWF片段的嵌合蛋白分泌至培养基。培养基从细胞分离、浓缩、过滤,并且然后通过两个或三个亲合柱如蛋白A柱和一个或两个阴离子交换柱。
在某些方面,本发明涉及由本文所述的方法制备的VWF片段或嵌合多肽。
体外制备允许放大得到大量所需的本发明改变的多肽。在组织培养条件下培养哺乳动物细胞的技术是本领域已知的,并且包括均匀悬浮培养,如在气升式反应器或连续搅拌反应器中,或固定化或包埋细胞培养,如在中空纤维、微胶囊中、琼脂糖微珠粒或陶瓷料筒上。如有必要和/或需要,可通过常规色谱法,例如凝胶过滤、离子交换色谱法、疏水相互作用色谱法(HIC、DEAE-纤维素色谱法或亲合色谱法纯化多肽的溶液。
药物组合物
包含VWF片段或本发明的嵌合蛋白的组合物可包含合适的可药用载体。例如,它们可包含促进活性化合物加工为制剂的赋形剂和/或辅助剂,所述制剂设计用于递送至作用位点。
药物组合物可配制为通过弹丸式注射(bolus injection)肠胃外施用(即,静脉内、皮下或肌肉内)。注射制剂可以单位剂型存在,如在添加防腐剂的安瓿瓶或多剂量容器中。组合物可采取例如悬浮液、溶液或油性或水性媒介物中的乳液的形式,并且包含配制剂,例如悬浮、稳定和/或分散剂。或者,活性成分可以是用合适的媒介物如无热原水配制的粉末形式。
合适的肠胃外施用制剂还包括水溶性形式的活性化合物例如水溶性盐的水溶液。此外,可施用活性化合物的悬浮液,作为适当的油性注射悬浮液。合适的亲脂性的溶剂或媒介物包括脂油例如芝蔴油或合成脂肪酸酯例如油酸乙酯或三酸甘油酯。水性注射悬浮液可包含增加悬浮液的粘度的物质,包括例如羧甲基纤维素钠、山梨糖醇和葡聚糖。任选地,悬浮液还可包含稳定剂。脂质体也可用于包封本发明的分子,用于递送至细胞或组织间隙。示例性可药用载体是生理相容性溶剂、分散介质、涂料、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、水、盐水、磷酸盐缓冲盐水、右旋糖、甘油、乙醇等。在一些实施方案中,组合物包含等渗剂,例如糖、多元醇例如甘露糖醇、山梨糖醇或氯化钠。在其它实施方案中,组合物包含可药用物质,例如润湿剂或微量辅助性物质例如润湿或乳化剂、防腐剂或缓冲剂,它们提高了活性成分的储存寿命或有效性。
本发明的组合物可具有各种形式,包括例如液体(如,可注射的和不可灌注的溶液)、分散体、悬浮液、半固体和固体剂型。优选的形式取决于施用和治疗应用模式。
组合物可配制为溶液、微乳液、分散体、脂质体或其它适于高药物浓度的有序结构。无菌注射溶液可通过将所需量溶于适当溶剂的活性成分掺入上面列举的一种成分或成分的组合(根据需要),然后过滤除菌来制备。一般来讲,分散体通过将活性成分掺入包含基本分散介质和所需的上面列举的其它成分的无菌媒介物来制备。就用于制备无菌注射溶液的无菌粉末而言,优选的制备方法是真空干燥和冷冻干燥,产生活性成分加上预先无菌过滤溶液的任何另外所需成分的粉末。可以例如通过使用涂料例如卵磷脂,就分散体而言通过保持所需的粒度以及通过使用表面活性剂来保持溶液的适当流动性。可通过将吸收延迟剂例如单硬脂酸盐和明胶包括于组合物中而产生注射组合物的长期吸收。
活性成分可用控释制剂或装置配制。此类制剂和装置的实例包括植入物、透皮贴剂和微包封递送系统。可使用生物可降解的生物相容性聚合物,例如乙烯-醋酸乙烯酯、聚酸酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。制备此类制剂和装置的方法是本领域已知的。参见例如Sustained and Controlled Release Drug Delivery Systems,J.R.Robinson,编著,Marcel Dekker,Inc.,New York,1978。
注射储存制剂可通过在生物可降解聚合物例如聚交酯-聚乙交酯中形成药物的微包封基质来制备。取决于药物与聚合物的比率以及所用的聚合物的性质,可控制药物释放速率。其它示例性生物可降解聚合物为聚原酸酯和聚酸酐。储存注射制剂也可通过将药物包封于脂质体或微乳液中来制备。
补充活性化合物可掺入组合物中。在一个实施方案中,本发明的VWF片段或嵌合蛋白与另一种凝血因子或其变体、片段、类似物或衍生物一起配制。例如,凝血因子包括但不限于:因子V、因子VII、因子VIII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原、血纤维蛋白原、血管性血友病因子或重组可溶性组织因子(rsTF)或任何上述的活性形式。止血剂的凝血因子也可包括抗纤溶药物,如ε-氨基己酸、氨甲环酸。
可调整给药方案以提供最佳所需响应。例如,可施用单次推注,可随时间推移施用多个分剂量,或可根据治疗情况紧急性指示按比例减少或增加剂量。出于易于施用和剂量均匀的目的,以单位剂型配制肠胃外组合物是有利的。参见例如Remington'sPharmaceutical Sciences(Mack Pub.Co.,Easton,Pa.1980)。
除活性化合物之外,液体剂型可包含惰性成分,例如水、乙醇、碳酸乙酯、乙酸乙酯、苄醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油、甘油、四氢糠醇、聚乙二醇和脱水山梨糖醇的脂肪酸酯。
合适的药用载体的非限制性实例还在E.W.Martin的Remington'sPharmaceutical Sciences中有所描述。赋形剂的一些实例包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙烯、乙二醇、水、乙醇等。组合物也可包含pH缓冲剂和润湿或乳化剂。
对于口服施用,药物组合物可采取通过常规方式制备的片剂或胶囊剂的形式。组合物也可以液体例如糖浆或悬浮液制备。液体可包括悬浮剂(如,山梨糖醇糖浆、纤维素衍生物或氢化食用脂)、乳化剂(卵磷脂或阿拉伯树胶)、非水性媒介物(如,杏仁油、油酯、乙醇或分馏植物油)和防腐剂(如,对羟基苯甲酸甲酯或丙酯或山梨酸甲)。制剂也可包括调味剂、着色剂和甜味剂。或者,组合物可以通过水或另一种合适的媒介物配制的干燥产品存在。
对于口腔含化施用,组合物可采取根据常规方案的片剂或锭剂的形式。
对于通过吸入施用,根据本发明使用的化合物以含或不含赋形剂的雾化气雾剂的形式或来自加压包或喷雾器的气雾喷剂的形式,任选地与推进剂如二氟二氯甲烷、一氟三氯甲烷、四氟二氯甲烷、二氧化碳或其它合适的气体一起便利地递送。就加压气雾剂而言,剂量单位可通过提供递送定量的阀门确定。用于吸入器或吹药器的例如明胶的胶囊剂和料筒可配制为包含化合物的粉末混合物和合适的粉末基料例如乳糖或淀粉。
药物组合物也可配制为用于直肠施用的栓剂或保留灌肠剂,如包含常规栓剂基料例如可可油或其它甘油酯。
基因治疗
本发明的VWF片段或其嵌合蛋白可在哺乳动物如人患者体内生成,使用基因治疗方法治疗选自由以下组成的组的出血性疾病或病症:出血性凝血障碍、关节出血症、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、头部创伤、胃肠出血、颅内溢血、腹腔内溢血、胸腔溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血以及髂腰肌鞘出血将有有益的治疗效果。在一个实施方案中,出血性疾病或病症是血友病。在另一个实施方案中,出血性疾病或病症是甲型血友病。这涉及可操作地连接至合适的表达控制序列的合适的VWF片段或嵌合蛋白编码核酸的施用。在某些实施方案中,这些序列掺入病毒载体。此类基因治疗的合适病毒载体包括腺病毒载体、慢病毒载体、杆状病毒载体、爱泼斯坦-巴尔病毒载体、乳头多瘤空泡病毒载体、牛痘病毒载体、单纯疱疹病毒载体和腺相关病毒(AAV)载体。病毒载体可以是复制缺陷型病毒载体。在其它实施方案中,腺病毒载体具有其E1基因或E3基因的缺失。当使用腺病毒载体时,哺乳动物可以不暴露至编码选择性标记基因的核酸。在其它实施方案中,序列掺入本领域技术人员已知的非病毒载体。
VWF片段或嵌合蛋白的使用方法
本发明的一个方面涉及通过阻断或屏蔽内源性VWF结合FVIII上的VWF结合位点来阻止或抑制FVIII与内源性VWF的相互作用。在一个实施方案中,本发明涉及构建半衰期长于野生型FVIII或FVIII单体-二聚体杂合物的FVIII蛋白的方法,所述方法包括使辅助部分与FVIII蛋白共价缔合,从而生成包含FVIII蛋白和辅助部分的嵌合蛋白,其中辅助部分屏蔽或抑制FVIII蛋白与内源性VWF的相互作用。用于该方法的嵌合蛋白包括本文所述的任何一种或多种嵌合蛋白。
本发明的另一个方面包括给需要其的受试者施用半衰期长于野生型FVIII或FVIII单体-二聚体杂合物的FVIII蛋白的方法,所述FVIII蛋白由两条多肽链组成,第一链由编码FVIII和Fc区的氨基酸序列组成,并且第二链由Fc区组成,其中所述方法包括给受试者施用本文所述的VWF片段或本文所述的嵌合蛋白。单体-二聚体杂合物中的FVIII氨基酸序列可以是SQ FVIII或野生型FVIII。
在一个实施方案中,本发明涉及使用辅助部分,如本文所述的VWF片段或包含VWF片段的嵌合蛋白阻止或抑制内源性VWF与FVIII蛋白相互作用的方法。在另一个实施方案中,能够与VWF片段相互作用的FVIII蛋白是内源性FVIII。在其它实施方案中,能够与VWF片段相互作用的FVIII蛋白是FVIII组合物,其在之前或之后独立地施用给受试者或与VWF片段或包含VWF片段的嵌合蛋白同时施用给受试者。在其它实施方案中,能够结合至VWF片段的FVIII蛋白是FVIII组合物,其与VWF片段或嵌合蛋白一起施用给受试者。在其它实施方案中,能够结合至VWF片段的FVIII蛋白是与VWF片段一起存在或与嵌合蛋白中的VWF片段缔合的FVIII。VWF片段或包含VWF片段的嵌合蛋白连接至FVIII蛋白或与之缔合,从而延长结合至VWF片段或嵌合蛋白的FVIII蛋白的半衰期。结合至VWF片段或嵌合蛋白的FVIII蛋白被屏蔽或保护不被从VWF的清除途径清除,并且因此与未结合至VWF片段或嵌合蛋白的FVIII蛋白相比清除减少。因此,屏蔽的FVIII蛋白具有比未连接至VWF片段或嵌合蛋白或与之缔合的FVIII蛋白更长的半衰期。在某些实施方案中,与本发明的VWF片段或嵌合蛋白缔合或受其保护的FVIII蛋白不被VWF清除受体清除。在其它实施方案中,与VWF片段或嵌合蛋白缔合或受其保护的FVIII蛋白从系统清除速度慢于不与VWF片段缔合或不受其保护的FVIII蛋白。
在一个方面,本发明的VWF片段或包含其的嵌合蛋白与不包含VWF清除受体结合位点的VWF片段或嵌合蛋白相比,减少了从循环的清除。VWF片段阻止或抑制通过VWF清除途径从系统清除连接至VWF片段或与之缔合的FVIII。用于本发明的VWF片段还可提供由内源性VWF提供的至少一种或多种VWF样FVIII保护特性。在某些实施方案中,VWF片段还可掩蔽一个或多个FVIII清除受体结合位点,从而阻止FVIII被其自身清除途径清除。
在另一个方面,本发明的VWF片段或嵌合蛋白可用于治疗或阻止与2N型血管性血友病(VWD)相关的疾病或病症。2N型VWD是由结合FVIII的缺陷型VWF导致的定性VWF缺陷,并且从而导致循环FVIII的低水平。因此,本发明的VWF片段或嵌合蛋白通过结合至FVIII蛋白或被其结合不仅稳定了FVIII蛋白,而且阻止了FVIII蛋白从循环的清除。
在一些实施方案中,通过VWF片段或嵌合蛋白防止或抑制FVIII蛋白结合内源性VWF可以是体外的或体内的。
还提供了增加FVIII蛋白的半衰期的方法,其包括给需要其的受试者施用包含VWF片段和FVIII蛋白的VWF片段或嵌合蛋白。结合至全长VWF或与之缔合的非活化FVIII在血浆中的半衰期为约12至14小时。在其中循环中几乎不存在VWF的3型VWD中,FVIII的半衰期仅为约六小时,导致由于FVIII浓度的降低此类患者中存在轻度至中度甲型血友病症状。与结合至全长VWF或与之缔合的非活化FVIII的半衰期相比,连接至本发明的VWF片段或与之缔合的FVIII蛋白的半衰期可增加至少约1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍或4.0倍。在一个实施方案中,与结合至全长VWF或与之缔合的非活化FVIII的半衰期相比,连接至嵌合蛋白中VWF片段或与之缔合的FVIII蛋白的半衰期增加至少约2倍、2.5倍、3.0倍、3.5倍、4.0倍、4.5倍、5.0倍、5.5倍、6.0倍、7倍、8倍、9倍或10倍。在另一个实施方案中,与结合至全长VWF或与之缔合的非活化FVIII的半衰期相比,连接至嵌合蛋白中VWF片段或与之缔合的FVIII蛋白的半衰期增加约2至约5倍、约3至约10倍、约5至约15倍、约10至约20倍、约15至约25倍、约20至约30倍、约25至约35倍、约30至约40倍、约35至约45倍。在具体实施方案中,与FVIII和VWF双敲除小鼠中野生型FVIII的半衰期相比,连接至嵌合蛋白中VWF片段或与之缔合的FVIII蛋白的半衰期增加至少约30倍、31倍、32倍、33倍、34倍、35倍、36倍、37倍、38倍、39倍或40倍。在一些实施方案中,包含融合至第一异源部分如第一Fc区的VWF片段和连接至第二异源部分如第二Fc区的FVIII蛋白的嵌合蛋白的半衰期长于包含FVIII蛋白和两个Fc区的嵌合蛋白的半衰期,其中FVIII蛋白连接至两个Fc区中的一者(即,FVIII单体-二聚体杂合物)。在其它实施方案中,包含融合至第一异源部分如第一Fc区的VWF片段和连接至第二异源部分如第二Fc区的FVIII蛋白的嵌合蛋白的半衰期是包含FVIII蛋白和两个Fc区的嵌合蛋白的半衰期的至少约1.5倍、2倍、2.5倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4.0倍、4.5倍或5.0倍,其中FVIII蛋白连接至两个Fc区中的一者(即,FVIII单体-二聚体杂合物)。
在一些实施方案中,作为本发明的结果,与无VWF片段的FVIII蛋白或野生型FVIII相比,FVIII蛋白的半衰期延长。FVIII蛋白的半衰期比无VWF片段的FVIII蛋白的半衰期长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。在一个实施方案中,FVIII的半衰期比野生型FVIII的半衰期长约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍至约10倍。在另一个实施方案中,与野生型FVIII或无VWF片段的FVIII蛋白相比,FVIII的半衰期延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。在其它实施方案中,FVIII的半衰期为至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。在其它实施方案中,FVIII的半衰期为约15小时至约两周、约16小时至约一周、约17小时至约一周、约18小时至约一周、约19小时至约一周、约20小时至约一周、约21小时至约一周、约22小时至约一周、约23小时至约一周、约24小时至约一周、约36小时至约一周、约48小时至约一周、约60小时至约一周、约24小时至约六天、约24小时至约五天、约24小时至约四天、约24小时至约三天或约24小时至约两天。
在一些实施方案中,每个受试者的FVIII蛋白的平均半衰期为约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约六天、约七天(一周)、约八天、约九天、约10天、约11天、约12天、约13天或约14天。
在具体实施方案中,本发明的嵌合蛋白的半衰期比野生型FVIII或BDD FVIII的半衰期长约两倍。在另一个实施方案中,嵌合蛋白的半衰期比野生型FVIII或BDD FVIII的半衰期长约三倍。
此外,本发明提供治疗或阻止出血性疾病或病症的方法,其包括施用有效量的VWF片段或嵌合蛋白(如,包含连接至第一异源部分如第一Fc区的VWF片段和连接至第二异源部分如第二Fc区的FVIII蛋白的嵌合蛋白,其中VWF片段结合至FVIII蛋白或与之缔合)。在一个实施方案中,出血性疾病或病症选自由以下组成的组:出血性凝血障碍、关节出血症、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、头部创伤、胃肠出血、颅内溢血、腹腔内溢血、胸腔溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血以及髂腰肌鞘出血。在具体实施方案中,出血性疾病或病症是甲型血友病。
如本领域技术人员所认识,VWF片段和包含辅助部分的嵌合蛋白,如本文所述的VWF片段和本发明制备的FVIII蛋白有多种用途,包括但不限于治疗患有止血病症的受试者的方法和治疗需要一般止血剂的受试者的方法。在一个实施方案中,本发明涉及治疗患有止血病症的受试者的方法,其包括施用治疗有效量的VWF片段或嵌合蛋白。
嵌合蛋白中的FVIII蛋白部分通过作为带负电的磷脂表面上的因子IX的辅因子,从而形成因子X酶复合物来治疗或抑制止血病症。活化的凝血因子结合至磷脂表面将该过程定位至血管受损部位。在磷脂表面上,因子VIIIa通过因子IXa增加因子X活化的最大速度大约200,000倍,从而导致第二次大量生成凝血酶。
包含辅助部分如VWF片段和FVIII蛋白的嵌合蛋白可用于治疗任何止血病症。可通过施用本发明的嵌合蛋白治疗的止血病症包括但不限于甲型血友病,以及因子VIII相关的缺陷或结构异常。在一个实施方案中,止血病症是甲型血友病。
包含辅助部分VWF片段和FVIII蛋白的嵌合蛋白可用于预防性治疗患有止血病症的受试者。本发明的嵌合蛋白可用于治疗患有止血病症的受试者的急性出血发作。在另一个实施方案中,止血病症可以是凝血因子如血管性血友病因子缺陷的结果。在一个实施方案中,止血病症是遗传性病症。在另一个实施方案中,止血病症是获得性病症。获得性病症可以是由潜在的继发性疾病或病状引起的。不相关病状可以是例如但不限于癌症、自身免疫疾病或妊娠。获得性病症可以是由年老或治疗潜在的继发性病症的药物治疗(如,癌症化学疗法)引起的。
本发明还涉及治疗不患有先天性止血病症,但患有继发性疾病或病状的受试者的方法,所述继发性疾病或病状导致获得止血病症,如由于抗FVIII抗体的发展或治疗。因此,本发明涉及治疗需要一般止血剂的受试者的方法,其包括施用治疗有效量的通过本发明方法制备的包含VWF片段和FVIII蛋白的嵌合蛋白。
本发明还涉及减小FVIII的免疫原性或诱导对FVIII的免疫原性减小的方法,其包括施用有效量的VWF片段、本文所述的嵌合蛋白或编码其的多核苷酸。
在一个实施方案中,需要一般止血剂的受试者正在经历或将要经历外科手术。包含VWF片段和FVIII蛋白的嵌合蛋白可在作为预防性方案的手术之前、期间或之后施用。包含VWF片段和FVIII蛋白的嵌合蛋白可在控制急性出血发作的手术之前、期间或之后施用。
包含VWF片段和FVIII蛋白的嵌合蛋白可用于治疗不患有止血病症的受试者的急性出血发作。急性出血发作可以是严重的创伤,如手术、车祸、伤害、枪击裂伤或导致出血无法控制的任何其它创伤事件引起的。出血发作的非限制性实例包括:出血性凝血障碍、关节出血症、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、头部创伤、胃肠出血、颅内溢血、腹腔内溢血、胸腔溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血以及它们的任何组合。
在预防性应用中,将包含本发明的嵌合蛋白或VWF片段或其混合物的一种或多种组合物施用给不处于疾病状态的患者,以增强患者的抵抗力或减少疾病或病症相关的症状。此量定义为“预防有效剂量”。在治疗应用中,在相对较短的间隔内相对较高的剂量(如,从约1至400mg/kg多肽/剂,其中从5至25mg的剂量更常用于放射性免疫缀合物,并且高剂量用于细胞毒素药物修饰的多肽)有时是必须的,直到疾病的进展减少或停止,并且直到患者显示出疾病症状的部分或完全改善。然后,患者可施用预防性方案。
在一些实施方案中,本发明的嵌合蛋白、VWF片段或组合物用于按需治疗,其包括治疗出血发作、关节出血症、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、头部创伤(头部外伤)、胃肠出血、颅内溢血、腹腔内溢血、胸腔溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血或髂腰肌鞘出血。受试者可需要手术预防、围手术期处理或手术治疗。此类手术包括如小手术、大手术、拔牙术、扁桃体切除术、腹股沟疝切开术、滑膜切除术、全膝关节置换术、颅骨切开术、骨缝合术、创伤手术、颅内手术、腹腔内手术、胸内手术或关节置换术。
在一个实施方案中,包含VWF片段和FVIII蛋白的嵌合蛋白静脉内、皮下、肌肉内或通过任何粘膜表面,如口服、舌下、口腔含化、鼻腔、直肠、阴道或通过肺部途径施用。包含VWF片段和FVIII蛋白的嵌合蛋白可植入或连接至生物聚合物固相支持物,所述生物聚合物固相支持物允许嵌合蛋白缓慢释放至出血部位或植入绷带/敷料。包含VWF片段和FVIII蛋白的嵌合蛋白的剂量根据受试者和所用的具体施用途径变化。剂量可在0.1至100,000μg/kg体重的范围内。在一个实施方案中,剂量范围为0.1-1,000μg/kg。在另一个实施方案中,剂量范围为0.1-500μg/kg。蛋白质可连续或以具体时间间隔施用。体外测定可用于确定最佳剂量范围和/或施用方案。测量凝血因子活性的体外测定是本领域已知的,如STA-CLOTVIIa-rTF凝血测定或ROTEM凝血测定。另外,有效剂量可从得自动物模型如血友病狗的剂量响应曲线推断(Mount等2002,Blood 99(8):2670)。
现在对本发明进行了详细描述,通过参考下面的实施例将更清晰地理解本发明,这些实施例据此仅出于示例性目的纳入,并且并非意图对本发明进行限制。本文引用的所有专利和公布明确地以引用方式并入。
实施例
在全部实施例中,使用以下材料和方法,除非另外指明。
材料和方法
一般来讲,除非另外指明,本发明的实施采用化学、生物物理学、分子生物学、重组DNA技术、免疫学(尤其是例如抗体技术)和标准电泳技术的常规技术。参见例如Sambrook,Fritsch和Maniatis,Molecular Cloning:Cold Spring Harbor Laboratory Press(1989);Antibody Engineering Protocols(Methods in Molecular Biology),510,Paul,S.,Humana Pr(1996);Antibody Engineering:A Practical Approach(PracticalApproach Series,169),McCafferty,编著,Irl Pr(1996);Antibodies:A LaboratoryManual,Harlow等,CS.H.L.Press,Pub.(1999);和Current Protocols in MolecularBiology,Ausubel等编著,John Wiley&Sons(1992)。
实施例1:克隆不同的VWF结构域(图1)
(a)克隆pSYN-VWF-001、002、003和004
pSYN-VWF-001至004包含编码VWF片段的核苷酸序列,它们是VWF-D’D3A蛋白质序列的第1-276位氨基酸(001)、第1-477位氨基酸(002)、第1-511位氨基酸(003)和第1-716位氨基酸(004)。氨基酸编号表示无原肽的成熟VWF序列,并且分别对应于SEQ ID NO:2的第764-1039位氨基酸(001)、第764-1240位氨基酸(002)、第764-1274位氨基酸(003)和第764-1479位氨基酸(004)。所有四个构建体在N-末端具有FVIII信号肽,其允许合成蛋白质的正确分泌,FVIII信号肽后面是用于蛋白质纯化的C-末端6×His标签。上述构建体通过使用如下引物组合合成:
pSYN VWF-001:
具有VIII信号和BsiW1位点的ESC48-Fwd-VWF-D'D3
Figure BDA0002313018640000981
具有6个His和Not1位点的ESC50-Rev-VWF-部分D'D3(第1-276位氨基酸)
Figure BDA0002313018640000991
pSYN VWF-002:
具有VIII信号和BsiW1位点的ESC48-Fwd-VWF-D'D3
Figure BDA0002313018640000992
具有6个His和Not1位点的ESC51-Rev-VWF D'D3(第1-477位氨基酸)
Figure BDA0002313018640000993
pSYN VWF-003:
具有VIII信号和BsiW1位点的ESC48-Fwd-VWF-D'D3
Figure BDA0002313018640000994
具有6个His和Not1位点的ESC52-Rev-VWF-D'D3部分A1(第1-511位氨基酸)
Figure BDA0002313018640000995
pSYN VWF-004:
具有VIII信号和BsiW1位点的ESC48-Fwd-VWF-D'D3
Figure BDA0002313018640000996
具有6个His和Not1位点的ESC53-Rev-VWF-D'D3A1(第1-716位氨基酸)
Figure BDA0002313018640000997
假设来自VWF-001、002、003和004构建体的蛋白质以单体存在。
50μl PCR反应使用ESC48/ESC50、ESC48/ESC51、ESC48/ESC52、ESC48/ESC53引物组合和全长VWF质粒作为模板进行,使用2步PCR扩增循环:94℃2分钟;21个(96℃30秒,68℃2分钟)循环。正确大小条带(VWF 001为约960bp、VWF 002为1460bp、VWF 003为1520bp以及VWF 004为2150bp)通过凝胶提取试剂盒(Gel Extraction kit)(Qiagen,Valencia,Calif.)进行凝胶纯化,并克隆至pcDNA 4的BsiWI和Not1限制性酶切位点,以分别生成pSYN-VWF 001、002、003和004。
(b)克隆pSYN-VWF-006
pSYN-VWF-006包含VWF的D1D2D’D3-CK(半胱氨酸结)结构域。为克隆该构建体,包含一部分D3结构域和CK结构域的DNA片段的合成外包进行(Genscript-序列标识号122026,如下所示)。将Genscript构建体的片段亚克隆至BamH1/EcoRV消化的pSYN-VWF008,即编码全长VWF的载体。
Genscript-序列号-122026(SEQ ID NO:65)
Figure BDA0002313018640001001
(c)克隆pSYN-VWF-009、010、011、012和013
pSYN VWF 008构建体包含pcDNA 3.1中的全长VWF序列(SEQ ID NO:2的第1-2813位氨基酸)。其包括763个氨基酸的原肽(即,D1D2结构域),然后是其余的2050个氨基酸成熟VWF序列。pSYN-VWF-009、010、011和012包含分别与VWF 001、002、003和004相同的编码序列,但还具有N-末端的D1D2结构域(VWF原肽),而不是FVIII信号肽。pSYN-VWF-008具有Arg907处的BamH1位点和编码区末端(在终止密码子之后)的Not1位点。pSYN-VWF-008、001、002、003和004用BamH1和Not1限制性内切酶消化。来自pSYN-VWF-001(423bp)、pSYN-VWF-002(1026bp)、pSYN-VWF-003(1128bp)和pSYN-VWF-004(1743bp)的插入子连接至bamH1/Not1消化的pSYN-VWF-008(8242bp),以得到pSYN-VWF-009(D1D2D’D3:SEQ ID NO:2的第1-1039位氨基酸)、pSYN-VWF-010(D1D2D’D3:SEQ ID NO:2的第1-1240位氨基酸)、pSYN-VWF-011(D1D2D’D3:SEQ ID NO:2的第1-1274位氨基酸)、pSYN-VWF-012(D1D2D’D3:第1-1479位氨基酸)。所有4个构建体具有C-末端的6×His标签。在转染的细胞中,pSYN-VWF-009、010、011和012用原肽合成,但由于细胞内加工,分泌产物不包含任何原肽(D1D2)。从VWF-009构建体表达的蛋白质以单体存在,并且假设从VWF-010、011和012构建体表达的蛋白质以二聚体存在,如图6和图7中所示,其分别使用VWF-009和VWF-010作为实例。
pSYN-VWF-010用于生成pSYN-VWF-013,其在对应于SEQ ID NO:73的C336A和C379A处具有两个点突变(氨基酸编号表示无D1D2结构域-VWF序列2的成熟VWF序列)。预期这些突变阻止VWF D’D3结构域的二聚化。
(d)克隆pSYN-VWF-025和029
pSYN-VWF-025包含pLIVE载体中全长VWF的野生型D1D2D’D3序列,而pSYN-VWF-029包含具有pLIVE载体中的C336A/C379A突变的D1D2D’D3结构域。对于克隆pSYN-VWF-025和029,使用如下引物组合:
具有Nhe1位点的ESC89-fwd=CTCACTATAGGGAGACCCAAGCTGGCTAGCCG(SEQ ID NO:66)
具有Sal1的ESC91-rev=CTGGATCCCGGGAGTCGACTCGTCAGTGGTGATGGTGATGATG(SEQID NO:67)
50μl PCR反应使用ESC 89/ESC91引物组合和pSYN-VWF-010(对于pSYN-VWF-025)或pSYN-VWF-013(对于pSYN-VWF-029)作为质粒模板进行,使用3步PCR扩增循环:94℃2分钟;21个(96℃30秒,55℃30秒,68℃4分钟)循环。预期大小条带(约3800bp)通过凝胶提取试剂盒(Qiagen,Valencia,Calif.)进行凝胶纯化并克隆至pLIVE-Mirus载体(Invitrogen,Carlsbad,Calif.)的Nhe1和Sal1限制性酶切位点,以生成pSYN-VWF-025和029。
(e)克隆pSYN-VWF-031
pSYN-VWF-031是D1D2D'D3(C336A/C379A)-Fc构建体,其在VWF D1D2D'D3(C336A/C379A)和Fc序列之间具有48个氨基酸长度的凝血酶可切割连接基(8×GGGGS(SEQ ID NO:110)+凝血酶位点)。为制备该构建体,将VWF-Fc区从构建体pSYN-FVIII-064(以下称为FVIII-VWF构建体)扩增。将pSYN-FVIII-VWF用Xba1和Nhe1消化。所得的4165bp包含VWF片段和Fc区的插入区域用作通过引物组合LW22/LW23扩增VWF和Fc区的模板。
具有FVIII信号序列和BsiW1位点的LW22-FWD-VWF-D'D3
Figure BDA0002313018640001011
具有终止密码子和Not1位点的LW23-Rev-Fc
Figure BDA0002313018640001012
VWF 031的核苷酸序列(SEQ ID NO:108)
Figure BDA0002313018640001021
Figure BDA0002313018640001031
VWF031的蛋白质序列(SEQ ID NO:109)
Figure BDA0002313018640001032
Figure BDA0002313018640001041
Figure BDA0002313018640001042
将得自LW22/LW23扩增的PCR产物(约2300bp)克隆至BsiW1/Not1消化的pSYN-VWF-002以得到pSYN-VWF-014中间体。pSYN-VWF-014包含FVIII信号肽-D’D3-20个氨基酸的凝血酶可切割连接基,然后是Fc区。
为生成D1D2D’D3-Fc构建体,D1D2D’D3区使用引物组合LW24/LW27通过标准PCR方法从pSYN-VWF-013扩增。
具有BsiW1位点的LW24-Fwd-VWF D1D2D’D3克隆寡核苷酸
Figure BDA0002313018640001043
具有EcoRV的LW27-Rev-VWF D'D3寡核苷酸
Figure BDA0002313018640001044
将得自LW22/LW23扩增的PCR产物(约3750bp)克隆至BsiW1/EcoRV消化的pSYN-VWF-014以得到pSYN-VWF-015中间体。改变VWF片段和Fc区之间的连接基长度以得到pSYN-VWF-031。
全长VWF蛋白序列在表1中示出。
VWF-D1D2D’D3蛋白质序列1b(SEQ ID NO:72)
Figure BDA0002313018640001051
VWF-D’D3蛋白质序列2(SEQ ID NO:73)
Figure BDA0002313018640001052
实施例2:包含第二Fc链氨基末端的FVIII-Fc和VWF-D’D3结构域的异源二聚体构建体(FVIII-VWF-Fc异源二聚体,图2)
(a)pSYN-FVIII-064的克隆
FVIII-064质粒包含单链FC(scFc)支架,其具有在细胞中合成期间加工的酶切位点。构建体具有全长VWF的FVIII结合结构域(D’D3)。
质粒(pSYN-FVIII-064)设计为表达FVIII-Fc和VWF-Fc异源二聚体,其中D’D3结构域结合FVIII并且阻止FVIII与磷脂和活化蛋白C的相互作用和/或阻止或抑制与内源性VWF的结合。来自pSYN-FVIII-064的蛋白质作为单个多肽在细胞中表达,其中FVIII-Fc亚基的C-末端通过6×(GGGGS)多肽连接基(SEQ ID NO:74)连接至VWF D’D3-Fc亚基的N-末端。此外,RRRRS(SEQ ID NO:75)和RKRRKR(SEQ ID NO:76)序列分别插入多肽连接基的5’和3’末端,通过前蛋白转化酶在每个序列最后的Arg之后在细胞内切割。因此,细胞可表达双链FVIII-Fc/D’D3-Fc异源二聚体,其中FVIII-Fc链具有C-末端的RRRRS序列(SEQ ID NO:75),但连接基序列的其余部分被移除。另一个3×(GGGGS)多肽连接基(SEQ ID NO:28)以及凝血酶切割位点被引入VWF结构域和Fc区之间,一旦FVIII-VWF异源二聚体蛋白被凝血酶活化,使得FVIII与其它凝血因子相互作用,即促进VWF片段从FVIII释放。
包含一部分第一Fc区,然后是6×(GGGGS)(SEQ ID NO:74)、VWF-D’D3结构域(1-477aa;C336A/C379A突变)、3×(GGGGS)(SEQ ID NO:28)、凝血酶切割位点和一部分第二Fc的DNA片段的合成外包进行(Genscript-序列号103069,如下所示)。将Genscript构建体的片段亚克隆至SalI/RsRII消化的pSYN-FVIII-049,pSYN-FVIII-049是可切割的连接基在两个Fc结构域之间的FVIII-Fc构建体。
Genscript-序列号103069(SEQ ID NO:82):
Figure BDA0002313018640001061
(b)pSYN-FVIII-065的克隆
FVIII-065质粒包含连接至第二Fc区的VWF的D’D3结构域的前276个氨基酸。将VWF片段通过使用引物组合ESC17和ESC41从全长VWF质粒pSYN-VWF-008进行PCR扩增。
具有Cla1的ESC17-Fwd-VWF克隆寡核苷酸
Figure BDA0002313018640001062
具有EcoRV的ESC41-Rev-VWF
Figure BDA0002313018640001063
预期大小条带(约692bp)通过凝胶提取试剂盒(Qiagen,Valencia,Calif.)进行凝胶纯化并克隆至pSYN-FVIII-064的Cla1和EcoRV位点,生成pSYN-FVIII-065。
实施例3:pSYN-FVIII-159、160、178、179的克隆(图3)
为了改变VWF片段和Fc区之间的连接基长度,将EcoRV位点引入pSYN-FVIII-064中VWF和20个氨基酸连接基开始的接合处,然后可变大小连接基用于替代PSYN-FVIII-064中的20aa连接基。新DNA构建体为:pSYN-FVIII-159、160、178和179,其分别包含35aa、48aa、73aa和98aa连接基。
为了将35个氨基酸的连接基插入pSYN-FVIII-159,从Integrated DNATechnologies,Inc(Coralville,IA)订购两个寡核苷酸(ESC78-105bp和ESC79-107bp)。将寡核苷酸使用标准PCR方法进行退火和延伸:
引物:
具有EcoRV位点的ESC78-Fwd
Figure BDA0002313018640001071
具有RsRII位点的ESC79-Rev
Figure BDA0002313018640001072
50μl PCR寡核苷酸退火和延伸反应使用ESC78/ESC79引物组合进行,使用3步PCR扩增循环:25个(96℃30秒,55℃30秒,68℃30秒)循环。将预期大小条带(约186bp)用凝胶提取试剂盒(Qiagen,Valencia,Calif.)进行凝胶纯化并克隆至pSYN-FVIII-064的EcoRV和RsRII限制性位点,生成pSYN-FVIII-159。
(b)克隆pSYN-FVIII-160、178和179
pSYN-VIII-160具有VWF片段和Fc区之间的48个氨基酸的连接基。编码48个氨基酸的连接基(ISGG GGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGGGGSGGGGS)(SEQ ID NO:81)和一部分Fc区的DNA片段的合成外包进行(Genscript-序列号-132601,如下所示)。将Genscript构建体的片段亚克隆至EcoRV/RsRII消化的pSYN-FVIII-0159(如上所述)。
Genscript-序列号-132601(SEQ ID NO:83)
Figure BDA0002313018640001073
pSYN-VIII-178具有VWF片段和Fc区之间的73个氨基酸的连接基。编码73个氨基酸的连接基(ISGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGGGGSGGGGS)(SEQ ID NO:84)和一部分Fc区的DNA片段的合成外包进行(Genscript-序列号-144849,如下所示)。将Genscript构建体的片段亚克隆至EcoRV/RsRII消化的pSYN-FVIII-0159(如上所述)。
Genscript-序列#-144849(SEQ ID NO:85)
Figure BDA0002313018640001081
pSYN-VIII-179具有VWF片段和Fc区之间的98个氨基酸的连接基。编码98个氨基酸的连接基(ISGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGGGGSGGGGS)(SEQ ID NO:86)和一部分Fc区的DNA片段的合成外包进行(Genscript-序列号-144849,如下所示)。将Genscript构建体的片段亚克隆至EcoRV/RsRII消化的pSYN-FVIII-0159(如上所述)。
Genscript-序列#-144849(SEQ ID NO:87)
Figure BDA0002313018640001082
pSYN-FVIII-180、181和182的克隆
pSYN-FVIII-180、181和182从pSYN-FVIII-160构建。将K2093A或F2093A或K2093A/F2093A突变引入pSYN-FVIII-160中FVIII的C1结构域,分别形成pSYN-FVIII-180、pSYN-FVIII-181和pSYN-FVIII-182。
FVIII-VWF-Fc异源二聚体蛋白质序列(SEQ ID NO:88)
(FVIII序列第1-1457位氨基酸;下划线区表示Fc区;波浪下划线表示第一Fc和VWF片段之间的可切割的连接基;双下划线区表示VWF片段;粗体区表示VWF片段和Fc之间的可变长度可切割的连接基。FVIII-064、159、160、178和179构建体中的连接基长度可变化。)
Figure BDA0002313018640001091
实施例4:FVIII-VWF DNA构建体的实施例(图4)
VWF片段和FVIII蛋白可使用常规重组DNA技术通过连接基或另一个蛋白质或多肽连接在一起,如图4中所示。在图4A中,VWF的D1D2D’D3结构域通过48aa连接基-IS GGGGSGGGGSGGGGSGGGGSGGGGSGGGGSLVPRGSGGGGSGGGGS(SEQ ID NO:89)连接至FVIII蛋白,并且保护FVIII不被过早清除。为了进一步增加D’D3的FVIII保护活性,另一个具有半衰期延长潜力的蛋白质或多肽,例如白蛋白或PAS序列(异源部分)可掺入构建体。异源部分如白蛋白或PAS序列可掺入FVIII分子的不同位置;图4B-4D中示出了几个实例:在FVIII的N-末端(4B)、在FVIII的C-末端(4C)或在B区中(4D)。在那些构建体中,另外的蛋白质序列可增加D’D3保护活性并且进一步延长FVIII半衰期。
此外,异源部分如白蛋白或PAS序列也可掺入FVIII/VWF异源二聚体构建体,如图4E-4G中所示。在图4E中,异源部分如白蛋白或PAS序列掺入FVIII-148的FVIII B结构域;在图4F中,异源部分如白蛋白或PAS序列掺入FVIII-136的FVIII B结构域区;在图4G中,异源部分如白蛋白或PAS序列用作使D’D3片段和Fc连接的连接基。在那些构型中,预期D’D3、Fc以及作为半衰期延长因子的异源部分(如,白蛋白/PAS序列)的协同效应使FVIII半衰期延长。
实施例5:FVIIIFc-VWF异源二聚体共转染系统的质粒构建(图5)
制备产生FVIIIFc-VWF异源二聚体的共转染系统,该系统包含三个DNA构建体。第一DNA构建体-pSYN-FVIII-155编码FVIII-Fc融合蛋白,其中单链FVIII蛋白直接融合至单个Fc片段,并且第二DNA构建体是pSYN-VWF-031,其编码D’D3-Fc融合蛋白(在上面实施例1中有所描述)。HEK293F细胞用80:15:5的比率两个质粒和第三质粒(PC5)转染。用PC5共转染用于确保D1和D2区的完全原肽加工,以得到成熟D’D3结构域。合成蛋白质以FVIIIFc/D’D3Fc异源二聚体和D’D3Fc同源二聚体分泌,并且将FVIIIFc/D’D3Fc异源二聚体通过蛋白质纯化与D’D3Fc同源二聚体分离。
pSYN-FVIII-155成熟蛋白质测序(SEQ ID NO:90):
Figure BDA0002313018640001111
pSYN-FVIII-155DNA测序(SEQ ID NO:91):
Figure BDA0002313018640001112
Figure BDA0002313018640001121
所构建的另外VWF片段和FVIIIFC-VWF异源二聚体在下面列出。
表6:VWF片段和FVIII/VWF异源二聚体构建体
Figure BDA0002313018640001122
Figure BDA0002313018640001131
Figure BDA0002313018640001141
实施例6:蛋白质纯化
VWF片段的蛋白质纯化
VWF片段通过两步纯化法纯化。硫酸镍带电的IMAC(固定化金属亲合色谱)柱用于初次纯化,Fractogel DEAE离子交换柱用于最终纯化。详细纯化方法如下所述。
(a)在Nickel IMAC上进行的VWF片段的初次纯化
将14mL Nickel IMAC Sepharose HP柱[XK26/3]用25mM HEPES、500mM NaCl、10mM咪唑和0.05%Tween-20(pH7.5)进行平衡。用100mL 1M HEPES(pH7.5)和600mL 5M NaCl调整大约7.2L VWF条件培养基。然后加入80mL 1M咪唑(pH7.5)达到10mM终浓度。然后将7.8L调整的VWF条件培养基在2-8℃以10mL/分钟[113cm/小时]上柱。洗涤步骤以13.3mL/分钟[150cm/小时]进行。首先,用25mM HEPES、500mM NaCl、10mM咪唑和0.05%Tween-20(pH7.5)以正向流{“向下流(DownFlow)"}进行2×柱体积(CV)洗涤。然后,用25mM HEPES、500mMNaCl、10mM咪唑和0.05%Tween-20(pH7.5)以反向流{“向上流(UpFlow)"}进行3×CV洗涤。最后,用25mM HEPES、500mM NaCl、10mM咪唑和0.05%Tween-20(pH7.5)以正向流{“向下流"}进行3×CV洗涤。洗脱以10×CV梯度进行至50%B1(25mM HEPES、500mM NaCl、500mM咪唑和0.05%Tween-20(pH7.5))。级分体积设定为10mL。然后,柱用100%B1剥离(strip)。然后是用25mM HEPES、500mM NaCl、10mM咪唑和0.05%Tween-20(pH7.5)洗涤。二次剥离用1NNaOH进行。然后柱用1M TRIS、1M NaCl(pH7.8),然后是25mM HEPES、500mM NaCl、10mM咪唑和0.05%Tween-20(pH7.5)冲洗。最后,柱用5CV的DPBS+20%乙醇冲洗并储存在4℃。
(b)在Fractogel DEAE上进行的VWF片段的二次纯化
VWF片段的二次纯化在Fractogel DEAE(pH7.5)上进行。首先,用200mgZwittergent 3-14两性离子洗涤剂调整20mL VWF Nickel IMAC洗出液(对应于VWF片段峰),尝试在不使用变性或还原赋形剂的情况下破坏聚集物质。在洗涤剂溶解后,将蛋白质在室温下放置大约15分钟。然后,用4克海藻糖、1mL 10%Tween-20、5mL 1M HEPES(pH7.5)和174mL“Milli-Q”水调整蛋白质。平衡缓冲液“A12”为25mM HEPES、50mM NaCl、1%海藻糖、0.05%Tween-20(pH7.5)。洗脱缓冲液“B1”为25mM HEPES、1000mM NaCl、1%海藻糖、0.05%Tween-20(pH7.5)。洗脱以10CV梯度进行至50%B1,保持5+CV,然后一步至100%B1。然后柱用0.85%磷酸,然后是1M TRIS、1M NaCl(pH7.5)剥离。然后柱用1N NaOH、2M NaCl,然后是1M TRIS、1M NaCl(pH7.5)解吸。然后柱用25mM HEPES、100mM NaCl+20%乙醇(pH7.5)冲洗,以用于储存。
(c)FVIII-VWF异源二聚体的蛋白质纯化
FVIII-VWF异源二聚体首先用亲合柱(GE VIIISelect),然后是Fractogal TMAE离子交换柱纯化。(McCue JT,Selvitelli K,Walker J,J Chromatogr A.2009年11月6日;1216(45):7824-30.Epub 2009年9月23日.)
对于FVIII-155/VWF-31的纯化,将切向流过滤(TFF)步骤用于缓冲更换澄清的条件培养基。然后使用亲合色谱法捕集滤液中的靶蛋白。然后进行弱阴离子交换色谱步骤以减少HMW物质。分子的纯度和大小二者通过HPLC-SEC和SDS-PAGE评估。FVIII-155/VWF-31的不同结构域的存在通过蛋白质印迹进一步确认。分子的比活性相当于B-结构域缺失的FVIII。
(d)FVIII-VWF异源二聚体的凝血酶消化(图8)
FVIII-VWF-Fc异源二聚体或FVIII-Fc(对照)在凝血酶切割缓冲液(50mM Tris(pH7.4)、150mM NaCl、2mM CaCl2、5%甘油)中以1:10的比率与凝血酶混合。将反应在37℃下温育20分钟。将消化产物在4-12%还原tris-甘氨酸凝胶上跑电泳。未消化的蛋白质用作对照。条带通过考马斯亮蓝染色观察。
(e)通过Octet测定评估VWF结合FVIII-155/VWF-031的能力
VWF结合FVIII-155/VWF-031的能力通过基于生物膜层干涉(BLI)的测量法(Octet测定)在25℃下用ForteBio Octet 384仪器、使用Tris结合缓冲液(50mM Tris(pH7.2)、150mM NaCl、5mM CaCl2)测定。用于确定FVIII结合的Octet测定基于人血管性血友病因子(hVWF)(Haematologic Technologies目录号HCVWF-0191)疏水固定化至APS生物传感器,然后结合1.0%牛血清白蛋白(Jackson ImmunoResearch目录号001-000-161)。简而言之,hVWF(38.5nM)在Tris缓冲液中稀释,并加载到APS生物传感器600秒,反应探针上产生大约3.0-3.5nm结合。对照APS探针在不存在hVWF的情况下用1.0%BSA加载,以进行参考扣除(reference subtraction)。在加载后,所有探针在Tris缓冲液中温育300秒以建立新的基线。随后,生物传感器探针在FVIII-155/VWF-031、FVIIIFc药物物质或rFVIII(60nM)的溶液中在室温下温育5分钟,然后是5分钟解离步骤。使用Octet数据分析软件,从扣除数据(反应探针减去参考探针)得到结合响应(nm)。如图15中所示,与rFVIIIFc和rFVIII的VWF结合亲合力相比,VWF与FVIII-155/VWF-031的结合亲合力严重受损。这表明通过FVIIIFc/VWF异源二聚体内的D’D3片段成功屏蔽FVIII免于全长VWF的结合。
实施例7:VWF-FVIII相互作用是FVIII半衰期延长的限制因素
大多数循环FVIII以FVIII-VWF复合物存在(>95%的血浆FVIII)。该FVIII-VWF相互作用促进通过VWF清除途径的FVIII清除,从而使VWF半衰期(T1/2)成为FVIII半衰期延长的限制。为评估该假说,在FVIII缺陷小鼠(HemA小鼠,其具有完整的VWF基因)和FVIII/VWF缺陷(FVIII-VWF双敲除(DKO))小鼠中测试通过Fc技术限制FVIII半衰期延长。
HemA小鼠或FVIII-VWF DKO小鼠用单静脉内剂量的rFVIII或rFVIIIFc(HemA小鼠中125IU/kg或DKO小鼠中200IU/kg)治疗。收集HemA小鼠中的血液样品最多72小时,或FVIII/VWF DKO小鼠中的血液样品最多8小时。然后血浆样品的FVIII活性通过FVIII显色测定测量。两种rFVIII变体的药代动力学(PK)曲线使用WinNonline程序分析。
如表7和图9中所示,在FVIII/VWF DKO小鼠中,与rFVIII的T1/2(即,T1/2为0.25小时)相比,rFVIIIFc显示出是其4.8倍的T1/2(即,T1/2为1.2小时)。相比之下,在HemA小鼠中测试时,与rFVIII相比,rFVIIIFc的T1/2仅是其1.8倍。rFVIIIFc的T1/2为13.7小时,符合内源性鼠VWF半衰期。这表明FVIII-VWF相互作用是FVIII半衰期延长的限制因素。为了实现超过2倍的FVIII半衰期延长,FVIII-VWF相互作用必须消除。
表7:HemA和FVIIII/VWF DKO小鼠中的FVIII PK
FVIII显色测定
Figure BDA0002313018640001171
FVIII活性使用得自DiaPharma(lot#N089019)的COATEST SP FVIII试剂盒测量,并且所有温育在37℃板式加热器上震荡进行。
rFVIII标准品的范围为从100mIU/mL至0.78mIU/mL。将混合的正常人血浆测定对照和血浆样品(用1×Coatest缓冲液稀释)加入Immulon 2HB 96孔板,一式两份(25μL/孔)。将新鲜制备的IXa/FX/磷脂混合物(50μL)、25μL25mM CaCl2和50μL FXa底物按顺序加入每个孔,每次加入之间温育5分钟。在温育底物后,加入25μL 20%乙酸终止颜色反应,并且OD405的吸光度用SpectraMAX plus(Molecular Devices)仪器测量。数据使用SoftMax Pro软件(5.2版)分析。最低定量限(LLOQ)为7.8mIU/mL。
实施例8:VWF D’D3二聚体保护FVIII不被FVIII蛋白水解和清除(图10)
VWF片段的FVIII保护活性通过其保护内源性鼠FVIII在VWF缺陷小鼠中不被清除的能力评估。如表8第1列中列出的不同VWF片段(图1,实施例1)通过以100μg/小鼠其对应DNA构建体的高压注射引入VWF缺陷小鼠的血液循环。收集注射后48小时的血浆样品,并且鼠FVIII血浆活性通过FVIII显色测定测量。VWF表达水平通过VWF ELISA测量。
测试的四个不同长度的VWF片段为276个、477个、511个和716个氨基酸。测试276至716个氨基酸范围以查找无VWF清除受体的结合结构域(716aa)的FVIII结合所需的VWF片段的长度(276aa)。全长VWF和D1D2D’D3CK多聚体用作FVIII保护的阳性对照。在血液循环中,通过D1D2结构域合成的VWF片段以二聚体存在,当它们在无D1D2结构域的情况下合成时以单体存在。
高压注射后血浆中鼠FVIII活性的增加衡量VWF片段的FVIII保护效果。如表8和图10A-B中所示,D’D3片段的前276aa无FVIII保护活性,如由类似的注射前/后FVIII血浆水平所证明(图10A)。然而,其它VWF片段的引入导致FVIII血浆水平显著增加,表明那些VWF片段可保护FVIII不被其清除途径清除。
表8:VWF片段引入前/后FVIII/VWF DKO小鼠的鼠FVIII血浆水平(DNA构建体在图1中示出)
Figure BDA0002313018640001181
注射后血浆FVIII活性和包含全长VWF的D’D3结构域的VWF片段的血浆抗原水平的比率在表8中列出。类似的注射后FVIII/VWF比率从全长VWF和VWF片段的两种二聚体形式观察,意指这两种VWF片段二聚体提供与全长VWF相同的FVIII保护。此外,从VWF片段二聚体同种型与其对应的单体相比观察到FVIII/VWF比率高三倍:D’D3(477aa)二聚体具有38.7mIU/nmol的FVIII/VWF比率;D'D3(477aa)单体具有11.6mIU/nmol的FVIII/VWF比率;D'D3A1(511aa)二聚体具有32.9mIU/nmol的FVIII/VWF比率;并且D'D3(511aa)单体具有13.8mIU/nmol的FVIII/VWF比率,表明与其对应的单体相比,VWF片段的二聚体同种型提供更好的FVIII保护。
表9:全长D’D3片段的FVIII保护效果
Figure BDA0002313018640001191
高压注射:
高压注射是非病毒基因递送至小型动物例如小鼠和大鼠的肝脏的高效和安全方法。它最初描述为动物体重十倍体积的不含内毒素的裸露质粒DNA/盐水溶液在约5-7秒内的快速注射。裸露质粒DNA包含所关注的基因,并且肝脏产生的注射DNA的靶蛋白可在注射后24小时内检测。然后收集血浆样品研究表达蛋白的治疗性质。
对于本专利申请进行的所有高压注射,将溶于0.9%无菌盐水溶液的2ml质粒DNA通过在约4-7秒内尾静脉注射递送至体重为20-35克的小鼠。密切监测小鼠前两个小时,直到恢复正常活性。通过眶后采血收集血液样品后,然后得到血浆样品并储存在-80℃,用于进一步分析。
VWF ELISA:
以0.5ug/孔将山羊抗人VWF抗体(亲合纯化,Affinity Biological,GAVWF-AP)用作捕获抗体,并且VWF-EIA-D(Affinity Biologicals,VWF-EIA-D,1:100稀释)用作检测抗体以用于VWF ELISA。ELISA测定在标准ELISA程序后进行,TMB用作HRP底物,PBST/1.5%BSA/0.5M NaCl缓冲液用作阻断和结合缓冲液。测定标准范围为100ng至0.78ng,并且测定的最低定量限(LLOQ)为7.8ng/mL。
实施例9:全长VWF D’D3片段的共施用延长FVIII-VWF DKO小鼠中的rBDD-FVIII半衰期(图11)
实施例8已示出全长D’D3片段可保护内源性FVIII不被其清除途径清除。为了进一步评估D’D3蛋白的FVIII保护活性,通过静脉注射给FVIII-VWF DKO小鼠共施用B结构域缺失的FVIII(rBDD-FVIII)和D’D3二聚体(VWF-010)或rBDD-FVIII和D’D3单体(VWF-002)(200IU/kg rBDD-FVIII、770μg/kgD’D3二聚体以及590μg/kg D’D3单体)。然后通过其注射后血浆活性监测rBDD-FVIII的PK曲线。由于D’D3片段的较短体内半衰期,在初始共注射后三小时,通过相同途径施用另外剂量的D’D3,以保持所需的D’D3血浆水平。
对于PK分析,通过注射后5分钟、30分钟、1小时、2小时、4小时和6小时眶后采血获得血浆样品,血浆FVIII活性和D’D3抗原水平通过FVIII显色测定和VWF ELISA进行分析。
如图11和表10所示,D’D3单体延长rBDD-FVIII半衰期2.5倍,并且提高其回收率1.8倍。D’D3二聚体延长rBDD-FVIII半衰期4.1倍,并且提高其回收率3.5倍。提高的平均驻留时间、清除和AUC也在两种D’D3同种型中观察到。然而,与其单体形式相比,D’D3二聚体在所有PK参数中实现更好的结果。
总而言之,全长D’D3的共注射保护FVIII不被其清除途径清除,如rBDD-FVIII的改善PK曲线所示。这些发现的潜在临床价值需要进一步评估。
表10:与D’D3片段共施用时,FVIII-VWF DKO小鼠中的BDD-FVIII PK参数
Figure BDA0002313018640001201
实施例10:用D1D2结构域及其二聚体同种型合成的D’D3单体具有相同的FVIII保护活性,并且在FVIII-VWF DKO小鼠中还延长FVIIIFc的半衰期约4倍(图12)。
为了定量D’D3结构域的FVIII保护能力,并且确定D’D3二聚化是否为其FVIII保护活性所必须的,两个DNA构建体(即,VWF-025(包含编码D1D2D’D3的DNA序列)和VWF-029(包含具有C336A和C379A突变的D1D2D’D3密码子DNA))中的每个通过高压注射施用至FVIII/VWF DKO小鼠。该注射导致FVIII/VWF DKO小鼠中的D’D3二聚体(VWF-025)或单体表达(VWF-029)。在高压注射后第5天,单静脉内剂量的rFVIIIFc以200IU/kg施用,并且血浆样品在rFVIIIFc静脉内注射后5分钟、4小时、8小时、16小时、24小时、31小时、40小时、55小时、66小时收集。以相同的剂量在初次受试的FVIII-VWF DKO小鼠中进行的rFVIIIFc PK研究用作rFVIIIFc半衰期基线。血浆FVIII活性通过FVIII显色测定分析。血浆D’D3水平通过VWFELISA测量,并且rFVIIIFc PK曲线使用WinNonlin程序分析。
如表11和图12中所示,通过循环中的VWF D’D3片段,rFVIIIFc的初始回收率从42%增加至D’D3二聚体的75%和D’D3单体的60%。rFVIIIFc的T1/2也从2.5小时分别增加至9.3小时和9.2小时。类似于T1/2,提高平均驻留时间、清除率和体积分布也在表达D’D3单体和二聚体的小鼠中观察到。总体上,观察到rFVIIIFc的半衰期提高约8倍,并且表达D’D3单体和二聚体二者的小鼠中AUC提高6倍。与其二聚体形式相同,使用VWF的原肽(D1D2)合成的全长VWF的D’D3单体足以提供与全长VWF分子相同的完全FVIII保护效果。
在FVIII/VWF DKO小鼠中,WT-FVIII具有0.25小时的T1/2。Fc融合技术使FVIII的T1/2增加至1.2小时,增加约4.8倍。当Fc融合技术与D’D3结构域组合时,FVIII的T1/2增加至9.3小时(D’D3二聚体)和9.2小时(D’D3单体),总共增加约37倍。(表10)该结果显示了Fc融合和D’D3 VWF片段对FVIII半衰期延长的协同效应。
表11:血液循环中含/不含D’D3片段的rFVIIIFc PK参数
Figure BDA0002313018640001211
实施例11:HemA小鼠中的FVIII-VWF异源二聚体PK
FVIII-VWF异源二聚体的领先候选物(例如FVIII-155/VWF-031)的PK曲线在HemA小鼠中测试,以评估其屏蔽FVIII免受内源性VWF作用的能力,及其延长FVIII半衰期的能力。
HemA小鼠用200IU/kg的单静脉内剂量的领先候选物处理,然后在5分钟、4小时、8小时、24小时、48小时、72小时、96小时和120小时收集血浆样品,血浆活性通过FVIII显色测定测试,并且FVIII变体的半衰期通过WinNonlin程序计算。
在最佳FVIII/VWF异源二聚体构型中,FVIII结合至内源性VWF被完全抑制,因此rFVIII的基线半衰期从7.6小时减少至0.25小时,如实施例7中所示。当D’D3片段与FVIII非共价缔合时,观察到约8倍的半衰期益处(实施例9)。在FVIII/VWF异源二聚体的领先候选物中,VWF片段与FVIII分子共价缔合,能够实现更好的FVIII保护。本发明打开了进一步延长FVIII半衰期超过两倍上限的途径,通过可用的半衰期延长技术的组合,在不久将来HemA患者可期待更好的长期作用FVIII变体。
FVIII-155/VWF-031的PK曲线在HemA和FVIII/VWF DKO小鼠中测试,以评估D’D3片段屏蔽FVIII部分免受内源性VWF作用的能力。HemA或FVIII/VWF DKO小鼠用200IU/kg的单静脉内剂量的FVIII-155/VWF-031处理,然后在给药后5分钟、8小时、24小时和48小时收集血浆样品。血浆样品的FVIII活性通过FVIII显色测定测试,并且FVIII-155/VWF-031的半衰期使用WinNonlin程序计算。
与rFVIIIFc和rFVIII相比,与固定化VWF结合的严重受损通过FVIII-155/VWF-031的生物膜层干涉(图15,Octet,ForteBio Inc.,Menlo Park,CA)检测。这显示分子中的D’D3结构域成功阻断FVIII结合至天然的VWF分子。因此,预期在两个不同的小鼠品系中rFVIII-155/VWF-031的类似半衰期。研究结果在图16和表12A中列出。根据预测,rFVIII-155/VWF-031在HemA和FVIII/VWF DKO小鼠中具有相当的PK曲线,表明FVIIIFc/VWF异源二聚体的半衰期与内源性VWF的半衰期无关。结果显示,通过VWF D’D3结构域抑制rFVIIIFc与内源性VWF之间的相互作用允许消除FVIII半衰期上限,并且打开了延长FVIII半衰期的可能性,使其超过可在无VWF D’D3结构域时实现的半衰期(约野生型FVIII的两倍)。
表12A:FVIII/VWF DKO小鼠和HemA小鼠中的FVIII-155/VWF-031PK
Figure BDA0002313018640001221
D’D3结构域的FVIII保护能力通过比较FVIII/VWF DKO小鼠中FVIII-155/VWF-031与FVIIIFc的t1/2进行评估。在单静脉内施用后,在5分钟、8小时、24小时和48小时收集FVIII-155/VWF-031的血液样品,并且在5分钟、1小时、2小时、4小时、6小时和8小时收集FVIIIFc的血液样品。血浆样品的FVIII活性通过FVIII显色测定测试,并且FVIII-155/VWF-031的半衰期使用WinNonlin程序计算。
图16B和表12B显示,与DKO小鼠中的rFVIIIFc相比,FVIII-155/VWF-031的PK曲线显著增加:t1/2增加约6倍;并且清除率和AUC增加约5倍。该结果显示,FVIIIFc/VWF异源二聚体中的D’D3结构域保护FVIII部分免受一些清除途径的清除,从而提供全长VWF通常提供的一些保护。该结论还在HemA小鼠中确认。当与HemA小鼠中的rFVIIIFc比较时,rFVIII-155/VWF-031显示出更短的t1/2和更小的AUC,意指在该构型中,D’D3结构域(VWF-031)成功阻止FVIII蛋白(rFVIII-155)结合内源性VWF,该结合具有一定程度的半衰期延长特性,以及FVIII半衰期限制性质。全长VWF为250kDa,并且形成多聚体,使得内源性VWF可达最多2MDa,因此符合VWF的55kDa D’D3区不提供与该情形中非常大的内源性VWF通常所提供相同的保护的假说。由于VWF片段阻止内源性VWF结合rFVIII-155/VWF-031,因此在该具体构建体中,HemA小鼠中的半衰期减少。因此,表12B中的结果表明rFVIII-155/VWF-031分子能够阻止FVIII半衰期延长因子(内源性VWF)结合rFVIII-155/VWF-031。然而,实验显示移除FVIII半衰期限制因子会打开延长FVIII蛋白的半衰期超过前面所示的1.5倍或2倍的可能性。当FVIII与图4中所示的其它半衰期延长元件组合时,可实现FVIII的2倍半衰期延长上限的突破。
表12B:FVIII/VWF DKO小鼠中的FVIII-155/VWF-031和FVIIIFc PK
Figure BDA0002313018640001231
实施例12:FVIII/D’D3异源二聚体的D’D3-Fc连接基的优化(图13)
为允许rFVIIIFc逃脱VWF清除途径并且消除2倍FVIII半衰期延长上限,将VWF D’D3片段掺入到rFVIIIFc分子(图2),得到FVIIIFc/VWF异源二聚体。为了消除rFVIIIFc和内源性VWF之间的相互作用,并且使D’D3 FVIII保护潜力最大化,调整D’D3结构域和Fc区之间的连接基,以允许最佳的FVIII/D’D3结合。更佳的连接基将允许D’D3结构域具有比次佳的连接基构建体更强的FVIII保护。这可通过FVIII/VWF DKO小鼠中DNA构建体的高压注射测试。更佳的构建体将产生更高的FVIIIFc/D’D3异源二聚体的稳态蛋白质表达。
将三种不同的FVIIIFc/D’D3异源二聚体(图3,实施例3)工程化以用于优化连接基选择。D’D3结构域和Fc区之间的可能连接基在表13中列出。那些DNA构建体通过以100μg/小鼠的高压注射(“HDI”)施用至FVIII/VWF DKO小鼠,并且在HDI后48小时收集血浆样品。循环FVIIIFc/D’D3异源二聚体活性通过FVIII显色测定分析。
研究结果在图13中示出。在HDI后48小时,FVIII-064和FVIII-159达到类似的表达水平,表明20aa连接基和35aa连接基促进类似水平的FVIII/D’D3相互作用。在另一方面,FVIII-160显示出表达显著高于FVIII-064,意指与20aa和35aa连接基相比,48aa连接基允许更好的FVIII/D’D3结合。
VWF片段和Fc区之间的最佳连接基是FVIIIFc/VWF异源二聚体的关键要素之一。寻找最佳连接基将允许FVIII和VWF片段之间的最佳相互作用,阻止FVIII结合内源性VWF,使FVIII逃脱VWF清除途径,并且延长FVIII半衰期超过血浆VWF半衰期。
表13:D’D3和Fc片段之间的不同连接基
Figure BDA0002313018640001241
实施例13:单链FVIII稳定性
单链FVIII蛋白可比其双链同种型更稳定。为了测试该假说,制备两个DNA构建体:FVIII-136(含D’D3结构域的可加工FVIIIFc)和FVIII-148(含D’D3结构域的单链(SC)FVIIIFc,其包含R1645A/R1648A突变,以阻止FVIII重链和轻链之间的切割)。
将两种质粒通过高压注射施用至FVIII/VWF DKO小鼠。在注射后24小时和48小时收集血浆样品,以测量两种FVIIIFc/D’D3同种型的表达水平。如图14中所示,在两个时间点观察到SC-FVIIIFc/D’D3构建体(FVIII-148)的更好表达趋势(p=0.12,p=0.19),表明单链FVIII可比其双链同种型(FVIII-136)更稳定或更好地表达。将对两种FVIII同种型的PK曲线,及其细胞培养物表达水平进一步研究。单链FVIII同种型可能用于替代常规的双链同种型,以实现更好的蛋白质生成和更长的体内FVIII半衰期。
实施例14:聚乙二醇化
一个或多个聚乙二醇(PEG)分子可连接至FVIII蛋白、VWF片段或它们二者的任何区域内。由于根据晶体结构FVIII的表面没有游离的半胱氨酸(PDB:2R7E,Shen等,Blood111:1240(2008);PDB:3CDZ,Ngo,Structure,16:597-606(2008)),因此一种方法是将含半胱氨酸的肽(如,GGGSGCGGGS)(SEQ ID NO:107)插入或连接至FVIII蛋白、VWF片段或它们二者。然后可将包含马来酰亚胺的PEG分子特异性缀合至重组FVIII蛋白上引入的半胱氨酸。简而言之,包含Cys插入的重组FVIII蛋白可通过标准分子技术构建,并且在哺乳动物表达系统(如,HEK 293、CHO、BHK21、PER.C6和CAP细胞)中表达的重组FVIII蛋白可通过亲合和离子交换色谱纯化。纯化的重组FVIII蛋白通过三(2-羧乙基)膦(TCEP)还原,以暴露引入的半胱氨酸的巯基,然后与马来酰亚胺PEG反应。测试所得重组FVIII蛋白的促凝血活性和延长的半衰期。
将PEG连接至美国专利申请号61/670,553中公开的位置中至少一个或其它合适的插入位点,该专利申请全文以引用方式并入本文。聚乙二醇化重组FVIII蛋白的FVIII活性使用FVIII显色测定进行分析。聚乙二醇化重组FVIII蛋白的PK在HemA小鼠和FVIII-VWFDKO小鼠中分析,如上所述。
实施例15:HemA和FVIII/VWF双敲除(DKO)血浆中的FVIII稳定性
不同FVIIIFc融合的血浆稳定性在HemA或FVIII/VWF双敲除(DKO)血浆中测试。对于稳定性测定,将5IU/ml各种FVIIIFc蛋白与小鼠HemA或DKO血浆在37℃下温育。在不同时间点收集等分试样以通过FVIII显色测定测量活性。每个时间点的活性测量两次,并且将平均活性绘制为时间的函数。
对于FVIIIFc免疫沉淀测定,将5μg FVIIIFc与250μl PBS或小鼠DKO血浆在37℃下温育24小时。通过在室温下加入5μg绵羊抗FVIII多克隆抗体(ab61370)1小时以及100μl蛋白A珠粒使FVIIIFc免疫沉淀。在4×1ml PBS洗涤后,将珠粒重悬于50μl 1×还原SDS-PAGE缓冲液中。煮沸后,将20μl样品(即约1μg FVIIIFc)上样到4-15%Bio-Rad无染色凝胶上。凝胶通过Bio-rad系统成像,然后通过FVIII抗重链抗体(GMA012)进行蛋白质印迹分析。
HemA和DKO血浆中FVIIIFc(双链FVIII分子,其具有单独的FVIII重链和轻链,通过非共价相互作用结合在一起)的活性随时间推移而减少(图18A)。由于缺乏VWF介导的保护,FVIIIFc活性损失在DKO血浆中更明显。这种FVIII活性损失主要是由于FVIII重链(HC)的解离或降解。在DKO血浆中温育24小时后观察到FVIIIFc重链减少约75%(图18B)。对于轻链(LC)(数据未示出)或未加工/单链FVIIIFc(即其中轻链和重链仍然共价结合在一起的FVIII分子,凝胶图片中的顶部条带)未观察到显著减少(图18B)。
对于VWF增加FVIII的体内稳定性的假设,我们测试了嵌合蛋白-FVIII-VWF异源二聚体(FVIII155:VWF31,其中VWF D’D3通过Fc共价结合至FVIII)是否在Hem A和DKO血浆中更稳定。如图19中的血浆稳定性数据所示,D’D3的存在增加了HemA和DKO血浆中FVIIIFc的稳定性。无D’D3的单链FVIIIFc用作这些实验的对照(scFVIII)。从图19可知,单链FVIII比双链FVIIIFc更稳定;然而D’D3的存在显著地进一步增加了单链FVIIIFc分子的血浆稳定性。这暗示D’D3不仅通过将重链和轻链保持在一起,而且通过一些其它未知机制来稳定FVIII。
实施例16:弗林蛋白酶/PACE用于VWF加工
VWF是独特的蛋白质,在这个意义上其包含非常大的原肽(即VWF的D1D2结构域,约85kDa)。VWF原肽作为VWF分子正确折叠的内部分子伴侣。测试两种酶PC5和弗林蛋白酶(PACE)的VWF加工。将VWF031构建体(D1D2D’D3Fc)与各种浓度的PC5或PACE瞬时共转染至HEK293细胞中。在四天后,收集组织培养基并经过蛋白A沉降。对于从D’D3Fc移除原肽(D1D2),即使在低浓度(2.5%)下,弗林蛋白酶(PACE)也比10%PC5高效(图20)。移除D1D2是重要的,因为D1D2的存在牵涉于阻止D’D3与FVIII的相互作用。
实施例17:FVIII-VWF异源二聚体中的VWF片段阻止FVIII与全长VWF的相互作用
ForteBio octet仪器用于测试FVIII构建体155/VWF31异源二聚体结合全长VWF(图21A)。对于结合测定,全长VWF通过使用APS传感器,然后用1%BSA阻断来捕集。在阻断后,测试不同FVIII构建体的VWF结合。根据预测,野生型FVIII和FVIIIFc强结合至VWF传感器。已知具有对VWF的低亲合力或无亲合力的FVIII Y1680F突变体,显示出VWF结合显著减少。FVIII155/VWF31异源二聚体完全不结合全长VWF,确认屏蔽FVIII免受FVIII-VWF异源二聚体中D’D3的作用。
以相反方向进行相同的实验,以确定FVIII-VWF异源二聚体中的D’D3部分是否可与非共价结合至D’D3的其它FVIII分子相互作用。如图21B中所示,当固定化在蛋白G传感器上时,VWF31(D’D3Fc)构建体单独可强烈结合FVIII,然而FVIII155:VWF31异源二聚体中的D’D3不显示出与FVIII的任何结合。蛋白G单独结合FVIII作为对照。这些结合实验确认异源二聚体中的D’D3可仅与一个与其共价结合的FVIII分子相互作用,并且阻止FVIII与全长野生型VWF分子相互作用。
为确定VWF D’D3与FVIII分子的准确结合亲合力,用VWF031进行表面等离子共振实验(图22)。使用抗人IgG捕集VWF031构建体(D’D3Fc),并且使B-结构域缺失的FVIII通过包含D’D3Fc的芯片。观察到FVIII约10nM的KD。与全长野生型VWF分子相比,该亲合力低约25倍,并且类似于前面的文献所报道。
实施例18:D’D3和Fc之间不同连接基长度对异源二聚体活性和PK的影响
为检验D’D3和Fc之间凝血酶可切割连接基长度的变化是否对FVIII-VWF异源二聚体的PK和活性具有任何影响,将不同的VWF构建体与FVIII 155一起共表达。测试表14A中列出的三个不同连接基长度的构建体(VWF031、VWF035和VWF036)。将每种质粒与FVIII155质粒混合(实施例5)并转染至HEK 293细胞。在转染后第四天,收集细胞培养基并且浓缩至10IU/ml FVIII显色活性。
然后将浓缩的细胞培养基以100IU/10mL/kg的剂量施用至8-12周龄的FVIII/VWFDKO小鼠。在给药后5分钟、8小时、16小时、24小时、32小时和48小时收集血浆样品。血浆样品的FVIII活性通过FVIII显色测定分析,并且半衰期使用WinNonlin-Phoenix程序计算。
如图23中所示,当D’D3和Fc片段之间的连接基长度从48aa增加至73aa或98aa时,对应的FVIIIFc/VWF异源二聚体的半衰期增加并且分别达到12.2小时和13.3小时。这表示48aa长变体增加1.5至1.6倍。迄今为止,98aa连接基是利用D’D3片段的FVIII保护活性的最佳连接基,并且将其掺入到FVIIIFc/VWF异源二聚体,以进一步增加其半衰期。
为比较连接基对FVIII活性的影响,对表达不同FVIII-VWF异源二聚体的细胞的组织培养基进行FVIII显色和aPTT测定。虽然与异源二聚体构建体的显色活性相比,aPTT活性减少2倍,但未发现各种连接基之间的显著差异,当连接基还包含凝血酶位点附近的PAR1位点时除外(表14B)。
表14A:VWF D’D3和Fc之间的可变连接基的序列
Figure BDA0002313018640001271
表14B:具有不同连接基长度的异源二聚体的活性
Figure BDA0002313018640001272
实施例19:使用分选酶将FVIII与VWF片段连接
在另一个方面,通过使用分选酶介导的体外蛋白连接法将VWF片段(如D1D2D’D3或D’D3结构域)连接至FVIII。在一个实例中,将金黄色葡萄球菌(Staphylococcus aureus)分选酶A(LPXTG)识别基序引入VWF片段的C-末端并且将Gly(n)残基引入FVIII的N-末端(其中甘氨酸残基的数量可变)。所用的FVIII分子可以是单链的或双链的。催化转肽反应的分选酶将VWF片段共价连接至FVIII。相反方向的识别基序可用于连接这两种蛋白质,其中使在FVIII在N-末端具有LPXTG基序,并且使VWF片段在C-末端具有Gly(n)(参见图24:分选酶连接的实例)。LPXTG基序和甘氨酸残基可被其它分选酶识别序列替代。
还制备了包含分选酶A识别序列Fc融合蛋白的VWF片段。对于Fc融合构建体,将VWFD1D2D’D3片段通过包含分选酶识别序列和凝血酶切割位点的GS连接基与IgG的Fc区融合(表15和16)。一旦蛋白质表达并在蛋白A柱上纯化,Fc区即可通过凝血酶切割移除。然后所得的具有分选酶A识别位点的VWF片段可用于与FVIII分子连接(图24-分选酶连接的实例-E列)。
pSYN-VWF-051具有54个氨基酸的连接基,其中VWF片段和Fc区之间具有分选酶和凝血酶位点。编码54个氨基酸的连接基(ISGGGGSGGG GSGGGGSGGG GSGGGGSGGG GSLPETGALRPRVVGGGGSG GGGS)(SEQ ID NO:98)和一部分Fc区的DNA片段的合成通过外包进行(Genewiz序列号10-210746313,如下所示)。将Genewiz构建体的片段亚克隆至EcoRV/RsRII消化的pSYN-VWF-031。
Genewiz-序列号-10-210746313(SEQ ID NO:99)
Figure BDA0002313018640001281
包含N-末端五甘氨酸的单链FVIII的序列在表17和18中示出。
表15:pSYN-VWF051(具有分选酶A识别基序和VWF片段和Fc之间的凝血酶可切割连接基的VWF D1D2D’D3Fc)的核苷酸序列(SEQ ID NO:100)
Figure BDA0002313018640001282
Figure BDA0002313018640001291
Figure BDA0002313018640001301
表16:VWF051(具有分选酶A识别基序和VWF片段和Fc之间的凝血酶可切割连接基的VWF D1D2D’D3Fc;分选酶A位点以粗体示出)的蛋白质序列(SEQ ID NO:101)
Figure BDA0002313018640001302
表17:FVIII 265(在N-末端具有五甘氨酸的FVIII单链分子)的核苷酸序列(SEQID NO:102)
Figure BDA0002313018640001311
Figure BDA0002313018640001321
表18:FVIII 265(在N-末端具有五甘氨酸的FVIII单链分子:五甘氨酸以粗体示出)的蛋白质序列(SEQ ID NO:103)
Figure BDA0002313018640001322
Figure BDA0002313018640001331
实施例20:HemA和FVIII/VWF双敲除(DKO)血浆中FVIII198的血浆稳定性和PK
将FVIII 198(它是包含部分B-结构域的单链FVIIIFc分子-226N6;其中226表示FVIII B-结构域的N-末端226个氨基酸,并且N6表示B-结构域中的六个N-糖基化位点)的血浆稳定性与FVIII/VWF双敲除(DKO)血浆中的单链FVIIIFc(FVIII 155/Fc)进行比较。FVIII155和FVIII198的示意图在图25中可见。
对于稳定性测定,将5IU/ml FVIII 198或FVIIIFc蛋白质与小鼠或DKO血浆在37℃下温育。在不同时间点收集等分试样以用于通过FVIII显色测定的活性测量。每个时间点的活性测量两次,并且将平均活性绘制为时间的函数。在稳定性测定中,部分B-结构域的存在增加了单链FVIIIFc的稳定性(图26A)。
还将FVIII 198(单链-B226N6)的半衰期还与DKO小鼠中的FVIII155(单链B-结构域缺失的FVIII)进行比较。FVIII 198的半衰期比FVIII155长至少约1.5倍(图26B)。这些实验暗示FVIII稳定性与其体内半衰期之间可能存在相关性。
FVIII198核苷酸序列(具有部分B-结构域的FVIIIFc,226N6)(SEQ ID NO:104)
Figure BDA0002313018640001332
Figure BDA0002313018640001341
Figure BDA0002313018640001351
FVIII 198蛋白质序列(SEQ ID NO:105)
Figure BDA0002313018640001361
实施例21:VWF的D1D2蛋白的表达
D’D3结构域的正确折叠对其结合FVIII是必要的。VWF原肽(D1D2-第1-763位氨基酸)对于D’D3的二硫键有效形成和折叠是必要的。其作为D’D3折叠的内部分子伴侣。制备VWF构建体的VWF片段可在VWF原肽(即D1D2结构域)直接连接至D’D3结构域时表达,并且在D’D3的常规细胞内加工期间移除(即顺式),或它可从其它质粒表达(即反式)。我们以其中D1D2以顺式或反式表达的方式设计FVIII-VWF异源二聚体。
克隆VWF 053:VWF 053克隆表达VWF原肽(D1D2结构域),从而以反式表达D1D2。VWF原肽使用ESC54和ESC124从全长进行PCR扩增。
具有BsiW1位点的ESC54-VWF-正向引物(SEQ ID NO:111)
Figure BDA0002313018640001362
具有Not1位点的ESC 124-D1D2克隆寡核苷酸-反向引物(SEQ ID NO:112)
Figure BDA0002313018640001363
PCR产物用BsiW1和Not1消化并且连接至BsiW1/Not1消化的pCDNA 4。
VWF 053(VWF D1D2-原肽)的核苷酸序列(SEQ ID NO:113)
Figure BDA0002313018640001371
VWF 053(VWF D1D2-原肽)的蛋白质序列(SEQ ID NO:114)
Figure BDA0002313018640001381
上述具体实施方案的描述完全揭示了本发明的一般特性,使得其他人可通过应用本领域技能范围内的知识,无需过度实验即可容易地修改和/或调整此类具体实施方案,以用于各种应用,而不脱离本发明的一般概念。因此,基于本文提供的教导和引导,此类调整和修改旨在处于所公开的实施方案的等同形式的意义和范围内。应当理解,本文的措辞或术语出于描述而不是限制目的,使得技术人员可根据教导和引导解释本说明书的术语或措辞。
考虑到本文所公开的本发明的描述和实施,本发明的其它实施方案对于本领域的技术人员将显而易见。预期描述和实施例仅被视为示例性的,以下权利要求书将指明本发明的真实范围和精神。
本文引用的所有专利和专利公布全文以引用方式并入本文。
序列表
<110> 比奥贝拉蒂治疗公司
<120> 嵌合因子VIII多肽及其用途
<130> 2159.359PC04/EKS/C-K/E-H
<140> 待指定
<141> 2013-01-11
<150> US 61/586,099
<151> 2012-01-12
<150> US 61/586,654
<151> 2012-01-13
<150> US 61/667,901
<151> 2012-07-03
<150> US 61/734,954
<151> 2012-12-07
<160> 114
<170> PatentIn 3.5版
<210> 1
<211> 16842
<212> DNA
<213> 智人
<400> 1
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc tactaaggac ggtctaaacg 120
gccccacgac gaacgagacc gggagtaaaa cggtccctgg gaaacacgtc ttccttgagc 180
gccgtccagt aggtgccggg gatgcagcct tttcggaagt gacttcgtca acacctttga 240
tgggagcatg tacagctttg cgggatactg cagttacctc ctggcagggg gctgccagaa 300
ctacgtcgga aaagccttca ctgaagcagt tgtggaaact accctcgtac atgtcgaaac 360
gccctatgac gtcaatggag gaccgtcccc cgacggtctt acgctccttc tcgattattg 420
gggacttcca gaatggcaag agagtgagcc tctccgtgta tcttggggaa ttttttgaca 480
tccatttgtt tgtcaatggt tgcgaggaag agctaataac ccctgaaggt cttaccgttc 540
tctcactcgg agaggcacat agaacccctt aaaaaactgt aggtaaacaa acagttacca 600
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 660
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct tggcactgtg tccccctggt 720
ttctcagagg tacgggatac ggaggtttcc cgacatagat ctttgactcc gacccatgat 780
gttcgacagg ccactccgga atggctttgt ggccaggatc gatggcagcg gcaactttca 840
agtcctgctg tcagacagat acttcaacaa gacctgcggg ctgtgtggca actttaacat 900
taccgaaaca ccggtcctag ctaccgtcgc cgttgaaagt tcaggacgac agtctgtcta 960
tgaagttgtt ctggacgccc gacacaccgt tgaaattgta ctttgctgaa gatgacttta 1020
tgacccaaga agggaccttg acctcggacc cttatgactt tgccaactca tgggctctga 1080
gcagtggaga acagtggtgt gaaacgactt ctactgaaat actgggttct tccctggaac 1140
tggagcctgg gaatactgaa acggttgagt acccgagact cgtcacctct tgtcaccaca 1200
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 1260
ctgtgggagc agtgccagct tctgaagagc acctcggtgt cttgcccgta gaggagggtc 1320
gtcgagtacg ttgtagagga gaccccttta cgtcttcccg gacaccctcg tcacggtcga 1380
agacttctcg tggagccaca ttgcccgctg ccaccctctg gtggaccccg agccttttgt 1440
ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg ctggagtgcg cctgccctgc 1500
aacgggcgac ggtgggagac cacctggggc tcggaaaaca ccgggacaca ctcttctgaa 1560
acacactcac acgacccccc gacctcacgc ggacgggacg cctcctggag tacgcccgga 1620
cctgtgccca ggagggaatg gtgctgtacg gctggaccga ccacagcgcg tgcagcccag 1680
tgtgccctgc tggtatggag ggaggacctc atgcgggcct ggacacgggt cctcccttac 1740
cacgacatgc cgacctggct ggtgtcgcgc acgtcgggtc acacgggacg accatacctc 1800
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 1860
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg atatccgtca cacacagggg 1920
aacgcggtcc tggacggtct cggacgtgta gttactttac acagtcctcg ctacgcacct 1980
accgacgtcg acgggactcc gacagctcct ggatgaaggc ctctgcgtgg agagcaccga 2040
gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc acctccctct ctcgagactg 2100
ctgtcgagga cctacttccg gagacgcacc tctcgtggct cacagggacg cacgtaaggc 2160
ctttcgcgat gggagggccg tggagggaga gagctctgac caacacctgc atttgccgaa 2220
acagccagtg gatctgcagc aatgaagaat gtccagggga gtgccttgtc actggtcaat 2280
cccacttcaa gagctttgac gttgtggacg taaacggctt tgtcggtcac ctagacgtcg 2340
ttacttctta caggtcccct cacggaacag tgaccagtta gggtgaagtt ctcgaaactg 2400
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 2460
cactccttct ccattgtcat tgagactgtc cagtgtgctg ttgtctatga agtggaagtc 2520
accctagacg gtcatggacg accgggccct aacggtcctg gtgaggaaga ggtaacagta 2580
actctgacag gtcacacgac atgaccgcga cgctgtgtgc acccgctccg tcaccgtccg 2640
gctgcctggc ctgcacaaca gccttgtgaa actgaagcat ggggcaggag ttgccatgga 2700
tactggcgct gcgacacacg tgggcgaggc agtggcaggc cgacggaccg gacgtgttgt 2760
cggaacactt tgacttcgta ccccgtcctc aacggtacct tggccaggac atccagctcc 2820
ccctcctgaa aggtgacctc cgcatccagc atacagtgac ggcctccgtg cgcctcagct 2880
acggggagga cctgcagatg accggtcctg taggtcgagg gggaggactt tccactggag 2940
gcgtaggtcg tatgtcactg ccggaggcac gcggagtcga tgcccctcct ggacgtctac 3000
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 3060
tgcggcctgt gtgggaatta caatggcaac cagggcgacg ctgaccctac cggcgccctc 3120
cgacgaccac ttcgacaggg ggcagatacg gcccttctgg acgccggaca cacccttaat 3180
gttaccgttg gtcccgctgc acttccttac cccctctggg ctggcrgagc cccgggtgga 3240
ggacttcggg aacgcctgga agctgcacgg ggactgccag gacctgcaga agcagcacag 3300
tgaaggaatg ggggagaccc gaccgyctcg gggcccacct cctgaagccc ttgcggacct 3360
tcgacgtgcc cctgacggtc ctggacgtct tcgtcgtgtc cgatccctgc gccctcaacc 3420
cgcgcatgac caggttctcc gaggaggcgt gcgcggtcct gacgtccccc acattcgagg 3480
cctgccatcg tgccgtcagc gctagggacg cgggagttgg gcgcgtactg gtccaagagg 3540
ctcctccgca cgcgccagga ctgcaggggg tgtaagctcc ggacggtagc acggcagtcg 3600
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 3660
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg ggcgacggga tggacgcctt 3720
gacggcgatg ctgcacacga ggacgagcct gccggcgctc acggacacgc cgcgggaccg 3780
gtcgatacgg cgccggacgc cggggagagg cgtgcgcgtc gcgtggcgcg agccaggccg 3840
ctgtgagctg aactgcccga aaggccaggt gtacctgcag tgcgggaccc cctgcaacct 3900
gcccctctcc gcacgcgcag cgcaccgcgc tcggtccggc gacactcgac ttgacgggct 3960
ttccggtcca catggacgtc acgccctggg ggacgttgga gacctgccgc tctctctctt 4020
acccggatga ggaatgcaat gaggcctgcc tggagggctg cttctgcccc ccagggctct 4080
acatggatga gaggggggac ctggacggcg agagagagaa tgggcctact ccttacgtta 4140
ctccggacgg acctcccgac gaagacgggg ggtcccgaga tgtacctact ctcccccctg 4200
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 4260
atcttctcag accatcacac catgtgctac tgtgaggatg acgcacgggt tccgggtcac 4320
ggggacaatg atactgccac tctagaaggt cggtcttctg tagaagagtc tggtagtgtg 4380
gtacacgatg acactcctac gcttcatgca ctgtaccatg agtggagtcc ccggaagctt 4440
gctgcctgac gctgtcctca gcagtcccct gtctcatcgc agcaaaagga gcctatcctg 4500
cgaagtacgt gacatggtac tcacctcagg ggccttcgaa cgacggactg cgacaggagt 4560
cgtcagggga cagagtagcg tcgttttcct cggataggac tcggcccccc atggtcaagc 4620
tggtgtgtcc cgctgacaac ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga 4680
actatgacct ggagtgcatg agccgggggg taccagttcg accacacagg gcgactgttg 4740
gacgcccgac ttcccgagct cacatggttt tgcacggtct tgatactgga cctcacgtac 4800
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 4860
tgtgtggccc tggaaaggtg tccctgcttc catcagggca tcgtacccga cacagagacc 4920
gacggagacg gggggcccgt accaggccgt actcttgtct acacaccggg acctttccac 4980
agggacgaag gtagtcccgt aggagtatgc ccctggagaa acagtgaaga ttggctgcaa 5040
cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac catgtgtgtg atgccacgtg 5100
tcctcatacg gggacctctt tgtcacttct aaccgacgtt gtgaacacag acagccctgg 5160
ccttcacctt gacgtgtctg gtacacacac tacggtgcac ctccacgatc ggcatggccc 5220
actacctcac cttcgacggg ctcaaatacc tgttccccgg ggagtgccag tacgttctgg 5280
tgcaggatta ctgcggcagt gaggtgctag ccgtaccggg tgatggagtg gaagctgccc 5340
gagtttatgg acaaggggcc cctcacggtc atgcaagacc acgtcctaat gacgccgtca 5400
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 5460
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgggaccct ggaaagccta 5520
ggatcacccc ttattcccta cgtcggtggg gagtcacttt acgttctttg cccagtggta 5580
ggaccacctc cctcctctct ttgagctgtt tgacggggag gtgaatgtga agaggcccat 5640
gaaggatgag actcactttg aggtggtgga gtctggccgg tacatcattc tgctgctggg 5700
aactcgacaa actgcccctc cacttacact tctccgggta cttcctactc tgagtgaaac 5760
tccaccacct cagaccggcc atgtagtaag acgacgaccc caaagccctc tccgtggtct 5820
gggaccgcca cctgagcatc tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg 5880
gcctgtgtgg gaattttgat gtttcgggag aggcaccaga ccctggcggt ggactcgtag 5940
aggcaccagg acttcgtctg tatggtcctc tttcacacac cggacacacc cttaaaacta 6000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 6060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccgtaggtct tgttactgga 6120
gtggtcgtcg ttggaggttc acctccttct gggacacctg aaacccttga ggacctttca 6180
ctcgagcgtc acacgactgt ccagaaaagt gcctctggac tcatcccctg ccacctgcca 6240
taacaacatc atgaagcaga cgatggtgga ttcctcctgt agaatcctta ccagtgacgt 6300
ggtcttttca cggagacctg agtaggggac ggtggacggt attgttgtag tacttcgtct 6360
gctaccacct aaggaggaca tcttaggaat ggtcactgca cttccaggac tgcaacaagc 6420
tggtggaccc cgagccatat ctggatgtct gcatttacga cacctgctcc tgtgagtcca 6480
ttggggactg cgcctgcttc gaaggtcctg acgttgttcg accacctggg gctcggtata 6540
gacctacaga cgtaaatgct gtggacgagg acactcaggt aacccctgac gcggacgaag 6600
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 6660
aggacggcca cattgtgccc ccagagctgc gaggagagga acgctgtggt aacgacggat 6720
acgggtgcac acacgggtcg taccgttcca ccactggacc tcctgccggt gtaacacggg 6780
ggtctcgacg ctcctctcct atctccggga gaacgggtat gagtgtgagt ggcgctataa 6840
cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct gagccactgg cctgccctgt 6900
tagaggccct cttgcccata ctcacactca ccgcgatatt gtcgacacgt ggacggacag 6960
ttcagtgcac agtcgtggga ctcggtgacc ggacgggaca gcagtgtgtg gagggctgcc 7020
atgcccactg ccctccaggg aaaatcctgg atgagctttt gcagacctgc gttgaccctg 7080
aagactgtcc agtgtgtgag cgtcacacac ctcccgacgg tacgggtgac gggaggtccc 7140
ttttaggacc tactcgaaaa cgtctggacg caactgggac ttctgacagg tcacacactc 7200
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 7260
cactgccaga tttgccactg tgatgttgtc aacctcacct caccgaccgg ccgcaaaacg 7320
gagtcctttc tttcagtgga acttagggtc actgggactc gtgacggtct aaacggtgac 7380
actacaacag ttggagtgga gtgaagcctg ccaggagccg ggaggcctgg tggtgcctcc 7440
cacagatgcc ccggtgagcc ccaccactct gtatgtggag gacatctcgg aaccgccgtt 7500
cacttcggac ggtcctcggc cctccggacc accacggagg gtgtctacgg ggccactcgg 7560
ggtggtgaga catacacctc ctgtagagcc ttggcggcaa gcacgatttc tactgcagca 7620
ggctactgga cctggtcttc ctgctggatg gctcctccag gctgtccgag gctgagtttg 7680
aagtgctgaa ggcctttgtg cgtgctaaag atgacgtcgt ccgatgacct ggaccagaag 7740
gacgacctac cgaggaggtc cgacaggctc cgactcaaac ttcacgactt ccggaaacac 7800
gtggacatga tggagcggct gcgcatctcc cagaagtggg tccgcgtggc cgtggtggag 7860
taccacgacg gctcccacgc ctacatcggg ctcaaggacc cacctgtact acctcgccga 7920
cgcgtagagg gtcttcaccc aggcgcaccg gcaccacctc atggtgctgc cgagggtgcg 7980
gatgtagccc gagttcctgg ggaagcgacc gtcagagctg cggcgcattg ccagccaggt 8040
gaagtatgcg ggcagccagg tggcctccac cagcgaggtc ttgaaataca cactgttcca 8100
ccttcgctgg cagtctcgac gccgcgtaac ggtcggtcca cttcatacgc ccgtcggtcc 8160
accggaggtg gtcgctccag aactttatgt gtgacaaggt aatcttcagc aagatcgacc 8220
gccctgaagc ctcccgcatc gccctgctcc tgatggccag ccaggagccc caacggatgt 8280
cccggaactt tgtccgctac ttagaagtcg ttctagctgg cgggacttcg gagggcgtag 8340
cgggacgagg actaccggtc ggtcctcggg gttgcctaca gggccttgaa acaggcgatg 8400
gtccagggcc tgaagaagaa gaaggtcatt gtgatcccgg tgggcattgg gccccatgcc 8460
aacctcaagc agatccgcct catcgagaag caggcccctg caggtcccgg acttcttctt 8520
cttccagtaa cactagggcc acccgtaacc cggggtacgg ttggagttcg tctaggcgga 8580
gtagctcttc gtccggggac agaacaaggc cttcgtgctg agcagtgtgg atgagctgga 8640
gcagcaaagg gacgagatcg ttagctacct ctgtgacctt gcccctgaag cccctcctcc 8700
tcttgttccg gaagcacgac tcgtcacacc tactcgacct cgtcgtttcc ctgctctagc 8760
aatcgatgga gacactggaa cggggacttc ggggaggagg tactctgccc cccgacatgg 8820
cacaagtcac tgtgggcccg gggctcttgg gggtttcgac cctggggccc aagaggaact 8880
ccatggttct ggatgtggcg atgagacggg gggctgtacc gtgttcagtg acacccgggc 8940
cccgagaacc cccaaagctg ggaccccggg ttctccttga ggtaccaaga cctacaccgc 9000
ttcgtcctgg aaggatcgga caaaattggt gaagccgact tcaacaggag caaggagttc 9060
atggaggagg tgattcagcg gatggatgtg ggccaggaca aagcaggacc ttcctagcct 9120
gttttaacca cttcggctga agttgtcctc gttcctcaag tacctcctcc actaagtcgc 9180
ctacctacac ccggtcctgt gcatccacgt cacggtgctg cagtactcct acatggtgac 9240
cgtggagtac cccttcagcg aggcacagtc caaaggggac atcctgcagc gggtgcgaga 9300
cgtaggtgca gtgccacgac gtcatgagga tgtaccactg gcacctcatg gggaagtcgc 9360
tccgtgtcag gtttcccctg taggacgtcg cccacgctct gatccgctac cagggcggca 9420
acaggaccaa cactgggctg gccctgcggt acctctctga ccacagcttc ttggtcagcc 9480
agggtgaccg ggagcaggcg ctaggcgatg gtcccgccgt tgtcctggtt gtgacccgac 9540
cgggacgcca tggagagact ggtgtcgaag aaccagtcgg tcccactggc cctcgtccgc 9600
cccaacctgg tctacatggt caccggaaat cctgcctctg atgagatcaa gaggctgcct 9660
ggagacatcc aggtggtgcc cattggagtg ggccctaatg gggttggacc agatgtacca 9720
gtggccttta ggacggagac tactctagtt ctccgacgga cctctgtagg tccaccacgg 9780
gtaacctcac ccgggattac ccaacgtgca ggagctggag aggattggct ggcccaatgc 9840
ccctatcctc atccaggact ttgagacgct cccccgagag gctcctgacc tggtgctgca 9900
ggttgcacgt cctcgacctc tcctaaccga ccgggttacg gggataggag taggtcctga 9960
aactctgcga gggggctctc cgaggactgg accacgacgt gaggtgctgc tccggagagg 10020
ggctgcagat ccccaccctc tcccctgcac ctgactgcag ccagcccctg gacgtgatcc 10080
ttctcctgga tggctcctcc ctccacgacg aggcctctcc ccgacgtcta ggggtgggag 10140
aggggacgtg gactgacgtc ggtcggggac ctgcactagg aagaggacct accgaggagg 10200
agtttcccag cttcttattt tgatgaaatg aagagtttcg ccaaggcttt catttcaaaa 10260
gccaatatag ggcctcgtct cactcaggtg tcagtgctgc tcaaagggtc gaagaataaa 10320
actactttac ttctcaaagc ggttccgaaa gtaaagtttt cggttatatc ccggagcaga 10380
gtgagtccac agtcacgacg agtatggaag catcaccacc attgacgtgc catggaacgt 10440
ggtcccggag aaagcccatt tgctgagcct tgtggacgtc atgcagcggg agggaggccc 10500
tcataccttc gtagtggtgg taactgcacg gtaccttgca ccagggcctc tttcgggtaa 10560
acgactcgga acacctgcag tacgtcgccc tccctccggg cagccaaatc ggggatgcct 10620
tgggctttgc tgtgcgatac ttgacttcag aaatgcatgg tgccaggccg ggagcctcaa 10680
aggcggtggt catcctggtc gtcggtttag cccctacgga acccgaaacg acacgctatg 10740
aactgaagtc tttacgtacc acggtccggc cctcggagtt tccgccacca gtaggaccag 10800
acggacgtct ctgtggattc agtggatgca gcagctgatg ccgccaggtc caacagagtg 10860
acagtgttcc ctattggaat tggagatcgc tacgatgcag tgcctgcaga gacacctaag 10920
tcacctacgt cgtcgactac ggcggtccag gttgtctcac tgtcacaagg gataacctta 10980
acctctagcg atgctacgtc cccagctacg gatcttggca ggcccagcag gcgactccaa 11040
cgtggtgaag ctccagcgaa tcgaagacct ccctaccatg gtcaccttgg gcaattcctt 11100
gggtcgatgc ctagaaccgt ccgggtcgtc cgctgaggtt gcaccacttc gaggtcgctt 11160
agcttctgga gggatggtac cagtggaacc cgttaaggaa cctccacaaa ctgtgctctg 11220
gatttgttag gatttgcatg gatgaggatg ggaatgagaa gaggcccggg gacgtctgga 11280
ccttgccaga ccagtgccac ggaggtgttt gacacgagac ctaaacaatc ctaaacgtac 11340
ctactcctac ccttactctt ctccgggccc ctgcagacct ggaacggtct ggtcacggtg 11400
accgtgactt gccagccaga tggccagacc ttgctgaaga gtcatcgggt caactgtgac 11460
cgggggctga ggccttcgtg ccctaacagc cagtcccctg tggcactgaa cggtcggtct 11520
accggtctgg aacgacttct cagtagccca gttgacactg gcccccgact ccggaagcac 11580
gggattgtcg gtcaggggac ttaaagtgga agagacctgt ggctgccgct ggacctgccc 11640
ctgygtgtgc acaggcagct ccactcggca catcgtgacc tttgatgggc agaatttcaa 11700
aatttcacct tctctggaca ccgacggcga cctggacggg gacrcacacg tgtccgtcga 11760
ggtgagccgt gtagcactgg aaactacccg tcttaaagtt gctgactggc agctgttctt 11820
atgtcctatt tcaaaacaag gagcaggacc tggaggtgat tctccataat ggtgcctgca 11880
gccctggagc aaggcagggc cgactgaccg tcgacaagaa tacaggataa agttttgttc 11940
ctcgtcctgg acctccacta agaggtatta ccacggacgt cgggacctcg ttccgtcccg 12000
tgcatgaaat ccatcgaggt gaagcacagt gccctctccg tcgagstgca cagtgacatg 12060
gaggtgacgg tgaatgggag actggtctct gttccttacg acgtacttta ggtagctcca 12120
cttcgtgtca cgggagaggc agctcsacgt gtcactgtac ctccactgcc acttaccctc 12180
tgaccagaga caaggaatgc tgggtgggaa catggaagtc aacgtttatg gtgccatcat 12240
gcatgaggtc agattcaatc accttggtca catcttcaca ttcactccac aaaacaatga 12300
acccaccctt gtaccttcag ttgcaaatac cacggtagta cgtactccag tctaagttag 12360
tggaaccagt gtagaagtgt aagtgaggtg ttttgttact gttccaactg cagctcagcc 12420
ccaagacttt tgcttcaaag acgtatggtc tgtgtgggat ctgtgatgag aacggagcca 12480
atgacttcat gctgagggat caaggttgac gtcgagtcgg ggttctgaaa acgaagtttc 12540
tgcataccag acacacccta gacactactc ttgcctcggt tactgaagta cgactcccta 12600
ggcacagtca ccacagactg gaaaacactt gttcaggaat ggactgtgca gcggccaggg 12660
cagacgtgcc agcccatcct ggaggagcag tgtcttgtcc ccgtgtcagt ggtgtctgac 12720
cttttgtgaa caagtcctta cctgacacgt cgccggtccc gtctgcacgg tcgggtagga 12780
cctcctcgtc acagaacagg ccgacagctc ccactgccag gtcctcctct taccactgtt 12840
tgctgaatgc cacaaggtcc tggctccagc cacattctat gccatctgcc agcaggacag 12900
ggctgtcgag ggtgacggtc caggaggaga atggtgacaa acgacttacg gtgttccagg 12960
accgaggtcg gtgtaagata cggtagacgg tcgtcctgtc ttgccaccag gagcaagtgt 13020
gtgaggtgat cgcctcttat gcccacctct gtcggaccaa cggggtctgc gttgactgga 13080
ggacacctga tttctgtgct aacggtggtc ctcgttcaca cactccacta gcggagaata 13140
cgggtggaga cagcctggtt gccccagacg caactgacct cctgtggact aaagacacga 13200
atgtcatgcc caccatctct ggtctacaac cactgtgagc atggctgtcc ccggcactgt 13260
gatggcaacg tgagctcctg tggggaccat ccctccgaag tacagtacgg gtggtagaga 13320
ccagatgttg gtgacactcg taccgacagg ggccgtgaca ctaccgttgc actcgaggac 13380
acccctggta gggaggcttc gctgtttctg ccctccagat aaagtcatgt tggaaggcag 13440
ctgtgtccct gaagaggcct gcactcagtg cattggtgag gatggagtcc agcaccagtt 13500
cgacaaagac gggaggtcta tttcagtaca accttccgtc gacacaggga cttctccgga 13560
cgtgagtcac gtaaccactc ctacctcagg tcgtggtcaa cctggaagcc tgggtcccgg 13620
accaccagcc ctgtcagatc tgcacatgcc tcagcgggcg gaaggtcaac tgcacaacgc 13680
agccctgccc cacggccaaa ggaccttcgg acccagggcc tggtggtcgg gacagtctag 13740
acgtgtacgg agtcgcccgc cttccagttg acgtgttgcg tcgggacggg gtgccggttt 13800
gctcccacgt gtggcctgtg tgaagtagcc cgcctccgcc agaatgcaga ccagtgctgc 13860
cccgagtatg agtgtgtgtg tgacccagtg agctgtgacc cgagggtgca caccggacac 13920
acttcatcgg gcggaggcgg tcttacgtct ggtcacgacg gggctcatac tcacacacac 13980
actgggtcac tcgacactgg tgcccccagt gcctcactgt gaacgtggcc tccagcccac 14040
actgaccaac cctggcgagt gcagacccaa cttcacctgc gcctgcagga aggaggagtg 14100
acgggggtca cggagtgaca cttgcaccgg aggtcgggtg tgactggttg ggaccgctca 14160
cgtctgggtt gaagtggacg cggacgtcct tcctcctcac caaaagagtg tccccaccct 14220
cctgcccccc gcaccgtttg cccacccttc ggaagaccca gtgctgtgat gagtatgagt 14280
gtgcctgcaa ctgtgtcaac gttttctcac aggggtggga ggacgggggg cgtggcaaac 14340
gggtgggaag ccttctgggt cacgacacta ctcatactca cacggacgtt gacacagttg 14400
tccacagtga gctgtcccct tgggtacttg gcctcaaccg ccaccaatga ctgtggctgt 14460
accacaacca cctgccttcc cgacaaggtg tgtgtccacc aggtgtcact cgacagggga 14520
acccatgaac cggagttggc ggtggttact gacaccgaca tggtgttggt ggacggaagg 14580
gctgttccac acacaggtgg gaagcaccat ctaccctgtg ggccagttct gggaggaggg 14640
ctgcgatgtg tgcacctgca ccgacatgga ggatgccgtg atgggcctcc gcgtggccca 14700
cttcgtggta gatgggacac ccggtcaaga ccctcctccc gacgctacac acgtggacgt 14760
ggctgtacct cctacggcac tacccggagg cgcaccgggt gtgctcccag aagccctgtg 14820
aggacagctg tcggtcgggc ttcacttacg ttctgcatga aggcgagtgc tgtggaaggt 14880
gcctgccatc tgcctgtgag cacgagggtc ttcgggacac tcctgtcgac agccagcccg 14940
aagtgaatgc aagacgtact tccgctcacg acaccttcca cggacggtag acggacactc 15000
gtggtgactg gctcaccgcg gggggactcc cagtcttcct ggaagagtgt cggctcccag 15060
tgggcctccc cggagaaccc ctgcctcatc aatgagtgtg caccactgac cgagtggcgc 15120
ccccctgagg gtcagaagga ccttctcaca gccgagggtc acccggaggg gcctcttggg 15180
gacggagtag ttactcacac tccgagtgaa ggaggaggtc tttatacaac aaaggaacgt 15240
ctcctgcccc cagctggagg tccctgtctg cccctcgggc tttcagctga gctgtaagac 15300
aggctcactt cctcctccag aaatatgttg tttccttgca gaggacgggg gtcgacctcc 15360
agggacagac ggggagcccg aaagtcgact cgacattctg ctcagcgtgc tgcccaagct 15420
gtcgctgtga gcgcatggag gcctgcatgc tcaatggcac tgtcattggg cccgggaaga 15480
ctgtgatgat cgatgtgtgc gagtcgcacg acgggttcga cagcgacact cgcgtacctc 15540
cggacgtacg agttaccgtg acagtaaccc gggcccttct gacactacta gctacacacg 15600
acgacctgcc gctgcatggt gcaggtgggg gtcatctctg gattcaagct ggagtgcagg 15660
aagaccacct gcaacccctg ccccctgggt tacaaggaag tgctggacgg cgacgtacca 15720
cgtccacccc cagtagagac ctaagttcga cctcacgtcc ttctggtgga cgttggggac 15780
gggggaccca atgttccttc aaaataacac aggtgaatgt tgtgggagat gtttgcctac 15840
ggcttgcacc attcagctaa gaggaggaca gatcatgaca ctgaagcgtg atgagacgct 15900
ttttattgtg tccacttaca acaccctcta caaacggatg ccgaacgtgg taagtcgatt 15960
ctcctcctgt ctagtactgt gacttcgcac tactctgcga ccaggatggc tgtgatactc 16020
acttctgcaa ggtcaatgag agaggagagt acttctggga gaagagggtc acaggctgcc 16080
caccctttga tgaacacaag ggtcctaccg acactatgag tgaagacgtt ccagttactc 16140
tctcctctca tgaagaccct cttctcccag tgtccgacgg gtgggaaact acttgtgttc 16200
tgtcttgctg agggaggtaa aattatgaaa attccaggca cctgctgtga cacatgtgag 16260
gagcctgagt gcaacgacat cactgccagg ctgcagtatg acagaacgac tccctccatt 16320
ttaatacttt taaggtccgt ggacgacact gtgtacactc ctcggactca cgttgctgta 16380
gtgacggtcc gacgtcatac tcaaggtggg aagctgtaag tctgaagtag aggtggatat 16440
ccactactgc cagggcaaat gtgccagcaa agccatgtac tccattgaca tcaacgatgt 16500
agttccaccc ttcgacattc agacttcatc tccacctata ggtgatgacg gtcccgttta 16560
cacggtcgtt tcggtacatg aggtaactgt agttgctaca gcaggaccag tgctcctgct 16620
gctctccgac acggacggag cccatgcagg tggccctgca ctgcaccaat ggctctgttg 16680
tgtaccatga ggttctcaat cgtcctggtc acgaggacga cgagaggctg tgcctgcctc 16740
gggtacgtcc accgggacgt gacgtggtta ccgagacaac acatggtact ccaagagtta 16800
gccatggagt gcaaatgctc ccccaggaag tgcagcaagt ga 16842
<210> 2
<211> 2813
<212> PRT
<213> 智人
<220>
<221> misc_feature
<222> (1)..(22)
<223> VWF信号肽
<220>
<221> misc_feature
<222> (23)..(763)
<223> VWF D1D2区
<220>
<221> misc_feature
<222> (764)..(866)
<223> VWF D'结构域
<220>
<221> misc_feature
<222> (867)..(1240)
<223> VWF D3结构域
<220>
<221> misc_feature
<222> (1241)..(1479)
<223> VWF A1结构域
<220>
<221> misc_feature
<222> (2016)..(2016)
<223> Xaa可以是任何天然存在的氨基酸
<400> 2
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr
1235 1240 1245
Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser
1250 1255 1260
Glu Pro Pro Leu His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu
1265 1270 1275
Val Phe Leu Leu Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe
1280 1285 1290
Glu Val Leu Lys Ala Phe Val Val Asp Met Met Glu Arg Leu Arg
1295 1300 1305
Ile Ser Gln Lys Trp Val Arg Val Ala Val Val Glu Tyr His Asp
1310 1315 1320
Gly Ser His Ala Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser
1325 1330 1335
Glu Leu Arg Arg Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln
1340 1345 1350
Val Ala Ser Thr Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile
1355 1360 1365
Phe Ser Lys Ile Asp Arg Pro Glu Ala Ser Arg Ile Ala Leu Leu
1370 1375 1380
Leu Met Ala Ser Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val
1385 1390 1395
Arg Tyr Val Gln Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro
1400 1405 1410
Val Gly Ile Gly Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile
1415 1420 1425
Glu Lys Gln Ala Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val
1430 1435 1440
Asp Glu Leu Glu Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys
1445 1450 1455
Asp Leu Ala Pro Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met
1460 1465 1470
Ala Gln Val Thr Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu
1475 1480 1485
Gly Pro Lys Arg Asn Ser Met Val Leu Asp Val Ala Phe Val Leu
1490 1495 1500
Glu Gly Ser Asp Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys
1505 1510 1515
Glu Phe Met Glu Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp
1520 1525 1530
Ser Ile His Val Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val
1535 1540 1545
Glu Tyr Pro Phe Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln
1550 1555 1560
Arg Val Arg Glu Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr
1565 1570 1575
Gly Leu Ala Leu Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser
1580 1585 1590
Gln Gly Asp Arg Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr
1595 1600 1605
Gly Asn Pro Ala Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile
1610 1615 1620
Gln Val Val Pro Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu
1625 1630 1635
Leu Glu Arg Ile Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp
1640 1645 1650
Phe Glu Thr Leu Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg
1655 1660 1665
Cys Cys Ser Gly Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala
1670 1675 1680
Pro Asp Cys Ser Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly
1685 1690 1695
Ser Ser Ser Phe Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe
1700 1705 1710
Ala Lys Ala Phe Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr
1715 1720 1725
Gln Val Ser Val Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val
1730 1735 1740
Pro Trp Asn Val Val Pro Glu Lys Ala His Leu Leu Ser Leu Val
1745 1750 1755
Asp Val Met Gln Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala
1760 1765 1770
Leu Gly Phe Ala Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala
1775 1780 1785
Arg Pro Gly Ala Ser Lys Ala Val Val Ile Leu Val Thr Asp Val
1790 1795 1800
Ser Val Asp Ser Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn
1805 1810 1815
Arg Val Thr Val Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala
1820 1825 1830
Ala Gln Leu Arg Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val
1835 1840 1845
Val Lys Leu Gln Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu
1850 1855 1860
Gly Asn Ser Phe Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile
1865 1870 1875
Cys Met Asp Glu Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp
1880 1885 1890
Thr Leu Pro Asp Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly
1895 1900 1905
Gln Thr Leu Leu Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu
1910 1915 1920
Arg Pro Ser Cys Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu
1925 1930 1935
Thr Cys Gly Cys Arg Trp Thr Cys Pro Cys Val Cys Thr Gly Ser
1940 1945 1950
Ser Thr Arg His Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu
1955 1960 1965
Thr Gly Ser Cys Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp
1970 1975 1980
Leu Glu Val Ile Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg
1985 1990 1995
Gln Gly Cys Met Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser
2000 2005 2010
Val Glu Xaa His Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu
2015 2020 2025
Val Ser Val Pro Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr
2030 2035 2040
Gly Ala Ile Met His Glu Val Arg Phe Asn His Leu Gly His Ile
2045 2050 2055
Phe Thr Phe Thr Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser
2060 2065 2070
Pro Lys Thr Phe Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys
2075 2080 2085
Asp Glu Asn Gly Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val
2090 2095 2100
Thr Thr Asp Trp Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg
2105 2110 2115
Pro Gly Gln Thr Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val
2120 2125 2130
Pro Asp Ser Ser His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala
2135 2140 2145
Glu Cys His Lys Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys
2150 2155 2160
Gln Gln Asp Ser Cys His Gln Glu Gln Val Cys Glu Val Ile Ala
2165 2170 2175
Ser Tyr Ala His Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp
2180 2185 2190
Arg Thr Pro Asp Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val
2195 2200 2205
Tyr Asn His Cys Glu His Gly Cys Pro Arg His Cys Asp Gly Asn
2210 2215 2220
Val Ser Ser Cys Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro
2225 2230 2235
Pro Asp Lys Val Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala
2240 2245 2250
Cys Thr Gln Cys Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu
2255 2260 2265
Glu Ala Trp Val Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys
2270 2275 2280
Leu Ser Gly Arg Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr
2285 2290 2295
Ala Lys Ala Pro Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg
2300 2305 2310
Gln Asn Ala Asp Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp
2315 2320 2325
Pro Val Ser Cys Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly
2330 2335 2340
Leu Gln Pro Thr Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe
2345 2350 2355
Thr Cys Ala Cys Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro
2360 2365 2370
Ser Cys Pro Pro His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys
2375 2380 2385
Cys Asp Glu Tyr Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val
2390 2395 2400
Ser Cys Pro Leu Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys
2405 2410 2415
Gly Cys Thr Thr Thr Thr Cys Leu Pro Asp Lys Val Cys Val His
2420 2425 2430
Arg Ser Thr Ile Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys
2435 2440 2445
Asp Val Cys Thr Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu
2450 2455 2460
Arg Val Ala Gln Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg
2465 2470 2475
Ser Gly Phe Thr Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg
2480 2485 2490
Cys Leu Pro Ser Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly
2495 2500 2505
Asp Ser Gln Ser Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser
2510 2515 2520
Pro Glu Asn Pro Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu
2525 2530 2535
Glu Val Phe Ile Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu
2540 2545 2550
Val Pro Val Cys Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser
2555 2560 2565
Ala Cys Cys Pro Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met
2570 2575 2580
Leu Asn Gly Thr Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp
2585 2590 2595
Val Cys Thr Thr Cys Arg Cys Met Val Gln Val Gly Val Ile Ser
2600 2605 2610
Gly Phe Lys Leu Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro
2615 2620 2625
Leu Gly Tyr Lys Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg
2630 2635 2640
Cys Leu Pro Thr Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile
2645 2650 2655
Met Thr Leu Lys Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr
2660 2665 2670
His Phe Cys Lys Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys
2675 2680 2685
Arg Val Thr Gly Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala
2690 2695 2700
Glu Gly Gly Lys Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr
2705 2710 2715
Cys Glu Glu Pro Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr
2720 2725 2730
Val Lys Val Gly Ser Cys Lys Ser Glu Val Glu Val Asp Ile His
2735 2740 2745
Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp
2750 2755 2760
Ile Asn Asp Val Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg
2765 2770 2775
Thr Glu Pro Met Gln Val Ala Leu His Cys Thr Asn Gly Ser Val
2780 2785 2790
Val Tyr His Glu Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro
2795 2800 2805
Arg Lys Cys Ser Lys
2810
<210> 3
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 多肽
<400> 3
Pro Lys Asn Ser Ser Met Ile Ser Asn Thr Pro
1 5 10
<210> 4
<211> 7
<212> PRT
<213> 人工
<220>
<223> 多肽
<400> 4
His Gln Ser Leu Gly Thr Gln
1 5
<210> 5
<211> 8
<212> PRT
<213> 人工
<220>
<223> 多肽
<400> 5
His Gln Asn Leu Ser Asp Gly Lys
1 5
<210> 6
<211> 8
<212> PRT
<213> 人工
<220>
<223> 多肽
<400> 6
His Gln Asn Ile Ser Asp Gly Lys
1 5
<210> 7
<211> 8
<212> PRT
<213> 人工
<220>
<223> 多肽
<400> 7
Val Ile Ser Ser His Leu Gly Gln
1 5
<210> 8
<211> 20
<212> PRT
<213> 人工
<220>
<223> PAS序列
<400> 8
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala
20
<210> 9
<211> 20
<212> PRT
<213> 人工
<220>
<223> PAS序列
<400> 9
Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro
1 5 10 15
Ala Ala Pro Ser
20
<210> 10
<211> 20
<212> PRT
<213> 人工
<220>
<223> PAS序列
<400> 10
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser Ser
20
<210> 11
<211> 19
<212> PRT
<213> 人工
<220>
<223> PAS序列
<400> 11
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser
<210> 12
<211> 20
<212> PRT
<213> 人工
<220>
<223> PAS序列
<400> 12
Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro
1 5 10 15
Ser Ser Pro Ala
20
<210> 13
<211> 24
<212> PRT
<213> 人工
<220>
<223> PAS序列
<400> 13
Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro
1 5 10 15
Ala Ala Pro Ser Ala Pro Pro Ala
20
<210> 14
<211> 20
<212> PRT
<213> 人工
<220>
<223> PAS序列
<400> 14
Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro
1 5 10 15
Ser Ala Ala Ala
20
<210> 15
<211> 19
<212> PRT
<213> 人工
<220>
<223> FVIII信号肽
<400> 15
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser
<210> 16
<211> 2332
<212> PRT
<213> 智人
<400> 16
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 17
<211> 7053
<212> DNA
<213> 智人
<400> 17
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340
ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400
atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460
gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520
cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580
catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640
aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700
tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760
agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820
tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880
aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940
aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct 3000
gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac 3060
aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta 3120
attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa 3180
gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta 3240
aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa 3300
gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc 3360
ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg 3420
caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag 3480
aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta 3540
ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat 3600
ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag 3660
gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag 3720
aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac 3780
ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca 3840
aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga 3900
aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca 3960
agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca 4020
ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc 4080
aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag 4140
aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct 4200
caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct 4260
atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat 4320
agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat 4380
aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc 4440
ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg 4500
aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat 4560
cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg 4620
gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct 4680
ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta 4740
ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa 4800
tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg 4860
aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa 4920
atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca 4980
gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa 5040
attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 5100
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 5160
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 5220
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 5280
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 5340
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 5400
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 5460
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 5520
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 5580
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 5640
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 5700
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 5760
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 5820
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 5880
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 5940
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 6000
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 6060
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 6120
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 6180
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 6240
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 6300
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 6360
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 6420
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 6480
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 6540
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 6600
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 6660
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 6720
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 6780
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 6840
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 6900
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 6960
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 7020
gaggttctgg gctgcgaggc acaggacctc tac 7053
<210> 18
<211> 1438
<212> PRT
<213> 人工
<220>
<223> BDD FVIII
<400> 18
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 19
<211> 4371
<212> DNA
<213> 人工
<220>
<223> BDD FVIII
<400> 19
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371
<210> 20
<211> 500
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 20
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
50 55 60
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70 75 80
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
85 90 95
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
100 105 110
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
115 120 125
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
145 150 155 160
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
165 170 175
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
180 185 190
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
210 215 220
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
225 230 235 240
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
245 250 255
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
260 265 270
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
275 280 285
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
290 295 300
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
305 310 315 320
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
325 330 335
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
340 345 350
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
355 360 365
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
370 375 380
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
385 390 395 400
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
405 410 415
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
420 425 430
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
435 440 445
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
450 455 460
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
465 470 475 480
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
485 490 495
Gly Gly Gly Ser
500
<210> 21
<211> 800
<212> PRT
<213> 人工
<220>
<223> 连接基
<220>
<221> 重复
<222> (1)..(300)
<223> Gly-Gly-Ser重复1至100次
<220>
<221> 重复
<222> (301)..(800)
<223> Gly-Gly-Gly-Gly-Ser重复1至100次
<400> 21
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
20 25 30
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
35 40 45
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
50 55 60
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
85 90 95
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
100 105 110
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
115 120 125
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
130 135 140
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
145 150 155 160
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
165 170 175
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
180 185 190
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
195 200 205
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
210 215 220
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
225 230 235 240
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
245 250 255
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
260 265 270
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
275 280 285
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly Gly
290 295 300
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
305 310 315 320
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
325 330 335
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
340 345 350
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
355 360 365
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
370 375 380
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
385 390 395 400
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
405 410 415
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
420 425 430
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
435 440 445
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
450 455 460
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
465 470 475 480
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
485 490 495
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
500 505 510
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
515 520 525
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
530 535 540
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
545 550 555 560
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
565 570 575
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
580 585 590
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
595 600 605
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
610 615 620
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
625 630 635 640
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
645 650 655
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
660 665 670
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
675 680 685
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
690 695 700
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
705 710 715 720
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
725 730 735
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
740 745 750
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
755 760 765
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
770 775 780
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
785 790 795 800
<210> 22
<211> 7
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 22
Ser Gly Gly Ser Gly Gly Ser
1 5
<210> 23
<211> 15
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 23
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly
1 5 10 15
<210> 24
<211> 16
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 24
Gly Gly Ser Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 25
<211> 18
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 25
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser
<210> 26
<211> 15
<212> PRT
<213> 人工
<220>
<223> 连接基
<220>
<221> 重复
<222> (1)..(15)
<223> Gly-Gly-Gly-Gly-Ser重复1至3次
<400> 26
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 27
<211> 100
<212> PRT
<213> 人工
<220>
<223> 连接基
<220>
<221> 重复
<222> (1)..(100)
<223> Gly-Gly-Gly-Gly-Ser重复1至20次
<400> 27
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
50 55 60
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70 75 80
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
85 90 95
Gly Gly Gly Ser
100
<210> 28
<211> 15
<212> PRT
<213> 人工
<220>
<223> 连接基
<220>
<221> 重复
<222> (1)..(15)
<223> Gly-Gly-Gly-Gly-Ser重复1至3次
<400> 28
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 29
<211> 7
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> FXIa切割位点
<400> 29
Lys Leu Thr Arg Ala Glu Thr
1 5
<210> 30
<211> 7
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> FXIa切割位点
<400> 30
Asp Phe Thr Arg Val Val Gly
1 5
<210> 31
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> FXIIa切割位点
<400> 31
Thr Met Thr Arg Ile Val Gly Gly
1 5
<210> 32
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> 激肽释放酶切割位点
<400> 32
Ser Pro Phe Arg Ser Thr Gly Gly
1 5
<210> 33
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> FVIIa切割位点
<400> 33
Leu Gln Val Arg Ile Val Gly Gly
1 5
<210> 34
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> FIXa切割位点
<400> 34
Pro Leu Gly Arg Ile Val Gly Gly
1 5
<210> 35
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> FXa切割位点
<400> 35
Ile Glu Gly Arg Thr Val Gly Gly
1 5
<210> 36
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> FIIa(凝血酶)切割位点
<400> 36
Leu Thr Pro Arg Ser Leu Leu Val
1 5
<210> 37
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> 弹性蛋白酶-2切割位点
<400> 37
Leu Gly Pro Val Ser Gly Val Pro
1 5
<210> 38
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> 粒酶-B切割位点
<400> 38
Val Ala Gly Asp Ser Leu Glu Glu
1 5
<210> 39
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> MMP-12切割位点
<400> 39
Gly Pro Ala Gly Leu Gly Gly Ala
1 5
<210> 40
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> MMP-13切割位点
<400> 40
Gly Pro Ala Gly Leu Arg Gly Ala
1 5
<210> 41
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> MMP-17切割位点
<400> 41
Ala Pro Leu Gly Leu Arg Leu Arg
1 5
<210> 42
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> MMP-20切割位点
<400> 42
Pro Ala Leu Pro Leu Val Ala Gln
1 5
<210> 43
<211> 7
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (6)..(7)
<223> TEV切割位点
<400> 43
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 44
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> 肠激酶切割位点
<400> 44
Asp Asp Asp Lys Ile Val Gly Gly
1 5
<210> 45
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (6)..(7)
<223> 蛋白酶C (PRESCISSION)切割位点
<400> 45
Leu Glu Val Leu Phe Gln Gly Pro
1 5
<210> 46
<211> 8
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<220>
<221> misc_feature
<222> (4)..(5)
<223> 分选酶A
<400> 46
Leu Pro Lys Thr Gly Ser Glu Ser
1 5
<210> 47
<211> 9
<212> PRT
<213> 人工
<220>
<223> 可切割的连接基
<400> 47
Thr Gln Ser Phe Asn Asp Phe Thr Arg
1 5
<210> 48
<211> 10
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 48
Ser Val Ser Gln Thr Ser Lys Leu Thr Arg
1 5 10
<210> 49
<211> 10
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 49
Asp Phe Leu Ala Glu Gly Gly Gly Val Arg
1 5 10
<210> 50
<211> 7
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 50
Thr Thr Lys Ile Lys Pro Arg
1 5
<210> 51
<211> 10
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 51
Ala Leu Arg Pro Arg Val Val Gly Gly Ala
1 5 10
<210> 52
<211> 4
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 52
Arg Arg Arg Arg
1
<210> 53
<211> 6
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 53
Arg Lys Arg Arg Lys Arg
1 5
<210> 54
<211> 5
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 54
Arg Arg Arg Arg Ser
1 5
<210> 55
<211> 5
<212> PRT
<213> 人工
<220>
<223> 切割位点
<400> 55
Leu Val Pro Arg Gly
1 5
<210> 56
<211> 25
<212> PRT
<213> 人工
<220>
<223> 切割和连接基位点
<400> 56
Thr Leu Asp Pro Arg Ser Phe Leu Leu Arg Asn Pro Asn Asp Lys Tyr
1 5 10 15
Glu Pro Phe Trp Glu Asp Glu Glu Lys
20 25
<210> 57
<211> 99
<212> DNA
<213> 人工
<220>
<223> 具有VIII信号和pSYN VWF-001的BsiW1位点的ESC48-Fwd-VWF-D'D3
<400> 57
tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60
ttgcgattct gctttagcct atcctgtcgg ccccccatg 99
<210> 58
<211> 68
<212> DNA
<213> 人工
<220>
<223> 具有6His和pSYN VWF-001的Not1位点的ESC50-Rev-VWF-部分D'D3(1-276个氨基酸)
<400> 58
tgacctcgag cggccgctca gtggtgatgg tgatgatgca gaggcacttt tctggtgtca 60
gcacactg 68
<210> 59
<211> 99
<212> DNA
<213> 人工
<220>
<223> 具有VIII信号和pSYN VWF-002的BsiW1位点的ESC48-Fwd-VWF-D'D3
<400> 59
tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60
ttgcgattct gctttagcct atcctgtcgg ccccccatg 99
<210> 60
<211> 71
<212> DNA
<213> 人工
<220>
<223> 具有6His和pSYN VWF-002的Not1位点的ESC51-Rev-VWF D'D3(1-477个氨基酸)
<400> 60
tgacctcgag cggccgctca gtggtgatgg tgatgatgcc tgctgcagta gaaatcgtgc 60
aacggcggtt c 71
<210> 61
<211> 99
<212> DNA
<213> 人工
<220>
<223> 具有VIII信号和pSYN VWF-003的BsiW1位点的ESC48-Fwd-VWF-D'D3
<400> 61
tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60
ttgcgattct gctttagcct atcctgtcgg ccccccatg 99
<210> 62
<211> 65
<212> DNA
<213> 人工
<220>
<223> 具有6His和pSYN VWF-003的Not1位点的ESC52-Rev-VWF-D'D3部分A1(1-511个氨基酸)
<400> 62
tgacctcgag cggccgctca gtggtgatgg tgatgatggc ccacagtgac ttgtgccatg 60
tgggg 65
<210> 63
<211> 99
<212> DNA
<213> 人工
<220>
<223> 具有VIII信号和pSYN VWF-004的BsiW1位点的ESC48-Fwd-VWF-D'D3
<400> 63
tcgcgacgta cggccgccac catgcaaata gagctctcca cctgcttctt tctgtgcctt 60
ttgcgattct gctttagcct atcctgtcgg ccccccatg 99
<210> 64
<211> 65
<212> DNA
<213> 人工
<220>
<223> 具有6His和pSYN VWF-004的Not1位点的ESC53-Rev-VWF-D'D3A1(1-716个氨基酸)
<400> 64
tgacctcgag cggccgctca gtggtgatgg tgatgatggc ccacagtgac ttgtgccatg 60
tgggg 65
<210> 65
<211> 1313
<212> DNA
<213> 人工
<220>
<223> 克隆载体
<400> 65
ggatcctagt ggggaataag ggatgcagcc acccctcagt gaaatgcaag aaacgggtca 60
ccatcctggt ggagggagga gagattgagc tgtttgacgg ggaggtgaat gtgaagaggc 120
ccatgaagga tgagactcac tttgaggtgg tggagtctgg ccggtacatc attctgctgc 180
tgggcaaagc cctctccgtg gtctgggacc gccacctgag catctccgtg gtcctgaagc 240
agacatacca ggagaaagtg tgtggcctgt gtgggaattt tgatggcatc cagaacaatg 300
acctcaccag cagcaacctc caagtggagg aagaccctgt ggactttggg aactcctgga 360
aagtgagctc gcagtgtgct gacaccagaa aagtgcctct ggactcatcc cctgccacct 420
gccataacaa catcatgaag cagacgatgg tggattcctc ctgtagaatc cttaccagtg 480
acgtcttcca ggactgcaac aagctggtgg accccgagcc atatctggat gtctgcattt 540
acgacacctg ctcctgtgag tccattgggg actgcgcctg cttctgcgac accattgctg 600
cctatgccca cgtgtgtgcc cagcatggca aggtggtgac ctggaggacg gccacattgt 660
gcccccagag ctgcgaggag aggaatctcc gggagaacgg gtatgagtgt gagtggcgct 720
ataacagctg tgcacctgcc tgtcaagtca cgtgtcagca ccctgagcca ctggcctgcc 780
ctgtgcagtg tgtggagggc tgccatgccc actgccctcc agggaaaatc ctggatgagc 840
ttttgcagac ctgcgttgac cctgaagact gtccagtgtg tgaggtggct ggccggcgtt 900
ttgcctcagg aaagaaagtc accttgaatc ccagtgaccc tgagcactgc cagatttgcc 960
actgtgatgt tgtcaacctc acctgtgaag cctgccagga gccgggaggc ctggtggtgc 1020
ctcccacaga tgccccggtg agccccacca ctctgtatgt ggatgagacg ctccaggatg 1080
gctgtgatac tcacttctgc aaggtcaatg agagaggaga gtacttctgg gagaagaggg 1140
tcacaggctg cccacccttt gatgaacaca agtgtcttgc tgagggaggt aaaattatga 1200
aaattccagg cacctgctgt gacacatgtg aggagcctga gtgcaacgac atcactgcca 1260
ggctgcagta tgtcaaggtg ggaagctgta agtctgaagt agaggtggat atc 1313
<210> 66
<211> 32
<212> DNA
<213> 人工
<220>
<223> 具有Nhe1位点的ESC 89-fwd
<400> 66
ctcactatag ggagacccaa gctggctagc cg 32
<210> 67
<211> 43
<212> DNA
<213> 人工
<220>
<223> 具有Sal1的ESC 91-rev
<400> 67
ctggatcccg ggagtcgact cgtcagtggt gatggtgatg atg 43
<210> 68
<211> 92
<212> DNA
<213> 人工
<220>
<223> 具有FVIII信号序列和BsiW1位点的LW 22-FWD-VWF-D'D3
<400> 68
gcgccggccg tacgatgcaa atagagctct ccacctgctt ctttctgtgc cttttgcgat 60
tctgctttag cctatcctgt cggcccccca tg 92
<210> 69
<211> 47
<212> DNA
<213> 人工
<220>
<223> 具有终止密码子和Not1位点的LW 23-Rev-Fc
<400> 69
tcatcaatgt atcttatcat gtctgaattc gcggccgctc atttacc 47
<210> 70
<211> 41
<212> DNA
<213> 人工
<220>
<223> 具有BsiW1位点的LW24-Fwd-VWF D1D2D'D3克隆寡核苷酸
<400> 70
gcgccggccg tacgatgatt cctgccagat ttgccggggt g 41
<210> 71
<211> 41
<212> DNA
<213> 人工
<220>
<223> 具有EcoRV的LW27-Rev-VWF D'D3寡核苷酸
<400> 71
ccaccgccag atatcggctc ctggcaggct tcacaggtga g 41
<210> 72
<211> 1240
<212> PRT
<213> 人工
<220>
<223> VWF-D1D2D'D3
<400> 72
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro
1235 1240
<210> 73
<211> 477
<212> PRT
<213> 人工
<220>
<223> VWF-D'D3
<400> 73
Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp
1 5 10 15
Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr
20 25 30
Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro
35 40 45
Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys
50 55 60
Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys
65 70 75 80
Ile Gly Cys Asn Thr Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr
85 90 95
Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr
100 105 110
Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr
115 120 125
Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile
130 135 140
Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys
145 150 155 160
Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly
165 170 175
Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val
180 185 190
Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser
195 200 205
Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr
210 215 220
Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln
225 230 235 240
Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val
245 250 255
Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg
260 265 270
Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met
275 280 285
Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val
290 295 300
Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
305 310 315 320
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys
325 330 335
Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly
340 345 350
Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu
355 360 365
Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn
370 375 380
Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu
385 390 395 400
Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro
405 410 415
Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp
420 425 430
Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys
435 440 445
Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys
450 455 460
Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro
465 470 475
<210> 74
<211> 30
<212> PRT
<213> 人工
<220>
<223> VWF-D'D3结构域(1-477aa;C336A/C379A突变)
<220>
<221> 重复
<222> (1)..(30)
<223> Gly-Gly-Gly-Gly-Ser重复6次
<400> 74
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
<210> 75
<211> 5
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 75
Arg Arg Arg Arg Ser
1 5
<210> 76
<211> 6
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 76
Arg Lys Arg Arg Lys Arg
1 5
<210> 77
<211> 24
<212> DNA
<213> 人工
<220>
<223> 具有Cla1的ESC17-Fwd-VWF克隆寡核苷酸
<400> 77
gtccggcatg agaatcgatg tgtg 24
<210> 78
<211> 31
<212> DNA
<213> 人工
<220>
<223> 具有EcoRV的ESC41-Rev-VWF
<400> 78
cctccaccgc cagatatcag aggcactttt c 31
<210> 79
<211> 105
<212> DNA
<213> 人工
<220>
<223> 具有EcoRV位点的ESC78-Fwd
<400> 79
aaagtgcctc tgatatctgg cggtggaggt tccggtggcg ggggatccgg tggcggggga 60
tccggtggcg ggggatccgg tggcggggga tccctggtcc cccgg 105
<210> 80
<211> 107
<212> DNA
<213> 人工
<220>
<223> 具有RsrII位点的ESC79-Rev
<400> 80
gaagaggaag actgacggtc cgcccaggag ttctggagct gggcacggtg ggcatgtgtg 60
agttttgtcg cctccgctgc cccgggggac cagggatccc ccgccac 107
<210> 81
<211> 48
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 81
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
<210> 82
<211> 1781
<212> DNA
<213> 人工
<220>
<223> pSYN-FVIII-049,它是两个Fc结构域之间具有可切割的连接基的FVIII-Fc构建体;
Genscript-序列号-103069
<400> 82
ccgtcgacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg atgcatgagg 60
ctctgcacaa ccactacacg cagaagagcc tctccctgtc tccgggtaaa cggcgccgcc 120
ggagcggtgg cggcggatca ggtgggggtg gatcaggcgg tggaggttcc ggtggcgggg 180
gatccggcgg tggaggttcc ggtgggggtg gatcaaggaa gaggaggaag agaagcctat 240
cctgtcggcc ccccatggtc aagctggtgt gtcccgctga caacctgcgg gctgaagggc 300
tcgagtgtac caaaacgtgc cagaactatg acctggagtg catgagcatg ggctgtgtct 360
ctggctgcct ctgccccccg ggcatggtcc ggcatgagaa tcgatgtgtg gccctggaaa 420
ggtgtccctg cttccatcag ggcaaggagt atgcccctgg agaaacagtg aagattggct 480
gcaacacttg tgtctgtcgg gaccggaagt ggaactgcac agaccatgtg tgtgatgcca 540
cgtgctccac gatcggcatg gcccactacc tcaccttcga cgggctcaaa tacctgttcc 600
ccggggagtg ccagtacgtt ctggtgcagg attactgcgg cagtaaccct gggacctttc 660
ggatcctagt ggggaataag ggatgcagcc acccctcagt gaaatgcaag aaacgggtca 720
ccatcctggt ggagggagga gagattgagc tgtttgacgg ggaggtgaat gtgaagaggc 780
ccatgaagga tgagactcac tttgaggtgg tggagtctgg ccggtacatc attctgctgc 840
tgggcaaagc cctctccgtg gtctgggacc gccacctgag catctccgtg gtcctgaagc 900
agacatacca ggagaaagtg tgtggcctgt gtgggaattt tgatggcatc cagaacaatg 960
acctcaccag cagcaacctc caagtggagg aagaccctgt ggactttggg aactcctgga 1020
aagtgagctc gcagtgtgct gacaccagaa aagtgcctct ggactcatcc cctgccacct 1080
gccataacaa catcatgaag cagacgatgg tggattcctc ctgtagaatc cttaccagtg 1140
acgtcttcca ggactgcaac aagctggtgg accccgagcc atatctggat gtctgcattt 1200
acgacacctg ctcctgtgag tccattgggg actgcgccgc attctgcgac accattgctg 1260
cctatgccca cgtgtgtgcc cagcatggca aggtggtgac ctggaggacg gccacattgt 1320
gcccccagag ctgcgaggag aggaatctcc gggagaacgg gtatgaggct gagtggcgct 1380
ataacagctg tgcacctgcc tgtcaagtca cgtgtcagca ccctgagcca ctggcctgcc 1440
ctgtgcagtg tgtggagggc tgccatgccc actgccctcc agggaaaatc ctggatgagc 1500
ttttgcagac ctgcgttgac cctgaagact gtccagtgtg tgaggtggct ggccggcgtt 1560
ttgcctcagg aaagaaagtc accttgaatc ccagtgaccc tgagcactgc cagatttgcc 1620
actgtgatgt tgtcaacctc acctgtgaag cctgccagga gccgatcgat ggcggtggag 1680
gttccggtgg cgggggatcc ctggtccccc ggggcagcgg aggcgacaaa actcacacat 1740
gcccaccgtg cccagctcca gaactcctgg gcggaccgtc a 1781
<210> 83
<211> 220
<212> DNA
<213> 人工
<220>
<223> 将Genscript构建体的片段亚克隆至EcoRV/RsrII消化的pSYN-FVIII-0159;
Genscript-序列号-132601
<400> 83
aaagtgcctc tgatatctgg cggtggaggt tccggtggcg ggggatccgg cggtggaggt 60
tccggcggtg gaggttccgg tggcggggga tccggtggcg ggggatccct ggtcccccgg 120
ggcagcggcg gtggaggttc cggtggcggg ggatccgaca aaactcacac atgcccaccg 180
tgcccagctc cagaactcct gggcggaccg tcagtcttcc 220
<210> 84
<211> 73
<212> PRT
<213> 人工
<220>
<223> pSYN-VIII-178在VWF片段和Fc区之间具有73个氨基酸的连接基;
编码73个氨基酸的连接基的DNA片段的合成
<400> 84
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser Gly
50 55 60
Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70
<210> 85
<211> 299
<212> DNA
<213> 人工
<220>
<223> Genscript-序列号-144849
<400> 85
gcctgccagg agccgatatc tggcggtgga ggttccggtg gcgggggatc cggcggtgga 60
ggttccggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggtggcggg 120
ggatccggcg gtggaggttc cggcggtgga ggttccggtg gcgggggatc cggtggcggg 180
ggatccctgg tcccccgggg cagcggcggt ggaggttccg gtggcggggg atccgacaaa 240
actcacacat gcccccgtgc ccagctccag aactcctggg cggaccgtca gtcttcctc 299
<210> 86
<211> 98
<212> PRT
<213> 人工
<220>
<223> 连接基
<400> 86
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
50 55 60
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
65 70 75 80
Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
85 90 95
Gly Ser
<210> 87
<211> 380
<212> DNA
<213> 人工
<220>
<223> Genscript-序列号-144849
<400> 87
gcctgccagg agccgatatc tggcggtgga ggttccggtg gcgggggatc cggcggtgga 60
ggttccggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggtggcggg 120
ggatccggcg gtggaggttc cggcggtgga ggttccggtg gcgggggatc cggcggtgga 180
ggttccggtg gcgggggatc cggcggtgga ggttccggcg gtggaggttc cggtggcggg 240
ggatccggtg gcgggggatc cctggtcccc cggggcagcg gcggtggagg ttccggtggc 300
gggggatccg acaaaactca cacatgccca ccgtgcccag ctccagaact cctgggcgga 360
ccgtcagtct tcctcttccc 380
<210> 88
<211> 2449
<212> PRT
<213> 人工
<220>
<223> FVIII-VWF-Fc异源二聚体
<400> 88
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1010 1015 1020
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1025 1030 1035
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1040 1045 1050
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1055 1060 1065
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1070 1075 1080
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1085 1090 1095
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1100 1105 1110
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1115 1120 1125
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1130 1135 1140
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1145 1150 1155
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1160 1165 1170
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1175 1180 1185
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1190 1195 1200
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1205 1210 1215
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1220 1225 1230
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1250 1255 1260
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1265 1270 1275
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1280 1285 1290
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1295 1300 1305
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1310 1315 1320
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1325 1330 1335
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1340 1345 1350
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1355 1360 1365
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1370 1375 1380
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1385 1390 1395
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1400 1405 1410
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1415 1420 1425
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1430 1435 1440
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr Asp
1445 1450 1455
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly
1460 1465 1470
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
1475 1480 1485
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
1490 1495 1500
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
1505 1510 1515
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
1520 1525 1530
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
1535 1540 1545
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
1550 1555 1560
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
1565 1570 1575
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp
1580 1585 1590
Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
1595 1600 1605
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
1610 1615 1620
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
1625 1630 1635
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
1640 1645 1650
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
1655 1660 1665
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
1670 1675 1680
Lys Arg Arg Arg Arg Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1685 1690 1695
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1700 1705 1710
Ser Gly Gly Gly Gly Ser Arg Lys Arg Arg Lys Arg Ser Leu Ser
1715 1720 1725
Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu
1730 1735 1740
Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp
1745 1750 1755
Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro
1760 1765 1770
Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg
1775 1780 1785
Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr
1790 1795 1800
Val Lys Ile Gly Cys Asn Thr Cys Val Cys Arg Asp Arg Lys Trp
1805 1810 1815
Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly
1820 1825 1830
Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro
1835 1840 1845
Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn
1850 1855 1860
Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His
1865 1870 1875
Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly
1880 1885 1890
Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro
1895 1900 1905
Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr
1910 1915 1920
Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
1925 1930 1935
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys
1940 1945 1950
Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp
1955 1960 1965
Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe
1970 1975 1980
Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys
1985 1990 1995
Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met
2000 2005 2010
Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp
2015 2020 2025
Val Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu
2030 2035 2040
Asp Val Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp
2045 2050 2055
Cys Ala Ala Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys
2060 2065 2070
Ala Gln His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys
2075 2080 2085
Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu
2090 2095 2100
Ala Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr
2105 2110 2115
Cys Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu
2120 2125 2130
Gly Cys His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu
2135 2140 2145
Leu Gln Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val
2150 2155 2160
Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro
2165 2170 2175
Ser Asp Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn
2180 2185 2190
Leu Thr Cys Glu Ala Cys Gln Glu Pro Ile Asp Gly Gly Gly Gly
2195 2200 2205
Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Asp
2210 2215 2220
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly
2225 2230 2235
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
2240 2245 2250
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
2255 2260 2265
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
2270 2275 2280
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
2285 2290 2295
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
2300 2305 2310
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
2315 2320 2325
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
2330 2335 2340
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp
2345 2350 2355
Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
2360 2365 2370
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
2375 2380 2385
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
2390 2395 2400
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
2405 2410 2415
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
2420 2425 2430
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
2435 2440 2445
Lys
<210> 89
<211> 48
<212> PRT
<213> 人工
<220>
<223> 48个氨基酸的连接基
<400> 89
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
<210> 90
<211> 1665
<212> PRT
<213> 人工
<220>
<223> pSYN-FVIII-155成熟蛋白
<400> 90
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Ala His
740 745 750
Gln Ala Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr Asp Lys Thr His Thr
1430 1435 1440
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
1445 1450 1455
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
1460 1465 1470
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
1475 1480 1485
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
1490 1495 1500
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr
1505 1510 1515
Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
1520 1525 1530
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
1535 1540 1545
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
1550 1555 1560
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
1565 1570 1575
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
1580 1585 1590
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
1595 1600 1605
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
1610 1615 1620
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
1625 1630 1635
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
1640 1645 1650
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
1655 1660 1665
<210> 91
<211> 5052
<212> DNA
<213> 人工
<220>
<223> pSYN-FVIII-155
<400> 91
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acccaccagt cttgaaagcc catcaggcgg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact 4380
cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc 4440
cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg 4500
gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag 4560
gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc 4620
agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc 4680
tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc 4740
cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc 4800
agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtgggagagc 4860
aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc 4920
ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc 4980
tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg 5040
tctccgggta aa 5052
<210> 92
<211> 19
<212> PRT
<213> 人工
<220>
<223> GFVIII-159
<400> 92
Ile Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg
1 5 10 15
Gly Ser Gly
<210> 93
<211> 34
<212> PRT
<213> 人工
<220>
<223> GFVIII-160
<400> 93
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly
20 25 30
Ser Gly
<210> 94
<211> 48
<212> PRT
<213> 人工
<220>
<223> FVIII-064
<400> 94
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
<210> 95
<211> 48
<212> PRT
<213> 人工序列
<220>
<223> VWF031
<400> 95
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
<210> 96
<211> 73
<212> PRT
<213> 人工序列
<220>
<223> VWF035
<400> 96
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser Gly
50 55 60
Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70
<210> 97
<211> 98
<212> PRT
<213> 人工序列
<220>
<223> VWF036
<400> 97
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
35 40 45
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
50 55 60
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
65 70 75 80
Gly Ser Leu Val Pro Arg Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
85 90 95
Gly Ser
<210> 98
<211> 54
<212> PRT
<213> 人工序列
<220>
<223> pSYN-VWF-051连接基
<400> 98
Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Leu Pro Glu Thr Gly Ala Leu Arg Pro Arg Val Val Gly Gly Gly Gly
35 40 45
Ser Gly Gly Gly Gly Ser
50
<210> 99
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> Genewiz-序列号-10-210746313
<400> 99
aggagccgat atctggcggt ggaggttccg gtggcggggg atccggcggt ggaggttccg 60
gcggtggagg ttccggtggc gggggatccg gtggcggggg atccttacct gaaactggag 120
ccctgcggcc ccgggtcgtc ggcggtggag gttccggtgg cgggggatcc gacaaaactc 180
acacatgccc accgtgccca gctccagaac tcctgggcgg accgtcagtc tt 232
<210> 100
<211> 4566
<212> DNA
<213> 人工序列
<220>
<223> pSYN-VWF051
<400> 100
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
atatctggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggcggtgga 3780
ggttccggtg gcgggggatc cggtggcggg ggatccttac ctgaaactgg agccctgcgg 3840
ccccgggtcg tcggcggtgg aggttccggt ggcgggggat ccgacaaaac tcacacatgc 3900
ccaccgtgcc cagctccaga actcctgggc ggaccgtcag tcttcctctt ccccccaaaa 3960
cccaaggaca ccctcatgat ctcccggacc cctgaggtca catgcgtggt ggtggacgtg 4020
agccacgaag accctgaggt caagttcaac tggtacgtgg acggcgtgga ggtgcataat 4080
gccaagacaa agccgcggga ggagcagtac aacagcacgt accgtgtggt cagcgtcctc 4140
accgtcctgc accaggactg gctgaatggc aaggagtaca agtgcaaggt ctccaacaaa 4200
gccctcccag cccccatcga gaaaaccatc tccaaagcca aagggcagcc ccgagaacca 4260
caggtgtaca ccctgccccc atcccgggat gagctgacca agaaccaggt cagcctgacc 4320
tgcctggtca aaggcttcta tcccagcgac atcgccgtgg agtgggagag caatgggcag 4380
ccggagaaca actacaagac cacgcctccc gtgttggact ccgacggctc cttcttcctc 4440
tacagcaagc tcaccgtgga caagagcagg tggcagcagg ggaacgtctt ctcatgctcc 4500
gtgatgcatg aggctctgca caaccactac acgcagaaga gcctctccct gtctccgggt 4560
aaatga 4566
<210> 101
<211> 1521
<212> PRT
<213> 人工序列
<220>
<223> VWF051
<400> 101
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Ala Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Ala Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Gly Gly Gly Ser Gly
1235 1240 1245
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1250 1255 1260
Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Pro Glu Thr Gly Ala
1265 1270 1275
Leu Arg Pro Arg Val Val Gly Gly Gly Gly Ser Gly Gly Gly Gly
1280 1285 1290
Ser Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
1295 1300 1305
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
1310 1315 1320
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
1325 1330 1335
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
1340 1345 1350
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
1355 1360 1365
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
1370 1375 1380
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
1385 1390 1395
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
1400 1405 1410
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
1415 1420 1425
Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
1430 1435 1440
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
1445 1450 1455
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
1460 1465 1470
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
1475 1480 1485
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
1490 1495 1500
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser
1505 1510 1515
Pro Gly Lys
1520
<210> 102
<211> 4389
<212> DNA
<213> 人工序列
<220>
<223> FVIII 265
<400> 102
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgga 60
ggaggaggag gagccaccag aagatactac ctgggtgcag tggaactgtc atgggactat 120
atgcaaagtg atctcggtga gctgcctgtg gacgcaagat ttcctcctag agtgccaaaa 180
tcttttccat tcaacacctc agtcgtgtac aaaaagactc tgtttgtaga attcacggat 240
caccttttca acatcgctaa gccaaggcca ccctggatgg gtctgctagg tcctaccatc 300
caggctgagg tttatgatac agtggtcatt acacttaaga acatggcttc ccatcctgtc 360
agtcttcatg ctgttggtgt atcctactgg aaagcttctg agggagctga atatgatgat 420
cagaccagtc aaagggagaa agaagatgat aaagtcttcc ctggtggaag ccatacatat 480
gtctggcagg tcctgaaaga gaatggtcca atggcctctg acccactgtg ccttacctac 540
tcatatcttt ctcatgtgga cctggtaaaa gacttgaatt caggcctcat tggagcccta 600
ctagtatgta gagaagggag tctggccaag gaaaagacac agaccttgca caaatttata 660
ctactttttg ctgtatttga tgaagggaaa agttggcact cagaaacaaa gaactccttg 720
atgcaggata gggatgctgc atctgctcgg gcctggccta aaatgcacac agtcaatggt 780
tatgtaaaca ggtctctgcc aggtctgatt ggatgccaca ggaaatcagt ctattggcat 840
gtgattggaa tgggcaccac tcctgaagtg cactcaatat tcctcgaagg tcacacattt 900
cttgtgagga accatcgcca ggcgtccttg gaaatctcgc caataacttt ccttactgct 960
caaacactct tgatggacct tggacagttt ctactgtttt gtcatatctc ttcccaccaa 1020
catgatggca tggaagctta tgtcaaagta gacagctgtc cagaggaacc ccaactacga 1080
atgaaaaata atgaagaagc ggaagactat gatgatgatc ttactgattc tgaaatggat 1140
gtggtcaggt ttgatgatga caactctcct tcctttatcc aaattcgctc agttgccaag 1200
aagcatccta aaacttgggt acattacatt gctgctgaag aggaggactg ggactatgct 1260
cccttagtcc tcgcccccga tgacagaagt tataaaagtc aatatttgaa caatggccct 1320
cagcggattg gtaggaagta caaaaaagtc cgatttatgg catacacaga tgaaaccttt 1380
aagactcgtg aagctattca gcatgaatca ggaatcttgg gacctttact ttatggggaa 1440
gttggagaca cactgttgat tatatttaag aatcaagcaa gcagaccata taacatctac 1500
cctcacggaa tcactgatgt ccgtcctttg tattcaagga gattaccaaa aggtgtaaaa 1560
catttgaagg attttccaat tctgccagga gaaatattca aatataaatg gacagtgact 1620
gtagaagatg ggccaactaa atcagatcct cggtgcctga cccgctatta ctctagtttc 1680
gttaatatgg agagagatct agcttcagga ctcattggcc ctctcctcat ctgctacaaa 1740
gaatctgtag atcaaagagg aaaccagata atgtcagaca agaggaatgt catcctgttt 1800
tctgtatttg atgagaaccg aagctggtac ctcacagaga atatacaacg ctttctcccc 1860
aatccagctg gagtgcagct tgaggatcca gagttccaag cctccaacat catgcacagc 1920
atcaatggct atgtttttga tagtttgcag ttgtcagttt gtttgcatga ggtggcatac 1980
tggtacattc taagcattgg agcacagact gacttccttt ctgtcttctt ctctggatat 2040
accttcaaac acaaaatggt ctatgaagac acactcaccc tattcccatt ctcaggagaa 2100
actgtcttca tgtcgatgga aaacccaggt ctatggattc tggggtgcca caactcagac 2160
tttcggaaca gaggcatgac cgccttactg aaggtttcta gttgtgacaa gaacactggt 2220
gattattacg aggacagtta tgaagatatt tcagcatact tgctgagtaa aaacaatgcc 2280
attgaaccaa gaagcttctc tcaaaaccca ccagtcttga aggcccatca ggccgaaata 2340
actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac catatcagtt 2400
gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag cccccgcagc 2460
tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg ggattatggg 2520
atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt ccctcagttc 2580
aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt ataccgtgga 2640
gaactaaatg aacatttggg cctcctcggc ccatatataa gagcagaagt tgaagataat 2700
atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc tagccttatt 2760
tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt caagcctaat 2820
gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa agatgagttt 2880
gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt gcactcaggc 2940
ctgattggac cccttctggt ctgccacact aacacactga accctgctca tgggagacaa 3000
gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa aagctggtac 3060
ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat ggaagatccc 3120
acttttaaag agaattatcg cttccatgca atcaatggct acataatgga tacactacct 3180
ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat gggcagcaat 3240
gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa aaaagaggag 3300
tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga aatgttacca 3360
tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca tgctgggatg 3420
agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat ggcttctgga 3480
cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc cccaaagctg 3540
gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc cttttcttgg 3600
atcaaggtgg atctgttggc accaatgatt attcacggca tcaagaccca gggtgcccgt 3660
cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct tgatgggaag 3720
aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt tggcaatgtg 3780
gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg atacatccgt 3840
ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat gggctgtgat 3900
ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga tgcacagatt 3960
actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa agctcgactt 4020
cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa agagtggctg 4080
caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg agtaaaatct 4140
ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga tggccatcag 4200
tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca agactccttc 4260
acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg aattcacccc 4320
cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga ggcacaggac 4380
ctctactga 4389
<210> 103
<211> 1462
<212> PRT
<213> 人工序列
<220>
<223> FVIII 265
<400> 103
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Gly Gly Gly Gly Gly Ala Thr Arg Arg Tyr Tyr Leu Gly
20 25 30
Ala Val Glu Leu Ser Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu
35 40 45
Pro Val Asp Ala Arg Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe
50 55 60
Asn Thr Ser Val Val Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp
65 70 75 80
His Leu Phe Asn Ile Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu
85 90 95
Gly Pro Thr Ile Gln Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu
100 105 110
Lys Asn Met Ala Ser His Pro Val Ser Leu His Ala Val Gly Val Ser
115 120 125
Tyr Trp Lys Ala Ser Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln
130 135 140
Arg Glu Lys Glu Asp Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr
145 150 155 160
Val Trp Gln Val Leu Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu
165 170 175
Cys Leu Thr Tyr Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu
180 185 190
Asn Ser Gly Leu Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu
195 200 205
Ala Lys Glu Lys Thr Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala
210 215 220
Val Phe Asp Glu Gly Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu
225 230 235 240
Met Gln Asp Arg Asp Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His
245 250 255
Thr Val Asn Gly Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys
260 265 270
His Arg Lys Ser Val Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro
275 280 285
Glu Val His Ser Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn
290 295 300
His Arg Gln Ala Ser Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala
305 310 315 320
Gln Thr Leu Leu Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile
325 330 335
Ser Ser His Gln His Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser
340 345 350
Cys Pro Glu Glu Pro Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu
355 360 365
Asp Tyr Asp Asp Asp Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe
370 375 380
Asp Asp Asp Asn Ser Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys
385 390 395 400
Lys His Pro Lys Thr Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp
405 410 415
Trp Asp Tyr Ala Pro Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys
420 425 430
Ser Gln Tyr Leu Asn Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys
435 440 445
Lys Val Arg Phe Met Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu
450 455 460
Ala Ile Gln His Glu Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu
465 470 475 480
Val Gly Asp Thr Leu Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro
485 490 495
Tyr Asn Ile Tyr Pro His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser
500 505 510
Arg Arg Leu Pro Lys Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu
515 520 525
Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly
530 535 540
Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe
545 550 555 560
Val Asn Met Glu Arg Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu
565 570 575
Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser
580 585 590
Asp Lys Arg Asn Val Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser
595 600 605
Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly
610 615 620
Val Gln Leu Glu Asp Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser
625 630 635 640
Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His
645 650 655
Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe
660 665 670
Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr
675 680 685
Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met
690 695 700
Ser Met Glu Asn Pro Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp
705 710 715 720
Phe Arg Asn Arg Gly Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp
725 730 735
Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala
740 745 750
Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln
755 760 765
Asn Pro Pro Val Leu Lys Ala His Gln Ala Glu Ile Thr Arg Thr Thr
770 775 780
Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val
785 790 795 800
Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln
805 810 815
Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala
820 825 830
Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu
835 840 845
Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val
850 855 860
Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly
865 870 875 880
Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu
885 890 895
Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro
900 905 910
Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln
915 920 925
Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr
930 935 940
Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe
945 950 955 960
Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp
965 970 975
Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr
980 985 990
Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
995 1000 1005
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1010 1015 1020
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1025 1030 1035
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1040 1045 1050
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1055 1060 1065
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1070 1075 1080
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1085 1090 1095
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1100 1105 1110
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1115 1120 1125
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
1130 1135 1140
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
1145 1150 1155
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
1160 1165 1170
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
1175 1180 1185
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
1190 1195 1200
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
1205 1210 1215
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
1220 1225 1230
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
1235 1240 1245
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
1250 1255 1260
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
1265 1270 1275
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
1280 1285 1290
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
1295 1300 1305
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
1310 1315 1320
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
1325 1330 1335
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
1340 1345 1350
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
1355 1360 1365
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
1370 1375 1380
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
1385 1390 1395
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
1400 1405 1410
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
1415 1420 1425
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
1430 1435 1440
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
1445 1450 1455
Gln Asp Leu Tyr
1460
<210> 104
<211> 5691
<212> DNA
<213> 人工序列
<220>
<223> FVIII198
<400> 104
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340
ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400
atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460
gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520
cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580
catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640
aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700
tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760
agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820
tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880
aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940
aaaaatgtat cgtcagaaat aactcgtact actcttcagt cagatcaaga ggaaattgac 3000
tatgatgata ccatatcagt tgaaatgaag aaggaagatt ttgacattta tgatgaggat 3060
gaaaatcaga gcccccgcag ctttcaaaag aaaacacgac actattttat tgctgcagtg 3120
gagaggctct gggattatgg gatgagtagc tccccacatg ttctaagaaa cagggctcag 3180
agtggcagtg tccctcagtt caagaaagtt gttttccagg aatttactga tggctccttt 3240
actcagccct tataccgtgg agaactaaat gaacatttgg gactcctggg gccatatata 3300
agagcagaag ttgaagataa tatcatggta actttcagaa atcaggcctc tcgtccctat 3360
tccttctatt ctagccttat ttcttatgag gaagatcaga ggcaaggagc agaacctaga 3420
aaaaactttg tcaagcctaa tgaaaccaaa acttactttt ggaaagtgca acatcatatg 3480
gcacccacta aagatgagtt tgactgcaaa gcctgggctt atttctctga tgttgacctg 3540
gaaaaagatg tgcactcagg cctgattgga ccccttctgg tctgccacac taacacactg 3600
aaccctgctc atgggagaca agtgacagta caggaatttg ctctgttttt caccatcttt 3660
gatgagacca aaagctggta cttcactgaa aatatggaaa gaaactgcag ggctccctgc 3720
aatatccaga tggaagatcc cacttttaaa gagaattatc gcttccatgc aatcaatggc 3780
tacataatgg atacactacc tggcttagta atggctcagg atcaaaggat tcgatggtat 3840
ctgctcagca tgggcagcaa tgaaaacatc cattctattc atttcagtgg acatgtgttc 3900
actgtacgaa aaaaagagga gtataaaatg gcactgtaca atctctatcc aggtgttttt 3960
gagacagtgg aaatgttacc atccaaagct ggaatttggc gggtggaatg ccttattggc 4020
gagcatctac atgctgggat gagcacactt tttctggtgt acagcaataa gtgtcagact 4080
cccctgggaa tggcttctgg acacattaga gattttcaga ttacagcttc aggacaatat 4140
ggacagtggg ccccaaagct ggccagactt cattattccg gatcaatcaa tgcctggagc 4200
accaaggagc ccttttcttg gatcaaggtg gatctgttgg caccaatgat tattcacggc 4260
atcaagaccc agggtgcccg tcagaagttc tccagcctct acatctctca gtttatcatc 4320
atgtatagtc ttgatgggaa gaagtggcag acttatcgag gaaattccac tggaacctta 4380
atggtcttct ttggcaatgt ggattcatct gggataaaac acaatatttt taaccctcca 4440
attattgctc gatacatccg tttgcaccca actcattata gcattcgcag cactcttcgc 4500
atggagttga tgggctgtga tttaaatagt tgcagcatgc cattgggaat ggagagtaaa 4560
gcaatatcag atgcacagat tactgcttca tcctacttta ccaatatgtt tgccacctgg 4620
tctccttcaa aagctcgact tcacctccaa gggaggagta atgcctggag acctcaggtg 4680
aataatccaa aagagtggct gcaagtggac ttccagaaga caatgaaagt cacaggagta 4740
actactcagg gagtaaaatc tctgcttacc agcatgtatg tgaaggagtt cctcatctcc 4800
agcagtcaag atggccatca gtggactctc ttttttcaga atggcaaagt aaaggttttt 4860
cagggaaatc aagactcctt cacacctgtg gtgaactctc tagacccacc gttactgact 4920
cgctaccttc gaattcaccc ccagagttgg gtgcaccaga ttgccctgag gatggaggtt 4980
ctgggctgcg aggcacagga cctctacgac aaaactcaca catgcccacc gtgcccagct 5040
ccagaactcc tgggcggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 5100
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 5160
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 5220
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 5280
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 5340
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 5400
cccccatccc gggatgagct gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 5460
ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 5520
aagaccacgc ctcccgtgtt ggactccgac ggctccttct tcctctacag caagctcacc 5580
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 5640
ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggtaaatg a 5691
<210> 105
<211> 1896
<212> PRT
<213> 人工序列
<220>
<223> FVIII 198
<400> 105
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Glu Ile Thr Arg Thr Thr Leu
980 985 990
Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu
995 1000 1005
Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln
1010 1015 1020
Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala
1025 1030 1035
Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His
1040 1045 1050
Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys
1055 1060 1065
Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro
1070 1075 1080
Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro
1085 1090 1095
Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg
1100 1105 1110
Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser
1115 1120 1125
Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
1130 1135 1140
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His
1145 1150 1155
His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala
1160 1165 1170
Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
1175 1180 1185
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
1190 1195 1200
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr
1205 1210 1215
Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu
1220 1225 1230
Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr
1235 1240 1245
Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met
1250 1255 1260
Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg
1265 1270 1275
Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile
1280 1285 1290
His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr
1295 1300 1305
Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val
1310 1315 1320
Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu
1325 1330 1335
Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val
1340 1345 1350
Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His
1355 1360 1365
Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp
1370 1375 1380
Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala
1385 1390 1395
Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu
1400 1405 1410
Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln
1415 1420 1425
Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser
1430 1435 1440
Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly
1445 1450 1455
Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys
1460 1465 1470
His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu
1475 1480 1485
His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu
1490 1495 1500
Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu
1505 1510 1515
Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe
1520 1525 1530
Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His
1535 1540 1545
Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro
1550 1555 1560
Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr
1565 1570 1575
Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr
1580 1585 1590
Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp
1595 1600 1605
Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn
1610 1615 1620
Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu
1625 1630 1635
Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln
1640 1645 1650
Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu
1655 1660 1665
Tyr Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
1670 1675 1680
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
1685 1690 1695
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
1700 1705 1710
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
1715 1720 1725
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
1730 1735 1740
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
1745 1750 1755
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
1760 1765 1770
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
1775 1780 1785
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
1790 1795 1800
Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
1805 1810 1815
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
1820 1825 1830
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
1835 1840 1845
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
1850 1855 1860
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
1865 1870 1875
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser
1880 1885 1890
Pro Gly Lys
1895
<210> 106
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 分选酶识别基序
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<400> 106
Leu Pro Xaa Thr Gly
1 5
<210> 107
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 包含半胱氨酸的肽
<400> 107
Gly Gly Gly Ser Gly Cys Gly Gly Gly Ser
1 5 10
<210> 108
<211> 4548
<212> DNA
<213> 人工序列
<220>
<223> VWF 031
<400> 108
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
atatctggcg gtggaggttc cggtggcggg ggatccggcg gtggaggttc cggcggtgga 3780
ggttccggtg gcgggggatc cggtggcggg ggatccctgg tcccccgggg cagcggcggt 3840
ggaggttccg gtggcggggg atccgacaaa actcacacat gcccaccgtg cccagctcca 3900
gaactcctgg gcggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 3960
atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 4020
gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 4080
gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 4140
tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 4200
gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 4260
ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 4320
tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 4380
accacgcctc ccgtgttgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg 4440
gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 4500
cacaaccact acacgcagaa gagcctctcc ctgtctccgg gtaaatga 4548
<210> 109
<211> 1515
<212> PRT
<213> 人工序列
<220>
<223> VWF 031
<400> 109
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Ala Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Ala Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Gly Gly Gly Ser Gly
1235 1240 1245
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1250 1255 1260
Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly Ser
1265 1270 1275
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Lys Thr His Thr
1280 1285 1290
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
1295 1300 1305
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
1310 1315 1320
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
1325 1330 1335
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
1340 1345 1350
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr
1355 1360 1365
Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
1370 1375 1380
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
1385 1390 1395
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
1400 1405 1410
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys
1415 1420 1425
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
1430 1435 1440
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
1445 1450 1455
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
1460 1465 1470
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
1475 1480 1485
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
1490 1495 1500
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
1505 1510 1515
<210> 110
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> 连接基
<220>
<221> 重复
<222> (1)..(5)
<223> Gly-Gly-Gly-Gly-Ser重复
<400> 110
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser
35 40
<210> 111
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 具有BsiW1位点的ESC54-VWF-正向
<400> 111
cgcttcgcga cgtacggccg ccaccatgat tcctgccaga tttgccgggg tgctgcttgc 60
tc 62
<210> 112
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 具有Not1位点的ESC 124-D1D2克隆寡核苷酸-反向
<400> 112
ctagactcga gcggccgctc accttttgct gcgatgagac aggggactgc tgaggacagc 60
<210> 113
<211> 2289
<212> DNA
<213> 人工序列
<220>
<223> VWF 053(VWF D1D2-原肽)
<400> 113
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagg 2289
<210> 114
<211> 763
<212> PRT
<213> 人工序列
<220>
<223> VWF 053(VWF D1D2-原肽)
<400> 114
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg
755 760

Claims (147)

1.一种包含通过共价键连接的因子VIII("FVIII")蛋白和辅助部分(AM)的嵌合蛋白,其中所述辅助部分抑制或阻止内源性VWF结合所述FVIII蛋白。
2.根据权利要求1所述的嵌合蛋白,其中所述共价键在内源性VWF存在下阻止所述辅助部分从所述FVIII蛋白的解离。
3.根据权利要求1或权利要求2所述的嵌合蛋白,其中所述共价键是肽键。
4.根据权利要求1至3中任一项所述的嵌合蛋白,其中所述共价键是二硫键。
5.根据权利要求1至4中任一项所述的嵌合蛋白,其中所述共价键是所述FVIII蛋白和所述辅助部分之间的连接基。
6.根据权利要求1至5中任一项所述的嵌合蛋白,其中所述辅助部分阻止所述FVIII蛋白通过VWF清除途径被清除。
7.根据权利要求1至6中任一项所述的嵌合蛋白,其中所述辅助部分通过屏蔽或阻断所述FVIII蛋白上的VWF结合位点抑制或阻止内源性VWF结合所述FVIII蛋白。
8.根据权利要求7所述的嵌合蛋白,其中所述VWF结合位点位于所述FVIII蛋白的所述A3结构域或所述C2结构域或所述A3结构域和所述C2结构域二者。
9.根据权利要求8所述的嵌合蛋白,其中所述VWF结合位点是与SEQ ID NO:16的第1669至1689位和第2303至2332位氨基酸对应的所述氨基酸序列。
10.根据权利要求1至9中任一项所述的嵌合蛋白,其中所述嵌合蛋白不包含FVIII半衰期限制因子。
11.根据权利要求10所述的嵌合蛋白,其中所述FVIII半衰期限制因子包括全长VWF蛋白或成熟VWF蛋白。
12.根据权利要求1至11中任一项所述的嵌合蛋白,其中在内源性VWF存在下,所述FVIII蛋白的所述半衰期可延长超过所述FVIII蛋白的所述半衰期限制。
13.根据权利要求1至12中任一项所述的嵌合蛋白,其中所述辅助部分具有至少一种VWF样FVIII保护特性。
14.根据权利要求13所述的嵌合蛋白,其中所述VWF样FVIII保护特性包括保护所述FVIII蛋白不被一种或多种蛋白酶切割、保护所述FVIII蛋白不被活化、稳定所述FVIII蛋白的所述重链和/或所述轻链或防止所述FVIII蛋白被一种或多种清除剂受体清除。
15.根据权利要求1至14中任一项所述的嵌合蛋白,其中所述辅助部分包括多肽、非多肽部分或它们二者。
16.根据权利要求15所述的嵌合蛋白,其中所述多肽包含长度为至少约40个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约110个、至少约120个、至少约130个、至少约140个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、至少约500个、至少约550个、至少约600个、至少约650个、至少约700个、至少约750个、至少约800个、至少约850个、至少约900个、至少约950个或至少约1000个氨基酸的氨基酸序列。
17.根据权利要求1至16中任一项所述的嵌合蛋白,其中所述辅助部分包括VWF片段、免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的任何组合。
18.根据权利要求17所述的嵌合蛋白,其中所述非多肽部分包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。
19.根据权利要求17所述的嵌合蛋白,其中所述辅助部分包括包含VWF的D'结构域和D3结构域的VWF片段,其中所述VWF片段通过除所述共价键之外的非共价键与所述FVIII蛋白缔合。
20.根据权利要求17或权利要求19所述的嵌合蛋白,其中所述VWF片段是单体。
21.根据权利要求19或权利要求20所述的嵌合蛋白,其中所述VWF片段包括彼此之间一个或多个连接的两个、三个、四个、五个或六个VWF片段。
22.根据权利要求1至21中任一项所述的嵌合蛋白,其中所述VWF片段包含至少一个异源部分(H1)以及所述VWF片段和所述异源部分(H1)之间的任选的连接基。
23.根据权利要求22所述的嵌合蛋白,其中连接至所述VWF片段的所述至少一个异源部分(H1)包括多肽、非多肽部分或它们二者。
24.根据权利要求22或权利要求23所述的嵌合蛋白,其中所述异源部分(H1)包括延长所述FVIII蛋白的所述半衰期的部分。
25.根据权利要求24所述的嵌合蛋白,其中所述异源部分(H1)包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的任何组合。
26.根据权利要求24所述的嵌合蛋白,其中所述非多肽部分包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。
27.根据权利要求25所述的嵌合蛋白,其中所述异源部分(H1)包括第一Fc区。
28.根据权利要求24所述的嵌合蛋白,其中所述异源部分(H1)包括包含至少约50个氨基酸、至少约100个氨基酸、至少约150个氨基酸、至少约200个氨基酸、至少约250个氨基酸、至少约300个氨基酸、至少约350个氨基酸、至少约400个氨基酸、至少约450个氨基酸、至少约500个氨基酸、至少约550个氨基酸、至少约600个氨基酸、至少约650个氨基酸、至少约700个氨基酸、至少约750个氨基酸、至少约800个氨基酸、至少约850个氨基酸、至少约900个氨基酸、至少约950个氨基酸或至少约1000个氨基酸的氨基酸序列。
29.根据权利要求22所述的嵌合蛋白,其中所述嵌合蛋白包含所述VWF片段和所述异源部分(H1)之间的连接基,所述连接基是可切割的连接基。
30.根据权利要求29所述的嵌合蛋白,其中所述可切割的连接基包含一个或多个可切割位点。
31.根据权利要求29或权利要求30中任一项所述的嵌合蛋白,其中所述可切割的连接基能够被选自由以下组成的组的蛋白酶切割:因子XIa、因子XIIa、激肽释放酶、因子VIIa、因子IXa、因子Xa、因子IIa(凝血酶)、弹性蛋白酶-2、粒酶-B、TEV、肠激酶、蛋白酶3C、分选酶A、MMP-12、MMP-13、MMP-17和MMP-20。
32.根据权利要求29所述的嵌合蛋白,其中所述可切割的连接基包含TLDPRSFLLRNPNDKYEPFWEDEEK(SEQ ID NO:56)。
33.根据权利要求29至32中任一项所述的嵌合蛋白,其中所述可切割的连接基包含一个或多个切割位点,所述切割位点包含选自由以下组成的组的氨基酸序列:RRRR(SEQ IDNO:52)、RKRRKR(SEQ ID NO:53)、RRRRS(SEQ ID NO:54)、TQSFNDFTR(SEQ ID NO:47)、SVSQTSKLTR(SEQ ID NO:48)、DFLAEGGGVR(SEQ ID NO:49)、TTKIKPR(SEQ ID NO:50)、LVPRG(SEQ ID NO:55)、ALRPRVVGGA(SEQ ID NO:51)、KLTRAET(SEQ ID NO:29)、DFTRVVG(SEQ IDNO:30)、TMTRIVGG(SEQ ID NO:31)、SPFRSTGG(SEQ ID NO:32)、LQVRIVGG(SEQ ID NO:33)、PLGRIVGG(SEQ ID NO:34)、IEGRTVGG(SEQ ID NO:35)、LTPRSLLV(SEQ ID NO:36)、LGPVSGVP(SEQ ID NO:37)、VAGDSLEE(SEQ ID NO:38)、GPAGLGGA(SEQ ID NO:39)、GPAGLRGA(SEQ IDNO:40)、APLGLRLR(SEQ ID NO:41)、PALPLVAQ(SEQ ID NO:42)、ENLYFQG(SEQ ID NO:43)、DDDKIVGG(SEQ ID NO:44)、LEVLFQGP(SEQ ID NO:45)和LPKTGSES(SEQ ID NO:46)。
34.根据权利要求1至33中任一项所述的嵌合蛋白,其中所述FVIII蛋白包含FVIII和至少一个异源部分(H2)。
35.根据权利要求34所述的嵌合蛋白,其中所述异源部分(H2)能够延长所述FVIII蛋白的所述半衰期。
36.根据权利要求34或权利要求35所述的嵌合蛋白,其中所述异源部分(H2)包括多肽、非多肽部分或它们二者。
37.根据权利要求34或权利要求35所述的嵌合蛋白,其中所述异源部分(H2)包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的任何组合。
38.根据权利要求34或权利要求35所述的嵌合蛋白,其中所述非多肽部分包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。
39.根据权利要求34所述的嵌合蛋白,其中所述异源部分(H2)包括第二Fc区。
40.根据权利要求1至39中任一项所述的嵌合蛋白,所述嵌合蛋白包含第一多肽链和第二多肽链,所述第一多肽链包含所述VWF片段、第一异源部分和连接基,所述第二多肽链包含所述FVIII蛋白和第二异源部分,其中所述第一多肽链和所述第二多肽链通过共价键彼此连接。
41.根据权利要求40所述的嵌合蛋白,其中所述第一异源部分和所述第二异源部分通过所述共价键彼此连接,其中所述共价键防止体内所述第一多肽链中的所述VWF片段被内源性VWF替换。
42.根据权利要求41所述的嵌合蛋白,其中所述共价键是二硫键。
43.根据权利要求34至42中任一项所述的嵌合蛋白,其中所述FVIII蛋白通过连接基连接至所述第二异源部分(H2)。
44.根据权利要求43所述的嵌合蛋白,其中所述FVIII蛋白和所述第二异源部分之间的所述连接基是可切割的连接基。
45.根据权利要求34至44所述的嵌合蛋白,其中所述第一异源部分(H1)和所述第二异源部分(H2)通过连接基连接。
46.根据权利要求45所述的嵌合蛋白,其中所述连接基是scFc连接基。
47.根据权利要求46所述的嵌合蛋白,其中所述scFc连接基是可加工的连接基。
48.根据权利要求1至47所述的嵌合蛋白包含选自由以下组成的组的式:
(a)V-L1-H1-L3-C-L2-H2,
(b)H2-L2-C-L3-H1-L1-V,
(c)C-L2-H2-L3-V-L1-H1,
(d)H1-L1-V-L3-H2-L2-C,
(e)H1-L1-V-L3-C-L2-H2,
(f)H2-L2-C-L3-V-L1-H1,
(g)V-L1-H1-L3-H2-L2-C,
(h)C-L2-H2-L3-H1-L1-V,
(i)H2-L3-H1-L1-V-L2-C,
(j)C-L2-V-L1-H1-L3-H2,
(k)V-L2-C-L1-H1-L3-H2,和
(l)H2-L3-H1-L1-C-L2-V,
其中V包括包含VWF的所述D’结构域和所述D3结构域的VWF片段;
L1是任选的连接基;
L2是任选的连接基;
(a)至(f)中的L3是任选的连接基,
(g)至(l)中的L3是任选的scFc连接基,
H1和H2中的每个包括任选的异源部分;
C包括FVIII蛋白;并且
(-)是肽键或一个或多个氨基酸。
49.根据权利要求1至47所述的嵌合蛋白包含选自由以下组成的组的式:
(m)V-L1-H1:H2-L2-C,
(n)V-L1-H1:C-L2-H2,
(o)H1-L1-V:H2-L2-C,
(p)H1-L1-V:C-L2-H2,
(q)V:C-L1-H1:H2,
(r)V:H1-L1-C:H2,
(s)H2:H1-L1-C:V,
(t)C:V-L1-H1:H2,和
(u)C:H1-L1-V:H2,
其中V是包含VWF的所述D’结构域和所述D3结构域的VWF片段;
L1是任选的连接基;
L2是任选的连接基;
H1是第一异源部分;
H2是第二异源部分;
C是FVIII蛋白;
(-)是肽键或一个或多个氨基酸;并且
(:)是所述H1和所述H2之间的共价键。
50.根据权利要求48和权利要求49所述的嵌合蛋白,其中所述VWF片段和所述FVIII蛋白通过除所述共价键、所述肽主链或所述一个或多个氨基酸之外的非共价键彼此缔合。
51.根据权利要求48和权利要求49所述的嵌合蛋白,其中所述VWF片段抑制或阻止内源性VWF与所述FVIII蛋白的结合。
52.根据权利要求49至51中任一项所述的嵌合蛋白,其中所述H1和所述H2之间的所述共价键是二硫键。
53.根据权利要求48至52中任一项所述的嵌合蛋白,其中H1包括多肽、非多肽部分或它们二者。
54.根据权利要求53所述的嵌合蛋白,其中H1包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的任何组合。
55.根据权利要求53或权利要求54所述的嵌合蛋白,其中H1包括第一Fc区。
56.根据权利要求53所述的嵌合蛋白,其中所述非多肽部分包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。
57.根据权利要求48至56中任一项所述的嵌合蛋白,其中H2包括多肽、非多肽部分或它们二者。
58.根据权利要求57所述的嵌合蛋白,其中H2包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、PAS序列、HAP序列、转铁蛋白或其片段或它们的任何组合。
59.根据权利要求48至58中任一项所述的嵌合蛋白,其中H2包括第二Fc区。
60.根据权利要求59所述的嵌合蛋白,其中所述非多肽部分包括聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或它们的任何组合。
61.根据权利要求60所述的嵌合蛋白,其中所述共价键是二硫键。
62.根据权利要求1至61中任一项所述的嵌合蛋白,其中所述FVIII蛋白包含第三异源部分(H3)。
63.根据权利要求1至62中任一项所述的嵌合蛋白,其中所述FVIII蛋白包含第四异源部分(H4)。
64.根据权利要求1至63中任一项所述的嵌合蛋白,其中所述FVIII蛋白包含第五异源部分(H5)。
65.根据权利要求1至64中任一项所述的嵌合蛋白,其中所述FVIII蛋白包含第六异源部分(H6)。
66.根据权利要求61至65中任一项所述的嵌合蛋白,其中所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)、所述第六异源部分(H6)中的一者或多者能够延长所述FVIII蛋白的所述半衰期。
67.根据权利要求1至66中任一项所述的嵌合蛋白,其中所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)和所述第六异源部分(H6)连接至FVIII的所述C末端或N末端或插入FVIII的两个氨基酸之间。
68.根据权利要求1至67中任一项所述的嵌合蛋白,其中所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)或所述第六异源部分(H6)中的一者或多者包括包含至少约50个氨基酸、至少约100个氨基酸、至少约150个氨基酸、至少约200个氨基酸、至少约250个氨基酸、至少约300个氨基酸、至少约350个氨基酸、至少约400个氨基酸、至少约450个氨基酸、至少约500个氨基酸、至少约550个氨基酸、至少约600个氨基酸、至少约650个氨基酸、至少约700个氨基酸、至少约750个氨基酸、至少约800个氨基酸、至少约850个氨基酸、至少约900个氨基酸、至少约950个氨基酸或至少约1000个氨基酸的氨基酸序列。
69.根据权利要求1至68中任一项所述的嵌合蛋白,其中所述FVIII的所述半衰期比野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
70.根据权利要求1至69中任一项所述的嵌合蛋白,其中所述FVIII蛋白的所述半衰期为至少约10小时、至少约11小时、至少约12小时、至少约13小时、至少约14小时、至少约15小时、至少约16小时、至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。
71.根据权利要求22至70中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述第二异源部分之间的所述连接基或所述VWF片段和所述第一异源部分之间的所述连接基还包含位于所述连接基的所述N-末端区的第一切割位点(P1)、位于所述连接基的所述C-末端区的第二切割位点(P2)或它们二者。
72.根据权利要求22至71中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述第二异源部分之间的所述连接基、所述VWF片段和所述第一异源部分之间的所述连接基或它们二者包含TLDPRSFLLRNPNDKYEPFWEDEEK(SEQ ID NO:56)。
73.根据权利要求22至71中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述第二异源部分之间的所述连接基、所述VWF片段和所述第一异源部分之间的所述连接基或它们二者被选自由以下组成的组的蛋白酶切割:因子XIa、因子XIIa、激肽释放酶、因子VIIa、因子IXa、因子Xa、因子IIa(凝血酶)、弹性蛋白酶-2、粒酶-B、TEV、肠激酶、蛋白酶3C、分选酶A、MMP-12、MMP-13、MMP-17和MMP-20。
74.根据权利要求22至73中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述第二异源部分之间的所述连接基、所述VWF片段和所述第一异源部分之间的所述连接基或它们二者包含选自由以下组成的组的氨基酸序列:RRRR(SEQ ID NO:52)、RKRRKR(SEQ ID NO:53)、RRRRS(SEQ ID NO:54)、TQSFNDFTR(SEQ ID NO:47)、SVSQTSKLTR(SEQ ID NO:48)、DFLAEGGGVR(SEQ ID NO:49)、TTKIKPR(SEQ ID NO:50)、LVPRG(SEQ ID NO:55)、ALRPRVVGGA(SEQ ID NO:51)、KLTRAET(SEQ ID NO:29)、DFTRVVG(SEQ ID NO:30)、TMTRIVGG(SEQ IDNO:31)、SPFRSTGG(SEQ ID NO:32)、LQVRIVGG(SEQ ID NO:33)、PLGRIVGG(SEQ ID NO:34)、IEGRTVGG(SEQ ID NO:35)、LTPRSLLV(SEQ ID NO:36)、LGPVSGVP(SEQ ID NO:37)、VAGDSLEE(SEQ ID NO:38)、GPAGLGGA(SEQ ID NO:39)、GPAGLRGA(SEQ ID NO:40)、APLGLRLR(SEQ IDNO:41)、PALPLVAQ(SEQ ID NO:42)、ENLYFQG(SEQ ID NO:43)、DDDKIVGG(SEQ ID NO:44)、LEVLFQGP(SEQ ID NO:45)和LPKTGSES(SEQ ID NO:46)。
75.根据权利要求71至74中任一项所述的嵌合蛋白,其中所述第一酶切割位点和所述第二酶切割位点是相同的或不同的。
76.根据权利要求5至75中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述辅助部分之间的所述连接基、所述FVIII蛋白和所述第二异源部分之间的所述连接基以及所述VWF片段和所述第一异源部分之间的所述连接基中的一者或多者具有约1至约2000个氨基酸的长度。
77.根据权利要求5至75中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述辅助部分之间的所述连接基、所述FVIII蛋白和所述第二异源部分之间的所述连接基以及所述VWF片段和所述第一异源部分之间的所述连接基中的一者或多者具有至少约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个、240个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、1200个、1400个、1600个、1800个或2000个氨基酸的长度。
78.根据权利要求5至77中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述辅助部分之间的所述连接基、所述FVIII蛋白和所述第二异源部分之间的所述连接基以及所述VWF片段和所述第一异源部分之间的所述连接基中的一者或多者包含gly/ser肽。
79.根据权利要求78所述的嵌合蛋白,其中所述gly/ser肽具有式(Gly4Ser)n或S(Gly4Ser)n,其中n为选自由以下组成的组的正整数:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80或100。
80.根据权利要求79所述的嵌合蛋白,其中所述(Gly4Ser)n连接基是(Gly4Ser)3或(Gly4Ser)4。
81.根据权利要求5至80中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述辅助部分之间的所述连接基是可切割的连接基。
82.根据权利要求81所述的嵌合蛋白,其中所述可切割的连接基包含一个或多个凝血酶切割位点。
83.根据权利要求81或权利要求82所述的嵌合蛋白,其中所述可切割的连接基包含TLDPRSFLLRNPNDKYEPFWEDEEK(SEQ ID NO:56)。
84.根据权利要求81至83中任一项所述的嵌合蛋白,其中可切割的连接基被选自由以下组成的组的蛋白酶切割:因子XIa、因子XIIa、激肽释放酶、因子VIIa、因子IXa、因子Xa、因子IIa(凝血酶)、弹性蛋白酶-2、粒酶-B、TEV、肠激酶、蛋白酶3C、分选酶A、MMP-12、MMP-13、MMP-17和MMP-20。
85.根据权利要求81至83中任一项所述的嵌合蛋白,其中所述可切割的连接基包含选自由以下组成的组的氨基酸序列:RRRR(SEQ ID NO:52)、RKRRKR(SEQ ID NO:53)、RRRRS(SEQ ID NO:54)、TQSFNDFTR(SEQ ID NO:47)、SVSQTSKLTR(SEQ ID NO:48)、DFLAEGGGVR(SEQ ID NO:49)、TTKIKPR(SEQ ID NO:50)、LVPRG(SEQ ID NO:55)、ALRPRVVGGA(SEQ IDNO:51)、KLTRAET(SEQ ID NO:29)、DFTRVVG(SEQ ID NO:30)、TMTRIVGG(SEQ ID NO:31)、SPFRSTGG(SEQ ID NO:32)、LQVRIVGG(SEQ ID NO:33)、PLGRIVGG(SEQ ID NO:34)、IEGRTVGG(SEQ ID NO:35)、LTPRSLLV(SEQ ID NO:36)、LGPVSGVP(SEQ ID NO:37)、VAGDSLEE(SEQ IDNO:38)、GPAGLGGA(SEQ ID NO:39)、GPAGLRGA(SEQ ID NO:40)、APLGLRLR(SEQ ID NO:41)、PALPLVAQ(SEQ ID NO:42)、ENLYFQG(SEQ ID NO:43)、DDDKIVGG(SEQ ID NO:44)、LEVLFQGP(SEQ ID NO:45)和LPKTGSES(SEQ ID NO:46)。
86.根据权利要求5至85中任一项所述的嵌合蛋白,其中所述FVIII蛋白和所述辅助部分之间的所述连接基还包含分选酶识别基序。
87.根据权利要求86所述的嵌合蛋白,其中所述分选酶识别基序包含所述序列LPXTG(SEQ ID NO:106)。
88.根据权利要求19至87中任一项所述的嵌合蛋白,其中所述VWF片段包含VWF的所述D’结构域和所述D3结构域。
89.根据权利要求88所述的嵌合蛋白,其中所述VWF片段抑制或阻止内源性VWF与FVIII蛋白的结合。
90.根据权利要求88或权利要求89所述的嵌合蛋白,其中所述VWF片段的所述D’结构域的所述氨基酸序列与SEQ ID NO:2的第764至866位氨基酸具有至少90%、95%、96%、97%、98%、99%或100%的同一性。
91.根据权利要求88至90中任一项所述的嵌合蛋白,其中所述VWF片段的所述D3结构域的所述氨基酸序列与SEQ ID NO:2的第867至1240位氨基酸具有至少90%、95%、96%、97%、98%、99%或100%的同一性。
92.根据权利要求88至91中任一项所述的嵌合蛋白,其中所述VWF片段包含在对应于SEQ ID NO:2的第1099位残基、第1142位残基或第1099和1142位残基二者的残基处的至少一个氨基酸取代。
93.根据权利要求88至91中任一项所述的嵌合蛋,其中在所述VWF片段的所述序列中,除半胱氨酸之外的氨基酸被对应于SEQ ID NO:2的第1099位残基、第1142位残基或第1099和1142位残基二者的残基取代。
94.根据权利要求88至93中任一项所述的嵌合蛋白,其中所述VWF片段的所述序列包含SEQ ID NO:2的第764至1240位氨基酸。
95.根据权利要求88至94中任一项所述的嵌合蛋白,其中所述VWF片段还包含VWF的所述D1结构域、所述D2结构域或所述D1和D2结构域。
96.根据权利要求88至95中任一项所述的嵌合蛋白,其中所述VWF片段还包含选自由以下组成的组的VWF结构域:所述A1结构域、所述A2结构域、所述A3结构域、所述D4结构域、所述B1结构域、所述B2结构域、所述B3结构域、所述C1结构域、所述C2结构域、所述CK结构域、它们的一个或多个片段以及它们的任何组合。
97.根据权利要求88至95中任一项所述的嵌合蛋白,其中所述VWF片段基本上由或由以下组成:(1)VWF的所述D'和D3结构域或其片段;(2)VWF的所述D1、D'和D3结构域或其片段;(3)VWF的所述D2、D'和D3结构域或其片段;(4)VWF的所述D1、D2、D'和D3结构域或其片段;或(5)VWF的所述D1、D2、D'、D3和A1结构域或其片段。
98.根据权利要求88至97中任一项所述的嵌合蛋白,还包含VWF的与其可操作地连接的信号肽。
99.根据权利要求19至98中任一项所述的嵌合蛋白,其中所述VWF片段是聚乙二醇化的、糖基化的、羟乙基淀粉化的或聚唾液酸化的。
100.根据权利要求1至99中任一项所述的嵌合蛋白,其中所述FVIII蛋白包含一个或多个选自由以下组成的组的FVIII的结构域:所述A1结构域、所述A2结构域、所述B结构域、所述A3结构域、所述C1结构域、所述C2结构域、它们的一个或多个片段以及它们的任何组合。
101.根据权利要求100所述的嵌合蛋白,其中所述FVIII蛋白包含所述A1结构域、所述A2结构域、所述A3结构域和所述C1结构域以及所述任选的C2结构域。
102.根据权利要求100或101所述的嵌合蛋白,其中所述FVIII蛋白包含所述B结构域或其部分。
103.根据权利要求100至102中任一项所述的嵌合蛋白,其包含与SEQ ID NO:16或SEQID NO:18具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性的氨基酸序列。
104.根据权利要求100至103中任一项所述的嵌合蛋白,其中所述FVIII蛋白是SQ B结构域缺失的FVIII。
105.根据权利要求100至104中任一项所述的嵌合蛋白,其中所述FVIII蛋白包括单链FVIII。
106.根据权利要求105所述的嵌合蛋白,其中所述单链FVIII包含在对应于全长成熟因子VIII多肽(SEQ ID NO:16)的第1648位残基、第1645位残基或它们二者或SQ BDD因子VIII(SEQ ID NO:18)的第754位残基、第751位残基或它们二者的残基处的至少一个氨基酸取代。
107.根据权利要求106所述的嵌合蛋白,其中所述氨基酸取代是除精氨酸之外的氨基酸。
108.根据权利要求1至107中任一项所述的嵌合蛋白,其中所述FVIII蛋白包含第一链和第二链,所述第一链包括FVIII的重链,并且所述第二链包括因子VIII的轻链,其中所述重链和所述轻链通过金属键缔合。
109.一种编码根据权利要求1至108中任一项所述的嵌合蛋白的多核苷酸。
110.根据权利要求110所述的多核苷酸,其还包含编码PC5、PC7或弗林蛋白酶的另外多核苷酸序列。
111.根据权利要求109或权利要求110所述的多核苷酸,其还包含编码VWF的D1结构域和D2结构域的另外多核苷酸序列。
112.一种或多种载体,其包含根据权利要求109至111中任一项所述的多核苷酸和一个或多个可操作地连接至所述多核苷酸或所述多核苷酸组的启动子。
113.根据权利要求112所述的一种或多种载体,其还包括另外的载体,所述另外的载体包含编码PC5、PC7或弗林蛋白酶的第二多核苷酸链。
114.根据权利要求112或权利要求113所述的一种或多种载体,其还包括另外的载体,所述另外的载体包含编码VWF的D1结构域和D2结构域的多核苷酸序列。
115.一种宿主细胞,其包含根据权利要求109至111中任一项所述的多核苷酸或根据权利要求112至114中任一项所述的载体。
116.根据权利要求115所述的宿主细胞,其包含编码PC5、PC7或弗林蛋白酶的另外载体。
117.根据权利要求115或权利要求116所述的宿主细胞,其还包含另外的载体,所述另外的载体包含编码VWF的D1结构域和D2结构域的多核苷酸序列。
118.根据权利要求115或权利要求118所述的宿主细胞,其为哺乳动物细胞。
119.根据权利要求118所述的宿主细胞,其中所述哺乳动物细胞选自由以下组成的组:HEK 293细胞、CHO细胞和BHK细胞。
120.一种药物组合物,其包含根据权利要求1至108中任一项所述的嵌合蛋白、根据权利要求109或权利要求111所述的多核苷酸、根据权利要求112或权利要求114所述的载体或根据权利要求115和权利要求118中任一项所述的宿主细胞以及可药用载体。
121.根据权利要求120中任一项所述的组合物,其中与无所述VWF片段的所述嵌合蛋白的所述FVIII蛋白的所述半衰期相比,所述嵌合蛋白的所述FVIII蛋白的所述半衰期在FVIII/VWF双敲除(“DKO”)小鼠中延长。
122.根据权利要求120或权利要求121所述的组合物,其中所述FVIII的所述半衰期比野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少20倍、至少30倍或至少40倍。
123.根据权利要求120或权利要求122所述的组合物,其中因子VIII的所述半衰期为至少6小时、至少7小时、至少9小时、至少10小时、至少11小时、至少12小时、至少15小时、至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。
124.根据权利要求120至123中任一项所述的组合物,其通过选自由以下组成的组的途径施用:局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用和口服。
125.根据权利要求124所述的组合物,其中所述肠胃外施用为静脉内或皮下施用。
126.根据权利要求120至125中任一项所述的组合物,其用于治疗需要其的受试者的出血性疾病或病状。
127.根据权利要求126所述的组合物,其中所述出血性疾病或病状选自由以下组成的组:出血性凝血障碍、关节出血症、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、头部创伤、胃肠出血、颅内溢血、腹腔内溢血、胸腔溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髂腰肌鞘出血以及它们的任何组合。
128.根据权利要求126或权利要求127所述的组合物,其中所述受试者被安排经历外科手术。
129.根据权利要求126或权利要求127中任一项所述的组合物,其中所述治疗是预防性的或发作期的。
130.一种阻止或抑制FVIII蛋白与内源性VWF的相互作用的方法,其包括向需要其的受试者加入有效量的根据权利要求1至108中任一项所述的嵌合蛋白、根据权利要求109至111中任一项所述的多核苷酸、根据权利要求112至114中任一项所述的载体、根据权利要求115至119中任一项所述的宿主细胞或根据权利要求120至129中任一项所述的组合物,其中所述VWF片段抑制或阻止所述FVIII蛋白与内源性VWF的相互作用。
131.一种移除或减少FVIII蛋白的半衰期限制因子的方法,其中所述方法包括加入有效量的根据权利要求1至108中任一项所述的嵌合蛋白、根据权利要求109至111中任一项所述的多核苷酸、根据权利要求112至114中任一项所述的载体、根据权利要求115至119中任一项所述的宿主细胞或根据权利要求120至129中任一项所述的组合物,其中所述嵌合蛋白或由所述多核苷酸、所述载体编码的或由所述宿主细胞表达的所述嵌合蛋白阻止或抑制所述FVIII蛋白与内源性VWF的相互作用。
132.一种延长或增加FVIII蛋白的所述半衰期的方法,其中所述方法包括加入有效量的根据权利要求1至108中任一项所述的嵌合蛋白、根据权利要求109至111中任一项所述的多核苷酸、根据权利要求112至114中任一项所述的载体、根据权利要求115至119中任一项所述的宿主细胞或根据权利要求120至129中任一项所述的组合物,其中所述嵌合蛋白的所述VWF片段阻止或抑制所述FVIII蛋白与内源性VWF的相互作用。
133.根据权利要求132所述的方法,其中所述FVIII蛋白的所述半衰期比野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
134.根据权利要求133所述的方法,其中因子VIII的所述半衰期为至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。
135.一种治疗需要其的受试者的出血性疾病或病状的方法,其包括施用有效量的根据权利要求1至108中任一项所述的嵌合蛋白、根据权利要求109至111中任一项所述的多核苷酸、根据权利要求112至114中任一项所述的载体、根据权利要求115至119中任一项所述的宿主细胞或根据权利要求120至129中任一项所述的组合物,其中所述出血性疾病或病症选自由以下组成的组:出血性凝血障碍、关节出血症、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、头部创伤、胃肠出血、颅内溢血、腹腔内溢血、胸腔溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髂腰肌鞘出血以及它们的任何组合。
136.根据权利要求135所述的方法,其中所述治疗是预防性的或按需的(发作期)。
137.根据权利要求130至136中任一项所述的方法,其中所述有效量为0.1μg/kg至500mg/kg。
138.根据权利要求130至137中任一项所述的方法,其中所述嵌合蛋白、所述多核苷酸、所述宿主细胞或所述组合物通过选自由以下组成的组的途径施用:局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用和口服。
139.根据权利要求138所述的方法,其中所述肠胃外施用选自由以下组成的组:静脉内施用、皮下施用、肌肉内施用和真皮内施用。
140.根据权利要求130至139中任一项所述的方法,其中所述受试者是人。
141.根据权利要求140所述的方法,其中所述受试者患有甲型血友病。
142.一种制备嵌合蛋白的方法,其包括用根据权利要求109至111中任一项所述的多核苷酸、或根据权利要求112至114中任一项所述的载体转染一种或多种宿主细胞,以及在所述宿主细胞中表达所述VWF片段或所述嵌合蛋白。
143.根据权利要求142所述的方法,其中所述载体还包含编码加工酶的多核苷酸。
144.根据权利要求143所述的方法,其中所述加工酶是PACE。
145.根据权利要求144所述的方法,其中PACE切割所述VWF片段的所述D1D2结构域。
146.根据权利要求142和权利要求143所述的方法,其中还包括用表达VWF的D1结构域和D2结构域的多核苷酸序列转染一种或多种宿主细胞。
147.一种构建根据权利要求1至108中任一项所述的嵌合蛋白的方法,其包括在分选酶存在下通过共价键将所述辅助部分与所述FVIII蛋白连接。
CN201911266598.8A 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途 Pending CN111499760A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201261586099P 2012-01-12 2012-01-12
US61/586,099 2012-01-12
US201261586654P 2012-01-13 2012-01-13
US61/586,654 2012-01-13
US201261667901P 2012-07-03 2012-07-03
US61/667,901 2012-07-03
US201261734954P 2012-12-07 2012-12-07
US61/734,954 2012-12-07
CN201380013452.7A CN104271150A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380013452.7A Division CN104271150A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途

Publications (1)

Publication Number Publication Date
CN111499760A true CN111499760A (zh) 2020-08-07

Family

ID=48781968

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201380013452.7A Pending CN104271150A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途
CN201810666645.7A Pending CN109111526A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途
CN201911267518.0A Pending CN111499761A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途
CN201911266598.8A Pending CN111499760A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途

Family Applications Before (3)

Application Number Title Priority Date Filing Date
CN201380013452.7A Pending CN104271150A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途
CN201810666645.7A Pending CN109111526A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途
CN201911267518.0A Pending CN111499761A (zh) 2012-01-12 2013-01-12 嵌合因子viii多肽及其用途

Country Status (29)

Country Link
US (2) US11370827B2 (zh)
EP (2) EP2804623B1 (zh)
JP (4) JP6255630B2 (zh)
KR (1) KR102212098B1 (zh)
CN (4) CN104271150A (zh)
AU (2) AU2016202875B2 (zh)
BR (1) BR112014017165B1 (zh)
CA (1) CA2863328A1 (zh)
CO (1) CO7010788A2 (zh)
CY (1) CY1122509T1 (zh)
DK (1) DK2804623T3 (zh)
EA (2) EA035323B1 (zh)
ES (1) ES2753124T3 (zh)
HK (1) HK1202799A1 (zh)
HR (1) HRP20191920T1 (zh)
HU (1) HUE046396T2 (zh)
IL (2) IL233463B (zh)
LT (1) LT2804623T (zh)
MX (1) MX357403B (zh)
MY (1) MY201293A (zh)
NZ (1) NZ626945A (zh)
PH (2) PH12014501602B1 (zh)
PL (1) PL2804623T3 (zh)
PT (1) PT2804623T (zh)
RS (1) RS59670B1 (zh)
SG (2) SG10201610193RA (zh)
SI (1) SI2804623T1 (zh)
TW (3) TWI826778B (zh)
WO (1) WO2013106787A1 (zh)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006063031A2 (en) 2004-12-06 2006-06-15 Haplomics Allelic variants of human factor viii
CA2728012C (en) 2008-06-24 2017-10-31 Csl Behring Gmbh Factor viii, von willebrand factor or complexes thereof with prolonged in vivo half-life
AU2010290077C1 (en) 2009-08-24 2015-12-03 Bioverativ Therapeutics Inc. Coagulation factor IX compositions and methods of making and using same
WO2013106787A1 (en) 2012-01-12 2013-07-18 Biogen Idec Ma Inc. Chimeric factor viii polypeptides and uses thereof
RS63870B1 (sr) 2012-02-15 2023-01-31 Bioverativ Therapeutics Inc Sastavi faktora viii i postupci za pravljenje i upotrebu istih
NZ628014A (en) 2012-02-15 2016-09-30 Biogen Ma Inc Recombinant factor viii proteins
AU2013270682A1 (en) 2012-06-08 2014-12-11 Biogen Ma Inc. Procoagulant compounds
EP2863940A4 (en) 2012-06-08 2016-08-10 Biogen Ma Inc CHIMERIC COAGULATION FACTORS
US10023628B2 (en) 2012-07-06 2018-07-17 Bioverativ Therapeutics Inc. Cell line expressing single chain factor VIII polypeptides and uses thereof
KR102403545B1 (ko) 2012-07-11 2022-05-30 바이오버라티브 테라퓨틱스 인크. Xten 및 폰 빌레브란트 인자 단백질과의 viii 인자 복합체 및 이의 용도
US10272163B2 (en) 2012-12-07 2019-04-30 The Regents Of The University Of California Factor VIII mutation repair and tolerance induction
ES2959747T3 (es) 2013-02-15 2024-02-28 Bioverativ Therapeutics Inc Gen del factor VIII optimizado
SG11201505926VA (en) 2013-03-15 2015-09-29 Biogen Ma Inc Factor ix polypeptide formulations
ES2657291T3 (es) 2013-04-22 2018-03-02 Csl Ltd. Un complejo covalente de factor de von Willebrand y factor VIII asociado por un puente disulfuro
SG10201913738YA (en) * 2013-06-28 2020-03-30 Bioverativ Therapeutics Inc Thrombin cleavable linker with xten and its uses thereof
US20160229903A1 (en) * 2013-06-28 2016-08-11 Biogen Ma Inc. Thrombin cleavable linker
WO2015021423A2 (en) * 2013-08-08 2015-02-12 Biogen Idec Ma Inc. Purification of chimeric fviii molecules
EP3033097B1 (en) 2013-08-14 2021-03-10 Bioverativ Therapeutics Inc. Factor viii-xten fusions and uses thereof
HUE057005T2 (hu) 2013-09-25 2022-04-28 Bioverativ Therapeutics Inc Oszlopon történõ vírusinaktiváló eljárások
CN117106095A (zh) * 2014-01-10 2023-11-24 比奥贝拉蒂治疗公司 因子viii嵌合蛋白及其用途
US10253088B2 (en) * 2014-07-02 2019-04-09 CSL Behring Lengnau AG Modified von Willebrand Factor
US10626164B2 (en) 2014-07-25 2020-04-21 Csl Limited Purification of VWF
EP3253786A4 (en) * 2015-02-06 2018-10-17 The University of North Carolina at Chapel Hill Optimized human clotting factor viii gene expression cassettes and their use
ES2774011T3 (es) 2015-05-22 2020-07-16 CSL Behring Lengnau AG Polipéptidos del factor de von Willebrand truncado para tratar la hemofilia
US10772936B2 (en) 2015-05-22 2020-09-15 CSL Behring Lengnau AG Methods for preparing modified von Willebrand factor
TWI741992B (zh) 2015-08-03 2021-10-11 美商百歐維拉提夫治療公司 因子ix融合蛋白以及其製備及使用方法
US10596232B2 (en) 2015-08-12 2020-03-24 Cell Machines, Inc. Methods and compositions related to long half-life coagulation complexes
BR112018008519A2 (pt) 2015-10-28 2018-11-06 Sangamo Therapeutics Inc construtos específicos de fígado, cassetes de expressão de fator viii e métodos de uso dos mesmos
KR20230008256A (ko) 2015-11-13 2023-01-13 다케다 야쿠힌 고교 가부시키가이샤 A형 혈우병의 유전자 요법을 위한 증가된 발현을 갖는 재조합 fviii 변이체를 인코딩하는 바이러스 벡터
WO2017112895A1 (en) * 2015-12-23 2017-06-29 Haplomics, Inc. F8 gene repair
EP3400002B1 (en) 2016-01-07 2022-02-02 CSL Behring Lengnau AG Mutated truncated von willebrand factor
HRP20221089T1 (hr) 2016-02-01 2022-11-25 Bioverativ Therapeutics Inc. Optimizirani geni faktora viii
EP3417058B1 (en) * 2016-02-16 2021-09-22 Research Development Foundation Sortase-modified molecules and uses thereof
JP2019522962A (ja) * 2016-05-20 2019-08-22 オクタファルマ アクチェン ゲゼルシャフト 改善された薬物動態を有する、グリコシル化vwf融合タンパク質
US11046749B2 (en) 2016-06-24 2021-06-29 Mogam Institute For Biomedical Research Chimera protein comprising FVIII and vWF factors, and use thereof
EP3476860A4 (en) * 2016-06-24 2020-01-22 Mogam Institute for Biomedical Research RECOMBINANT SINGLE CHAIN FVIII AND CHEMICAL CONJUGATE THEREOF
US10738338B2 (en) 2016-10-18 2020-08-11 The Research Foundation for the State University Method and composition for biocatalytic protein-oligonucleotide conjugation and protein-oligonucleotide conjugate
SG11201903950UA (en) 2016-11-11 2019-05-30 CSL Behring Lengnau AG Truncated von willebrand factor polypeptides for treating hemophilia
TW201828974A (zh) 2016-11-11 2018-08-16 瑞士商Csl貝林重組技能公司 用於血管外施予以治療或預防凝血疾病之截短型類血友病因子(von Willebrand factor)多肽類
CN110520149A (zh) 2016-12-02 2019-11-29 比奥维拉迪维治疗股份有限公司 诱导对凝血因子的免疫耐受性的方法
EP3548066A1 (en) 2016-12-02 2019-10-09 Bioverativ Therapeutics Inc. Methods of treating hemophilic arthropathy using chimeric clotting factors
CN118184797A (zh) * 2017-02-27 2024-06-14 沙塔克实验室有限公司 基于vsig8的嵌合蛋白
CA3068098A1 (en) 2017-06-22 2018-12-27 CSL Behring Lengnau AG Modulation of fviii immunogenicity by truncated vwf
US20210163986A1 (en) 2017-08-09 2021-06-03 Bioverativ Therapeutics Inc. Nucleic acid molecules and uses thereof
AU2019215063A1 (en) 2018-02-01 2020-09-03 Bioverativ Therapeutics, Inc. Use of lentiviral vectors expressing Factor VIII
WO2019219049A1 (zh) * 2018-05-18 2019-11-21 北京辅仁瑞辉生物医药研究院有限公司 改进的fviii融合蛋白及其应用
CN113166271A (zh) * 2018-05-18 2021-07-23 郑州晟斯生物科技有限公司 具有延长半衰期的融合多肽缀合物
JP2021523878A (ja) 2018-05-18 2021-09-09 バイオベラティブ セラピューティクス インコーポレイテッド 血友病aを処置する方法
US20220073637A1 (en) * 2018-06-29 2022-03-10 City Of Hope Compositions and methods for treating autoimmune diseases
CA3106590A1 (en) 2018-07-16 2020-01-23 Baxalta Incorporated Gene therapy of hemophilia a using viral vectors encoding recombinant fviii variants with increased expression
US20200069817A1 (en) 2018-08-09 2020-03-05 Bioverativ Therapeutics Inc. Nucleic acid molecules and uses thereof for non-viral gene therapy
CA3127065A1 (en) 2019-01-16 2020-07-23 Baxalta Incorporated Viral vectors encoding recombinant fviii variants with increased expression for gene therapy of hemophilia a
US10654911B1 (en) * 2019-04-02 2020-05-19 Beijing Neoletix Biological Technology Co., Ltd. Vector co-expressing truncated von Willebrand factor and factor VIII
EP3736286A1 (en) 2019-05-09 2020-11-11 Biotest AG Single chain factor viii molecule
CN112175088B (zh) * 2019-07-02 2023-03-28 江苏晟斯生物制药有限公司 改进的fix融合蛋白、缀合物及其应用
KR20220029733A (ko) 2019-07-04 2022-03-08 체에스엘 베링 렝나우 아게 응고 인자 viii의 시험관내 안정성을 증가시키기 위한 절단된 폰 빌레브란트 인자 (vwf)
JP2022546525A (ja) * 2019-09-02 2022-11-04 ビオテスト・アクチエンゲゼルシャフト 延長された半減期を有する第viii因子タンパク質
EP3785726A1 (en) * 2019-09-02 2021-03-03 Biotest AG Factor viii protein with increased half-life
WO2021067389A1 (en) 2019-09-30 2021-04-08 Bioverativ Therapeutics Inc. Lentiviral vector formulations
JP2023500953A (ja) 2019-11-11 2023-01-11 ツェー・エス・エル・ベーリング・レングナウ・アクチエンゲゼルシャフト 第viii因子に対する寛容を誘導するためのポリペプチド
EP4073098B1 (en) * 2019-12-19 2023-09-27 Akston Biosciences Corporation Ultra-long acting insulin-fc fusion proteins and methods of use
CN113087803B (zh) * 2021-05-12 2022-10-14 苏州大学附属第一医院 抗人血管性血友病因子前导肽单克隆抗体sz176及其应用
WO2023159135A2 (en) * 2022-02-16 2023-08-24 University Of Miami Il-2 and tl1a fusion proteins and methods of use thereof

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020019036A1 (en) * 1996-12-13 2002-02-14 Hans-Peter Schwarz Von willebrand factor derivatives and methods of isolating proteins that bind to von willebrand factor
US20040192599A1 (en) * 2001-06-15 2004-09-30 Schuh Andre C Gene therapy for hemophilia a
US20060160948A1 (en) * 2004-12-27 2006-07-20 Friedrich Scheiflinger Polymer-von Willebrand factor-conjugates
CN101743309A (zh) * 2007-04-13 2010-06-16 催化剂生物科学公司 修饰的因子ⅶ多肽及其应用
WO2011060242A2 (en) * 2009-11-13 2011-05-19 Talecris Biotherapeutics, Inc. Von willebrand factor (vwf)-containing preparations, and methods, kits, and uses related thereto
US20110183907A1 (en) * 2008-06-24 2011-07-28 Thomas Weimer Factor viii, von willebrand factor or complexes thereof with prolonged in vivo half-life

Family Cites Families (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4179337A (en) 1973-07-20 1979-12-18 Davis Frank F Non-immunogenic polypeptides
US4215051A (en) 1979-08-29 1980-07-29 Standard Oil Company (Indiana) Formation, purification and recovery of phthalic anhydride
US4713339A (en) 1983-01-19 1987-12-15 Genentech, Inc. Polycistronic expression vector construction
US4757006A (en) 1983-10-28 1988-07-12 Genetics Institute, Inc. Human factor VIII:C gene and recombinant methods for production
US4965199A (en) 1984-04-20 1990-10-23 Genentech, Inc. Preparation of functional human factor VIII in mammalian cells using methotrexate based selection
US4970300A (en) 1985-02-01 1990-11-13 New York University Modified factor VIII
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US5981216A (en) 1985-04-01 1999-11-09 Alusuisse Holdings A.G. Transformed myeloma cell-line and a process for the expression of a gene coding for a eukaryotic polypeptide employing same
CA1341174C (en) 1985-04-12 2001-01-30 John J. Toole Jr. Procoagulant proteins derived from factor viii: c
KR910006424B1 (ko) 1985-08-21 1991-08-24 인코텍스 비.브이 편성브리프(brief) 제조방법
DE3785102T2 (de) 1986-01-03 1993-07-22 Genetics Inst Verfahren zur herstellung von faktor-viii:c-typ-proteinen.
US5595886A (en) 1986-01-27 1997-01-21 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5422260A (en) * 1986-05-29 1995-06-06 Genetics Institute, Inc. -Legal Affairs Human factor VIII:c muteins
US5543502A (en) 1986-06-24 1996-08-06 Novo Nordisk A/S Process for producing a coagulation active complex of factor VIII fragments
US4912040A (en) 1986-11-14 1990-03-27 Genetics Institute, Inc. Eucaryotic expression system
JP3101690B2 (ja) 1987-03-18 2000-10-23 エス・ビィ・2・インコーポレイテッド 変性抗体の、または変性抗体に関する改良
CA1331157C (en) 1987-04-06 1994-08-02 Randal J. Kaufman Method for producing factor viii:c-type proteins
US6060447A (en) 1987-05-19 2000-05-09 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US6346513B1 (en) 1987-06-12 2002-02-12 Baxter Trading Gmbh Proteins with factor VIII activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
IE69026B1 (en) 1987-06-12 1996-08-07 Immuno Ag Novel proteins with factor VIII activity process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
DE3720246A1 (de) 1987-06-19 1988-12-29 Behringwerke Ag Faktor viii:c-aehnliches molekuel mit koagulationsaktivitaet
FR2619314B1 (fr) 1987-08-11 1990-06-15 Transgene Sa Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant
US4994371A (en) 1987-08-28 1991-02-19 Davie Earl W DNA preparation of Christmas factor and use of DNA sequences
US6780613B1 (en) 1988-10-28 2004-08-24 Genentech, Inc. Growth hormone variants
US5004803A (en) 1988-11-14 1991-04-02 Genetics Institute, Inc. Production of procoagulant proteins
SE465222C5 (sv) 1989-12-15 1998-02-10 Pharmacia & Upjohn Ab Ett rekombinant, humant faktor VIII-derivat och förfarande för dess framställning
US5846951A (en) 1991-06-06 1998-12-08 The School Of Pharmacy, University Of London Pharmaceutical compositions
IE922437A1 (en) 1991-07-25 1993-01-27 Idec Pharma Corp Recombinant antibodies for human therapy
US5364771A (en) 1992-04-07 1994-11-15 Emory University Hybrid human/porcine factor VIII
US5859204A (en) 1992-04-07 1999-01-12 Emory University Modified factor VIII
US6376463B1 (en) 1992-04-07 2002-04-23 Emory University Modified factor VIII
US6037452A (en) 1992-04-10 2000-03-14 Alpha Therapeutic Corporation Poly(alkylene oxide)-Factor VIII or Factor IX conjugate
US5563045A (en) 1992-11-13 1996-10-08 Genetics Institute, Inc. Chimeric procoagulant proteins
SE504074C2 (sv) 1993-07-05 1996-11-04 Pharmacia Ab Proteinberedning för subkutan, intramuskulär eller intradermal administrering
US5643575A (en) 1993-10-27 1997-07-01 Enzon, Inc. Non-antigenic branched polymer conjugates
GB9422383D0 (en) 1994-11-05 1995-01-04 Wellcome Found Antibodies
US6818439B1 (en) 1994-12-30 2004-11-16 Chiron Corporation Methods for administration of recombinant gene delivery vehicles for treatment of hemophilia and other disorders
US6030613A (en) 1995-01-17 2000-02-29 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6086875A (en) 1995-01-17 2000-07-11 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of immunogens
US6485726B1 (en) 1995-01-17 2002-11-26 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6096871A (en) 1995-04-14 2000-08-01 Genentech, Inc. Polypeptides altered to contain an epitope from the Fc region of an IgG molecule for increased half-life
US6121022A (en) 1995-04-14 2000-09-19 Genentech, Inc. Altered polypeptides with increased half-life
US5869046A (en) 1995-04-14 1999-02-09 Genentech, Inc. Altered polypeptides with increased half-life
US5739277A (en) 1995-04-14 1998-04-14 Genentech Inc. Altered polypeptides with increased half-life
SE9503380D0 (sv) 1995-09-29 1995-09-29 Pharmacia Ab Protein derivatives
US6458563B1 (en) 1996-06-26 2002-10-01 Emory University Modified factor VIII
AU3968897A (en) 1996-08-02 1998-02-25 Bristol-Myers Squibb Company A method for inhibiting immunoglobulin-induced toxicity resulting from the use of immunoglobulins in therapy and in vivo diagnosis
WO1998023289A1 (en) 1996-11-27 1998-06-04 The General Hospital Corporation MODULATION OF IgG BINDING TO FcRn
US6277375B1 (en) 1997-03-03 2001-08-21 Board Of Regents, The University Of Texas System Immunoglobulin-like domains with increased half-lives
CA2225189C (en) 1997-03-06 2010-05-25 Queen's University At Kingston Canine factor viii gene, protein and methods of use
GB9722131D0 (en) 1997-10-20 1997-12-17 Medical Res Council Method
US6242195B1 (en) 1998-04-02 2001-06-05 Genentech, Inc. Methods for determining binding of an analyte to a receptor
US6528624B1 (en) 1998-04-02 2003-03-04 Genentech, Inc. Polypeptide variants
DK1068241T3 (da) 1998-04-02 2008-02-04 Genentech Inc Antistofvarianter og fragmenter deraf
US6194551B1 (en) 1998-04-02 2001-02-27 Genentech, Inc. Polypeptide variants
GB9809951D0 (en) 1998-05-08 1998-07-08 Univ Cambridge Tech Binding molecules
JP2002522063A (ja) 1998-08-17 2002-07-23 アブジェニックス インコーポレイテッド 増加した血清半減期を有する改変された分子の生成
US6927044B2 (en) 1998-09-25 2005-08-09 Regeneron Pharmaceuticals, Inc. IL-1 receptor based cytokine traps
EP1006183A1 (en) 1998-12-03 2000-06-07 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Recombinant soluble Fc receptors
US6358703B1 (en) 1998-12-10 2002-03-19 Bayer Corporation Expression system for factor VIII
US6737056B1 (en) 1999-01-15 2004-05-18 Genentech, Inc. Polypeptide variants with altered effector function
KR101155191B1 (ko) 1999-01-15 2012-06-13 제넨테크, 인크. 효과기 기능이 변화된 폴리펩티드 변이체
US7829085B2 (en) * 1999-07-14 2010-11-09 Life Sciences Research Partners Vzw Methods of treating hemostasis disorders using antibodies binding the C1 domain of factor VIII
CA2405557C (en) 2000-04-12 2013-09-24 Human Genome Sciences, Inc. Albumin fusion proteins
ES2256234T3 (es) 2000-05-16 2006-07-16 Lipoxen Technologies Limited Derivatizacion de proteinas en solucion acuosa.
GB0029407D0 (en) 2000-12-01 2001-01-17 Affitech As Product
DE60143544D1 (de) 2000-12-12 2011-01-05 Medimmune Llc Moleküle mit längeren halbwertszeiten, zusammensetzungen und deren verwendung
US7211395B2 (en) 2001-03-09 2007-05-01 Dyax Corp. Serum albumin binding moieties
US20080194481A1 (en) 2001-12-21 2008-08-14 Human Genome Sciences, Inc. Albumin Fusion Proteins
KR101271635B1 (ko) 2001-12-21 2013-06-12 휴먼 게놈 사이언시즈, 인코포레이티드 알부민 융합 단백질
EP2261250B1 (en) 2001-12-21 2015-07-01 Human Genome Sciences, Inc. GCSF-Albumin fusion proteins
US20040002587A1 (en) 2002-02-20 2004-01-01 Watkins Jeffry D. Fc region variants
US20040132101A1 (en) 2002-09-27 2004-07-08 Xencor Optimized Fc variants and methods for their generation
KR20040088572A (ko) 2002-03-01 2004-10-16 이뮤노메딕스, 인코오포레이티드 제거율 증강을 위한 양특이성 항체 점 돌연변이들
US7317091B2 (en) 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
EP1487992A4 (en) 2002-03-15 2007-10-31 Brigham & Womens Hospital CENTRAL AIRWAY DELIVERY FOR SYSTEMIC DRUG DELIVERY
US7425620B2 (en) 2002-08-14 2008-09-16 Scott Koenig FcγRIIB-specific antibodies and methods of use thereof
WO2004027901A2 (en) 2002-09-17 2004-04-01 Diffusion Science, Inc. Electrochemical generation, storage and reaction of hydrogen and oxygen using gas permeable catalyst-coated hollow microspheres
EP2364996B1 (en) 2002-09-27 2016-11-09 Xencor Inc. Optimized FC variants and methods for their generation
SI1562972T1 (sl) 2002-10-15 2010-12-31 Facet Biotech Corp ALTERACIJA FcRn VEZANIH AFINITET ALI SERUMSKIH RAZPOLOVNIH DOB ANTITELESC Z MUTAGENEZO
GB2395337B (en) 2002-11-14 2005-12-28 Gary Michael Wilson Warning Unit
ES2897506T3 (es) 2003-01-09 2022-03-01 Macrogenics Inc Identificación y modificación de anticuerpos con regiones Fc variantes y métodos de utilización de los mismos
US7041635B2 (en) * 2003-01-28 2006-05-09 In2Gen Co., Ltd. Factor VIII polypeptide
CN102139114A (zh) 2003-02-26 2011-08-03 尼克塔治疗公司 聚合物-因子viii部分缀合物
WO2004076522A1 (ja) 2003-02-28 2004-09-10 Kuraray Co., Ltd. 硬化性樹脂組成物
US8388955B2 (en) 2003-03-03 2013-03-05 Xencor, Inc. Fc variants
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
US7348004B2 (en) 2003-05-06 2008-03-25 Syntonix Pharmaceuticals, Inc. Immunoglobulin chimeric monomer-dimer hybrids
TWI353991B (en) 2003-05-06 2011-12-11 Syntonix Pharmaceuticals Inc Immunoglobulin chimeric monomer-dimer hybrids
ATE497783T1 (de) 2003-05-06 2011-02-15 Syntonix Pharmaceuticals Inc Gerinnungsfaktor vii-fc chimäre proteine zur behandlung von hämostatischen krankheiten
EP1654290B1 (en) 2003-08-12 2019-03-13 Lipoxen Technologies Limited Sialic acid derivatives for protein derivatisation and conjugation
GB0324368D0 (en) 2003-10-17 2003-11-19 Univ Cambridge Tech Polypeptides including modified constant regions
US7211559B2 (en) 2003-10-31 2007-05-01 University Of Maryland, Baltimore Factor VIII compositions and methods
WO2005047327A2 (en) 2003-11-12 2005-05-26 Biogen Idec Ma Inc. NEONATAL Fc RECEPTOR (FcRn)-BINDING POLYPEPTIDE VARIANTS, DIMERIC Fc BINDING PROTEINS AND METHODS RELATED THERETO
WO2005077981A2 (en) 2003-12-22 2005-08-25 Xencor, Inc. Fc POLYPEPTIDES WITH NOVEL Fc LIGAND BINDING SITES
WO2005070963A1 (en) 2004-01-12 2005-08-04 Applied Molecular Evolution, Inc Fc region variants
US7276585B2 (en) 2004-03-24 2007-10-02 Xencor, Inc. Immunoglobulin variants outside the Fc region
WO2005123780A2 (en) 2004-04-09 2005-12-29 Protein Design Labs, Inc. Alteration of fcrn binding affinities or serum half-lives of antibodies by mutagenesis
WO2006085967A2 (en) 2004-07-09 2006-08-17 Xencor, Inc. OPTIMIZED ANTI-CD20 MONOCONAL ANTIBODIES HAVING Fc VARIANTS
SI2471813T1 (sl) 2004-07-15 2015-03-31 Xencor, Inc. Optimirane Fc variante
US7566701B2 (en) 2004-09-07 2009-07-28 Archemix Corp. Aptamers to von Willebrand Factor and their use as thrombotic disease therapeutics
WO2006047350A2 (en) 2004-10-21 2006-05-04 Xencor, Inc. IgG IMMUNOGLOBULIN VARIANTS WITH OPTIMIZED EFFECTOR FUNCTION
EP1924596A4 (en) 2005-08-12 2009-07-29 Human Genome Sciences Inc ALBUM INFUSION PROTEINS
US7855279B2 (en) * 2005-09-27 2010-12-21 Amunix Operating, Inc. Unstructured recombinant polymers and uses thereof
US7846445B2 (en) 2005-09-27 2010-12-07 Amunix Operating, Inc. Methods for production of unstructured recombinant polymers and uses thereof
EP1996937A4 (en) * 2006-03-06 2009-04-08 Amunix Inc GENETIC PACKS AND USES THEREOF
CN101415445A (zh) * 2006-03-31 2009-04-22 巴克斯特国际公司 聚乙二醇化的因子ⅷ
WO2007144173A1 (en) 2006-06-14 2007-12-21 Csl Behring Gmbh Proteolytically cleavable fusion protein comprising a blood coagulation factor
EP1867660A1 (en) 2006-06-14 2007-12-19 CSL Behring GmbH Proteolytically cleavable fusion protein comprising a blood coagulation factor
US20080242607A1 (en) * 2006-07-21 2008-10-02 Neose Technologies, Inc. Glycosylation of peptides via o-linked glycosylation sequences
EP2068905A4 (en) 2006-09-14 2009-12-30 Human Genome Sciences Inc ALBUM INFUSION PROTEINS
US20100075375A1 (en) * 2006-10-03 2010-03-25 Novo Nordisk A/S Methods for the purification of polypeptide conjugates
JP5457185B2 (ja) 2006-10-04 2014-04-02 ノヴォ ノルディスク アー/エス グリセロール連結のpeg化された糖および糖ペプチド
CA2673459C (en) 2006-12-22 2016-09-13 Stefan Schulte Modified coagulation factors with prolonged in vivo half-life
EP1935430A1 (en) * 2006-12-22 2008-06-25 CSL Behring GmbH Modified coagulation factors with prolonged in vivo half-life
WO2008151258A2 (en) 2007-06-04 2008-12-11 Neose Technologies, Inc. O-linked glycosylation using n-acetylglucosaminyl transferases
DK2369005T3 (da) 2007-06-21 2013-06-24 Univ Muenchen Tech Biologisk aktive proteiner med forøget stabilitet in vivo og/eller in vitro
AU2008287340A1 (en) * 2007-08-15 2009-02-19 Amunix, Inc. Compositions and methods for modifying properties of biologically active polypeptides
CA2703948A1 (en) 2007-11-01 2009-05-07 University Of Rochester Recombinant factor viii having increased stability
US8173597B2 (en) 2007-11-09 2012-05-08 Baxter International Inc. Modified recombinant factor VIII and von Willebrand factor and methods of use
EP3936116A1 (en) 2007-12-28 2022-01-12 Takeda Pharmaceutical Company Limited Rrecombinant vwf containing formulations
ES2298096B1 (es) * 2008-01-08 2009-01-01 Grifols, S.A. Procedimiento para la obtencion de un concentrado de factor von willebrand o del complejo de factor viii/factor von willebrand y utilizacionde los mismos.
DE102008032361A1 (de) * 2008-07-10 2010-01-21 Csl Behring Gmbh Der Einsatz von Faktor VIII und vWF bzw. vWF-enthaltenden Konzentraten zur Therapie der durch Thrombocyten-Inhibitoren induzierte Koagulopathie
CA3092223C (en) * 2008-07-21 2023-01-03 Apogenix Ag Tnfsf single chain molecules
EP2368124A4 (en) 2008-11-24 2012-09-19 Bayer Healthcare Llc METHOD FOR DETERMINING THE ACTIVITY OF A PEGYLATED BLOOD GENERATION FACTOR IN A SILICON-BASED ACTIVATED PART THROMBOPLASTINE TIME ASSAY
CN102348715B (zh) * 2009-02-03 2017-12-08 阿穆尼克斯运营公司 延伸重组多肽和包含该延伸重组多肽的组合物
US8703717B2 (en) 2009-02-03 2014-04-22 Amunix Operating Inc. Growth hormone polypeptides and methods of making and using same
US8680050B2 (en) 2009-02-03 2014-03-25 Amunix Operating Inc. Growth hormone polypeptides fused to extended recombinant polypeptides and methods of making and using same
US20120142593A1 (en) * 2009-03-24 2012-06-07 Bayer Healthcare Llc Factor VIII Variants and Methods of Use
DE202010018378U1 (de) 2009-04-10 2016-04-07 Tufts Medical Center, Inc. PAR-1-Aktivierung durch Metalloproteinase-1 (MMP-1)
NZ596778A (en) 2009-06-08 2013-11-29 Amunix Operating Inc Glucose-regulating polypeptides and methods of making and using same
CN106916229A (zh) 2009-06-08 2017-07-04 阿穆尼克斯运营公司 生长激素多肽及其制备和使用方法
AU2010284977A1 (en) * 2009-08-20 2012-03-29 Csl Behring Gmbh Albumin fused coagulation factors for non-intravenous administration in the therapy and prophylactic treatment of bleeding disorders
AU2010290077C1 (en) 2009-08-24 2015-12-03 Bioverativ Therapeutics Inc. Coagulation factor IX compositions and methods of making and using same
WO2011028344A2 (en) 2009-08-25 2011-03-10 Amunix Operating Inc. Interleukin-1 receptor antagonist compositions and methods of making and using same
AU2010325787B2 (en) 2009-12-06 2016-05-12 Bioverativ Therapeutics Inc. Factor VIII-Fc chimeric and hybrid polypeptides, and methods of use thereof
EP2977055A1 (en) * 2010-02-16 2016-01-27 Novo Nordisk A/S Factor viii fusion protein
CN102770449B (zh) 2010-02-16 2016-02-24 诺沃—诺迪斯克有限公司 具有降低的vwf结合的因子viii分子
WO2011123830A2 (en) 2010-04-02 2011-10-06 Amunix Operating Inc. Alpha 1-antitrypsin compositions and methods of making and using same
ES2813650T3 (es) 2010-05-20 2021-03-24 Allergan Inc Toxinas clostridiales degradables
EP3508573A1 (en) 2010-07-09 2019-07-10 Bioverativ Therapeutics Inc. Systems for factor viii processing and methods thereof
NZ605400A (en) 2010-07-09 2015-05-29 Biogen Idec Hemophilia Inc Chimeric clotting factors
US20130017997A1 (en) 2010-08-19 2013-01-17 Amunix Operating Inc. Factor VIII Compositions and Methods of Making and Using Same
WO2013106787A1 (en) 2012-01-12 2013-07-18 Biogen Idec Ma Inc. Chimeric factor viii polypeptides and uses thereof
RS63870B1 (sr) 2012-02-15 2023-01-31 Bioverativ Therapeutics Inc Sastavi faktora viii i postupci za pravljenje i upotrebu istih
NZ628014A (en) 2012-02-15 2016-09-30 Biogen Ma Inc Recombinant factor viii proteins
KR102403545B1 (ko) 2012-07-11 2022-05-30 바이오버라티브 테라퓨틱스 인크. Xten 및 폰 빌레브란트 인자 단백질과의 viii 인자 복합체 및 이의 용도
SG10201913738YA (en) 2013-06-28 2020-03-30 Bioverativ Therapeutics Inc Thrombin cleavable linker with xten and its uses thereof
US20160229903A1 (en) 2013-06-28 2016-08-11 Biogen Ma Inc. Thrombin cleavable linker
CN117106095A (zh) 2014-01-10 2023-11-24 比奥贝拉蒂治疗公司 因子viii嵌合蛋白及其用途

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020019036A1 (en) * 1996-12-13 2002-02-14 Hans-Peter Schwarz Von willebrand factor derivatives and methods of isolating proteins that bind to von willebrand factor
US20040192599A1 (en) * 2001-06-15 2004-09-30 Schuh Andre C Gene therapy for hemophilia a
US20060160948A1 (en) * 2004-12-27 2006-07-20 Friedrich Scheiflinger Polymer-von Willebrand factor-conjugates
CN101743309A (zh) * 2007-04-13 2010-06-16 催化剂生物科学公司 修饰的因子ⅶ多肽及其应用
US20110183907A1 (en) * 2008-06-24 2011-07-28 Thomas Weimer Factor viii, von willebrand factor or complexes thereof with prolonged in vivo half-life
WO2011060242A2 (en) * 2009-11-13 2011-05-19 Talecris Biotherapeutics, Inc. Von willebrand factor (vwf)-containing preparations, and methods, kits, and uses related thereto

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
P L TURECEK: "Development of a plasma- and albumin-free recombinant von Willebrand factor", vol. 29, pages 32 - 8 *
SÉBASTIEN LACROIX-DESMAZES: "The role of VWF in the immunogenicity of FVIII", vol. 122, pages 3 - 6 *
徐秋霞: "《血栓血塞性疾病》", 31 August 2004, 中国医药科技出版社, pages: 39 - 40 *

Also Published As

Publication number Publication date
RS59670B1 (sr) 2020-01-31
WO2013106787A1 (en) 2013-07-18
KR20140115347A (ko) 2014-09-30
IL233463B (en) 2020-03-31
PH12014501602A1 (en) 2014-10-08
BR112014017165B1 (pt) 2023-05-02
JP2020078338A (ja) 2020-05-28
CY1122509T1 (el) 2021-01-27
SI2804623T1 (sl) 2020-02-28
EA028309B1 (ru) 2017-11-30
EP2804623B1 (en) 2019-08-07
TW202204392A (zh) 2022-02-01
AU2013205647B2 (en) 2016-02-04
PH12018501250A1 (en) 2019-02-27
BR112014017165A2 (pt) 2017-06-13
PL2804623T3 (pl) 2020-03-31
CN111499761A (zh) 2020-08-07
JP2018057388A (ja) 2018-04-12
SG10201610193RA (en) 2017-01-27
TW201348253A (zh) 2013-12-01
HK1202799A1 (zh) 2015-10-09
JP2015504679A (ja) 2015-02-16
DK2804623T3 (da) 2019-11-11
MY201293A (en) 2024-02-15
ES2753124T3 (es) 2020-04-07
AU2016202875B2 (en) 2018-03-08
NZ626945A (en) 2016-10-28
EA201791134A1 (ru) 2018-02-28
EA201491186A1 (ru) 2015-05-29
AU2016202875A1 (en) 2016-05-26
IL233463A0 (en) 2014-08-31
US20230011438A1 (en) 2023-01-12
PT2804623T (pt) 2019-11-18
JP6255630B2 (ja) 2018-01-10
PH12014501602B1 (en) 2014-10-08
LT2804623T (lt) 2019-12-10
HRP20191920T1 (hr) 2020-01-10
MX2014008512A (es) 2014-11-25
BR112014017165A8 (pt) 2018-05-15
CN104271150A (zh) 2015-01-07
AU2018201163B2 (en) 2020-07-30
US11370827B2 (en) 2022-06-28
TWI826778B (zh) 2023-12-21
EP2804623A4 (en) 2015-12-02
SG11201403764XA (en) 2014-07-30
EA035323B1 (ru) 2020-05-28
US20150023959A1 (en) 2015-01-22
EP2804623A1 (en) 2014-11-26
EP3505179A1 (en) 2019-07-03
TW201839011A (zh) 2018-11-01
JP2022159331A (ja) 2022-10-17
CA2863328A1 (en) 2013-07-18
CN109111526A (zh) 2019-01-01
MX357403B (es) 2018-07-09
JP6728121B2 (ja) 2020-07-22
CO7010788A2 (es) 2014-07-31
AU2013205647A8 (en) 2016-03-17
AU2018201163A1 (en) 2018-03-08
TWI727187B (zh) 2021-05-11
IL261632A (en) 2018-10-31
HUE046396T2 (hu) 2020-02-28
JP7113860B2 (ja) 2022-08-05
IL261632B (en) 2021-09-30
KR102212098B1 (ko) 2021-02-03
AU2013205647A1 (en) 2013-08-01
JP7475613B2 (ja) 2024-04-30

Similar Documents

Publication Publication Date Title
JP7113860B2 (ja) キメラ第viii因子ポリペプチドおよびその使用
US11261437B2 (en) Procoagulant compounds
CN114736305B (zh) 因子viii嵌合蛋白及其用途
US10968442B2 (en) Chimeric clotting factors
KR102329315B1 (ko) Xten 및 폰 빌레브란트 인자 단백질과의 viii 인자 복합체 및 이의 용도
US20160229903A1 (en) Thrombin cleavable linker
CN112512555A (zh) 治疗血友病a的方法
US20220243189A1 (en) Procoagulant compounds
AU2013205647B8 (en) Chimeric factor VIII polypeptides and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination