CN113817069A - 具有xten的凝血酶可裂解连接子和其用途 - Google Patents

具有xten的凝血酶可裂解连接子和其用途 Download PDF

Info

Publication number
CN113817069A
CN113817069A CN202110796045.4A CN202110796045A CN113817069A CN 113817069 A CN113817069 A CN 113817069A CN 202110796045 A CN202110796045 A CN 202110796045A CN 113817069 A CN113817069 A CN 113817069A
Authority
CN
China
Prior art keywords
fviii
vwf
amino acids
protein
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110796045.4A
Other languages
English (en)
Inventor
埃克塔·赛斯·恰布拉
约翰·库曼
刘童瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biogen Inc
Bioverativ Therapeutics Inc
Biogen MA Inc
Original Assignee
Bioverativ Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioverativ Therapeutics Inc filed Critical Bioverativ Therapeutics Inc
Publication of CN113817069A publication Critical patent/CN113817069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/36Blood coagulation or fibrinolysis factors
    • A61K38/37Factors VIII
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/02Stomatological preparations, e.g. drugs for caries, aphtae, periodontitis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/02Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/02Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/08Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/35Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification

Abstract

本发明涉及具有XTEN的凝血酶可裂解连接子和其用途。本发明提供包含经由VWF连接子与异源部分融合的VWF蛋白的嵌合分子。本发明提供可在凝血酶存在下裂解的有效的VWF连接子。所述嵌合分子还可包含包括FVIII蛋白和第二异源部分的多肽链,其中包含所述VWF蛋白的链与包含所述FVIII蛋白的链彼此缔合。本发明还包括核苷酸、载体、宿主细胞、使用所述嵌合蛋白的方法。

Description

具有XTEN的凝血酶可裂解连接子和其用途
本申请是申请日为2014年6月27日、中国申请号为201480029781.5、发明名称为“具有XTEN的凝血酶可裂解连接子和其用途”的发明申请的分案申请。
发明背景
A型血友病是由编码凝血因子VIII(FVIII)的基因的缺陷所造成的出血性病症并且在男性新生儿中发病率为万分之1-2。Graw等,Nat.Rev.Genet.6(6):488-501(2005)。罹患A型血友病的患者可通过输注纯化或重组产生的FVIII来治疗。然而,已知所有市售FVIII产品具有约8-12小时的半衰期,从而需要对患者进行频繁的静脉内施用。参见Weiner M.A.和Cairo,M.S.,Pediatric Hematology Secrets,Lee,M.T.,12.Disorders ofCoagulation,Elsevier Health Sciences,2001;Lillicrap,D.Thromb.Res.122增刊4:S2-8(2008)。另外,已尝试多种方法来延长FVIII半衰期。例如,为延长凝血因子的半衰期所开发的方法包括聚乙二醇化、糖基化和与白蛋白结合。参见Dumont等,Blood.119(13):3024-3030(在线公布于2012年1月13日)。然而,不考虑所用的蛋白质工程改造,目前处于开发中的长效FVIII产品具有改良的半衰期,但所述半衰期据报道是有限的,在临床前动物模型中仅达到约1.5至2倍改进。参见同上。在人类中已证实一致结果,例如,在A型血友病患者中,与
Figure BDA0003162841480000011
相比,rFVIIIFc被报道使半衰期提高达约1.7倍。参见同上。因此,尽管改进微小,但半衰期增加可指示其他t1/2限制因素的存在。
由于频繁给药和由给药方案所造成的不便,仍有必要开发需要较小频率施用的FVIII产品,即,具有比1.5至2倍半衰期限制更长的半衰期的FVIII产品。
发明内容
本发明针对一种包含温韦伯氏因子(Von Willebrand Factor,VWF)蛋白、异源部分(H1)、XTEN序列和连接所述VWF蛋白与所述异源部分的VWF连接子的嵌合分子,其中所述VWF连接子包含选自以下的多肽:(i)来自因子VIII(FVIII)的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合,并且其中所述XTEN序列连接至所述VWF蛋白、所述异源部分(H1)、所述VWF连接子或其任何组合。在一个实施方案中,所述XTEN序列连接VWF蛋白与VWF连接子或者VWF连接子与异源部分。在另一个实施方案中,所述嵌合分子还包含包括FVIII蛋白的第二多肽链,其中所述第一多肽链与所述第二多肽链彼此缔合。在其他实施方案中,嵌合分子中的FVIII蛋白还包含另外的XTEN序列。所述另外的XTEN序列可连接至FVIII蛋白的N端或C端或者插入彼此相邻的两个FVIII氨基酸之间。在其他实施方案中,第二多肽链还包含第二异源部分(H2)。
本公开还包括一种嵌合分子,其包括包含VWF蛋白、异源部分(H1)和连接所述VWF蛋白与所述异源部分(H1)的VWF连接子的第一多肽链以及包含FVIII蛋白和XTEN序列的第二多肽链,其中所述第一多肽链中的所述VWF连接子包含:(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合,并且其中所述第一多肽链与所述第二多肽链彼此缔合。在一个实施方案中,所述XTEN序列连接至FVIII蛋白的N端或C端或者插入彼此相邻的两个FVIII氨基酸之间。在另一个实施方案中,所述嵌合分子还包含另外的XTEN序列,其连接至所述VWF蛋白、所述异源部分、所述VWF连接子或其任何组合。在其他实施方案中,所述嵌合分子还包含第二异源部分(H2)。在其他实施方案中,所述第二异源部分连接至FVIII蛋白、XTEN序列,或两者。
对于本公开的嵌合分子,连接至嵌合分子中的VWF蛋白、VWF连接子、FVIII蛋白或任何其他组分的XTEN序列包含约42个氨基酸、约72个氨基酸、约108个氨基酸、约144个氨基酸、约180个氨基酸、约216个氨基酸、约252个氨基酸、约288个氨基酸、约324个氨基酸、约360个氨基酸、约396个氨基酸、约432个氨基酸、约468个氨基酸、约504个氨基酸、约540个氨基酸、约576个氨基酸、约612个氨基酸、约624个氨基酸、约648个氨基酸、约684个氨基酸、约720个氨基酸、约756个氨基酸、约792个氨基酸、约828个氨基酸、约836个氨基酸、约864个氨基酸、约875个氨基酸、约912个氨基酸、约923个氨基酸、约948个氨基酸、约1044个氨基酸、约1140个氨基酸、约1236个氨基酸、约1318个氨基酸、约1332个氨基酸、约1428个氨基酸、约1524个氨基酸、约1620个氨基酸、约1716个氨基酸、约1812个氨基酸、约1908个氨基酸或约2004个氨基酸。在一些实施方案中,XTEN多肽选自AE42、AE72、AE864、AE576、AE288、AE144、AG864、AG576、AG288或AG144。在其他实施方案中,XTEN多肽选自SEQ ID NO:39;SEQ ID NO:40;SEQ ID NO:47;SEQ ID NO:45;SEQ ID NO:44;SEQ ID NO:41;SEQ ID NO:48;SEQ IDNO:46、SEQ ID NO:44或SEQ ID NO:42。
在其他方面,嵌合分子中的另外的XTEN序列包含约42个氨基酸、约72个氨基酸、约108个氨基酸、约144个氨基酸、约180个氨基酸、约216个氨基酸、约252个氨基酸、约288个氨基酸、约324个氨基酸、约360个氨基酸、约396个氨基酸、约432个氨基酸、约468个氨基酸、约504个氨基酸、约540个氨基酸、约576个氨基酸、约612个氨基酸、约624个氨基酸、约648个氨基酸、约684个氨基酸、约720个氨基酸、约756个氨基酸、约792个氨基酸、约828个氨基酸、约836个氨基酸、约864个氨基酸、约875个氨基酸、约912个氨基酸、约923个氨基酸、约948个氨基酸、约1044个氨基酸、约1140个氨基酸、约1236个氨基酸、约1318个氨基酸、约1332个氨基酸、约1428个氨基酸、约1524个氨基酸、约1620个氨基酸、约1716个氨基酸、约1812个氨基酸、约1908个氨基酸或约2004个氨基酸。在一些实施方案中,另外的XTEN多肽选自AE42、AE72、AE864、AE576、AE288、AE144、AG864、AG576、AG288或AG144。在某些实施方案中,另外的XTEN多肽选自SEQ ID NO:39;SEQ ID NO:40;SEQ ID NO:47;SEQ ID NO:45;SEQ ID NO:43;SEQ ID NO:41;SEQ ID NO:48;SEQ ID NO:46、SEQ ID NO:44或SEQ ID NO:42。
在一个实施方案中,可用于连接嵌合分子中的VWF蛋白与异源部分的VWF连接子包含a2区域,其包含与对应于全长FVIII的Glu720至Arg740具有至少约80%、约85%、约90%、约95%或100%同一性的氨基酸序列,其中所述a2区域能够被凝血酶裂解。在一个特定实施方案中,a2区域包含ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS(SEQ ID NO:4)。在另一个实施方案中,可用于连接VWF蛋白与异源部分的VWF连接子包含a1区域,其包含与对应于全长FVIII的Met337至Arg372具有至少约80%、约85%、约90%、约95%或100%同一性的氨基酸序列,其中所述a1区域能够被凝血酶裂解。在一些实施方案中,a1区域包含ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV(SEQ ID NO:5)。
在其他实施方案中,可用于连接VWF蛋白与异源部分的VWF连接子包含a3区域,其包含与对应于全长FVIII的Glu1649至Arg1689具有至少约80%、约85%、约90%、约95%或100%同一性的氨基酸序列,其中所述a3区域能够被凝血酶裂解。在一个特定实施方案中,a3区域包含ISEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQ(SEQ ID NO:6)。
在其他实施方案中,可用于连接VWF蛋白与异源部分的VWF连接子包含包括X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,并且其中所述PAR1外位点相互作用基序包含S-F-L-L-R-N(SEQ ID NO:7)。在一个实施方案中,PAR1外位点相互作用基序还包含选自以下的序列:P、P-N、P-N-D、P-N-D-K(SEQ ID NO:8)、P-N-D-K-Y(SEQ IDNO:9)、P-N-D-K-Y-E(SEQ ID NO:10)、P-N-D-K-Y-E-P(SEQ ID NO:11)、P-N-D-K-Y-E-P-F(SEQ ID NO:12)、P-N-D-K-Y-E-P-F-W(SEQ ID NO:13)、P-N-D-K-Y-E-P-F-W-E(SEQ ID NO:14)、P-N-D-K-Y-E-P-F-W-E-D(SEQ ID NO:20)、P-N-D-K-Y-E-P-F-W-E-D-E(SEQ ID NO:21)、P-N-D-K-Y-E-P-F-W-E-D-E-E(SEQ ID NO:22)、P-N-D-K-Y-E-P-F-W-E-D-E-E-S(SEQID NO:23)或其任何组合。在其他实施方案中,其中所述脂族氨基酸选自甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸。在一个特定实施方案中,VWF连接子包含GGLVPRSFLLRNPNDKYEPFWEDEES(SEQ ID NO:24)。
在某些实施方案中,如果在嵌合分子中用凝血酶裂解位点替代VWF连接子,则凝血酶裂解VWF连接子的速率比凝血酶将裂解凝血酶裂解位点的速率快。在其他实施方案中,如果在嵌合分子中用凝血酶裂解位点替代VWF连接子,则凝血酶裂解VWF连接子的速率是凝血酶将裂解凝血酶裂解位点的速率的至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。
在一些实施方案中,VWF连接子还包含具有至少约5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸的长度的一个或多个氨基酸。在一个实例中,所述一个或多个氨基酸包含gly肽。在另一个实例中,所述一个或多个氨基酸包含GlyGly。在其他实例中,所述一个或多个氨基酸包含gly/ser肽。在一些实例中,所述gly/ser肽具有(Gly4Ser)n或S(Gly4Ser)n的式,其中n是选自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80或100的正整数。在某些实例中,(Gly4Ser)n连接子是(Gly4Ser)3(SEQ ID NO:89)或(Gly4Ser)4(SEQ ID NO:90)。
可用于本发明的嵌合分子的VWF蛋白可包含VWF的D'结构域和D3结构域,其中所述D'结构域和所述D3结构域能够结合至FVIII蛋白。在一个实施方案中,VWF蛋白的D'结构域包含与SEQ ID NO:2的氨基酸764至866具有至少约90%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。在另一个实施方案中,VWF蛋白的D3结构域包含与SEQ ID NO:2的氨基酸867至1240具有至少约90%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
在其他实施方案中,VWF蛋白在对应于SEQ ID NO:2的残基1099、残基1142、或残基1099与1142的残基处含有至少一个氨基酸取代。在其他实施方案中,在VWF蛋白的序列中,用除半胱氨酸之外的氨基酸取代对应于SEQ ID NO:2的残基1099、残基1142、或残基1099与1142的残基。在其他实施方案中,VWF蛋白的序列包含SEQ ID NO:2的氨基酸764至1240。在某些实施方案中,VWF蛋白还包含VWF的D1结构域、D2结构域、或D1和D2结构域。在一些实施方案中,VWF蛋白还包含选自A1结构域、A2结构域、A3结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、其一个或多个片段或其任何组合的VWF结构域。在其他实施方案中,VWF蛋白基本上由以下组成或由以下组成:(1)VWF的D'和D3结构域或其片段;(2)VWF的D1、D'和D3结构域或其片段;(3)VWF的D2、D'和D3结构域或其片段;(4)VWF的D1、D2、D'和D3结构域或其片段;或(5)VWF的D1、D2、D'、D3和A1结构域或其片段。在其他实施方案中,VWF蛋白还包含VWF的信号肽。在其他实施方案中,VWF蛋白被聚乙二醇化、糖基化、羟乙基化或聚唾液酸化。术语“聚乙二醇化”是指在蛋白质上具有聚乙二醇(PEG);术语“糖基化”是指在蛋白质上具有糖基化;术语“羟乙基化”是指在蛋白质上具有羟乙基淀粉(HES);以及术语“聚唾液酸化”是指在蛋白质上具有聚唾液酸(PSA)。PEG、HES和PSA的实例显示于本文他处。
在一些方面,经由VWF连接子与VWF蛋白融合的异源部分(H1)能够延长嵌合分子的半衰期。在一个实施方案中,异源部分(H1)包含免疫球蛋白恒定区或其部分、白蛋白、白蛋白结合部分、PAS、HAP、转铁蛋白或其片段、聚乙二醇(PEG)、羟乙基淀粉(HES)、PSA、人类绒毛膜促性腺激素的β亚单位的C端肽(CTP)或其任何组合。在另一个实施方案中,异源部分包含FcRn结合伴侣。在其他实施方案中,异源部分包含Fc区。在其他实施方案中,异源部分(H1)包含清除受体或其片段,其中所述清除受体阻断FVIII蛋白结合于FVIII清除受体。在一些实施方案中,其中所述清除受体是低密度脂蛋白受体相关蛋白1(LRP1)或其FVIII结合片段。
在一些方面,经由任选的FVIII连接子与FVIII蛋白融合的第二异源部分包含免疫球蛋白恒定区或其部分、白蛋白、白蛋白结合多肽、PAS、人类绒毛膜促性腺激素的β亚单位的C端肽(CTP)、聚乙二醇(PEG)、羟乙基淀粉(HES)、白蛋白结合小分子或其任何组合。在一个实施方案中,第二异源部分(H2)能够延长FVIII蛋白的半衰期。在另一个实施方案中,第二异源部分(H2)包含多肽、非多肽部分,或两者。在其他实施方案中,第二异源部分(H2)包含免疫球蛋白恒定区或其部分。在其他实施方案中,第二异源部分包含FcRn结合伴侣。在其他实施方案中,第二异源部分包含第二Fc区。
在一些实施方案中,经由VWF连接子与VWF蛋白融合的第一异源部分与经由任选的连接子与FVIII蛋白融合的第二异源部分彼此缔合,其中XTEN序列与所述组分中的任一种融合。在一个实施方案中,第一多肽链与第二多肽之间的缔合是共价键。在另一个实施方案中,第一异源部分与第二异源部分之间的缔合是二硫键。在其他实施方案中,第一异源部分是FcRn结合伴侣并且第二异源部分是FcRn结合伴侣。在其他实施方案中,第一异源部分是Fc区,并且第二异源部分是Fc区。
在某些实施方案中,FVIII蛋白是通过FVIII连接子连接至第二异源部分。在一个实施方案中,第二连接子是可裂解连接子。在另一个实施方案中,FVIII连接子与VWF连接子相同。在其他实施方案中,FVIII连接子与VWF连接子不同。
在一些方面,本发明的嵌合分子包含选自以下的式:(a)V-L1-X1-H1:H2-L2-X2-C;(b)V-X1-L1-H1:H2-L2-X2-C;(c)V-L1-X1-H1:H2-X2-L2-C;(d)V-X1-L1-H1:H2-X2-L2-C;(e)V-L1-X1-H1:H2-L2-C(X2);(f)V-X1-L1-H1:H2-L2-C(X2);(g)C-X2-L2-H2:H1-X1-L1-V;(h)C-X2-L2-H2:H1-L1-X1-V;(i)C-L2-X2-H2:H1-L1-X1-V;(j)C-L2-X2-H2:H1-L1-X1-V;(k)C(X2)-L2-H2:H1-X1-L1-V;或(l)C(X2)-L2-H2:H1-L1-X1-V;其中V是VWF蛋白;L1是VWF连接子;L2是任选的FVIII连接子;H1是第一异源部分;H2是第二异源部分;X1是XTEN序列;X2是任选的XTEN序列;C是FVIII蛋白;C(X2)是与XTEN序列融合的FVIII蛋白,其中所述XTEN序列插入彼此相邻的两个FVIII氨基酸之间;(-)是肽键或一个或多个氨基酸;并且(:)是H1与H2之间的共价键。
在其他方面,嵌合分子包含选自以下的式:(a)V-L1-X1-H1:H2-L2-X2-C;(b)V-X1-L1-H1:H2-L2-X2-C;(c)V-L1-X1-H1:H2-X2-L2-C;(d)V-X1-L1-H1:H2-X2-L2-C;(e)V-L1-X1-H1:H2-L2-C(X2);(f)V-X1-L1-H1:H2-L2-C(X2);(g)C-X2-L2-H2:H1-X1-L1-V;(h)C-X2-L2-H2:H1-L1-X1-V;(i)C-L2-X2-H2:H1-L1-X1-V;(j)C-L2-X2-H2:H1-L1-X1-V;(k)C(X2)-L2-H2:H1-X1-L1-V;或(l)C(X2)-L2-H2:H1-L1-X1-V;其中V是VWF蛋白;L1是VWF连接子;L2是任选的FVIII连接子;H1是第一异源部分;H2是第二异源部分;X1是XTEN序列;X2是任选的XTEN序列;C是FVIII蛋白;C(X2)是与XTEN序列融合的FVIII蛋白,其中所述XTEN序列插入彼此相邻的两个FVIII氨基酸之间;(-)是肽键或一个或多个氨基酸;并且(:)是H1与H2之间的共价键。
在其他方面中,嵌合分子包含选自以下的式:(a)V-L1-X1-H1:H2-L2-X2-C;(b)V-X1-L1-H1:H2-L2-X2-C;(c)V-L1-X1-H1:H2-X2-L2-C;(d)V-X1-L1-H1:H2-X2-L2-C;(e)V-L1-X1-H1:H2-L2-C(X2);(f)V-X1-L1-H1:H2-L2-C(X2);(g)C-X2-L2-H2:H1-X1-L1-V;(h)C-X2-L2-H2:H1-L1-X1-V;(i)C-L2-X2-H2:H1-L1-X1-V;(j)C-L2-X2-H2:H1-L1-X1-V;(k)C(X2)-L2-H2:H1-X1-L1-V;或(l)C(X2)-L2-H2:H1-L1-X1-V;其中V是VWF蛋白;L1是VWF连接子;L2是任选的FVIII连接子;H1是第一异源部分;H2是第二异源部分;X1是任选的XTEN序列;X2是XTEN序列;C是FVIII蛋白;C(X2)是与XTEN序列融合的FVIII蛋白,其中所述XTEN序列插入彼此相邻的两个FVIII氨基酸之間;(-)是肽键或一个或多个氨基酸;并且(:)是H1与H2之间的共价键。
在本发明的嵌合分子中,VWF蛋白可抑制或防止内源性VWF结合于FVIII蛋白。
在某些方面中,嵌合分子中的FVIII蛋白可包含第三异源部分(H3)。所述第三异源部分(H3)可以是XTEN序列。在其他方面,FVIII蛋白包含第四异源部分(H4)。所述第四异源部分(H4)可以是XTEN序列。在一些方面,FVIII蛋白包含第五异源部分(H5)。所述第五异源部分可以是XTEN序列。在其他方面,FVIII蛋白包含第六异源部分(H6)。所述第六异源部分可以是XTEN序列。在某些方面中,第三异源部分(H3)、第四异源部分(H4)、第五异源部分(H5)和第六异源部分(H6)中的一个或多个能够延长嵌合分子的半衰期。在其他方面,第三异源部分(H3)、第四异源部分(H4)、第五异源部分(H5)和第六异源部分(H6)连接至FVIII的C端或N端或者插入FVIII蛋白的两个氨基酸之间。在其他方面,第三异源部分、第四异源部分、第五异源部分和第六异源部分中的一个或多个包含选自约42个氨基酸、约72个氨基酸、约108个氨基酸、约144个氨基酸、约180个氨基酸、约216个氨基酸、约252个氨基酸、约288个氨基酸、约324个氨基酸、约360个氨基酸、约396个氨基酸、约432个氨基酸、约468个氨基酸、约504个氨基酸、约540个氨基酸、约576个氨基酸、约612个氨基酸、约624个氨基酸、约648个氨基酸、约684个氨基酸、约720个氨基酸、约756个氨基酸、约792个氨基酸、约828个氨基酸、约836个氨基酸、约864个氨基酸、约875个氨基酸、约912个氨基酸、约923个氨基酸、约948个氨基酸、约1044个氨基酸、约1140个氨基酸、约1236个氨基酸、约1318个氨基酸、约1332个氨基酸、约1428个氨基酸、约1524个氨基酸、约1620个氨基酸、约1716个氨基酸、约1812个氨基酸、约1908个氨基酸或约2004个氨基酸中的一个或多个的长度。例如,第三异源部分、第四异源部分、第五异源部分或第六异源部分的XTEN序列可选自AE42、AE72、AE864、AE576、AE288、AE144、AG864、AG576、AG288或AG144。更具体地,XTEN序列可选自SEQ ID NO:39;SEQID NO:40;SEQ ID NO:47;SEQ ID NO:45;SEQ ID NO:43;SEQ ID NO:41;SEQ ID NO:48;SEQID NO:46、SEQ ID NO:44或SEQ ID NO:42。
在某些实施方案中,嵌合分子的半衰期相比于野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
本公开还提供编码嵌合分子或其互补序列的聚核苷酸或一组聚核苷酸。所述聚核苷酸或所述一组聚核苷酸还可包含编码PC5或PC7的聚核苷酸链。
还包括包含所述聚核苷酸或所述一组聚核苷酸和可操作地连接至所述聚核苷酸或所述一组聚核苷酸的一个或多个启动子的载体或一组载体。在一些实施方案中,所述载体或所述一组载体还可包含编码PC5或PC7的一个另外的聚核苷酸链。
本发明还包括一种宿主细胞,其包含所述聚核苷酸或所述一组聚核苷酸或者所述载体或所述一组载体。在一个实施方案中,宿主细胞是哺乳动物细胞。在另一个实施方案中,宿主细胞选自HEK293细胞、CHO细胞或BHK细胞。
在一些方面,本发明包括一种药物组合物,其包含本文公开的嵌合分子、编码所述嵌合分子的聚核苷酸或一组聚核苷酸、包含所述聚核苷酸或所述一组聚核苷酸的载体或一组载体、或本文公开的宿主细胞,和药学上可接受的载体。在一个实施方案中,所述组合物中的嵌合分子相比于野生型FVIII蛋白具有延长的半衰期。在另一个实施方案中,其中组合物中的嵌合分子的半衰期相比于野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
还包括一种降低有需要的受试者中出血事件的频率或程度的方法,其包括施用有效量的本文公开的嵌合分子、编码所述嵌合分子的聚核苷酸或一组聚核苷酸、本文公开的载体或一组载体、本文公开的宿主细胞、或本文公开的组合物。本发明还包括一种预防有需要的受试者中出血事件的发生的方法,其包括施用有效量的本文公开的嵌合分子、编码所述嵌合分子的聚核苷酸或一组聚核苷酸、本文公开的载体或一组载体、本文公开的宿主细胞、或本文公开的组合物。在一个实施方案中,出血事件是来自出血凝血障碍、关节积血、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、创伤性头癣、胃肠道出血、颅内溢血、腹内溢血、胸内溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髋腰肌鞘中出血或其任何组合。在另一个实施方案中,本文公开的嵌合分子、编码所述嵌合分子的聚核苷酸或一组聚核苷酸、本文公开的载体或一组载体、本文公开的宿主细胞或本文公开的组合物可通过选自局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用、经口施用或其任何组合的途径施用。
本公开还包括一种制备嵌合分子的方法,其包括用本文公开的聚核苷酸或本文公开的载体转染一个或多个宿主细胞并且在所述宿主细胞中表达所述嵌合分子。所述方法还包含分离所述嵌合分子。在一些实施方案中,嵌合分子的FVIII活性可通过aPTT测定法或ROTEM测定法测量。
本公开涉及下述实施方案。
1.一种嵌合分子,其包含温韦伯氏因子(VWF)蛋白、异源部分(H1)、XTEN序列和连接所述VWF蛋白与所述异源部分的VWF连接子,其中所述VWF连接子包含选自以下的多肽:
i.来自因子VIII(FVIII)的a2区域;
ii.来自FVIII的a1区域;
iii.来自FVIII的a3区域;
iv.包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或
v.其任何组合,并且
其中所述XTEN序列连接至所述VWF蛋白、所述异源部分(H1)、所述VWF连接子或其任何组合。
2.如实施方案1所述的嵌合分子,其中所述XTEN序列连接所述VWF蛋白与所述VWF连接子或者所述VWF连接子与所述异源部分。
3.如实施方案1或2所述的嵌合分子,其还包含包括FVIII蛋白的第二多肽链,其中所述第一多肽链与所述第二多肽链彼此缔合。
4.如实施方案3所述的嵌合分子,其中所述FVIII蛋白还包含另外的XTEN序列。
5.如实施方案4所述的嵌合分子,其中所述另外的XTEN序列连接至所述FVIII蛋白的N端或C端或者插入彼此相邻的两个FVIII氨基酸之间。
6.如实施方案3至5中任一项所述的嵌合分子,其中所述第二多肽链还包含第二异源部分(H2)。
7.一种嵌合分子,其包括包含VWF蛋白、异源部分(H1)和连接所述VWF蛋白与所述异源部分(H1)的VWF连接子的第一多肽链和包含FVIII蛋白和XTEN序列的第二多肽链,其中所述第一多肽链中的所述VWF连接子包含:
i.来自FVIII的a2区域;
ii.来自FVIII的a1区域;
iii.来自FVIII的a3区域;
iv.包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或
v.其任何组合,
并且其中所述第一多肽链与所述第二多肽链彼此缔合。
8.如实施方案7所述的嵌合分子,其中所述XTEN序列连接至所述FVIII蛋白的N端或C端或者插入彼此相邻的两个FVIII氨基酸之间。
9.如实施方案7或8所述的嵌合分子,其还包含另外的XTEN序列,所述另外的XTEN序列连接至所述VWF蛋白、所述异源部分、所述VWF连接子或其任何组合。
10.如实施方案7至9中任一项所述的嵌合分子,其还包含第二异源部分(H2)。
11.如实施方案10所述的嵌合分子,其中所述第二异源部分连接至所述FVIII蛋白、所述XTEN序列,或两者。
12.如实施方案1至11中任一项所述的嵌合分子,其中所述XTEN序列包含约42个氨基酸、约72个氨基酸、约108个氨基酸、约144个氨基酸、约180个氨基酸、约216个氨基酸、约252个氨基酸、约288个氨基酸、约324个氨基酸、约360个氨基酸、约396个氨基酸、约432个氨基酸、约468个氨基酸、约504个氨基酸、约540个氨基酸、约576个氨基酸、约612个氨基酸、约624个氨基酸、约648个氨基酸、约684个氨基酸、约720个氨基酸、约756个氨基酸、约792个氨基酸、约828个氨基酸、约836个氨基酸、约864个氨基酸、约875个氨基酸、约912个氨基酸、约923个氨基酸、约948个氨基酸、约1044个氨基酸、约1140个氨基酸、约1236个氨基酸、约1318个氨基酸、约1332个氨基酸、约1428个氨基酸、约1524个氨基酸、约1620个氨基酸、约1716个氨基酸、约1812个氨基酸、约1908个氨基酸或约2004个氨基酸。
13.如实施方案1至12中任一项所述的嵌合分子,其中所述XTEN序列选自AE42、AE72、AE864、AE576、AE288、AE144、AG864、AG576、AG288或AG144。
14.如实施方案1至13中任一项所述的嵌合分子,其中所述XTEN序列选自SEQ IDNO:39;SEQ ID NO:40;SEQ ID NO:47;SEQ ID NO:45;SEQ ID NO:44;SEQ ID NO:41;SEQ IDNO:48;SEQ ID NO:46、SEQ ID NO:44或SEQ ID NO:42。
15.如实施方案4至6和9至11中任一项所述的嵌合分子,其中所述另外的XTEN序列包含约42个氨基酸、约72个氨基酸、约108个氨基酸、约144个氨基酸、约180个氨基酸、约216个氨基酸、约252个氨基酸、约288个氨基酸、约324个氨基酸、约360个氨基酸、约396个氨基酸、约432个氨基酸、约468个氨基酸、约504个氨基酸、约540个氨基酸、约576个氨基酸、约612个氨基酸、约624个氨基酸、约648个氨基酸、约684个氨基酸、约720个氨基酸、约756个氨基酸、约792个氨基酸、约828个氨基酸、约836个氨基酸、约864个氨基酸、约875个氨基酸、约912个氨基酸、约923个氨基酸、约948个氨基酸、约1044个氨基酸、约1140个氨基酸、约1236个氨基酸、约1318个氨基酸、约1332个氨基酸、约1428个氨基酸、约1524个氨基酸、约1620个氨基酸、约1716个氨基酸、约1812个氨基酸、约1908个氨基酸或约2004个氨基酸。
16.如实施方案4至6、9至11和15中任一项所述的嵌合分子,其中所述另外的XTEN序列选自AE42、AE72、AE864、AE576、AE288、AE144、AG864、AG576、AG288或AG144。
17.如实施方案4至6、9至11和15至16中任一项所述的嵌合分子,其中所述另外的XTEN序列选自SEQ ID NO:39;SEQ ID NO:40;SEQ ID NO:47;SEQ ID NO:45;SEQ ID NO:43;SEQ ID NO:41;SEQ ID NO:48;SEQ ID NO:46、SEQ ID NO:44或SEQ ID NO:42。
18.如实施方案1至17中任一项所述的嵌合分子,其中所述VWF连接子包含所述a2区域,其包含与对应于全长FVIII的Glu720至Arg740具有至少约80%、约85%、约90%、约95%或100%同一性的氨基酸序列,其中所述a2区域能够被凝血酶裂解。
19.如实施方案18所述的嵌合分子,其中所述a2区域包含SEQ ID NO:4。
20.如实施方案1至17中任一项所述的嵌合分子,其中所述VWF连接子包含所述a1区域,其包含与对应于全长FVIII的Met337至Arg372具有至少约80%、至少约85%、至少约90%、至少约95%或100%同一性的氨基酸序列,其中所述a1区域能够被凝血酶裂解。
21.如实施方案20所述的嵌合分子,其中所述a1区域包含SEQ ID NO:5。
22.如实施方案1至17中任一项所述的嵌合分子,其中所述VWF连接子包含所述a3区域,其包含与对应于全长FVIII的Glu1649至Arg1689具有至少约80%、约85%、约90%、约95%或100%同一性的氨基酸序列,其中所述a3区域能够被凝血酶裂解。
23.如实施方案22所述的嵌合分子,其中所述a3区域包含SEQ ID NO:6。
24.如实施方案1至17中任一项所述的嵌合分子,其中所述VWF连接子包含包括X-V-P-R(SEQ ID NO:3)的所述凝血酶裂解位点和所述PAR1外位点相互作用基序并且其中所述PAR1外位点相互作用基序包含S-F-L-L-R-N(SEQ ID NO:7)。
25.如实施方案1至17和24中任一项所述的嵌合分子,其中所述PAR1外位点相互作用基序还包含选自以下的序列:P、P-N、P-N-D、P-N-D-K(SEQ ID NO:8)、P-N-D-K-Y(SEQ IDNO:9)、P-N-D-K-Y-E(SEQ ID NO:10)、P-N-D-K-Y-E-P(SEQ ID NO:11)、P-N-D-K-Y-E-P-F(SEQ ID NO:12)、P-N-D-K-Y-E-P-F-W(SEQ ID NO:13)、P-N-D-K-Y-E-P-F-W-E(SEQ ID NO:14)、P-N-D-K-Y-E-P-F-W-E-D(SEQ ID NO:20)、P-N-D-K-Y-E-P-F-W-E-D-E(SEQ ID NO:21)、P-N-D-K-Y-E-P-F-W-E-D-E-E(SEQ ID NO:22)、P-N-D-K-Y-E-P-F-W-E-D-E-E-S(SEQID NO:23)或其任何组合。
26.如实施方案1至17、24和25中任一项所述的嵌合分子,其中所述脂族氨基酸选自甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸。
27.如实施方案1至26中任一项所述的嵌合分子,其中所述VWF连接子被凝血酶裂解的速率比由L-V-P-R(SEQ ID NO:25)组成的凝血酶裂解位点被凝血酶裂解的速率快。
28.如实施方案1至27中任一项所述的嵌合分子,其中所述VWF连接子包含SEQ IDNO:24。
29.如实施方案27所述的嵌合分子,其中所述VWF连接子被凝血酶裂解的速率是由L-V-P-R(SEQ ID NO:25)组成的凝血酶裂解位点被凝血酶裂解的速率的至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。
30.如实施方案1至29中任一项所述的嵌合分子,其中所述VWF连接子还包含一个或多个氨基酸,所述VWF连接子具有至少约1、5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸的长度。
31.如实施方案30所述的嵌合分子,其中所述一个或多个氨基酸包含gly肽。
32.如实施方案30或31所述的嵌合分子,其中所述一个或多个氨基酸包含GlyGly。
33.如实施方案30所述的嵌合分子,其中所述一个或多个氨基酸包含gly/ser肽。
34.如实施方案33所述的嵌合分子,其中所述gly/ser肽具有(Gly4Ser)n或S(Gly4Ser)n的式,其中n是选自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80或100的正整数。
35.如实施方案34所述的嵌合分子,其中所述(Gly4Ser)n连接子是(Gly4Ser)3(SEQID NO:89)或(Gly4Ser)4(SEQ ID NO:90)。
36.如实施方案1至35中任一项所述的嵌合分子,其中所述VWF蛋白包含VWF的D'结构域和D3结构域,其中所述D'结构域和所述D3结构域能够结合于FVIII蛋白。
37.如实施方案36所述的嵌合分子,其中所述VWF蛋白的所述D'结构域包含与SEQID NO:2的氨基酸764至866具有至少约90%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
38.如实施方案36或37所述的嵌合分子,其中所述VWF蛋白的所述D3结构域包含与SEQ ID NO:2的氨基酸867至1240具有至少约90%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
39.如实施方案36至38中任一项所述的嵌合分子,其中所述VWF蛋白在对应于SEQID NO:2的残基1099、残基1142、或残基1099与1142的残基处含有至少一个氨基酸取代。
40.如实施方案1至39中任一项所述的嵌合分子,其中在所述VWF蛋白的序列中,用除半胱氨酸之外的氨基酸取代对应于SEQ ID NO:2的残基1099、残基1142、或残基1099与1142的残基。
41.如实施方案1至39中任一项所述的嵌合分子,其中所述VWF蛋白的序列包含SEQID NO:2的氨基酸764至1240。
42.如实施方案36至41中任一项所述的嵌合分子,其中所述VWF蛋白还包含VWF的D1结构域、D2结构域、或D1和D2结构域。
43.如实施方案36至42中任一项所述的嵌合分子,其中所述VWF蛋白还包含选自A1结构域、A2结构域、A3结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、一个或多个其片段或其任何组合的VWF结构域。
44.如实施方案36至43中任一项所述的嵌合分子,其中所述VWF蛋白基本上由以下组成或由以下组成:(1)VWF的D'和D3结构域或其片段;(2)VWF的D1、D'和D3结构域或其片段;(3)VWF的D2、D'和D3结构域或其片段;(4)VWF的D1、D2、D'和D3结构域或其片段;或(5)VWF的D1、D2、D'、D3和A1结构域或其片段。
45.如实施方案1至44中任一项所述的嵌合分子,其还包含VWF的信号肽。
46.如实施方案1至45中任一项所述的嵌合分子,其中所述VWF蛋白被聚乙二醇化、糖基化、羟乙基化或聚唾液酸化。
47.如实施方案1至46中任一项所述的嵌合分子,其中所述异源部分(H1)能够延长所述嵌合分子的半衰期。
48.如实施方案47所述的嵌合分子,其中所述异源部分(H1)包含免疫球蛋白恒定区或其部分、白蛋白、白蛋白结合多肽、PAS、人类绒毛膜促性腺激素的β亚单位的C端肽(CTP)、聚乙二醇(PEG)、羟乙基淀粉(HES)、白蛋白结合小分子或其任何组合。
49.如实施方案48所述的嵌合分子,其中所述免疫球蛋白恒定区或其部分包含FcRn结合伴侣。
50.如实施方案48所述的嵌合分子,其中所述免疫球蛋白恒定区或其部分包含Fc区。
51.如实施方案1至47中任一项所述的嵌合分子,其中所述异源部分(H1)包含清除受体或其片段,其中所述清除受体阻断FVIII蛋白结合于FVIII清除受体。
52.如实施方案51所述的嵌合分子,其中所述清除受体是低密度脂蛋白受体相关蛋白1(LRP1)或其FVIII结合片段。
53.如实施方案6和10至52中任一项所述的嵌合分子,其中所述第二异源部分包含免疫球蛋白恒定区或其部分、白蛋白、白蛋白结合多肽、PAS、人类绒毛膜促性腺激素的β亚单位的C端肽(CTP)、聚乙二醇(PEG)、羟乙基淀粉(HES)、白蛋白结合小分子或其任何组合。
54.如实施方案6和10至53中任一项所述的嵌合分子,其中所述第二异源部分(H2)能够延长所述FVIII蛋白的半衰期。
55.如实施方案54所述的嵌合分子,其中所述第二异源部分(H2)包含多肽、非多肽部分,或两者。
56.如实施方案54或55所述的嵌合分子,其中所述第二异源部分(H2)包含免疫球蛋白恒定区或其部分。
57.如实施方案56所述的嵌合分子,其中所述第二异源部分包含FcRn结合伴侣。
58.如实施方案56所述的嵌合分子,其中所述第二异源部分包含第二Fc区。
59.如实施方案6和10至58中任一项所述的嵌合分子,其中所述第一异源部分与所述第二异源部分彼此缔合。
60.如实施方案59所述的嵌合分子,其中所述第一多肽链与所述第二多肽之间的缔合是共价键。
61.如实施方案59所述的嵌合分子,其中所述第一异源部分与所述第二异源部分之间的缔合是二硫键。
62.如实施方案6和10至58中任一项所述的嵌合分子,其中所述第一异源部分是FcRn结合伴侣并且所述第二异源部分是FcRn结合伴侣。
63.如实施方案6和10至58中任一项所述的嵌合分子,其中所述第一异源部分是Fc区并且所述第二异源部分是Fc区。
64.如实施方案6和10至58中任一项所述的嵌合分子,其中所述FVIII蛋白是通过FVIII连接子连接至所述第二异源部分。
65.如实施方案64所述的嵌合分子,其中所述FVIII连接子是可裂解连接子。
66.如实施方案64或65所述的嵌合分子,其中所述FVIII连接子与所述VWF连接子相同。
67.如实施方案64或65所述的嵌合分子,其中所述FVIII连接子与所述VWF连接子不同。
68.如实施方案6和10至67中任一项所述的嵌合分子,其包含选自以下的式:
(a)V-L1-X1-H1:H2-L2-X2-C;
(b)V-X1-L1-H1:H2-L2-X2-C;
(c)V-L1-X1-H1:H2-X2-L2-C;
(d)V-X1-L1-H1:H2-X2-L2-C;
(e)V-L1-X1-H1:H2-L2-C(X2);
(f)V-X1-L1-H1:H2-L2-C(X2);
(g)C-X2-L2-H2:H1-X1-L1-V;
(h)C-X2-L2-H2:H1-L1-X1-V;
(i)C-L2-X2-H2:H1-L1-X1-V;
(j)C-L2-X2-H2:H1-I.1-X1-V;
(k)C(X2)-L2-H2:H1-X1-L1-V;或
(l)C(X2)-L2-H2:H1-L1-X1-V;
其中V是所述VWF蛋白;
L1是所述VWF连接子;
L2是任选的FVIII连接子;
H1是所述第一异源部分;
H2是所述第二异源部分;
C是所述FVIII蛋白;
C(X2)是与所述XTEN序列融合的所述FVIII蛋白,其中所述XTEN序列插入彼此相邻的两个FVIII氨基酸之间;
(-)是肽键或一个或多个氨基酸;并且
(:)是所述H1与所述H2之间的共价键。
69.如实施方案6和10至68中任一项所述的嵌合分子,其中所述VWF蛋白抑制或防止内源性VWF结合于所述FVIII蛋白。
70.如实施方案6和10至69中任一项所述的嵌合分子,其中所述FVIII蛋白包含第三异源部分(H3)。
71.如实施方案70所述的嵌合分子,其中所述第三异源部分(H3)是XTEN序列。
72.如实施方案70或71所述的嵌合分子,其中所述FVIII蛋白包含第四异源部分(H4)。
73.如实施方案72所述的嵌合分子,其中所述第四异源部分(H4)是XTEN序列。
74.如实施方案72或73所述的嵌合分子,其中所述FVIII蛋白包含第五异源部分(H5)。
75.如实施方案74所述的嵌合分子,其中所述第五异源部分是XTEN序列。
76.如实施方案74或75所述的嵌合分子,其中所述FVIII蛋白包含所述第六异源部分(H6)。
77.如实施方案76所述的嵌合分子,其中所述第六异源部分是XTEN序列。
78.如实施方案76或77所述的嵌合分子,其中所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)和所述第六异源部分(H6)中的一个或多个能够延长所述嵌合分子的半衰期。
79.如实施方案76或77所述的嵌合分子,其中所述第三异源部分(H3)、所述第四异源部分(H4)、所述第五异源部分(H5)和所述第六异源部分(H6)连接至FVIII的C端或N端或者插入所述FVIII蛋白的两个氨基酸之间。
80.如实施方案71、73、75和77中任一项所述的嵌合分子,其中所述XTEN序列中的一个或多个包含选自约42个氨基酸、约72个氨基酸、约108个氨基酸、约144个氨基酸、约180个氨基酸、约216个氨基酸、约252个氨基酸、约288个氨基酸、约324个氨基酸、约360个氨基酸、约396个氨基酸、约432个氨基酸、约468个氨基酸、约504个氨基酸、约540个氨基酸、约576个氨基酸、约612个氨基酸、约624个氨基酸、约648个氨基酸、约684个氨基酸、约720个氨基酸、约756个氨基酸、约792个氨基酸、约828个氨基酸、约836个氨基酸、约864个氨基酸、约875个氨基酸、约912个氨基酸、约923个氨基酸、约948个氨基酸、约1044个氨基酸、约1140个氨基酸、约1236个氨基酸、约1318个氨基酸、约1332个氨基酸、约1428个氨基酸、约1524个氨基酸、约1620个氨基酸、约1716个氨基酸、约1812个氨基酸、约1908个氨基酸或约2004个氨基酸中的一个或多个的长度。
81.如实施方案71、73、75、77和80中任一项所述的嵌合分子,其中所述XTEN序列选自AE42、AE72、AE864、AE576、AE288、AE144、AG864、AG576、AG288或AG144。
82.如实施方案81所述的嵌合分子,其中所述XTEN序列选自SEQ ID NO:39;SEQ IDNO:40;SEQ ID NO:47;SEQ ID NO:45;SEQ ID NO:44;SEQ ID NO:41;SEQ ID NO:48;SEQ IDNO:46、SEQ ID NO:44或SEQ ID NO:42。
83.如实施方案1至82中任一项所述的嵌合分子,其中所述嵌合分子的半衰期相比于野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
84.一种聚核苷酸或一组聚核苷酸,其编码如实施方案1至83中任一项所述的嵌合分子或其互补序列。
85.如实施方案84所述的聚核苷酸或一组聚核苷酸,其还包含编码PC5或PC7的聚核苷酸链。
86.一种载体或一组载体,其包含如实施方案84或85所述的聚核苷酸或一组聚核苷酸和一个或多个可操作地连接至所述聚核苷酸或所述一组聚核苷酸的启动子。
87.如实施方案86所述的载体或一组载体,其还包含编码PC5或PC7的另外的聚核苷酸链。
88.一种宿主细胞,其包含如实施方案86或87所述的聚核苷酸或一组聚核苷酸或者如实施方案86或87所述的载体或一组载体。
89.如实施方案88所述的宿主细胞,其是哺乳动物细胞。
90.如实施方案89所述的宿主细胞,其中所述哺乳动物细胞选自HEK293细胞、CHO细胞或BHK细胞。
91.一种药物组合物,其包含如实施方案1至83中任一项所述的嵌合分子、如实施方案84或85所述的聚核苷酸或一组聚核苷酸、如实施方案86或87所述的载体或一组载体、或如实施方案88至90中任一项所述的宿主细胞,和药学上可接受的载体。
92.如实施方案91所述的组合物,其中所述嵌合分子相比于野生型FVIII蛋白具有延长的半衰期。
93.如实施方案91或92所述的组合物,其中所述嵌合分子的半衰期相比于野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
94.一种降低有需要的受试者中出血事件的频率或程度的方法,其包括施用有效量的如实施方案1至83中任一项所述的嵌合分子、如实施方案84或85所述的聚核苷酸、如实施方案86或87所述的载体、如实施方案88至90中任一项所述的宿主细胞、或如实施方案91至93中任一项所述的组合物。
95.一种预防有需要的受试者中出血事件的发生的方法,其包括施用有效量的如实施方案1至83中任一项所述的嵌合分子、如实施方案84或85所述的聚核苷酸、如实施方案86或87所述的载体、如实施方案88至90中任一项所述的宿主细胞、或如实施方案91至93中任一项所述的组合物。
96.如实施方案94或95所述的方法,其中所述出血事件是来自出血凝血障碍、关节积血、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、创伤性头癣、胃肠道出血、颅内溢血、腹内溢血、胸内溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髋腰肌鞘中出血或其任何组合。
97.如实施方案95至96中任一项所述的方法,其中如实施方案1至83中任一项所述的嵌合分子、如实施方案84或85所述的聚核苷酸、如实施方案86或87所述的载体、如实施方案88至90中任一项所述的宿主细胞、或如实施方案91至93中任一项所述的组合物是通过选自局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用、经口施用或其任何组合的途径施用。
98.一种制备嵌合分子的方法,其包括用如实施方案84或85所述的聚核苷酸或如实施方案86或87所述的载体转染一个或多个宿主细胞并且在所述宿主细胞中表达所述嵌合分子。
99.如实施方案98所述的方法,其还包括分离所述嵌合分子。
100.一种提高包含VWF蛋白、异源部分(H1)和连接所述VWF蛋白与所述异源部分(H1)的VWF连接子以及包含FVIII蛋白和XTEN序列的第二多肽链的嵌合FVIII蛋白的FVIII活性的方法,其中第一多肽链中的所述VWF连接子包含:
i.来自FVIII的a2区域;
ii.来自FVIII的a1区域;
iii.来自FVIII的a3区域;
iv.包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或
v.其任何组合。
101.如实施方案100所述的方法,其中所述FVIII活性是通过aPTT测定法或ROTEM测定法测量的。
102.一种包含两个多肽序列的嵌合分子,第一多肽序列包含与FVIII169(SEQ IDNO:88)具有至少约80%、约90%、约95%或100%同一性的氨基酸序列并且第二多肽序列包含与VWF059(SEQ ID NO:82)具有至少约80%、90%、95%或100%同一性的氨基酸序列。
103.一种包含两个多肽序列的嵌合分子,第一多肽序列包含与FVIII286(SEQ IDNO:86)具有至少约80%、约90%、约95%或100%同一性的氨基酸序列并且第二多肽序列包含与VWF059(SEQ ID NO:82)具有至少约80%、约90%、约95%或100%同一性的氨基酸序列。
104.一种包含两个多肽序列的嵌合分子,第一多肽序列包含与FVIII286(SEQ IDNO:86)具有至少约80%、约90%、约95%或100%同一性的氨基酸序列并且第二多肽序列包含与VWF062(SEQ ID NO:84)具有至少约80%、90%、95%或100%同一性的氨基酸序列。
105.一种包含两个多肽序列的嵌合分子,第一多肽序列包含与FVIII286(SEQ IDNO:86)具有至少约80%、约90%、约95%或100%同一性的氨基酸序列并且第二多肽序列包含与VWF057(SEQ ID NO:80)具有至少约80%、90%、95%或100%同一性的氨基酸序列。
106.一种聚核苷酸或多种聚核苷酸,其编码如实施方案102至105中任一项所述的嵌合分子。
107.一种聚核苷酸,其编码与VWF057(SEQ ID NO:79)具有至少约80%、约90%、约95%或100%同一性的核苷酸序列。
108.如实施方案107所述的聚核苷酸,其还包含第二聚核苷酸,所述第二聚核苷酸包含与FVIII169(SEQ ID NO:87)具有至少约80%、约90%、约95%或100%同一性的第二核苷酸序列。
109.如实施方案107所述的聚核苷酸,其还包含第二聚核苷酸,所述第二聚核苷酸包含与FVIII286(SEQ ID NO:85)具有至少约80%、约90%、约95%或100%同一性的第二核苷酸序列。
110.如实施方案108或109所述的聚核苷酸,其中所述第一聚核苷酸与所述第二聚核苷酸处于相同载体上或处于两个不同载体上。
111.一种降低有需要的受试者中出血事件的频率或程度的方法,其包括施用有效量的如实施方案102至105中任一项所述的嵌合分子或如实施方案106至110中任一项所述的一种聚核苷酸或多种聚核苷酸。
附图说明
图1示出包含两个多肽链的嵌合分子(FVIII-XTEN/VWF异质二聚体)的例示图,第一个链包含经由凝血酶可裂解VWF连接子与Fc区融合的VWF蛋白(例如,VWF的D'结构域和D3结构域)并且第二个链包含经由FVIII连接子与第二Fc区融合的FVIII蛋白。所述FVIII蛋白在FVIII的多个结构域中包含一个或多个XTEN。
图2示出各种VWF构建体,每种构建体包含经由凝血酶可裂解VWF连接子与Fc区融合的D'结构域和D3结构域,对照(即,VWF-052)除外。VWF-031包含包括L-V-P-R(SEQ ID NO:25)的凝血酶裂解位点的具有48个氨基酸的连接子。VWF-034包含具有288个氨基酸的XTEN序列和包含L-V-P-R(SEQ ID NO:25)的凝血酶裂解位点的具有35个氨基酸的连接子。VWF-035包含包括L-V-P-R(SEQ ID NO:25)的凝血酶裂解位点的具有73个氨基酸的连接子。VWF-036包含包括L-V-P-R(SEQ ID NO:25)的凝血酶裂解位点的具有98个氨基酸的连接子。VWF-039包含包括L-V-P-R(SEQ ID NO:25)的凝血酶裂解位点和PAR1外位点相互作用基序的具有26个氨基酸的VWF连接子。VWF-051包含包括A-L-R-P-R-V-V(SEQ ID NO:26)的凝血酶裂解位点的具有54个氨基酸的连接子。VWF-052包含不具有任何凝血酶裂解位点的具有48个氨基酸的连接子(对照)。VWF-054包含包括来自FVIII的a1区域的具有40个氨基酸的VWF连接子。VWF-055包含包括来自FVIII的a2区域的具有34个氨基酸的VWF连接子。VWF-056包含包括来自FVIII的a3区域的具有46个氨基酸的VWF连接子。
图3小图A示出VWF-Fc融合构建体、即VWF-031、VWF-034、VWF-036、VWF-039、VWF-051和VWF-052的凝血酶介导性裂解速率(单位为共振单位/秒(RU/s))随捕捉密度(单位为RU)变化的函数关系。图3小图B示出VWF-Fc融合构建体、即VWF-031、VWF-034、VWF-036、VWF-051和VWF-052的凝血酶介导性裂解速率(单位为共振单位/秒(RU/s))随捕捉密度(单位为RU)变化的函数关系。在这些实验中,每种VWF-Fc融合构建体以不同密度捕捉并且随后暴露于固定浓度的人类α-凝血酶。图3小图A和图3小图B中每个曲线的斜率直接反映每种构建体的凝血酶裂解易感性。
图4小图A示出VWF-Fc融合构建体、即VWF-054、VWF-055和VWF-056的凝血酶介导性裂解速率(单位为共振单位/秒(RU/s))随捕捉密度(单位为RU)变化的函数关系。图4小图B示出VWF-Fc融合构建体、即VWF-031、VWF-039、VWF-054、VWF-055和VWF-056的凝血酶介导性裂解速率(单位为共振单位/秒(RU/s))随捕捉密度(单位为RU)变化的函数关系。在这些实验中,每种VWF-Fc融合构建体以不同密度捕捉并且随后暴露于固定浓度的人类α-凝血酶。图4小图A和图4小图B中每个曲线的斜率直接反映每种构建体的凝血酶裂解易感性。
图5示出测定各种VWF-Fc构建体VWF-031、VWF-034、VWF-036、VWF-039、VWF-051、VWF-052、VWF-054、VWF-055和VWF-056对于凝血酶介导性裂解的易感性的线性回归分析的结果。数值以s-1为单位表示并且反映图3和图4中所示的曲线的斜率。两种不同构建体的相对易感性是得自其相应斜率的商。斜率VWF-039/斜率VWF-031是71,指示VWF-Fc融合构建体VWF-039对于凝血酶介导性裂解的易感性是VWF-031的71倍。斜率VWF-055/斜率VWF-031是65,并且斜率VWF-051/斜率VWF-031是1.8。
图6示出通过全血ROTEM测定法所测量的各种嵌合分子在HemA患者中的凝血时间。FVII155/VWF-031包含两个多肽链,第一个链包含与Fc区融合的BDD FVIII并且第二个链包含经由最小凝血酶裂解位点(即,L-V-P-R(SEQ ID NO:25))与Fc区融合的VWF的D'结构域和D3结构域。FVII155/VWF-039包含两个多肽链,第一个链包含与Fc区融合的BDD FVIII并且第二个链包含经由包含L-V-P-R(SEQ ID NO:25)和PAR1外位点相互作用基序的VWF连接子与Fc区融合的VWF的D'结构域和D3结构域。FVII155/VWF-055包含两个多肽链,第一个链包含与Fc区融合的BDD FVIII并且第二个链包含经由包含来自FVIII的a2区域的VWF连接子与Fc区融合的VWF的D'结构域和D3结构域。
图7示出代表性FVIII-VWF异质二聚体以及FVIII169、FVIII286、VWF057、VWF059和VWF062构建体的图。例如,FVIII169构建体包含与Fc区融合的具有R1648A取代的B结构域缺失FVIII蛋白,其中在对应于成熟全长FVIII的氨基酸745处插入XTEN序列(例如,AE288)(A1-a1-A2-a2-288XTEN-a3-A3-C1-C2-Fc)。FVIII286构建体包含与Fc区融合的具有R1648取代的B结构域缺失FVIII蛋白,其中在对应于成熟全长FVIII的氨基酸745处插入XTEN序列(例如,AE288),在FVIII与Fc之间具有另一个a2区域(A1-a1-A2-a2-288XTEN-a3-A3-C1-C2-a2-Fc)。VWF057是包含经由VWF连接子连接至Fc区的VWF蛋白的D'D3结构域(在D'D3结构域中具有两个氨基酸取代,即,C336A和C379A)的VWF-Fc融合构建体,所述VWF连接子包含LVPR凝血酶位点(“LVPR”)和GS连接子(“GS”),其中XTEN序列(即144XTEN)插入D'D3结构域与VWF连接子之间(D'D3-144XTEN-GS+LVPR-Fc)。VWF059是包含经由作为VWF连接子的酸性区域2(a2)区域连接至Fc区的VWF蛋白的D'D3结构域(在D'D3结构域中具有两个氨基酸取代,即,C336A和C379A)的VWF-Fc融合构建体,其中XTEN序列插入D'D3结构域与VWF连接子之间。VWF062是包含连接至Fc区的VWF蛋白的D'D3结构域(在D'D3结构域中具有两个氨基酸取代,即,C336A和C379A)的VWF-Fc融合构建体,其中XTEN序列插入D'D3结构域与Fc区之间(D'D3-144XTEN-Fc)。
图8示出FVIII-XTEN-Fc/D'D3-连接子-Fc异质二聚体(即,FVIII169/VWF034、FVIII169/VWF059和FVIII169/VWF057)相比于B结构域缺失FVIII(“SQ BDD FVIII”或“BDD-rFVIII”)或媒介物对照在HemA小鼠尾部剪断模型中的急性功效。BDD-rFVIII以圆形显示,而FVIII169/VWF034以正方形显示,FVIII169/VWF059以三角形显示,FVIII169/VWF057以中空圆形显示,并且媒介物以倒三角形显示。VWF034是包含经由VWF连接子与Fc区融合的VWF的D'结构域和D3结构域的VWF-Fc融合构建体,所述VWF连接子包含LVPR,其中XTEN序列(即288XTEN)插入D'D3结构域与VWF连接子之间(D'D3-288XTEN-LVPR-Fc)。FVIII169、VWF059和VWF057的构建体详情示于本文他处。在每个治疗组中给与75IU/kg构建体之后的小鼠中值失血量(uL)由水平线指示。
具体实施方式
本发明针对包含XTEN序列和连接VWF蛋白或FVIII蛋白与异源部分(例如,半衰期延长部分)的凝血酶可裂解连接子的嵌合分子。本发明还提供包含两个多肽链的嵌合分子,第一个链包含与异源部分融合的VWF蛋白,并且第二个链包含FVIII蛋白和第二异源部分,其中所述嵌合分子在所述第一或第二多肽链中包含XTEN序列并且其中所述VWF蛋白或所述FVIII蛋白(或两者)经由VWF连接子或FVIII连接子(或两者)与异源部分融合。所述凝血酶可裂解连接子(VWF连接子或FVIII连接子)可在容易获得凝血酶的损伤部位由凝血酶有效裂解。示例性嵌合分子说明于本说明书和附图中。在一些实施方案中,本发明涉及具有例如图1至图7中所示的结构的嵌合分子。在其他实施方案中,本发明涉及编码本文公开的嵌合分子构建体的聚核苷酸。
为提供对本说明书和权利要求书的清晰理解,下文提供以下定义。
I.定义
应注意到,术语“一个”实体是指一个或多个所述实体;例如,“核苷酸序列”应理解为表示一个或多个核苷酸序列。因而,术语“一个”、“一个或多个”和“至少一个”在本文可互换使用。
术语“约”在本文用于是指大约、大致、左右或附近。当术语“约”与数值范围结合使用时,其通过扩展边界高于和低于所述数值来调节所述范围。一般来说,术语“约”在本文用于调节数值高于和低于所述值,变化是±10%(更高或更低)。
术语“聚核苷酸”或“核苷酸”旨在涵盖单数个核酸以及复数个核酸,并且是指分离的核酸分子或构建体,例如,信使RNA(mRNA)或质粒DNA(pDNA)。在某些实施方案中,聚核苷酸包含常规磷酸二酯键或非常规键(例如,酰胺键,诸如见于肽核酸(PNA)中)。术语“核酸”是指聚核苷酸中存在的任何一个或多个核酸区段,例如,DNA或RNA片段。“分离的”核酸或聚核苷酸意指已从其自然环境中移出的核酸分子、DNA或RNA。例如,对于本发明的目的,编码载体中所含的因子VIII多肽的重组聚核苷酸视为分离的。分离聚核苷酸的其他实例包括保持在异源宿主细胞中或在溶液中从其他聚核苷酸(部分地或基本上)纯化的重组聚核苷酸。分离RNA分子包括本发明的聚核苷酸的体内或体外RNA转录物。根据本发明的分离聚核苷酸或核酸还包括合成产生的此类分子。另外,聚核苷酸或核酸可包括调控元件,诸如启动子、增强子、核糖体结合位点或转录终止信号。
如本文所用,“编码区”或“编码序列”是聚核苷酸的一部分,其由可翻译成氨基酸的密码子组成。尽管“终止密码子”(TAG、TGA或TAA)通常并不翻译成氨基酸,但其可视为编码区的一部分,但任何侧接序列,例如启动子、核糖体结合位点、转录终止子、内含子等,并非编码区的一部分。编码区的边界通常在5'端由起始密码子决定,其编码所得多肽的氨基端,以及在3'端由翻译终止密码子决定,其编码所得多肽的羧基端。本发明的两个或更多个编码区可存在于单一聚核苷酸构建体中,例如,单一载体上,或单独聚核苷酸构建体中,例如,单独(不同)载体上。反之,单一载体可仅含有单一编码区,或者包含两个或更多个编码区,例如,单一载体可独立编码如下所述的嵌合分子的第一多肽链和第二多肽链。另外,本发明的载体、聚核苷酸或核酸可编码与编码本发明嵌合分子的核酸融合或未融合的异源编码区。异源编码区包括(不限于)专业元件或基序,诸如分泌信号肽或异源功能结构域。
由哺乳动物细胞分泌的某些蛋白质与分泌信号肽缔合,一旦生长蛋白链穿过粗面内质网的输出已起始,就从成熟蛋白质裂解出所述分泌信号肽。本领域普通技术人员认识到,信号肽一般与多肽的N端融合,并且从完整或“全长”多肽裂解以产生分泌或“成熟”形式的多肽。在某些实施方案中,使用原生信号肽,例如FVIII信号肽或VWF信号肽,或者保留引导可操作性缔合的多肽分泌的能力的所述序列的功能衍生物。可选地,可使用异源哺乳动物信号肽,例如,人类组织纤维蛋白溶酶原活化因子(TPA)或小鼠β-葡糖苷酸酶信号肽,或其功能衍生物。
术语“下游”是指位于参考核苷酸序列的3'的核苷酸序列。在某些实施方案中,下游核苷酸序列是指在转录起始点后的序列。例如,基因的翻译起始密码子位于转录起始位点下游。
术语“上游”是指位于参考核苷酸序列的5'的核苷酸序列。在某些实施方案中,上游核苷酸序列是指位于编码区的5'侧或转录起始点上的序列。例如,大部分启动子位于转录起始位点上游。
如本文所用,术语“调控区”是指位于编码区上游(5'非编码序列)、其内或下游(3'非编码序列)并且影响所缔合的编码区的转录、RNA加工、稳定性或翻译的核苷酸序列。调控区可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎-环结构。如果编码区旨在于真核细胞中表达,则多腺苷酸化信号和转录终止序列通常将位于编码序列的3'。
编码基因产物(例如,多肽)的聚核苷酸可包括启动子和/或与一个或多个编码区可操作性缔合的其他转录或翻译控制元件。在可操作缔合中,基因产物(例如,多肽)的编码区以使得基因产物的表达处于一个或多个调控区的影响或控制下的方式与所述一个或多个调控区缔合。例如,如果启动子功能的诱导导致编码由编码区编码的基因产物的mRNA的转录,并且如果启动子与编码区之间的连接的性质不干扰启动子引导基因产物表达的能力或不干扰待转录的DNA模板的能力,则所述编码区与所述启动子是“可操作性缔合”。除启动子之外,其他转录控制元件,例如增强子、操纵子、阻遏子和转录终止信号也可与编码区可操作性缔合以引导基因产物表达。
多种转录控制区是本领域技术人员已知的。其包括(但不限于)在脊椎动物细胞中起作用的转录控制区,诸如(但不限于)来自巨细胞病毒(立即早期启动子,结合内含子-A)、猿猴病毒40(早期启动子)和逆转录病毒(诸如Rous肉瘤病毒)的启动子和增强子区段。其他转录控制区包括源自脊椎动物基因的那些,诸如肌动蛋白、热休克蛋白、牛生长激素和兔β-球蛋白,以及能够控制真核细胞中的基因表达的其他序列。另外合适的转录控制区包括组织特异性启动子和增强子以及淋巴因子诱导性启动子(例如,可由干扰素或介白素诱导的启动子)。
类似地,多种翻译控制元件是本领域普通技术人员已知的。其包括(但不限于)核糖体结合位点、翻译起始和终止密码子,和源自小核糖核酸病毒的元件(尤其是内部核糖体进入位点或IRES,也称为CITE序列)。
如本文所用的术语“表达”是指聚核苷酸产生基因产物(例如,RNA或多肽)的过程。其包括(但不限于)将聚核苷酸转录成信使RNA(mRNA)、转移RNA(tRNA)、小发夹RNA(shRNA)、小干扰RNA(siRNA)或任何其他RNA产物,以及将mRNA翻译成多肽。表达产生“基因产物”。如本文所用,基因产物可为核酸,例如,由基因转录产生的信使RNA,或从转录物翻译的多肽。本文所述的基因产物还包括具有转录后修饰(例如,多腺苷酸化或剪接)的核酸,或具有翻译后修饰(例如,甲基化、糖基化、添加脂质、与其他蛋白质亚单位缔合,或蛋白水解裂解)的多肽。
“载体”是指用于将核酸克隆和/或转移至宿主细胞中的任何媒介物。载体可以是可连接至另一个核酸区段以产生所连接区段的复制的复制子。“复制子”是指在体内充当自主复制单元,即能够在其自身控制下复制的任何遗传元件(例如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括在体外、离体或体内用于将核酸引入细胞中的病毒和非病毒媒介物。大量载体是已知的并且用于本领域中,包括例如质粒、被修饰的真核病毒或被修饰的细菌病毒。可通过将适当聚核苷酸片段连接至具有互补性粘性末端的所选载体来将聚核苷酸插入合适载体中。
载体可被工程改造以编码可选择标记或报道体,其提供已并有所述载体的细胞的选择或鉴定。可选择标记或报道体的表达允许鉴定和/或选择并有和表达于载体上所含的其他编码区的宿主细胞。本领域中已知和使用的可选择标记基因的实例包括:提供对胺苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、毕拉草除草剂、磺酰胺等具抗性的基因;以及用作表型标记的基因,即,花青素调控基因、异戊烯基转移酶基因等。本领域中已知和使用的报道体的实例包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、-半乳糖苷酶(LacZ)、-葡糖苷酸酶(Gus)等。可选择标记还可视为报道体。
术语“质粒”是指通常带有并非细胞中心代谢部分的基因的染色体外元件,并且通常呈环状双链DNA分子形式。所述元件可为源自任何来源的单链或双链DNA或RNA的线性、环状或超螺旋状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已经接合或重组成独特构造,其能够将所选基因产物的启动子片段和DNA序列与适当的3'非翻译序列一起引入细胞中。
可使用的真核病毒载体包括(但不限于)腺病毒载体、逆转录病毒载体、腺相关病毒载体、痘病毒(例如牛痘病毒)载体、杆状病毒载体或疱疹病毒载体。非病毒载体包括质粒、脂质体、带电脂质(细胞转染剂)、DNA-蛋白质复合物和生物聚合物。
“克隆载体”是指“复制子”,其为连续复制的单位长度的核酸并且其包含复制起点,诸如质粒、噬菌体或粘粒,另一个核酸区段可与其连接以产生所连接区段的复制。某些克隆载体能够在一种细胞类型(例如细菌)中复制并且在另一种细胞类型(例如真核细胞)中表达。克隆载体通常包含可用于选择包含载体的细胞的一个或多个序列和/或用于插入目标核酸序列的一个或多个多克隆位点。
术语“表达载体”是指经设计以实现所插入核酸序列在插入宿主细胞中之后的表达的媒介物。所插入核酸序列与如上所述的调控区处于可操作性缔合。
通过本领域中众所周知的方法将载体引入宿主细胞中,例如,转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂质转染(溶酶体融合)、使用基因枪、或DNA载体转运体。
如本文所用的“培养”是指在允许细胞生长或分裂或维持细胞处于存活状态的体外条件下温育细胞。如本文所用的“培养细胞”是指在体外繁殖的细胞。
如本文所用,术语“多肽”旨在涵盖单数个“多肽”以及复数个“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指具有两个或更多个氨基酸的任何一个或多个链,而不是指特定长度的产物。因此,肽、二肽、三肽、低聚肽、“蛋白质”、“氨基酸链”或用于指代具有两个或更多个氨基酸的一个或多个链的任何其他术语包括在“多肽”的定义内,并且术语“多肽”可替代任何这些术语使用或与任何这些术语互换使用。术语“多肽”还旨在是指多肽的表达后修饰产物,所述修饰包括(但不限于)糖基化、乙酰化、磷酸化、酰胺化、通过已知保护/阻断基团衍生、蛋白水解裂解或通过非天然存在的氨基酸进行修饰。多肽可源自天然生物来源或产生重组技术,但未必从所设计的核酸序列翻译。其可以任何方式产生,包括通过化学合成。
“分离”多肽或其片段、变体或衍生物是指并非处于其天然环境中的多肽。不需要特定程度的纯化。例如,分离多肽可简单地从其自然或天然环境去除。对于本发明的目的,表达于宿主细胞中的重组产生多肽和蛋白质被视为分离的,因为原生或重组多肽已通过任何合适技术分离、分馏、或部分地或基本上纯化。
本发明中还包括多肽的片段或变体和其任何组合。术语“片段”或“变体”当指代本发明的多肽结合域或结合分子时,包括保留参考多肽的至少一些特性(例如,FcRn结合域或Fc变体的FcRn结合亲和力、FVIII变体的凝血活性,或VWF蛋白的FVIII结合活性)的任何多肽。除本文他处所讨论的特定抗体片段之外,多肽的片段包括蛋白水解片段,以及缺失片段,但不包括天然存在的全长多肽(或成熟多肽)。本发明的多肽结合域或结合分子的变体包括如上文所述的片段,以及由于氨基酸取代、缺失或插入而具有改变的氨基酸序列的多肽。变体可以是天然存在或非天然存在的。非天然存在的变体可使用本领域中已知的突变诱发技术产生。变异多肽可包含保守性或非保守性氨基酸取代、缺失或添加。
本文使用的术语“VWF片段”是指与FVIII相互作用并保留通常由全长VWF向FVIII提供的至少一种或多种特性的任何VWF片段,例如,预防FVIIIa过早活化、预防过早蛋白水解、预防可导致过早清除的与磷脂膜的缔合、预防与可结合裸FVIII但不结合VWF结合FVIII的FVIII清除受体的结合,和/或稳定FVIII重链和轻链相互作用。在一个特定实施方案中,如本文所用的“VWF片段”包含VWF蛋白的D'结构域和D3结构域,但不包括VWF蛋白的A1结构域、A2结构域、A3结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域和CK结构域。
如本文所用的术语“半衰期限制因子”或“FVIII半衰期限制因子”指示防止FVIII蛋白的半衰期相比于野生型FVIII(例如,
Figure BDA0003162841480000381
Figure BDA0003162841480000382
)是1.5倍或2倍的因子。例如,全长或成熟VWF可通过利用一种或多种VWF清除路径诱导FVIII与VWF复合物从系统清除而充当FVIII半衰期限制因子。在一个实例中,内源性VWF是FVIII半衰期限制因子。在另一个实例中,与FVIII蛋白非共价结合的全长重组VWF分子是FVIII半衰期限制因子。
如本文所用的术语“内源性VWF”指示血浆中天然存在的VWF分子。所述内源性VWF分子可以是多聚体,但也可以是单体或二聚体。血浆中的内源性VWF结合于FVIII并与FVIII形成非共价复合物。
“保守性氨基酸取代”是氨基酸残基被具有类似侧链的氨基酸残基置换的氨基酸取代。具有类似侧链的氨基酸残基家族已经在本领域中定义,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分枝侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果多肽中的氨基酸被来自相同侧链家族的另一个氨基酸置换,则将所述取代视为保守性。在另一个实施方案中,一串氨基酸可被侧链家族成员在结构上类似而次序和/或组成不同的串保守性置换。
如本领域中已知,两种多肽之间的“序列同一性”是通过比较一种多肽的氨基酸序列与第二多肽的序列来确定。当在本文中讨论时,可使用本领域中已知的方法和电脑程序/软件(诸如但不限于BESTFIT程序)(Wisconsin序列分析套件,Unix第8版,GeneticsComputer Group,University Research Park,575 Science Drive,Madison,WI 53711)来测定任何特定多肽是否与另一个多肽具有至少约50%、60%、70%、75%、80%、85%、90%、95%、99%或100%同一性。BESTFIT使用Smith和Waterman,Advances in AppliedMathematics 2:482-489(1981)的局部同源性算法来找出两个序列之间的最佳同源性区段。当使用BESTFIT或任何其他序列比对程序来测定特定序列是否与根据本发明的参考序列具有例如95%同一性时,参数当然被设定以使得同一性百分比是在参考多肽序列的全长上计算并且允许参考序列中氨基酸总数的至多5%的同源性空隙。
如本文所用,VWF序列或FVIII蛋白序列中的“对应于……的氨基酸”或“等效氨基酸”是通过比对鉴定以最大化第一VWF或FVIII序列与第二VWF或FVIII序列之间的同一性或类似性。用于鉴定第二VWF或FVIII序列中的等效氨基酸的编号是基于用于鉴定第一VWF或FVIII序列中的相应氨基酸的编号。
“融合”或“嵌合”分子包含第一氨基酸序列连接至其本质上并非天然连接的第二氨基酸序列。通常存在于独立蛋白质中的氨基酸序列可集合在融合多肽中,或者通常存在于相同蛋白质中的氨基酸序列可置于融合多肽中的新排列中,例如,本发明的因子VIII结构域与免疫球蛋白Fc结构域的融合。融合蛋白是例如通过化学合成或通过产生并翻译以所需关系编码肽区域的聚核苷酸而产生。嵌合蛋白还可包含通过共价、非肽键或非共价键与第一氨基酸序列缔合的第二氨基酸序列。
如本文所用,术语“半衰期”是指特定多肽在体内的生物半衰期。半衰期可由施用至受试者的量的一半从动物中的循环和/或其他组织中清除所需的时间表示。当给定多肽的清除曲线被理解为时间的函数时,所述曲线通常是具有快速α相和较长β相的双相。所述α相通常表示所施用多肽在血管内空间与血管外空间之间的平衡并且由多肽大小部分地决定。所述β相通常表示多肽在血管内空间中的分解代谢。在一些实施方案中,本发明的嵌合分子是单相的,并且因此不具有α相,而仅是单一β相。因此,在某些实施方案中,如本文所用的术语半衰期是指β相中多肽的半衰期。人类抗体在人类中的典型β相半衰期是21天。
如应用于聚核苷酸或多肽的术语“异源”是指聚核苷酸或多肽是源自与其相比较的实体相异的实体。因此,连接至VWF蛋白的异源多肽是指多肽链连接至VWF蛋白而非VWF蛋白的天然存在部分。例如,异源聚核苷酸或抗原可源自不同物种、不同细胞类型的个体、或相同或不同细胞类型的相异个体。
如本文所用的术语“连接(linked)”、“融合(fused)”或“连接(connected)”是指第一氨基酸序列或核苷酸序列接合于第二氨基酸序列或核苷酸序列(例如,分别经由肽键或磷酸二酯键)。术语“共价连接的”或“共价连接”是指连接在一起的两个部分之间的共价键,例如,二硫键、肽键或一个或多个氨基酸,例如,连接子。第一氨基酸或核苷酸序列可直接接合于第二氨基酸或核苷酸序列或者插入序列可接合第一序列与第二序列。术语“连接”、“融合”或“连接”不仅是指第一氨基酸序列与第二氨基酸序列在C端或N端融合,并且还包括将整个第一氨基酸序列(或第二氨基酸序列)插入第二氨基酸序列(或第一氨基酸序列)中的任何两个氨基酸中。在一个实施方案中,第一氨基酸序列可通过肽键或连接子接合于第二氨基酸序列。第一核苷酸序列可通过磷酸二酯键或连接子接合于第二核苷酸序列。连接子可以是肽或多肽(对于多肽链)或核苷酸或核苷酸链(对于核苷酸链)或任何化学部分(对于多肽和聚核苷酸链)。共价连接有时以(-)或连字符指示。
如本文所用,术语“与……缔合”是指第一氨基酸链与第二氨基酸链之间形成的共价或非共价键。在一个实施方案中,术语“与……缔合”是指共价、非肽键或非共价键。在一些实施方案中,这种缔合由冒号(即,(:))指示。在另一个实施方案中,其是指除肽键之外的共价键。在其他实施方案中,如本文所用的术语“共价缔合”是指两个部分之间由共价键(例如,二硫键、肽键或一个或多个氨基酸(例如,连接子))缔合。例如,氨基酸半胱氨酸包含可与第二半胱氨酸残基上的硫醇基形成二硫键或桥联的硫醇基。在大部分天然存在的IgG分子中,CH1和CL区域是通过二硫键缔合的并且两个重链是通过在对应于使用Kabat编号系统的239和242的位置(位置226或229,EU编号系统)处的两个二硫键缔合。共价键的实例包括(但不限于)肽键、金属键、氢键、二硫键、σ键、π键、δ键、糖苷键、不可知键、弯曲键、偶极键、π反向键、双键、三键、四重键、五重键、六重键、共轭、超共轭、芳香性、哈普托数(hapticity)或反键。非共价键的非限制性实例包括离子键(例如,阳离子π键或盐键)、金属键、氢键(例如,二氢键、二氢复合物、低屏障氢键或对称氢键)、范德华力、伦敦分散力、机械键、卤键、金键(aurophilicity)、插层(intercalation)、堆叠、熵力或化学极性。
如本文所用,术语“裂解位点”或“酶促裂解位点”是指由酶识别的位点。在一个实施方案中,多肽具有通过在凝血级联期间活化的酶裂解的酶促裂解位点,以使得这些位点的裂解发生在凝块形成部位。在另一个实施方案中,连接FVIII蛋白与第二异源部分的FVIII连接子可包含裂解位点。示例性的这类位点包括例如由凝血酶、因子XIa或因子Xa所识别的那些。示例性FXIa裂解位点包括例如TQSFNDFTR(SEQ ID NO:27)和SVSQTSKLTR(SEQID NO:28)。示例性凝血酶裂解位点包括例如DFLAEGGGVR(SEQ ID NO:29)、TTKIKPR(SEQ IDNO:30)、LVPRG(SEQ ID NO:31)和ALRPR(SEQ ID NO:26的氨基酸1至5)。其他酶促裂解位点是本领域中已知的。可由凝血酶裂解的裂解位点在本文称为“凝血酶裂解位点”。
如本文所用,术语“加工位点”或“细胞内加工位点”是指多肽中的一类酶促裂解位点,其是在多肽翻译后起作用的酶的靶标。在一个实施方案中,这些酶在从高尔基体(Golgi)内腔转运至转运高尔基体功能区期间起作用。细胞内加工酶在从细胞中分泌蛋白质之前裂解多肽。这些加工位点的实例包括例如由内肽酶的PACE/furin(其中PACE是配对碱性氨基酸裂解酶(Paired basic Amino acid Cleaving Enzyme)的缩写)家族所靶向者。这些酶定位于高尔基体膜并且在序列基序Arg-[任何残基]-(Lys或Arg)-Arg的羧基末端侧上裂解蛋白。如本文所用,酶的“furin”家族包括例如PCSK1(也称为PC1/Pc3)、PCSK2(也称为PC2)、PCSK3(也称为furin或PACE)、PCSK4(也称为PC4)、PCSK5(也称为PC5或PC6)、PCSK6(也称为PACE4)或PCSK7(也称为PC7/LPC、PC8或SPC7)。其他加工位点是本领域中已知的。本文提及的术语“可加工连接子”是指包含细胞内加工位点的连接子。
术语“furin”是指对应于EC No.3.4.21.75的酶。Furin是枯草杆菌蛋白酶样前蛋白转化酶,它还被称为配对碱性氨基酸裂解酶(PACE,Paired basic Amino acid CleavingEnzyme)。Furin缺失非活性前体蛋白的部分以将其转化成生物活性蛋白。在其细胞内转运期间,通过高尔基体中的furin酶从成熟VWF分子裂解出前肽。
在包括一个以上加工或裂解位点的构建体中,应了解,这些位点可能相同或不同。
如本文所用的止血障碍是指一种基因遗传性或后天性病状,其特征在于自发地或由创伤所致,由于形成纤维蛋白凝块的能力受损或不能形成纤维蛋白凝块而溢血的倾向。这些病症的实例包括血友病。三种主要形式是A型血友病(因子VIII缺乏)、B型血友病(因子IX缺乏或“圣诞病”)和C型血友病(因子XI缺乏、轻度出血倾向)。其他止血障碍包括例如血管性血友病(von Willebrand disease)、因子XI缺乏(PTA缺乏)、因子XII缺乏、纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII缺乏或结构异常、伯纳德-苏里尔症候群(Bernard-Soulier syndrome)(其是GPIb有缺陷或缺乏)。GPIb是VWF的受体,其可能具有缺陷并导致缺乏初级凝块形成(初级止血)和出血倾向增加,以及Glanzman和Naegeli的血小板功能不全(血小板无力症(Glanzmann thrombasthenia))。在肝衰竭(急性和慢性形式)中,肝脏产生的凝血因子不足;这可能增加出血风险。
本发明的嵌合分子可以预防性使用。如本文所用,术语“预防性治疗”是指在出血事件之前施用分子。在一个实施方案中,需要一般止血剂的受试者正在进行手术,或将要进行手术。本发明的嵌合蛋白可在手术之前或之后作为预防剂施用。本发明的嵌合蛋白可在手术期间或之后施用以控制急性出血事件。手术可包括(但不限于)肝移植、肝切除、牙科手术或干细胞移植。
本发明的嵌合分子还用于按需(也称为“偶发性”)治疗。术语“按需治疗”或“偶发性治疗”是指回应于出血事件的症状或在可造成出血的活动之前而施用嵌合分子。在一个方面中,按需(偶发性)治疗可给予开始出现(诸如在手术后)或预期出血(诸如在手术前)的受试者。在另一个方面,可在增加出血风险的活动(诸如接触性运动)之前给予按需治疗。
如本文所用,术语“急性出血”是指不考虑潜在原因的出血事件。例如,受试者可具有创伤、尿毒症、遗传性出血性病症(例如,因子VII缺乏)、血小板病症或由于产生凝血因子抗体而造成的抗性。
如本文所用的治疗是指例如疾病或病状的严重程度降低;疾病过程的持续时间缩短;与疾病或病状相关的一种或多种症状的改善;向具有疾病或病状的受试者提供有益作用,而未必治愈所述疾病或病状,或预防与疾病或病状相关的一种或多种症状。在一个实施方案中,术语“治疗”是指通过施用本发明的嵌合分子在受试者中维持FVIII谷底含量为至少约1IU/dL、2IU/dL、3IU/dL、4IU/dL、5IU/dL、6IU/dL、7IU/dL、8IU/dL、9IU/dL、10IU/dL、11IU/dL、12IU/dL、13IU/dL、14IU/dL、15IU/dL、16IU/dL、17IU/dL、18IU/dL、19IU/dL或20IU/dL。在另一个实施方案中,治疗是指维持FVIII谷底含量介于约1至约20IU/dL、约2至约20IU/dL、约3至约20IU/dL、约4至约20IU/dL、约5至约20IU/dL、约6至约20IU/dL、约7至约20IU/dL、约8至约20IU/dL、约9至约20IU/dL、或约10至约20IU/dL。疾病或病状的治疗还可包括将受试者中FVIII活性维持在相当于非血友病受试者中至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%的FVIII活性的程度。治疗所需的最低谷底含量可通过一种或多种已知方法测量并且可针对每个人进行调节(增加或减少)。
II.嵌合分子
本发明的嵌合分子经过设计以改进VWF蛋白或FVIII蛋白从所述VWF蛋白或FVIII蛋白所融合的另一个部分的释放。本发明提供可在损伤部位快速和有效裂解的凝血酶可裂解连接子。在本发明的一个方面中,嵌合分子可包含温韦伯氏因子(VWF)蛋白、异源部分(H1)、XTEN序列和连接所述VWF蛋白与所述异源部分的VWF连接子,其中所述VWF连接子包含选自以下的多肽:(i)来自因子VIII(FVIII)的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合,并且其中所述XTEN序列连接至所述VWF蛋白、所述异源部分(H1)、所述VWF连接子或其任何组合。在本发明的另一方面中,嵌合分子可包括包含VWF蛋白、异源部分(H1)和连接所述VWF蛋白与所述异源部分(H1)的VWF连接子的第一多肽链和包含FVIII蛋白和XTEN序列的第二多肽链,其中所述第一多肽链中的所述VWF连接子包含:(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合,并且其中所述第一多肽链与所述第二多肽链彼此缔合。
在本发明的其他方面中,嵌合分子包含包括经由FVIII连接子与异源部分融合的FVIII蛋白的多肽链,其中所述FVIII连接子包含:(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合。
II.A.具有VWF、XTEN、VWF连接子的嵌合分子
本发明提供包含经由VWF连接子与XTEN序列融合的VWF蛋白的嵌合分子,其中所述VWF连接子包含选自以下的多肽:(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合。
在一个实施方案中,嵌合分子包含VWF蛋白、异源部分(H1)、XTEN序列,和连接所述VWF蛋白与所述异源部分的VWF连接子,其中所述XTEN序列位于所述VWF蛋白与所述VWF连接子之间并且其中所述VWF连接子包含选自以下的多肽:(i)来自因子VIII(FVIII)的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合。在另一个实施方案中,嵌合分子包含VWF蛋白、异源部分(H1)、XTEN序列,和连接所述VWF蛋白与所述异源部分的VWF连接子,其中所述XTEN序列位于所述VWF连接子与所述异源部分之间并且其中所述VWF连接子包含选自以下的多肽:(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合。
在其他实施方案中,嵌合分子还包含包括FVIII蛋白的多肽链,其中包含VWF蛋白的第一个链和包含FVIII蛋白的第二个链彼此缔合。在一个实例中,缔合可以是共价(例如,二硫键)缔合。在其他实施方案中,包含FVIII蛋白的多肽链还包含另外的XTEN序列。所述另外的XTEN序列可连接至FVIII蛋白的N端或C端或者插入彼此相邻的两个FVIII氨基酸之间。在其他实施方案中,包含FVIII蛋白的链还包含第二异源部分(H2)。在一些实施方案中,FVIII蛋白经由FVIII连接子与第二异源部分融合。在某些实施方案中,FVIII连接子与连接VWF蛋白与异源部分的VWF连接子相同。在其他实施方案中,FVIII连接子与连接VWF蛋白与异源部分的VWF连接子不同。
在某些实施方案中,嵌合分子包含选自以下的式:(i)V-L1-X1-H1:H2-L2-X2-C;(ii)V-X1-L1-H1:H2-L2-X2-C;(iii)V-L1-X1-H1:H2-X2-L2-C;(iv)V-X1-L1-H1:H2-X2-L2-C;(v)V-L1-X1-H1:H2-L2-C(X2);(vi)V-X1-L1-H1:H2-L2-C(X2);(vii)C-X2-L2-H2:H1-X1-L1-V;(viii)C-X2-L2-H2:H1-L1-X1-V;(ix)C-L2-X2-H2:H1-L1-X1-V;(x)C-L2-X2-H2:H1-L1-X1-V;(xi)C(X2)-L2-H2:H1-X1-L1-V;或(xii)C(X2)-L2-H2:H1-L1-X1-V;其中V是VWF蛋白;L1是VWF连接子;L2是任选的FVIII连接子;H1是第一异源部分;H2是第二异源部分;X1是XTEN序列;X2是任选的XTEN序列;C是FVIII蛋白;C(X2)是与XTEN序列融合的FVIII蛋白,其中所述XTEN序列插入彼此相邻的两个FVIII氨基酸之间;(-)是肽键或一个或多个氨基酸;并且(:)是H1与H2之间的共价键。
在一些实施方案中,嵌合分子中的FVIII蛋白包含第三异源部分(H3),其可以是XTEN序列。在其他实施方案中,嵌合分子中的FVIII蛋白包含第四异源部分(H4),其可以是XTEN序列。在其他实施方案中,嵌合分子中的FVIII蛋白包含第五异源部分(H5),其可以是XTEN序列。在其他实施方案中,嵌合分子中的FVIII蛋白包含第六异源部分(H6),其可以是XTEN序列。在某些实施方案中,第三异源部分(H3)、第四异源部分(H4)、第五异源部分(H5)和第六异源部分(H6)中的一个或多个能够延长嵌合分子的半衰期。在一些实施方案中,第三异源部分(H3)、第四异源部分(H4)、第五异源部分(H5)和第六异源部分(H6)连接至FVIII的C端或N端或者插入FVIII蛋白的两个氨基酸之间。
II.B.具有FVIII、XTEN、VWF蛋白、VWF连接子的嵌合分子
本发明还提供一种嵌合分子,其包括包含VWF蛋白、异源部分(H1)和连接所述VWF蛋白与所述异源部分(H1)的VWF连接子的第一多肽链和包含FVIII蛋白和XTEN序列的第二多肽链,其中所述第一多肽链中的所述VWF连接子包含:(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合,并且其中所述第一多肽链与所述第二多肽链彼此缔合。在一个实施方案中,其中所述XTEN序列连接至FVIII蛋白的N端或C端或者插入彼此相邻的两个FVIII氨基酸之间。在另一个实施方案中,所述嵌合分子还包含另外的XTEN序列,其连接至所述VWF蛋白、所述异源部分、所述VWF连接子或其任何组合。在其他实施方案中,所述嵌合分子还包含第二异源部分(H2)。在其他实施方案中,所述嵌合分子的所述第二异源部分连接至FVIII蛋白、XTEN序列,或两者。在其他实施方案中,所述第二异源部分经由FVIII连接子连接至FVIII蛋白或XTEN序列。在其他实施方案中,FVIII连接子与VWF连接子相同。在一些实施方案中,FVIII连接子与VWF连接子不同。
在某些实施方案中,嵌合分子包含选自以下的式:(i)V-L1-X1-H1:H2-L2-X2-C;(ii)V-X1-L1-H1:H2-L2-X2-C;(iii)V-L1-X1-H1:H2-X2-L2-C;(iv)V-X1-L1-H1:H2-X2-L2-C;(v)V-L1-X1-H1:H2-L2-C(X2);(vi)V-X1-L1-H1:H2-L2-C(X2);(vii)C-X2-L2-H2:H1-X1-L1-V;(viii)C-X2-L2-H2:H1-L1-X1-V;(ix)C-L2-X2-H2:H1-L1-X1-V;(x)C-L2-X2-H2:H1-L1-X1-V;(xi)C(X2)-L2-H2:H1-X1-L1-V;或(xii)C(X2)-L2-H2:H1-L1-X1-V;其中V是VWF蛋白;L1是VWF连接子;L2是任选的FVIII连接子;H1是第一异源部分;H2是第二异源部分;X1是任选的XTEN序列;X2是XTEN序列;C是FVIII蛋白;C(X2)是与XTEN序列融合的FVIII蛋白,其中所述XTEN序列插入彼此相邻的两个FVIII氨基酸之间;(-)是肽键或一个或多个氨基酸;并且(:)是H1与H2之间的共价键。在一个实施方案中,VWF连接子与FVIII连接子可能相同。在另一个实施方案中,VWF连接子与FVIII连接子不同。
在某些实施方案中,嵌合分子的FVIII蛋白包含第三异源部分(H3),其可以是XTEN序列。在其他实施方案中,嵌合分子的FVIII蛋白包含第四异源部分(H4),其是XTEN序列。在其他实施方案中,嵌合分子的FVIII蛋白包含第五异源部分(H5),其可以是XTEN序列。在其他实施方案中,FVIII蛋白包含第六异源部分(H6),其可以是XTEN序列。在某些实施方案中,第三异源部分(H3)、第四异源部分(H4)、第五异源部分(H5)和第六异源部分(H6)中的一个或多个能够延长嵌合分子的半衰期。在一些实施方案中,第三异源部分(H3)、第四异源部分(H4)、第五异源部分(H5)和/或第六异源部分(H6)连接至FVIII的C端或N端或者插入FVIII蛋白的两个氨基酸之间。
II.C.具有FVIII、XTEN和FVIII连接子的嵌合分子
本发明的嵌合分子可包含FVIII蛋白、XTEN序列、和通过FVIII连接子融合的异源部分,所述FVIII连接子包含(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合。在某些实施方案中,嵌合分子包含两个多肽链,第一个链包含经由FVIII连接子与第一Fc区融合的FVIII蛋白,并且第二个链包含与Fc区融合的VWF蛋白(例如,VWF的D'结构域和D3结构域),其中所述第一多肽链中的所述FVIII连接子包含:(i)来自FVIII的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合,并且其中所述第一多肽链与所述第二多肽链彼此缔合且其中XTEN序列连接至第一多肽(例如,FVIII蛋白的N端或C端、连接子或第一Fc区或FVIII蛋白内部)、第二多肽(例如,VWF蛋白的N端或C端或Fc区或FVIII蛋白内部),或两者。在一个特定实施方案中,第一多肽链中的连接子包含来自FVIII的a2区域。
在某些实施方案中,嵌合分子包含选自以下的式:(i)V-L2-X2-H2:H1-L1-X1-C;(ii)V-X2-L2-H2:H1-L1-X1-C;(iii)V-L2-X2-H2:H1-X1-L1-C;(iv)V-X2-L2-H2:H1-X1-L1-C;(v)V-L2-X2-H2:H1-L1-C(X1);(vi)V-X2-L2-H2:H1-L1-C(X1);(vii)C-X1-L1-H1:H2-X2-L2-V;(viii)C-X1-L1-H1:H2-L2-X2-V;(ix)C-L1-X1-H1:H2-L2-X2-V;(x)C-L1-X1-H1:H2-L2-X2-V;(xi)C(X1)-L1-H1:H2-X2-L2-V;或(xii)C(X1)-L1-H1:H2-L2-X2-V,其中V是VWF蛋白;L1是FVIII连接子;L2是任选的VWF连接子;H1是第一异源部分;H2是第二异源部分;X1是任选的XTEN序列;X2是任选的XTEN序列;C是FVIII蛋白;C(X1)是与XTEN序列融合的FVIII蛋白,其中所述XTEN序列插入彼此相邻的两个FVIII氨基酸之间;(-)是肽键或一个或多个氨基酸;并且(:)是H1与H2之间的共价键,并且其中至少一个XTEN序列存在于嵌合分子中。在一个实施方案中,VWF连接子与FVIII连接子相同。在另一个实施方案中,VWF连接子与FVIII连接子不同。
II.D.嵌合分子的组分
II.C.1.VWF连接子或FVIII连接子
可用于本发明的嵌合分子的VWF连接子或FVIII连接子是融合VWF蛋白与异源部分或者融合FVIII蛋白与异源部分的凝血酶可裂解连接子。在一个实施方案中,VWF连接子或FVIII连接子包含FVIII的a1区域。在另一个实施方案中,VWF连接子或FVIII连接子包含FVIII的a2区域。在其他实施方案中,VWF连接子或FVIII连接子包含FVIII的a3区域。在其他实施方案中,VWF连接子或FVIII连接子包含包括X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸。
在一个实施方案中,VWF连接子或FVIII连接子包含a1区域,其包含与对应于全长成熟FVIII的Met337至Arg372具有至少约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或100%同一性的氨基酸序列,其中所述a1区域能够被凝血酶裂解。在另一个实施方案中,VWF连接子或FVIII连接子包含a1区域,其包含与对应于全长成熟FVIII的氨基酸337至374具有至少约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或100%同一性的氨基酸序列,其中所述a1区域能够被凝血酶裂解。在其他实施方案中,VWF连接子或FVIII连接子还包含其他氨基酸,例如,一个、两个、三个、四个、五个、十个或更多个。在一个特定实施方案中,VWF连接子或FVIII连接子包含ISMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSV(SEQ ID NO:5)。
在一些实施方案中,VWF连接子或FVIII连接子包含a2区域,其包含与对应于全长成熟FVIII的Glu720至Arg740具有至少约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或100%同一性的氨基酸序列,其中所述a2区域能够被凝血酶裂解。在其他实施方案中,VWF连接子或FVIII连接子包含a2区域,其包含与对应于全长成熟FVIII的氨基酸712至743具有至少约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或100%同一性的氨基酸序列。在其他实施方案中,VWF连接子或FVIII连接子还包含其他氨基酸,例如,一个、两个、三个、四个、五个、十个或更多个。在一个特定实施方案中,VWF连接子包含ISDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFS(SEQ ID NO:4)。
在某些实施方案中,VWF连接子或FVIII连接子包含a3区域,其包含与对应于全长成熟FVIII的Glu1649至Arg1689具有至少约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或100%同一性的氨基酸序列,其中所述a3区域能够被凝血酶裂解。在一些实施方案中,VWF连接子或FVIII连接子包含a3区域,其包含与对应于全长成熟FVIII的氨基酸1649至1692具有至少约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或100%同一性的氨基酸序列,其中所述a3区域能够被凝血酶裂解。在其他实施方案中,VWF连接子或FVIII连接子还包含其他氨基酸,例如,一个、两个、三个、四个、五个、十个或更多个。在一个特定实施方案中,VWF连接子或FVIII连接子包含ISEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQ(SEQ ID NO:6)。
在其他实施方案中,VWF连接子或FVIII连接子包含包括X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序并且其中所述PAR1外位点相互作用基序包含S-F-L-L-R-N(SEQ ID NO:7)。在一些实施方案中,PAR1外位点相互作用基序还包含选自以下的氨基酸序列:P、P-N、P-N-D、P-N-D-K(SEQ ID NO:8)、P-N-D-K-Y(SEQ ID NO:9)、P-N-D-K-Y-E(SEQ ID NO:10)、P-N-D-K-Y-E-P(SEQ ID NO:11)、P-N-D-K-Y-E-P-F(SEQ ID NO:12)、P-N-D-K-Y-E-P-F-W(SEQ ID NO:13)、P-N-D-K-Y-E-P-F-W-E(SEQ ID NO:14)、P-N-D-K-Y-E-P-F-W-E-D(SEQ ID NO:20)、P-N-D-K-Y-E-P-F-W-E-D-E(SEQ ID NO:21)、P-N-D-K-Y-E-P-F-W-E-D-E-E(SEQ ID NO:22)、P-N-D-K-Y-E-P-F-W-E-D-E-E-S(SEQ ID NO:23)或其任何组合。在其他实施方案中,包含X-V-P-R的凝血酶裂解位点的脂族氨基酸选自甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸。在一个特定实施方案中,凝血酶裂解位点包含L-V-P-R。在一些实施方案中,如果用凝血酶裂解位点(L-V-P-R)分别替代VWF连接子或FVIII连接子(即,不存在PAR1外位点相互作用基序),则凝血酶裂解VWF连接子或FVIII连接子的速率比凝血酶将裂解凝血酶裂解位点(例如,L-V-P-R)的速率快。在一些实施方案中,如果用凝血酶裂解位点(例如,L-V-P-R)替代VWF连接子或FVIII连接子,则凝血酶裂解VWF连接子或FVIII连接子的速率是凝血酶将裂解凝血酶裂解位点(例如,L-V-P-R)的速率的至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。
在一些实施方案中,包含(i)a1区域、(ii)a2区域、(iii)a3区域或(iv)凝血酶裂解位点X-V-P-R和PAR1外位点相互作用基序的VWF连接子或FVIII连接子还包含一个或多个具有至少约2、5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸的长度的氨基酸。在一个实施方案中,所述一个或多个氨基酸包含gly肽。在另一个实施方案中,所述一个或多个氨基酸包含GlyGly。在其他实施方案中,所述一个或多个氨基酸包含IleSer。在其他实施方案中,所述一个或多个氨基酸包含gly/ser肽。在其他实施方案中,所述一个或多个氨基酸包含具有(Gly4Ser)n或S(Gly4Ser)n的式的gly/ser肽,其中n是选自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80或100的正整数。在一些实施方案中,所述一个或多个氨基酸包含(Gly4Ser)3(SEQ ID NO:89)或(Gly4Ser)4(SEQ ID NO:90)。
II.C.2.VWF蛋白
VWF(也称为F8VWF)是存在于血浆中并且在内皮(在Weibel-Palade小体中)、巨核细胞(血小板的α-颗粒)和内皮下层结缔组织中组成性产生的大型多聚糖蛋白。基本VWF单体是具有2813个氨基酸的蛋白质。每个单体包含多个具有特定功能的特定结构域,D'/D3结构域(其结合于因子VIII)、A1结构域(其结合于血小板GPIb-受体、肝素和/或可能地胶原蛋白)、A3结构域(其结合于胶原蛋白)、C1结构域(其中RGD结构域当其被活化时结合于血小板整合素αIIbβ3),和在蛋白质的C端的“半胱氨酸结”结构域(所述VWF与血小板衍生生长因子(PDGF)、转化生长因子-β(TGFβ)和β-人类绒毛膜促性腺激素(βHCG)共用))。
如本文所用的术语“VWF蛋白”包括(但不限于)包含D'结构域和D3结构域的全长VWF蛋白或功能性VWF片段,其能够抑制内源性VWF与FVIII的结合。在一个实施方案中,VWF蛋白结合于FVIII。在另一个实施方案中,VWF蛋白阻断FVIII上的VWF结合位点,从而抑制FVIII与内源性VWF的相互作用。在其他实施方案中,VWF蛋白未通过VWF清除路径清除。VWF蛋白包括保留VWF的这些活性的衍生物、变体、突变体或类似物。
人类VWF的2813单体氨基酸序列在Genbank中报道为保藏编号_NP_000543.2__。编码人类VWF的核苷酸序列在Genbank中报道为保藏编号__NM_000552.3_。人类VWF的核苷酸序列指定为SEQ ID NO:1。SEQ ID NO:2是由SEQ ID NO:1编码的氨基酸序列。VWF的每个结构域列于表1中。
表1.VWF序列
Figure BDA0003162841480000541
Figure BDA0003162841480000551
Figure BDA0003162841480000561
Figure BDA0003162841480000571
Figure BDA0003162841480000581
Figure BDA0003162841480000591
Figure BDA0003162841480000601
Figure BDA0003162841480000611
Figure BDA0003162841480000621
如本文所用的VWF蛋白可包含VWF的D'结构域和D3结构域,其中所述VWF蛋白结合于FVIII并抑制内源性VWF(全长VWF)与FVIII的结合。包含D'结构域和D3结构域的VWF蛋白还可包含选自A1结构域、A2结构域、A3结构域、D1结构域、D2结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、其一个或多个片段或其任何组合的VWF结构域。在一个实施方案中,VWF蛋白包含以下、基本上由以下组成、或由以下组成:(1)VWF的D'和D3结构域或其片段;(2)VWF的D1、D'和D3结构域或其片段;(3)VWF的D2、D'和D3结构域或其片段;(4)VWF的D1、D2、D'和D3结构域或其片段;或(5)VWF的D1、D2、D'、D3或A1结构域或其片段。本文所述的VWF蛋白不包含VWF清除受体结合位点。本发明的VWF蛋白可包含连接至或融合至VWF蛋白的任何其他序列。例如,本文所述的VWF蛋白还可包含信号肽。
在一个实施方案中,VWF蛋白结合于FVIII蛋白或与FVIII蛋白缔合。通过结合于FVIII蛋白或与FVIII蛋白缔合,本发明的VWF蛋白可保护FVIII免于蛋白酶裂解和FVIII活化,稳定FVIII的重链和轻链,并且防止FVIII被清道夫受体清除。在另一个实施方案中,VWF蛋白结合于FVIII蛋白或与FVIII蛋白缔合并阻断或防止FVIII蛋白结合于磷脂和活化蛋白C。通过防止或抑制FVIII蛋白与内源性全长VWF结合,本发明的VWF蛋白可减少FVIII被内源性VWF清除受体清除并且因此延长FVIII蛋白的半衰期。FVIII蛋白的半衰期延长因此是由于FVIII蛋白与缺乏VWF清除受体结合位点的VWF蛋白的缔合,并且从而屏蔽和/或保护FVIII蛋白远离包含VWF清除受体结合位点的内源性VWF。结合于VWF蛋白或被VWF蛋白保护的FVIII蛋白还可允许FVIII蛋白的再循环。通过消除全长VWF分子中的VWF清除路径受体结合位点,本发明的FVIII/VWF异质二聚体被屏蔽远离VWF清除路径,从而进一步延长FVIII半衰期。
在一个实施方案中,本发明的VWF蛋白包含VWF的D'结构域和D3结构域,其中所述D'结构域与SEQ ID NO:2的氨基酸764至866具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性,其中所述VWF蛋白防止内源性VWF结合于FVIII。在另一个实施方案中,VWF蛋白包含VWF的D'结构域和D3结构域,其中所述D3结构域与SEQ IDNO:2的氨基酸867至1240具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性,其中所述VWF蛋白防止内源性VWF结合于FVIII。在一些实施方案中,本文所述的VWF蛋白包含以下、基本上由以下组成或由以下组成:VWF的D'结构域和D3结构域,其与SEQ ID NO:2的氨基酸764至1240具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性,其中所述VWF蛋白防止内源性VWF结合于FVIII。在其他实施方案中,VWF蛋白包含以下、基本上由以下组成或由以下组成:D1、D2、D'和D3结构域,其与SEQ ID NO:2的氨基酸23至1240具有至少60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性,其中所述VWF蛋白防止内源性VWF结合于FVIII。在其他实施方案中,VWF蛋白还包含可与其操作性连接的信号肽。
在一些实施方案中,本发明的VWF蛋白基本上由以下组成或由以下组成:(1)D'D3结构域、D1D'D3结构域、D2D'D3结构域或D1D2D'D3结构域;和(2)至多约10个氨基酸(例如,从SEQ ID NO:2的氨基酸764至1240到SEQ ID NO:2的氨基酸764至1250的任何序列)、至多约15个氨基酸(例如,从SEQ ID NO:2的氨基酸764至1240到SEQ ID NO:2的氨基酸764至1255的任何序列)、至多约20个氨基酸(例如,从SEQ ID NO:2的氨基酸764至1240到SEQ IDNO:2的氨基酸764至1260的任何序列)、至多约25个氨基酸(例如,从SEQ ID NO:2的氨基酸764至1240到SEQ ID NO:2的氨基酸764至1265的任何序列)、或至多约30个氨基酸(例如,从SEQ ID NO:2的氨基酸764至1240到SEQ ID NO:2的氨基酸764至1260的任何序列)的一个另外的VWF序列。在一个特定实施方案中,包含D'结构域和D3结构域或基本上由D'结构域和D3结构域组成的VWF蛋白既不是SEQ ID NO:2的氨基酸764至1274,也不是全长成熟VWF。在一些实施方案中,D1D2结构域与D'D3结构域呈反式表达。在一些实施方案中,D1D2结构域与D'D3结构域呈顺式表达。
在其他实施方案中,包含连接至D1D2结构域的D'D3结构域的VWF蛋白还包含细胞内加工位点,例如,(PACE(furin)或PC5的加工位点),其允许在表达时D1D2结构域从D'D3结构域裂解。细胞内加工位点的非限制性实例公开于本文他处。
在其他实施方案中,VWF蛋白包含D'结构域和D3结构域,但不包含选自以下的氨基酸序列:(1)SEQ ID NO:2的氨基酸1241至2813、(2)SEQ ID NO:2的氨基酸1270至氨基酸2813、(3)SEQ ID NO:2的氨基酸1271至氨基酸2813、(4)SEQ ID NO:2的氨基酸1272至氨基酸2813、(5)SEQ ID NO:2的氨基酸1273至氨基酸2813、(6)SEQ ID NO:2的氨基酸1274至氨基酸2813,或其任何组合。
在其他实施方案中,本发明的VWF蛋白包含以下、基本上由以下组成或由以下组成:对应于D'结构域、D3结构域和A1结构域的氨基酸序列,其中所述氨基酸序列与SEQ IDNO:2的氨基酸764至1479具有至少60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性,其中所述VWF蛋白防止内源性VWF结合于FVIII。在一个特定实施方案中,VWF蛋白不是SEQ ID NO:2的氨基酸764至1274。
在一些实施方案中,本发明的VWF蛋白包含D'结构域和D3结构域,但不包含选自以下的至少一个VWF结构域:(1)A1结构域、(2)A2结构域、(3)A3结构域、(4)D4结构域、(5)B1结构域、(6)B2结构域、(7)B3结构域、(8)C1结构域、(9)C2结构域、(10)CK结构域、(11)CK结构域和C2结构域、(12)CK结构域、C2结构域和C1结构域、(13)CK结构域、C2结构域、C1结构域、B3结构域、(14)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、(15)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域和B1结构域、(16)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域和D4结构域、(17)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域、D4结构域和A3结构域、(18)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域、D4结构域、A3结构域和A2结构域、(19)CK结构域、C2结构域、C1结构域、B3结构域、B2结构域、B1结构域、D4结构域、A3结构域、A2结构域和A1结构域,或(20)其任何组合。
在其他实施方案中,VWF蛋白包含D'D3结构域和一个或多个结构域或模块。这些结构域或模块的实例包括(但不限于)Zhour等,Blood,在线公布于2012年4月6日:DOI10.1182/blood-2012-01-405134中所公开的结构域和模块。例如,VWF蛋白可包含D'D3结构域和选自以下的一个或多个结构域或模块:A1结构域、A2结构域、A3结构域、D4N模块、VWD4模块、C8-4模块、TIL-4模块、C1模块、C2模块、C3模块、C4模块、C5模块、C5模块、C6模块或其任何组合。
在某些实施方案中,本发明的VWF蛋白形成多聚体,例如,二聚体、三聚体、四聚体、五聚体、六聚体、七聚体或更高阶多聚体。在其他实施方案中,VWF蛋白是仅具有一个VWF蛋白的单体。在一些实施方案中,本发明的VWF蛋白可具有一个或多个氨基酸取代、缺失、添加或修饰。在一个实施方案中,VWF蛋白可包括氨基酸取代、缺失、添加或修饰以使得VWF蛋白不能形成二硫键或形成二聚体或多聚体。在另一个实施方案中,氨基酸取代在D'结构域和D3结构域内。在一个特定实施方案中,本发明的VWF蛋白在对应于SEQ ID NO:2的残基1099、残基1142、或残基1099与1142的残基处包含至少一个氨基酸取代。所述至少一个氨基酸取代可以是不天然存在于野生型VWF中的任何氨基酸。例如,氨基酸取代可以是除半胱氨酸之外的任何氨基酸,例如,异亮氨酸、丙氨酸、亮氨酸、天冬酰胺、赖氨酸、天冬氨酸、甲硫氨酸、苯丙氨酸、谷氨酸、苏氨酸、谷氨酰胺、色氨酸、甘氨酸、缬氨酸、脯氨酸、丝氨酸、酪氨酸、精氨酸或组氨酸。在另一个实例中,氨基酸取代具有防止或抑制VWF蛋白形成多聚体的一个或多个氨基酸。
在一些实施方案中,VWF蛋白包含在对应于VWF的D'D3结构域的残基336(SEQ IDNO:2的残基1099)处从半胱氨酸到丙氨酸的氨基酸取代,和在对应于VWF的D'D3结构域的残基379(SEQ ID NO:2的残基1142)处从半胱氨酸到丙氨酸的氨基酸取代,或两者。
在某些实施方案中,本文可使用的VWF蛋白可被进一步修饰以改进其与FVIII的相互作用,例如,改进与FVIII的结合亲和力。作为非限制性实例,VWF蛋白包含在对应于SEQID NO:2的氨基酸764的残基处的丝氨酸残基和在对应于SEQ ID NO:2的氨基酸773的残基处的赖氨酸残基。残基764和/或773可促进VWF蛋白与FVIII的结合亲和力。在其他实施方案中,可用于本发明的VWF蛋白可具有其他修饰,例如,蛋白质可被聚乙二醇化、糖基化、羟乙基化或聚唾液酸化。
II.C.3.异源部分
可经由VWF连接子与VWF蛋白融合或经由FVIII连接子与FVIII蛋白融合的异源部分可以是异源多肽或异源非多肽部分。在某些实施方案中,异源部分是本领域中已知的半衰期延长分子并且包含多肽、非多肽部分或两者的组合。异源多肽部分可包含FVIII蛋白、免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白或其片段、PAS序列、HAP序列、其衍生物或变体、人类绒毛膜促性腺激素的β亚单位的C端肽(CTP)或其任何组合。在一些实施方案中,非多肽结合部分包含聚乙二醇(PEG)、聚唾液酸、羟乙基淀粉(HES)、其衍生物或其任何组合。在某些实施方案中,可存在一个、两个、三个或更多个异源部分,其可能各自是相同或不同的分子。
II.C.3.a免疫球蛋白恒定区或其部分
免疫球蛋白恒定区由称为CH(恒定重)结构域(CH1、CH2等)的结构域组成。视同种型(即IgG、IgM、IgA、IgD或IgE)而定,恒定区可由三个或四个CH结构域组成。一些同种型(例如IgG)恒定区还包含铰链区。参见Janeway等,2001,Immunobiology,Garland Publishing,N.Y.,N.Y.。
用于产生本发明的嵌合蛋白的免疫球蛋白恒定区或其部分可获自多种不同来源。在一些实施方案中,免疫球蛋白恒定区或其部分是源自人类免疫球蛋白。然而,应了解,免疫球蛋白恒定区或其部分可源自另一个哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿动物(例如,小鼠、大鼠、兔、天竺鼠)或非人类灵长类动物(例如黑猩猩、猕猴)物种。此外,免疫球蛋白恒定区或其部分可源自任何免疫球蛋白种类,包括IgM、IgG、IgD、IgA和IgE,以及任何免疫球蛋白同种型,包括IgGl、IgG2、IgG3和IgG4。在一个实施方案中,使用人类同种型IgG1。
多种免疫球蛋白恒定区基因序列(例如人类恒定区基因序列)可以公开访问的存放物形式获得。可选择具有特定效应功能(或缺乏特定效应功能)或具有特定修饰以降低免疫原性的恒定区结构域序列。抗体和抗体编码基因的许多序列已公开并且可使用本领域中公认的技术从这些序列获得合适的Ig恒定区序列(例如,铰链、CH2和/或CH3序列、或其部分)。使用任何前述方法获得的遗传物质随后可改变或合成以获得本发明的多肽。应进一步了解,本发明的范畴涵盖恒定区DNA序列的等位基因、变体和突变。
免疫球蛋白恒定区或其部分的序列可例如使用聚合酶链反应和经过选择以扩增目标结构域的引物来克隆。为了从抗体克隆免疫球蛋白恒定区或其部分的序列,可从杂交瘤、脾脏或淋巴细胞分离mRNA,逆转录成DNA,并且通过PCR扩增抗体基因。PCR扩增方法详细描述于美国专利第4,683,195号、第4,683,202号、第4,800,159号、第4,965,188号中;以及例如“PCR Protocols:A Guide to Methods and Applications”,Innis等编,AcademicPress,San Diego,CA(1990);Ho等,1989.Gene 77:51;Horton等,1993.MethodsEnzymol.217:270中)。
本文使用的免疫球蛋白恒定区可包括所有结构域和铰链区或其部分。在一个实施方案中,免疫球蛋白恒定区或其部分包含CH2结构域、CH3结构域和铰链区,即,Fc区或FcRn结合伴侣。
如本文所用,术语“Fc区”定义为对应于原生免疫球蛋白的Fc区的多肽部分,即,如通过其两个重链的相应Fc结构域的二聚缔合形成。原生Fc区与另一Fc区形成均二聚体。
在一个实施方案中,“Fc区”是指开始于木瓜蛋白酶裂解位点正上游的铰链区中(即IgG中的残基216,将重链恒定区的第一残基取为114)并且结束于抗体的C端的单一免疫球蛋白重链的部分。因此,完整Fc结构域至少包含铰链结构域、CH2结构域和CH3结构域。
视免疫球蛋白同种型而定,免疫球蛋白恒定区的Fc区可包括CH2、CH3和CH4结构域以及铰链区。包含免疫球蛋白的Fc区的嵌合蛋白赋予嵌合蛋白若干所需特性,包括增加的稳定性、增加的血清半衰期(参见Capon等,1989,Nature 337:525)以及结合于Fc受体如新生儿Fc受体(FcRn)(美国专利第6,086,875号、第6,485,726号、第6,030,613号;WO 03/077834;US2003-0235536A1),所述专利以全文引用的方式并入本文中。
免疫球蛋白恒定区或其部分可以是FcRn结合伴侣。FcRn活跃于成人上皮组织中并且在肠内腔、肺部气管、鼻表面、阴道表面、结肠和直肠表面中表达(美国专利第6,485,726号)。FcRn结合伴侣是结合于FcRn的免疫球蛋白的一部分。
FcRn受体已经从若干哺乳动物物种(包括人类)中分离。人类FcRn、猴FcRn、大鼠FcRn和小鼠FcRn的序列是已知的(Story等,1994,J.Exp.Med.180:2377)。FcRn受体在相对低pH下结合IgG(而非其他免疫球蛋白种类如IgA、IgM、IgD和IgE),积极地在管腔内跨细胞转运IgG至浆膜方向,并且然后在间质液中存在的相对较高pH下释放IgG。其在成人上皮组织(美国专利第6,485,726号、第6,030,613号、第6,086,875号;WO 03/077834;US2003-0235536A1)中表达,包括肺和肠上皮(Israel等,1997,Immunology 92:69)、肾近端小管上皮(Kobayashi等,2002,Am.J.Physiol.Renal Physiol.282:F358)以及鼻上皮、阴道表面和胆管树表面。
可用于本发明中的FcRn结合伴侣涵盖可由FcRn受体特异性结合的分子,包括完整IgG、IgG的Fc片段,和包括FcRn受体的完整结合区域的其他片段。已基于X射线晶体学描述结合于FcRn受体的IgG的Fc部分的区域(Burmeister等,1994,Nature 372:379)。Fc与FcRn的主要接触区域接近CH2与CH3结构域的交界处。Fc-FcRn接触都在单一Ig重链内。FcRn结合伴侣包括完整IgG、IgG的Fc片段,和IgG中包括FcRn的完整结合区域的其他片段。主要接触位点包括CH2结构域的氨基酸残基248、250-257、272、285、288、290-291、308-311和314以及CH3结构域的氨基酸残基385-387、428和433-436。对于免疫球蛋白或免疫球蛋白片段或区域的氨基酸编号的提及都是基于Kabat等,1991,Sequences of Proteins ofImmunological Interest,U.S.Department of Public Health,Bethesda,Md。
结合于FcRn的Fc区或FcRn结合伴侣可通过FcRn而有效穿梭跨越上皮屏障,因此提供一种非侵入性方法来系统性施用所需治疗分子。另外,包含Fc区或FcRn结合伴侣的融合蛋白被表达FcRn的细胞内吞。但不是标志着降解,这些融合蛋白再循环出来以再次进入循环中,因此增加这些蛋白质的体内半衰期。在某些实施方案中,免疫球蛋白恒定区的部分是通常经由二硫键和其他非特异性相互作用与另一个Fc区或另一个FcRn结合伴侣缔合以形成二聚体和更高阶多聚体的Fc区或FcRn结合伴侣。
FcRn结合伴侣区域是可由FcRn受体特异性结合并且随后被Fc区的FcRn受体活性转运的分子或其部分。特异性结合是指两个分子形成在生理条件下相对稳定的复合物。特异性结合的特征是高亲和力和低至中等能力,其与非特异性结合相区别,非特异性结合通常具有低亲和力和中等至高能力。通常,当亲和常数KA高于106M-1或高于108M-1时,将结合视为特异性。必要时,可通过改变结合条件来减少非特异性结合而不会基本上影响特异性结合。本领域技术人员可使用常规技术最佳化适当的结合条件,诸如分子的浓度、溶液的离子强度、温度、允许结合的时间、阻断剂(例如血清白蛋白、乳酪蛋白)的浓度等。
无数突变体、片段、变体和衍生物描述于例如PCT公开第WO 2011/069164 A2号、第WO 2012/006623 A2号、第WO 2012/006635 A2号或第WO 2012/006633 A2号中,其全部都以全文引用的方式并入本文中。
II.C.3.b.白蛋白或其片段或变体
在某些实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的异源部分是白蛋白或其功能片段。在一些实施方案中,融合至VWF蛋白的白蛋白与融合至FVIII蛋白的白蛋白共价缔合。
人类血清白蛋白(HSA或HA)是其全长形式为609个氨基酸的蛋白质,其负责显著比例的血清渗透压并且还充当内源性和外源性配体的载体。如本文所用的术语“白蛋白”包括全长白蛋白或其功能片段、变体、衍生物或类似物。白蛋白或其片段或变体的实例公开于美国专利公开第2008/0194481A1号、第2008/0004206 A1号、第2008/0161243 A1号、第2008/0261877 A1号或第2008/0153751 A1号或PCT申请公开第2008/033413 A2号、第2009/058322 A1号或第2007/021494 A2号中,其以全文引用的方式并入本文中。
II.C.3.c.白蛋白结合部分
在某些实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白结合域、白蛋白结合抗体片段或其任何组合。例如,白蛋白结合蛋白可以是细菌白蛋白结合蛋白、抗体或抗体片段,包括结构域抗体(参见美国专利第6,696,245号)。白蛋白结合蛋白例如可以是细菌白蛋白结合域,诸如链球菌蛋白G中的一种(Konig,T.和Skerra,A.(1998)J.Immunol.Methods 218,73-83)。可用作结合伴侣的白蛋白结合肽的其他实例是例如具有Cys-Xaa1-Xaa2-Xaa3-Xaa4-Cys共有序列者,其中Xaa1是Asp、Asn、Ser、Thr或Trp;Xaa2是Asn、Gln、His、Ile、Leu或Lys;Xaa3是Ala、Asp、Phe、Trp或Tyr;并且Xaa4是Asp、Gly、Leu、Phe、Ser或Thr,如美国专利申请2003/0069395或Dennis等(Dennis等,(2002)J.Biol.Chem.277,35035-35043)中所述。
II.C.3.d.PAS序列
在其他实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的异源部分是PAS序列。在一个实施方案中,嵌合分子包含经由VWF连接子融合至PAS序列的本文所述的VWF蛋白。在另一个实施方案中,本发明的嵌合分子包含包括经由VWF连接子融合至PAS序列的VWF蛋白的第一个链和包括FVIII蛋白和另一个任选的PAS序列的第二个链,其中所述PAS序列屏蔽或保护FVIII蛋白上的VWF结合位点,从而抑制或防止FVIII蛋白与内源性VWF的相互作用。两个PAS序列可彼此共价缔合。
如本文所用,PAS序列是指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,所述氨基酸序列在生理条件下形成无规卷曲构型。因此,PAS序列是架构基块、氨基酸聚合物或包含丙氨酸、丝氨酸和脯氨酸、基本上由丙氨酸、丝氨酸和脯氨酸组成或由丙氨酸、丝氨酸和脯氨酸组成的序列盒,其可以用作嵌合蛋白中异源部分的一部分。然而,本领域技术人员认识到,当除丙氨酸、丝氨酸和脯氨酸之外的残基作为PAS序列中的次要成分添加时,氨基酸聚合物也可形成无规卷曲构型。如本文所用的术语“次要成分”是指除丙氨酸、丝氨酸和脯氨酸之外的氨基酸可在某种程度上添加于PAS序列中,例如,PAS序列的至多约12%(即,100个氨基酸中约12个)、PAS序列的至多约10%(即,100个氨基酸中约10个)、至多约9%(即,100个氨基酸中约9个)、至多约8%(即,100个氨基酸中约8个)、约6%(即,100个氨基酸中约6个)、约5%(即,100个氨基酸中约5个)、约4%(即,100个氨基酸中约4个)、约3%(即,100个氨基酸中约3个)、约2%(即,100个氨基酸中约2个)、约1%(即,100个氨基酸中约1个)。不同于丙氨酸、丝氨酸和脯氨酸的氨基酸可选自由Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Thr、Trp、Tyr和Val组成的群组。
在生理条件下,PAS序列伸展形成无规卷曲构型并且从而可介导VWF因子或具凝血活性的蛋白质的体内和/或体外稳定性增加。由于无规卷曲结构域不采用稳定结构或自身起作用,由与其融合的VWF蛋白或FVIII蛋白介导的生物活性基本上得以保留。在其他实施方案中,形成无规卷曲结构域的PAS序列呈生物惰性,尤其关于在血浆中的蛋白水解、免疫原性、等电点/静电行为、结合于细胞表面受体或内化,但仍可生物降解,其提供明显优于合成聚合物如PEG的优势。
形成无规卷曲构型的PAS序列的非限制性实例包含选自由以下组成的群组的氨基酸序列:ASPAAPAPASPAAPAPSAPA(SEQ ID NO:32)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO:33)、APSSPSPSAPSSPSPASPSS(SEQ ID NO:34)、APSSPSPSAPSSPSPASPS(SEQ ID NO:35)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO:36)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO:37)和ASAAAPAAASAAASAPSAAA(SEQ ID NO:38)或其任何组合。PAS序列的其他实例可从例如美国专利公开第2010/0292130A1号和PCT申请公开第WO 2008/155134 A1号已知。
II.C.3.e.HAP序列
在某些实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的异源部分是富含甘氨酸的氨基酸均聚物(HAP)。HAP序列可包含甘氨酸的重复序列,其具有长度为至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸或500个氨基酸。在一个实施方案中,HAP序列能够延长融合至或连接至HAP序列的部分的半衰期。HAP序列的非限制性实例包括(但不限于)(Gly)n、(Gly4Ser)n或S(Gly4Ser)n,其中n是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一个实施方案中,n是20、21、22、23、24、25、26、26、28、29、30、31、32、33、34、35、36、37、38、39或40。在另一个实施方案中,n是50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200。参见例如Schlapschy M等,Protein Eng.Design Selection,20:273-284(2007)。
II.C.3.f.转铁蛋白或其片段
在某些实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的异源部分是转铁蛋白或其片段。任何转铁蛋白可用于制备本发明的嵌合分子。例如,野生型人类Tf(Tf)是具有两个主要结构域N(约330个氨基酸)和C(约340个氨基酸)的约75KDa的具679个氨基酸的蛋白质(不造成糖基化),其似乎源自基因复制。参见GenBank保藏编号NM001063、XM002793、M12530、XM039845、XM 039847和S95936(www.ncbi.nlm.nih.gov/),其都以全文引用的方式并入本文中。转铁蛋白包含两个结构域,N结构域和C结构域。N结构域包含两个子结构域,N1结构域和N2结构域,并且C结构域包含两个子结构域,C1结构域和C2结构域。
在一个实施方案中,嵌合分子的转铁蛋白部分包括转铁蛋白剪接变体。在一个实例中,转铁蛋白剪接变体可以是人类转铁蛋白的剪接变体,例如,Genbank保藏编号AAA61140。在另一个实施方案中,嵌合分子的转铁蛋白部分包括转铁蛋白序列的一个或多个结构域,例如,N结构域、C结构域、N1结构域、N2结构域、C1结构域、C2结构域或其任何组合。
II.C.3.g聚合物,例如聚乙二醇(PEG)
在其他实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的异源部分是本领域中已知的可溶性聚合物,包括(但不限于)聚乙二醇、乙二醇/丙二醇共聚物、羧甲基纤维素、葡聚糖或聚乙烯醇。异源部分如可溶性聚合物可连接至嵌合分子内的任何位置。
在某些实施方案中,嵌合分子包含经由VWF连接子与异源部分(例如,Fc区)融合的VWF蛋白,其中所述VWF蛋白进一步连接至PEG。在另一个实施方案中,嵌合分子包含经由VWF连接子与Fc区融合的VWF蛋白以及FVIII蛋白,所述VWF蛋白与所述FVIII蛋白彼此缔合,其中所述FVIII蛋白连接至PEG。
本发明还提供本发明嵌合分子的化学修饰衍生物,其可提供其他优点,诸如增加的多肽溶解性、稳定性和循环时间,或降低的免疫原性(参见美国专利第4,179,337号)。用于修饰的化学部分可选自水溶性聚合物,包括(但不限于)聚乙二醇、乙二醇/丙二醇共聚物、羧甲基纤维素、葡聚糖或聚乙烯醇。嵌合分子可在分子内的任意位置或在N端或C端、或在分子内的预定位置被修饰并且可包括一个、两个、三个或更多个连接的化学部分。
聚合物可具有任何分子量,并且可以是分枝或未分枝的。对于聚乙二醇,在一个实施方案中,为了易于处理和制造,分子量介于约1kDa与约100kDa之间。视所需概况(例如,所需持续释放的持续时间、对生物活性的影响(如果存在的话)、易于处理、抗原性的程度或缺乏以及聚乙二醇对蛋白质或类似物的其他已知作用)而定,可使用其他尺寸。例如,聚乙二醇可具有约200、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10,000、10,500、11,000、11,500、12,000、12,500、13,000、13,500、14,000、14,500、15,000、15,500、16,000、16,500、17,000、17,500、18,000、18,500、19,000、19,500、20,000、25,000、30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95,000或100,000kDa的平均分子量。
在一些实施方案中,聚乙二醇可具有分枝结构。分枝聚乙二醇描述于例如美国专利第5,643,575号;Morpurgo等,Appl.Biochem.Biotechnol.56:59-72(1996);Vorobjev等,Nucleosides Nucleotides 18:2745-2750(1999);和Caliceti等,Bioconjug.Chem.10:638-646(1999)中,其各自以全文引用的方式并入本文中。
连接至每个嵌合分子的聚乙二醇部分的数目(即,取代程度)也可改变。例如,本发明的聚乙二醇化蛋白质平均可连接至1、2、3、4、5、6、7、8、9、10、12、15、17、20个或更多个聚乙二醇分子。类似地,平均取代程度在诸如每个蛋白质分子1-3、2-4、3-5、4-6、5-7、6-8、7-9、8-10、9-11、10-12、11-13、12-14、13-15、14-16、15-17、16-18、17-19或18-20个聚乙二醇部分的范围内。用于测定取代程度的方法讨论于例如Delgado等,Crit.Rev.Thera.DrugCarrier Sys.9:249-304(1992)中。
在其他实施方案中,本发明中使用的FVIII蛋白结合于一个或多个聚合物。所述聚合物可以是水溶性的并且共价或非共价连接至因子VIII或结合至因子VIII的其他部分。聚合物的非限制性实例可以是聚(环氧烷)、聚(乙烯吡咯烷酮)、聚(乙烯醇)、聚噁唑啉或聚(丙烯酰基吗啉)。其他类型的聚合物结合FVIII公开于美国专利第7,199,223号中。
II.C.3.h.羟乙基淀粉(HES)
在某些实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的异源部分是聚合物,例如,羟乙基淀粉(HES)或其衍生物。
羟乙基淀粉(HES)是天然存在的支链淀粉的衍生物并且通过α-淀粉酶在体内降解。HES是碳水化合物聚合物支链淀粉的被取代衍生物,其以至多95重量%的浓度存在于玉米淀粉中。HES展现有利的生物特性并且用作血容量替代剂以及在诊所用于血液稀释疗法中(Sommermeyer等,Krankenhauspharmazie,8(8),271-278(1987);和Weidler等,Arzneim.-Forschung/Drug Res.,41,494-498(1991))。
支链淀粉含有葡萄糖部分,其中在主链中存在α-1,4-糖苷键并且在分枝位点存在α-1,6-糖苷键。这个分子的物理-化学特性主要由糖苷键类型决定。由于带缺口的α-1,4-糖苷键,产生每圈具有约六个葡萄糖单体的螺旋结构。聚合物的物理-化学以及生物化学特性可经由取代修饰。可经由碱性羟乙基化实现羟乙基的引入。通过调整反应条件,有可能利用未被取代的葡萄糖单体中的个别羟基关于羟乙基化的不同反应性。由此,本领域技术人员能够在有限程度上影响取代模式。
HES的主要特征在于分子量分布和取代程度。取代程度(以DS指示)涉及摩尔取代,是本领域技术人员已知的。参见如上文所引用的Sommermeyer等,Krankenhauspharmazie,8(8),271-278(1987),尤其是第273页。
在一个实施方案中,羟乙基淀粉具有1至300kD、2至200kD、3至100kD或4至70kD的平均分子量(重量平均值)。羟乙基淀粉还可展现0.1至3、较佳0.1至2、更佳0.1至0.9、较佳0.1至0.8的摩尔取代程度,并且关于羟乙基的C2:C6取代之间的比率在2至20的范围内。具有约130kD的平均分子量的HES的非限制性实例是具有0.2至0.8诸如0.2、0.3、0.4、0.5、0.6、0.7或0.8、较佳0.4至0.7诸如0.4、0.5、0.6或0.7的取代程度的HES。在一个特定实施方案中,具有约130kD的平均分子量的HES是来自Fresenius的
Figure BDA0003162841480000771
Figure BDA0003162841480000772
是人工胶体,例如用于治疗和预防低容量血症的治疗适应症中所用的容量替代。
Figure BDA0003162841480000773
的特征是130,000+/-20,000D的平均分子量、0.4的摩尔取代和约9:1的C2:C6比率。在其他实施方案中,羟乙基淀粉的平均分子量范围是例如4至70kD或10至70kD或12至70kD或18至70kD或50至70kD或4至50kD或10至50kD或12至50kD或18至50kD或4至18kD或10至18kD或12至18kD或4至12kD或10至12kD或4至10kD。在其他实施方案中,所用羟乙基淀粉的平均分子量在高于4kD且低于70kD的范围内,诸如约10kD,或在9至10kD或10至11kD或9至11kD的范围内,或约12kD,或在11至12kD或12至13kD或1l至13kD的范围内,或约18kD,或在17至18kD或18至19kD或17至19kD的范围内,或约30kD,或在29至30、或30至31kD的范围内,或约50kD,或在49至50kD或50至51kD或49至51kD的范围内。
在某些实施方案中,异源部分可以是具有不同平均分子量和/或不同取代程度和/或不同C2:C6取代比率的羟乙基淀粉的混合物。因此,可使用具有不同平均分子量和不同取代程度和不同C2:C6取代比率、或具有不同平均分子量和不同取代程度和相同或大致相同C2:C6取代比率、或具有不同平均分子量和相同或大致相同取代程度和不同C2:C6取代比率、或具有相同或大致相同平均分子量和不同取代程度和不同C2:C6取代比率、或具有不同平均分子量和相同或大致相同取代程度和相同或大致相同C2:C6取代比率、或具有相同或大致相同平均分子量和不同取代程度和相同或大致相同C2:C6取代比率、或具有相同或大致相同平均分子量和相同或大致相同取代程度和不同C2:C6取代比率、或具有大致相同平均分子量和大致相同取代程度和大致相同C2:C6取代比率的羟乙基淀粉的混合物。
II.C.3.i.聚唾液酸(PSA)
在某些实施方案中,经由VWF连接子连接至VWF蛋白或经由FVIII连接子连接至FVIII蛋白的非多肽异源部分是聚合物,例如,聚唾液酸(PSA)或其衍生物。聚唾液酸(PSA)是通过某些细菌株并且在哺乳动物中在某些细胞中产生的天然存在的未分枝唾液酸聚合物。Roth J.等,(1993)Polysialic Acid:From Microbes to Man,Roth J.,RutishauserU.,Troy F.A.编(
Figure BDA0003162841480000781
Verlag,Basel,Switzerland),第335-348页。它们可通过有限的酸水解或通过神经胺酸酶消化,或通过聚合物的天然的细菌源形式分馏,以从n=约80或更多个唾液酸残基到降至n=2的各种聚合程度产生。不同聚唾液酸的组成也改变,以使得存在均聚物形式,即包含大肠杆菌株K1和B族脑膜炎球菌的荚膜多糖的α-2,8-连接聚唾液酸,其也存在于神经元细胞粘附分子(N-CAM)的胚胎形式上。还存在异质聚合物形式,诸如大肠杆菌株K92和C族脑膜炎奈瑟球菌多糖的交替α-2,8α-2,9聚唾液酸。唾液酸也可见于与除唾液酸之外的单体诸如W135族或Y族脑膜炎奈瑟球菌的交替共聚物。聚唾液酸具有重要的生物功能,包括通过致病菌逃避免疫和补体系统以及在胎儿发育期间调控未成熟神经元的神经胶质粘附性(其中所述聚合物具有抗粘附功能)(Cho和Troy,P.N.A.S.,USA,91(1994)11427-11431),但在哺乳动物中不存在聚唾液酸的已知受体。大肠杆菌株K1的α-2,8-连接聚唾液酸也称为‘多聚乙酰神经酸(colominic acid)’并且(以各种长度)用于示例本发明。连接或结合聚唾液酸与多肽的各种方法已经描述(例如,参见美国专利第5,846,951号、WO-A-0187922和US 2007/0191597 A1,其以全文引用的方式并入本文中。
II.C.4.XTEN序列。
如本文所用,“XTEN序列”是指具有主要由小的亲水性氨基酸组成的非天然存在的基本上非重复序列的延长长度的多肽,其中序列在生理条件下具有低程度的二级或三级结构或者不具有二级或三级结构。作为嵌合蛋白搭配物,XTEN可充当载体,当连接至本发明的VWF蛋白或FVIII蛋白以产生嵌合蛋白时赋予某些所需药物动力学、物理化学和药物特性。这些所需特性包括(但不限于)增强的药物动力学参数和溶解特性。如本文所用,“XTEN”特定排除抗体或抗体片段,诸如单链抗体或轻链或重链的Fc片段。
在一些实施方案中,本发明的XTEN序列是具有大于约20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸残基的肽或多肽。在某些实施方案中,XTEN是具有大于约20个至约3000个氨基酸残基、大于30个至约2500个残基、大于40个至约2000个残基、大于50个至约1500个残基、大于60个至约1000个残基、大于70个至约900个残基、大于80个至约800个残基、大于90个至约700个残基、大于100个至约600个残基、大于110个至约500个残基、或大于120个至约400个残基的肽或多肽。
本发明的XTEN序列可包含一个或多个具有9至14个氨基酸残基的序列基序或与所述序列基序具有至少80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,其中所述基序包含以下、基本上由以下组成或由以下组成:选自由甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)组成的群组的4至6种类型的氨基酸。参见US 2010-0239554 A1。
在一些实施方案中,XTEN包含非重叠序列基序,其中约80%、或至少约85%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%或约100%的序列由选自从表2A中选出的单一基序家族的非重叠序列的多个单元组成,从而产生家族序列。如本文所用,“家族”是指XTEN具有仅从来自表2A的单一基序类别选出的基序;即,AD、AE、AF、AG、AM、AQ、BC或BD XTEN,并且XTEN中并非来自家族基序的任何其他氨基酸经过选择以实现所需特性,诸如允许通过编码核苷酸并入限制位点,并入裂解序列,或实现与FVIII或VWF的更佳连接。在XTEN家族的一些实施方案中,XTEN序列包含AD基序家族、或AE基序家族、或AF基序家族、或AG基序家族、或AM基序家族、或AQ基序家族、或BC家族、或BD家族的非重叠序列基序的多个单元,其中所得XTEN展现上述同源性范围。在其他实施方案中,XTEN包含来自表2A的两个或更多个基序家族的基序序列的多个单元。这些序列可经过选择以实现所需物理/化学特性,包括诸如净电荷、亲水性、缺乏二级结构或缺乏由基序的氨基酸组成所赋予的重复性等性质,其在下文更充分描述。在这个段落中的上述实施方案中,并入XTEN中的基序可使用本文所述的方法选择并组装以实现具有约36个至约3000个氨基酸残基的XTEN。
表2A.具有12个氨基酸的XTEN序列基序和基序家族
Figure BDA0003162841480000811
·指示当以各种排列一起使用时产生“家族序列”的单独的基序序列
XTEN可具有不同长度以供插入或连接至FVIII或VWF或嵌合分子的任何其他组分。在一个实施方案中,一个或多个XTEN序列的长度是基于在融合蛋白中有待实现的性质或功能而进行选择。视预期性质或功能而定,XTEN可以是可充当载体的较短或中等长度序列或较长序列。在某些实施方案中,XTEN包括具有约6个至约99个氨基酸残基的短区段、具有约100个至约399个氨基酸残基的中等长度区段,和具有约400个至约1000个且至多约3000个氨基酸残基的较长长度区段。因此,插入或连接至FVIII或VWF的XTEN可具有约6、约12、约36、约40、约42、约72、约96、约144、约288、约400、约500、约576、约600、约700、约800、约864、约900、约1000、约1500、约2000、约2500或至多约3000个氨基酸残基的长度。在其他实施方案中,XTEN序列的长度是约6至约50、约50至约100、约100至150、约150至250、约250至400、约400至约500、约500至约900、约900至1500、约1500至2000、或约2000至约3000个氨基酸残基。插入或连接至FVIII或VWF的XTEN的精确长度可改变而不会不利影响FVIII或VWF的活性。在一个实施方案中,本文使用的一种或多种XTEN具有36个氨基酸、42个氨基酸、72个氨基酸、144个氨基酸、288个氨基酸、576个氨基酸或864个氨基酸的长度并且可选自XTEN家族序列中的一个或多个;即,AD、AE、AF、AG、AM、AQ、BC或BD。
在一些实施方案中,本发明中使用的XTEN序列与选自由以下组成的群组的序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性:AE42、AG42、AE48、AM48、AE72、AG72、AE108、AG108、AE144、AF144、AG144、AE180、AG180、AE216、AG216、AE252、AG252、AE288、AG288、AE324、AG324、AE360、AG360、AE396、AG396、AE432、AG432、AE468、AG468、AE504、AG504、AF504、AE540、AG540、AF540、AD576、AE576、AF576、AG576、AE612、AG612、AE624、AE648、AG648、AG684、AE720、AG720、AE756、AG756、AE792、AG792、AE828、AG828、AD836、AE864、AF864、AG864、AM875、AE912、AM923、AM1318、BC864、BD864、AE948、AE1044、AE1140、AE1236、AE1332、AE1428、AE1524、AE1620、AE1716、AE1812、AE1908、AE2004A、AG948、AG1044、AG1140、AG1236、AG1332、AG1428、AG1524、AG1620、AG1716、AG1812、AG1908和AG2004。参见US 2010-0239554 A1。
在一个实施方案中,XTEN序列与选自由AE42、AE864、AE576、AE288、AE144、AG864、AG576、AG288、AG144和其任何组合组成的群组的氨基酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%、99%或100%同一性。在另一个实施方案中,XTEN序列选自由AE42、AE864、AE576、AE288、AE144、AG864、AG576、AG288、AG144和其任何组合组成的群组。在一个特定实施方案中,XTEN序列是AE288。本发明的某些XTEN序列的氨基酸序列示于表2B中。
表2B.XTEN序列
Figure BDA0003162841480000841
Figure BDA0003162841480000851
在所用XTEN组分中小于100%的其氨基酸由选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4、5或6种类型的氨基酸组成、或小于100%的序列由来自表2A的序列基序或表2B的XTEN序列组成的那些实施方案中,XTEN的其他氨基酸残基选自任何其他14种天然L-氨基酸,但优先选自亲水性氨基酸以使得XTEN序列含有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%亲水性氨基酸。不是甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的XTEN氨基酸散布于整个XTEN序列内,位于序列基序内或之间,或者集中在XTEN序列的一个或多个短伸展物中,例如,以产生XTEN与其他组分(例如,VWF蛋白)之间的连接子。在XTEN组分包含除甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)之外的氨基酸的这些情况下,优选的是小于约2%或小于约1%的氨基酸是疏水性残基以使得所得序列一般缺乏二级结构,例如,如通过本文公开的方法所测定,不具有大于2%α螺旋或2%β折叠。在XTEN的构造中不太偏爱的疏水性残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。另外,可设计XTEN序列以包含小于5%或小于4%或小于3%或小于2%或小于1%的下列氨基酸或不含下列氨基酸:半胱氨酸(以避免二硫化物形成和氧化)、甲硫氨酸(以避免氧化)、天冬酰胺和谷氨酰胺(以避免脱酰胺)。因此,在一些实施方案中,包含除甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)之外的其他氨基酸的XTEN具有如通过Chou-Fasman算法所测量贡献于α螺旋和β折叠的残基小于5%的序列并且具有如通过GOR算法所测量至少90%或至少约95%以上的无规卷曲形成。
在其他实施方案中,本发明中使用的XTEN序列影响本发明嵌合蛋白的物理或化学特性,例如,药物动力学特性。本发明中使用的XTEN序列可展现下列有利特性中的一个或多个:构型灵活性、增强的水溶性、高程度的蛋白酶抗性、低免疫原性、与哺乳动物受体的低结合或增大的流体动力学(或Stoke)半径。在一个特定实施方案中,在本发明中连接至FVIII蛋白的XTEN序列提高药物动力学特性,诸如较长终末半衰期或增加的曲线下面积(AUC),以使得本文所述嵌合蛋白相比于野生型FVIII保持在体内的时间增加。在其他实施方案中,本发明中使用的XTEN序列提高药物动力学特性,诸如较长终末半衰期或增加的曲线下面积(AUC),以使得FVIII蛋白相比于野生型FVIII保持在体内的时间增加。
可使用多种方法和测定法来测定包含XTEN序列的蛋白质的物理/化学特性。所述方法包括(但不限于)分析离心、EPR、离子交换HPLC、尺寸排阻HPLC、反相HPLC、光散射、毛细管电泳、圆二色法、差示扫描热量测定、荧光法、离子交换HPLC、尺寸排阻HPLC、IR、NMR、拉曼光谱、折射率测定和紫外/可见光谱。其他方法公开于Amau等,Prot Expr and Purif 48,1-13(2006)中。
根据本发明可使用XTEN序列的其他实例并且其公开于美国专利公开第2010/0239554 A1号、第2010/0323956 A1号、第2011/0046060 A1号、第2011/0046061 A1号、第2011/0077199 A1号或第2011/0172146 A1号、或者国际专利公开第WO 2010091122 A1号、第WO 2010144502 A2号、第WO 2010144508 A1号、第WO 2011028228 A1号、第WO2011028229 A1号、第WO 2011028344 A2号或第WO2013123457 A1号、或者国际申请第PCT/US2013/049989号中。
II.C.5.FVIII蛋白
除非另外说明,否则如本文所用的“FVIII蛋白”是指在凝血中呈其正常作用的功能性FVIII多肽。术语FVIII蛋白包括在凝血路径中保持全长野生型因子VIII的功能的其功能性片段、变体、类似物或衍生物。“FVIII蛋白”可与FVIII多肽(或蛋白质)或FVIII互换使用。FVIII功能的实例包括(但不限于)活化凝血的能力、充当因子IX的辅因子的能力、或在Ca2+和磷脂存在下与因子IX形成tenase复合物并且然后将因子X转化为活化形式Xa的能力。FVIII蛋白可以是人类、猪、犬、大鼠或鼠类FVIII蛋白。另外,来自人类和其他物种的FVIII之间的比较已鉴定可能为功能所需的保守残基(Cameron等,Thromb.Haemost.79:317-22(1998);US 6,251,632)。
多种测试可用于评估凝血系统的功能:活化部分凝血活酶时间(aPTT)测试、显色测定法、ROTEM测定法、凝血酶原时间(PT)测试(也用于测定INR)、血纤维蛋白原测试(通常通过Clauss法)、血小板计数、血小板功能测试(通常通过PFA-100)、TCT、出血时间、混合测试(如果将患者的血浆与正常血浆混合时是否校正异常)、凝血因子测定法、抗磷脂抗体、D-二聚体、基因测试(例如因子V Leiden、凝血酶原突变G20210A)、稀释Russell毒蛇毒液时间(dRVVT)、杂项血小板功能测试、血栓弹力图(TEG或Sonoclot)、血栓弹力测定(
Figure BDA0003162841480000881
例如
Figure BDA0003162841480000882
)或优球蛋白溶解时间(ELT)。
aPTT测试是测量“固有”(也称为接触活化路径)和常见凝血路径的功效的效能指标。这项测试通常用于测量市售重组凝血因子(例如,FVIII或FIX)的凝血活性。其与测量外部路径的凝血酶原时间(PT)结合使用。
ROTEM分析提供关于止血的完全动力学的信息:凝血时间、凝块形成、凝块稳定性和溶解。血栓弹力测定中的不同参数取决于血浆凝血系统的活性、血小板功能、纤维蛋白溶解或影响这些相互作用的许多因素。这项测定法可以提供二次止血的完整见解。
FVIII多肽和聚核苷酸序列是已知的,许多功能性片段、突变体和修饰形式也是如此。人类FVIII序列(全长)的实例显示为SEQ ID NO:16或18中的子序列。
表3.全长FVIII(FVIII信号肽加下划线;FVIII重链加双下划线;B结构域是斜体字;并且FVIII轻链是普通文字)
信号肽:(SEQ ID NO:15)
Figure BDA0003162841480000883
成熟因子VIII(SEQ ID NO:16)*
Figure BDA0003162841480000891
表4.编码全长FVIII的核苷酸序列(SEQ ID NO:17)*
Figure BDA0003162841480000892
Figure BDA0003162841480000901
Figure BDA0003162841480000911
*加下划线的核酸编码信号肽。
FVIII多肽包括全长FVIII、在N端减去Met的全长FVIII、成熟FVIII(减去信号序列)、在N端具有另一个Met的成熟FVIII和/或具有B结构域的完全或部分缺失的FVIII。在某些实施方案中,FVIII变体包括B结构域缺失,存在部分或完全缺失。
人类FVIII基因被分离并在哺乳动物细胞中表达(Toole,J.J.等,Nature 312:342-347(1984);Gitschier,J.等,Nature 312:326-330(1984);Wood,W.I.等,Nature 312:330-337(1984);Vehar,G.A.等,Nature 312:337-342(1984);WO 87/04187;WO 88/08035;WO 88/03558;和美国专利第4,757,006号)。如美国专利第4,965,199号中所示,从cDNA推导FVIII氨基酸序列。另外,部分或完全B结构域缺失的FVIII示于美国专利第4,994,371号和第4,868,112号中。在一些实施方案中,人类FVIII B结构域被人类因子V B结构域置换,如美国专利第5,004,803号中所示。编码人类因子VIII的cDNA序列和氨基酸序列分别示于美国专利第7,211,559号的SEQ ID NO:1和2中。
猪FVIII序列公开于Toole,J.J.等,Proc.Natl.Acad.Sci.USA 83:5939-5942(1986)中。此外,从来自猪脾cDNA文库的FVIII序列的PCR扩增获得的完整猪cDNA序列已报道于Healey,J.F.等,Blood 88:4209-4214(1996)中。具有所有结构域、所有亚单位和特定氨基酸序列的取代的杂交人类/猪FVIII公开于Lollar和Runge的美国专利第5,364,771号中以及WO 93/20093中。近来,猪FVIII的A1和A2结构域以及具有用猪A1和/或A2结构域取代相应人类结构域的嵌合FVIII的核苷酸和相应氨基酸序列报道于WO 94/11503中。Lollar,J.S.的美国专利第5,859,204号也公开猪cDNA和推导的氨基酸序列。美国专利第6,458,563号公开B结构域缺失的猪FVIII。
Lollar,J.S.的美国专利第5,859,204号报道了具有降低的抗原性和降低的免疫反应性的FVIII的功能突变体。Lollar,J.S.的美国专利第6,376,463号也报道了具有降低的免疫反应性的FVIII突变体。Saenko等的美国申请公开第2005/0100990号报道了FVIII的A2结构域中的功能突变。
在一个实施方案中,FVIII蛋白(或嵌合蛋白的FVIII部分)可与SEQ ID NO:18的氨基酸1至1438或SEQ ID NO:16(不具有信号序列)的氨基酸1至2332的FVIII氨基酸序列具有至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%同一性,其中所述FVIII具有凝血活性,例如,活化作为辅因子的因子IX以将因子X转化为活化因子X。FVIII(或嵌合蛋白的FVIII部分)可与SEQ ID NO:18的氨基酸1至1438或SEQ ID NO:16(不具有信号序列)的氨基酸1至2332的FVIII氨基酸序列一致。FVIII蛋白还可包含信号序列。
如本文所用,FVIII的“B结构域”与本领域中已知由内部氨基酸序列同一性和蛋白水解裂解位点界定的B结构域相同,例如,全长人类FVIII的残基Ser741-Arg1648。其他人类FVIII结构域是由以下氨基酸残基界定:A1,残基Ala1-Arg372;A2,残基Ser373-Arg740;A3,残基Ser1690-Asn2019;C1,残基Lys2020-Asn2172;C2,残基Ser2173-Tyr2332。A3-C1-C2序列包括残基Ser1690-Tyr2332。其余序列(残基Glu1649-Arg1689)通常被称为a3酸性区域。所有结构域(包括猪、小鼠和犬FVIII的B结构域)的边界位置也是本领域已知的。在一个实施方案中,FVIII的B结构域缺失(“B结构域缺失的因子VIII”或“BDD FVIII”)。BDD FVIII的实例是
Figure BDA0003162841480000931
(重组BDD FVIII),其具有与表5中的序列的因子VIII部分相同的序列。(BDD FVIII重链加双下划线;B结构域是斜体字;并且BDD FVIII轻链是普通文字)。
表5.BDD FVIII(SEQ ID NO:18)
Figure BDA0003162841480000932
表6.编码BDD FVIII的核苷酸序列(SEQ ID NO:19)*
Figure BDA0003162841480000941
Figure BDA0003162841480000951
*加下划线的核酸编码信号肽。
“B结构域缺失的FVIII”可具有美国专利第6,316,226号、第6,346,513号、第7,041,635号、第5,789,203号、第6,060,447号、第5,595,886号、第6,228,620号、第5,972,885号、第6,048,720号、第5,543,502号、第5,610,278号、第5,171,844号、第5,112,950号、第4,868,112号和第6,458,563号中所公开的完全或部分缺失。在一些实施方案中,本发明的B结构域缺失的FVIII序列包含美国专利第6,316,226号(也在US 6,346,513中)的第4栏第4行至第5栏第28行和实施例1-5中所公开的缺失中的任一个。在另一个实施方案中,B结构域缺失的因子VIII是S743/Q1638 B结构域缺失的因子VIII(SQ BDD FVIII)(例如,具有氨基酸744至氨基酸1637的缺失的因子VIII,例如,具有SEQ ID NO:16的氨基酸1-743和氨基酸1638-2332的因子VIII,即,SEQ ID NO:18)。在一些实施方案中,本发明的B结构域缺失的FVIII具有在美国专利第5,789,203号(以及US 6,060,447、US 5,595,886和US 6,228,620)的第2栏第26-51行和实施例5-8中公开的缺失。在一些实施方案中,B结构域缺失的因子VIII具有美国专利第5,972,885号的第1栏第25行至第2栏第40行;美国专利第6,048,720号的第6栏第1-22行和实施例1;美国专利第5,543,502号的第2栏第17-46行;美国专利第5,171,844号的第4栏第22行至第5栏第36行;美国专利第5,112,950号的第2栏第55-68行、图2和实施例1;美国专利第4,868,112号的第2栏第2行至第19栏第21行和表2;美国专利第7,041,635号的第2栏第1行至第3栏第19行、第3栏第40行至第4栏第67行、第7栏第43行至第8栏第26行和第11栏第5行至第13栏第39行;或美国专利第6,458,563号的第4栏第25-53行中所述的缺失。
在一些实施方案中,B结构域缺失的FVIII具有大部分B结构域的缺失,但仍包含对于将主要翻译产物体内蛋白水解加工成两个多肽链所必需的B结构域的氨基末端序列,如WO 91/09122中所公开。在一些实施方案中,B结构域缺失的FVIII被构建具有氨基酸747-1638的缺失,即,B结构域的几乎完全缺失。Hoeben R.C.等,J.Biol.Chem.265(13):7318-7323(1990)。B结构域缺失的因子VIII还可包含FVIII的氨基酸771-1666或氨基酸868-1562的缺失。Meulien P.等,Protein Eng.2(4):301-6(1988)。作为本发明的一部分的其他B结构域缺失包括:氨基酸982至1562或760至1639(Toole等,Proc.Natl.Acad.Sci.U.S.A.(1986)83,5939-5942))、797至1562(Eaton等,Biochemistry(1986)25:8343-8347))、741至1646(Kaufman(PCT公开申请第WO 87/04187号))、747-1560(Sarver等,DNA(1987)6:553-564))、741至1648(Pasek(PCT申请第88/00831号))或816至1598或741至1648(Lagner(Behring Inst.Mitt.(1988)No 82:16-25,EP 295597))的缺失。在其他实施方案中,BDDFVIII包括包含保留一个或多个N连接糖基化位点(例如,残基757、784、828、900、963或任选地943,其对应于全长FVIII序列的氨基酸序列)的B结构域片段的FVIII多肽。B结构域片段的实例包括B结构域的226个氨基酸或163个氨基酸,如Miao,H.Z.等,Blood 103(a):3412-3419(2004);Kasuda,A等,J.Thromb.Haemost.6:1352-1359(2008);和Pipe,S.W.等,J.Thromb.Haemost.9:2235-2242(2011)中所公开(即,B结构域的前226个氨基酸或163个氨基酸得以保留)。在一些实施方案中,具有部分B结构域的FVIII是FVIII198。FVIII198是含有单链FVIIIFc分子-226N6的部分B结构域。226表示FVIII B结构域的N端226氨基酸,并且N6表示B结构域中的六个N糖基化位点。在其他实施方案中,BDD FVIII还包含残基309处的点突变(Phe至Ser)以改进BDD FVIII蛋白的表达。参见Miao,H.Z.等,Blood 103(a):3412-3419(2004)。在其他实施方案中,BDD FVIII包括包含B结构域的一部分的FVIII多肽,但不包含一个或多个furin裂解位点(例如,Arg1313和Arg 1648)。参见Pipe,S.W.等,J.Thromb.Haemost.9:2235-2242(2011)。在任何FVIII序列中可进行各个前述缺失。
可用于本发明中的FVIII蛋白可包括其中具有一个或多个其他异源序列或化学或物理修饰的FVIII,其不影响FVIII凝血活性。这些异源序列或化学或物理修饰可与FVIII蛋白的C端或N端融合或插入FVIII蛋白中的两个氨基酸残基中的一个或多个之间。FVIII蛋白中的这些插入不影响FVIII凝血活性或FVIII功能。在一个实施方案中,插入可改良FVIII蛋白的药物动力学特性(例如,半衰期)。在另一个实施方案中,插入可超过两个、三个、四个、五个或六个位点。
在一个实施方案中,FVIII在氨基酸1648(在全长因子VIII或SEQ ID NO:16中)、氨基酸754(在S743/Q1638 B结构域缺失的因子VIII或SEQ ID NO:16中)或相应精氨酸残基(在其他变体中)处紧邻精氨酸后裂解,从而产生重链和轻链。在另一个实施方案中,FVIII包含重链和轻链,其通过金属离子介导的非共价键连接或缔合。
在其他实施方案中,FVIII是尚未在氨基酸1648(在全长因子FVIII或SEQ ID NO:16中)、氨基酸754(在S743/Q1638 B结构域缺失的因子FVIII或SEQ ID NO:18中)或相应精氨酸残基(在其他变体中)处紧邻精氨酸后裂解的单链FVIII。单链FVIII可包含一个或多个氨基酸取代。在一个实施方案中,氨基酸取代在对应于全长成熟因子VIII多肽(SEQ ID NO:16)的残基1648、残基1645或两者或SQ BDD因子VIII(SEQ ID NO:18)的残基754、残基751或两者的残基处。氨基酸取代可以是除精氨酸之外的任何氨基酸,例如,异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、苏氨酸、色氨酸、缬氨酸、丙氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、硒代半胱氨酸、丝氨酸、酪氨酸、组氨酸、鸟氨酸、吡咯赖氨酸或牛磺酸。
FVIII可进一步由凝血酶裂解并且然后活化为FVIIIa,从而充当活化因子IX的辅因子(FIXa)。并且活化FIX与活化FVIII一起形成Xase复合物并且将因子X转化为活化因子X(FXa)。对于活化,FVIII是在氨基酸372、740和1689(对应于B结构域缺失的FVIII序列中的氨基酸372、740和795)处三个精氨酸残基后被凝血酶裂解,裂解产生的FVIIIa具有50kDaA1、43kDa A2和73kDa A3-C1-C2链。在一个实施方案中,可用于本发明的FVIII蛋白是非活性FVIII。在另一个实施方案中,FVIII蛋白是活化FVIII。
具有连接至VWF蛋白或与VWF蛋白缔合的FVIII多肽的蛋白质可包含与SEQ ID NO:16或18具有至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%同一性的序列,其中所述序列具有FVIII凝血活性,例如,活化作为辅因子的因子IX以将因子X转化为活化因子X(FXa)。
在一些实施方案中,FVIII蛋白还包含与FVIII蛋白的C端或N端融合或插入FVIII蛋白中的两个相邻氨基酸之间的一个或多个异源部分。在其他实施方案中,所述异源部分包含具有至少约50个氨基酸、至少约100个氨基酸、至少约150个氨基酸、至少约200个氨基酸、至少约250个氨基酸、至少约300个氨基酸、至少约350个氨基酸、至少约400个氨基酸、至少约450个氨基酸、至少约500个氨基酸、至少约550个氨基酸、至少约600个氨基酸、至少约650个氨基酸、至少约700个氨基酸、至少约750个氨基酸、至少约800个氨基酸、至少约850个氨基酸、至少约900个氨基酸、至少约950个氨基酸或至少约1000个氨基酸的氨基酸序列。在一些实施方案中,嵌合分子的半衰期相比于野生型FVIII延长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
其他示例性FVIII变体也公开于2013年1月17日公布的美国公开第US2013/0017997号、2013年8月22日公布的国际公开第WO 2013/122617号、或2014年1月16日公布的国际公开第WO 2014/011819号、或国际公开第WO2013123457 A1号、或国际申请第PCT/US2013/049989号中。
III.聚核苷酸、载体、宿主细胞和制备方法
本发明中还提供编码本文所述的嵌合分子的聚核苷酸。当VWF蛋白经由VWF连接子连接至异源部分并且连接至嵌合蛋白中的FVIII蛋白和XTEN序列作为单一多肽链时,本发明是关于编码单一多肽链的单一聚核苷酸。当嵌合蛋白包含第一多肽链和第二多肽链时,所述第一多肽链包含经由VWF连接子连接的VWF蛋白、XTEN序列和第一异源部分(例如,第一Fc区)并且所述第二多肽链包含FVIII蛋白和第二异源部分(例如,第二Fc区),聚核苷酸可包含第一核苷酸区域和第二核苷酸区域。在一个实施方案中,第一核苷酸区域和第二核苷酸区域处于相同聚核苷酸上。在另一个实施方案中,第一核苷酸区域和第二核苷酸区域处于两个不同聚核苷酸(例如,不同载体)上。在某些实施方案中,本发明针对一组包含第一核苷酸链和第二核苷酸链的聚核苷酸,其中所述第一核苷酸链编码VWF蛋白、XTEN序列、VWF连接子和嵌合蛋白的异源部分并且所述第二核苷酸链编码FVIII蛋白和第二异源部分。在一些实施方案中,本发明针对一组包含第一核苷酸链和第二核苷酸链的聚核苷酸,其中所述第一核苷酸链编码VWF蛋白和嵌合蛋白的异源部分并且所述第二核苷酸链编码经由FVIII连接子与第二异源部分融合的FVIII蛋白,其中至少一个XTEN序列与嵌合蛋白融合。在其他实施方案中,本发明针对一组包含第一核苷酸链和第二核苷酸链的聚核苷酸,其中所述第一核苷酸链编码VWF蛋白、VWF连接子和嵌合蛋白的异源部分并且所述第二核苷酸链编码FVIII蛋白、FVIII连接子和第二异源部分,其中至少一个XTEN序列与嵌合蛋白融合。
在其他实施方案中,所述一组聚核苷酸还包含编码蛋白质转化酶的另一个核苷酸链(例如,当嵌合多肽是由单一聚核苷酸链编码时的第二核苷酸链,或当嵌合蛋白是由两个聚核苷酸链编码时的第三核苷酸链)。蛋白质转化酶可选自5型前蛋白转化酶枯草杆菌蛋白酶/kexin(PCSK5或PC5)、7型前蛋白转化酶枯草杆菌蛋白酶/kexin(PCSK7或PC5)、酵母Kex2、3型前蛋白转化酶枯草杆菌蛋白酶/kexin(PACE或PCSK3),或其中两个或更多个的组合。在一些实施方案中,蛋白酶转化酶是PACE、PC5或PC7。在一个特定实施方案中,蛋白质转化酶是PC5或PC7。参见国际申请第PCT/US2011/043568号,其以引用的方式并入本文中。在另一个实施方案中,蛋白酶转化酶是PACE/furin。
在某些实施方案中,本发明包括一组聚核苷酸,其包含编码经由VWF连接子与第一异源部分融合的包含VWF的D'结构域和D3结构域的VWF蛋白的第一核苷酸序列、编码FVIII蛋白和第二异源部分的第二核苷酸序列,和编码VWF的D1结构域和D2结构域的第三核苷酸序列,并且其中XTEN序列存在于第一个链或第二个链中。在这个实施方案中,D1结构域和D2结构域分别表达(并不连接至VWF蛋白的D'D3结构域)以使得适当二硫键形成和D'D3结构域折叠。D1D2结构域表达可为顺式或反式。
如本文所用,表达载体是指当引入适当宿主细胞中时,包含插入编码序列的转录和翻译所必需的元件或在RNA病毒载体的情况下是复制和翻译所必需的元件的任何核酸构建体。表达载体可包括质粒、噬菌体、病毒和其衍生物。
本发明的表达载体将包括编码嵌合分子的聚核苷酸。
在一个实施方案中,嵌合分子的编码序列可操作地连接至表达控制序列。如本文所用,当两个核酸序列以允许每个组分核酸序列保留其功能性的方式共价连接时,它们是可操作地连接。当编码序列和基因表达控制序列以将编码序列的表达或转录和/或翻译置于基因表达控制序列的影响或控制下的方式共价连接时,将其称为可操作地连接。如果5'基因表达序列中的启动子的诱导产生编码序列的转录并且如果两个DNA序列之间的连接的性质不会(1)导致移码突变的引入,(2)干扰启动子区域引导编码序列的转录的能力,或(3)干扰相应RNA转录物翻译成蛋白质的能力,则将所述两个DNA序列称为可操作地连接。因此,如果基因表达序列能够实现编码核酸序列的转录以使得所得转录物翻译成所需蛋白质或多肽,则所述基因表达序列将可操作地连接至所述编码核酸序列。
如本文所用的基因表达控制序列是任何调控核苷酸序列,诸如启动子序列或启动子-增强子组合,其促进与其可操作地连接的编码核酸的有效转录和翻译。基因表达控制序列例如可以是哺乳动物或病毒启动子,诸如组成性或可诱导启动子。组成性哺乳动物启动子包括(但不限于)以下基因的启动子:次黄嘌呤磷酸核糖转移酶(HPRT)、腺苷去胺酶、丙酮酸激酶、β-肌动蛋白启动子和其他组成性启动子。在真核细胞中组成性地起作用的示例性病毒启动子包括例如来自巨细胞病毒(CMV)、猿猴病毒(例如,SV40)、乳头状瘤病毒、腺病毒、人类免疫缺陷病毒(HIV)、Rous肉瘤病毒、巨细胞病毒、Moloney白血病病毒的长末端重复序列(LTR)和其他逆转录病毒的启动子,以及单纯疱疹病毒的胸苷激酶启动子。其他组成性启动子是本领域普通技术人员已知的。可用作本发明的基因表达序列的启动子还包括可诱导启动子。可诱导启动子在诱导剂的存在下表达。例如,金属硫蛋白启动子被诱导以促进在某些金属离子存在下转录和翻译。其他可诱导启动子是本领域普通技术人员已知的。
一般来说,基因表达控制序列必要时应包括分别涉及转录和翻译的起始的5'非转录和5'非翻译序列,诸如TATA盒、封端序列、CAAT序列等。尤其是,这些5'非转录序列将包括启动子区域,其包括用于可操作地接合的编码核酸的转录控制的启动子序列。必要时,基因表达序列任选地包括增强子序列或上游激活子序列。
病毒载体包括(但不限于)来自以下病毒的核酸序列:逆转录病毒,诸如Moloney鼠类白血病病毒、Harvey鼠类肉瘤病毒、鼠类乳腺肿瘤病毒和Rous肉瘤病毒;腺病毒、腺相关病毒;SV40型病毒;多瘤病毒;爱泼斯坦-巴尔病毒(Epstein-Barr virus);乳头状瘤病毒;疱疹病毒;牛痘病毒;脊髓灰质炎病毒;和RNA病毒,诸如逆转录病毒。可容易地采用本领域中众所周知的其他载体。某些病毒载体是基于非细胞致病性真核病毒,其中非必需基因已置换为目标基因。非细胞致病性病毒包括逆转录病毒,其生命周期涉及基因组病毒RNA逆转录成DNA,随后前病毒整合至宿主细胞DNA中。逆转录病毒已经批准用于人类基因疗法试验。大部分有用者是那些复制缺陷型逆转录病毒(即,能够引导所需蛋白的合成,但不能制造感染性粒子)。这些基因改变的逆转录病毒表达载体具有基因在体内高效转导的一般效用。用于产生复制缺陷型逆转录病毒的标准方案(包括以下步骤:将外源遗传物质并入质粒中,用质粒转染包装细胞系,通过包装细胞系产生重组逆转录病毒,从组织培养基收集病毒粒子,和用病毒粒子感染靶细胞)提供于Kriegler,M.,Gene Transfer and Expression,ALaboratory Manual,W.H.Freeman Co.,New York(1990)和Murry,E.J.,Methods inMolecular Biology,第7卷,Humana Press,Inc.,Cliffton,N.J.(1991)中。
在一个实施方案中,病毒是腺相关病毒、双链DNA病毒。腺相关病毒可以被工程改造为复制缺陷型并且能够感染广泛多种细胞类型和物种。其进一步具有以下优点,诸如热和脂质溶剂稳定性;在不同谱系细胞(包括造血细胞)中的高转导频率;和缺乏二重感染抑制,因而允许多个系列的转导。据报道,腺相关病毒可以位点特异性方式整合至人类细胞DNA中,从而将插入突变诱发的可能性和逆转录病毒感染的插入基因表达特征的可变性最小化。另外,野生型腺相关病毒感染已在不存在选择性压力的情况下在组织培养中传代100次以上,表明腺相关病毒基因组整合为相对稳定的事件。腺相关病毒还可以染色体外方式起作用。
其他载体包括质粒载体。质粒载体已在本领域中广泛描述并且是本领域技术人员众所周知的。参见例如Sambrook等,Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor Laboratory Press,1989。近几年来,已发现质粒载体特别有利于在体内递送基因至细胞,这是由于它们不能在宿主基因组中复制和整合至宿主基因组中。然而,具有可与宿主细胞相容的启动子的这些质粒可行在质粒内可操作地编码的基因表达肽。一些可获自商业供应商的常用质粒包括pBR322、pUC18、pUC19、各种pcDNA质粒、pRC/CMV、各种pCMV质粒、pSV40和pBlueScript。特定质粒的其他实例包括pcDNA3.1,目录号V79020;pcDNA3.1/hygro,目录号V87020;pcDNA4/myc-His,目录号V86320;和pBudCE4.1,目录号V53220,都来自Invitrogen(Carlsbad,CA.)。其他质粒是本领域普通技术人员众所周知的。另外,可使用标准分子生物学技术来定制设计质粒以去除和/或添加特定DNA片段。
在可用于产生本发明的蛋白质的一个昆虫表达系统中,使用苜蓿银纹夜蛾(Autographa californica)核多角体病毒(AcNPV)作为载体来表达外来基因。所述病毒在草地夜蛾(Spodoptera frugiperda)细胞中生长。可将编码序列克隆到病毒的非必需区域(例如,多面体基因)中并且置于ACNPV启动子(例如,多面体启动子)的控制下。编码序列的成功插入将导致多面体基因的失活和非闭合重组病毒(即,缺乏由多面体基因编码的蛋白质包衣的病毒)的产生。这些重组病毒随后用于感染已表达插入基因的草地夜蛾细胞。(参见例如Smith等,(1983)J Virol 46:584;美国专利第4,215,051号)。这种表达系统的其他实例可见于Ausubel等编,(1989)Current Protocols in Molecular Biology,第2卷,Greene Publish.Assoc.&Wiley Interscience中。
可用于表达本发明蛋白质的另一种系统是谷氨酰胺合成酶基因表达系统,也称为“GS表达系统”(Lonza Biologics PLC,Berkshire UK)。这种表达系统详细描述于美国专利第5,981,216号中。
在哺乳动物宿主细胞中,可利用多种基于病毒的表达系统。在使用腺病毒作为表达载体的情况下,可将编码序列连接至腺病毒转录/翻译控制复合物,例如,后期启动子和三重前导序列。然后可通过体外或体内重组将这种嵌合基因插入腺病毒基因组中。插入病毒基因组的非必需区域(例如,区域E1或E3)中将产生有活力并且能够在感染宿主中表达肽的重组病毒。参见例如Logan和Shenk(1984)Proc Natl Acad Sci USA 81:3655)。或者,可使用牛痘7.5K启动子。参见例如Mackett等,(1982)Proc Natl Acad Sci USA 79:7415;Mackett等,(1984)J Virol 49:857;Panicali等,(1982)Proc Natl Acad Sci USA 79:4927。
为了增加产生效率,可设计聚核苷酸以编码由酶促裂解位点分离的本发明蛋白的多个单元。所得多肽可裂解(例如,通过用适当的酶处理)以回收多肽单元。这可以增加由单一启动子驱动的多肽的产率。当用于适当的病毒表达系统中时,在转录物中内部引导由mRNA编码的每种多肽的翻译;例如,通过内部核糖体进入位点IRES。因此,多顺反子构建体引导单一大型多顺反子mRNA的转录,而所述单一大型多顺反子mRNA又引导多个单独的多肽的翻译。这种方法消除了聚蛋白的产生和酶促加工并且可显著增加由单一启动子驱动的多肽的产率。
用于转化中的载体通常将含有用于鉴定转化株的可选择标记。在细菌系统中,这可以包括抗生素抗性基因,诸如胺苄青霉素或卡那霉素。用于被培养的哺乳动物细胞中的可选择标记包括赋予药物(诸如新霉素、潮霉素和甲氨蝶呤)以抗性的基因。可选择标记可以是可扩增的可选择标记。一种可扩增的可选择标记是二氢叶酸还原酶(DHFR)基因。Simonsen C C等,(1983)Proc Natl Acad Sci USA 80:2495-9。可选择标记由Thilly(1986)Mammalian Cell Technology,Butterworth Publishers,Stoneham,Mass.评述,并且可选择标记的选择完全处在本领域普通技术人员的技术水准内。
可选择标记可与目标基因同时引入另一种质粒上的细胞中,或它们可引入相同质粒上。如果处于相同质粒上,则可选择标记和目标基因可处在不同启动子或相同启动子的控制下,后者的排列产生双顺反子信息。这种类型的构建体是本领域中已知的(例如,美国专利第4,713,339号)。
表达载体可编码允许容易纯化重组产生的蛋白质的标签。实例包括(但不限于)载体pUR278(Ruther等,(1983)EMBO J 2:1791),其中有待表达的蛋白质的编码序列可连接至与lac z编码区同框的载体中,以便产生被标记的融合蛋白;可使用pGEX载体来表达具有麸胱甘肽S-转移酶(GST)标签的本发明蛋白质。这些蛋白质通常可溶并且可容易地通过吸附至麸胱甘肽-琼脂糖珠粒、接着在游离麸胱甘肽存在下洗脱而从细胞中纯化。所述载体包括用于在纯化后容易去除标签的裂解位点(凝血酶或因子Xa蛋白酶或PRESCISSIONPROTEASETM(Pharmacia,Peapack,N.J.))。
随后将一个或多个表达载体转染或共转染至合适的靶细胞中,其将表达多肽。本领域中已知的转染技术包括(但不限于)磷酸钙沉淀(Wigler等,(1978)Cell 14:725)、电穿孔(Neumann等,(1982)EMBO J 1:841)和基于脂质体的试剂。多种宿主-表达载体系统可用于表达本文所述的蛋白质,包括原核和真核细胞。这些包括(但不限于)微生物,诸如用含有适当编码序列的重组噬菌体DNA或质粒DNA表达载体转化的细菌(例如,大肠杆菌);用含有适当编码序列的重组酵母或真菌表达载体转化的酵母或丝状真菌;用含有适当编码序列的重组病毒表达载体(例如,杆状病毒)感染的昆虫细胞系统;用含有适当编码序列的重组病毒表达载体(例如,花椰菜花叶病毒或烟草花叶病毒)感染或用含有适当编码序列的重组质粒表达载体(例如,Ti质粒)转化的植物细胞系统;或动物细胞系统,包括哺乳动物细胞(例如,HEK 293、CHO、Cos、HeLa、HKB11和BHK细胞)。
在一个实施方案中,宿主细胞是真核细胞。如本文所用,真核细胞是指任何具有明确细胞核的动物或植物细胞。真核动物细胞包括脊椎动物(例如哺乳动物)的细胞,和无脊椎动物(例如,昆虫)的细胞。真核植物细胞特定可包括(但不限于)酵母细胞。真核细胞相异于原核细胞(例如,细菌)。
在某些实施方案中,真核细胞是哺乳动物细胞。哺乳动物细胞是源自哺乳动物的任何细胞。哺乳动物细胞特定包括(但不限于)哺乳动物细胞系。在一个实施方案中,哺乳动物细胞是人类细胞。在另一个实施方案中,哺乳动物细胞是HEK 293细胞,其是人类胚胎肾细胞系。HEK 293细胞可以CRL-1533获自American Type Culture Collection,Manassas,VA,并且以293-H细胞(目录号11631-017)或293-F细胞(目录号11625-019)获自Invitrogen(Carlsbad,Calif.)。在一些实施方案中,哺乳动物细胞是
Figure BDA0003162841480001061
细胞,其是源自视网膜的人类细胞系。
Figure BDA0003162841480001062
细胞可获自Crucell(Leiden,The Netherlands)。在其他实施方案中,哺乳动物细胞是人类仓鼠卵巢(CHO)细胞。CHO细胞可获自American Type CultureCollection,Manassas,VA(例如,CHO-K1;CCL-61)。在其他实施方案中,哺乳动物细胞是幼仓鼠肾(BHK)细胞。BHK细胞可获自American Type Culture Collection,Manassas,Va(例如,CRL-1632)。在一些实施方案中,哺乳动物细胞是HKB11细胞,其是HEK293细胞与人类B细胞系的杂交细胞系。Mei等,Mol.Biotechnol.34(2):165-78(2006)。
在一个实施方案中,编码VWF蛋白、VWF连接子、异源部分或本发明嵌合蛋白的质粒还包括可选择标记,例如,博莱霉素抗性,并且转染于HEK 293细胞中,以用于产生嵌合蛋白。
在其他实施方案中,转染细胞被稳定转染。使用本领域技术人员已知的常规技术,这些细胞可以被选择并维持为稳定细胞系。
含有蛋白质的DNA构建体的宿主细胞生长于适当生长培养基中。如本文所用,术语“适当的生长培养基”是指包含细胞生长所需的营养素的培养基。细胞生长所需的营养素可包括碳源、氮源、必要氨基酸、维生素、矿物和生长因子。任选地,培养基可含有一种或多种选择因子。任选地,培养基可含有牛血清或胎牛血清(FCS)。在一个实施方案中,培养基基本上不含IgG。生长培养基一般将针对含有DNA构建体的细胞进行选择,通过例如在由DNA构建体上的可选择标记补充或与DNA构建体共转染的必要营养素中的药物选择或其缺乏。被培养的哺乳动物细胞一般生长在市售含血清或不含血清的培养基(例如,MEM、DMEM、DMEM/F12)中。在一个实施方案中,培养基是CD293(Invitrogen,Carlsbad,CA.)。在另一个实施方案中,培养基是CD17(Invitrogen,Carlsbad,CA.)。适于所用特定细胞系的培养基的选择在本领域技术人员的技术水准内。
为了共表达如本文所述的嵌合分子的两个多肽链,宿主细胞在允许两个链表达的条件下培养。如本文所用,培养是指将活细胞在体外至少保持一段确定的时间。保持可以(但无需)包括活细胞群体的增加。例如,保持培养的细胞可以是静态群体,但仍存活并且能够产生所需产物,例如,重组蛋白或重组融合蛋白。用于培养真核细胞的合适条件是本领域中众所周知的并且包括培养基、培养基补充剂、温度、pH、氧饱和度等的适当选择。对于商业目的,培养可包括使用任何各种类型的规模扩大系统,包括震荡瓶、滚瓶、中空纤维生物反应器、搅拌槽生物反应器、气升式生物反应器、Wave生物反应器以及其他。
细胞培养条件还经过选择以允许嵌合分子中第一个链与第二个链的缔合。允许嵌合分子表达的条件可包括维生素K源的存在。例如,在一个实施方案中,将稳定转染的HEK293细胞培养在补充有4mM谷氨酰胺的CD293培养基(Invitrogen,Carlsbad,CA)或OptiCHO培养基(Invitrogen,Carlsbad,CA)中。
在一个方面,本发明针对表达、制备或产生嵌合蛋白的方法,其包括a)用编码嵌合分子的聚核苷酸转染宿主细胞和b)在适于表达嵌合分子的条件下在培养基中培养所述宿主细胞,其中所述嵌合分子被表达。
在其他实施方案中,含有嵌合分子的蛋白质产物分泌于培养基中。培养基从细胞中分离,浓缩,过滤并且然后穿过两个或三个亲和柱,例如,蛋白质A柱和一个或两个阴离子交换柱。
在某些方面,本发明涉及由本文所述的方法产生的嵌合多肽。
体外产生允许扩大规模以得到大量的本发明的所需变异多肽。在组织培养条件下用于哺乳动物细胞培养的技术是本领域中已知的并且包括均质悬浮培养,例如在气升式反应器中或在连续搅拌反应器中;或固定化或包埋细胞培养,例如在中空纤维、微囊中,在琼脂糖微珠粒或陶瓷滤筒上。必要时和/或需要时,可通过惯常色谱方法,例如凝胶过滤、离子交换色谱、疏水性相互作用色谱(HIC)、DEAE纤维素色谱或亲和色谱来纯化多肽的溶液。
本发明还包括改进包含与第一异源部分和XTEN序列融合的VWF蛋白和与第二异源部分融合的FVIII蛋白的嵌合FVIII蛋白的FVIII活性的方法,所述方法包括将VWF连接子插入所述VWF蛋白与所述第一异源部分之间,其中所述VWF连接子包含选自以下的多肽:(i)来自因子VIII(FVIII)的a2区域;(ii)来自FVIII的a1区域;(iii)来自FVIII的a3区域;(iv)包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或(v)其任何组合。在一些实施方案中,通过aPTT测定法或ROTEM测定法测量FVIII活性。
IV.药物组合物
含有本发明的嵌合分子的组合物可含有合适的药学上可接受的载体。例如,它们可含有促进将活性化合物加工成设计用于递送至作用部位的制剂的赋形剂和/或助剂。
药物组合物可被配制以通过团式注射进行肠胃外施用(即,静脉内、皮下或肌肉内)。用于注射的制剂可以单位剂型呈现,例如,于安瓿中或于具有外加防腐剂的多剂量容器中。组合物可采用诸如于油性或水性媒介物中的悬浮液、溶液或乳液形式,并且含有诸如悬浮剂、稳定剂和/或分散剂等配制剂。可选地,活性成分可呈粉末形式以用合适的媒介物(例如,无热原质的水)构造。
适于肠胃外施用的制剂还包括水溶性形式的活性化合物(例如,水溶性盐)的水溶液。另外,可施用呈适当的油性注射悬浮液形式的活性化合物悬浮液。合适的亲脂溶剂或媒介物包括脂肪油,例如芝麻油,或合成脂肪酸酯,例如油酸乙酯或三甘油酯。水性注射悬浮液可含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨糖醇和葡聚糖。任选地,悬浮液还可含有稳定剂。还可使用脂质体来囊封本发明的分子以递送至细胞或间隙空间中。示例性的药学上可接受的载体是生理学相容性溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗和吸收延迟剂、水、盐水、磷酸盐缓冲盐水、右旋糖、甘油、乙醇等。在一些实施方案中,组合物包含等渗剂,例如,糖、多元醇诸如甘露糖醇、山梨糖醇,或氯化钠。在其他实施方案中,组合物包含药学上可接受的物质诸如湿润剂或微量的助剂物质诸如湿润或乳化剂、防腐剂或缓冲剂,其增强活性成分的存放期或有效性。
本发明的组合物可呈多种形式,包括例如液体(例如,可注射和可输注溶液)、分散液、悬浮液、半固体和固体剂型。较佳形式取决于施用模式和治疗应用。
所述组合物可配制成溶液、微乳液、分散液、脂质体或适于高药物浓度的其他有序结构。可通过将所需量的活性成分与所需要的上文所列成分的一种或组合并入适当溶剂中,接着过滤灭菌来制备无菌可注射溶液。一般来说,通过将活性成分并入含有碱性分散介质和来自上文所列那些的所需其他成分的无菌媒介物中来制备分散液。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥,其得到活性成分粉末加上来自先前无菌过滤溶液的任何其他所需成分。可例如通过使用诸如卵磷脂等包衣,在分散液的情况下通过维持所需粒度和通过使用表面活性剂来维持溶液的适当流动性。可通过在组合物中包括延迟吸收剂(例如,单硬脂酸盐和明胶)来产生可注射组合物的延长吸收。
活性成分可用控制释放制剂或装置来配制。这些制剂和装置的实例包括植入物、经皮贴片和微囊封递送系统。可使用可生物降解的生物相容性聚合物,例如,乙烯-乙酸乙烯酯、聚酸酐、聚乙醇酸、胶原蛋白、聚原酸酯和聚乳酸。用于制备这些制剂和装置的方法是本领域中已知的。参见例如Sustained and Controlled Release Drug DeliverySystems,J.R.Robinson编,Marcel Dekker,Inc.,New York,1978。
可通过形成药物于可生物降解聚合物诸如聚丙交酯-聚乙交酯中的微囊封基质来制备可注射储槽式制剂。视药物与聚合物的比率和所用聚合物的性质而定,可控制药物释放速率。其他示例性的可生物降解聚合物是聚原酸酯和聚酸酐。还可通过将药物包埋在脂质体或微乳液中来制备储槽式可注射制剂。
补充性活性化合物可并入组合物中。在一个实施方案中,将本发明的嵌合分子与另一种凝血因子、或其变体、片段、类似物或衍生物一起配制。例如,凝血因子包括(但不限于)因子V、因子VII、因子VIII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原、血纤维蛋白原、温韦伯氏因子或重组可溶性组织因子(rsTF)或前述任一种的活化形式。止血剂的凝血因子还可包括抗纤维蛋白溶解药,例如,ε-氨基-己酸、氨甲环酸。
可调节给药方案以提供最佳所需反应。例如,可施用单一大丸剂,可随时间施用若干分次剂量,或可按照治疗情形的紧急程度所指示按比例降低或增加剂量。为了易于施用和剂量均匀性,宜将肠胃外组合物配制成单位剂型。参见例如Remington'sPharmaceutical Sciences(Mack Pub.Co.,Easton,Pa.1980)。
除活性化合物之外,液体剂型还可含有惰性成分,诸如水、乙醇、碳酸乙酯、乙酸乙酯、苄醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油类、甘油、四氢糠醇、聚乙二醇和脱水山梨糖醇脂肪酸酯。
合适的药学载体的非限制性实例也描述于E.W.Martin的Remington'sPharmaceutical Sciences中。赋形剂的一些实例包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、二醇、水、乙醇等。组合物还可含有pH缓冲试剂,和湿润或乳化剂。
对于经口施用,药物组合物可采用通过常规方式制备的片剂或胶囊形式。所述组合物还可制成液体形式,例如糖浆或悬浮液。所述液体可包括悬浮剂(例如,山梨糖醇糖浆、纤维素衍生物或氢化可食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒介物(例如,杏仁油、油性酯、乙醇或分馏植物油),和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可包括调味剂、着色剂和甜味剂。或者,所述组合物可呈现为用于用水或另一种合适媒介物构造的无水产品形式。
对于经颊施用,根据常规方案,组合物可采用片剂或糖锭形式。
对于通过吸入施用,根据本发明使用的化合物宜以具有或不具有赋形剂的喷雾气雾剂形式或以气雾剂喷雾形式从任选地具有推进剂的加压包或喷雾器递送,推进剂是例如二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他合适的气体。在加压气雾剂的情况下,可通过提供阀来确定计量单位以递送计量量。用于吸入器或吹入器中的例如明胶的胶囊和滤筒可被配制含有化合物与合适的粉末基质诸如乳糖或淀粉的粉末混合物。
药物组合物还可经配制以例如含有常规栓剂基质诸如可可脂或其他甘油酯的栓剂或保留灌肠剂形式经直肠施用。
V.基因疗法
本发明的嵌合分子可使用治疗出血性疾病或病症的基因治疗方法在哺乳动物(例如,人类患者)中体内产生,所述出血性疾病或病症选自出血凝血障碍、关节积血、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、创伤性头癣、胃肠道出血、颅内溢血、腹内溢血、胸内溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血或髋腰肌鞘中出血,其将是治疗上有益的。在一个实施方案中,出血性疾病或病症是血友病。在另一个实施方案中,出血性疾病或病症是A型血友病。这涉及施用可操作地连接至合适表达控制序列的编码合适嵌合分子的核酸。在某些实施方案中,这些序列被并入病毒载体中。适合这种基因疗法的病毒载体包括腺病毒载体、慢病毒载体、杆状病毒载体、爱泼斯坦-巴尔病毒载体、乳多空病毒载体、牛痘病毒载体、单纯疱疹病毒载体和腺相关病毒(AAV)载体。病毒载体可为复制缺陷型病毒载体。在其他实施方案中,腺病毒载体在其E1基因或E3基因中具有缺失。当使用腺病毒载体时,哺乳动物可能不暴露于编码可选择标记基因的核酸。在其他实施方案中,将序列并入本领域技术人员所知的非病毒载体中。
VI.嵌合蛋白的使用方法
本发明还提供使用本发明的嵌合分子降低有需要的受试者中出血事件的频率或程度的方法。示例性方法包括向所述有需要的受试者施用治疗有效量的本发明的嵌合分子。在其他方面,本发明包括使用本发明的嵌合分子预防有需要的受试者中出血事件的发生的方法。在其他方面,可向有需要的受试者施用包含编码本发明的重组蛋白的DNA的组合物。在本发明的某些方面中,可向有需要的受试者施用表达本发明的嵌合分子的细胞。在本发明的某些方面中,药物组合物包含(i)嵌合分子、(ii)编码嵌合分子的分离核酸、(iii)包含编码嵌合分子的核酸的载体、(iv)包含编码嵌合分子的分离核酸和/或包含编码嵌合分子的核酸的载体的细胞,或(v)其组合,并且所述药物组合物还包含可接受的赋形剂或载体。
出血事件可由凝血障碍造成或获得。凝血障碍还可称为凝血功能异常。在一个实例中,可用本公开的药物组合物治疗的凝血障碍是血友病或von Willebrand病(vWD)。在另一个实例中,可用本公开的药物组合物治疗的凝血障碍是A型血友病。
在一些实施方案中,与出血性病状相关的出血类型选自关节积血、肌肉出血、口腔出血、溢血、溢血进入肌肉、口腔溢血、创伤、创伤性头癣、胃肠道出血、颅内溢血、腹内溢血、胸内溢血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髋腰肌鞘中出血或其任何组合。
在其他实施方案中,罹患出血性病状的受试者需要手术治疗,包括例如手术预防或围手术期管理。在一个实例中,手术选自小手术和大手术。示例性外科手术包括拔牙、扁桃体切除术、腹股沟疝切开术、滑膜切除术、开颅手术、骨接合术、创伤手术、颅内手术、腹腔内手术、胸内手术、关节置换手术(例如,全膝关节置换、髋关节置换等)、心脏手术和剖宫产术。
在另一个实例中,用因子IX伴随治疗受试者。由于本发明化合物能够活化FIXa,因此其可用于在向受试者施用FIXa之前预活化FIXa多肽。
可向需要预防治疗或按需治疗的受试者实践本发明的方法。
包含本发明嵌合分子的药物组合物可被配制用于任何适当施用方式,包括例如局部(例如,经皮或经眼)、经口、经颊、经鼻、经阴道、经直肠或肠胃外施用。
如本文所用的术语肠胃外包括皮下、皮内、血管内(例如,静脉内)、肌肉内、脊柱、颅内、鞘内、眼内、眼周、眼眶内、滑膜内和腹膜内注射,以及任何类似注射或输注技术。组合物还可以是例如悬浮液、乳液、持续释放制剂、乳膏、凝胶或散剂。组合物可被配制为具有传统粘合剂和载体诸如三甘油酯的栓剂。
现已详细描述本发明,通过参考以下实施例将更清楚地理解本发明,所述实施例仅出于说明目的包括于本发明而不旨在限制本发明。本文提及的所有专利和出版物是以引用的方式明确并入。
实施例
在整个实施例中,除非另外说明,否则使用以下材料和方法。
材料和方法
一般来说,除非另外说明,否则本发明的实践使用常规化学、生物物理学、分子生物学、重组DNA技术、免疫学技术(尤其是例如抗体技术),以及标准电泳技术。参见例如Sambrook,Fritsch和Maniatis,Molecular Cloning:Cold Spring Harbor LaboratoryPress(1989);Antibody Engineering Protocols(Methods in Molecular Biology),510,Paul,S.,Humana Pr(1996);Antibody Engineering:A Practical Approach(PracticalApproach Series,169),McCafferty编,Irl Pr(1996);Antibodies:A LaboratoryManual,Harlow等,CS.H.L.Press,Pub.(1999);和Current Protocols in MolecularBiology,Ausubel等编,John Wiley&Sons(1992)。
实施例1.评估各种VWF构建体的凝血酶介导性D'D3释放
本实施例评估图2中所提及的各种VWF构建体在37℃下的凝血酶介导性D'D3释放的动力学。用在VWF的D'D3结构域与Fc之间含有不同凝血酶可裂解连接子的VWF-Fc构建体来进行Biocore实验。最终目的在于将从VWF-Fc凝血酶消化采集的信息应用于如本文所述的FVIII-VWF异质二聚体。所有VWF-D'D3构建体都在芯片上操作以实现在100-700RU范围内的蛋白质捕捉密度。在芯片上捕捉VWF构建体之后,将5U/ml凝血酶注射在表面上持续5分钟。Fc保持结合于芯片,而可裂解构建体中的D'D3得以释放。如图3和图4中所示绘制速率(RU/s)对捕捉密度(RU)的曲线。清除速率与起始捕捉密度成正比,而斜率提供每种构建体的凝血酶裂解易感性的量度。
图3示出如所预期的VWF-052(其在连接子区域中不具有凝血酶裂解位点)并未由凝血酶裂解。VWF-039(具有PAR1位点的LVPR)的速率与FVIII裂解速率相当(数据未示出)。因此,VWF-039充当从Fc完全释放D'D3的基准。使用各种VWF-Fc构建体相对于VWF-039的斜率的比率来测定凝血酶裂解效率。用凝血酶使VWF-039(具有PAR1位点的LVPR)裂解的速率是VWF-031(LVPR)的约70-80倍。VWF-51(ALRPRVV)的裂解速率是VWF-031(LVPR)的1.8倍。沿着LVPR位点含有288XTEN的VWF-034相比于VWF-031显示较缓慢的裂解。
还通过在连接子区域中引入FVIII蛋白的不同酸性区域(a1、a2和a3)来制得VWF-Fc构建体。VWF-055(其在D'D3与Fc区之间含有a2区域)显示与VWF-039构建体类似的凝血酶裂解。如图4中所示,VWF-054(a1区域)和VWF-056(a3区域)显示约5倍降低的凝血酶裂解。
图5显示不同VWF构建体的凝血酶裂解曲线的斜率值。根据这些结果,FVIII的酸性区域2(a2)似乎是高效凝血酶裂解位点并且并入如本文所述的FVIII-VWF异质二聚体中。
实施例2.利用HemA患者全血ROTEM测定法评估FVIII/VWFD'D3异质二聚体的止血效能
在HemA供体全血旋转血栓弹力测定(rotational thromboelastometry,ROTEM)测定法中评估含有不同凝血酶可裂解连接子的FVIII/VWFD'D3异质二聚体的止血效能。利用柠檬酸钠作为抗凝血剂,从患有重度A型血友病出血障碍的供体采集全血样品。在血样采集后40分钟,将含有不同凝血酶可裂解连接子-FVIII155/VWF031(48aa,LVPR位点)、FVIII155/VWF039(26aa,LVPR+PAR1位点)、FVIII155/VWF055(34aa,来自FVIII的a2)的FVIII/VWFD'D3异质二聚体变体稀释在全血样品中至最终浓度为正常值的100%、30%、10%和3%,如通过FVIII显色测定法所测量。在添加FVIII/VWFD'D3异质二聚体之后不久,通过添加CaCl2来起始ROTEM反应。通过仪器记录凝血时间(从测试开始至达到2mm幅值的时间)并且针对样品中的FVIII浓度绘制曲线(图6)。假定更有效的FVIII/VWFD'D3异质二聚体将诱导更快的凝血过程,因此导致相比于效力较低的FVIII/VWFD'D3异质二聚体的凝血时间较短。如图6中所示,添加有FVIII/VWF039异质二聚体的样品在已经测试的所有浓度下都具有最短的凝血时间,并且添加有FVIII/VWF031异质二聚体的样品在所有浓度下都具有最长的凝血时间。添加有FVIII155/VWF055异质二聚体的样品的凝血时间居中。因此,止血效能等级为FVIII155/VWF039>FVIII155/VWF055>FVIII155/VWF031。由于所述三种分子之间的唯一差异在于VWF蛋白与Fc区之间的凝血酶可裂解连接子,因此结果指示含有LVPR位点和PAR1外位点相互作用基序和FVIII的a2区域的连接子相比于仅含有LVPR位点的连接子的作用更佳。
实施例3.评估FVIII/VWF异质二聚体的活性
使用以下三种质粒将FVIII-XTEN/VWF异质二聚体构建体转染于HEK293F细胞中:第一表达FVIII-XTEN-Fc、第二表达VWF-XTEN-Fc和第三表达PACE。使用聚乙烯亚胺(PEI)标准方案进行转染并且在转染5天后,收集组织培养基。从所述培养基纯化FVIII-VWF异质二聚体的各种组合。使用标准方案在显色(两阶段)和aPTT(一阶段)凝血测定法中测试纯化蛋白质的活性。将FVIII的酸性区域2(a2)引入FVIII与Fc之间或D′D3与Fc之间(如表7A和图7中所示)可改进FVIII-VWF异质二聚体的aPTT活性,如表7C中所示。例如,FVIII169/VWF059异质二聚体在D′D3-Fc连接子区域中具有a2凝血酶裂解位点并且具有比FVIII169/VWF057更好的aPTT活性,所述FVIII169/VWF057在D′D3Fc连接子中含有LVPR凝血酶位点,如表7C中所示。
类似地,将a2区域并入FVIII与Fc之间可增加异质二聚体的一阶段凝血活性,如由表7B中所示的FVIII286/VWF059和FVIII286/VWF062的改进的显色/aPTT比所示。
表7A
序号 构建体 FVIII与Fc(aa)之间的连接子长度 连接子中的凝血酶位点
1 FVIII169 -
2 FVIII286 32 FVIII-a2
序号 构建体 D′D3与Fc(aa)之间的连接子长度 连接子中的凝血酶位点
1 VWF057 144AE XTEN+35+LVPR LVPR
2 VWF059 144AE XTEN+32 FVIII-a2
3 VWF062 144AE XTEN
表7B
构建体 显色/aPTT比
FVIII169/VWF057 2.51
FVIII169/VWF059 1.67
FVIII169/VWF0622 2.7
FVIII286/VWF059 0.69
FVIII286/VWF062 0.83
表7C
Figure BDA0003162841480001181
实施例4:FVIII-XTEN-Fc/D'D3-XTEN-Fc异质二聚体在HemA小鼠尾部剪断出血模型中的急性功效
使用HemA小鼠尾部剪断出血模型评估含有不同凝血酶可裂解连接子的异质二聚体的急性功效。
将8-12周龄雄性HemA小鼠随机分配至5个治疗组,并且分别用SQ BDD-FVIII、rFVIII169/VWF034、rFVIII169/VWF057、rFVIII169/VWF059或媒介物溶液的单次静脉内施用来治疗。为了模拟FVIII的情形治疗(以重构50-100%的正常FVIII血浆含量),如通过FVIII aPTT活性所测量,所选FVIII治疗剂量是75IU/kg。在这个剂量水平下,所有测试FVIII变体将在给药后5分钟重构约70%的正常鼠类血浆FVIII活性。
如下进行尾部剪断程序。简言之,在尾部损伤前用50mg/kg氯胺酮/0.5mg/kg右美托咪定混合液麻醉小鼠并且将其放置在37℃加热垫上以帮助维持体温。然后将小鼠尾部浸于37℃盐水中持续10分钟以扩张侧静脉。在静脉扩张后,经由尾静脉注射FVIII变体或媒介物溶液并且然后在给药后5分钟使用直边#11解剖刀切掉尾部末端5mm。将流出的血收集在13ml的37℃盐水中持续30分钟并且通过血液收集管的重量变化确定失血量:失血量=(收集管最终重量-开始重量+0.10)ml。使用t检验(Kolmogorov-Smirnov检验)和单因子ANOVA(KRUSKAL-Wallis检验,后检验:Dunns多重比较检验)进行统计分析。
将研究中每个单独的动物的失血量绘制于图8中。观测到所有FVIII治疗组相比于媒介物处理动物的失血量显著减少(p<0.05,表8)。从所有异质二聚体治疗组观测到相比于BDD-FVIII治疗的类似失血减少(p>0.5,表8),表明对于按需治疗,异质二聚体分子可潜在地与SQ BDD-FVIII同样有效。
表8:Kolmogorov-Smirnov检验的P值
FVIII169/VWF034 FVIII169/VWF057 FVIII169/VWF059
BDD-FVIII 0.7591 0.9883 0.5176
媒介物 0.0006 0.0006 0.0266
pSYN VWF057核苷酸序列(连接子中具有LVPR凝血酶位点的VWF D'D3-Fc)(SEQ ID NO:79)
Figure BDA0003162841480001191
Figure BDA0003162841480001201
Figure BDA0003162841480001211
pSYN VWF057蛋白质序列(连接子中具有LVPR凝血酶位点的VWF D'D3-Fc):粗体下 划线区域显示含有连接子区域的凝血酶可裂解LVPR(SEQ ID NO:80)
Figure BDA0003162841480001212
pSYN VWF059核苷酸序列(连接子中具有酸性区域2(a2)凝血酶位点的VWF D'D3- Fc)(SEQ ID NO:81)
Figure BDA0003162841480001221
Figure BDA0003162841480001231
pSYN VWF059蛋白质序列(连接子中具有LVPR凝血酶位点的VWF D'D3-Fc)–粗体下 划线区域显示a2区域(SEQ ID NO:82)
Figure BDA0003162841480001232
Figure BDA0003162841480001241
pSYN VWF062核苷酸序列(连接子中不具有凝血酶位点的VWF D′D3-Fc)(SEQ ID NO:83)
Figure BDA0003162841480001242
Figure BDA0003162841480001251
Figure BDA0003162841480001261
pSYN VWF062蛋白质序列(连接子中不具有凝血酶位点的VWF D′D3-Fc)(SEQ ID NO:84)
Figure BDA0003162841480001262
pSYN FVIII 286核苷酸序列(FVIII与Fc之间具有另一个a2区域的FVIII-Fc)(SEQ ID NO:85)
Figure BDA0003162841480001271
Figure BDA0003162841480001281
pSYN FVIII 286蛋白质序列(FVIII与Fc之间具有另一个a2区域的FVIII-Fc;以粗 体和下划线显示)(SEQ ID NO:86)
Figure BDA0003162841480001291
FVIII 169核苷酸序列(SEQ ID NO:87)
Figure BDA0003162841480001292
Figure BDA0003162841480001301
Figure BDA0003162841480001311
FVIII 169蛋白质序列(SEQ ID NO:88)
Figure BDA0003162841480001321
VWF034核苷酸序列(SEQ ID NO:91)
Figure BDA0003162841480001322
Figure BDA0003162841480001331
Figure BDA0003162841480001341
VWF034蛋白质序列(SEQ ID NO:92)
Figure BDA0003162841480001351
特定实施方案的前述描述将完全揭示本发明的一般性质,以使得其他人在无需过多实验并且不偏离本发明的一般概念的情况下,通过应用本领域技能范围内的知识而容易地针对各种应用来修改和/或改适这些特定实施方案。因此,基于本文呈现的教导和指导,所述改适和修改旨在是在所公开实施方案的等效物的含义和范围内。应了解,本文的短语或术语是出于描述目的而非限制目的,因此本领域技术人员应鉴于教导和指导来理解本说明书的术语或短语。
根据对本文公开的本发明的说明书和实践的考虑,本发明的其他实施方案对于本领域技术人员将是显而易见的。预期本说明书和实施例应理解为仅具示例性,而本发明的真实范围和精神是由以下权利要求书指示。
本文引用的所有专利和出版物是以全文引用的方式并入本文中。
本申请要求2013年6月28日提交的美国临时专利申请第61/840,872号的优先权。上述申请的内容是以全文引用的方式并入本文中。
序列表
<110> 比奥贝拉蒂治疗公司
<120> 具有XTEN的凝血酶可裂解连接子和其用途
<130> 2159.420PC01
<140> 待受让
<141> 2014-06-27
<150> 61/840,872
<151> 2013-06-28
<160> 92
<170> PatentIn 3.5版
<210> 1
<211> 8442
<212> DNA
<213> 智人
<400> 1
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcrgagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgcctgcttc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gagtgtgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
ggaggcctgg tggtgcctcc cacagatgcc ccggtgagcc ccaccactct gtatgtggag 3780
gacatctcgg aaccgccgtt gcacgatttc tactgcagca ggctactgga cctggtcttc 3840
ctgctggatg gctcctccag gctgtccgag gctgagtttg aagtgctgaa ggcctttgtg 3900
gtggacatga tggagcggct gcgcatctcc cagaagtggg tccgcgtggc cgtggtggag 3960
taccacgacg gctcccacgc ctacatcggg ctcaaggacc ggaagcgacc gtcagagctg 4020
cggcgcattg ccagccaggt gaagtatgcg ggcagccagg tggcctccac cagcgaggtc 4080
ttgaaataca cactgttcca aatcttcagc aagatcgacc gccctgaagc ctcccgcatc 4140
gccctgctcc tgatggccag ccaggagccc caacggatgt cccggaactt tgtccgctac 4200
gtccagggcc tgaagaagaa gaaggtcatt gtgatcccgg tgggcattgg gccccatgcc 4260
aacctcaagc agatccgcct catcgagaag caggcccctg agaacaaggc cttcgtgctg 4320
agcagtgtgg atgagctgga gcagcaaagg gacgagatcg ttagctacct ctgtgacctt 4380
gcccctgaag cccctcctcc tactctgccc cccgacatgg cacaagtcac tgtgggcccg 4440
gggctcttgg gggtttcgac cctggggccc aagaggaact ccatggttct ggatgtggcg 4500
ttcgtcctgg aaggatcgga caaaattggt gaagccgact tcaacaggag caaggagttc 4560
atggaggagg tgattcagcg gatggatgtg ggccaggaca gcatccacgt cacggtgctg 4620
cagtactcct acatggtgac cgtggagtac cccttcagcg aggcacagtc caaaggggac 4680
atcctgcagc gggtgcgaga gatccgctac cagggcggca acaggaccaa cactgggctg 4740
gccctgcggt acctctctga ccacagcttc ttggtcagcc agggtgaccg ggagcaggcg 4800
cccaacctgg tctacatggt caccggaaat cctgcctctg atgagatcaa gaggctgcct 4860
ggagacatcc aggtggtgcc cattggagtg ggccctaatg ccaacgtgca ggagctggag 4920
aggattggct ggcccaatgc ccctatcctc atccaggact ttgagacgct cccccgagag 4980
gctcctgacc tggtgctgca gaggtgctgc tccggagagg ggctgcagat ccccaccctc 5040
tcccctgcac ctgactgcag ccagcccctg gacgtgatcc ttctcctgga tggctcctcc 5100
agtttcccag cttcttattt tgatgaaatg aagagtttcg ccaaggcttt catttcaaaa 5160
gccaatatag ggcctcgtct cactcaggtg tcagtgctgc agtatggaag catcaccacc 5220
attgacgtgc catggaacgt ggtcccggag aaagcccatt tgctgagcct tgtggacgtc 5280
atgcagcggg agggaggccc cagccaaatc ggggatgcct tgggctttgc tgtgcgatac 5340
ttgacttcag aaatgcatgg tgccaggccg ggagcctcaa aggcggtggt catcctggtc 5400
acggacgtct ctgtggattc agtggatgca gcagctgatg ccgccaggtc caacagagtg 5460
acagtgttcc ctattggaat tggagatcgc tacgatgcag cccagctacg gatcttggca 5520
ggcccagcag gcgactccaa cgtggtgaag ctccagcgaa tcgaagacct ccctaccatg 5580
gtcaccttgg gcaattcctt cctccacaaa ctgtgctctg gatttgttag gatttgcatg 5640
gatgaggatg ggaatgagaa gaggcccggg gacgtctgga ccttgccaga ccagtgccac 5700
accgtgactt gccagccaga tggccagacc ttgctgaaga gtcatcgggt caactgtgac 5760
cgggggctga ggccttcgtg ccctaacagc cagtcccctg ttaaagtgga agagacctgt 5820
ggctgccgct ggacctgccc ctgygtgtgc acaggcagct ccactcggca catcgtgacc 5880
tttgatgggc agaatttcaa gctgactggc agctgttctt atgtcctatt tcaaaacaag 5940
gagcaggacc tggaggtgat tctccataat ggtgcctgca gccctggagc aaggcagggc 6000
tgcatgaaat ccatcgaggt gaagcacagt gccctctccg tcgagstgca cagtgacatg 6060
gaggtgacgg tgaatgggag actggtctct gttccttacg tgggtgggaa catggaagtc 6120
aacgtttatg gtgccatcat gcatgaggtc agattcaatc accttggtca catcttcaca 6180
ttcactccac aaaacaatga gttccaactg cagctcagcc ccaagacttt tgcttcaaag 6240
acgtatggtc tgtgtgggat ctgtgatgag aacggagcca atgacttcat gctgagggat 6300
ggcacagtca ccacagactg gaaaacactt gttcaggaat ggactgtgca gcggccaggg 6360
cagacgtgcc agcccatcct ggaggagcag tgtcttgtcc ccgacagctc ccactgccag 6420
gtcctcctct taccactgtt tgctgaatgc cacaaggtcc tggctccagc cacattctat 6480
gccatctgcc agcaggacag ttgccaccag gagcaagtgt gtgaggtgat cgcctcttat 6540
gcccacctct gtcggaccaa cggggtctgc gttgactgga ggacacctga tttctgtgct 6600
atgtcatgcc caccatctct ggtctacaac cactgtgagc atggctgtcc ccggcactgt 6660
gatggcaacg tgagctcctg tggggaccat ccctccgaag gctgtttctg ccctccagat 6720
aaagtcatgt tggaaggcag ctgtgtccct gaagaggcct gcactcagtg cattggtgag 6780
gatggagtcc agcaccagtt cctggaagcc tgggtcccgg accaccagcc ctgtcagatc 6840
tgcacatgcc tcagcgggcg gaaggtcaac tgcacaacgc agccctgccc cacggccaaa 6900
gctcccacgt gtggcctgtg tgaagtagcc cgcctccgcc agaatgcaga ccagtgctgc 6960
cccgagtatg agtgtgtgtg tgacccagtg agctgtgacc tgcccccagt gcctcactgt 7020
gaacgtggcc tccagcccac actgaccaac cctggcgagt gcagacccaa cttcacctgc 7080
gcctgcagga aggaggagtg caaaagagtg tccccaccct cctgcccccc gcaccgtttg 7140
cccacccttc ggaagaccca gtgctgtgat gagtatgagt gtgcctgcaa ctgtgtcaac 7200
tccacagtga gctgtcccct tgggtacttg gcctcaaccg ccaccaatga ctgtggctgt 7260
accacaacca cctgccttcc cgacaaggtg tgtgtccacc gaagcaccat ctaccctgtg 7320
ggccagttct gggaggaggg ctgcgatgtg tgcacctgca ccgacatgga ggatgccgtg 7380
atgggcctcc gcgtggccca gtgctcccag aagccctgtg aggacagctg tcggtcgggc 7440
ttcacttacg ttctgcatga aggcgagtgc tgtggaaggt gcctgccatc tgcctgtgag 7500
gtggtgactg gctcaccgcg gggggactcc cagtcttcct ggaagagtgt cggctcccag 7560
tgggcctccc cggagaaccc ctgcctcatc aatgagtgtg tccgagtgaa ggaggaggtc 7620
tttatacaac aaaggaacgt ctcctgcccc cagctggagg tccctgtctg cccctcgggc 7680
tttcagctga gctgtaagac ctcagcgtgc tgcccaagct gtcgctgtga gcgcatggag 7740
gcctgcatgc tcaatggcac tgtcattggg cccgggaaga ctgtgatgat cgatgtgtgc 7800
acgacctgcc gctgcatggt gcaggtgggg gtcatctctg gattcaagct ggagtgcagg 7860
aagaccacct gcaacccctg ccccctgggt tacaaggaag aaaataacac aggtgaatgt 7920
tgtgggagat gtttgcctac ggcttgcacc attcagctaa gaggaggaca gatcatgaca 7980
ctgaagcgtg atgagacgct ccaggatggc tgtgatactc acttctgcaa ggtcaatgag 8040
agaggagagt acttctggga gaagagggtc acaggctgcc caccctttga tgaacacaag 8100
tgtcttgctg agggaggtaa aattatgaaa attccaggca cctgctgtga cacatgtgag 8160
gagcctgagt gcaacgacat cactgccagg ctgcagtatg tcaaggtggg aagctgtaag 8220
tctgaagtag aggtggatat ccactactgc cagggcaaat gtgccagcaa agccatgtac 8280
tccattgaca tcaacgatgt gcaggaccag tgctcctgct gctctccgac acggacggag 8340
cccatgcagg tggccctgca ctgcaccaat ggctctgttg tgtaccatga ggttctcaat 8400
gccatggagt gcaaatgctc ccccaggaag tgcagcaagt ga 8442
<210> 2
<211> 2813
<212> PRT
<213> 智人
<220>
<221> MISC_FEATURE
<222> (2016)..(2016)
<223> 其中Xaa可能是除半胱氨酸之外的任何氨基酸
<400> 2
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr
1235 1240 1245
Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser
1250 1255 1260
Glu Pro Pro Leu His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu
1265 1270 1275
Val Phe Leu Leu Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe
1280 1285 1290
Glu Val Leu Lys Ala Phe Val Val Asp Met Met Glu Arg Leu Arg
1295 1300 1305
Ile Ser Gln Lys Trp Val Arg Val Ala Val Val Glu Tyr His Asp
1310 1315 1320
Gly Ser His Ala Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser
1325 1330 1335
Glu Leu Arg Arg Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln
1340 1345 1350
Val Ala Ser Thr Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile
1355 1360 1365
Phe Ser Lys Ile Asp Arg Pro Glu Ala Ser Arg Ile Ala Leu Leu
1370 1375 1380
Leu Met Ala Ser Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val
1385 1390 1395
Arg Tyr Val Gln Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro
1400 1405 1410
Val Gly Ile Gly Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile
1415 1420 1425
Glu Lys Gln Ala Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val
1430 1435 1440
Asp Glu Leu Glu Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys
1445 1450 1455
Asp Leu Ala Pro Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met
1460 1465 1470
Ala Gln Val Thr Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu
1475 1480 1485
Gly Pro Lys Arg Asn Ser Met Val Leu Asp Val Ala Phe Val Leu
1490 1495 1500
Glu Gly Ser Asp Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys
1505 1510 1515
Glu Phe Met Glu Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp
1520 1525 1530
Ser Ile His Val Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val
1535 1540 1545
Glu Tyr Pro Phe Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln
1550 1555 1560
Arg Val Arg Glu Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr
1565 1570 1575
Gly Leu Ala Leu Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser
1580 1585 1590
Gln Gly Asp Arg Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr
1595 1600 1605
Gly Asn Pro Ala Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile
1610 1615 1620
Gln Val Val Pro Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu
1625 1630 1635
Leu Glu Arg Ile Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp
1640 1645 1650
Phe Glu Thr Leu Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg
1655 1660 1665
Cys Cys Ser Gly Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala
1670 1675 1680
Pro Asp Cys Ser Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly
1685 1690 1695
Ser Ser Ser Phe Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe
1700 1705 1710
Ala Lys Ala Phe Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr
1715 1720 1725
Gln Val Ser Val Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val
1730 1735 1740
Pro Trp Asn Val Val Pro Glu Lys Ala His Leu Leu Ser Leu Val
1745 1750 1755
Asp Val Met Gln Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala
1760 1765 1770
Leu Gly Phe Ala Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala
1775 1780 1785
Arg Pro Gly Ala Ser Lys Ala Val Val Ile Leu Val Thr Asp Val
1790 1795 1800
Ser Val Asp Ser Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn
1805 1810 1815
Arg Val Thr Val Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala
1820 1825 1830
Ala Gln Leu Arg Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val
1835 1840 1845
Val Lys Leu Gln Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu
1850 1855 1860
Gly Asn Ser Phe Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile
1865 1870 1875
Cys Met Asp Glu Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp
1880 1885 1890
Thr Leu Pro Asp Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly
1895 1900 1905
Gln Thr Leu Leu Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu
1910 1915 1920
Arg Pro Ser Cys Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu
1925 1930 1935
Thr Cys Gly Cys Arg Trp Thr Cys Pro Cys Val Cys Thr Gly Ser
1940 1945 1950
Ser Thr Arg His Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu
1955 1960 1965
Thr Gly Ser Cys Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp
1970 1975 1980
Leu Glu Val Ile Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg
1985 1990 1995
Gln Gly Cys Met Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser
2000 2005 2010
Val Glu Xaa His Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu
2015 2020 2025
Val Ser Val Pro Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr
2030 2035 2040
Gly Ala Ile Met His Glu Val Arg Phe Asn His Leu Gly His Ile
2045 2050 2055
Phe Thr Phe Thr Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser
2060 2065 2070
Pro Lys Thr Phe Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys
2075 2080 2085
Asp Glu Asn Gly Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val
2090 2095 2100
Thr Thr Asp Trp Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg
2105 2110 2115
Pro Gly Gln Thr Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val
2120 2125 2130
Pro Asp Ser Ser His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala
2135 2140 2145
Glu Cys His Lys Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys
2150 2155 2160
Gln Gln Asp Ser Cys His Gln Glu Gln Val Cys Glu Val Ile Ala
2165 2170 2175
Ser Tyr Ala His Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp
2180 2185 2190
Arg Thr Pro Asp Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val
2195 2200 2205
Tyr Asn His Cys Glu His Gly Cys Pro Arg His Cys Asp Gly Asn
2210 2215 2220
Val Ser Ser Cys Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro
2225 2230 2235
Pro Asp Lys Val Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala
2240 2245 2250
Cys Thr Gln Cys Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu
2255 2260 2265
Glu Ala Trp Val Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys
2270 2275 2280
Leu Ser Gly Arg Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr
2285 2290 2295
Ala Lys Ala Pro Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg
2300 2305 2310
Gln Asn Ala Asp Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp
2315 2320 2325
Pro Val Ser Cys Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly
2330 2335 2340
Leu Gln Pro Thr Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe
2345 2350 2355
Thr Cys Ala Cys Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro
2360 2365 2370
Ser Cys Pro Pro His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys
2375 2380 2385
Cys Asp Glu Tyr Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val
2390 2395 2400
Ser Cys Pro Leu Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys
2405 2410 2415
Gly Cys Thr Thr Thr Thr Cys Leu Pro Asp Lys Val Cys Val His
2420 2425 2430
Arg Ser Thr Ile Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys
2435 2440 2445
Asp Val Cys Thr Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu
2450 2455 2460
Arg Val Ala Gln Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg
2465 2470 2475
Ser Gly Phe Thr Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg
2480 2485 2490
Cys Leu Pro Ser Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly
2495 2500 2505
Asp Ser Gln Ser Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser
2510 2515 2520
Pro Glu Asn Pro Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu
2525 2530 2535
Glu Val Phe Ile Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu
2540 2545 2550
Val Pro Val Cys Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser
2555 2560 2565
Ala Cys Cys Pro Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met
2570 2575 2580
Leu Asn Gly Thr Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp
2585 2590 2595
Val Cys Thr Thr Cys Arg Cys Met Val Gln Val Gly Val Ile Ser
2600 2605 2610
Gly Phe Lys Leu Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro
2615 2620 2625
Leu Gly Tyr Lys Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg
2630 2635 2640
Cys Leu Pro Thr Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile
2645 2650 2655
Met Thr Leu Lys Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr
2660 2665 2670
His Phe Cys Lys Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys
2675 2680 2685
Arg Val Thr Gly Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala
2690 2695 2700
Glu Gly Gly Lys Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr
2705 2710 2715
Cys Glu Glu Pro Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr
2720 2725 2730
Val Lys Val Gly Ser Cys Lys Ser Glu Val Glu Val Asp Ile His
2735 2740 2745
Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp
2750 2755 2760
Ile Asn Asp Val Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg
2765 2770 2775
Thr Glu Pro Met Gln Val Ala Leu His Cys Thr Asn Gly Ser Val
2780 2785 2790
Val Tyr His Glu Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro
2795 2800 2805
Arg Lys Cys Ser Lys
2810
<210> 3
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 凝血酶裂解位点
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 其中X是脂族氨基酸
<400> 3
Xaa Val Pro Arg
1
<210> 4
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> a2区域
<400> 4
Ile Ser Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser Tyr Glu Asp
1 5 10 15
Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu Pro Arg Ser
20 25 30
Phe Ser
<210> 5
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> a1区域
<400> 5
Ile Ser Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu
1 5 10 15
Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro
20 25 30
Ser Phe Ile Gln Ile Arg Ser Val
35 40
<210> 6
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> a3区域
<400> 6
Ile Ser Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
1 5 10 15
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
20 25 30
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln
35 40 45
<210> 7
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 7
Ser Phe Leu Leu Arg Asn
1 5
<210> 8
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 8
Pro Asn Asp Lys
1
<210> 9
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 9
Pro Asn Asp Lys Tyr
1 5
<210> 10
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 10
Pro Asn Asp Lys Tyr Glu
1 5
<210> 11
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 11
Pro Asn Asp Lys Tyr Glu Pro
1 5
<210> 12
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 12
Pro Asn Asp Lys Tyr Glu Pro Phe
1 5
<210> 13
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 13
Pro Asn Asp Lys Tyr Glu Pro Phe Trp
1 5
<210> 14
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 14
Pro Asn Asp Lys Tyr Glu Pro Phe Trp Glu
1 5 10
<210> 15
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 信号肽
<400> 15
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser
<210> 16
<211> 2332
<212> PRT
<213> 智人
<400> 16
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 17
<211> 7053
<212> DNA
<213> 智人
<400> 17
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340
ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400
atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460
gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520
cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580
catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640
aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700
tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760
agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820
tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880
aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940
aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct 3000
gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac 3060
aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta 3120
attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa 3180
gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta 3240
aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa 3300
gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc 3360
ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg 3420
caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag 3480
aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta 3540
ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat 3600
ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag 3660
gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag 3720
aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac 3780
ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca 3840
aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga 3900
aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca 3960
agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca 4020
ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc 4080
aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag 4140
aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct 4200
caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct 4260
atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat 4320
agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat 4380
aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc 4440
ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg 4500
aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat 4560
cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg 4620
gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct 4680
ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta 4740
ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa 4800
tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg 4860
aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa 4920
atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca 4980
gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa 5040
attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 5100
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 5160
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 5220
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 5280
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 5340
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 5400
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 5460
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 5520
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 5580
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 5640
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 5700
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 5760
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 5820
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 5880
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 5940
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 6000
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 6060
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 6120
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 6180
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 6240
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 6300
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 6360
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 6420
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 6480
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 6540
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 6600
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 6660
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 6720
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 6780
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 6840
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 6900
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 6960
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 7020
gaggttctgg gctgcgaggc acaggacctc tac 7053
<210> 18
<211> 1438
<212> PRT
<213> 人工序列
<220>
<223> B结构域缺失的FVIII
<400> 18
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 19
<211> 4371
<212> DNA
<213> 人工序列
<220>
<223> B结构域缺失的FVIII
<400> 19
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371
<210> 20
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 20
Pro Asn Asp Lys Tyr Glu Pro Phe Trp Glu Asp
1 5 10
<210> 21
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 21
Pro Asn Asp Lys Tyr Glu Pro Phe Trp Glu Asp Glu
1 5 10
<210> 22
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 22
Pro Asn Asp Lys Tyr Glu Pro Phe Trp Glu Asp Glu Glu
1 5 10
<210> 23
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> PAR1外位点相互作用基序
<400> 23
Pro Asn Asp Lys Tyr Glu Pro Phe Trp Glu Asp Glu Glu Ser
1 5 10
<210> 24
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> VWF连接子
<400> 24
Gly Gly Leu Val Pro Arg Ser Phe Leu Leu Arg Asn Pro Asn Asp Lys
1 5 10 15
Tyr Glu Pro Phe Trp Glu Asp Glu Glu Ser
20 25
<210> 25
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 凝血酶裂解位点
<400> 25
Leu Val Pro Arg
1
<210> 26
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 凝血酶裂解位点
<400> 26
Ala Leu Arg Pro Arg Val Val
1 5
<210> 27
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> FXIa裂解位点
<400> 27
Thr Gln Ser Phe Asn Asp Phe Thr Arg
1 5
<210> 28
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> FXIa裂解位点
<400> 28
Ser Val Ser Gln Thr Ser Lys Leu Thr Arg
1 5 10
<210> 29
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 凝血酶裂解位点
<400> 29
Asp Phe Leu Ala Glu Gly Gly Gly Val Arg
1 5 10
<210> 30
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 凝血酶裂解位点
<400> 30
Thr Thr Lys Ile Lys Pro Arg
1 5
<210> 31
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 凝血酶裂解位点
<400> 31
Leu Val Pro Arg Gly
1 5
<210> 32
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 32
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala
20
<210> 33
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 33
Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro
1 5 10 15
Ala Ala Pro Ser
20
<210> 34
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 34
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser Ser
20
<210> 35
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 35
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser
<210> 36
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 36
Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro
1 5 10 15
Ser Ser Pro Ala
20
<210> 37
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 37
Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro
1 5 10 15
Ala Ala Pro Ser Ala Pro Pro Ala
20
<210> 38
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 38
Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro
1 5 10 15
Ser Ala Ala Ala
20
<210> 39
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE42
<400> 39
Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser
35 40
<210> 40
<211> 78
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE72
<400> 40
Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
1 5 10 15
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
20 25 30
Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu
35 40 45
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr
50 55 60
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser
65 70 75
<210> 41
<211> 143
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144
<400> 41
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
20 25 30
Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
50 55 60
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly
65 70 75 80
Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
100 105 110
Ser Ala Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
115 120 125
Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
<210> 42
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144
<400> 42
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
1 5 10 15
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
35 40 45
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro
50 55 60
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
65 70 75 80
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
85 90 95
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
100 105 110
Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala
115 120 125
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
130 135 140
<210> 43
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE288
<400> 43
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
1 5 10 15
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
20 25 30
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
35 40 45
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
65 70 75 80
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
100 105 110
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr
115 120 125
Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
145 150 155 160
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro
165 170 175
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
180 185 190
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro
195 200 205
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr
210 215 220
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
245 250 255
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
275 280 285
<210> 44
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG288
<400> 44
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
1 5 10 15
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
20 25 30
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
35 40 45
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
50 55 60
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
65 70 75 80
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
85 90 95
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
100 105 110
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser
115 120 125
Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
130 135 140
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
145 150 155 160
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser
165 170 175
Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
180 185 190
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
195 200 205
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly
210 215 220
Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
225 230 235 240
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser
245 250 255
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
260 265 270
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
275 280 285
<210> 45
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE576
<400> 45
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu
20 25 30
Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
65 70 75 80
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala
100 105 110
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
115 120 125
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
145 150 155 160
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
165 170 175
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
245 250 255
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
275 280 285
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
290 295 300
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
305 310 315 320
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
325 330 335
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
340 345 350
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
355 360 365
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
370 375 380
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
385 390 395 400
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
405 410 415
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
420 425 430
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
435 440 445
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
450 455 460
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
465 470 475 480
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
485 490 495
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
500 505 510
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
515 520 525
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
530 535 540
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
545 550 555 560
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
565 570 575
<210> 46
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG576
<400> 46
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
1 5 10 15
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser
20 25 30
Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
35 40 45
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
50 55 60
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
65 70 75 80
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
85 90 95
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
100 105 110
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser
115 120 125
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
130 135 140
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser
145 150 155 160
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
165 170 175
Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
180 185 190
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
195 200 205
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly
210 215 220
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
225 230 235 240
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
245 250 255
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
260 265 270
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
275 280 285
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
290 295 300
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser
305 310 315 320
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
325 330 335
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser
340 345 350
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
355 360 365
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
370 375 380
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
385 390 395 400
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
405 410 415
Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
420 425 430
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro
435 440 445
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
450 455 460
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
465 470 475 480
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser
485 490 495
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser
500 505 510
Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
515 520 525
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
530 535 540
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser
545 550 555 560
Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
565 570 575
<210> 47
<211> 864
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE864
<400> 47
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu
20 25 30
Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
65 70 75 80
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala
100 105 110
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
115 120 125
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
145 150 155 160
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
165 170 175
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
245 250 255
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
275 280 285
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
290 295 300
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
305 310 315 320
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
325 330 335
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
340 345 350
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
355 360 365
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
370 375 380
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
385 390 395 400
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
405 410 415
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
420 425 430
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
435 440 445
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
450 455 460
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
465 470 475 480
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
485 490 495
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
500 505 510
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
515 520 525
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
530 535 540
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
545 550 555 560
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
565 570 575
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
580 585 590
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
595 600 605
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
610 615 620
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
625 630 635 640
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
645 650 655
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
660 665 670
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
675 680 685
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr
690 695 700
Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
705 710 715 720
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
725 730 735
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro
740 745 750
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
755 760 765
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro
770 775 780
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr
785 790 795 800
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
805 810 815
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
820 825 830
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
835 840 845
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
850 855 860
<210> 48
<211> 864
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG864
<400> 48
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
145 150 155 160
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
165 170 175
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
180 185 190
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
195 200 205
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
210 215 220
Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
225 230 235 240
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro
245 250 255
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
260 265 270
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
275 280 285
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro
290 295 300
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
305 310 315 320
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
325 330 335
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
340 345 350
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
355 360 365
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
370 375 380
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
385 390 395 400
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
405 410 415
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
420 425 430
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
435 440 445
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
450 455 460
Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
465 470 475 480
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro
485 490 495
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
500 505 510
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
515 520 525
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro
530 535 540
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
545 550 555 560
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
565 570 575
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
580 585 590
Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala
595 600 605
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
610 615 620
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
625 630 635 640
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
645 650 655
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
660 665 670
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro
675 680 685
Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala
690 695 700
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
705 710 715 720
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
725 730 735
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
740 745 750
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
755 760 765
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
770 775 780
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
785 790 795 800
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
805 810 815
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
820 825 830
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
835 840 845
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
850 855 860
<210> 49
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AD
<400> 49
Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser
1 5 10
<210> 50
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AD
<400> 50
Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser
1 5 10
<210> 51
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AD
<400> 51
Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro
1 5 10
<210> 52
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AD
<400> 52
Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser
1 5 10
<210> 53
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AE、AM
<400> 53
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
1 5 10
<210> 54
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AE、AM、AQ
<400> 54
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
1 5 10
<210> 55
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AE、AM、AQ
<400> 55
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1 5 10
<210> 56
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AE、AM、AQ
<400> 56
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
1 5 10
<210> 57
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AF、AM
<400> 57
Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro
1 5 10
<210> 58
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AF、AM
<400> 58
Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro
1 5 10
<210> 59
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AF、AM
<400> 59
Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro
1 5 10
<210> 60
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AF、AM
<400> 60
Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro
1 5 10
<210> 61
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AG、AM
<400> 61
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
1 5 10
<210> 62
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AG、AM
<400> 62
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
1 5 10
<210> 63
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AG、AM
<400> 63
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
1 5 10
<210> 64
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AG、AM
<400> 64
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
1 5 10
<210> 65
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AQ
<400> 65
Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu
1 5 10
<210> 66
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AQ
<400> 66
Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu
1 5 10
<210> 67
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AQ
<400> 67
Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu
1 5 10
<210> 68
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AQ
<400> 68
Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala
1 5 10
<210> 69
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AQ
<400> 69
Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 70
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族AQ
<400> 70
Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala
1 5 10
<210> 71
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BC
<400> 71
Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro
1 5 10
<210> 72
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BC
<400> 72
Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser
1 5 10
<210> 73
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BC
<400> 73
Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 74
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BC
<400> 74
Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala
1 5 10
<210> 75
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BD
<400> 75
Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala
1 5 10
<210> 76
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BD
<400> 76
Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala
1 5 10
<210> 77
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BD
<400> 77
Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala
1 5 10
<210> 78
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> XTEN基序家族BD
<400> 78
Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser
1 5 10
<210> 79
<211> 4974
<212> DNA
<213> 人工序列
<220>
<223> VWF057(连接子中具有LVPR凝血酶位点的VWF D'D3-Fc)
<400> 79
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
atatcgggcg cgccaacatc agagagcgcc acccctgaaa gtggtcccgg gagcgagcca 3780
gccacatctg ggtcggaaac gccaggcaca agtgagtctg caactcccga gtccggacct 3840
ggctccgagc ctgccactag cggctccgag actccgggaa cttccgagag cgctacacca 3900
gaaagcggac ccggaaccag taccgaacct agcgagggct ctgctccggg cagcccagcc 3960
ggctctccta catccacgga ggagggcact tccgaatccg ccaccccgga gtcagggcca 4020
ggatctgaac ccgctacctc aggcagtgag acgccaggaa cgagcgagtc cgctacaccg 4080
gagagtgggc cagggagccc tgctggatct cctacgtcca ctgaggaagg gtcaccagcg 4140
ggctcgccca ccagcactga agaaggtgcc tcgagcggcg gtggaggatc cggtggcggg 4200
ggatccggtg gcgggggatc cggtggcggg ggatccggtg gcgggggatc cggtggcggg 4260
ggatccctgg tcccccgggg cagcggaggc gacaaaactc acacatgccc accgtgccca 4320
gctccagaac tcctgggcgg accgtcagtc ttcctcttcc ccccaaaacc caaggacacc 4380
ctcatgatct cccggacccc tgaggtcaca tgcgtggtgg tggacgtgag ccacgaagac 4440
cctgaggtca agttcaactg gtacgtggac ggcgtggagg tgcataatgc caagacaaag 4500
ccgcgggagg agcagtacaa cagcacgtac cgtgtggtca gcgtcctcac cgtcctgcac 4560
caggactggc tgaatggcaa ggagtacaag tgcaaggtct ccaacaaagc cctcccagcc 4620
cccatcgaga aaaccatctc caaagccaaa gggcagcccc gagaaccaca ggtgtacacc 4680
ctgcccccat cccgggatga gctgaccaag aaccaggtca gcctgacctg cctggtcaaa 4740
ggcttctatc ccagcgacat cgccgtggag tgggagagca atgggcagcc ggagaacaac 4800
tacaagacca cgcctcccgt gttggactcc gacggctcct tcttcctcta cagcaagctc 4860
accgtggaca agagcaggtg gcagcagggg aacgtcttct catgctccgt gatgcatgag 4920
gctctgcaca accactacac gcagaagagc ctctccctgt ctccgggtaa atga 4974
<210> 80
<211> 1662
<212> PRT
<213> 人工序列
<220>
<223> VWF057(连接子中具有LVPR凝血酶位点的VWF D'D3-Fc)
<400> 80
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Ala Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Ala Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Ala Pro Thr Ser Glu
1235 1240 1245
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser
1250 1255 1260
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1265 1270 1275
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1280 1285 1290
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
1295 1300 1305
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro
1310 1315 1320
Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1325 1330 1335
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1340 1345 1350
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala
1355 1360 1365
Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro
1370 1375 1380
Thr Ser Thr Glu Glu Gly Ala Ser Ser Gly Gly Gly Gly Ser Gly
1385 1390 1395
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1400 1405 1410
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu
1415 1420 1425
Val Pro Arg Gly Ser Gly Gly Asp Lys Thr His Thr Cys Pro Pro
1430 1435 1440
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
1445 1450 1455
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
1460 1465 1470
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
1475 1480 1485
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
1490 1495 1500
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
1505 1510 1515
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
1520 1525 1530
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
1535 1540 1545
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val
1550 1555 1560
Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val
1565 1570 1575
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
1580 1585 1590
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
1595 1600 1605
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
1610 1615 1620
Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
1625 1630 1635
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
1640 1645 1650
Lys Ser Leu Ser Leu Ser Pro Gly Lys
1655 1660
<210> 81
<211> 4959
<212> DNA
<213> 人工序列
<220>
<223> VWF059(连接子中具有酸性区域凝血酶位点的VWF D'D3-Fc)
<400> 81
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
atatcgggcg cgccaacatc agagagcgcc acccctgaaa gtggtcccgg gagcgagcca 3780
gccacatctg ggtcggaaac gccaggcaca agtgagtctg caactcccga gtccggacct 3840
ggctccgagc ctgccactag cggctccgag actccgggaa cttccgagag cgctacacca 3900
gaaagcggac ccggaaccag taccgaacct agcgagggct ctgctccggg cagcccagcc 3960
ggctctccta catccacgga ggagggcact tccgaatccg ccaccccgga gtcagggcca 4020
ggatctgaac ccgctacctc aggcagtgag acgccaggaa cgagcgagtc cgctacaccg 4080
gagagtgggc cagggagccc tgctggatct cctacgtcca ctgaggaagg gtcaccagcg 4140
ggctcgccca ccagcactga agaaggtgcc tcgatatctg acaagaacac tggtgattat 4200
tacgaggaca gttatgaaga tatttcagca tacttgctga gtaaaaacaa tgccattgaa 4260
ccaagaagct tctctgacaa aactcacaca tgcccaccgt gcccagctcc agaactcctg 4320
ggcggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 4380
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 4440
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 4500
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 4560
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 4620
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 4680
gatgagctga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 4740
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 4800
cccgtgttgg actccgacgg ctccttcttc ctctacagca agctcaccgt ggacaagagc 4860
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 4920
tacacgcaga agagcctctc cctgtctccg ggtaaatga 4959
<210> 82
<211> 1652
<212> PRT
<213> 人工序列
<220>
<223> VWF059(连接子中具有LVPR凝血酶位点的VWF D'D3-Fc)
<400> 82
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Ala Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Ala Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Ala Pro Thr Ser Glu
1235 1240 1245
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser
1250 1255 1260
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1265 1270 1275
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1280 1285 1290
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
1295 1300 1305
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro
1310 1315 1320
Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1325 1330 1335
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1340 1345 1350
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala
1355 1360 1365
Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro
1370 1375 1380
Thr Ser Thr Glu Glu Gly Ala Ser Ile Ser Asp Lys Asn Thr Gly
1385 1390 1395
Asp Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu
1400 1405 1410
Ser Lys Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Asp Lys Thr
1415 1420 1425
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro
1430 1435 1440
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
1445 1450 1455
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His
1460 1465 1470
Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
1475 1480 1485
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
1490 1495 1500
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
1505 1510 1515
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
1520 1525 1530
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
1535 1540 1545
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu
1550 1555 1560
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
1565 1570 1575
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
1580 1585 1590
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
1595 1600 1605
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
1610 1615 1620
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
1625 1630 1635
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
1640 1645 1650
<210> 83
<211> 4860
<212> DNA
<213> 人工序列
<220>
<223> VWF062(连接子中不具有凝血酶位点的VWF D'D3-Fc)
<400> 83
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
atatcgggcg cgccaacatc agagagcgcc acccctgaaa gtggtcccgg gagcgagcca 3780
gccacatctg ggtcggaaac gccaggcaca agtgagtctg caactcccga gtccggacct 3840
ggctccgagc ctgccactag cggctccgag actccgggaa cttccgagag cgctacacca 3900
gaaagcggac ccggaaccag taccgaacct agcgagggct ctgctccggg cagcccagcc 3960
ggctctccta catccacgga ggagggcact tccgaatccg ccaccccgga gtcagggcca 4020
ggatctgaac ccgctacctc aggcagtgag acgccaggaa cgagcgagtc cgctacaccg 4080
gagagtgggc cagggagccc tgctggatct cctacgtcca ctgaggaagg gtcaccagcg 4140
ggctcgccca ccagcactga agaaggtgcc tcgagcgaca aaactcacac atgcccaccg 4200
tgcccagctc cagaactcct gggcggaccg tcagtcttcc tcttcccccc aaaacccaag 4260
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 4320
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 4380
acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 4440
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 4500
ccagccccca tcgagaaaac catctccaaa gccaaagggc agccccgaga accacaggtg 4560
tacaccctgc ccccatcccg ggatgagctg accaagaacc aggtcagcct gacctgcctg 4620
gtcaaaggct tctatcccag cgacatcgcc gtggagtggg agagcaatgg gcagccggag 4680
aacaactaca agaccacgcc tcccgtgttg gactccgacg gctccttctt cctctacagc 4740
aagctcaccg tggacaagag caggtggcag caggggaacg tcttctcatg ctccgtgatg 4800
catgaggctc tgcacaacca ctacacgcag aagagcctct ccctgtctcc gggtaaatga 4860
<210> 84
<211> 1619
<212> PRT
<213> 人工序列
<220>
<223> VWF062(连接子中不具有凝血酶位点的VWF D'D3-Fc)
<400> 84
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Ala Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Ala Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Ala Pro Thr Ser Glu
1235 1240 1245
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser
1250 1255 1260
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1265 1270 1275
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1280 1285 1290
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
1295 1300 1305
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro
1310 1315 1320
Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1325 1330 1335
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1340 1345 1350
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala
1355 1360 1365
Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro
1370 1375 1380
Thr Ser Thr Glu Glu Gly Ala Ser Ser Asp Lys Thr His Thr Cys
1385 1390 1395
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
1400 1405 1410
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
1415 1420 1425
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
1430 1435 1440
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
1445 1450 1455
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
1460 1465 1470
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly
1475 1480 1485
Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
1490 1495 1500
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
1505 1510 1515
Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
1520 1525 1530
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
1535 1540 1545
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
1550 1555 1560
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
1565 1570 1575
Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
1580 1585 1590
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
1595 1600 1605
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
1610 1615
<210> 85
<211> 6033
<212> DNA
<213> 人工序列
<220>
<223> FVIII 286(在FVIII与Fc之间具有另一个a2区域的FVIII-Fc)
<400> 85
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcta gcttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acggcgcgcc aggtacctca gagtctgcta cccccgagtc agggccagga 2340
tcagagccag ccacctccgg gtctgagaca cccgggactt ccgagagtgc cacccctgag 2400
tccggacccg ggtccgagcc cgccacttcc ggctccgaaa ctcccggcac aagcgagagc 2460
gctaccccag agtcaggacc aggaacatct acagagccct ctgaaggctc cgctccaggg 2520
tccccagccg gcagtcccac tagcaccgag gagggaacct ctgaaagcgc cacacccgaa 2580
tcagggccag ggtctgagcc tgctaccagc ggcagcgaga caccaggcac ctctgagtcc 2640
gccacaccag agtccggacc cggatctccc gctgggagcc ccacctccac tgaggaggga 2700
tctcctgctg gctctccaac atctactgag gaaggtacct caaccgagcc atccgaggga 2760
tcagctcccg gcacctcaga gtcggcaacc ccggagtctg gacccggaac ttccgaaagt 2820
gccacaccag agtccggtcc cgggacttca gaatcagcaa cacccgagtc cggccctggg 2880
tctgaacccg ccacaagtgg tagtgagaca ccaggatcag aacctgctac ctcagggtca 2940
gagacacccg gatctccggc aggctcacca acctccactg aggagggcac cagcacagaa 3000
ccaagcgagg gctccgcacc cggaacaagc actgaaccca gtgagggttc agcacccggc 3060
tctgagccgg ccacaagtgg cagtgagaca cccggcactt cagagagtgc cacccccgag 3120
agtggcccag gcactagtac cgagccctct gaaggcagtg cgccagcctc gagcccacca 3180
gtcttgaaac gccatcaagc tgaaataact cgtactactc ttcagtcaga tcaagaggaa 3240
atcgattatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 3300
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 3360
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 3420
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 3480
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 3540
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 3600
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 3660
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 3720
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 3780
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 3840
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 3900
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 3960
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 4020
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 4080
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 4140
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 4200
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 4260
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 4320
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 4380
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 4440
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 4500
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 4560
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 4620
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 4680
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 4740
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 4800
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 4860
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 4920
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 4980
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 5040
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 5100
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 5160
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 5220
gaggttctgg gctgcgaggc acaggacctc tacgacaaga acactggtga ttattacgag 5280
gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 5340
agcttctctg acaaaactca cacatgccca ccgtgcccag ctccagaact cctgggcgga 5400
ccgtcagtct tcctcttccc cccaaaaccc aaggacaccc tcatgatctc ccggacccct 5460
gaggtcacat gcgtggtggt ggacgtgagc cacgaagacc ctgaggtcaa gttcaactgg 5520
tacgtggacg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga gcagtacaac 5580
agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct gaatggcaag 5640
gagtacaagt gcaaggtctc caacaaagcc ctcccagccc ccatcgagaa aaccatctcc 5700
aaagccaaag ggcagccccg agaaccacag gtgtacaccc tgcccccatc ccgggatgag 5760
ctgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctatcc cagcgacatc 5820
gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg 5880
ttggactccg acggctcctt cttcctctac agcaagctca ccgtggacaa gagcaggtgg 5940
cagcagggga acgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacacg 6000
cagaagagcc tctccctgtc tccgggtaaa tga 6033
<210> 86
<211> 1991
<212> PRT
<213> 人工序列
<220>
<223> FVIII 286(在FVIII与Fc之间具有另一个a2区域的FVIII-Fc)
<400> 86
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Gly Thr Ser Glu
740 745 750
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
755 760 765
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
770 775 780
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
785 790 795 800
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu
805 810 815
Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
820 825 830
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
835 840 845
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
850 855 860
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
865 870 875 880
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr
885 890 895
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
900 905 910
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
915 920 925
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
930 935 940
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly
945 950 955 960
Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
965 970 975
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
980 985 990
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly
995 1000 1005
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly
1010 1015 1020
Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Ala Ser
1025 1030 1035
Ser Pro Pro Val Leu Lys Arg His Gln Ala Glu Ile Thr Arg Thr
1040 1045 1050
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1055 1060 1065
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1070 1075 1080
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1085 1090 1095
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1100 1105 1110
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1115 1120 1125
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1130 1135 1140
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1145 1150 1155
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1160 1165 1170
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1175 1180 1185
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1190 1195 1200
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1205 1210 1215
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1220 1225 1230
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1235 1240 1245
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1250 1255 1260
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1265 1270 1275
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1280 1285 1290
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1295 1300 1305
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1310 1315 1320
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1325 1330 1335
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1340 1345 1350
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1355 1360 1365
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1370 1375 1380
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1385 1390 1395
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
1400 1405 1410
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
1415 1420 1425
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
1430 1435 1440
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
1445 1450 1455
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
1460 1465 1470
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
1475 1480 1485
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
1490 1495 1500
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
1505 1510 1515
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
1520 1525 1530
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
1535 1540 1545
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
1550 1555 1560
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
1565 1570 1575
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
1580 1585 1590
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
1595 1600 1605
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
1610 1615 1620
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
1625 1630 1635
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
1640 1645 1650
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
1655 1660 1665
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
1670 1675 1680
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
1685 1690 1695
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
1700 1705 1710
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
1715 1720 1725
Gln Asp Leu Tyr Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser
1730 1735 1740
Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile
1745 1750 1755
Glu Pro Arg Ser Phe Ser Asp Lys Thr His Thr Cys Pro Pro Cys
1760 1765 1770
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
1775 1780 1785
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
1790 1795 1800
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys
1805 1810 1815
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
1820 1825 1830
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
1835 1840 1845
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
1850 1855 1860
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
1865 1870 1875
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
1880 1885 1890
Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser
1895 1900 1905
Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
1910 1915 1920
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
1925 1930 1935
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
1940 1945 1950
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser
1955 1960 1965
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
1970 1975 1980
Ser Leu Ser Leu Ser Pro Gly Lys
1985 1990
<210> 87
<211> 5937
<212> DNA
<213> 人工序列
<220>
<223> FVIII 169
<400> 87
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcta gcttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acggcgcgcc aggtacctca gagtctgcta cccccgagtc agggccagga 2340
tcagagccag ccacctccgg gtctgagaca cccgggactt ccgagagtgc cacccctgag 2400
tccggacccg ggtccgagcc cgccacttcc ggctccgaaa ctcccggcac aagcgagagc 2460
gctaccccag agtcaggacc aggaacatct acagagccct ctgaaggctc cgctccaggg 2520
tccccagccg gcagtcccac tagcaccgag gagggaacct ctgaaagcgc cacacccgaa 2580
tcagggccag ggtctgagcc tgctaccagc ggcagcgaga caccaggcac ctctgagtcc 2640
gccacaccag agtccggacc cggatctccc gctgggagcc ccacctccac tgaggaggga 2700
tctcctgctg gctctccaac atctactgag gaaggtacct caaccgagcc atccgaggga 2760
tcagctcccg gcacctcaga gtcggcaacc ccggagtctg gacccggaac ttccgaaagt 2820
gccacaccag agtccggtcc cgggacttca gaatcagcaa cacccgagtc cggccctggg 2880
tctgaacccg ccacaagtgg tagtgagaca ccaggatcag aacctgctac ctcagggtca 2940
gagacacccg gatctccggc aggctcacca acctccactg aggagggcac cagcacagaa 3000
ccaagcgagg gctccgcacc cggaacaagc actgaaccca gtgagggttc agcacccggc 3060
tctgagccgg ccacaagtgg cagtgagaca cccggcactt cagagagtgc cacccccgag 3120
agtggcccag gcactagtac cgagccctct gaaggcagtg cgccagcctc gagcccacca 3180
gtcttgaaac gccatcaagc tgaaataact cgtactactc ttcagtcaga tcaagaggaa 3240
atcgattatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 3300
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 3360
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 3420
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 3480
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 3540
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 3600
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 3660
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 3720
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 3780
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 3840
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 3900
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 3960
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 4020
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 4080
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 4140
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 4200
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 4260
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 4320
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 4380
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 4440
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 4500
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 4560
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 4620
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 4680
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 4740
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 4800
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 4860
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 4920
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 4980
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 5040
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 5100
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 5160
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 5220
gaggttctgg gctgcgaggc acaggacctc tacgacaaaa ctcacacatg cccaccgtgc 5280
ccagctccag aactcctggg cggaccgtca gtcttcctct tccccccaaa acccaaggac 5340
accctcatga tctcccggac ccctgaggtc acatgcgtgg tggtggacgt gagccacgaa 5400
gaccctgagg tcaagttcaa ctggtacgtg gacggcgtgg aggtgcataa tgccaagaca 5460
aagccgcggg aggagcagta caacagcacg taccgtgtgg tcagcgtcct caccgtcctg 5520
caccaggact ggctgaatgg caaggagtac aagtgcaagg tctccaacaa agccctccca 5580
gcccccatcg agaaaaccat ctccaaagcc aaagggcagc cccgagaacc acaggtgtac 5640
accctgcccc catcccggga tgagctgacc aagaaccagg tcagcctgac ctgcctggtc 5700
aaaggcttct atcccagcga catcgccgtg gagtgggaga gcaatgggca gccggagaac 5760
aactacaaga ccacgcctcc cgtgttggac tccgacggct ccttcttcct ctacagcaag 5820
ctcaccgtgg acaagagcag gtggcagcag gggaacgtct tctcatgctc cgtgatgcat 5880
gaggctctgc acaaccacta cacgcagaag agcctctccc tgtctccggg taaatga 5937
<210> 88
<211> 1978
<212> PRT
<213> 人工序列
<220>
<223> FVIII 169
<400> 88
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Gly
755 760 765
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
770 775 780
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
785 790 795 800
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
805 810 815
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
820 825 830
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
835 840 845
Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
850 855 860
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
865 870 875 880
Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
885 890 895
Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
900 905 910
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
915 920 925
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
930 935 940
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
945 950 955 960
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
965 970 975
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
980 985 990
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
995 1000 1005
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
1010 1015 1020
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
1025 1030 1035
Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
1040 1045 1050
Ala Pro Ala Ser Ser Pro Pro Val Leu Lys Arg His Gln Ala Glu
1055 1060 1065
Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr
1070 1075 1080
Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile
1085 1090 1095
Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
1100 1105 1110
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
1115 1120 1125
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
1130 1135 1140
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
1145 1150 1155
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
1160 1165 1170
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp
1175 1180 1185
Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser
1190 1195 1200
Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly
1205 1210 1215
Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr
1220 1225 1230
Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu
1235 1240 1245
Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu
1250 1255 1260
Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His
1265 1270 1275
Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln
1280 1285 1290
Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp
1295 1300 1305
Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn
1310 1315 1320
Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His
1325 1330 1335
Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1340 1345 1350
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser
1355 1360 1365
Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr
1370 1375 1380
Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1385 1390 1395
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly
1400 1405 1410
Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly
1415 1420 1425
Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro
1430 1435 1440
Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala
1445 1450 1455
Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His
1460 1465 1470
Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser
1475 1480 1485
Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile
1490 1495 1500
Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser
1505 1510 1515
Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr
1520 1525 1530
Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn
1535 1540 1545
Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile
1550 1555 1560
Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg
1565 1570 1575
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
1580 1585 1590
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln
1595 1600 1605
Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser
1610 1615 1620
Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
1625 1630 1635
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe
1640 1645 1650
Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys
1655 1660 1665
Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser
1670 1675 1680
Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys
1685 1690 1695
Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val
1700 1705 1710
Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His
1715 1720 1725
Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu
1730 1735 1740
Gly Cys Glu Ala Gln Asp Leu Tyr Asp Lys Thr His Thr Cys Pro
1745 1750 1755
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
1760 1765 1770
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
1775 1780 1785
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
1790 1795 1800
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
1805 1810 1815
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
1820 1825 1830
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
1835 1840 1845
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile
1850 1855 1860
Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
1865 1870 1875
Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln
1880 1885 1890
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
1895 1900 1905
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
1910 1915 1920
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
1925 1930 1935
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
1940 1945 1950
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
1955 1960 1965
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
1970 1975
<210> 89
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> Gly/Ser连接子
<400> 89
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 90
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Gly/Ser连接子
<400> 90
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser
20
<210> 91
<211> 5379
<212> DNA
<213> 人工序列
<220>
<223> VWF034
<400> 91
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcggagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgccgcattc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gaggctgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
atatcgggta cctcagagtc tgctaccccc gagtcagggc caggatcaga gccagccacc 3780
tccgggtctg agacacccgg gacttccgag agtgccaccc ctgagtccgg acccgggtcc 3840
gagcccgcca cttccggctc cgaaactccc ggcacaagcg agagcgctac cccagagtca 3900
ggaccaggaa catctacaga gccctctgaa ggctccgctc cagggtcccc agccggcagt 3960
cccactagca ccgaggaggg aacctctgaa agcgccacac ccgaatcagg gccagggtct 4020
gagcctgcta ccagcggcag cgagacacca ggcacctctg agtccgccac accagagtcc 4080
ggacccggat ctcccgctgg gagccccacc tccactgagg agggatctcc tgctggctct 4140
ccaacatcta ctgaggaagg tacctcaacc gagccatccg agggatcagc tcccggcacc 4200
tcagagtcgg caaccccgga gtctggaccc ggaacttccg aaagtgccac accagagtcc 4260
ggtcccggga cttcagaatc agcaacaccc gagtccggcc ctgggtctga acccgccaca 4320
agtggtagtg agacaccagg atcagaacct gctacctcag ggtcagagac acccggatct 4380
ccggcaggct caccaacctc cactgaggag ggcaccagca cagaaccaag cgagggctcc 4440
gcacccggaa caagcactga acccagtgag ggttcagcac ccggctctga gccggccaca 4500
agtggcagtg agacacccgg cacttcagag agtgccaccc ccgagagtgg cccaggcact 4560
agtaccgagc cctctgaagg cagtgcgcca gattctggcg gtggaggttc cggtggcggg 4620
ggatccggtg gcgggggatc cggtggcggg ggatccggtg gcgggggatc cctggtcccc 4680
cggggcagcg gaggcgacaa aactcacaca tgcccaccgt gcccagctcc agaactcctg 4740
ggcggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 4800
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 4860
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 4920
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 4980
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 5040
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 5100
gatgagctga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 5160
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 5220
cccgtgttgg actccgacgg ctccttcttc ctctacagca agctcaccgt ggacaagagc 5280
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 5340
tacacgcaga agagcctctc cctgtctccg ggtaaatga 5379
<210> 92
<211> 1778
<212> PRT
<213> 人工序列
<220>
<223> VWF034
<400> 92
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Ala Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Ala Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Ile Ser Gly Thr Ser Glu Ser Ala
1235 1240 1245
Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
1250 1255 1260
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1265 1270 1275
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser
1280 1285 1290
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro
1295 1300 1305
Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
1310 1315 1320
Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1325 1330 1335
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser
1340 1345 1350
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser
1355 1360 1365
Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser
1370 1375 1380
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
1385 1390 1395
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser
1400 1405 1410
Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala
1415 1420 1425
Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
1430 1435 1440
Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
1445 1450 1455
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser
1460 1465 1470
Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro
1475 1480 1485
Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
1490 1495 1500
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1505 1510 1515
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Asp Ile Gly
1520 1525 1530
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Leu Val Pro Arg Gly
1535 1540 1545
Ser Gly Gly Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro
1550 1555 1560
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
1565 1570 1575
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
1580 1585 1590
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
1595 1600 1605
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
1610 1615 1620
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
1625 1630 1635
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
1640 1645 1650
Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
1655 1660 1665
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
1670 1675 1680
Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
1685 1690 1695
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
1700 1705 1710
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
1715 1720 1725
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val
1730 1735 1740
Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
1745 1750 1755
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
1760 1765 1770
Leu Ser Pro Gly Lys
1775

Claims (10)

1.一种嵌合分子,其包含温韦伯氏因子(VWF)蛋白、异源部分(H1)、XTEN序列和连接所述VWF蛋白与所述异源部分的VWF连接子,其中所述VWF连接子包含选自以下的多肽:
i.来自因子VIII(FVIII)的a2区域;
ii.来自FVIII的a1区域;
iii.来自FVIII的a3区域;
iv.包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或
v.其任何组合,并且
其中所述XTEN序列连接至所述VWF蛋白、所述异源部分(H1)、所述VWF连接子或其任何组合。
2.一种嵌合分子,其包括包含VWF蛋白、异源部分(H1)和连接所述VWF蛋白与所述异源部分(H1)的VWF连接子的第一多肽链和包含FVIII蛋白和XTEN序列的第二多肽链,其中所述第一多肽链中的所述VWF连接子包含:
i.来自FVIII的a2区域;
ii.来自FVIII的a1区域;
iii.来自FVIII的a3区域;
iv.包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或
v.其任何组合,
并且其中所述第一多肽链与所述第二多肽链彼此缔合。
3.一种聚核苷酸或一组聚核苷酸,其编码如权利要求1或2所述的嵌合分子或其互补序列。
4.一种载体或一组载体,其包含如权利要求3所述的聚核苷酸或一组聚核苷酸和一个或多个可操作地连接至所述聚核苷酸或所述一组聚核苷酸的启动子。
5.一种宿主细胞,其包含如权利要求3所述的聚核苷酸或一组聚核苷酸或者如权利要求4所述的载体或一组载体。
6.一种药物组合物,其包含如权利要求1或2所述的嵌合分子、如权利要求3所述的聚核苷酸或一组聚核苷酸、如权利要求4所述的载体或一组载体、或如权利要求5所述的宿主细胞,和药学上可接受的载体。
7.一种降低有需要的受试者中出血事件的频率或程度的方法,其包括施用有效量的如权利要求1或2所述的嵌合分子、如权利要求3所述的聚核苷酸、如权利要求4所述的载体、如权利要求5所述的宿主细胞、或如权利要求6所述的组合物。
8.一种预防有需要的受试者中出血事件的发生的方法,其包括施用有效量的如权利要求1或2所述的嵌合分子、如权利要求3所述的聚核苷酸、如权利要求4所述的载体、如权利要求5所述的宿主细胞、或如权利要求6所述的组合物。
9.一种制备嵌合分子的方法,其包括用如权利要求3所述的聚核苷酸或如权利要求4所述的载体转染一个或多个宿主细胞并且在所述宿主细胞中表达所述嵌合分子。
10.一种提高包含VWF蛋白、异源部分(H1)和连接所述VWF蛋白与所述异源部分(H1)的VWF连接子以及包含FVIII蛋白和XTEN序列的第二多肽链的嵌合FVIII蛋白的FVIII活性的方法,其中第一多肽链中的所述VWF连接子包含:
i.来自FVIII的a2区域;
ii.来自FVIII的a1区域;
iii.来自FVIII的a3区域;
iv.包含X-V-P-R(SEQ ID NO:3)的凝血酶裂解位点和PAR1外位点相互作用基序,其中X是脂族氨基酸;或
v.其任何组合。
CN202110796045.4A 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途 Pending CN113817069A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361840872P 2013-06-28 2013-06-28
US61/840,872 2013-06-28
CN201480029781.5A CN105392495A (zh) 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480029781.5A Division CN105392495A (zh) 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途

Publications (1)

Publication Number Publication Date
CN113817069A true CN113817069A (zh) 2021-12-21

Family

ID=52142742

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202110796045.4A Pending CN113817069A (zh) 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途
CN202110797628.9A Pending CN113831415A (zh) 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途
CN201480029781.5A Pending CN105392495A (zh) 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202110797628.9A Pending CN113831415A (zh) 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途
CN201480029781.5A Pending CN105392495A (zh) 2013-06-28 2014-06-27 具有xten的凝血酶可裂解连接子和其用途

Country Status (17)

Country Link
US (3) US20160251408A1 (zh)
EP (1) EP3013358A4 (zh)
JP (5) JP2016523919A (zh)
KR (3) KR20240023705A (zh)
CN (3) CN113817069A (zh)
AU (3) AU2014302100B2 (zh)
CA (1) CA2913078A1 (zh)
CL (1) CL2015003710A1 (zh)
EA (1) EA201592022A1 (zh)
HK (1) HK1223302A1 (zh)
IL (3) IL297611A (zh)
MX (1) MX2015016567A (zh)
NZ (1) NZ713904A (zh)
PH (1) PH12015502614A1 (zh)
SG (3) SG11201509313PA (zh)
TW (3) TWI716340B (zh)
WO (1) WO2014210558A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102741422B (zh) 2009-08-24 2016-06-08 阿穆尼克斯运营公司 凝血因子ⅶ组合物及其制备和使用方法
BR112014017165B1 (pt) 2012-01-12 2023-05-02 Bioverativ Therapeutics Inc Proteína quimérica compreendendo uma proteína de fator viii, composição farmacêutica, e seus usos
JP6383666B2 (ja) 2012-02-15 2018-08-29 バイオベラティブ セラピューティクス インコーポレイテッド 組換え第viii因子タンパク質
JP6256882B2 (ja) 2012-02-15 2018-01-10 アムニクス オペレーティング インコーポレイテッド 第viii因子組成物、ならびに組成物の作製方法および用途
EP2870250B2 (en) 2012-07-06 2022-06-29 Bioverativ Therapeutics Inc. Cell line expressing single chain factor viii polypeptides and uses thereof
SG10201913893XA (en) * 2012-07-11 2020-03-30 Bioverativ Therapeutics Inc Factor viii complex with xten and von willebrand factor protein, and uses thereof
US10548953B2 (en) 2013-08-14 2020-02-04 Bioverativ Therapeutics Inc. Factor VIII-XTEN fusions and uses thereof
RS63583B1 (sr) * 2014-01-10 2022-10-31 Bioverativ Therapeutics Inc Himerni proteini faktora viii i njihova upotreba
US20180043012A1 (en) * 2015-03-06 2018-02-15 Csl Behring Recombinant Facility Ag Compounds for improving the half-life of von willebrand factor
BR112018002150A2 (pt) 2015-08-03 2018-09-18 Bioverativ Therapeutics Inc proteínas de fusão do fator ix e métodos de fabricação e uso das mesmas
CN109790529A (zh) * 2016-06-24 2019-05-21 财团法人牧岩生命科学研究所 包含FVIII和vWF因子的嵌合蛋白及其用途
AU2017358861B2 (en) * 2016-11-11 2022-02-17 CSL Behring Lengnau AG Truncated von Willebrand Factor polypeptides for treating hemophilia
MA52630A (fr) 2018-05-18 2021-05-26 Bioverativ Therapeutics Inc Procédés de traitement de l'hémophilie a

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102076855A (zh) * 2008-06-24 2011-05-25 Csl百灵有限公司 具有延长的体内半衰期的因子viii,冯·维勒布兰德因子或它们的复合物
CN102348715A (zh) * 2009-02-03 2012-02-08 阿穆尼克斯运营公司 延伸重组多肽和包含该延伸重组多肽的组合物
CN102741422A (zh) * 2009-08-24 2012-10-17 阿穆尼克斯运营公司 凝血因子ⅶ组合物及其制备和使用方法
US20130108629A1 (en) * 2009-12-06 2013-05-02 Biogen Idec Hemophilia Inc. Factor VIII-Fc Chimeric and Hybrid Polypeptides, and Methods of Use Thereof
WO2013083858A1 (en) * 2012-04-24 2013-06-13 Novo Nordisk A/S Compounds suitable for treatment of haemophilia

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6037452A (en) * 1992-04-10 2000-03-14 Alpha Therapeutic Corporation Poly(alkylene oxide)-Factor VIII or Factor IX conjugate
WO2001007072A1 (en) * 1999-07-23 2001-02-01 The Regents Of The University Of California Modulation of platelet activation
WO2004076484A1 (en) * 2003-02-27 2004-09-10 National Research Council Of Canada Peptide inhibitors of thrombin as potent anticoagulants
GB0516091D0 (en) * 2005-08-04 2005-09-14 Haemostatix Ltd Therapeutic agent
US7846445B2 (en) * 2005-09-27 2010-12-07 Amunix Operating, Inc. Methods for production of unstructured recombinant polymers and uses thereof
JP5457185B2 (ja) * 2006-10-04 2014-04-02 ノヴォ ノルディスク アー/エス グリセロール連結のpeg化された糖および糖ペプチド
US8173597B2 (en) * 2007-11-09 2012-05-08 Baxter International Inc. Modified recombinant factor VIII and von Willebrand factor and methods of use
WO2010060081A1 (en) * 2008-11-24 2010-05-27 Bayer Healthcare Llc Method of determining pegylated blood coagulation factor activity in a silica-based activated partial thromboplastin time assay
WO2010111414A1 (en) * 2009-03-24 2010-09-30 Bayer Healthcare Llc Factor viii variants and methods of use
JP5544219B2 (ja) * 2009-09-24 2014-07-09 富士フイルム株式会社 内視鏡システム
NZ600278A (en) * 2009-11-13 2014-04-30 Grifols Therapeutics Inc Von willebrand factor (vwf)-containing preparations, and methods, kits, and uses related thereto
US20110312881A1 (en) * 2009-12-21 2011-12-22 Amunix, Inc. Bifunctional polypeptide compositions and methods for treatment of metabolic and cardiovascular diseases
WO2012006623A1 (en) * 2010-07-09 2012-01-12 Biogen Idec Hemophilia Inc. Systems for factor viii processing and methods thereof
US20130017997A1 (en) * 2010-08-19 2013-01-17 Amunix Operating Inc. Factor VIII Compositions and Methods of Making and Using Same
BR112014017165B1 (pt) * 2012-01-12 2023-05-02 Bioverativ Therapeutics Inc Proteína quimérica compreendendo uma proteína de fator viii, composição farmacêutica, e seus usos
JP6256882B2 (ja) * 2012-02-15 2018-01-10 アムニクス オペレーティング インコーポレイテッド 第viii因子組成物、ならびに組成物の作製方法および用途
SG10201913893XA (en) * 2012-07-11 2020-03-30 Bioverativ Therapeutics Inc Factor viii complex with xten and von willebrand factor protein, and uses thereof
EP2796145B1 (en) * 2013-04-22 2017-11-01 CSL Ltd. A covalent complex of von willebrand factor and faktor viii linked by a disulphide bridge
EP3013359A4 (en) * 2013-06-28 2017-01-25 Biogen MA Inc. Thrombin cleavable linker
RS63583B1 (sr) * 2014-01-10 2022-10-31 Bioverativ Therapeutics Inc Himerni proteini faktora viii i njihova upotreba

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102076855A (zh) * 2008-06-24 2011-05-25 Csl百灵有限公司 具有延长的体内半衰期的因子viii,冯·维勒布兰德因子或它们的复合物
CN102348715A (zh) * 2009-02-03 2012-02-08 阿穆尼克斯运营公司 延伸重组多肽和包含该延伸重组多肽的组合物
CN102741422A (zh) * 2009-08-24 2012-10-17 阿穆尼克斯运营公司 凝血因子ⅶ组合物及其制备和使用方法
US20130108629A1 (en) * 2009-12-06 2013-05-02 Biogen Idec Hemophilia Inc. Factor VIII-Fc Chimeric and Hybrid Polypeptides, and Methods of Use Thereof
WO2013083858A1 (en) * 2012-04-24 2013-06-13 Novo Nordisk A/S Compounds suitable for treatment of haemophilia

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SCHELLENBERGER V等: "A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner", NATURE BIOTECHNOLOGY, vol. 27, no. 12, pages 1186 - 1190 *
于爽等: "XTEN修饰延长多肽药物半衰期研究进展", 中国兽医学报, vol. 41, no. 8, pages 1651 - 1657 *

Also Published As

Publication number Publication date
JP2022000053A (ja) 2022-01-04
JP7005800B2 (ja) 2022-02-10
BR112015031194A2 (pt) 2017-09-19
JP2021072853A (ja) 2021-05-13
AU2023219840A1 (en) 2023-09-14
TWI716340B (zh) 2021-01-21
TW202045535A (zh) 2020-12-16
JP7297837B2 (ja) 2023-06-26
AU2020203063B2 (en) 2023-05-25
CN113831415A (zh) 2021-12-24
TW201514204A (zh) 2015-04-16
US20160251408A1 (en) 2016-09-01
EP3013358A4 (en) 2017-03-22
EA201592022A1 (ru) 2016-05-31
JP2019010124A (ja) 2019-01-24
AU2020203063A1 (en) 2020-05-28
KR20230007555A (ko) 2023-01-12
IL266462A (en) 2019-06-30
IL266462B2 (en) 2023-04-01
EP3013358A1 (en) 2016-05-04
IL266462B (en) 2022-12-01
KR20240023705A (ko) 2024-02-22
CN105392495A (zh) 2016-03-09
CL2015003710A1 (es) 2016-08-26
JP2016523919A (ja) 2016-08-12
IL297611A (en) 2022-12-01
PH12015502614A1 (en) 2016-02-29
NZ713904A (en) 2022-02-25
TWI770467B (zh) 2022-07-11
TW202313672A (zh) 2023-04-01
WO2014210558A1 (en) 2014-12-31
SG11201509313PA (en) 2016-01-28
HK1223302A1 (zh) 2017-07-28
SG10201913738YA (en) 2020-03-30
IL242436B (en) 2019-05-30
SG10201710616XA (en) 2018-02-27
MX2015016567A (es) 2016-03-31
CA2913078A1 (en) 2014-12-31
US20220106383A1 (en) 2022-04-07
JP2023107932A (ja) 2023-08-03
KR20160023654A (ko) 2016-03-03
AU2014302100B2 (en) 2020-02-13
AU2014302100A1 (en) 2015-11-26
US20240083975A1 (en) 2024-03-14

Similar Documents

Publication Publication Date Title
CN113817069A (zh) 具有xten的凝血酶可裂解连接子和其用途
KR102409250B1 (ko) 인자 viii 키메라 단백질 및 이들의 용도
US20210292729A1 (en) Processable single chain molecules and polypeptides made using same
KR102212098B1 (ko) 키메라 인자 viii 폴리펩티드들과 이의 용도
KR102110736B1 (ko) Viii 인자 키메라 및 하이브리드 폴리펩타이드, 그리고 이들의 사용 방법
TW201542596A (zh) 凝血酶可裂解連接子
AU2013331000B2 (en) Methods of using a fixed dose of a clotting factor
KR102175878B1 (ko) Fviii 및 vwf 인자를 포함하는 키메라 단백질 및 그 용도
KR20210020030A (ko) A형 혈우병의 치료 방법
EA041588B1 (ru) Расщепляемый тромбином линкер, содержащий xten, и его применение
BR112015031194B1 (pt) Molécula quimérica, composição farmacêutica, e uso dos anteriores

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination