CN112175088A - 改进的fix融合蛋白、缀合物及其应用 - Google Patents

改进的fix融合蛋白、缀合物及其应用 Download PDF

Info

Publication number
CN112175088A
CN112175088A CN201910591280.0A CN201910591280A CN112175088A CN 112175088 A CN112175088 A CN 112175088A CN 201910591280 A CN201910591280 A CN 201910591280A CN 112175088 A CN112175088 A CN 112175088A
Authority
CN
China
Prior art keywords
gly
ala
thr
cys
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910591280.0A
Other languages
English (en)
Other versions
CN112175088B (zh
Inventor
苏鸿声
陈宪
莫炜川
朱鹿燕
阎海霞
姜明
任子甲
王亚里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Shengsi Biopharmaceutical Co ltd
Original Assignee
Zhengzhou Shengsi Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201910591280.0A priority Critical patent/CN112175088B/zh
Application filed by Zhengzhou Shengsi Biotechnology Co ltd filed Critical Zhengzhou Shengsi Biotechnology Co ltd
Priority to KR1020227002953A priority patent/KR20220028018A/ko
Priority to EP20834320.2A priority patent/EP3995513A4/en
Priority to PCT/CN2020/097911 priority patent/WO2021000767A1/zh
Priority to BR112021026752A priority patent/BR112021026752A2/pt
Priority to US17/597,149 priority patent/US20220323590A1/en
Priority to MX2021016099A priority patent/MX2021016099A/es
Priority to JP2022500493A priority patent/JP7305864B2/ja
Publication of CN112175088A publication Critical patent/CN112175088A/zh
Application granted granted Critical
Publication of CN112175088B publication Critical patent/CN112175088B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/56Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule
    • A61K47/59Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule obtained otherwise than by reactions only involving carbon-to-carbon unsaturated bonds, e.g. polyureas or polyurethanes
    • A61K47/60Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule obtained otherwise than by reactions only involving carbon-to-carbon unsaturated bonds, e.g. polyureas or polyurethanes the organic macromolecular compound being a polyoxyalkylene oligomer, polymer or dendrimer, e.g. PEG, PPG, PEO or polyglycerol
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/36Blood coagulation or fibrinolysis factors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21022Coagulation factor IXa (3.4.21.22)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Zoology (AREA)
  • Epidemiology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Biotechnology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Diabetes (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicinal Preparation (AREA)

Abstract

本发明涉及一种具有延长的循环半衰期的凝血因子IX融合蛋白及其缀合物,含有它们的药物组合物以及它们在治疗出血性疾病(例如血友病B)中的应用。

Description

改进的FIX融合蛋白、缀合物及其应用
技术领域
本发明涉及延长体内半衰期的生物活性多肽融合蛋白及其与聚合物的缀合物,特别涉及延长体内半衰期的人凝血因子IX,含有它们的药物组合物以及它们在治疗出血性疾病(例如血友病B)中的应用。
背景技术
血友病是一组遗传性出血性疾病,是由于血液中某些凝血因子的缺乏而导致的严重凝血功能障碍。其中包括血友病A(因子VIII、AHG缺乏)和血友病B(因子IX、PTC缺乏)。
血友病B(hemophilia B)是人凝血因子IX(human coagulation factor IX,hFIX)缺乏所引起的一种严重凝血功能障碍性疾病。编码hFIX的基因(hFIX)位于人X染色体长臂远端,定位于Xq27.1区域,全长34kb,包含8个外显子和7个内含子,cDNA全长2802bp,其中编码区1383bp。(Genbank登录号:NM_000133)重型病人的因子IX活性往往低于正常的1%,经常发生自发的出血导致肌肉血肿或者关节畸形。
用于预防和治疗血友病的重组制剂以其安全性日益获得医疗体系和病人的认同。对于血友病B,输注因子IX制剂(目前通常是体外重组表达的因子IX蛋白)补充患者体内的凝血因子IX水平是目前唯一有效的治疗方法,但由于多肽类药物普遍存在体内半衰期较短,物理、化学稳定性较差,易被体内各种蛋白酶降解等特性,使得这些药物通常需要在一天之内多次注射而导致用药频繁。给患者身体、心理和经济带来较大的负担,限制了患者用药依从性。因此,本领域迫切需要新的药物,从而延长其血浆周期和增加其系统性药物暴露(systemic drug exposure)。
发明内容
发明人经过多年的研究,提供了一种凝血因子IX与Fc的融合蛋白,该融合蛋白可进一步经过包括PEG在内的缀合物的修饰,与FIX多肽相比,具有显著延长的循环半衰期。
具体的,本发明的第一个方面提供了一种凝血因子IX(FIX)的融合蛋白,其包括凝血因子IX活性部分以及与其连接的延长半衰期的融合伴侣(FP);其中所述凝血因子IX活性部分与所述融合伴侣直接连接或者通过第一接头L1连接;优选地,所述第一接头L1为包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸的肽段;更优选地,所述第一接头L1包含柔性肽段和/或刚性单元,所述柔性肽段为包含甘氨酸(Gly,G)、丝氨酸(Ser,S)、丙氨酸(Ala,A)和/或苏氨酸(Thr,T)的肽段,例如,所述柔性肽段为(GS)m(GGS)n(GGGS)o(GGGGS)p,其中m、n、o和p分别选自0至50的整数,如0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20,优选m、n、o和p不同时为0。
在一个实施方案中,凝血因子IX活性部分源自人,例如全长或截短的人凝血因子IX;所述全长或截短的人凝血因子IX可包含1个或更多个氨基酸突变,条件是仍保留其FIX活性;例如所述凝血因子IX活性部分包含SEQ ID NO:1所示的氨基酸序列,或者与SEQ IDNO:1所示氨基酸序列具有至少80%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性。
在另一个实施方案中,刚性单元为包含1、2、3、4、5、6、7、8、9、10个或更多个脯氨酸(Pro,P)的肽段:优选的,所述刚性单元包含选自以下的氨基酸序列:
VAPPPALPAPVRLPGPA(SEQ ID NO:3);
VAPPPALPAVAPPPALPA(SEQ ID NO:4);
VAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPA(SEQ ID NO:5);
VAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPA(SEQ ID NO:6);和
VAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPA(SEQ ID NO:7);
优选的,所述第一接头L1选自:
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPA(SEQ ID NO:8);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPA(SEQ ID NO:9);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPA(SEQ IDNO:10);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPA(SEQ IDNO:11);和
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPA(SEQID NO:12)。
在又一个实施方案中,融合伴侣为:全长、截短或变体形式的免疫球蛋白Fc区段、白蛋白、转铁蛋白或XTEN,所述融合伴侣例如源自人,例如所述Fc区段是人免疫球蛋白Fc区段;优选地,所述免疫球蛋白Fc区段由选自CH1结构域、CH2结构域、CH3结构域和CH4结构域的一至四个结构域构成;还优选地,所述免疫球蛋白Fc区段是来自于IgG、IgA、IgD、IgE或IgM的Fc区段,更优选为IgG Fc区段;进一步优选地,所述Fc区段是来自IgG1、IgG2、IgG3或IgG4的Fc区段;此外还优选所述IgG Fc区段具有降低的ADCC效应和/或CDC效应和/或与FcRn受体增强的结合亲和力。
在又一个实施方案中,其中所述融合伴侣(FP)还与包含Sortase酶识别位点的一段氨基酸序列P直接连接或者通过第二接头L2连接,所述Sortase酶例如是Sortase A或Sortase B;优选的,所述P包含Sortase A的核心识别位点LPXTG,其中X是任意氨基酸,例如P序列可以是LPETG、LPETGG或LPETGGG;还优选的,所述氨基酸序列P还包含与Sortase酶识别位点连接的亲和标签,这样的氨基酸序列P例如是LPETGGHHHHHH或LPETGGWSHPQFEK。
在又一个实施方案中,所述第二接头L2为包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸的肽段;更优选地,所述第二接头L2为包含甘氨酸(Gly,G)、丝氨酸(Ser,S)、丙氨酸(Ala,A)和/或苏氨酸(Thr,T)的柔性肽段,例如,(GS)w(GGS)x(GGGS)y(GGGGS)z,其中w、x、y和z分别选自0至50的整数,例如0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20,优选的,w、x、y和z不同时为0;
优选地,第二接头L2的序列为:
GGGGS(SEQ ID NO:14)、GGGGSGGGGS(SEQ ID NO:15)或GSGGSGGGGS(SEQ ID NO:16)。
在一个具体实施方案中,所述融合蛋白具有如下结构:FIX-L1-FP-L2-P,其中
FIX、L1、L2、FP和P具有如实施方案6中相同的定义,其中L1和L2任一个或两者可以不存在。
在又一个实施方案中,所述融合蛋白包含如SEQ ID NO:18、20、22、24、26或28所示的序列,或者由SEQ ID NO:19、21、23、25、27或29所示的核酸分子编码。
进一步的,本发明还提供了编码以上任一项实施方案的融合蛋白的核酸序列以及包含所述核酸序列的表达载体。
本发明的第二个方面提供了一种缀合物,其中所述缀合物由亲水聚合物分子连接至第一个方面任意实施方案所述融合蛋白的末端而形成;在所述缀合物中,一个、二个或更多个亲水聚合物分子连接至第一个方面任意实施方案所述融合蛋白的末端,优选地经转肽反应连接至所述Sortase酶识别位点;特别地,所述融合蛋白可以是单体形式或二聚体形式。
在一个实施方案中,所述一个、二个或更多个亲水聚合物分子各自独立地选自多糖和聚亚烷基二醇,如聚丙二醇和聚乙二醇;所述聚亚烷基二醇可以是末端封端的,例如经烷氧基如甲氧基封端的;和/或所述聚亚烷基二醇是直链的或支链的;例如所述聚亚烷基二醇是支链的,例如是支链的聚乙二醇,尤其是经甲氧基封端的支链聚乙二醇;所述聚亚烷基二醇的分子量可以是>=1、>=10、>=20、>=30、>=40、>=50、>=60、>=70、>=80、>=90、>=100、>=110、>=120、>=130、>=140、>=150或>=160kDa,例如是5、10、20、30、40、50、60、70、80、90或100kDa,或者以上任意二数值之间的值;优选地所述亲水性聚合物分子的分子量是20kD或40kD。
本发明的第三个方面提供了一种制备第二个方面的缀合物的方法,其中包括使本发明第一个方面所述的融合蛋白与Sortase酶(如Sortase A或Sortase B)和亲水聚合物分子接触,其中所述亲水聚合物分子一端带有可被Sortase酶酰胺化的氨基。
在一个实施方案中,亲水聚合物分子的一端带有聚Gly,例如带有GGGAA。
本发明的第四个方面提供了一种药物组合物,其包含有效量的第一个方面中所述的融合蛋白和/或第二个方面中所述的缀合物,以及任选地药学上可接受的载体。
在一个实施方案中,所述药物组合物用于预防和/或治疗出血性疾病,所述出血性疾病优选地选自FIX先天性或获得性缺乏症患者的出血性疾病和血友病B患者的自发或手术性出血。
在又一个实施方案中,所述药物组合物为液体制剂形式或冻干制剂形式。
本发明的第五个方面提供了前述方面中的融合蛋白、缀合物或药物组合物在制备用于预防和/或治疗出血性疾病的药物中的用途,所述出血性疾病优选地选自FIX先天性或获得性缺乏症患者的出血性疾病和血友病B患者的自发或手术性出血。
本发明的第六个方面提供了一种预防和/或治疗出血性疾病的方法,其包括向有此需要的对象施用前述方面中的融合蛋白、缀合物或药物组合物,所述出血性疾病优选地选自FIX先天性或获得性缺乏症患者的出血性疾病和血友病B患者的自发或手术性出血。
本发明的第七个方面提供了一种试剂盒,其包含前述方面中的融合蛋白、缀合物或药物组合物,以及任选包含的使用说明书。
本发明的第八和第九个方面分别提供了包含第一个方面的融合蛋白的核酸序列以及包含所述核酸序列的的表达载体。
附图说明
图1A显示了FIX/PACE(Furin)双顺反子表达载体的结构。
图1B显示了pcDNA3.1-Hyg-VKGC质粒图谱。
图2显示了FIX-C1-Fc-L2-P融合蛋白纯化后的SDS-PAGE(A)和SEC-HPLC(B)检测结果。
图3显示了各FIX-L1-Fc-L2-P融合蛋白以及FIX-C1-Fc-L2-P缀合产物的体外活性检测结果。
图4显示了缀合反应结束后,40kD PEG缀合产物的SEC-HPLC检测结果。
图5显示了缀合产物纯化回收后的SEC-HPLC检测结果。
图6显示了缀合物FIX-C1-Fc-L2-PEG在血友病B模型小鼠中的PK检测结果,图下列表显示了T1/2(消除相半衰期)、Cmax、AUC0-inf(曲线下面积)、MRT(平均停留时间)和CL(清除速率)的检测值。
具体实施方式
为使本发明的目的、技术方案、及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方案,都属于本发明保护的范围。
定义
凝血因子IX,也叫做因子IX、九因子或者FIX,是与因子VII、凝血酶原、因子X和蛋白C具有结构相似性的维生素K依赖性凝血因子。
本发明中术语“凝血因子IX活性部分”是指融合蛋白表现出凝血因子IX活性的部分。术语“凝血因子IX”既可以指代其天然的野生型序列(野生型氨基酸序列如SEQ ID NO:1所示,其参考野生型核酸编码序列见Genbank登录号:NM_000133,具体如SEQ ID NO:2所示),也涵盖了其变体形式,例如经过1个或更多个(如2个、3个、4个或5个)氨基酸替换、缺失或插入后得到的变体蛋白,同时保留凝血因子IX的活性。
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT(SEQ ID NO:1)。
ATGCAGCGCGTGAACATGATCATGGCAGAATCACCAGGCCTCATCACCATCTGCCTTTTAGGATATCTACTCAGTGCTGAATGTACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCGATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAA(SEQ ID NO:2)
在一个实施方案中,所述变体蛋白与SEQ ID NO:1的序列至少90%相同。在另一个实施方案中,所述变体蛋白与SEQ ID NO:1的序列至少95%,例如96%、97%、98%或99%相同。如本文所用的,如无明确相反表示,任何提及的具体位置均指SEQ ID NO:1中的相应位置。
本发明并不限于本公开所述的序列。FIX变体例如在US5521070(其中在第一位的酪氨酸被丙氨酸替代)、以及W02007/135182(其中FIX中的一个或多个天然氨基酸残基被半胱氨酸残基置换)中公开。所述参考文献通过引用以其全文并入于此。因此,FIX的变体是本领域公知的,并且本公开内容涵盖那些已知的或未来将会开发或发现的变体形式。
融合蛋白
术语“融合伴侣”,即FP、Fusion Partner,是指与目标多肽(即希望延长其循环半衰期的多肽)进行融合的另一个多肽,所述融合伴侣能够通过多种不同的机制影响融合蛋白的功能特性,例如延长目标多肽的体内半衰期。
在一个实施方案中,融合伴侣通过与新生儿Fc受体(FcRn)相互作用而延迟FIX的体内清除。在一个实施方案中,融合伴侣是免疫球蛋白Fc区段、白蛋白、转铁蛋白、XTEN或其部分。
免疫球蛋白的Fc区段用作药物载体是安全的,因为它是体内代谢的可生物降解多肽,此外,与整个免疫球蛋白分子相比,免疫球蛋白Fc区具有相对低的分子量,因此在缀合物的制备、纯化和生产上是有利的。由于免疫球蛋白Fc区段不包含Fab片段(其氨基酸序列根据抗体亚类而不同并且因此是高度不均一的),因此可以预期免疫球蛋白Fc区可极大地增加物质的均一性并具有低抗原性。
术语“免疫球蛋白的Fc区段”是指含有免疫球蛋白的重链恒定区2(CH2)和重链恒定区3(CH3),而不含免疫球蛋白的重链和轻链的可变区的蛋白质,此外,本发明的免疫球蛋白Fc区段还可包含重链恒定区处的铰链区,和/或除了重链和轻链的可变区以外的重链恒定区1(CH1)和/或轻链恒定区1(CL1)的一部分或全部,只要它具有与天然形式基本相似或更好的生理功能即可。
在一些实施方案中,本发明的免疫球蛋白Fc区段可包含1)CH1结构域、CH2结构域、CH3结构域和CH4结构域;2)CH1结构域和CH2结构域;3)CH1结构域和CH3结构域;4)CH2结构域和CH3结构域;5)一种或更多种结构域与免疫球蛋白铰链区(或铰链区的一部分)的组合以及6)重链恒定区和轻链恒定区的各个结构域的二聚体。
此外,免疫球蛋白Fc区段可以是衍生自IgG、IgA、IgD、IgE和IgM的Fc区,或者通过其组合或杂合制备而成。优选地,其衍生自IgG或IgM(因为它们是人类血液中最丰富的蛋白质之一),在一个实施方案中,考虑到IgG抗体具有较长的半衰期,优选IgG Fc结构域。
Fc区段还可经修饰以改进其它功能,例如通过突变改变其诱导免疫反应的能力,例如与补体结合和/或与某些Fc受体结合的能力,因为这对于Fc延长半衰期的用途而言是不必要的。已知在IgG Fc区段中第234、235和237位的突变通常将会导致与FcγRI受体的结合减少,还可能导致与FcγRIIa和FcγRIII受体的结合减少,但这些突变不改变其与FcRn受体的结合,因此仍能通过内吞再循环途径而促进长的循环半衰期。优选地,本发明的融合蛋白中经修饰的IgG Fc区段包含一个或多个以下突变,所述突变将会分别导致对某些Fc受体的亲和力下降(L234A、L235E和G237A)以及C1q-介导的补体结合降低(A330S和P331S)。
在一个实施方案中,所述凝血因子IX融合蛋白进一步连接包含Sortase酶识别位点的片段(即本发明中所述的“氨基酸序列P”)。
术语“Sortase酶”,有时也被称为分选酶,具体包括Sortase A和Sortase B,最早发现其具有将细菌的表面蛋白锚定在细胞壁上的作用,经鉴定发现,表面蛋白的“锚定信号(sorting signal)”由三个关键的部分组成——LPXTG序列、疏水序列和一个大多数情况下带正电荷的残基尾巴,其中LPXTG序列非常保守,能够被Sortase酶所识别。随后Sortase酶的半胱氨酸(Cys)作为亲核基团进行攻击,作用在底物(如表面蛋白)的C末端基序LPXTG的苏氨酸和甘氨酸间的肽键,使其裂开(酰化作用),进而产生一个酰基酶中间物。随后把多肽共价联结到细胞壁或菌毛亚基上发挥功能(脱酰作用)。
在本发明的一个实施方案中,利用Sortase A进行PEG的定点偶联,在一个具体实施方案中,使用了Sortase A的核心识别位点LPETG、LPETGG、LPETGGG,在另一个具体实施方案中,还可以在识别位点后添加不同亲和标签如:LPETGGHHHHHH、LPETGGWSHPQFEK等。
在另一个实施方案中,本发明的凝血因子IX融合蛋白通过重组方法产生,包括例如在合适的原核或真核宿主细胞中进行表达,然后通过常规技术从中分离出本发明的凝血因子IX融合蛋白。例如,可以首先通过化学合成法合成编码所述肽的核苷酸序列,随后将所述序列克隆到合适的表达载体中在合适的启动子控制下进行表达。或者,还可以采用诱变法如PCR诱变法从野生型凝血因子IX获得编码凝血因子IX的核苷酸序列、并且随后将所述序列以及构建融合蛋白的其他元件的序列克隆到合适的表达载体中在合适的启动子控制下进行表达。这些技术完全在本领域普通技术人员的能力范围之内,并且在现有技术中有众多的教导。
合适的真核宿主细胞有哺乳动物细胞,例如CHO、COS、HEK 293、BHK、SK-Hep和HepG2。所述细胞优选地生长于适合表达本发明凝血因子IX融合蛋白的条件下。至于用于生产或分离本发明的凝血因子IX融合蛋白的试剂和条件,则没有任何特别的限制,本领域已知的或商业上可得到的任何体系均可应用。在一个优选的实施方案中,所述凝血因子IX融合蛋白通过本领域中已描述的方法获得。
有多种表达载体可用于制备凝血因子IX融合蛋白,其可选自真核和原核表达载体。原核表达载体可包括例如质粒如pRSET、pET和pBAD等,其中可采用的启动子有例如lac、trc、trp、recA或araBAD等。真核表达载体包括有:(i)用于在酵母中表达的载体如pAO,pPIC,pYES,pMET,其中可使用诸如AOX1,GAP,GAL1,AUG1等的启动子;(ii)用于在昆虫细胞中表达的载体如pMT,pAc[delta],plB,pMIB,pBAC等,其中可使用诸如PH,p10,MT,Ac5,OplE2,gp64,polh等的启动子;和(iii)用于在哺乳动物细胞中表达的载体如pSVL,pCMV,pRc/RSV,pcDNA3,pBPV等,以及源自病毒体系的载体如痘苗病毒、腺伴随病毒、疱疹病毒、逆转录病毒等,其中可使用诸如CMV,SV40,EF-1,UbC,RSV,ADV,BPV和β肌动蛋白等的启动子。在一个优选的实施方案中,所述凝血因子IX融合蛋白在原核或真核细胞体系中进行表达,并且使用经过密码子优化的编码序列。
在一个优选的实施方案中,表达所述凝血因子IX融合蛋白的序列包含前导肽(propeptide)和/或信号肽,以利于所述凝血因子IX融合蛋白从细胞中分泌到细胞外,从而进行分离纯化;为了提高前导肽的切割效率、FIX的产量和正确加工,对表达载体进行改进;在一个具体实施方案中,构建了FIX/PACE(Furin)双顺反子表达载体。
在另一个实施方案中,表达所述凝血因子IX融合蛋白的序列不包含前导肽和/或信号肽,其不分泌到细胞外,通过裂解细胞对其进行分离纯化。
在另一个实施方案中,本发明所述的融合蛋白中,凝血因子IX蛋白与Fc区段是直接连接的,在另一个实施方案中,凝血因子IX蛋白与Fc区段是通过第一接头L1连接的;在又一个实施方案中,Fc区段与包含Sortase识别序列的多肽片段是直接连接的,在另一个实施方案中,Fc区段与包含Sortase识别序列的片段是通过第二接头L2连接的。
在优选的实施方案中,所述第一接头L1为包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸的肽段;更优选地,所述第一接头L1包含柔性肽段和/或刚性单元,所述柔性肽段为包含甘氨酸(Gly,G)、丝氨酸(Ser,S)、丙氨酸(Ala,A)和/或苏氨酸(Thr,T)的肽段,例如,(GS)m(GGS)n(GGGS)o(GGGGS)p,其中m、n、o和p分别选自0至50的整数,如0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20,优选m、n、o和p不同时为0。
所述刚性单元为一段包含有一个或更多个脯氨酸(Pro,P)的肽段,脯氨酸具有特殊的环状结构,加强了对肽链结构的限制。发明人意外的发现,接头中包含刚性单元能够极大的提高融合蛋白的活性,优选的,所述刚性单元包含选自以下的氨基酸序列:
VAPPPALPAPVRLPGPA(SEQ ID NO:3);
VAPPPALPAVAPPPALPA(SEQ ID NO:4);
VAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPA(SEQ ID NO:5);
VAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPA(SEQ ID NO:6);和
VAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPA(SEQ ID NO:7)。
在另一个优选的方案中,所述第一接头L1的序列选自:
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPA(SEQ ID NO:8);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPA(SEQ ID NO:9);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPA(SEQ IDNO:10);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPA(SEQ IDNO:11);和
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPA(SEQID NO:12)。
所述第二接头L2为包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸的肽段,主要用于分隔Fc与Sortase酶识别位点,有利于Sortase酶的识别和作用;更优选地,所述第二接头L2为包含甘氨酸(Gly,G)、丝氨酸(Ser,S)、丙氨酸(Ala,A)和/或苏氨酸(Thr,T)的柔性肽段,例如,(GS)w(GGS)x(GGGS)y(GGGGS)z,其中w、x、y和z分别选自0至50的整数,例如0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20,优选的,w、x、y和z不同时为0;
在一个优选方案中,第二接头L2的序列为:
GGGGS(SEQ ID NO:14)、GGGGSGGGGS(SEQ ID NO:15)或GSGGSGGGGS(SEQ ID NO:16)。
凝血因子IX融合蛋白的缀合物
术语“缀合物”是指多肽或多肽变体与本文所述的亲水聚合物修饰基团共价或非共价连接后形成的产物,其中亲水聚合物与多肽可以在任意位置连接,例如多肽的N端、C端或者中部的合适位置。
一般地,本文中使用的术语“聚合物”具有本领域普通技术人员通常理解的含义,既包括聚合物本身,也包括其末端修饰的衍生物,除非另有明确说明。
此外,对于亲水聚合物如聚乙二醇来说,有多种方法测定其分子量。由于聚合物是由一定分布范围内的不同聚合度的分子构成,一般用平均分子量来表示聚合物的分子量,具体来说可以是数均分子量或重均分子量。其中,数均分子量是指各个不同分子量的分子所占的数量分数与其对应的分子量乘积的总和;重均分子量是指各个不同的分子所占的重量份数与其对应的分子量乘积的总和。尽管在聚合物的聚合度差异较大时,数均分子量和重均分子量可能有一些偏差,但是对于分布范围较窄的聚合物来说,二者趋于相等。对于本文提及的聚合物如聚乙二醇,在提及其分子量时,既可以是重均分子量,也可以是数均分子量。
本发明的凝血因子IX融合蛋白可以与一个或多个亲水聚合物分子相缀合,形成凝血因子IX融合蛋白缀合物。聚合物优选是生理可接受的,其包括在水溶液或悬液中可溶、并且以药学有效量施用该凝血因子IX融合蛋白缀合物后对哺乳动物没有负面影响如副作用的聚合物。可在本发明中使用的聚合物没有特别的限制。所述聚合物通常优选具有2到约3000个重复单元。该聚合物基团可以选自天然或合成聚合物,其实例包括、但不限于例如多糖、聚亚烷基二醇,如聚乙二醇(PEG)、聚丙二醇(PPG)、聚氧化乙烯(PEO)、乙二醇与丙二醇的共聚物、聚乙烯醇等或者其任何组合。在一个优选实施方案中,本发明凝血因子IX融合蛋白缀合物中使用一个或多个PEG基团进行缀合修饰。
在本发明中,所述聚合物并不限于特别的结构,其可以是线性的(如烷氧基PEG或双功能PEG)、分支或多臂的(如分叉PEG或连接到多元醇核心的PEG)、树枝状的或者可以具有可降解的连键。此外,聚合物的内部结构可以以任意数目的不同模式组织,其可选自均聚物、交替共聚物、无规共聚物、嵌段共聚物、交替三聚物、无规三聚物和嵌段三聚物等。所述聚合物还可包括聚(环氧烷)聚合物、聚马来酸、聚(D,L-丙氨酸)等。
在一些实施方案中,所述聚合物是聚乙二醇(PEG)或其衍生物例如甲氧基聚乙二醇(mPEG)。在本文中,如果没有特别指明,所述聚乙二醇(PEG)既包括末端基团为羟基也包括末端为其它基团的类型。所述其它基团包括但不限于烷氧基、环烷氧基、环烷基氧基、烯基、芳氧基或芳烷基氧基。这些PEG分子类型都是现有技术中已知的,并且在多肽修饰中常规使用。PEG侧链可以是线性的、分枝的、分叉的或者由多个臂组成,不同的聚乙二醇可以具有不同的聚合链长度和聚合结构。
本发明中对于所用PEG的分子量没有特别的限制,其分子量范围可以是0.1至200kDa,例如1至150kDa、2至100kDa、3至80kDa或4至50kDa,还可以是5至40kDa。另一些有用的PEG分子包括例如WO 03/040211、US 6,566,506、US 6,864,350和US 6,455,639中公开的那些。特别地,所述PEG具有通式HO-CH2CH2O-(CH2CH2O)n-CH2CH2-OH,其中n的范围是约5至4000。如上所述,本发明的PEG包括带其它末端基团的PEG,例如甲氧基PEG、分支PEG、分叉PEG等。合适的分支PEG可按照美国专利No.5,932,462中所述进行制备,该专利的全部公开内容通过参考并入本文。所述分叉PEG是指在靠近聚合物链一端的地方具有分支的PEG,分叉PEG的主链可以是直链或支链的。
本领域技术人员已知的是,在缀合了聚合物基团的生物活性分子中,随着所述聚合物基团分子量的增加,该缀合物分子的生物活性通常会逐渐降低。本领域技术人员还已知的是,随着所述聚合物基团分子量的增加,该缀合物分子的生物半衰期和/或血浆半衰期逐渐延长。
为了在长时间内提供稳定的治疗作用,另外为了减少给药频率,以提高患者依从性,在保留显著的凝血因子IX受体激动剂活性的同时,希望尽可能延长所述凝血因子IX融合蛋白缀合物的生物半衰期。因此,本发明提供了具有延长的生物半衰期和显著的凝血因子IX受体激动剂活性的凝血因子IX融合蛋白缀合物。
在一个具体实施方案中,在本发明的凝血因子IX融合蛋白缀合物中,所述一个或多个聚合物基团(如PEG)的分子量为>=1、>=10、>=20、>=30、>=40、>=50、>=60、>=70、>=80、>=90、>=100、>=110、>=120、>=130、>=140、>=150或>=160kDa,例如是5、10、20、30、40、50、60、70、80、90或100kDa,或者以上任意二数值之间的值。需要指出的是,当描述一种凝血因子IX融合蛋白缀合物中缀合聚合物基团的分子量时,如果该缀合物中有多个缀合聚合物基团,计算的是该缀合物中所有缀合聚合物基团的分子量总和,除非另外指明。
用于本发明中的聚合物是现有技术中已知的,其可通过多种途径得到,包括例如通过商业途径获得,或者根据本领域中已知的方法自行制备。本发明并不局限于通过任何具体方法制得的聚合物。
缀合反应之后,可以通过合适的方法将缀合物分离出来。适用的方法包括例如超滤法、透析法或色谱法等,这些均在本领域普通技术人员的能力范围之内。
药物组合物
本发明的凝血因子IX融合蛋白或凝血因子IX融合蛋白缀合物可以有多种用途,包括例如用于预防和/或治疗出血性疾病。因此,本发明还提供了一种用于预防和/或治疗出血性疾病的药物组合物,其中包含治疗有效量的本发明的融合蛋白或缀合物,以及任选地药学上可接受的载体。优选地,所述药物组合物可用于预防和/或治疗出血性疾病,更优选地用于选自FIX先天性或获得性缺乏症患者的出血性疾病和血友病B患者的自发或手术性出血。
本发明的融合蛋白或缀合物的治疗有效量取决于给药途径、受试者类型以及所考虑的具体哺乳动物的身体特征。这些因素及其与确定该量之间的关系是医药领域中技术人员熟知的。可调整该量和施用方法以达到最佳效力,从而将肽递送到受试者,但是将取决于医药领域技术人员熟知的因素例如体重、饮食、同时用药和其它因素。
本发明的药物组合物可在联合疗法中施用,即与一种或多种其它药剂联合应用,其中所述治疗剂一起施用,或者依次施用。在另一些实施方案中,所述其它药剂可在施用一种或多种本发明的融合蛋白或缀合物或者其药物组合物之前、期间或之后施用。
本文所使用的“可药用载体”、“药学上可接受的载体”或“生理可接受载体”可互换使用,包括任何和所有的生理上相容的盐、溶剂、分散介质、包衣、抗菌剂和抗真菌剂、等渗和吸收延迟剂等等中的一种或多种。在一些实施方案中,所述载体适于静脉内、肌内、皮下、胃肠外、脊髓或表皮给药(例如通过注射或灌注)。取决于给药途径,可用一定材料包被所述治疗剂,以保护该治疗剂免受酸和其它可能使该治疗剂失活的天然条件的作用。
施用时,本发明的药物制剂以可药用量在可药用组合物中施用。术语“可药用的”意为不干扰活性成分的生物活性效力的无毒物质。这样的制剂通常含有盐、缓冲剂、防腐剂、相容载体和任选的其它治疗剂,例如补充性免疫增强剂,包括佐剂,趋化因子和细胞因子。当使用在药物中时,所述盐应该是可药用的,但是非可药用盐可方便的用于制备其可药用盐,它们并不排除在本发明的范围之外。
如果需要,本发明的凝血因子IX融合蛋白或凝血因子IX融合蛋白缀合物可与可药用载体组合。本文所使用的术语“可药用载体”指一种或多种相容的固体或液体填充剂、稀释剂或封装物质,其适于施用于哺乳动物例如人。术语“载体”表示有机或无机、天然或合成的成分,其与活性成分组合以便于应用。药物组合物的组分也能够以不存在可显著破坏所需药物疗效的相互作用的形式共混合。
优选地,本发明的药物组合物可以包含缓冲体系,优选地所述缓冲体系为pH为约3.0至约6.0的醋酸盐缓冲溶液,或者pH为约5.0至约9.0的磷酸盐缓冲溶液。在一些具体实施方案中,合适的缓冲剂包括乙酸盐、柠檬酸盐、硼酸盐或磷酸盐。
任选地,所述药用组合物也可含有合适的防腐剂,例如:苯扎氯铵、氯叔丁醇、对羟基苯甲酸酯类和硫柳汞。
所述药用组合物可方便地以单位剂量形式存在,并可通过药学领域任何公知方法制备。所有方法包括将所述活性剂与载体联合的步骤,所述载体包含一种或多种辅助成分。通常,通过将所述活性化合物与液体载体、精细分割的固体载体或以上两者均一并密切地联合来制备所述组合物,必要时接着使产品成形。
适于胃肠外给药的药物组合物可以是包含一种或多种融合蛋白或缀合物的无菌水性或非水性制剂。在一些实施方案中,所述制剂与受试者的血液等渗。可根据已知方法使用合适的分散剂或润湿剂以及助悬剂配制此制剂。所述无菌注射制剂也可以是在无毒胃肠外可接受稀释剂或溶剂中的无菌注射溶液或悬液,例如1,3-丁二醇中的溶液。可使用的可接受载体和溶剂包括水、林格溶液和等渗氯化钠溶液。另外,无菌的不挥发性油常规用作溶剂或悬浮介质。为此,可使用任何温和的不挥发性油,包括合成的甘油单酯或甘油二酯。另外,脂肪酸如油酸可用于注射制剂。适于经口、皮下、静脉内、肌内等施用的载体配方可参阅现有技术中的工具书获得。
本发明的融合蛋白或缀合物可与保护其避免快速释放的载体制备在一起,例如受控释放配方,包括植入物、透皮贴剂和微胶囊递送系统。可使用生物可降解、生物相容性聚合物,例如乙烯乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。现有技术中已知许多制备这样的配方的方法。
本发明的药物组合物可通过任何常规途径施用,包括注射或随时间逐渐输注。例如,所述施用可以是经口、静脉内、腹膜内、肌内、腔内、肿瘤内、或透皮。
本发明的药物组合物以有效量施用。“有效量”是本文提供的任何融合蛋白或缀合物的量,其单独或者与进一步的剂量和/或其它治疗剂一起产生期望的应答。
当然这样的量将取决于受治疗的具体疾病、所述疾病的严重程度、患者个体参数(包括年龄、生理状况、身高和体重)、治疗持续时间、同时进行的治疗的性质(如果有的话)、具体的给药途径以及在医疗卫生工作者知识范围内的类似因素。这些因素对本领域技术人员来说是公知的,仅仅使用常规实验就可获知。一般优选使用各个成分或其组合的最大剂量,也就是说根据合理医学判断的最高安全剂量。但是,本领域技术人员可以理解,患者可由于医学原因、心理原因或基本上任何其它原因而要求较低剂量或可容许的剂量。
在前述方法中所使用的药物组合物优选是无菌的,且在适于施用给患者的重量单位或体积单位中含有有效量的单独或与另一种制剂组合的融合蛋白或缀合物,以产生期望的应答,例如血糖的降低。
施用于受试者的融合蛋白或缀合物的剂量可根据不同参数进行选择,特别是根据所使用的给药模式和受试者的状态。其它因素包括所需的治疗时期。如果在所应用的最初剂量下受试者中的应答不足,可应用更高的剂量(或通过不同的更局部的递送途径实现的有效更高剂量)到患者容忍度允许的范围。
在一些实施方案中,所述的凝血因子IX融合蛋白和/或凝血因子IX融合蛋白缀合物的剂量范围可以是30mg/kg体重/天至0.00001mg/kg体重/天,或者3mg/kg/天至0.0001mg/kg/天,或者0.3mg/kg/天至0.01mg/kg/天。
在一些实施方案中,本发明的药物组合物包含0.20mg/ml~5mg/ml凝血因子IX融合蛋白或和/或包含4mg/ml~40mg/ml凝血因子IX融合蛋白缀合物,优选地0.20mg/ml~5mg/ml凝血因子IX融合蛋白和/或包含4mg/ml~40mg/ml凝血因子IX融合蛋白缀合物,更优选地0.5mg/ml~2mg/ml凝血因子IX融合蛋白和/或包含10mg/ml~20mg/ml凝血因子IX融合蛋白缀合物。一般地,本发明的凝血因子IX融合蛋白或凝血因子IX融合蛋白缀合物的剂量范围可从约10μg/kg患者体重到约100,000μg/kg患者体重。在一些实施方案中,所述剂量范围可从约0.1mg/kg到约20mg/kg。在另一些实施方案中,所述剂量范围可从约0.1mg/kg到5mg/kg、0.1mg/kg到10mg/kg或0.1mg/kg到15mg/kg。在另一些实施方案中,所述剂量范围可从约1mg/kg到5mg/kg、5mg/kg到10mg/kg、10mg/kg到15mg/kg或15mg/kg到20mg/kg。在另一些实施方案中,所述剂量约为0.1mg/kg、0.5mg/kg、1mg/kg、2mg/kg、3mg/kg、5mg/kg、7mg/kg、10mg/kg、12mg/kg、15mg/kg、17mg/kg、20mg/kg、25mg/kg或30mg/kg。在另一个实施方案中,所述剂量约为1mg/kg、3mg/kg、5mg/kg或6mg/kg。基于所述组合物,所述剂量可连续递送(例如通过连续泵),或者以周期性间隔递送。在一些实施方案中,当静脉内给药时,本发明的凝血因子IX融合蛋白或凝血因子IX融合蛋白缀合物的剂量可以为0.1至20mg/kg或其中任何值。特定组合物多次给药的理想时间间隔可由本领域技术人员确定,而不需过度实验。所提供组合物的其它给药方案是本领域技术人员已知的,其中剂量、施用时间表、给药部位、给药模式等可以与前述有所不同。在一个实施方案中,所述剂量以静脉内给药。在另一个实施方案中,药剂施用方案是单次静脉内给药。
包含凝血因子IX融合蛋白或凝血因子IX融合蛋白缀合物(例如在药物组合物中)和使用说明的药盒也在本发明的范围内。所述药盒可另外含有至少一种其它的试剂,例如一种或多种其它预防和/或治疗出血性疾病的药剂。在另一个实施方案中,药盒可包含载体,所述载体经区室化,以在其中紧密固定地容纳一个或多个容器装置或一系列容器装置(例如试管、管、烧瓶、瓶、注射器等)。所述药盒的成分可包装在水性介质中,或者为冻干形式。
本文提供的组合物可以是冻干形式或在水性介质中提供。
优选地,所述受试者是脊椎动物,更优选是哺乳动物,最优选是人,但也可以是其它动物,如家养动物(如狗、猫等),家畜(如牛、羊、猪、马等)或实验动物(如猴子、大鼠、小鼠、兔子、豚鼠等)。
术语“改良的循环半衰期”或“延长的循环半衰期”是指与野生型因子IX分子相比,本发明的分子具有改变的循环半衰期,优选增加的循环半衰期。循环半衰期优选增加至少10%,优选至少15%,优选至少20%,优选至少25%,优选至少30%,优选至少35%,优选至少40%,优选至少45%,优选至少50%,优选至少55%,优选至少60%,优选至少65%,优选至少70%,优选至少75%,优选至少80%,优选至少85%,优选至少90%,优选至少95%,优选至少100%,更优选至少125%,更优选至少150%,更优选至少175%,更优选至少200%,和最优选至少250%或300%。甚至更优选地,所述分子具有的循环半衰期增加至少400%,500%,600%,或甚至700%。
本发明将通过以下实施例进行进一步说明,其不应以任何方式解释为进一步限制。本申请中所有引用的参考文献的全部内容(包含文章参考、授权的专利、公开的专利申请和共同未决的专利申请)均明确地通过引用并入本文。以下实施例中,若未具体指出,所用试剂和材料是能够商业获得的至少分析纯或与此相当级别的产品。
实施例
实施例1制备融合蛋白FIX-L1-Fc-L2-P
1.表达载体的构建
本实施例中构建的FIX融合蛋白具有共同的分子结构:FIX-L1-Fc-L2-P。其中,FIX表示来自人的天然的凝血九因子,其序列如SEQ ID NO:1所示。
L1代表FIX和Fc之间的第一接头,是柔性肽或柔性肽与多个脯氨酸(Pro,P)为基础构成的刚性结构组成的连接肽,其中L1共使用了6条序列,分别以C1、C2、C3、C4、C5和GS表示,具体序列如下:
C1:GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPA(SEQ ID NO:8)
C2:GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPA(SEQ ID NO:9)
C3:GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPA(SEQID NO:10)
C4:GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPA(SEQID NO:11)
C5:GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPA(SEQ ID NO:12)
GS:GGGGSGGGGSGGGGSGGGGSGGGGS(SEQ ID NO:13)
Fc是人的IgG1,其中带有降低ADCC和CDC活性的N297A点突变(参见Lund J.etal.Multiple binding sites on the CH2 domain of IgG for mouse Fc gamma R11.MolImmunol.1992 Jan;29(1):53-9.)。
L2是第二接头,主要用于分隔Fc与Sortase酶识别位点。具体的,在本实施例中L2的序列为GSGGSGGGS(SEQ ID NO:16)。
P是含有Sortase酶识别位点的氨基酸序列片段。
表1中总结了本实施例构建的各FIX-L1-Fc-L2-P融合蛋白。
表1
Figure BDA0002116216750000231
Figure BDA0002116216750000241
利用CHO细胞重组表达的FIX大部分以前体蛋白形式存在,只有约30%的前体蛋白的前导肽(propeptide)被切割从而形成成熟FIX。而成熟FIX的加工需要PACE/furin酶的参与,其中PACE/furin是一种枯草杆菌蛋白酶类似的、钙依赖性丝氨酸前肽酶,定位于反式高尔基体,可切割FIX前体蛋白中R46的C末端,催化FIX前体蛋白转变为成熟FIX。为提高FIX的产量和正确加工,本实施例进一步构建了FIX/PACE(Furin)双顺反子表达载体,其结构如图1A所示。
构建FIX/PACE(Furin)双顺反子表达载体
a、构建表达PACE的表达载体pFRL-rPS
PACE/Furin序列参考GenBank登陆号NP_002560.1,其第1-715位氨基酸的编码序列(SEQ ID NO:17)首先针对表达宿主进行密码子优化,经全基因合成,克隆至载体pcDNA3.1(+)上,所构建质粒命名为pcDNA3.1-P-SOL(上海捷瑞生物工程有限公司)。以质粒pcDNA3.1-P-SOL为模板,用引物F1和R1(序列见下文)进行PCR扩增得到包括启动子SV40、PACE/Furin基因和PolyA的完整基因表达框,并通过两端的BglII酶切位点连接至经BamHI单酶切的pFRL-DHFR载体上。挑取阳性克隆测序验证,载体命名为pFRL-rPS。
F1:
5'-TCAGGAAGATCTCGCGAATTAATTCTGTGGAATGTGT-3'(SEQ ID NO:30);
R1:
5'-TATCCTAGATCTGCTGGCACGACAGGTTTCCCGAC T-3'(SEQ ID NO:31)
PACE/Furin第1-715位氨基酸序列如下所示:
MELRPWLLWVVAATGTLVLLAADAQGQKVFTNTWAVRIPGGPAVANSVARKHGFLNLGQIFGDYYHFWHRGVTKRSLSPHRPRHSRLQREPQVQWLEQQVAKRRTKRDVYQEPTDPKFPQQWYLSGVTQRDLNVKAAWAQGYTGHGIVVSILDDGIEKNHPDLAGNYDPGASFDVNDQDPDPQPRYTQMNDNRHGTRCAGEVAAVANNGVCGVGVAYNARIGGVRMLDGEVTDAVEARSLGLNPNHIHIYSASWGPEDDGKTVDGPARLAEEAFFRGVSQGRGGLGSIFVWASGNGGREHDSCNCDGYTNSIYTLSISSATQFGNVPWYSEACSSTLATTYSSGNQNEKQIVTTDLRQKCTESHTGTSASAPLAAGIIALTLEANKNLTWRDMQHLVVQTSKPAHLNANDWATNGVGRKVSHSYGYGLLDAGAMVALAQNWTTVAPQRKCIIDILTEPKDIGKRLEVRKTVTACLGEPNHITRLEHAQARLTLSYNRRGDLAIHLVSPMGTRSTLLAARPHDYSADGFNDWAFMTTHSWDEDPSGEWVLEIENTSEANNYGTLTKFTLVLYGTAPEGLPVPPESSGCKTLTSSQACVVCEEGFSLHQKSCVQHCPPGFAPQVLDTHYSTENDVETIRASVCAPCHASCATCQGPALTDCLSCPSHASLDPVEQTCSRQSQSSRESPPQQQPPRLPPEVEAGQRLRAGLLPSHLPE(SEQ ID NO:17)
b、构建表达各FIX-L1-Fc-L2-P的双顺反子表达载体
b1)pFRL-rPS-FIX-C1-Fc-L2-P
FIX-C1-Fc-L2-P的编码核酸序列(即FIX-L1-Fc-L2-P中L1的序列为C1,以此类推)经密码子优化后(氨基酸序列如SEQ ID NO:18所示,密码子优化后的核酸编码序列如SEQID NO:19所示),由上海捷瑞生物工程有限公司全基因合成,并通过HindIII/EcoRI双酶切位点连接至pFRL-rPS上,构建共表达FIX-C1-Fc-L2-P/Furin的双顺反子表达载体pFRL-rPS-FIX-C1-Fc-L2-P。
FIX-C1-Fc-L2-P的氨基酸序列:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPADKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYASTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKGSGGSGGGGSLPETGG(SEQ IDNO:18)
FIX-C1-Fc-L2-P的核酸编码序列:
ATGCAGCGCGTCAATATGATTATGGCCGAGTCTCCAGGCCTCATTACCATTTGTCTGCTGGGCTACCTGCTGTCCGCAGAGTGTACCGTCTTCCTCGACCACGAGAACGCAAATAAGATTCTCAATAGGCCTAAGCGCTACAATTCCGGAAAGCTCGAAGAGTTTGTCCAGGGAAATCTGGAGCGCGAGTGTATGGAGGAAAAGTGTAGCTTTGAAGAAGCTAGAGAGGTGTTTGAGAATACTGAGCGCACTACTGAGTTTTGGAAGCAGTATGTGGATGGCGATCAGTGCGAGTCCAATCCATGCCTGAATGGCGGATCTTGCAAGGATGATATTAATTCTTACGAGTGTTGGTGCCCATTCGGCTTTGAGGGAAAGAATTGCGAACTGGATGTCACATGTAACATCAAGAACGGCAGATGCGAGCAGTTTTGTAAGAACAGCGCCGATAATAAGGTGGTGTGTAGTTGTACTGAGGGATACCGCCTCGCAGAGAATCAGAAGTCCTGTGAGCCCGCTGTGCCATTTCCTTGTGGCCGGGTCAGCGTCAGCCAGACTTCTAAGCTGACACGCGCCGAGACCGTCTTTCCAGATGTGGATTATGTCAACTCTACTGAGGCCGAGACCATTCTCGATAATATTACTCAGTCTACACAGTCCTTTAACGACTTCACTCGGGTGGTGGGCGGAGAGGACGCAAAGCCTGGCCAGTTTCCTTGGCAGGTCGTGCTCAACGGAAAGGTGGACGCATTTTGTGGCGGATCTATCGTGAATGAGAAGTGGATTGTGACCGCCGCTCACTGCGTCGAGACAGGCGTCAAGATTACCGTGGTCGCTGGAGAGCACAACATTGAGGAAACAGAGCACACCGAGCAGAAGCGCAATGTGATTCGCATCATCCCACACCACAACTACAACGCCGCTATTAATAAGTACAACCACGACATCGCCCTGTTAGAACTAGATGAGCCTCTGGTCCTGAATAGTTACGTCACTCCTATTTGTATCGCCGATAAAGAATACACTAACATCTTTCTCAAGTTCGGCTCTGGCTATGTATCTGGATGGGGACGGGTGTTTCACAAGGGACGGTCCGCACTCGTGCTACAATACCTCCGGGTGCCACTGGTGGATCGGGCAACATGCCTCCGGTCTACCAAGTTTACTATATACAATAACATGTTTTGCGCCGGCTTTCACGAGGGCGGACGGGATAGTTGCCAGGGCGATAGTGGAGGCCCTCATGTCACAGAGGTGGAGGGAACTAGCTTTCTGACAGGCATTATCTCTTGGGGCGAAGAGTGCGCTATGAAGGGAAAGTACGGCATCTATACTAAGGTCTCGCGTTACGTCAATTGGATCAAGGAAAAGACAAAGCTGACAGGCGGCGGAGGGAGCGGCGGCGGAGGCTCTGGCGGCGGCGGATCTGGCGGAGGCGGCTCTGGCGGAGGCGGATCCGTCGCTCCACCACCTGCACTCCCCGCCCCTGTCAGACTGCCTGGACCCGCTGATAAGACCCACACATGTCCACCTTGCCCAGCACCTGAGCTGCTGGGCGGACCTAGCGTGTTTCTGTTCCCACCAAAGCCAAAGGACACCCTCATGATTAGTAGAACCCCAGAGGTGACTTGCGTCGTGGTCGATGTCAGTCACGAGGACCCCGAGGTGAAGTTTAATTGGTATGTAGATGGCGTCGAGGTGCACAACGCTAAGACCAAGCCACGCGAAGAGCAGTACGCATCTACTTACCGGGTCGTCTCTGTGCTGACTGTGCTGCACCAGGATTGGCTCAATGGCAAAGAGTACAAGTGTAAGGTCAGTAATAAGGCCCTCCCCGCACCTATTGAAAAGACTATTAGCAAGGCAAAGGGCCAGCCTAGGGAGCCCCAGGTCTACACCCTGCCCCCTTCCCGCGATGAGCTGACTAAGAATCAGGTCTCTCTCACTTGCCTCGTGAAGGGCTTTTACCCATCCGACATTGCCGTGGAGTGGGAGTCCAACGGACAGCCAGAGAATAACTACAAGACAACTCCTCCCGTGCTCGATAGCGACGGTTCATTCTTCCTGTACTCCAAGCTCACCGTTGATAAGTCTCGGTGGCAGCAGGGAAATGTGTTCTCTTGTTCCGTCATGCACGAGGCACTGCACAATCACTACACCCAGAAGTCCCTGTCCCTCAGCCCTGGCAAAGGCAGCGGCGGATCTGGAGGCGGCGGATCCCTCCCAGAGACCGGCGGATGA(SEQ ID NO:19)
b2)pFRL-rPS-FIX-C2-Fc-L2-P
以FIX-C1-Fc-L2-P的编码序列为模板,将C2加入引物5’端,利用PCR扩增Fc-L2-P序列,从而获得C2-Fc-L2-P序列,所述PCR扩增所使用的引物F2和R2序列如下;
正向引物F2:
5’-TTCGCGGATCCGTCGCTCCACCACCTGCACTCCCCGCCGTGGCTCCTCCACCTGCTTTGCCCGCTGATAAGACCCACACATGTCCAC-3’(SEQ ID NO:32),
反向引物R2:
5’-TAACCGGAATTCATTATCCGCCGGTCTCTGGGAGAGATCCGCCGCCTCCAGATCCGCCGCTGCCGCCAGGGCTGAGGGACAGGGACT-3’(SEQ ID NO:33);
接下来,利用BamHI/EcoRI双酶切位点,将载体pFRL-rPS-FIX-C1-Fc-L2-P中的C1-Fc-L2-P序列替换为扩增产物C2-Fc-L2-P,从而得到共表达FIX-C2-Fc-L2-P/Furin的双顺反子表达载体pFRL-rPS-FIX-C2-Fc-L2-P。
FIX-C2-Fc-L2-P的氨基酸序列:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPADKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYASTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGGSGGSGGGGSLPETGG(SEQ IDNO:20)
FIX-C2-Fc-L2-P的核酸编码序列:
ATGCAGCGCGTCAATATGATTATGGCCGAGTCTCCAGGCCTCATTACCATTTGTCTGCTGGGCTACCTGCTGTCCGCAGAGTGTACCGTCTTCCTCGACCACGAGAACGCAAATAAGATTCTCAATAGGCCTAAGCGCTACAATTCCGGAAAGCTCGAAGAGTTTGTCCAGGGAAATCTGGAGCGCGAGTGTATGGAGGAAAAGTGTAGCTTTGAAGAAGCTAGAGAGGTGTTTGAGAATACTGAGCGCACTACTGAGTTTTGGAAGCAGTATGTGGATGGCGATCAGTGCGAGTCCAATCCATGCCTGAATGGCGGATCTTGCAAGGATGATATTAATTCTTACGAGTGTTGGTGCCCATTCGGCTTTGAGGGAAAGAATTGCGAACTGGATGTCACATGTAACATCAAGAACGGCAGATGCGAGCAGTTTTGTAAGAACAGCGCCGATAATAAGGTGGTGTGTAGTTGTACTGAGGGATACCGCCTCGCAGAGAATCAGAAGTCCTGTGAGCCCGCTGTGCCATTTCCTTGTGGCCGGGTCAGCGTCAGCCAGACTTCTAAGCTGACACGCGCCGAGACCGTCTTTCCAGATGTGGATTATGTCAACTCTACTGAGGCCGAGACCATTCTCGATAATATTACTCAGTCTACACAGTCCTTTAACGACTTCACTCGGGTGGTGGGCGGAGAGGACGCAAAGCCTGGCCAGTTTCCTTGGCAGGTCGTGCTCAACGGAAAGGTGGACGCATTTTGTGGCGGATCTATCGTGAATGAGAAGTGGATTGTGACCGCCGCTCACTGCGTCGAGACAGGCGTCAAGATTACCGTGGTCGCTGGAGAGCACAACATTGAGGAAACAGAGCACACCGAGCAGAAGCGCAATGTGATTCGCATCATCCCACACCACAACTACAACGCCGCTATTAATAAGTACAACCACGACATCGCCCTGTTAGAACTAGATGAGCCTCTGGTCCTGAATAGTTACGTCACTCCTATTTGTATCGCCGATAAAGAATACACTAACATCTTTCTCAAGTTCGGCTCTGGCTATGTATCTGGATGGGGACGGGTGTTTCACAAGGGACGGTCCGCACTCGTGCTACAATACCTCCGGGTGCCACTGGTGGATCGGGCAACATGCCTCCGGTCTACCAAGTTTACTATATACAATAACATGTTTTGCGCCGGCTTTCACGAGGGCGGACGGGATAGTTGCCAGGGCGATAGTGGAGGCCCTCATGTCACAGAGGTGGAGGGAACTAGCTTTCTGACAGGCATTATCTCTTGGGGCGAAGAGTGCGCTATGAAGGGAAAGTACGGCATCTATACTAAGGTCTCGCGTTACGTCAATTGGATCAAGGAAAAGACAAAGCTGACAGGCGGCGGAGGGAGCGGCGGCGGAGGCTCTGGCGGCGGCGGATCTGGCGGAGGCGGCTCTGGCGGAGGCGGATCCGTCGCTCCACCACCTGCACTCCCCGCCGTGGCTCCTCCACCTGCTTTGCCCGCTGATAAGACCCACACATGTCCACCTTGCCCAGCACCTGAGCTGCTGGGCGGACCTAGCGTGTTTCTGTTCCCACCAAAGCCAAAGGACACCCTCATGATTAGTAGAACCCCAGAGGTGACTTGCGTCGTGGTCGATGTCAGTCACGAGGACCCCGAGGTGAAGTTTAATTGGTATGTAGATGGCGTCGAGGTGCACAACGCTAAGACCAAGCCACGCGAAGAGCAGTACGCATCTACTTACCGGGTCGTCTCTGTGCTGACTGTGCTGCACCAGGATTGGCTCAATGGCAAAGAGTACAAGTGTAAGGTCAGTAATAAGGCCCTCCCCGCACCTATTGAAAAGACTATTAGCAAGGCAAAGGGCCAGCCTAGGGAGCCCCAGGTCTACACCCTGCCCCCTTCCCGCGATGAGCTGACTAAGAATCAGGTCTCTCTCACTTGCCTCGTGAAGGGCTTTTACCCATCCGACATTGCCGTGGAGTGGGAGTCCAACGGACAGCCAGAGAATAACTACAAGACAACTCCTCCCGTGCTCGATAGCGACGGTTCATTCTTCCTGTACTCCAAGCTCACCGTTGATAAGTCTCGGTGGCAGCAGGGAAATGTGTTCTCTTGTTCCGTCATGCACGAGGCACTGCACAATCACTACACCCAGAAGTCCCTGTCCCTCAGCCCTGGCGGCAGCGGCGGATCTGGAGGCGGCGGATCTCTCCCAGAGACCGGCGGATAA(SEQ ID NO:21)
b3)构建pFRL-rPS-FIX-C3-Fc-L2-P
载体构建方法同pFRL-rPS-FIX-C2-Fc-L2-P。其中扩增C3-Fc-L2-P编码序列的PCR引物包括正向引物F3:
5’-TGGCTCCTCCACCTGCTTTGCCCGCTGTCGCTCCACCACCTGCACTCC-3’(SEQ ID NO:34),和F4:5’-TAGATCTGTCGCTCCACCACCTGCACTCCCCGCCGTGGCTCCTCCACCTGCTTTGCC-3’(SEQ IDNO:35),反向引物R3:5’-TGAATTCTTATCATCCGCCGGTCTCTGGGAG-3’(SEQ ID NO:36)。通过2轮PCR扩增获得C3-Fc-L2-P基因。
FIX-C3-Fc-L2-P的氨基酸序列:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPADKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYASTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKGSGGSGGGGSLPETGG(SEQ ID NO:22)
FIX-C3-Fc-L2-P的核酸编码序列:
ATGCAGCGCGTCAATATGATTATGGCCGAGTCTCCAGGCCTCATTACCATTTGTCTGCTGGGCTACCTGCTGTCCGCAGAGTGTACCGTCTTCCTCGACCACGAGAACGCAAATAAGATTCTCAATAGGCCTAAGCGCTACAATTCCGGAAAGCTCGAAGAGTTTGTCCAGGGAAATCTGGAGCGCGAGTGTATGGAGGAAAAGTGTAGCTTTGAAGAAGCTAGAGAGGTGTTTGAGAATACTGAGCGCACTACTGAGTTTTGGAAGCAGTATGTGGATGGCGATCAGTGCGAGTCCAATCCATGCCTGAATGGCGGATCTTGCAAGGATGATATTAATTCTTACGAGTGTTGGTGCCCATTCGGCTTTGAGGGAAAGAATTGCGAACTGGATGTCACATGTAACATCAAGAACGGCAGATGCGAGCAGTTTTGTAAGAACAGCGCCGATAATAAGGTGGTGTGTAGTTGTACTGAGGGATACCGCCTCGCAGAGAATCAGAAGTCCTGTGAGCCCGCTGTGCCATTTCCTTGTGGCCGGGTCAGCGTCAGCCAGACTTCTAAGCTGACACGCGCCGAGACCGTCTTTCCAGATGTGGATTATGTCAACTCTACTGAGGCCGAGACCATTCTCGATAATATTACTCAGTCTACACAGTCCTTTAACGACTTCACTCGGGTGGTGGGCGGAGAGGACGCAAAGCCTGGCCAGTTTCCTTGGCAGGTCGTGCTCAACGGAAAGGTGGACGCATTTTGTGGCGGATCTATCGTGAATGAGAAGTGGATTGTGACCGCCGCTCACTGCGTCGAGACAGGCGTCAAGATTACCGTGGTCGCTGGAGAGCACAACATTGAGGAAACAGAGCACACCGAGCAGAAGCGCAATGTGATTCGCATCATCCCACACCACAACTACAACGCCGCTATTAATAAGTACAACCACGACATCGCCCTGTTAGAACTAGATGAGCCTCTGGTCCTGAATAGTTACGTCACTCCTATTTGTATCGCCGATAAAGAATACACTAACATCTTTCTCAAGTTCGGCTCTGGCTATGTATCTGGATGGGGACGGGTGTTTCACAAGGGACGGTCCGCACTCGTGCTACAATACCTCCGGGTGCCACTGGTGGATCGGGCAACATGCCTCCGGTCTACCAAGTTTACTATATACAATAACATGTTTTGCGCCGGCTTTCACGAGGGCGGACGGGATAGTTGCCAGGGCGATAGTGGAGGCCCTCATGTCACAGAGGTGGAGGGAACTAGCTTTCTGACAGGCATTATCTCTTGGGGCGAAGAGTGCGCTATGAAGGGAAAGTACGGCATCTATACTAAGGTCTCGCGTTACGTCAATTGGATCAAGGAAAAGACAAAGCTGACAGGCGGCGGAGGGAGCGGCGGCGGAGGCTCTGGCGGCGGCGGATCTGGCGGAGGCGGCTCTGGCGGAGGCGGATCTGTCGCTCCACCACCTGCACTCCCCGCCGTGGCTCCTCCACCTGCTTTGCCCGCTGTCGCTCCACCACCTGCACTCCCCGCCCCTGTCAGACTGCCTGGACCCGCTGATAAGACCCACACATGTCCACCTTGCCCAGCACCTGAGCTGCTGGGCGGACCTAGCGTGTTTCTGTTCCCACCAAAGCCAAAGGACACCCTCATGATTAGTAGAACCCCAGAGGTGACTTGCGTCGTGGTCGATGTCAGTCACGAGGACCCCGAGGTGAAGTTTAATTGGTATGTAGATGGCGTCGAGGTGCACAACGCTAAGACCAAGCCACGCGAAGAGCAGTACGCATCTACTTACCGGGTCGTCTCTGTGCTGACTGTGCTGCACCAGGATTGGCTCAATGGCAAAGAGTACAAGTGTAAGGTCAGTAATAAGGCCCTCCCCGCACCTATTGAAAAGACTATTAGCAAGGCAAAGGGCCAGCCTAGGGAGCCCCAGGTCTACACCCTGCCCCCTTCCCGCGATGAGCTGACTAAGAATCAGGTCTCTCTCACTTGCCTCGTGAAGGGCTTTTACCCATCCGACATTGCCGTGGAGTGGGAGTCCAACGGACAGCCAGAGAATAACTACAAGACAACTCCTCCCGTGCTCGATAGCGACGGTTCATTCTTCCTGTACTCCAAGCTCACCGTTGATAAGTCTCGGTGGCAGCAGGGAAATGTGTTCTCTTGTTCCGTCATGCACGAGGCACTGCACAATCACTACACCCAGAAGTCCCTGTCCCTCAGCCCTGGCAAAGGCAGCGGCGGATCTGGAGGCGGCGGATCCCTCCCAGAGACCGGCGGATGA(SEQ ID NO:23)
b4)构建pFRL-rPS-FIX-C4-Fc-L2-P
构建方法同pFRL-rPS-FIX-C2-Fc-P。其中,扩增C4-Fc-L2-P基因的PCR引物包括正向引物F5:5’-CCCTGTCAGACTGCCTGGACCCGCTGTCGCTCCACCACCTGCACTCC-3’(SEQ ID NO:37),和F6 5’-TAGATCTGTCGCTCCACCACCTGCACTCCCCGCCCCTGTCAGACTGCCTGGACC-3’(SEQ ID NO:38),反向引物R3。通过2轮PCR扩增获得C4-Fc-L2-P基因。
FIX-C4-Fc-L2-P的氨基酸序列
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPADKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYASTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGGSGGSGGGGSLPETGG(SEQ ID NO:24)
FIX-C4-Fc-L2-P的核酸编码序列
ATGCAGCGCGTCAATATGATTATGGCCGAGTCTCCAGGCCTCATTACCATTTGTCTGCTGGGCTACCTGCTGTCCGCAGAGTGTACCGTCTTCCTCGACCACGAGAACGCAAATAAGATTCTCAATAGGCCTAAGCGCTACAATTCCGGAAAGCTCGAAGAGTTTGTCCAGGGAAATCTGGAGCGCGAGTGTATGGAGGAAAAGTGTAGCTTTGAAGAAGCTAGAGAGGTGTTTGAGAATACTGAGCGCACTACTGAGTTTTGGAAGCAGTATGTGGATGGCGATCAGTGCGAGTCCAATCCATGCCTGAATGGCGGATCTTGCAAGGATGATATTAATTCTTACGAGTGTTGGTGCCCATTCGGCTTTGAGGGAAAGAATTGCGAACTGGATGTCACATGTAACATCAAGAACGGCAGATGCGAGCAGTTTTGTAAGAACAGCGCCGATAATAAGGTGGTGTGTAGTTGTACTGAGGGATACCGCCTCGCAGAGAATCAGAAGTCCTGTGAGCCCGCTGTGCCATTTCCTTGTGGCCGGGTCAGCGTCAGCCAGACTTCTAAGCTGACACGCGCCGAGACCGTCTTTCCAGATGTGGATTATGTCAACTCTACTGAGGCCGAGACCATTCTCGATAATATTACTCAGTCTACACAGTCCTTTAACGACTTCACTCGGGTGGTGGGCGGAGAGGACGCAAAGCCTGGCCAGTTTCCTTGGCAGGTCGTGCTCAACGGAAAGGTGGACGCATTTTGTGGCGGATCTATCGTGAATGAGAAGTGGATTGTGACCGCCGCTCACTGCGTCGAGACAGGCGTCAAGATTACCGTGGTCGCTGGAGAGCACAACATTGAGGAAACAGAGCACACCGAGCAGAAGCGCAATGTGATTCGCATCATCCCACACCACAACTACAACGCCGCTATTAATAAGTACAACCACGACATCGCCCTGTTAGAACTAGATGAGCCTCTGGTCCTGAATAGTTACGTCACTCCTATTTGTATCGCCGATAAAGAATACACTAACATCTTTCTCAAGTTCGGCTCTGGCTATGTATCTGGATGGGGACGGGTGTTTCACAAGGGACGGTCCGCACTCGTGCTACAATACCTCCGGGTGCCACTGGTGGATCGGGCAACATGCCTCCGGTCTACCAAGTTTACTATATACAATAACATGTTTTGCGCCGGCTTTCACGAGGGCGGACGGGATAGTTGCCAGGGCGATAGTGGAGGCCCTCATGTCACAGAGGTGGAGGGAACTAGCTTTCTGACAGGCATTATCTCTTGGGGCGAAGAGTGCGCTATGAAGGGAAAGTACGGCATCTATACTAAGGTCTCGCGTTACGTCAATTGGATCAAGGAAAAGACAAAGCTGACAGGCGGCGGAGGGAGCGGCGGCGGAGGCTCTGGCGGCGGCGGATCTGGCGGAGGCGGCTCTGGCGGAGGCGGATCTGTCGCTCCACCACCTGCACTCCCCGCCCCTGTCAGACTGCCTGGACCCGCTGTCGCTCCACCACCTGCACTCCCCGCCGTGGCTCCTCCACCTGCTTTGCCCGCTGATAAGACCCACACATGTCCACCTTGCCCAGCACCTGAGCTGCTGGGCGGACCTAGCGTGTTTCTGTTCCCACCAAAGCCAAAGGACACCCTCATGATTAGTAGAACCCCAGAGGTGACTTGCGTCGTGGTCGATGTCAGTCACGAGGACCCCGAGGTGAAGTTTAATTGGTATGTAGATGGCGTCGAGGTGCACAACGCTAAGACCAAGCCACGCGAAGAGCAGTACGCATCTACTTACCGGGTCGTCTCTGTGCTGACTGTGCTGCACCAGGATTGGCTCAATGGCAAAGAGTACAAGTGTAAGGTCAGTAATAAGGCCCTCCCCGCACCTATTGAAAAGACTATTAGCAAGGCAAAGGGCCAGCCTAGGGAGCCCCAGGTCTACACCCTGCCCCCTTCCCGCGATGAGCTGACTAAGAATCAGGTCTCTCTCACTTGCCTCGTGAAGGGCTTTTACCCATCCGACATTGCCGTGGAGTGGGAGTCCAACGGACAGCCAGAGAATAACTACAAGACAACTCCTCCCGTGCTCGATAGCGACGGTTCATTCTTCCTGTACTCCAAGCTCACCGTTGATAAGTCTCGGTGGCAGCAGGGAAATGTGTTCTCTTGTTCCGTCATGCACGAGGCACTGCACAATCACTACACCCAGAAGTCCCTGTCCCTCAGCCCTGGCGGCAGCGGCGGATCTGGAGGCGGCGGATCTCTCCCAGAGACCGGCGGATGA(SEQ ID NO:25)
b5)构建pFRL-rPS-FIX-C5-Fc-L2-P
以FIX-C2-Fc-L2-P为模板,PCR扩增FIX-C2序列片段(正向引物F7:5’-ATATAAGCTTCCGCCACCATGCAGCGC-3’(SEQ ID NO:39),反向引物R4:5’-ATATGGATCCAGCGGGCAAAGCAGGTGG AGGAGC-3’(SEQ ID NO:40)),通过HindIII/BamHI双酶切位点克隆至载体pFRL-rPS-FIX-C2-Fc-L2-P,即得到共表达FIX-C5-Fc-L2-P/Furin的双顺反子表达载体pFRL-rPS-FIX-C5-Fc-L2-P(C5实际上就是2个C2的串联)。
FIX-C5-Fc-L2-P的氨基酸序列:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPADKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYASTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGGSGGSGGGGSLPETGG(SEQ ID NO:26)
FIX-C5-Fc-L2-P的核酸编码序列:
ATGCAGCGCGTCAATATGATTATGGCCGAGTCTCCAGGCCTCATTACCATTTGTCTGCTGGGCTACCTGCTGTCCGCAGAGTGTACCGTCTTCCTCGACCACGAGAACGCAAATAAGATTCTCAATAGGCCTAAGCGCTACAATTCCGGAAAGCTCGAAGAGTTTGTCCAGGGAAATCTGGAGCGCGAGTGTATGGAGGAAAAGTGTAGCTTTGAAGAAGCTAGAGAGGTGTTTGAGAATACTGAGCGCACTACTGAGTTTTGGAAGCAGTATGTGGATGGCGATCAGTGCGAGTCCAATCCATGCCTGAATGGCGGATCTTGCAAGGATGATATTAATTCTTACGAGTGTTGGTGCCCATTCGGCTTTGAGGGAAAGAATTGCGAACTGGATGTCACATGTAACATCAAGAACGGCAGATGCGAGCAGTTTTGTAAGAACAGCGCCGATAATAAGGTGGTGTGTAGTTGTACTGAGGGATACCGCCTCGCAGAGAATCAGAAGTCCTGTGAGCCCGCTGTGCCATTTCCTTGTGGCCGGGTCAGCGTCAGCCAGACTTCTAAGCTGACACGCGCCGAGACCGTCTTTCCAGATGTGGATTATGTCAACTCTACTGAGGCCGAGACCATTCTCGATAATATTACTCAGTCTACACAGTCCTTTAACGACTTCACTCGGGTGGTGGGCGGAGAGGACGCAAAGCCTGGCCAGTTTCCTTGGCAGGTCGTGCTCAACGGAAAGGTGGACGCATTTTGTGGCGGATCTATCGTGAATGAGAAGTGGATTGTGACCGCCGCTCACTGCGTCGAGACAGGCGTCAAGATTACCGTGGTCGCTGGAGAGCACAACATTGAGGAAACAGAGCACACCGAGCAGAAGCGCAATGTGATTCGCATCATCCCACACCACAACTACAACGCCGCTATTAATAAGTACAACCACGACATCGCCCTGTTAGAACTAGATGAGCCTCTGGTCCTGAATAGTTACGTCACTCCTATTTGTATCGCCGATAAAGAATACACTAACATCTTTCTCAAGTTCGGCTCTGGCTATGTATCTGGATGGGGACGGGTGTTTCACAAGGGACGGTCCGCACTCGTGCTACAATACCTCCGGGTGCCACTGGTGGATCGGGCAACATGCCTCCGGTCTACCAAGTTTACTATATACAATAACATGTTTTGCGCCGGCTTTCACGAGGGCGGACGGGATAGTTGCCAGGGCGATAGTGGAGGCCCTCATGTCACAGAGGTGGAGGGAACTAGCTTTCTGACAGGCATTATCTCTTGGGGCGAAGAGTGCGCTATGAAGGGAAAGTACGGCATCTATACTAAGGTCTCGCGTTACGTCAATTGGATCAAGGAAAAGACAAAGCTGACAGGCGGCGGAGGGAGCGGCGGCGGAGGCTCTGGCGGCGGCGGATCTGGCGGAGGCGGCTCTGGCGGAGGCGGATCTGTCGCTCCACCACCTGCACTCCCCGCCGTGGCTCCTCCACCTGCTTTGCCCGCTGGATCCGTCGCTCCACCACCTGCACTCCCCGCCGTGGCTCCTCCACCTGCTTTGCCCGCTGATAAGACCCACACATGTCCACCTTGCCCAGCACCTGAGCTGCTGGGCGGACCTAGCGTGTTTCTGTTCCCACCAAAGCCAAAGGACACCCTCATGATTAGTAGAACCCCAGAGGTGACTTGCGTCGTGGTCGATGTCAGTCACGAGGACCCCGAGGTGAAGTTTAATTGGTATGTAGATGGCGTCGAGGTGCACAACGCTAAGACCAAGCCACGCGAAGAGCAGTACGCATCTACTTACCGGGTCGTCTCTGTGCTGACTGTGCTGCACCAGGATTGGCTCAATGGCAAAGAGTACAAGTGTAAGGTCAGTAATAAGGCCCTCCCCGCACCTATTGAAAAGACTATTAGCAAGGCAAAGGGCCAGCCTAGGGAGCCCCAGGTCTACACCCTGCCCCCTTCCCGCGATGAGCTGACTAAGAATCAGGTCTCTCTCACTTGCCTCGTGAAGGGCTTTTACCCATCCGACATTGCCGTGGAGTGGGAGTCCAACGGACAGCCAGAGAATAACTACAAGACAACTCCTCCCGTGCTCGATAGCGACGGTTCATTCTTCCTGTACTCCAAGCTCACCGTTGATAAGTCTCGGTGGCAGCAGGGAAATGTGTTCTCTTGTTCCGTCATGCACGAGGCACTGCACAATCACTACACCCAGAAGTCCCTGTCCCTCAGCCCTGGCGGCAGCGGCGGATCTGGAGGCGGCGGATCTCTCCCAGAGACCGGCGGATAA(SEQ ID NO:27)
b6)构建pFRL-rPS-FIX-GS-Fc-L2-P
共表达FIX-GS-Fc-L2-P/Furin的双顺反子表达载体pFRL-rPS-FIX-GS-Fc-L2-P的构建方法同pFRL-rPS-FIX-C2-Fc-L2-P。PCR扩增Fc-L2-P基因的引物包括正向引物F8:5’-GATTTGGATCCGATAAGA CCCACACATGTCCACCTTG-3’(SEQ ID NO:41),反向引物R5:5’-TAACCGGAATTCATTATCCGCCGGTCTCTGGGAGAGATCCGCCGCCTCCAGATCCGCCGCTGCCGCCAGGGCTGAGGGACAGGGACT-3’(SEQ ID NO:42)。
FIX-GS-Fc-L2-P的氨基酸序列如下:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGGGGSGGGGSGGGGSGGGGSGGGGSDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYASTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGGSGGSGGGGSLPETGG(SEQ ID NO:28)
FIX-GS-Fc-L2-P的核酸编码序列如下:
ATGCAGCGCGTCAATATGATTATGGCCGAGTCTCCAGGCCTCATTACCATTTGTCTGCTGGGCTACCTGCTGTCCGCAGAGTGTACCGTCTTCCTCGACCACGAGAACGCAAATAAGATTCTCAATAGGCCTAAGCGCTACAATTCCGGAAAGCTCGAAGAGTTTGTCCAGGGAAATCTGGAGCGCGAGTGTATGGAGGAAAAGTGTAGCTTTGAAGAAGCTAGAGAGGTGTTTGAGAATACTGAGCGCACTACTGAGTTTTGGAAGCAGTATGTGGATGGCGATCAGTGCGAGTCCAATCCATGCCTGAATGGCGGATCTTGCAAGGATGATATTAATTCTTACGAGTGTTGGTGCCCATTCGGCTTTGAGGGAAAGAATTGCGAACTGGATGTCACATGTAACATCAAGAACGGCAGATGCGAGCAGTTTTGTAAGAACAGCGCCGATAATAAGGTGGTGTGTAGTTGTACTGAGGGATACCGCCTCGCAGAGAATCAGAAGTCCTGTGAGCCCGCTGTGCCATTTCCTTGTGGCCGGGTCAGCGTCAGCCAGACTTCTAAGCTGACACGCGCCGAGACCGTCTTTCCAGATGTGGATTATGTCAACTCTACTGAGGCCGAGACCATTCTCGATAATATTACTCAGTCTACACAGTCCTTTAACGACTTCACTCGGGTGGTGGGCGGAGAGGACGCAAAGCCTGGCCAGTTTCCTTGGCAGGTCGTGCTCAACGGAAAGGTGGACGCATTTTGTGGCGGATCTATCGTGAATGAGAAGTGGATTGTGACCGCCGCTCACTGCGTCGAGACAGGCGTCAAGATTACCGTGGTCGCTGGAGAGCACAACATTGAGGAAACAGAGCACACCGAGCAGAAGCGCAATGTGATTCGCATCATCCCACACCACAACTACAACGCCGCTATTAATAAGTACAACCACGACATCGCCCTGTTAGAACTAGATGAGCCTCTGGTCCTGAATAGTTACGTCACTCCTATTTGTATCGCCGATAAAGAATACACTAACATCTTTCTCAAGTTCGGCTCTGGCTATGTATCTGGATGGGGACGGGTGTTTCACAAGGGACGGTCCGCACTCGTGCTACAATACCTCCGGGTGCCACTGGTGGATCGGGCAACATGCCTCCGGTCTACCAAGTTTACTATATACAATAACATGTTTTGCGCCGGCTTTCACGAGGGCGGACGGGATAGTTGCCAGGGCGATAGTGGAGGCCCTCATGTCACAGAGGTGGAGGGAACTAGCTTTCTGACAGGCATTATCTCTTGGGGCGAAGAGTGCGCTATGAAGGGAAAGTACGGCATCTATACTAAGGTCTCGCGTTACGTCAATTGGATCAAGGAAAAGACAAAGCTGACAGGCGGCGGAGGGAGCGGCGGCGGAGGCTCTGGCGGCGGCGGATCTGGCGGAGGCGGCTCTGGCGGAGGCGGATCCGATAAGACCCACACATGTCCACCTTGCCCAGCACCTGAGCTGCTGGGCGGACCTAGCGTGTTTCTGTTCCCACCAAAGCCAAAGGACACCCTCATGATTAGTAGAACCCCAGAGGTGACTTGCGTCGTGGTCGATGTCAGTCACGAGGACCCCGAGGTGAAGTTTAATTGGTATGTAGATGGCGTCGAGGTGCACAACGCTAAGACCAAGCCACGCGAAGAGCAGTACGCATCTACTTACCGGGTCGTCTCTGTGCTGACTGTGCTGCACCAGGATTGGCTCAATGGCAAAGAGTACAAGTGTAAGGTCAGTAATAAGGCCCTCCCCGCACCTATTGAAAAGACTATTAGCAAGGCAAAGGGCCAGCCTAGGGAGCCCCAGGTCTACACCCTGCCCCCTTCCCGCGATGAGCTGACTAAGAATCAGGTCTCTCTCACTTGCCTCGTGAAGGGCTTTTACCCATCCGACATTGCCGTGGAGTGGGAGTCCAACGGACAGCCAGAGAATAACTACAAGACAACTCCTCCCGTGCTCGATAGCGACGGTTCATTCTTCCTGTACTCCAAGCTCACCGTTGATAAGTCTCGGTGGCAGCAGGGAAATGTGTTCTCTTGTTCCGTCATGCACGAGGCACTGCACAATCACTACACCCAGAAGTCCCTGTCCCTCAGCCCTGGCGGCAGCGGCGGATCTGGAGGCGGCGGATCTCTCCCAGAGACCGGCGGATAA(SEQ IDNO:29)
上述不同FIX-L1-Fc-L2-P/Furin双顺反子表达载体结构示意图如图1A所示。
构建GGCX和VKORCl共表达载体
FIX是一种维生素K(VK)依赖性糖蛋白,在VK的辅助下,其N端Gla区的谷氨酸残基羧化形成γ-羧基谷氨酸而具有凝血活性。在Gla修饰中,γ-谷氨酰羧化酶(GGCX)和维生素K环氧化物还原酶复合体亚基I(VKORCl)是两个关键作用酶。因此,本发明构建质粒pcDNA3.1-Hyg-VKGC,通过与FIX共转染来提高功能性FIX的表达水平。pcDNA3.1-Hyg-VKGC质粒结构如图1B所示,构建方法如下:全基因合成γ谷氨酰羧化酶(GGCX)、维生素K环氧化物还原酶复合体亚基I(VKORCl)和内部核糖体进入位点(IRES),首先通过NheI/XhoI双酶切位点将IRES克隆至载体pcDNA3.1(+)/hygro上,构建质粒p3.1hyg-IRES;随后,通过不同的双酶切位点分别将VKORCl基因(NheI/BamHI)和GGCX基因(NotI/XhoI)克隆到p3.1hyg-IRES上,构建GGCX和VKORCl共表达载体pcDNA3.1-Hyg-VKGC。
2.构建表达细胞株
采用电转染的方法将上述构建得到的表达FIX融合蛋白的质粒转染到宿主细胞CHO DG44中。电转时,取1×107个细胞,40μg FIX-L1-Fc-L2-P/Furin共表达质粒,20μgpcDNA3.1-Hyg-VKGC表达质粒,将质粒和细胞轻轻混匀后加入电转杯中(Bio-Rad,4mm),使用Bio-Rad(GENE PULSER XCELL)电转仪,电转参数设定如下:
Figure BDA0002116216750000441
电转后将细胞转入恢复培养基中,培养24小时后,将细胞接种于15块96孔板中,培养基换成含Opti-MEM I+50nM MTX的筛选培养基。细胞培养4到5天后补充50nM MTX的培养基,补液2至3次,待克隆汇合率达到50%或以上时,采用Dot Blotting方法筛选出表达量相对高的克隆,抗体为鼠抗人IgG Fc。将筛选出的表达量相对较高的克隆,依次转入24孔板、6孔板、细胞培养皿和细胞培养摇瓶中扩大培养。
为了提高融合蛋白产量,采用递增MTX浓度的加压方法培养细胞。这样通过MTX对DHFR基因的抑制,实现DHFR基因和融合蛋白基因的共扩增。
3.生产融合蛋白
3.1种子复苏和传代
种子于方瓶中复苏,待密度增大后转入摇瓶培养传代,培养基CD DG44 Medium+5mg/L VK,当细胞密度达到2.5-3.5×106cells/mL的范围时进行传代,传代密度为0.8-1.0×106cells/mL之间。细胞种子扩培至1.8-2L,密度达到约3.5×106cells/mL时,进行罐上培养。
3.2发酵
发酵时选用15L生物反应器(Applikon,Biobundle 15L),接种体积为8L,细胞密度为1.0×106cells/mL。设定培养参数如下:1)pH 6.8-7.4;2)DO 40%;3)供氧方式:大泡通气供氧;4)降温策略:前期37℃培养,第5天时,降温至33℃培养;5)转速80-140rpm;6)补料策略:第四天开始补料,按2%、3%、4%、3%、2%、2%、2%、2%、2%的方式,总补料体积24%。每天用细胞计数仪记数。7)收获:培养13天左右收获上清液,3000g/10min离心收获上清。
3.3样品检测和纯化
发酵液上清经过三步纯化:亲和层析、混合模式层析以及阴离子交换层析。纯化后的融合蛋白经SDS-PAGE、SEC-HPLC检测。如图2A所示,SDS-PAGE结果显示目的蛋白大小与理论分子量基本保持一致;
SEC-HPLC使用Agilent Advancebio SEC 300A,2.7μm,7.8*300mm规格的色谱柱,利用50mM Tris+150mM NaCl,pH 7.2的洗脱液进行等度洗脱,柱温为30℃,流速0.5mL/min,进样器温度4.0℃,进样体积30μg,图2B以FIX-C1-Fc-L2-P蛋白为例显示了纯化结果,即保留时间在15.1min,三步纯化后SEC纯度为95.0%。
实施例2 FIX-L1-Fc-L2-P的体外活性检测和比较
本实施例检测了实施例1制备的FIX-C1-Fc-L2-P、FIX-C2-Fc-L2-P、FIX-C3-Fc-L2-P、FIX-C4-Fc-L2-P和FIX-C5-Fc-L2-P的体外活性,并且与第一接头L1中不含有刚性单元的FIX-GS-Fc-L2-P的体外活性进行了比较。
具体如下:人凝血因子IX(hFIX)活性采用基于活化部分凝血活酶时间(activatedpartial thromboplastin time,APTT)的一期法进行测定,以鞣花酸作为激活剂,用8thInternational Standard 2009 FIX Concentrate(WHO FIX活性标准品)进行APTT测定,以已知标准品的活性与测得的APTT时间分别取对数,再进行线性拟合绘制标准曲线。将待检样品稀释至标准曲线范围内,与乏FIX血浆混合测得的APPT值,通过标准曲线计算出待检样品的生物学活性。
取分装的WHO FIX活性标准品或样品,平衡至室温,吸取10μl,用5%乏FIX血浆将其稀释至约1IU/ml,然后再用5%乏FIX血浆将上述溶液分别稀释10倍,20倍(活性标准品增加稀释40倍和80倍),涡旋混匀,将稀释好的标准品或样品放置于全自动凝血仪分析样品架上,将所用的试剂分别放置于相应的试剂位置,在全自动凝血分析仪上选择相应测定程序,测定凝固时间,每个稀释度重复测定两次。以标准品活性的对数为横坐标,凝血时间的对数为纵坐标做出标准曲线。将测得的稀释后的供试品的凝血时间分别代入标准曲线,计算活性结果,再乘以稀释倍数得到相应的活性。
发明人意外的发现,如图3所示,第一L1接头包含刚性单元的FIX-C1-Fc-L2-P、FIX-C2-Fc-L2-P、FIX-C3-Fc-L2-P、FIX-C4-Fc-L2-P和FIX-C5-Fc-L2-P分子的比活力远高于第一接头L1中不包含FIX-GS-Fc-L2-P分子。这表明了第一接头L1含有刚性单元能够显著提高分子的比活力。
此外出于意料的是,在L1含有刚性单元的各个融合蛋白中,FIX-C1-Fc-L2-P具有显著更高的活性,相对比活力比其它融合蛋白高出了将近一倍或以上(图3)。因此在后续实施例中,选定了FIX-C1-Fc-L2-P进行深入研究。
实施例3制备缀合PEG的融合蛋白FIX-C1-Fc-L2-PEG
FIX-C1-Fc-L2-P蛋白的C端含LPETG,可被Sortase A酶特异性识别。在Sortase A酶的作用下,T、G之间的酰胺键被切断,T与Sortase酶184位C的巯基反应形成硫酯键中间体,随后被一端带有聚Gly的GGGAA-PEG攻击,最终能够将特定分子量大小的PEG定点连接到蛋白的C端。
PEGlation反应体系:将40KD-GGGAA-PEG用缓冲液溶解并调节pH到7.5,然后将蛋白与40KD-GGGAA-PEG以1:20的投料比加入到50mM Tris 150mM NaCl pH 7.5缓冲体系中,再加入Sortase A酶和10mM CaCl2,30min后加入EDTA终止反应。
缀合产物(FIX-C1-Fc-L2-PEG)通过SEC-HPLC检测缀合率。SEC检测使用TOSOHTSKgel UItraSW Aggregate 7.8*300mm 3μm规格的色谱柱,利用50mM Tris+150mM NaCl,pH 7.2的洗脱液进行等度洗脱,柱温为25℃,流速0.5mL/min,进样器温度4.0℃,进样体积50μg,缀合后的蛋白的保留时间在12-14.5min,底物保留时间15min。图4显示了FIX-C1-Fc-L2-PEG的检测结果,其中30min时,PEG缀合产物比例达到70%。
PEG缀合后产物的纯化和检测
PEG缀合后样品经阴离子交换层析除去未反应的GGGAA-PEG、Sortase A酶以及未缀合的底物(FIX-C1-Fc-L2-P),将未缀合底物的残余量控制在3%以内。
缀合后样品经阴离子交换层析色谱分离,分段收峰。将各峰进行SDS-HPLC检测及SEC检测,然后将未缀合底物比例低于5%的各峰合并后检测SEC纯度。FIX-C1-Fc-L2-PEG的SEC检测结果如图5所示,其中PEG化产物SEC纯度为97.8%。其中双缀合产物15.7%,保留时间为13.20min,单缀合产物82.2%,保留时间为13.70min,未反应底物FIX-C1-Fc-L2-P比例1.24%,保留时间为15.94min。
实施例4缀合物FIX-C1-Fc-L2-PEG保持了优异的体外活性
本实施例进一步检测了缀合物FIX-C1-Fc-L2-PEG的体外活性。具体如下:人凝血因子IX(hFIX)活性采用基于活化部分凝血活酶时间(activated partial thromboplastintime,APTT)的一期法进行测定,以鞣花酸作为激活剂,用8th InternationalStandard2009 FIX Concentrate(WHO FIX活性标准品)进行APTT测定,以已知标准品的活性与测得的APTT时间分别取对数,再进行线性拟合绘制标准曲线。将待检样品稀释至标准曲线范围内,与乏FIX血浆混合测得的APPT值,通过标准曲线计算出待检样品的生物学活性。
取分装的WHO FIX活性标准品或样品,平衡至室温,吸取10μL,用5%乏FIX血浆将其稀释至约1IU/ml,然后再用5%乏FIX血浆将上述溶液分别稀释10倍,20倍(活性标准品增加稀释40倍和80倍),涡旋混匀,将稀释好的标准品或样品放置于全自动凝血仪分析样品架上,将所用的试剂分别放置于相应的试剂位置,在全自动凝血分析仪上选择相应测定程序,测定凝固时间,每个稀释度重复测定两次。以标准品活性的对数为横坐标,凝血时间的对数为纵坐标做出标准曲线。将测得的稀释后的供试品的凝血时间分别代入标准曲线,计算活性结果,再乘以稀释倍数得到相应的活性。
如图3所示,缀合物FIX-C1-Fc-L2-PEG的比活力低于FIX-C1-Fc-L2-P,这反映了PEG缀合会在一定程度上降低分子的体外比活性,上述结果与本领域的通常认识是一致的。但同时值得注意的是,FIX-C1-Fc-L2-PEG的体外活性仍然保持在较高水平,不但远远高于未缀合PEG的FIX-GS-Fc-L2-P,而且与除了FIX-C1-Fc-L2-P外其它未缀合PEG的FIX-L1-Fc-L2-P融合蛋白的体外活性相当。
实施例5 FIX-C1-Fc-L2-PEG具有显著延长的体内半衰期
本实施例进一步检测了缀合物FIX-C1-Fc-L2-PEG在小鼠体内的活性。具体地,通过向HB小鼠给予FIX-C1-Fc-L2-PEG,然后在不同时间点进行眼眶采血,分离血浆,采用一期法检测血浆中hFIX活性,通过软件WinNonlin 5.2.1进行药代参数计算。
本实施例使用的实验动物如下表所示:
Figure BDA0002116216750000491
本实施例使用的测试样品如下:
Figure BDA0002116216750000492
本实验分为2组,对照药贝赋和缀合物FIX-C1-Fc-L2-PEG样品按300IU/kg进行尾静脉给药,采血时间点为:1)贝赋:0.083、0.5、1、4、8、24、48、72h;2)FIX-C1-Fc-L2-PEG:0.083、0.5、1、4、8、24、48、72、96、120、144、168、192、216、240h。每组每个采血点,5个HB动物(2雄,3雌)进行眼眶采血,并进行hFIX活性检测。
如图6所示,贝赋给药后2天还可以维持5%以上血浆hFIX水平,但给药后3天后则仅能够维持1%-2%的血浆hFIX水平;而FIX-C1-Fc-L2-PEG给药后3天依旧保持5%以上血浆hFIX水平,在给药后6天还维持高于2%的血浆hFIX水平,特别是给药后10天仍可维持1%-2%的血浆hFIX水平。实验结果表明FIX-C1-Fc-L2-PEG的消除相半衰期(T1/2)达到了70h,远大于对照药贝赋的T1/2(14h;与文献中报道的半衰期数据相符)和文献报道的Alprolix的T1/2(46h)(Peters et al.Prolonged activity of factor IX as amonomeric Fc fusion protein.Blood 2010;115(10):2057-64.)。最大血药浓度Cmax是119IU/dL,药时曲线下面积(AUClast)是1475h*IU/dL,清除率(CL)是0.2033dL/h/kg,平均滞留时间(MRT)为72h,达到了优异的药效学效果。由此可见,将hFIX与Fc融合,进一步制备得到的PEG定点缀合物,显著提高了hFIX分子的半衰期,并且相对于现有药物具有明显更优的体内长效性,具有良好的应用前景。
<110> 北京京晟斯生物科技中心(有限合伙)
<120> 改进的FIX融合蛋白、缀合物及其应用
<130> MP1909263
<160> 42
<170> PatentIn version 3.2
<210> 1
<211> 461
<212> PRT
<213> Homo sapiens
<400> 1
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
450 455 460
<210> 2
<211> 1386
<212> DNA
<213> Homo sapiens
<400> 2
atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60
ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120
ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180
gagagagaat gtatggaaga aaagtgtagt tttgaagaag cacgagaagt ttttgaaaac 240
actgaaagaa caactgaatt ttggaagcag tatgttgatg gagatcagtg tgagtccaat 300
ccatgtttaa atggcggcag ttgcaaggat gacattaatt cctatgaatg ttggtgtccc 360
tttggatttg aaggaaagaa ctgtgaatta gatgtaacat gtaacattaa gaatggcaga 420
tgcgagcagt tttgtaaaaa tagtgctgat aacaaggtgg tttgctcctg tactgaggga 480
tatcgacttg cagaaaacca gaagtcctgt gaaccagcag tgccatttcc atgtggaaga 540
gtttctgttt cacaaacttc taagctcacc cgtgctgaga ctgtttttcc tgatgtggac 600
tatgtaaatt ctactgaagc tgaaaccatt ttggataaca tcactcaaag cacccaatca 660
tttaatgact tcactcgggt tgttggtgga gaagatgcca aaccaggtca attcccttgg 720
caggttgttt tgaatggtaa agttgatgca ttctgtggag gctctatcgt taatgaaaaa 780
tggattgtaa ctgctgccca ctgtgttgaa actggtgtta aaattacagt tgtcgcaggt 840
gaacataata ttgaggagac agaacataca gagcaaaagc gaaatgtgat tcgaattatt 900
cctcaccaca actacaatgc agctattaat aagtacaacc atgacattgc ccttctggaa 960
ctggacgaac ccttagtgct aaacagctac gttacaccta tttgcattgc tgacaaggaa 1020
tacacgaaca tcttcctcaa atttggatct ggctatgtaa gtggctgggg aagagtcttc 1080
cacaaaggga gatcagcttt agttcttcag taccttagag ttccacttgt tgaccgagcc 1140
acatgtcttc gatctacaaa gttcaccatc tataacaaca tgttctgtgc tggcttccat 1200
gaaggaggta gagattcatg tcaaggagat agtgggggac cccatgttac tgaagtggaa 1260
gggaccagtt tcttaactgg aattattagc tggggtgaag agtgtgcaat gaaaggcaaa 1320
tatggaatat ataccaaggt atcccggtat gtcaactgga ttaaggaaaa aacaaagctc 1380
acttaa 1386
<210> 3
<211> 17
<212> PRT
<213> 人工序列
<400> 3
Val Ala Pro Pro Pro Ala Leu Pro Ala Pro Val Arg Leu Pro Gly Pro
1 5 10 15
Ala
<210> 4
<211> 18
<212> PRT
<213> 人工序列
<400> 4
Val Ala Pro Pro Pro Ala Leu Pro Ala Val Ala Pro Pro Pro Ala Leu
1 5 10 15
Pro Ala
<210> 5
<211> 35
<212> PRT
<213> 人工序列
<400> 5
Val Ala Pro Pro Pro Ala Leu Pro Ala Val Ala Pro Pro Pro Ala Leu
1 5 10 15
Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala Pro Val Arg Leu Pro
20 25 30
Gly Pro Ala
35
<210> 6
<211> 35
<212> PRT
<213> 人工序列
<400> 6
Val Ala Pro Pro Pro Ala Leu Pro Ala Pro Val Arg Leu Pro Gly Pro
1 5 10 15
Ala Val Ala Pro Pro Pro Ala Leu Pro Ala Val Ala Pro Pro Pro Ala
20 25 30
Leu Pro Ala
35
<210> 7
<211> 38
<212> PRT
<213> 人工序列
<400> 7
Val Ala Pro Pro Pro Ala Leu Pro Ala Val Ala Pro Pro Pro Ala Leu
1 5 10 15
Pro Ala Gly Ser Val Ala Pro Pro Pro Ala Leu Pro Ala Val Ala Pro
20 25 30
Pro Pro Ala Leu Pro Ala
35
<210> 8
<211> 42
<212> PRT
<213> 人工序列
<400> 8
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu
20 25 30
Pro Ala Pro Val Arg Leu Pro Gly Pro Ala
35 40
<210> 9
<211> 43
<212> PRT
<213> 人工序列
<400> 9
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu
20 25 30
Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala
35 40
<210> 10
<211> 60
<212> PRT
<213> 人工序列
<400> 10
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu
20 25 30
Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala Val Ala Pro Pro Pro
35 40 45
Ala Leu Pro Ala Pro Val Arg Leu Pro Gly Pro Ala
50 55 60
<210> 11
<211> 60
<212> PRT
<213> 人工序列
<400> 11
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu
20 25 30
Pro Ala Pro Val Arg Leu Pro Gly Pro Ala Val Ala Pro Pro Pro Ala
35 40 45
Leu Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala
50 55 60
<210> 12
<211> 63
<212> PRT
<213> 人工序列
<400> 12
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu
20 25 30
Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala Gly Ser Val Ala Pro
35 40 45
Pro Pro Ala Leu Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala
50 55 60
<210> 13
<211> 25
<212> PRT
<213> 人工序列
<400> 13
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25
<210> 14
<211> 5
<212> PRT
<213> 人工序列
<400> 14
Gly Gly Gly Gly Ser
1 5
<210> 15
<211> 10
<212> PRT
<213> 人工序列
<400> 15
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 16
<211> 10
<212> PRT
<213> 人工序列
<400> 16
Gly Ser Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 17
<211> 715
<212> PRT
<213> 人工序列
<400> 17
Met Glu Leu Arg Pro Trp Leu Leu Trp Val Val Ala Ala Thr Gly Thr
1 5 10 15
Leu Val Leu Leu Ala Ala Asp Ala Gln Gly Gln Lys Val Phe Thr Asn
20 25 30
Thr Trp Ala Val Arg Ile Pro Gly Gly Pro Ala Val Ala Asn Ser Val
35 40 45
Ala Arg Lys His Gly Phe Leu Asn Leu Gly Gln Ile Phe Gly Asp Tyr
50 55 60
Tyr His Phe Trp His Arg Gly Val Thr Lys Arg Ser Leu Ser Pro His
65 70 75 80
Arg Pro Arg His Ser Arg Leu Gln Arg Glu Pro Gln Val Gln Trp Leu
85 90 95
Glu Gln Gln Val Ala Lys Arg Arg Thr Lys Arg Asp Val Tyr Gln Glu
100 105 110
Pro Thr Asp Pro Lys Phe Pro Gln Gln Trp Tyr Leu Ser Gly Val Thr
115 120 125
Gln Arg Asp Leu Asn Val Lys Ala Ala Trp Ala Gln Gly Tyr Thr Gly
130 135 140
His Gly Ile Val Val Ser Ile Leu Asp Asp Gly Ile Glu Lys Asn His
145 150 155 160
Pro Asp Leu Ala Gly Asn Tyr Asp Pro Gly Ala Ser Phe Asp Val Asn
165 170 175
Asp Gln Asp Pro Asp Pro Gln Pro Arg Tyr Thr Gln Met Asn Asp Asn
180 185 190
Arg His Gly Thr Arg Cys Ala Gly Glu Val Ala Ala Val Ala Asn Asn
195 200 205
Gly Val Cys Gly Val Gly Val Ala Tyr Asn Ala Arg Ile Gly Gly Val
210 215 220
Arg Met Leu Asp Gly Glu Val Thr Asp Ala Val Glu Ala Arg Ser Leu
225 230 235 240
Gly Leu Asn Pro Asn His Ile His Ile Tyr Ser Ala Ser Trp Gly Pro
245 250 255
Glu Asp Asp Gly Lys Thr Val Asp Gly Pro Ala Arg Leu Ala Glu Glu
260 265 270
Ala Phe Phe Arg Gly Val Ser Gln Gly Arg Gly Gly Leu Gly Ser Ile
275 280 285
Phe Val Trp Ala Ser Gly Asn Gly Gly Arg Glu His Asp Ser Cys Asn
290 295 300
Cys Asp Gly Tyr Thr Asn Ser Ile Tyr Thr Leu Ser Ile Ser Ser Ala
305 310 315 320
Thr Gln Phe Gly Asn Val Pro Trp Tyr Ser Glu Ala Cys Ser Ser Thr
325 330 335
Leu Ala Thr Thr Tyr Ser Ser Gly Asn Gln Asn Glu Lys Gln Ile Val
340 345 350
Thr Thr Asp Leu Arg Gln Lys Cys Thr Glu Ser His Thr Gly Thr Ser
355 360 365
Ala Ser Ala Pro Leu Ala Ala Gly Ile Ile Ala Leu Thr Leu Glu Ala
370 375 380
Asn Lys Asn Leu Thr Trp Arg Asp Met Gln His Leu Val Val Gln Thr
385 390 395 400
Ser Lys Pro Ala His Leu Asn Ala Asn Asp Trp Ala Thr Asn Gly Val
405 410 415
Gly Arg Lys Val Ser His Ser Tyr Gly Tyr Gly Leu Leu Asp Ala Gly
420 425 430
Ala Met Val Ala Leu Ala Gln Asn Trp Thr Thr Val Ala Pro Gln Arg
435 440 445
Lys Cys Ile Ile Asp Ile Leu Thr Glu Pro Lys Asp Ile Gly Lys Arg
450 455 460
Leu Glu Val Arg Lys Thr Val Thr Ala Cys Leu Gly Glu Pro Asn His
465 470 475 480
Ile Thr Arg Leu Glu His Ala Gln Ala Arg Leu Thr Leu Ser Tyr Asn
485 490 495
Arg Arg Gly Asp Leu Ala Ile His Leu Val Ser Pro Met Gly Thr Arg
500 505 510
Ser Thr Leu Leu Ala Ala Arg Pro His Asp Tyr Ser Ala Asp Gly Phe
515 520 525
Asn Asp Trp Ala Phe Met Thr Thr His Ser Trp Asp Glu Asp Pro Ser
530 535 540
Gly Glu Trp Val Leu Glu Ile Glu Asn Thr Ser Glu Ala Asn Asn Tyr
545 550 555 560
Gly Thr Leu Thr Lys Phe Thr Leu Val Leu Tyr Gly Thr Ala Pro Glu
565 570 575
Gly Leu Pro Val Pro Pro Glu Ser Ser Gly Cys Lys Thr Leu Thr Ser
580 585 590
Ser Gln Ala Cys Val Val Cys Glu Glu Gly Phe Ser Leu His Gln Lys
595 600 605
Ser Cys Val Gln His Cys Pro Pro Gly Phe Ala Pro Gln Val Leu Asp
610 615 620
Thr His Tyr Ser Thr Glu Asn Asp Val Glu Thr Ile Arg Ala Ser Val
625 630 635 640
Cys Ala Pro Cys His Ala Ser Cys Ala Thr Cys Gln Gly Pro Ala Leu
645 650 655
Thr Asp Cys Leu Ser Cys Pro Ser His Ala Ser Leu Asp Pro Val Glu
660 665 670
Gln Thr Cys Ser Arg Gln Ser Gln Ser Ser Arg Glu Ser Pro Pro Gln
675 680 685
Gln Gln Pro Pro Arg Leu Pro Pro Glu Val Glu Ala Gly Gln Arg Leu
690 695 700
Arg Ala Gly Leu Leu Pro Ser His Leu Pro Glu
705 710 715
<210> 18
<211> 746
<212> PRT
<213> 人工序列
<400> 18
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly Gly Gly
450 455 460
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
465 470 475 480
Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu Pro Ala Pro
485 490 495
Val Arg Leu Pro Gly Pro Ala Asp Lys Thr His Thr Cys Pro Pro Cys
500 505 510
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
515 520 525
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
530 535 540
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
545 550 555 560
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
565 570 575
Glu Gln Tyr Ala Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
580 585 590
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
595 600 605
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
610 615 620
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
625 630 635 640
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
645 650 655
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
660 665 670
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
675 680 685
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
690 695 700
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
705 710 715 720
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Gly Ser Gly Gly Ser Gly
725 730 735
Gly Gly Gly Ser Leu Pro Glu Thr Gly Gly
740 745
<210> 19
<211> 2241
<212> PRT
<213> 人工序列
<400> 19
Ala Thr Gly Cys Ala Gly Cys Gly Cys Gly Thr Cys Ala Ala Thr Ala
1 5 10 15
Thr Gly Ala Thr Thr Ala Thr Gly Gly Cys Cys Gly Ala Gly Thr Cys
20 25 30
Thr Cys Cys Ala Gly Gly Cys Cys Thr Cys Ala Thr Thr Ala Cys Cys
35 40 45
Ala Thr Thr Thr Gly Thr Cys Thr Gly Cys Thr Gly Gly Gly Cys Thr
50 55 60
Ala Cys Cys Thr Gly Cys Thr Gly Thr Cys Cys Gly Cys Ala Gly Ala
65 70 75 80
Gly Thr Gly Thr Ala Cys Cys Gly Thr Cys Thr Thr Cys Cys Thr Cys
85 90 95
Gly Ala Cys Cys Ala Cys Gly Ala Gly Ala Ala Cys Gly Cys Ala Ala
100 105 110
Ala Thr Ala Ala Gly Ala Thr Thr Cys Thr Cys Ala Ala Thr Ala Gly
115 120 125
Gly Cys Cys Thr Ala Ala Gly Cys Gly Cys Thr Ala Cys Ala Ala Thr
130 135 140
Thr Cys Cys Gly Gly Ala Ala Ala Gly Cys Thr Cys Gly Ala Ala Gly
145 150 155 160
Ala Gly Thr Thr Thr Gly Thr Cys Cys Ala Gly Gly Gly Ala Ala Ala
165 170 175
Thr Cys Thr Gly Gly Ala Gly Cys Gly Cys Gly Ala Gly Thr Gly Thr
180 185 190
Ala Thr Gly Gly Ala Gly Gly Ala Ala Ala Ala Gly Thr Gly Thr Ala
195 200 205
Gly Cys Thr Thr Thr Gly Ala Ala Gly Ala Ala Gly Cys Thr Ala Gly
210 215 220
Ala Gly Ala Gly Gly Thr Gly Thr Thr Thr Gly Ala Gly Ala Ala Thr
225 230 235 240
Ala Cys Thr Gly Ala Gly Cys Gly Cys Ala Cys Thr Ala Cys Thr Gly
245 250 255
Ala Gly Thr Thr Thr Thr Gly Gly Ala Ala Gly Cys Ala Gly Thr Ala
260 265 270
Thr Gly Thr Gly Gly Ala Thr Gly Gly Cys Gly Ala Thr Cys Ala Gly
275 280 285
Thr Gly Cys Gly Ala Gly Thr Cys Cys Ala Ala Thr Cys Cys Ala Thr
290 295 300
Gly Cys Cys Thr Gly Ala Ala Thr Gly Gly Cys Gly Gly Ala Thr Cys
305 310 315 320
Thr Thr Gly Cys Ala Ala Gly Gly Ala Thr Gly Ala Thr Ala Thr Thr
325 330 335
Ala Ala Thr Thr Cys Thr Thr Ala Cys Gly Ala Gly Thr Gly Thr Thr
340 345 350
Gly Gly Thr Gly Cys Cys Cys Ala Thr Thr Cys Gly Gly Cys Thr Thr
355 360 365
Thr Gly Ala Gly Gly Gly Ala Ala Ala Gly Ala Ala Thr Thr Gly Cys
370 375 380
Gly Ala Ala Cys Thr Gly Gly Ala Thr Gly Thr Cys Ala Cys Ala Thr
385 390 395 400
Gly Thr Ala Ala Cys Ala Thr Cys Ala Ala Gly Ala Ala Cys Gly Gly
405 410 415
Cys Ala Gly Ala Thr Gly Cys Gly Ala Gly Cys Ala Gly Thr Thr Thr
420 425 430
Thr Gly Thr Ala Ala Gly Ala Ala Cys Ala Gly Cys Gly Cys Cys Gly
435 440 445
Ala Thr Ala Ala Thr Ala Ala Gly Gly Thr Gly Gly Thr Gly Thr Gly
450 455 460
Thr Ala Gly Thr Thr Gly Thr Ala Cys Thr Gly Ala Gly Gly Gly Ala
465 470 475 480
Thr Ala Cys Cys Gly Cys Cys Thr Cys Gly Cys Ala Gly Ala Gly Ala
485 490 495
Ala Thr Cys Ala Gly Ala Ala Gly Thr Cys Cys Thr Gly Thr Gly Ala
500 505 510
Gly Cys Cys Cys Gly Cys Thr Gly Thr Gly Cys Cys Ala Thr Thr Thr
515 520 525
Cys Cys Thr Thr Gly Thr Gly Gly Cys Cys Gly Gly Gly Thr Cys Ala
530 535 540
Gly Cys Gly Thr Cys Ala Gly Cys Cys Ala Gly Ala Cys Thr Thr Cys
545 550 555 560
Thr Ala Ala Gly Cys Thr Gly Ala Cys Ala Cys Gly Cys Gly Cys Cys
565 570 575
Gly Ala Gly Ala Cys Cys Gly Thr Cys Thr Thr Thr Cys Cys Ala Gly
580 585 590
Ala Thr Gly Thr Gly Gly Ala Thr Thr Ala Thr Gly Thr Cys Ala Ala
595 600 605
Cys Thr Cys Thr Ala Cys Thr Gly Ala Gly Gly Cys Cys Gly Ala Gly
610 615 620
Ala Cys Cys Ala Thr Thr Cys Thr Cys Gly Ala Thr Ala Ala Thr Ala
625 630 635 640
Thr Thr Ala Cys Thr Cys Ala Gly Thr Cys Thr Ala Cys Ala Cys Ala
645 650 655
Gly Thr Cys Cys Thr Thr Thr Ala Ala Cys Gly Ala Cys Thr Thr Cys
660 665 670
Ala Cys Thr Cys Gly Gly Gly Thr Gly Gly Thr Gly Gly Gly Cys Gly
675 680 685
Gly Ala Gly Ala Gly Gly Ala Cys Gly Cys Ala Ala Ala Gly Cys Cys
690 695 700
Thr Gly Gly Cys Cys Ala Gly Thr Thr Thr Cys Cys Thr Thr Gly Gly
705 710 715 720
Cys Ala Gly Gly Thr Cys Gly Thr Gly Cys Thr Cys Ala Ala Cys Gly
725 730 735
Gly Ala Ala Ala Gly Gly Thr Gly Gly Ala Cys Gly Cys Ala Thr Thr
740 745 750
Thr Thr Gly Thr Gly Gly Cys Gly Gly Ala Thr Cys Thr Ala Thr Cys
755 760 765
Gly Thr Gly Ala Ala Thr Gly Ala Gly Ala Ala Gly Thr Gly Gly Ala
770 775 780
Thr Thr Gly Thr Gly Ala Cys Cys Gly Cys Cys Gly Cys Thr Cys Ala
785 790 795 800
Cys Thr Gly Cys Gly Thr Cys Gly Ala Gly Ala Cys Ala Gly Gly Cys
805 810 815
Gly Thr Cys Ala Ala Gly Ala Thr Thr Ala Cys Cys Gly Thr Gly Gly
820 825 830
Thr Cys Gly Cys Thr Gly Gly Ala Gly Ala Gly Cys Ala Cys Ala Ala
835 840 845
Cys Ala Thr Thr Gly Ala Gly Gly Ala Ala Ala Cys Ala Gly Ala Gly
850 855 860
Cys Ala Cys Ala Cys Cys Gly Ala Gly Cys Ala Gly Ala Ala Gly Cys
865 870 875 880
Gly Cys Ala Ala Thr Gly Thr Gly Ala Thr Thr Cys Gly Cys Ala Thr
885 890 895
Cys Ala Thr Cys Cys Cys Ala Cys Ala Cys Cys Ala Cys Ala Ala Cys
900 905 910
Thr Ala Cys Ala Ala Cys Gly Cys Cys Gly Cys Thr Ala Thr Thr Ala
915 920 925
Ala Thr Ala Ala Gly Thr Ala Cys Ala Ala Cys Cys Ala Cys Gly Ala
930 935 940
Cys Ala Thr Cys Gly Cys Cys Cys Thr Gly Thr Thr Ala Gly Ala Ala
945 950 955 960
Cys Thr Ala Gly Ala Thr Gly Ala Gly Cys Cys Thr Cys Thr Gly Gly
965 970 975
Thr Cys Cys Thr Gly Ala Ala Thr Ala Gly Thr Thr Ala Cys Gly Thr
980 985 990
Cys Ala Cys Thr Cys Cys Thr Ala Thr Thr Thr Gly Thr Ala Thr Cys
995 1000 1005
Gly Cys Cys Gly Ala Thr Ala Ala Ala Gly Ala Ala Thr Ala Cys
1010 1015 1020
Ala Cys Thr Ala Ala Cys Ala Thr Cys Thr Thr Thr Cys Thr Cys
1025 1030 1035
Ala Ala Gly Thr Thr Cys Gly Gly Cys Thr Cys Thr Gly Gly Cys
1040 1045 1050
Thr Ala Thr Gly Thr Ala Thr Cys Thr Gly Gly Ala Thr Gly Gly
1055 1060 1065
Gly Gly Ala Cys Gly Gly Gly Thr Gly Thr Thr Thr Cys Ala Cys
1070 1075 1080
Ala Ala Gly Gly Gly Ala Cys Gly Gly Thr Cys Cys Gly Cys Ala
1085 1090 1095
Cys Thr Cys Gly Thr Gly Cys Thr Ala Cys Ala Ala Thr Ala Cys
1100 1105 1110
Cys Thr Cys Cys Gly Gly Gly Thr Gly Cys Cys Ala Cys Thr Gly
1115 1120 1125
Gly Thr Gly Gly Ala Thr Cys Gly Gly Gly Cys Ala Ala Cys Ala
1130 1135 1140
Thr Gly Cys Cys Thr Cys Cys Gly Gly Thr Cys Thr Ala Cys Cys
1145 1150 1155
Ala Ala Gly Thr Thr Thr Ala Cys Thr Ala Thr Ala Thr Ala Cys
1160 1165 1170
Ala Ala Thr Ala Ala Cys Ala Thr Gly Thr Thr Thr Thr Gly Cys
1175 1180 1185
Gly Cys Cys Gly Gly Cys Thr Thr Thr Cys Ala Cys Gly Ala Gly
1190 1195 1200
Gly Gly Cys Gly Gly Ala Cys Gly Gly Gly Ala Thr Ala Gly Thr
1205 1210 1215
Thr Gly Cys Cys Ala Gly Gly Gly Cys Gly Ala Thr Ala Gly Thr
1220 1225 1230
Gly Gly Ala Gly Gly Cys Cys Cys Thr Cys Ala Thr Gly Thr Cys
1235 1240 1245
Ala Cys Ala Gly Ala Gly Gly Thr Gly Gly Ala Gly Gly Gly Ala
1250 1255 1260
Ala Cys Thr Ala Gly Cys Thr Thr Thr Cys Thr Gly Ala Cys Ala
1265 1270 1275
Gly Gly Cys Ala Thr Thr Ala Thr Cys Thr Cys Thr Thr Gly Gly
1280 1285 1290
Gly Gly Cys Gly Ala Ala Gly Ala Gly Thr Gly Cys Gly Cys Thr
1295 1300 1305
Ala Thr Gly Ala Ala Gly Gly Gly Ala Ala Ala Gly Thr Ala Cys
1310 1315 1320
Gly Gly Cys Ala Thr Cys Thr Ala Thr Ala Cys Thr Ala Ala Gly
1325 1330 1335
Gly Thr Cys Thr Cys Gly Cys Gly Thr Thr Ala Cys Gly Thr Cys
1340 1345 1350
Ala Ala Thr Thr Gly Gly Ala Thr Cys Ala Ala Gly Gly Ala Ala
1355 1360 1365
Ala Ala Gly Ala Cys Ala Ala Ala Gly Cys Thr Gly Ala Cys Ala
1370 1375 1380
Gly Gly Cys Gly Gly Cys Gly Gly Ala Gly Gly Gly Ala Gly Cys
1385 1390 1395
Gly Gly Cys Gly Gly Cys Gly Gly Ala Gly Gly Cys Thr Cys Thr
1400 1405 1410
Gly Gly Cys Gly Gly Cys Gly Gly Cys Gly Gly Ala Thr Cys Thr
1415 1420 1425
Gly Gly Cys Gly Gly Ala Gly Gly Cys Gly Gly Cys Thr Cys Thr
1430 1435 1440
Gly Gly Cys Gly Gly Ala Gly Gly Cys Gly Gly Ala Thr Cys Cys
1445 1450 1455
Gly Thr Cys Gly Cys Thr Cys Cys Ala Cys Cys Ala Cys Cys Thr
1460 1465 1470
Gly Cys Ala Cys Thr Cys Cys Cys Cys Gly Cys Cys Cys Cys Thr
1475 1480 1485
Gly Thr Cys Ala Gly Ala Cys Thr Gly Cys Cys Thr Gly Gly Ala
1490 1495 1500
Cys Cys Cys Gly Cys Thr Gly Ala Thr Ala Ala Gly Ala Cys Cys
1505 1510 1515
Cys Ala Cys Ala Cys Ala Thr Gly Thr Cys Cys Ala Cys Cys Thr
1520 1525 1530
Thr Gly Cys Cys Cys Ala Gly Cys Ala Cys Cys Thr Gly Ala Gly
1535 1540 1545
Cys Thr Gly Cys Thr Gly Gly Gly Cys Gly Gly Ala Cys Cys Thr
1550 1555 1560
Ala Gly Cys Gly Thr Gly Thr Thr Thr Cys Thr Gly Thr Thr Cys
1565 1570 1575
Cys Cys Ala Cys Cys Ala Ala Ala Gly Cys Cys Ala Ala Ala Gly
1580 1585 1590
Gly Ala Cys Ala Cys Cys Cys Thr Cys Ala Thr Gly Ala Thr Thr
1595 1600 1605
Ala Gly Thr Ala Gly Ala Ala Cys Cys Cys Cys Ala Gly Ala Gly
1610 1615 1620
Gly Thr Gly Ala Cys Thr Thr Gly Cys Gly Thr Cys Gly Thr Gly
1625 1630 1635
Gly Thr Cys Gly Ala Thr Gly Thr Cys Ala Gly Thr Cys Ala Cys
1640 1645 1650
Gly Ala Gly Gly Ala Cys Cys Cys Cys Gly Ala Gly Gly Thr Gly
1655 1660 1665
Ala Ala Gly Thr Thr Thr Ala Ala Thr Thr Gly Gly Thr Ala Thr
1670 1675 1680
Gly Thr Ala Gly Ala Thr Gly Gly Cys Gly Thr Cys Gly Ala Gly
1685 1690 1695
Gly Thr Gly Cys Ala Cys Ala Ala Cys Gly Cys Thr Ala Ala Gly
1700 1705 1710
Ala Cys Cys Ala Ala Gly Cys Cys Ala Cys Gly Cys Gly Ala Ala
1715 1720 1725
Gly Ala Gly Cys Ala Gly Thr Ala Cys Gly Cys Ala Thr Cys Thr
1730 1735 1740
Ala Cys Thr Thr Ala Cys Cys Gly Gly Gly Thr Cys Gly Thr Cys
1745 1750 1755
Thr Cys Thr Gly Thr Gly Cys Thr Gly Ala Cys Thr Gly Thr Gly
1760 1765 1770
Cys Thr Gly Cys Ala Cys Cys Ala Gly Gly Ala Thr Thr Gly Gly
1775 1780 1785
Cys Thr Cys Ala Ala Thr Gly Gly Cys Ala Ala Ala Gly Ala Gly
1790 1795 1800
Thr Ala Cys Ala Ala Gly Thr Gly Thr Ala Ala Gly Gly Thr Cys
1805 1810 1815
Ala Gly Thr Ala Ala Thr Ala Ala Gly Gly Cys Cys Cys Thr Cys
1820 1825 1830
Cys Cys Cys Gly Cys Ala Cys Cys Thr Ala Thr Thr Gly Ala Ala
1835 1840 1845
Ala Ala Gly Ala Cys Thr Ala Thr Thr Ala Gly Cys Ala Ala Gly
1850 1855 1860
Gly Cys Ala Ala Ala Gly Gly Gly Cys Cys Ala Gly Cys Cys Thr
1865 1870 1875
Ala Gly Gly Gly Ala Gly Cys Cys Cys Cys Ala Gly Gly Thr Cys
1880 1885 1890
Thr Ala Cys Ala Cys Cys Cys Thr Gly Cys Cys Cys Cys Cys Thr
1895 1900 1905
Thr Cys Cys Cys Gly Cys Gly Ala Thr Gly Ala Gly Cys Thr Gly
1910 1915 1920
Ala Cys Thr Ala Ala Gly Ala Ala Thr Cys Ala Gly Gly Thr Cys
1925 1930 1935
Thr Cys Thr Cys Thr Cys Ala Cys Thr Thr Gly Cys Cys Thr Cys
1940 1945 1950
Gly Thr Gly Ala Ala Gly Gly Gly Cys Thr Thr Thr Thr Ala Cys
1955 1960 1965
Cys Cys Ala Thr Cys Cys Gly Ala Cys Ala Thr Thr Gly Cys Cys
1970 1975 1980
Gly Thr Gly Gly Ala Gly Thr Gly Gly Gly Ala Gly Thr Cys Cys
1985 1990 1995
Ala Ala Cys Gly Gly Ala Cys Ala Gly Cys Cys Ala Gly Ala Gly
2000 2005 2010
Ala Ala Thr Ala Ala Cys Thr Ala Cys Ala Ala Gly Ala Cys Ala
2015 2020 2025
Ala Cys Thr Cys Cys Thr Cys Cys Cys Gly Thr Gly Cys Thr Cys
2030 2035 2040
Gly Ala Thr Ala Gly Cys Gly Ala Cys Gly Gly Thr Thr Cys Ala
2045 2050 2055
Thr Thr Cys Thr Thr Cys Cys Thr Gly Thr Ala Cys Thr Cys Cys
2060 2065 2070
Ala Ala Gly Cys Thr Cys Ala Cys Cys Gly Thr Thr Gly Ala Thr
2075 2080 2085
Ala Ala Gly Thr Cys Thr Cys Gly Gly Thr Gly Gly Cys Ala Gly
2090 2095 2100
Cys Ala Gly Gly Gly Ala Ala Ala Thr Gly Thr Gly Thr Thr Cys
2105 2110 2115
Thr Cys Thr Thr Gly Thr Thr Cys Cys Gly Thr Cys Ala Thr Gly
2120 2125 2130
Cys Ala Cys Gly Ala Gly Gly Cys Ala Cys Thr Gly Cys Ala Cys
2135 2140 2145
Ala Ala Thr Cys Ala Cys Thr Ala Cys Ala Cys Cys Cys Ala Gly
2150 2155 2160
Ala Ala Gly Thr Cys Cys Cys Thr Gly Thr Cys Cys Cys Thr Cys
2165 2170 2175
Ala Gly Cys Cys Cys Thr Gly Gly Cys Ala Ala Ala Gly Gly Cys
2180 2185 2190
Ala Gly Cys Gly Gly Cys Gly Gly Ala Thr Cys Thr Gly Gly Ala
2195 2200 2205
Gly Gly Cys Gly Gly Cys Gly Gly Ala Thr Cys Cys Cys Thr Cys
2210 2215 2220
Cys Cys Ala Gly Ala Gly Ala Cys Cys Gly Gly Cys Gly Gly Ala
2225 2230 2235
Thr Gly Ala
2240
<210> 20
<211> 746
<212> PRT
<213> 人工序列
<400> 20
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly Gly Gly
450 455 460
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
465 470 475 480
Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu Pro Ala Val
485 490 495
Ala Pro Pro Pro Ala Leu Pro Ala Asp Lys Thr His Thr Cys Pro Pro
500 505 510
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
515 520 525
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
530 535 540
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
545 550 555 560
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
565 570 575
Glu Glu Gln Tyr Ala Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
580 585 590
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
595 600 605
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
610 615 620
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp
625 630 635 640
Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
645 650 655
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
660 665 670
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
675 680 685
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
690 695 700
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
705 710 715 720
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Gly Ser Gly Gly Ser Gly
725 730 735
Gly Gly Gly Ser Leu Pro Glu Thr Gly Gly
740 745
<210> 21
<211> 2241
<212> DNA
<213> 人工序列
<400> 21
atgcagcgcg tcaatatgat tatggccgag tctccaggcc tcattaccat ttgtctgctg 60
ggctacctgc tgtccgcaga gtgtaccgtc ttcctcgacc acgagaacgc aaataagatt 120
ctcaataggc ctaagcgcta caattccgga aagctcgaag agtttgtcca gggaaatctg 180
gagcgcgagt gtatggagga aaagtgtagc tttgaagaag ctagagaggt gtttgagaat 240
actgagcgca ctactgagtt ttggaagcag tatgtggatg gcgatcagtg cgagtccaat 300
ccatgcctga atggcggatc ttgcaaggat gatattaatt cttacgagtg ttggtgccca 360
ttcggctttg agggaaagaa ttgcgaactg gatgtcacat gtaacatcaa gaacggcaga 420
tgcgagcagt tttgtaagaa cagcgccgat aataaggtgg tgtgtagttg tactgaggga 480
taccgcctcg cagagaatca gaagtcctgt gagcccgctg tgccatttcc ttgtggccgg 540
gtcagcgtca gccagacttc taagctgaca cgcgccgaga ccgtctttcc agatgtggat 600
tatgtcaact ctactgaggc cgagaccatt ctcgataata ttactcagtc tacacagtcc 660
tttaacgact tcactcgggt ggtgggcgga gaggacgcaa agcctggcca gtttccttgg 720
caggtcgtgc tcaacggaaa ggtggacgca ttttgtggcg gatctatcgt gaatgagaag 780
tggattgtga ccgccgctca ctgcgtcgag acaggcgtca agattaccgt ggtcgctgga 840
gagcacaaca ttgaggaaac agagcacacc gagcagaagc gcaatgtgat tcgcatcatc 900
ccacaccaca actacaacgc cgctattaat aagtacaacc acgacatcgc cctgttagaa 960
ctagatgagc ctctggtcct gaatagttac gtcactccta tttgtatcgc cgataaagaa 1020
tacactaaca tctttctcaa gttcggctct ggctatgtat ctggatgggg acgggtgttt 1080
cacaagggac ggtccgcact cgtgctacaa tacctccggg tgccactggt ggatcgggca 1140
acatgcctcc ggtctaccaa gtttactata tacaataaca tgttttgcgc cggctttcac 1200
gagggcggac gggatagttg ccagggcgat agtggaggcc ctcatgtcac agaggtggag 1260
ggaactagct ttctgacagg cattatctct tggggcgaag agtgcgctat gaagggaaag 1320
tacggcatct atactaaggt ctcgcgttac gtcaattgga tcaaggaaaa gacaaagctg 1380
acaggcggcg gagggagcgg cggcggaggc tctggcggcg gcggatctgg cggaggcggc 1440
tctggcggag gcggatccgt cgctccacca cctgcactcc ccgccgtggc tcctccacct 1500
gctttgcccg ctgataagac ccacacatgt ccaccttgcc cagcacctga gctgctgggc 1560
ggacctagcg tgtttctgtt cccaccaaag ccaaaggaca ccctcatgat tagtagaacc 1620
ccagaggtga cttgcgtcgt ggtcgatgtc agtcacgagg accccgaggt gaagtttaat 1680
tggtatgtag atggcgtcga ggtgcacaac gctaagacca agccacgcga agagcagtac 1740
gcatctactt accgggtcgt ctctgtgctg actgtgctgc accaggattg gctcaatggc 1800
aaagagtaca agtgtaaggt cagtaataag gccctccccg cacctattga aaagactatt 1860
agcaaggcaa agggccagcc tagggagccc caggtctaca ccctgccccc ttcccgcgat 1920
gagctgacta agaatcaggt ctctctcact tgcctcgtga agggctttta cccatccgac 1980
attgccgtgg agtgggagtc caacggacag ccagagaata actacaagac aactcctccc 2040
gtgctcgata gcgacggttc attcttcctg tactccaagc tcaccgttga taagtctcgg 2100
tggcagcagg gaaatgtgtt ctcttgttcc gtcatgcacg aggcactgca caatcactac 2160
acccagaagt ccctgtccct cagccctggc ggcagcggcg gatctggagg cggcggatct 2220
ctcccagaga ccggcggata a 2241
<210> 22
<211> 764
<212> PRT
<213> 人工序列
<400> 22
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly Gly Gly
450 455 460
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
465 470 475 480
Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu Pro Ala Val
485 490 495
Ala Pro Pro Pro Ala Leu Pro Ala Val Ala Pro Pro Pro Ala Leu Pro
500 505 510
Ala Pro Val Arg Leu Pro Gly Pro Ala Asp Lys Thr His Thr Cys Pro
515 520 525
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
530 535 540
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
545 550 555 560
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
565 570 575
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
580 585 590
Arg Glu Glu Gln Tyr Ala Ser Thr Tyr Arg Val Val Ser Val Leu Thr
595 600 605
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
610 615 620
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
625 630 635 640
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
645 650 655
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
660 665 670
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
675 680 685
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
690 695 700
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
705 710 715 720
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
725 730 735
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Gly Ser Gly Gly
740 745 750
Ser Gly Gly Gly Gly Ser Leu Pro Glu Thr Gly Gly
755 760
<210> 23
<211> 2295
<212> DNA
<213> 人工序列
<400> 23
atgcagcgcg tcaatatgat tatggccgag tctccaggcc tcattaccat ttgtctgctg 60
ggctacctgc tgtccgcaga gtgtaccgtc ttcctcgacc acgagaacgc aaataagatt 120
ctcaataggc ctaagcgcta caattccgga aagctcgaag agtttgtcca gggaaatctg 180
gagcgcgagt gtatggagga aaagtgtagc tttgaagaag ctagagaggt gtttgagaat 240
actgagcgca ctactgagtt ttggaagcag tatgtggatg gcgatcagtg cgagtccaat 300
ccatgcctga atggcggatc ttgcaaggat gatattaatt cttacgagtg ttggtgccca 360
ttcggctttg agggaaagaa ttgcgaactg gatgtcacat gtaacatcaa gaacggcaga 420
tgcgagcagt tttgtaagaa cagcgccgat aataaggtgg tgtgtagttg tactgaggga 480
taccgcctcg cagagaatca gaagtcctgt gagcccgctg tgccatttcc ttgtggccgg 540
gtcagcgtca gccagacttc taagctgaca cgcgccgaga ccgtctttcc agatgtggat 600
tatgtcaact ctactgaggc cgagaccatt ctcgataata ttactcagtc tacacagtcc 660
tttaacgact tcactcgggt ggtgggcgga gaggacgcaa agcctggcca gtttccttgg 720
caggtcgtgc tcaacggaaa ggtggacgca ttttgtggcg gatctatcgt gaatgagaag 780
tggattgtga ccgccgctca ctgcgtcgag acaggcgtca agattaccgt ggtcgctgga 840
gagcacaaca ttgaggaaac agagcacacc gagcagaagc gcaatgtgat tcgcatcatc 900
ccacaccaca actacaacgc cgctattaat aagtacaacc acgacatcgc cctgttagaa 960
ctagatgagc ctctggtcct gaatagttac gtcactccta tttgtatcgc cgataaagaa 1020
tacactaaca tctttctcaa gttcggctct ggctatgtat ctggatgggg acgggtgttt 1080
cacaagggac ggtccgcact cgtgctacaa tacctccggg tgccactggt ggatcgggca 1140
acatgcctcc ggtctaccaa gtttactata tacaataaca tgttttgcgc cggctttcac 1200
gagggcggac gggatagttg ccagggcgat agtggaggcc ctcatgtcac agaggtggag 1260
ggaactagct ttctgacagg cattatctct tggggcgaag agtgcgctat gaagggaaag 1320
tacggcatct atactaaggt ctcgcgttac gtcaattgga tcaaggaaaa gacaaagctg 1380
acaggcggcg gagggagcgg cggcggaggc tctggcggcg gcggatctgg cggaggcggc 1440
tctggcggag gcggatctgt cgctccacca cctgcactcc ccgccgtggc tcctccacct 1500
gctttgcccg ctgtcgctcc accacctgca ctccccgccc ctgtcagact gcctggaccc 1560
gctgataaga cccacacatg tccaccttgc ccagcacctg agctgctggg cggacctagc 1620
gtgtttctgt tcccaccaaa gccaaaggac accctcatga ttagtagaac cccagaggtg 1680
acttgcgtcg tggtcgatgt cagtcacgag gaccccgagg tgaagtttaa ttggtatgta 1740
gatggcgtcg aggtgcacaa cgctaagacc aagccacgcg aagagcagta cgcatctact 1800
taccgggtcg tctctgtgct gactgtgctg caccaggatt ggctcaatgg caaagagtac 1860
aagtgtaagg tcagtaataa ggccctcccc gcacctattg aaaagactat tagcaaggca 1920
aagggccagc ctagggagcc ccaggtctac accctgcccc cttcccgcga tgagctgact 1980
aagaatcagg tctctctcac ttgcctcgtg aagggctttt acccatccga cattgccgtg 2040
gagtgggagt ccaacggaca gccagagaat aactacaaga caactcctcc cgtgctcgat 2100
agcgacggtt cattcttcct gtactccaag ctcaccgttg ataagtctcg gtggcagcag 2160
ggaaatgtgt tctcttgttc cgtcatgcac gaggcactgc acaatcacta cacccagaag 2220
tccctgtccc tcagccctgg caaaggcagc ggcggatctg gaggcggcgg atccctccca 2280
gagaccggcg gatga 2295
<210> 24
<211> 763
<212> PRT
<213> 人工序列
<400> 24
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly Gly Gly
450 455 460
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
465 470 475 480
Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu Pro Ala Pro
485 490 495
Val Arg Leu Pro Gly Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala
500 505 510
Val Ala Pro Pro Pro Ala Leu Pro Ala Asp Lys Thr His Thr Cys Pro
515 520 525
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
530 535 540
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
545 550 555 560
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
565 570 575
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
580 585 590
Arg Glu Glu Gln Tyr Ala Ser Thr Tyr Arg Val Val Ser Val Leu Thr
595 600 605
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
610 615 620
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
625 630 635 640
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
645 650 655
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
660 665 670
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
675 680 685
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
690 695 700
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
705 710 715 720
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
725 730 735
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Gly Ser Gly Gly Ser
740 745 750
Gly Gly Gly Gly Ser Leu Pro Glu Thr Gly Gly
755 760
<210> 25
<211> 2292
<212> DNA
<213> 人工序列
<400> 25
atgcagcgcg tcaatatgat tatggccgag tctccaggcc tcattaccat ttgtctgctg 60
ggctacctgc tgtccgcaga gtgtaccgtc ttcctcgacc acgagaacgc aaataagatt 120
ctcaataggc ctaagcgcta caattccgga aagctcgaag agtttgtcca gggaaatctg 180
gagcgcgagt gtatggagga aaagtgtagc tttgaagaag ctagagaggt gtttgagaat 240
actgagcgca ctactgagtt ttggaagcag tatgtggatg gcgatcagtg cgagtccaat 300
ccatgcctga atggcggatc ttgcaaggat gatattaatt cttacgagtg ttggtgccca 360
ttcggctttg agggaaagaa ttgcgaactg gatgtcacat gtaacatcaa gaacggcaga 420
tgcgagcagt tttgtaagaa cagcgccgat aataaggtgg tgtgtagttg tactgaggga 480
taccgcctcg cagagaatca gaagtcctgt gagcccgctg tgccatttcc ttgtggccgg 540
gtcagcgtca gccagacttc taagctgaca cgcgccgaga ccgtctttcc agatgtggat 600
tatgtcaact ctactgaggc cgagaccatt ctcgataata ttactcagtc tacacagtcc 660
tttaacgact tcactcgggt ggtgggcgga gaggacgcaa agcctggcca gtttccttgg 720
caggtcgtgc tcaacggaaa ggtggacgca ttttgtggcg gatctatcgt gaatgagaag 780
tggattgtga ccgccgctca ctgcgtcgag acaggcgtca agattaccgt ggtcgctgga 840
gagcacaaca ttgaggaaac agagcacacc gagcagaagc gcaatgtgat tcgcatcatc 900
ccacaccaca actacaacgc cgctattaat aagtacaacc acgacatcgc cctgttagaa 960
ctagatgagc ctctggtcct gaatagttac gtcactccta tttgtatcgc cgataaagaa 1020
tacactaaca tctttctcaa gttcggctct ggctatgtat ctggatgggg acgggtgttt 1080
cacaagggac ggtccgcact cgtgctacaa tacctccggg tgccactggt ggatcgggca 1140
acatgcctcc ggtctaccaa gtttactata tacaataaca tgttttgcgc cggctttcac 1200
gagggcggac gggatagttg ccagggcgat agtggaggcc ctcatgtcac agaggtggag 1260
ggaactagct ttctgacagg cattatctct tggggcgaag agtgcgctat gaagggaaag 1320
tacggcatct atactaaggt ctcgcgttac gtcaattgga tcaaggaaaa gacaaagctg 1380
acaggcggcg gagggagcgg cggcggaggc tctggcggcg gcggatctgg cggaggcggc 1440
tctggcggag gcggatctgt cgctccacca cctgcactcc ccgcccctgt cagactgcct 1500
ggacccgctg tcgctccacc acctgcactc cccgccgtgg ctcctccacc tgctttgccc 1560
gctgataaga cccacacatg tccaccttgc ccagcacctg agctgctggg cggacctagc 1620
gtgtttctgt tcccaccaaa gccaaaggac accctcatga ttagtagaac cccagaggtg 1680
acttgcgtcg tggtcgatgt cagtcacgag gaccccgagg tgaagtttaa ttggtatgta 1740
gatggcgtcg aggtgcacaa cgctaagacc aagccacgcg aagagcagta cgcatctact 1800
taccgggtcg tctctgtgct gactgtgctg caccaggatt ggctcaatgg caaagagtac 1860
aagtgtaagg tcagtaataa ggccctcccc gcacctattg aaaagactat tagcaaggca 1920
aagggccagc ctagggagcc ccaggtctac accctgcccc cttcccgcga tgagctgact 1980
aagaatcagg tctctctcac ttgcctcgtg aagggctttt acccatccga cattgccgtg 2040
gagtgggagt ccaacggaca gccagagaat aactacaaga caactcctcc cgtgctcgat 2100
agcgacggtt cattcttcct gtactccaag ctcaccgttg ataagtctcg gtggcagcag 2160
ggaaatgtgt tctcttgttc cgtcatgcac gaggcactgc acaatcacta cacccagaag 2220
tccctgtccc tcagccctgg cggcagcggc ggatctggag gcggcggatc tctcccagag 2280
accggcggat ga 2292
<210> 26
<211> 766
<212> PRT
<213> 人工序列
<400> 26
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly Gly Gly
450 455 460
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
465 470 475 480
Ser Gly Gly Gly Gly Ser Val Ala Pro Pro Pro Ala Leu Pro Ala Val
485 490 495
Ala Pro Pro Pro Ala Leu Pro Ala Gly Ser Val Ala Pro Pro Pro Ala
500 505 510
Leu Pro Ala Val Ala Pro Pro Pro Ala Leu Pro Ala Asp Lys Thr His
515 520 525
Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
530 535 540
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
545 550 555 560
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
565 570 575
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
580 585 590
Thr Lys Pro Arg Glu Glu Gln Tyr Ala Ser Thr Tyr Arg Val Val Ser
595 600 605
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
610 615 620
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
625 630 635 640
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
645 650 655
Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
660 665 670
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
675 680 685
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
690 695 700
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
705 710 715 720
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
725 730 735
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Gly Ser
740 745 750
Gly Gly Ser Gly Gly Gly Gly Ser Leu Pro Glu Thr Gly Gly
755 760 765
<210> 27
<211> 2301
<212> DNA
<213> 人工序列
<400> 27
atgcagcgcg tcaatatgat tatggccgag tctccaggcc tcattaccat ttgtctgctg 60
ggctacctgc tgtccgcaga gtgtaccgtc ttcctcgacc acgagaacgc aaataagatt 120
ctcaataggc ctaagcgcta caattccgga aagctcgaag agtttgtcca gggaaatctg 180
gagcgcgagt gtatggagga aaagtgtagc tttgaagaag ctagagaggt gtttgagaat 240
actgagcgca ctactgagtt ttggaagcag tatgtggatg gcgatcagtg cgagtccaat 300
ccatgcctga atggcggatc ttgcaaggat gatattaatt cttacgagtg ttggtgccca 360
ttcggctttg agggaaagaa ttgcgaactg gatgtcacat gtaacatcaa gaacggcaga 420
tgcgagcagt tttgtaagaa cagcgccgat aataaggtgg tgtgtagttg tactgaggga 480
taccgcctcg cagagaatca gaagtcctgt gagcccgctg tgccatttcc ttgtggccgg 540
gtcagcgtca gccagacttc taagctgaca cgcgccgaga ccgtctttcc agatgtggat 600
tatgtcaact ctactgaggc cgagaccatt ctcgataata ttactcagtc tacacagtcc 660
tttaacgact tcactcgggt ggtgggcgga gaggacgcaa agcctggcca gtttccttgg 720
caggtcgtgc tcaacggaaa ggtggacgca ttttgtggcg gatctatcgt gaatgagaag 780
tggattgtga ccgccgctca ctgcgtcgag acaggcgtca agattaccgt ggtcgctgga 840
gagcacaaca ttgaggaaac agagcacacc gagcagaagc gcaatgtgat tcgcatcatc 900
ccacaccaca actacaacgc cgctattaat aagtacaacc acgacatcgc cctgttagaa 960
ctagatgagc ctctggtcct gaatagttac gtcactccta tttgtatcgc cgataaagaa 1020
tacactaaca tctttctcaa gttcggctct ggctatgtat ctggatgggg acgggtgttt 1080
cacaagggac ggtccgcact cgtgctacaa tacctccggg tgccactggt ggatcgggca 1140
acatgcctcc ggtctaccaa gtttactata tacaataaca tgttttgcgc cggctttcac 1200
gagggcggac gggatagttg ccagggcgat agtggaggcc ctcatgtcac agaggtggag 1260
ggaactagct ttctgacagg cattatctct tggggcgaag agtgcgctat gaagggaaag 1320
tacggcatct atactaaggt ctcgcgttac gtcaattgga tcaaggaaaa gacaaagctg 1380
acaggcggcg gagggagcgg cggcggaggc tctggcggcg gcggatctgg cggaggcggc 1440
tctggcggag gcggatctgt cgctccacca cctgcactcc ccgccgtggc tcctccacct 1500
gctttgcccg ctggatccgt cgctccacca cctgcactcc ccgccgtggc tcctccacct 1560
gctttgcccg ctgataagac ccacacatgt ccaccttgcc cagcacctga gctgctgggc 1620
ggacctagcg tgtttctgtt cccaccaaag ccaaaggaca ccctcatgat tagtagaacc 1680
ccagaggtga cttgcgtcgt ggtcgatgtc agtcacgagg accccgaggt gaagtttaat 1740
tggtatgtag atggcgtcga ggtgcacaac gctaagacca agccacgcga agagcagtac 1800
gcatctactt accgggtcgt ctctgtgctg actgtgctgc accaggattg gctcaatggc 1860
aaagagtaca agtgtaaggt cagtaataag gccctccccg cacctattga aaagactatt 1920
agcaaggcaa agggccagcc tagggagccc caggtctaca ccctgccccc ttcccgcgat 1980
gagctgacta agaatcaggt ctctctcact tgcctcgtga agggctttta cccatccgac 2040
attgccgtgg agtgggagtc caacggacag ccagagaata actacaagac aactcctccc 2100
gtgctcgata gcgacggttc attcttcctg tactccaagc tcaccgttga taagtctcgg 2160
tggcagcagg gaaatgtgtt ctcttgttcc gtcatgcacg aggcactgca caatcactac 2220
acccagaagt ccctgtccct cagccctggc ggcagcggcg gatctggagg cggcggatct 2280
ctcccagaga ccggcggata a 2301
<210> 28
<211> 728
<212> PRT
<213> 人工序列
<400> 28
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly Gly Gly
450 455 460
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
465 470 475 480
Ser Gly Gly Gly Gly Ser Asp Lys Thr His Thr Cys Pro Pro Cys Pro
485 490 495
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
500 505 510
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
515 520 525
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
530 535 540
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
545 550 555 560
Gln Tyr Ala Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
565 570 575
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
580 585 590
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
595 600 605
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu
610 615 620
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro
625 630 635 640
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
645 650 655
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
660 665 670
Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
675 680 685
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
690 695 700
Lys Ser Leu Ser Leu Ser Pro Gly Gly Ser Gly Gly Ser Gly Gly Gly
705 710 715 720
Gly Ser Leu Pro Glu Thr Gly Gly
725
<210> 29
<211> 2187
<212> DNA
<213> 人工序列
<400> 29
atgcagcgcg tcaatatgat tatggccgag tctccaggcc tcattaccat ttgtctgctg 60
ggctacctgc tgtccgcaga gtgtaccgtc ttcctcgacc acgagaacgc aaataagatt 120
ctcaataggc ctaagcgcta caattccgga aagctcgaag agtttgtcca gggaaatctg 180
gagcgcgagt gtatggagga aaagtgtagc tttgaagaag ctagagaggt gtttgagaat 240
actgagcgca ctactgagtt ttggaagcag tatgtggatg gcgatcagtg cgagtccaat 300
ccatgcctga atggcggatc ttgcaaggat gatattaatt cttacgagtg ttggtgccca 360
ttcggctttg agggaaagaa ttgcgaactg gatgtcacat gtaacatcaa gaacggcaga 420
tgcgagcagt tttgtaagaa cagcgccgat aataaggtgg tgtgtagttg tactgaggga 480
taccgcctcg cagagaatca gaagtcctgt gagcccgctg tgccatttcc ttgtggccgg 540
gtcagcgtca gccagacttc taagctgaca cgcgccgaga ccgtctttcc agatgtggat 600
tatgtcaact ctactgaggc cgagaccatt ctcgataata ttactcagtc tacacagtcc 660
tttaacgact tcactcgggt ggtgggcgga gaggacgcaa agcctggcca gtttccttgg 720
caggtcgtgc tcaacggaaa ggtggacgca ttttgtggcg gatctatcgt gaatgagaag 780
tggattgtga ccgccgctca ctgcgtcgag acaggcgtca agattaccgt ggtcgctgga 840
gagcacaaca ttgaggaaac agagcacacc gagcagaagc gcaatgtgat tcgcatcatc 900
ccacaccaca actacaacgc cgctattaat aagtacaacc acgacatcgc cctgttagaa 960
ctagatgagc ctctggtcct gaatagttac gtcactccta tttgtatcgc cgataaagaa 1020
tacactaaca tctttctcaa gttcggctct ggctatgtat ctggatgggg acgggtgttt 1080
cacaagggac ggtccgcact cgtgctacaa tacctccggg tgccactggt ggatcgggca 1140
acatgcctcc ggtctaccaa gtttactata tacaataaca tgttttgcgc cggctttcac 1200
gagggcggac gggatagttg ccagggcgat agtggaggcc ctcatgtcac agaggtggag 1260
ggaactagct ttctgacagg cattatctct tggggcgaag agtgcgctat gaagggaaag 1320
tacggcatct atactaaggt ctcgcgttac gtcaattgga tcaaggaaaa gacaaagctg 1380
acaggcggcg gagggagcgg cggcggaggc tctggcggcg gcggatctgg cggaggcggc 1440
tctggcggag gcggatccga taagacccac acatgtccac cttgcccagc acctgagctg 1500
ctgggcggac ctagcgtgtt tctgttccca ccaaagccaa aggacaccct catgattagt 1560
agaaccccag aggtgacttg cgtcgtggtc gatgtcagtc acgaggaccc cgaggtgaag 1620
tttaattggt atgtagatgg cgtcgaggtg cacaacgcta agaccaagcc acgcgaagag 1680
cagtacgcat ctacttaccg ggtcgtctct gtgctgactg tgctgcacca ggattggctc 1740
aatggcaaag agtacaagtg taaggtcagt aataaggccc tccccgcacc tattgaaaag 1800
actattagca aggcaaaggg ccagcctagg gagccccagg tctacaccct gcccccttcc 1860
cgcgatgagc tgactaagaa tcaggtctct ctcacttgcc tcgtgaaggg cttttaccca 1920
tccgacattg ccgtggagtg ggagtccaac ggacagccag agaataacta caagacaact 1980
cctcccgtgc tcgatagcga cggttcattc ttcctgtact ccaagctcac cgttgataag 2040
tctcggtggc agcagggaaa tgtgttctct tgttccgtca tgcacgaggc actgcacaat 2100
cactacaccc agaagtccct gtccctcagc cctggcggca gcggcggatc tggaggcggc 2160
ggatctctcc cagagaccgg cggataa 2187
<210> 30
<211> 37
<212> DNA
<213> 人工序列
<400> 30
tcaggaagat ctcgcgaatt aattctgtgg aatgtgt 37
<210> 31
<211> 36
<212> DNA
<213> 人工序列
<400> 31
tatcctagat ctgctggcac gacaggtttc ccgact 36
<210> 32
<211> 87
<212> DNA
<213> 人工序列
<400> 32
ttcgcggatc cgtcgctcca ccacctgcac tccccgccgt ggctcctcca cctgctttgc 60
ccgctgataa gacccacaca tgtccac 87
<210> 33
<211> 87
<212> DNA
<213> 人工序列
<400> 33
taaccggaat tcattatccg ccggtctctg ggagagatcc gccgcctcca gatccgccgc 60
tgccgccagg gctgagggac agggact 87
<210> 34
<211> 48
<212> DNA
<213> 人工序列
<400> 34
tggctcctcc acctgctttg cccgctgtcg ctccaccacc tgcactcc 48
<210> 35
<211> 57
<212> DNA
<213> 人工序列
<400> 35
tagatctgtc gctccaccac ctgcactccc cgccgtggct cctccacctg ctttgcc 57
<210> 36
<211> 31
<212> DNA
<213> 人工序列
<400> 36
tgaattctta tcatccgccg gtctctggga g 31
<210> 37
<211> 47
<212> DNA
<213> 人工序列
<400> 37
ccctgtcaga ctgcctggac ccgctgtcgc tccaccacct gcactcc 47
<210> 38
<211> 54
<212> DNA
<213> 人工序列
<400> 38
tagatctgtc gctccaccac ctgcactccc cgcccctgtc agactgcctg gacc 54
<210> 39
<211> 27
<212> DNA
<213> 人工序列
<400> 39
atataagctt ccgccaccat gcagcgc 27
<210> 40
<211> 34
<212> DNA
<213> 人工序列
<400> 40
atatggatcc agcgggcaaa gcaggtggag gagc 34
<210> 41
<211> 37
<212> DNA
<213> 人工序列
<400> 41
gatttggatc cgataagacc cacacatgtc caccttg 37
<210> 42
<211> 87
<212> DNA
<213> 人工序列
<400> 42
taaccggaat tcattatccg ccggtctctg ggagagatcc gccgcctcca gatccgccgc 60
tgccgccagg gctgagggac agggact 87

Claims (20)

1.一种凝血因子IX(FIX)的融合蛋白,其包括凝血因子IX活性部分以及与其连接的延长半衰期的融合伴侣(FP);其中所述凝血因子IX活性部分与所述融合伴侣直接连接或者通过第一接头L1连接;优选地,所述第一接头L1为包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸的肽段;更优选地,所述第一接头L1包含柔性肽段和/或刚性单元,所述柔性肽段为包含甘氨酸(Gly,G)、丝氨酸(Ser,S)、丙氨酸(Ala,A)和/或苏氨酸(Thr,T)的肽段,例如,所述柔性肽段为(GS)m(GGS)n(GGGS)o(GGGGS)p,其中m、n、o和p分别选自0至50的整数,如0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20,优选m、n、o和p不同时为0。
2.根据权利要求1所述的融合蛋白,其中所述凝血因子IX活性部分源自人,例如全长或截短的人凝血因子IX;所述全长或截短的人凝血因子IX可包含1个或更多个氨基酸突变,条件是仍保留其FIX活性;例如所述凝血因子IX活性部分包含SEQ ID NO:1所示的氨基酸序列,或者与SEQ ID NO:1所示氨基酸序列具有至少85%、90%、95%或更高的一致性。
3.根据权利要求1或2所述的融合蛋白,其中所述刚性单元为包含1、2、3、4、5、6、7、8、9、10个或更多个脯氨酸(Pro,P)的肽段:优选地,所述刚性单元包含选自以下的氨基酸序列:
VAPPPALPAPVRLPGPA(SEQ ID NO:3);
VAPPPALPAVAPPPALPA(SEQ ID NO:4);
VAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPA(SEQ ID NO:5);
VAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPA(SEQ ID NO:6);和
VAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPA(SEQ ID NO:7);
还优选地,所述第一接头L1选自:
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPA(SEQ ID NO:8);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPA(SEQ ID NO:9);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAVAPPPALPAPVRLPGPA(SEQ ID NO:10);
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAPVRLPGPAVAPPPALPAVAPPPALPA(SEQ ID NO:11);和
GGGGSGGGGSGGGGSGGGGSGGGGSVAPPPALPAVAPPPALPAGSVAPPPALPAVAPPPALPA(SEQ IDNO:12)。
4.根据权利要求1至3中任一项所述的融合蛋白,其中所述融合伴侣为:全长、截短或变体形式的免疫球蛋白Fc区段、白蛋白、转铁蛋白或XTEN,所述融合伴侣例如源自人,例如所述Fc区段是人免疫球蛋白Fc区段;优选地,所述免疫球蛋白Fc区段由选自CH1结构域、CH2结构域、CH3结构域和CH4结构域的一至四个结构域构成;还优选地,所述免疫球蛋白Fc区段是来自于IgG、IgA、IgD、IgE或IgM的Fc区段,更优选为IgG Fc区段;进一步优选地,所述Fc区段是来自IgG1、IgG2、IgG3或IgG4的Fc区段;此外还优选所述IgG Fc区段具有降低的ADCC效应和/或CDC效应和/或与FcRn受体增强的结合亲和力。
5.根据权利要求1至4中任一项所述的融合蛋白,其中所述融合伴侣还与包含Sortase酶识别位点的一段氨基酸序列P直接连接或者通过第二接头L2连接,所述Sortase酶例如是Sortase A或Sortase B;优选地,所述氨基酸序列P包含Sortase A的核心识别位点LPXTG,其中X是任意氨基酸;例如,P可以是LPETG、LPETGG或LPETGGG;还优选地,所述氨基酸序列P还包含与Sortase酶识别位点连接的亲和标签,这样的氨基酸序列P例如是LPETGGHHHHHH或LPETGGWSHPQFEK。
6.根据权利要求5所述的融合蛋白,其中所述第二接头L2为包含1、2、3、4、5、6、7、8、9、10个或更多个氨基酸的肽段;优选地,所述第二接头L2为包含甘氨酸(Gly,G)、丝氨酸(Ser,S)、丙氨酸(Ala,A)和/或苏氨酸(Thr,T)的柔性肽段,例如,(GS)w(GGS)x(GGGS)y(GGGGS)z,其中w、x、y和z分别选自0至50的整数,例如0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20,更优选地,w、x、y和z不同时为0;
还优选地,第二接头L2的序列为:
GGGGS(SEQ ID NO:14)、GGGGSGGGGS(SEQ ID NO:15)或GSGGSGGGGS(SEQ ID NO:16)。
7.根据权利要求6所述的融合蛋白,其具有如下结构:FIX-L1-FP-L2-P,其中
FIX、L1、L2、FP和P具有如权利要求6中相同的定义,其中L1和L2任一个或两者可以不存在。
8.根据权利要求1至7中任一项所述的融合蛋白,其包含如SEQ ID NO:18、20、22、24、26或28所示的序列,或者由SEQ ID NO:19、21、23、25、27或29所示的核酸分子编码。
9.一种缀合物,其中亲水聚合物分子连接至权利要求1至8中任一项所述融合蛋白的末端,优选地经转肽反应连接至所述Sortase酶识别位点;特别地,所述融合蛋白可以以单体形式或二聚体形式存在。
10.权利要求9的缀合物,其中所述亲水聚合物分子选自多糖和聚亚烷基二醇,如聚丙二醇和聚乙二醇;所述聚亚烷基二醇可以是末端封端的,例如经烷氧基如甲氧基封端的;和/或所述聚亚烷基二醇可以是直链的或支链的;所述聚亚烷基二醇的分子量可以是>=1、>=10、>=20、>=30、>=40、>=50、>=60、>=70、>=80、>=90、>=100、>=110、>=120、>=130、>=140、>=150或>=160kDa,例如是5、10、20、30、40、50、60、70、80、90或100kDa,或者以上任意二数值之间的值;优选地所述亲水性聚合物分子的分子量是20kD或40kD。
11.一种制备权利要求9或10所述缀合物的方法,其中包括使权利要求1至8中任一项所述的融合蛋白与Sortase酶(如Sortase A或Sortase B)和亲水聚合物分子接触,其中所述亲水聚合物分子一端带有可被Sortase酶酰胺化的氨基。
12.根据权利要求11所述的方法,其中所述亲水聚合物分子的一端带有聚Gly,例如GGGAA。
13.一种药物组合物,其包含有效量的权利要求1至8中任一项所述的融合蛋白和/或权利要求9或10所述的缀合物,以及任选地药学上可接受的载体。
14.根据权利要求13的药物组合物,其用于预防和/或治疗出血性疾病,所述出血性疾病优选地选自FIX先天性或获得性缺乏症患者的出血性疾病和血友病B患者的自发或手术性出血。
15.根据权利要求13或14所述的药物组合物,其为液体制剂形式或冻干制剂形式。
16.权利要求1至8中任一项的融合蛋白、权利要求9或10所述的缀合物或权利要求13至15中任一项的药物组合物在制备用于预防和/或治疗出血性疾病的药物中的用途,所述出血性疾病优选地选自FIX先天性或获得性缺乏症患者的出血性疾病和血友病B患者的自发或手术性出血。
17.一种预防和/或治疗出血性疾病的方法,其包括向有此需要的对象施用权利要求1至8中任一项的融合蛋白、权利要求9或10所述的缀合物或权利要求13至15中任一项的药物组合物,所述出血性疾病优选地选自FIX先天性或获得性缺乏症患者的出血性疾病和血友病B患者的自发或手术性出血。
18.一种试剂盒,其包含权利要求1至8中任一项的融合蛋白、权利要求9或10所述的缀合物或权利要求13至15中任一项的药物组合物,以及任选包含的使用说明书。
19.编码权利要求1至8中任一项融合蛋白的核酸序列。
20.包含权利要求19所述核酸序列的表达载体。
CN201910591280.0A 2019-07-02 2019-07-02 改进的fix融合蛋白、缀合物及其应用 Active CN112175088B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201910591280.0A CN112175088B (zh) 2019-07-02 2019-07-02 改进的fix融合蛋白、缀合物及其应用
EP20834320.2A EP3995513A4 (en) 2019-07-02 2020-06-24 IMPROVED FIX FUSION PROTEIN AND CONJUGATE AND USE THEREOF
PCT/CN2020/097911 WO2021000767A1 (zh) 2019-07-02 2020-06-24 改进的fix融合蛋白、缀合物及其应用
BR112021026752A BR112021026752A2 (pt) 2019-07-02 2020-06-24 Composição farmacêutica, conjugado que compreende uma proteína de fusão, método de produção e uso do mesmo
KR1020227002953A KR20220028018A (ko) 2019-07-02 2020-06-24 개선된 fix 융합 단백질 및 접합체 및 이의 용도
US17/597,149 US20220323590A1 (en) 2019-07-02 2020-06-24 Improved fix fusion protein and conjugate and use thereof
MX2021016099A MX2021016099A (es) 2019-07-02 2020-06-24 Proteina de fusion fix mejorada y conjugar y utilizar la misma.
JP2022500493A JP7305864B2 (ja) 2019-07-02 2020-06-24 改善されたfix融合タンパク質、コンジュゲート及びその使用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910591280.0A CN112175088B (zh) 2019-07-02 2019-07-02 改进的fix融合蛋白、缀合物及其应用

Publications (2)

Publication Number Publication Date
CN112175088A true CN112175088A (zh) 2021-01-05
CN112175088B CN112175088B (zh) 2023-03-28

Family

ID=73915040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910591280.0A Active CN112175088B (zh) 2019-07-02 2019-07-02 改进的fix融合蛋白、缀合物及其应用

Country Status (8)

Country Link
US (1) US20220323590A1 (zh)
EP (1) EP3995513A4 (zh)
JP (1) JP7305864B2 (zh)
KR (1) KR20220028018A (zh)
CN (1) CN112175088B (zh)
BR (1) BR112021026752A2 (zh)
MX (1) MX2021016099A (zh)
WO (1) WO2021000767A1 (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1422870A (zh) * 2001-12-03 2003-06-11 第一制糖株式会社 具有增强的体内红细胞生成素活性的融合蛋白
CN101415445A (zh) * 2006-03-31 2009-04-22 巴克斯特国际公司 聚乙二醇化的因子ⅷ
CN102639144A (zh) * 2009-07-09 2012-08-15 波洛尔生物科技有限公司 长效凝固因子及产生其的方法
CN103180439A (zh) * 2010-07-09 2013-06-26 比奥根艾迪克依蒙菲利亚公司 嵌合凝血因子
CN104130308A (zh) * 2014-07-29 2014-11-05 吉林大学 一种蛋白质定点peg修饰的方法及所得peg修饰的蛋白质
CN104271150A (zh) * 2012-01-12 2015-01-07 比奥根艾迪克Ma公司 嵌合因子viii多肽及其用途
CN104661674A (zh) * 2012-07-11 2015-05-27 阿穆尼克斯运营公司 具有xten和血管性血友病因子蛋白的因子viii复合物、及其用途
CN106029106A (zh) * 2014-02-12 2016-10-12 诺和诺德保健股份有限公司 凝血因子ix缀合物
CN106317226A (zh) * 2016-08-19 2017-01-11 安源医药科技(上海)有限公司 用于构建融合蛋白的连接肽
WO2018144623A1 (en) * 2017-01-31 2018-08-09 Bioverativ Therapeutics Inc. Factor ix fusion proteins and methods of making and using same
CN108472337A (zh) * 2015-08-03 2018-08-31 比奥贝拉蒂治疗公司 因子ix融合蛋白以及其制备和使用方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2638643B1 (fr) 1988-11-09 1991-04-12 Transgene Sa Sequence d'adn codant pour le facteur ix humain ou une proteine analogue, vecteur d'expression, cellules transformees, procede de preparation du facteur ix et produits obtenus correspondants
US5919455A (en) 1993-10-27 1999-07-06 Enzon, Inc. Non-antigenic branched polymer conjugates
US5932462A (en) 1995-01-10 1999-08-03 Shearwater Polymers, Inc. Multiarmed, monofunctional, polymer for coupling to molecules and surfaces
US6214966B1 (en) 1996-09-26 2001-04-10 Shearwater Corporation Soluble, degradable poly(ethylene glycol) derivatives for controllable release of bound molecules into solution
US6455639B1 (en) 1998-03-24 2002-09-24 Nof Corporation Oxirane derivative and process for the preparation thereof
CA2466027C (en) 2001-11-07 2013-01-08 Nektar Therapeutics Al, Corporation Branched polymers and their conjugates
KR20090013816A (ko) 2006-05-24 2009-02-05 노보 노르디스크 헬스 케어 악티엔게젤샤프트 연장된 생체내 반감기를 갖는 인자 ⅸ 유사체
CN103140237A (zh) * 2010-07-09 2013-06-05 比奥根艾迪克依蒙菲利亚公司 因子ix多肽及其使用方法
WO2013016454A1 (en) 2011-07-25 2013-01-31 Biogen Idec Hemophilia Inc. Assays to monitor bleeding disorders
AU2015236340B2 (en) 2014-03-24 2020-02-06 Bioverativ Therapeutics Inc. Lyophilized factor IX formulations
JP7261739B2 (ja) * 2017-04-27 2023-04-20 中外製薬株式会社 薬物動態が改善された血液凝固第ix因子

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1422870A (zh) * 2001-12-03 2003-06-11 第一制糖株式会社 具有增强的体内红细胞生成素活性的融合蛋白
CN101415445A (zh) * 2006-03-31 2009-04-22 巴克斯特国际公司 聚乙二醇化的因子ⅷ
CN102639144A (zh) * 2009-07-09 2012-08-15 波洛尔生物科技有限公司 长效凝固因子及产生其的方法
CN103180439A (zh) * 2010-07-09 2013-06-26 比奥根艾迪克依蒙菲利亚公司 嵌合凝血因子
CN109111526A (zh) * 2012-01-12 2019-01-01 比奥贝拉蒂治疗公司 嵌合因子viii多肽及其用途
CN104271150A (zh) * 2012-01-12 2015-01-07 比奥根艾迪克Ma公司 嵌合因子viii多肽及其用途
CN104661674A (zh) * 2012-07-11 2015-05-27 阿穆尼克斯运营公司 具有xten和血管性血友病因子蛋白的因子viii复合物、及其用途
CN106029106A (zh) * 2014-02-12 2016-10-12 诺和诺德保健股份有限公司 凝血因子ix缀合物
CN104130308A (zh) * 2014-07-29 2014-11-05 吉林大学 一种蛋白质定点peg修饰的方法及所得peg修饰的蛋白质
CN108472337A (zh) * 2015-08-03 2018-08-31 比奥贝拉蒂治疗公司 因子ix融合蛋白以及其制备和使用方法
CN106317226A (zh) * 2016-08-19 2017-01-11 安源医药科技(上海)有限公司 用于构建融合蛋白的连接肽
CN107995914A (zh) * 2016-08-19 2018-05-04 安源医药科技(上海)有限公司 人成纤维细胞生长因子21融合蛋白及其制备方法与用途
CN108137708A (zh) * 2016-08-19 2018-06-08 安源医药科技(上海)有限公司 人凝血因子ix融合蛋白及其制备方法与用途
WO2018144623A1 (en) * 2017-01-31 2018-08-09 Bioverativ Therapeutics Inc. Factor ix fusion proteins and methods of making and using same

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MAXIMILIAN W. POPP等: "Sortase-catalyzed transformations that improve the properties of cytokines", 《PNAS》 *
徐龙福: "PEG定点修饰及白蛋白结合肽融合的长效策略", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *
梁明征等: "长效人凝血因子Ⅶ的研究进展", 《中国新药杂志》 *

Also Published As

Publication number Publication date
EP3995513A4 (en) 2023-05-31
BR112021026752A2 (pt) 2022-05-10
KR20220028018A (ko) 2022-03-08
JP7305864B2 (ja) 2023-07-10
EP3995513A1 (en) 2022-05-11
JP2022540402A (ja) 2022-09-15
MX2021016099A (es) 2022-04-20
WO2021000767A1 (zh) 2021-01-07
US20220323590A1 (en) 2022-10-13
CN112175088B (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
JP7227951B2 (ja) 制御性t細胞の増殖のためのインターロイキン-2ムテイン
CN108137708B (zh) 人凝血因子ix融合蛋白及其制备方法与用途
CN109071623B (zh) 用于扩增t调节性细胞的白细胞介素-2突变蛋白
CN100528235C (zh) 红细胞生成素共轭物
JP2019047828A (ja) 一本鎖Fc融合タンパク質
CN103974716B (zh) 凝血因子Ⅶ和Ⅶa衍生物、包括其的缀合物和复合体及其用途
CN103739712A (zh) 具有延长的体内半衰期的因子viii,冯·维勒布兰德因子或它们的复合物
CA2649199C (en) Method of increasing the in vivo recovery of therapeutic polypeptides
JP6676551B2 (ja) 改変フォンウィルブランド因子
CN107949638A (zh) 新型人血清白蛋白突变体
CN112175088B (zh) 改进的fix融合蛋白、缀合物及其应用
TW202120534A (zh) 用於擴增調節性t細胞之介白素-2突變蛋白
RU2794350C1 (ru) Улучшенный слитый белок фактора ix и его конъюгат и их применение
CN114364796A (zh) 嵌合蛋白
CN115819611B (zh) 生长激素融合蛋白及其制备方法和用途
TW202340459A (zh) 包含α—L—艾杜糖醛酸酶之融合蛋白及其方法
CN113912735A (zh) 多肽二聚体及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211206

Address after: 226000 West Guangxian road and South Xinxing Road, Nantong Economic and Technological Development Zone, Nantong City, Jiangsu Province

Applicant after: Jiangsu Shengsi biopharmaceutical Co.,Ltd.

Address before: 450000 building 20, Zhengzhou airport biomedical park, northeast corner of the intersection of Huanghai Road and biotechnology Second Street, Zhengzhou Airport Economic Comprehensive Experimental Zone, Henan Province

Applicant before: Zhengzhou Shengsi Biotechnology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant