CN111918674A - 表达因子viii的慢病毒载体的用途 - Google Patents

表达因子viii的慢病毒载体的用途 Download PDF

Info

Publication number
CN111918674A
CN111918674A CN201980022379.7A CN201980022379A CN111918674A CN 111918674 A CN111918674 A CN 111918674A CN 201980022379 A CN201980022379 A CN 201980022379A CN 111918674 A CN111918674 A CN 111918674A
Authority
CN
China
Prior art keywords
seq
nucleotides
less
fviii
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980022379.7A
Other languages
English (en)
Inventor
A·安诺尼
A·康托尔
D·德拉格
刘彤瑶
M·米拉尼
J·莫菲特
L·纳迪尼
S·帕塔罗约-怀特
R·彼得斯
A·塞雷金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bioverativ Therapeutics Inc
Original Assignee
Bioverativ Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioverativ Therapeutics Inc filed Critical Bioverativ Therapeutics Inc
Publication of CN111918674A publication Critical patent/CN111918674A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/36Blood coagulation or fibrinolysis factors
    • A61K38/37Factors VIII
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/48Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Organic Chemistry (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Diabetes (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本公开文本提供包含经密码子优化的因子VIII序列的慢病毒载体,以及使用此类慢病毒载体的方法。本文公开的靶向肝的慢病毒载体可以用于基因疗法,其中所述慢病毒基因递送使得能够将转基因表达盒稳定地整合至儿科(例如,新生儿)或成年受试者的所靶向的细胞(例如,肝细胞)的基因组中,从而以低慢病毒载体剂量(例如,5x1010或更低,如1.5x109或更低、或1x108TU/kg或更低)实现FVIII表达的改进(例如,100倍改进)。本公开文本还提供治疗出血性障碍如血友病(例如,血友病A)的方法,所述方法包括向有需要的受试者以低剂量(1x108TU/kg或更低至1.5x1010TU/kg)给予包含经密码子优化的因子VIII核酸序列的靶向肝的慢病毒载体。

Description

表达因子VIII的慢病毒载体的用途
相关申请
本申请要求2018年2月1日提交的美国临时专利申请序列号62/625,145、2018年5月15日提交的序列号62/671,915和2019年1月16日提交的序列号62/793,158的优先权,将所述申请的全部公开内容通过引用特此并入本文。
对电子提交的序列表的引用
将以ASCII文本文件(名称:609628_SA9_460PC_Sequence_Listing.txt;大小:204,203字节;以及创建日期:2019年1月31日)电子提交的序列表通过引用以其整体并入本文。
背景技术
血液凝固途径部分地涉及因子VIIIa(FVIIIa)与因子IXa(FIXa)的酶复合物(X酶复合物)在血小板表面上的形成。FIXa是一种丝氨酸蛋白酶,其在没有其辅因子FVIIIa的情况下催化活性相对较弱。X酶复合物将因子X(FX)切割为因子Xa(FXa),所述因子Xa(FXa)转而与因子Va(FVa)相互作用以切割凝血酶原并生成凝血酶。血友病A是一种出血性障碍,它是由FVIII(FVIII)基因中导致FVIII活性不足的突变和/或缺失引起的(Peyvandi等人2006)。在一些情况下,患者由于FVIII抑制剂如抗FVIII抗体的存在而具有降低的FVIII水平。
所述疾病可以通过目标为恢复FVIII活性以防止自发性出血的替代疗法来治疗。存在可用于按需治疗出血发作或用于通过预防性治疗防止出血发作发生的源自血浆的和重组的FVIII产品。基于这些产品的半衰期(10-12hr)(White G.C.,等人,Thromb.Haemost.77:660-7(1997);Morfini,M.,Haemophilia 9(增刊1):94-99;discussion 100(2003)),治疗方案需要频繁的静脉内给予,一般对于预防一周二到三次,并且对于按需治疗每天一至三次(Manco-Johnson,M.J.,等人,N.Engl.J.Med.357:535-544(2007))。如此频繁的给予既不方便成本又高。
向患者提供低成本重组FVIII蛋白的主要阻碍是商业生产的高成本。FVIII蛋白在异源表达系统中表达不佳,比类似大小的蛋白质低二至三个数量级。(Lynch等人,Hum.Gene.Ther.;4:259–72(1993))。我们对FVIII表达的生物学的理解的进步已经导致开发出更有效的FVIII变体。例如,生物化学研究证实,FVIII B结构域对于FVIII辅因子活性而言是可有可无的。B结构域的缺失导致mRNA水平相对于全长野生型FVIII的17倍增加和分泌蛋白的30%增加。(Toole等人,Proc Natl Acad Sci USA 83:5939–42(1986))。然而,本领域对在异源系统中有效表达的FVIII序列仍然有需要。
发明内容
本公开文本提供治疗有需要的受试者的出血性障碍的方法,所述方法包括向所述受试者给予至少一个剂量的5X1010TU/kg转导单位/kg(TU/kg)或更少(例如,5x109或更少,或者108TU/kg或更少)的慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列具有:(i)与SEQID NO:1的核苷酸58-2277和2320-4374的至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(ii)与SEQ ID NO:2的核苷酸58-2277和2320-4374的至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(iii)与SEQ IDNO:70的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(iv)与SEQ ID NO:71的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(v)与SEQ ID NO:3的核苷酸58-2277和2320-4374的至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(vi)与SEQ ID NO:4的核苷酸58-2277和2320-4374的至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(vii)与SEQ ID NO:5的核苷酸58-2277和2320-4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(viii)与SEQ ID NO:6的核苷酸58-2277和2320-4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或(ix)或(i)至(viii)的任何组合。
本公开文本还提供治疗有需要的受试者的出血性障碍的方法,所述方法包括向所述受试者给予至少一个剂量的5X1010TU/kg或更少(例如,5x109或更少,或者108TU/kg或更少)的慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码因子VIII(FVIII)多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;(a)其中所述第一核酸序列具有:(i)与SEQ IDNO:3的核苷酸58-2277和2320-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(ii)与SEQ ID NO:4的核苷酸58-2277和2320-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(iii)与SEQ ID NO:5的核苷酸58-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或(iv)与SEQ ID NO:6的核苷酸58-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(b)其中所述第二核苷酸序列具有:(i)与SEQ ID NO:3的核苷酸1792-2277和2320-4374的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(ii)与SEQ ID NO:4的核苷酸1792-2277和2320-4374的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;(iii)与SEQ ID NO:5的核苷酸1792-2277和2320-4374的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或(iv)与SEQ ID NO:6的核苷酸1792-2277和2320-4374的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或(c)(a)与(b)的任何组合;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在上文所公开的方法的一些实施方案中,所述剂量为约9.5x108TU/kg、约9x108TU/kg、约8.5x108TU/kg、约8x108TU/kg、约7.5x108TU/kg、约7x108TU/kg、约6.5x108TU/kg、约6x108TU/kg、约5.5x108TU/kg、约5x108TU/kg、约4.5x108TU/kg、约4x108TU/kg、约3.5x108TU/kg、约3x108TU/kg、约2.5x108TU/kg、约2x108TU/kg、约1.5x108TU/kg、或约1x108TU/kg、约5x1010TU/kg、约4.5x1010TU/kg、约4x1010TU/kg、约3.5x1010TU/kg、约3x1010TU/kg、约2.5x1010TU/kg、约2x1010TU/kg、约1.5x1010TU/kg、约1x1010TU/kg、约9.5x109TU/kg、约9x109TU/kg、约8.5x109TU/kg、约8x109TU/kg、约7.5x109TU/kg、约7x109TU/kg、约6.5x109TU/kg、约6x109TU/kg、约5.5x109TU/kg、约5x109TU/kg、约4.5x109TU/kg、约4x109TU/kg、约3.5x109TU/kg、约3x109TU/kg、约2.5x109TU/kg、约2x109TU/kg、约1.5x109TU/kg、或约1x109TU/kg。
在一些实施方案中,所述剂量为小于约9.5x108TU/kg、小于约9x108TU/kg、小于约8.5x108TU/kg、小于约8x108TU/kg、小于约7.5x108TU/kg、小于约7x108TU/kg、小于约6.5x108TU/kg、小于约6x108TU/kg、小于约5.5x108TU/kg、小于约5x108TU/kg、小于约4.5x108TU/kg、小于约4x108TU/kg、小于约3.5x108TU/kg、小于约3x108TU/kg、小于约2.5x108TU/kg、小于约2x108TU/kg、小于约1.5x108TU/kg、或小于约1x108TU/kg、小于约5x1010TU/kg、小于约4.5x1010TU/kg、小于约4x1010TU/kg、小于约3.5x1010TU/kg、小于约3x1010TU/kg、小于约2.5x1010TU/kg、小于约2x1010TU/kg、小于约1.5x1010TU/kg、小于约1x1010TU/kg、小于约9.5x109TU/kg、小于约9x109TU/kg、小于约8.5x109TU/kg、小于约8x109TU/kg、小于约7.5x109TU/kg、小于约7x109TU/kg、小于约6.5x109TU/kg、小于约6x109TU/kg、小于约5.5x109TU/kg、小于约5x109TU/kg、小于约4.5x109TU/kg、小于约4x109TU/kg、小于约3.5x109TU/kg、小于约3x109TU/kg、小于约2.5x109TU/kg、小于约2x109TU/kg、小于约1.5x109TU/kg、或小于约1x109TU/kg。
在一些实施方案中,所述剂量为在1x108与5x1010TU/kg之间、在1x108与5x109TU/kg之间、在1x108与1x109TU/kg之间、在1x108与1x1010TU/kg之间、在1x109与5x1010TU/kg之间、在2x109与5x1010TU/kg之间、在3x109与5x1010TU/kg之间、在4x109与5x1010TU/kg之间、在5x109与5x1010TU/kg之间、在6x109与5x1010TU/kg之间、在7x109与5x1010TU/kg之间、8x109与5x1010TU/kg之间、在9x109与5x1010TU/kg之间、在1010与5x1010TU/kg之间、在1.5x1010与5x1010TU/kg之间、在2x1010与5x1010TU/kg之间、在2.5x1010与5x1010TU/kg之间、在3x1010与5x1010TU/kg之间、在3.5x1010与5x1010TU/kg之间、在4x1010与5x1010TU/kg之间、或在4.5x1010与5x1010TU/kg之间。在一些实施方案中,所述剂量为在1x109与5x1010TU/kg之间、在1x109与4.5x1010TU/kg之间、在1x109与4x1010TU/kg之间、在1x109与3.5x1010TU/kg之间、在1x109与3x1010TU/kg之间、在1x109与2.5x1010TU/kg之间、在1x109与2x1010TU/kg之间、在1x109与1.5x1010TU/kg之间、在1x109与1010TU/kg之间、在1x109与9x109TU/kg之间、在1x109与8x109TU/kg之间、在1x109与7x109TU/kg之间、在1x109与6x109TU/kg之间、在1x109与5x109TU/kg之间、在1x109与4x109TU/kg之间、在1x109与3x109TU/kg之间、以及在1x109与2x109之间。在一些实施方案中,所述剂量为在1x1010与2x1010TU/kg之间、在1.1x1010与1.9x1010TU/kg之间、在1.2x1010与1.8x1010TU/kg之间、在1.3x1010与1.7x1010TU/kg之间、或在1.4x1010与1.6x1010TU/kg之间。在一些实施方案中,所述剂量为约1.5x1010TU/kg。在一些实施方案中,所述剂量为1.5x109TU/kg。在一些实施方案中,所述剂量为在2.5x109TU/kg与3.5x109TU/kg之间、在2.6x109TU/kg与3.4x109TU/kg之间、在2.7x109TU/kg与3.3x109TU/kg之间、在2.8x109TU/kg与3.2x109TU/kg之间、或在2.9x109TU/kg与3.1x109TU/kg之间。在一些实施方案中,所述剂量为约3.0x109TU/kg。在一些实施方案中,所述剂量为在5.5x109TU/kg与6.5x109TU/kg之间、在5.6x109TU/kg与6.4x109TU/kg之间、在5.7x109TU/kg与6.3x109TU/kg之间、在5.8x109TU/kg与6.2x109TU/kg之间、或在5.9x109TU/kg与6.1x109TU/kg之间。在一些实施方案中,所述剂量为约6.0x109TU/kg。
在上文所公开的方法的一些实施方案中,在给予所述慢病毒载体后24小时至48小时,相对于被给予包含含有SEQ ID NO:16的核酸分子的参考载体的受试者,血浆FVIII活性增加。在一些实施方案中,所述血浆FVIII活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、或至少约200倍。
在上文所公开的方法的一些实施方案中,将所述慢病毒载体作为单一剂量或多个剂量给予。在一些实施方案中,将所述慢病毒载体经由静脉内注射给予。在一些实施方案中,所述受试者是儿科受试者。在一些实施方案中,所述受试者是成年受试者。
在一些实施方案中,所述慢病毒载体包含组织特异性启动子。在一些实施方案中,所述组织特异性启动子选择性地增强具有FVIII活性的多肽在靶肝细胞中的表达。在一些实施方案中,选择性地增强具有FVIII活性的多肽在靶肝细胞中的表达的组织特异性启动子包括mTTR启动子。在一些实施方案中,所述靶肝细胞(liver cell)是肝细胞(hepatocyte)。在一些实施方案中,将所述分离的核酸分子稳定地整合至所述肝细胞的基因组中。在一些实施方案中,所述出血性障碍是血友病A。
在上文所公开的方法的一些实施方案中,所述分离的核酸分子包含LV-coFVIII-6(SEQ ID NO:71)。在一些实施方案中,所述分离的核酸分子包含LV-coFVIII-6-XTEN(SEQID NO:72)。
在一些实施方案中,将所述剂量的慢病毒载体一次性给予,或者分为两个亚剂量、三个亚剂量、四个亚剂量、五个亚剂量或六个亚剂量。在一些实施方案中,将所述剂量的慢病毒载体重复至少两次、至少三次、至少四次、至少五次、至少六次、至少七次、至少八次、至少九次或至少十次。在一些实施方案中,编码具有FVIII活性的多肽的核苷酸序列还包含编码信号肽的核酸序列,其中所述编码信号肽的核酸序列具有与以下各项的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性:(i)SEQ ID NO:1的核苷酸1至57;(ii)SEQ ID NO:2的核苷酸1至57;(iii)SEQ IDNO:3的核苷酸1至57;(iv)SEQ ID NO:4的核苷酸1至57;(v)SEQ ID NO:5的核苷酸1至57;(vi)SEQ ID NO:6的核苷酸1至57;(vii)SEQ ID NO:70的核苷酸1至57;(viii)SEQ ID NO:71的核苷酸1至57;或(ix)SEQ ID NO:68的核苷酸1至57。
在一些实施方案中,所述核酸分子(或编码具有FVIII活性的多肽的核苷酸序列)包含选自以下各项的一种或多种特性:(a)所述核酸分子或其部分的人密码子适应指数相对于SEQ ID NO:16增加;(b)所述核苷酸序列或其部分的最优密码子的频率相对于SEQ IDNO:16增加;(c)与SEQ ID NO:16中G/C核苷酸的百分比相比,所述核苷酸序列或其部分含有更高的G/C核苷酸百分比;(d)所述核苷酸序列或其部分的相对同义密码子使用度相对于SEQ ID NO:16增加;(e)所述核苷酸序列或其部分的有效密码子数相对于SEQ ID NO:16减少;(f)所述核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列(SEQ ID NO:21和22);(g)所述核苷酸序列相对于SEQ ID NO:16含有更少的去稳定元件(SEQ ID NO:23和24);以及(h)其任何组合。
在一些实施方案中,编码具有FVIII活性的多肽的核苷酸序列还包含编码异源氨基酸序列(例如,半衰期延长剂)的异源核苷酸序列。在一些实施方案中,所述异源氨基酸序列是免疫球蛋白恒定区或其部分、XTEN、转铁蛋白、白蛋白或PAS序列。在一些实施方案中,所述异源氨基酸序列与由所述核苷酸序列编码的氨基酸序列的N末端或C末端连接,或者在选自表3的一个或多个插入位点插入由所述核苷酸序列编码的氨基酸序列中的两个氨基酸之间。在一些实施方案中,所述FVIII多肽是全长FVIII或B结构域缺失的FVIII。
附图说明
图1A-图1J提供经密码子优化的编码B结构域缺失的因子VIII的核苷酸序列。图1A显示coFVIII-3的核苷酸序列(SEQ ID NO:1)。图1B显示coFVIII-4的核苷酸序列(SEQ IDNO:2)。图1C显示coFVIII-5的核苷酸序列(SEQ ID NO:70)。图1D显示coFVIII-6的核苷酸序列(SEQ ID NO:71)。图1E显示coFVIII-52的核苷酸序列(SEQ ID NO:3)。图1F显示coFVIII-62的核苷酸序列(SEQ ID NO:4)。图1G显示coFVIII-25的核苷酸序列(SEQ ID NO:5)。图1H显示coFVIII-26的核苷酸序列(SEQ ID NO:6)。图1I和图1J分别显示未经密码子优化的B结构域缺失的(BDD-FVIII)核苷酸和氨基酸序列(分别是SEQ ID NO:16和17)。
图2A-图2J显示在经密码子优化的编码BDD-FVIII的核苷酸序列中的密码子使用偏好调整。图2A显示编码BDD-FVIII的野生型核苷酸序列(在经密码子优化前)(例如,未优化的BDD-FVIII)中密码子的相对频率。未优化的BDD-FVIII序列的人密码子适应指数(CAI)是74%。图2B显示人CAI为88%的coFVIII-1变体序列中密码子的相对频率。图2C显示人CAI为91%的coFVIII-3变体序列中密码子的相对频率。图2D显示人CAI为97%的coFVIII-4变体序列中密码子的相对频率。图2E显示人CAI为83%的coFVIII-5变体序列中密码子的相对频率。图2F显示人CAI为83%的coFVIII-6变体序列中密码子的相对频率。图2G显示人CAI为91%的coFVIII-52变体序列中密码子的相对频率。图2H显示人CAI为91%的coFVIII-62变体序列中密码子的相对频率。图2I显示人CAI为88%的coFVIII-25变体序列中密码子的相对频率。图2J显示人CAI为88%的coFVIII-26变体序列中密码子的相对频率。
图3提供FVIII-303的质粒图谱,FVIII-303在pcDNA3骨架中包含在ET增强的转甲状腺素蛋白启动子控制下的coFVIII-1,所述启动子位于coFVIII-1翻译起始位点的上游并且包含合成增强子、mTIR增强子和mTIR启动子。
图4显示在流体动力学注射5μg FVIII-303(coFVIII-1;圆形)或5μg FVIII-311(BDD-FVIII;正方形)后,HemA小鼠中FVIII血浆活性的图形表示。FVIII血浆活性是在注射后24、48和72小时通过FVIII特异性生色测定确定的。显示在72小时的相对活性水平,所述相对活性水平针对FVIII-311的表达水平归一化。
图5显示pLV-coFVIII-52的质粒图谱,pLV-coFVIII-52在慢病毒质粒中包含在ET启动子控制下的coFVIII-52,所述启动子位于coFVIII-52翻译起始位点的上游并且包含合成增强子、mTTR增强子和mTTR启动子。
图6A-图6C显示在流体动力学注射各种FVIII编码核苷酸后,HemA小鼠中FVIII血浆活性的图形表示。FVIII血浆活性是在注射后24、48和72小时通过FVIII特异性生色测定确定的。图6A显示在流体动力学注射5μg LV-coFVIII-1(实心圆形)、5μg LV-coFVIII-3(三角形)、5μg LV-coFVIII-4(倒三角形)、5μg LV-coFVIII-5(菱形)或5μg LV-coFVIII-6(空心圆形)后,HemA小鼠中的FVIII血浆活性。图6B显示在流体动力学注射5μg LV-coFVIII-1(圆形)、5μg LV-coFVIII-25(三角形)或5μg LV-coFVIII-26(倒三角形)后,HemA小鼠中的FVIII血浆活性。图6C显示在流体动力学注射20μg LV-2116(未经密码子优化的(WT)BDD-FVIII核苷酸序列;空心圆形)、20μg LV-coFVIII-1(三角形)、20μg LV-coFVIII-52(正方形)或20μg LV-coFVIII-62(实心圆形)后,HemA小鼠中的FVIII血浆活性。显示每种质粒在72小时的相对活性水平,所述相对活性水平针对LV-coFVIII-1(图6A、图6B和图6C)和/或LV-2116(图6C)的表达水平归一化,如图所示。
图7显示与LV-2116(BDD-FVIII)对照相比,并且如通过FVIII特异性生色测定所测量,在注射1E8TU/小鼠的包含coFVIII-1、coFVIII-5、coFVIII-52、coFVIII-6或coFVIII-62的慢病毒载体后24天在HemA小鼠中的血浆FVIII活性。误差条指示标准差。
图8A-图8C提供与XTEN融合的各种经密码子优化的编码BDD-FVIII的核苷酸序列。图8A显示coFVIII-52-XTEN的核苷酸序列(SEQ ID NO:19),其中将编码具有144个氨基酸的XTEN的核苷酸序列("XTEN144";SEQ ID NO:18;加下划线的)插入coFVIII-52核苷酸序列内。图8B显示coFVIII-1-XTEN的核苷酸序列(SEQ ID NO:20),其中将编码具有144个氨基酸的XTEN的核苷酸序列("XTEN144";SEQ ID NO:18;加下划线的)插入coFVIII-1核苷酸序列内。图8C显示coFVIII-6-XTEN的核苷酸序列(SEQ ID NO:72),其中将编码具有144个氨基酸的XTEN的核苷酸序列("XTEN144";SEQ ID NO:18;加下划线的)插入coFVIII-6核苷酸序列内(例如,对应于成熟FVIII序列的氨基酸残基745)。
图9提供pLV-coFVIII-52-XTEN的质粒图谱,pLV-coFVIII-52-XTEN在慢病毒载体中包含在ET启动子控制下的coFVIII-52-XTEN。以与pLV-coFVIII-52-XTEN相同的方式构建如下慢病毒载体,所述慢病毒载体包含如本文所述的其余经密码子优化的编码具有FVIII活性的多肽的核酸分子中的每一个,其中插入相同XTEN序列以替代FVIII的B结构域。
图10A和图10B显示在注射包含各种经密码子优化的编码BDD-FVIII的核苷酸序列的质粒DNA(图10A)或慢病毒载体(图10B)后,HemA小鼠中的FVIII活性。图10A显示在流体动力学注射5μg FVIII-311(未经密码子优化的BDD-FVIII编码核苷酸序列;正方形)、5μgFVIII-303(coFVIII-1;小圆形)或FVIII-306(coFVIII-1-XTEN144;大圆形)后,HemA小鼠中的FVIII血浆活性的图形表示。显示每种质粒在72小时的相对活性,所述相对活性针对FVIII-311归一化。图10B显示与LV-2116(BDD-FVIII)对照相比,并且如通过FVIII特异性生色测定所测量,在注射1E8TU/小鼠的包含coFVIII-52或coFVIII-52-XTEN的慢病毒载体后21天在HemA小鼠中的血浆FVIII活性。误差条指示标准差。
图11A显示全长成熟人因子VIII的氨基酸序列。图11B显示全长人血管性血友病因子(von Willebrand Factor)的氨基酸序列(SEQ ID NO:44)。图11C和图11D分别显示具有42个氨基酸的XTEN多肽的氨基酸和核苷酸序列(XTEN AE42-4;分别是SEQ ID NO:46和47)。各种具有144个氨基酸的XTEN多肽的氨基酸序列显示于图11E、图11G、图11I、图11K、图11M、图11O、图11Q、图11S、图11U和图11W中(分别是SEQ ID NO:48、50、52、54、56、58、60、62、64和66),并且相应核苷酸序列显示于图11F、图11H、图11J、图11L、图11N、图11P、图11R、图11T、图11V和图11X中(分别是SEQ ID NO:49、51、53、55、57、59、61、63、65和67)。图11Y显示ET启动子的核苷酸序列(SEQ ID NO:69)。图11Z显示coFVIII-1的核苷酸序列(SEQ ID NO:68)(参见国际公开号WO 2014/127215,SEQ ID NO:1)。
图12A是在IV给予约1.5x1010TU/kg LV-wtBDD-FVIII(圆形)、LV-coFVIII-6(正方形)或LV-coFVIII-6XTEN(三角形)后,14日龄HemA小鼠中FVIII血浆活性(IU/mL)的图形表示。图12B是在IV给予约1.5x1010TU/kg的表达wtBDD-FVIII、coFVIII-1、coFVIII-3、coFVIII-4、coFVIII-5、coFVIII-6、coFVIII-52、coFVIII-62、coFVIII-25或coFVIII-26的慢病毒载体的14日龄HemA小鼠的治疗后150天,载体拷贝数(VCN)的图形表示。图12C是在IV给予约1.5x1010TU/kg的表达wtBDD-FVIII、coFVIII-1、coFVIII-3、coFVIII-4、coFVIII-5、coFVIII-6、coFVIII-52、coFVIII-62、coFVIII-25或coFVIII-26的慢病毒载体的14日龄HemA小鼠的治疗后21天,FVIII血浆活性(IU/mL)的图形表示。
图13A和图13B是说明用表达coFVIII-5变体的慢病毒治疗的五只HemA小鼠中FVIII血浆活性水平(图13A)和抗FVIII抗体水平(图13B)的图形表示。通过静脉内注射向十四日龄HemA同窝出生仔畜给予大约1.5x1010TU/kg的表达coFVIII-5变体的慢病毒。将每只小鼠用编号命名(即,1、2、3、4和5;图13A和图13B)。
图14是如通过在慢病毒治疗后21天的FVIII血浆活性所证明的LV-FVIII表达水平与抗FVIII抗体的存在之间的相关性的图形表示。每个数据点对应于单一HemA小鼠。每只小鼠通过静脉内注射表达本文所公开的coFVIII变体之一的慢病毒接受1.5x1010TU/kg剂量。水平线指示平均FVIII血浆活性。
图15是在慢病毒治疗后150天的每个细胞的载体拷贝数(VCN)与抗FVIII抗体的存在之间的相关性的图形表示。每个数据点对应于单一HemA小鼠。每只小鼠通过静脉内注射表达本文所公开的coFVIII变体之一的慢病毒接受1.5x1010TU/kg剂量。水平线指示平均VCN。
图16A和图16B是说明用表达coFVIII-52变体的慢病毒治疗的两只HemA小鼠(coFVIII-52-A和coFVIII-52-B)中FVIII血浆活性水平(图16A)和抗FVIII抗体水平(图16B)的图形表示。通过静脉内注射向十四日龄HemA同窝出生仔畜给予大约1.5x1010TU/kg的表达coFVIII-52变体的慢病毒。图16C和图16D是显示从图16A和图16B的coFVIII-52-A(图16C)和coFVIII-52-B(图16D)小鼠收集的肝组织中针对FVIII表达(深染色)的RNA原位杂交染色的图像。
图17是显示用表达野生型B结构域缺失的FVIII(wtBDD-FVIII;三角形)、coFVIII-52-XTEN(圆形)或coFVIII-6-XTEN(倒三角形)变体的慢病毒治疗的HemA新生小鼠中长期FVIII表达的图形表示。通过静脉内注射向新生HemA小鼠给予大约1.5x1010TU/kg的表达wtBDD-FVIII、coFVIII-52-XTEN或coFVIII-6-XTEN的慢病毒。在大约16周内测量FVIII血浆活性。
图18A-图18B显示对应于用表达coFVIII-6(图18A)或coFVIII-6-XTEN(图18B)的慢病毒治疗HemA小鼠的剂量-反应结果的图形表示。
图19提供用于靶向肝的基因疗法的慢病毒载体的示意图。SD:剪接供体位点;SA:剪接受体位点;GA:截短的gag序列;RRE:Rev反应元件;ET:增强的转甲状腺素蛋白;FVIII:因子VIII;142T:miR-142的靶序列;Wpre:突变的土拨鼠肝炎病毒转录后调节元件;Ψ(包装信号)。
图20A-图20B是如通过FVIII血浆活性(图20A)和FVIII血浆抗原水平(图20B)所测量的雄性猪尾猕猴中循环FVIII水平峰值的图形表示,所述雄性猪尾猕猴被给予3x109TU/kg的从CD47/MHC-I293T细胞产生的表达coFVIII-6-XTEN的慢病毒。
图21A-图21B是雄性猪尾猕猴中人FVIII活性(图21A)和人FVIII抗原水平(图21B)的血浆水平峰值的图形表示,所述雄性猪尾猕猴被给予3x109TU/kg或6x109TU/kg的表达coFVIII-6的慢病毒。
图22A-22B显示雄性猪尾猕猴中人FVIII活性(图22A)和平均人FVIII抗原水平(图22B)的血浆水平峰值的图形呈现,所述雄性猪尾猕猴被给予1x109或3x109TU/kg的表达coFVIII-6-XTEN的慢病毒。
具体实施方式
本公开文本描述靶向肝的慢病毒基因疗法,其使用经密码子优化的编码具有因子VIII(FVIII)活性的多肽的基因。参见例如,国际公开案WO2017136358,将其通过引用以其整体并入本文。
因此,在一些方面,本公开文本涉及基因疗法,所述基因疗法包括给予慢病毒载体,所述慢病毒载体包含经密码子优化的核酸分子,所述经密码子优化的核酸分子包含编码具有因子VIII活性的多肽的核酸序列。在特定方面,本公开文本涉及治疗出血性障碍如血友病(例如,血友病A)的方法,所述方法包括向受试者给予慢病毒载体,所述慢病毒载体包含经密码子优化的靶向肝(例如,肝细胞)的因子VIII核酸序列。本公开文本通过基因疗法方法满足了本领域的重要需求,所述基因疗法方法导致将包含经密码子优化的因子VIII核酸序列的转基因表达盒稳定地整合至所靶向的细胞的基因组中。
在将慢病毒载体以5x1010转导单位/kg(TU/kg)或更低(例如,约1.5x1010TU/kg或更少、或约1.5x109TU/kg或更少、或约108TU/kg或更少)的至少一个剂量给予至受试者时,该系统显示在所靶向的细胞(例如,肝细胞)中增加的因子VIII长期表达。
在具体实施方案中,本文公开的慢病毒载体包含经密码子优化的核酸序列,所述经密码子优化的核酸序列包含SEQ ID NO:71(LV-coFVIII-6),由SEQ ID NO:71(LV-coFVIII-6)组成,或基本上由SEQ ID NO:71(LV-coFVIII-6)组成。
在一些其他具体实施方案中,本文公开的慢病毒载体包含经密码子优化的核酸序列,所述经密码子优化的核酸序列包含SEQ ID NO:72(LV-coFVIII-6-XTEN),由SEQ ID NO:72(LV-coFVIII-6-XTEN)组成,或基本上由SEQ ID NO:72(LV-coFVIII-6-XTEN)组成。
本文公开的靶向肝的慢病毒载体使得能将包含经密码子优化的编码FVIII的核酸的转基因表达盒稳定地整合至儿科(例如,新生儿)或成年受试者的所靶向的细胞(例如,肝细胞)的基因组中,从而在低慢病毒载体剂量(例如,5x1010或更低,如109TU/kg或更低,或者108TU/kg或更低)下实现FVIII表达的改进(例如,100倍改进)。由于所公开的慢病毒载体可以以极低剂量(例如,109TU/kg或更低,或者108TU/kg或更低)实现治疗水平的循环FVIII,这些载体可以显著降低与慢病毒载体治疗相关的潜在急性毒性。此外,慢病毒载体、并且特别是第三代载体的使用可以导致可能终生在受试者基因组中的整合。慢病毒载体相对于其他基因递送系统(例如,AAV)的高容量(10kb)允许在转基因中包含更多的调节元件,例如,将控制FVIII转基因在不同组织(例如,肝细胞和肝内皮细胞)中的表达的启动子。本文公开的慢病毒载体可以用于体内、体外或离体治疗中。
本公开文本的示例性构建体在附图和序列表中进行了说明。
为了提供对说明书和权利要求书的清晰理解,下文提供以下定义。
I.定义
应注意,术语“一个/一种(a)”或“一个/一种(an)”实体是指一个/一种或多个/多种该实体:例如,“一个核苷酸序列”应理解为表示一个或多个核苷酸序列。因此,术语“一个/一种(a)”(或“一个/一种(an)”)、“一个/一种或多个/多种”以及“至少一个/一种”在本文中可以互换使用。
术语“约”在本文中用于表示大约、大致、大约地或在……左右。当术语“约”与数值范围结合使用时,它通过扩展高于和低于所述数值的边界来修饰该范围。通常,术语“约”在本文中用于向上或向下(较高或较低)修饰高于和低于所述值10%差异的数值。
出于本公开文本的目的,术语“分离的”表示已经从其初始环境(其在自然界中所存在的环境)移取的生物材料(细胞、多肽、多核苷酸或其片段、变体或衍生物)。例如,在植物或动物中以天然状态存在的多核苷酸是未分离的,但是与其天然存在的相邻核酸分开的相同多核苷酸被认为是“分离的”。不要求特定的纯化水平。出于本公开文本的目的,宿主细胞中表达的重组产生的多肽和蛋白质被视为是分离的,已经通过任何合适的技术分开、分级分离或者部分或基本上纯化的天然或重组多肽也被视为是分离的。
“核酸”、“核酸分子”、“寡核苷酸”和“多核苷酸”可互换使用,并且是指呈单链形式或双链螺旋的核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯聚合形式或其任何磷酸酯类似物,如硫代磷酸酯和硫代酸酯。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子、特别是DNA或RNA分子仅仅是指所述分子的一级和二级结构,并且不将其限制为任何特定三级形式。因此,这个术语包括尤其在线性或环状DNA分子(例如,限制性片段)、质粒、超螺旋化DNA和染色体中发现的双链DNA。在讨论特定双链DNA分子的结构时,在本文中可以根据正常惯例描述序列,即仅给出沿DNA的非转录链(即,具有与mRNA同源的序列的链)的5'至3'方向的序列。“重组DNA分子”是已经经历分子生物学操纵的DNA分子。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。本公开文本的“核酸组合物”包含如本文所述的一种或多种核酸。
如本文所用,“编码区”或“编码序列”是多核苷酸中由可翻译成氨基酸的密码子组成的部分。虽然“终止密码子”(TAG、TGA或TAA)通常不翻译成氨基酸,但是可以将其视为编码区的一部分,但是任何侧接序列(例如启动子、核糖体结合位点、转录终止子、内含子等)不是编码区的一部分。编码区的边界通常由5'末端的起始密码子(编码所得多肽的氨基末端)和3'末端的翻译终止密码子(编码所得多肽的羧基末端)来决定。两个或更多个编码区可以存在于单一多核苷酸构建体中(例如,在单一载体上),或者存在于分开的多核苷酸构建体中(例如,在分开的(不同的)载体上)。那么,这样的话,单一载体可以仅含有单一编码区,或者包含两个或更多个编码区。
哺乳动物细胞分泌的某些蛋白质与分泌信号肽缔合,一旦开始将生长中的蛋白质链穿过糙面内质网输出,就从成熟蛋白质切割所述分泌信号肽。本领域普通技术人员已知,信号肽通常与多肽的N末端融合,并且是从完整或“全长”多肽切割以产生多肽的分泌或“成熟”形式。在某些实施方案中,天然信号肽或该序列的功能衍生物,所述功能衍生物保留引导与其可操作地缔合的多肽分泌的能力。可替代地,可以使用异源哺乳动物信号肽(例如,人组织纤溶酶原激活剂(TPA)或小鼠β-葡糖醛酸糖苷酶信号肽)或其功能衍生物。
术语“下游”是指位于参考核苷酸序列3'的核苷酸序列。在某些实施方案中,下游核苷酸序列是指在转录起点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。
术语“上游”是指位于参考核苷酸序列5'的核苷酸序列。在某些实施方案中,上游核苷酸序列是指位于编码区或转录起点的5'侧的序列。例如,大多数启动子位于转录起始位点的上游。
如本文所用,术语“基因调节区”或“调节区”是指位于编码区的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码区的转录、RNA加工、稳定性或翻译的核苷酸序列。调节区可以包括启动子、翻译前导序列、内含子、多聚腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。如果编码区是用于在真核细胞中表达,则多聚腺苷酸化信号和转录终止序列通常将位于编码序列的3'。
编码基因产物(例如,多肽)的多核苷酸可以包括与一个或多个编码区可操作地缔合的启动子和/或其他表达(例如,转录或翻译)控制元件。在可操作的缔合中,基因产物(例如多肽)的编码区与一个或多个调节区以如下方式缔合:将所述基因产物的表达置于所述一个或多个调节区的影响或控制之下。例如,如果启动子功能的诱导导致编码由编码区编码的基因产物的mRNA的转录,并且如果启动子与编码区之间的连接的性质不会干扰启动子引导基因产物表达的能力或干扰DNA模板被转录的能力,则编码区与启动子是“可操作地缔合的”。除了启动子以外的其他表达控制元件(例如,增强子、操纵基因、阻遏物和转录终止信号)也可以与编码区可操作地缔合以引导基因产物表达。
“转录控制序列”是指提供编码序列在宿主细胞中的表达的DNA调节序列,如启动子、增强子、终止子等。多种转录控制区是本领域技术人员已知的。这些转录控制区包括但不限于作用于脊椎动物细胞中的转录控制区,例如但不限于来自巨细胞病毒(立即早期启动子,与内含子-A结合)、猿猴病毒40(早期启动子)和逆转录病毒(如劳斯肉瘤病毒)的启动子和增强子区段。其他转录控制区包括源自脊椎动物基因的那些,如肌动蛋白、热休克蛋白、牛生长激素和兔β珠蛋白,以及能够控制真核细胞中的基因表达的其他序列。另外的合适的转录控制区包括组织特异性启动子和增强子以及淋巴因子诱导型启动子(例如,可由干扰素或白介素诱导的启动子)。
类似地,多种翻译控制元件是本领域普通技术人员已知的。这些翻译控制元件包括但不限于核糖体结合位点、翻译起始和终止密码子,以及源自微小核糖核酸病毒的元件(特别是内部核糖体进入位点或IRES,也称为CITE序列)。
如本文所用的术语“表达”是指多核苷酸产生基因产物(例如,RNA或多肽)的过程。其包括但不限于将多核苷酸转录为信使RNA(mRNA)、转移RNA(tRNA)、小发夹RNA(shRNA)、小干扰RNA(siRNA)或任何其他RNA产物,以及将mRNA翻译为多肽。表达产生“基因产物”。如本文所用,基因产物可以是核酸(例如,通过基因转录产生的信使RNA),或者是从转录物翻译的多肽。本文描述的基因产物还包括具有转录后修饰(例如,多聚腺苷酸化或剪接)的核酸,或具有翻译后修饰(例如,甲基化、糖基化、脂质的添加、与其他蛋白质亚基缔合或蛋白水解切割)的多肽。如本文所用,术语“产量”是指通过基因表达产生的多肽的量。
“载体”是指用于将核酸克隆和/或转移到宿主细胞中的任何媒介物。载体可以是复制子,另一核酸区段可以与其连接以实现所连接区段的复制。“复制子”是指在体内作为自主复制单元(即,能够在其自身控制下复制)起作用的任何遗传元件(例如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括用于在体外、离体或在体内将核酸引入细胞中的病毒和非病毒媒介物二者。很多载体是本领域已知和使用的,包括例如质粒、修饰的真核病毒或修饰的细菌病毒。将多核苷酸插入合适的载体中可以通过将适当多核苷酸片段连接至具有互补粘性末端的所选载体中来完成。
可以对载体进行工程化以编码可选标记或报告物,所述可选标记或报告物提供对已经掺入所述载体的细胞的选择或鉴定。可选标记或报告物的表达允许鉴定和/或选择掺入并表达载体上所含其他编码区的宿主细胞。本领域中已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即,花色苷调节基因、异戊烷基转移酶基因等。本领域中已知并使用的报告物的例子包括:萤光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸糖苷酶(Gus)等。还可以将可选标记视为报告物。
术语“可选标记”是指能够基于标记基因的效应(即,对抗生素的抗性、对除草剂的抗性、比色标记、酶、荧光标记等)加以选择的鉴定因子(通常是抗生素或化学抗性基因),其中所述效应用于跟踪目的核酸的遗传性和/或鉴定已经遗传目的核酸的细胞或生物体。本领域中已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即,花色苷调节基因、异戊烷基转移酶基因等。
术语“报告基因”是指编码能基于报告基因的效应加以鉴定的鉴定因子的核酸,其中所述效应用于跟踪目的核酸的遗传性、鉴定已经遗传目的核酸的细胞或生物体和/或测量基因表达诱导或转录。本领域中已知并使用的报告基因的例子包括:萤光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸糖苷酶(Gus)等。也可以将可选标记基因视为报告基因。
“启动子”与“启动子序列”可互换使用,并且是指能够控制编码序列或功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3'。启动子可以整体源自天然基因,或者由源自在自然界中发现的不同启动子的不同元件构成,或者甚至包含合成DNA区段。本领域技术人员应理解,不同的启动子可以在不同组织或细胞类型中,或在不同发育阶段,或响应于不同的环境或生理条件引导基因表达。使基因在大多数细胞类型中在大多数时间表达的启动子一般被称为“组成型启动子”。使基因在特定细胞类型中表达的启动子一般被称为“细胞特异性启动子”或“组织特异性启动子”。使基因在发育或细胞分化的特定阶段表达的启动子一般被称为“发育特异性启动子”或“细胞分化特异性启动子”。在用诱导启动子的试剂、生物分子、化学品、配体、光等对细胞进行暴露或处理后被诱导并且使基因表达的启动子一般被称为“诱导型启动子”或“可调节启动子”。还认识到,由于在大多数情况下,尚未完全界定调节序列的确切边界,所以不同长度的DNA片段可以具有相同的启动子活性。
启动子序列通常在其3'末端以转录起始位点为边界,并向上游(5'方向)延伸以包括以高于背景的可检测水平起始转录所必需的最小数量的碱基或元件。在启动子序列内将发现转录起始位点(例如通过用核酸酶S1标示(mapping)方便地界定),以及负责RNA聚合酶的结合的蛋白质结合结构域(共有序列)。
术语“限制性内切核酸酶”与“限制酶”可互换使用,并且是指在双链DNA内的特定核苷酸序列内结合并切割的酶。
术语“质粒”是指染色体外元件,其通常携带并非细胞中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式。此类元件可以是源自任何来源的单链或双链DNA或RNA的线性、环状或超螺旋化的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已经接合或重组至独特构建体中,所述构建体能够将用于所选基因产物的启动子片段和DNA序列以及适当的3'非翻译序列引入细胞中。
“克隆载体”是指“复制子”,其是单位长度的连续复制的核酸并且其包含复制起点,如质粒、噬菌体或粘粒,另一核酸区段可以与所述复制子连接以实现所连接区段的复制。某些克隆载体能够在一种细胞类型(例如,细菌)中复制并在另一种细胞类型(例如,真核细胞)中表达。克隆载体通常包含可以用于选择包含所述载体的细胞的一个或多个序列和/或用于插入目的核酸序列的一个或多个多重克隆位点。
术语“表达载体”是指设计使得所插入的核酸序列能够在插入宿主细胞中之后表达的媒介物。将插入的核酸序列置于与如上所述的调节区可操作地缔合。
通过本领域熟知的方法将载体引入宿主细胞中,所述方法例如转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白。
如本文所用,“培养(culture)”、“培养(to culture)”和“培养(culturing)”意指在允许细胞生长或分裂的体外条件下孵育细胞或使细胞维持存活状态。如本文所用,“培养的细胞”意指在体外繁殖的细胞。
如本文所用,术语“多肽”旨在涵盖单数种“多肽”以及复数种“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并且不是指特定长度的产物。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指代两个或更多个氨基酸的一条或多条链的任何其他术语均包括在“多肽”的定义中,且术语“多肽”可以代替这些术语中的任一个使用,或与其可互换地使用。术语“多肽”还旨在是指多肽的表达后修饰的产物,所述表达后修饰包括但不限于糖基化、乙酰化、磷酸化、酰胺化、通过已知的保护/阻断基团衍生化、蛋白水解切割或通过非天然存在的氨基酸进行的修饰。多肽可以源自天然生物来源或通过重组技术产生,但不一定从指定的核酸序列翻译。它可以以任何方式产生,包括通过化学合成产生。
术语“氨基酸”包括丙氨酸(Ala或A);精氨酸(Arg或R);天冬酰胺(Asn或N);天冬氨酸(Asp或D);半胱氨酸(Cys或C);谷氨酰胺(Gln或Q);谷氨酸(Glu或E);甘氨酸(Gly或G);组氨酸(His或H);异亮氨酸(Ile或I);亮氨酸(Leu或L);赖氨酸(Lys或K);甲硫氨酸(Met或M);苯丙氨酸(Phe或F);脯氨酸(Pro或P);丝氨酸(Ser或S);苏氨酸(Thr或T);色氨酸(Trp或W);酪氨酸(Tyr或Y);和缬氨酸(Val或V)。非传统氨基酸也在本公开文本的范围内,并且包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其他氨基酸残基类似物,如Ellman等人Meth.Enzym.202:301-336(1991)中所述的那些。为了产生此类非天然存在的氨基酸残基,可以使用Noren等人Science 244:182(1989)和Ellman等人(同上)的程序。简单来说,这些程序涉及化学激活具有非天然存在的氨基酸残基的抑制剂tRNA,之后进行RNA的体外转录和翻译。引入非传统氨基酸也可以使用本领域中已知的肽化学来实现。如本文所用,术语“极性氨基酸”包括具有零个净电荷,但是在其侧链的不同部分具有非零部分电荷的氨基酸(例如,M、F、W、S、Y、N、Q、C)。这些氨基酸可以参与疏水相互作用和静电相互作用。如本文所用,术语“带电氨基酸”包括在其侧链上具有非零净电荷的氨基酸(例如,R、K、H、E、D)。这些氨基酸可以参与疏水相互作用和静电相互作用。
本公开文本还包括多肽的片段或变体及其任何组合。术语“片段”或“变体”在涉及本公开文本的多肽结合结构域或结合分子时包括保留参考多肽的至少一些特性(例如,对FcRn结合结构域或Fc变体的FcRn结合亲和力、对FVIII变体的凝固活性、或对VWF片段的FVIII结合活性)的任何多肽。除了本文中其他地方讨论的特定抗体片段以外,多肽片段包括蛋白质水解片段以及缺失片段,但是不包括天然存在的全长多肽(或成熟多肽)。本公开文本的多肽结合结构域或结合分子的变体包括如上所述的片段,以及由于氨基酸取代、缺失或插入而具有改变的氨基酸序列的多肽。变体可以是天然存在的或非天然存在的。非天然存在的变体可以使用本领域已知的诱变技术来产生。变体多肽可以包含保守或非保守氨基酸取代、缺失或添加。
“保守氨基酸取代”是用具有类似侧链的氨基酸残基替代氨基酸残基的取代。本领域中已经定义具有类似侧链的氨基酸残基的家族,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果多肽中的氨基酸被来自相同侧链家族的另一种氨基酸替代,则所述取代被认为是保守的。在另一个实施方案中,一串氨基酸可以用侧链家族成员的顺序和/或组成不同的结构上相似的串保守地替代。
如本领域中已知的术语“同一性百分比”是两个或更多个多肽序列或者两个或更多个多核苷酸序列之间的关系,如通过比较序列所确定。在本领域中,“同一性”还意指多肽或多核苷酸序列之间的序列相关性程度,视情况而定,如通过此类序列的串之间的匹配所确定。“同一性”可以通过已知方法容易地计算,所述方法包括但不限于以下文献中所述的那些:Computational Molecular Biology(Lesk,A.M.,编辑)Oxford University Press,纽约(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,编辑)Academic Press,纽约(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,和Griffin,H.G.,编辑)Humana Press,新泽西州(1994);Sequence Analysis inMolecular Biology(von Heinje,G.,编辑)Academic Press(1987);和Sequence AnalysisPrimer(Gribskov,M.和Devereux,J.,编辑)Stockton Press,纽约(1991)。确定同一性的优选方法设计为给出所测试序列之间的最佳匹配。确定同一性的方法被编纂于可公开获得的电脑程序中。序列比对和同一性百分比计算可以使用序列分析软件来进行,所述序列分析软件是例如LASERGENE生物信息学计算套件的Megalign程序(DNASTAR Inc.,威斯康星州麦迪逊市)、GCG程序套件(Wisconsin Package 9.0版,Genetics Computer Group(GCG),威斯康星州麦迪逊市)、BLASTP、BLASTN、BLASTX(Altschul等人,J.Mol.Biol.215:403(1990))和DNASTAR(DNASTAR,Inc.1228 S.Park St.威斯康星州麦迪逊市53715美国)。在本申请的上下文中将理解,在使用序列分析软件进行分析的情况下,除非另外指定,否则分析结果将基于所提及程序的“缺省值”。如本文所用的“缺省值”将意指在首次初始化时最初用软件加载的任一组值或参数。出于确定本公开文本的优化的BDD FVIII序列与参考序列之间的同一性百分比的目的,仅使用参考序列中与本公开文本的优化的BDD FVIII序列中的核苷酸对应的核苷酸来计算同一性百分比。例如,在比较含有B结构域的全长FVIII核苷酸序列与本公开文本的优化的B结构域缺失(BDD)FVIII核苷酸序列时,将使用包括A1、A2、A3、C1和C2结构域的比对部分来计算同一性百分比。全长FVIII序列中编码B结构域的部分(其将在比对中产生大的“空位”)中的核苷酸将不会被计为错配。另外,在确定本公开文本的优化的BDDFVIII序列或其指定部分(例如,SEQ ID NO:3的核苷酸58-2277和2320-4374)与参考序列之间的同一性百分比时,将通过比对、用匹配核苷酸的数量除以如本文所述的优化的BDD-FVIII序列或其指定部分的完整序列中核苷酸的总数来计算同一性百分比。
如本文所用,“与本公开文本的优化的BDD FVIII序列中的核苷酸对应的核苷酸”是通过比对本公开文本的优化的BDD FVIII序列以使与参考FVIII序列的同一性最大化来鉴定的。用于鉴定参考FVIII序列中的等效氨基酸的编号是基于用于鉴定本公开文本的优化的BDD FVIII序列中的相应氨基酸的编号。
“融合”或“嵌合”蛋白质包含与第二氨基酸序列连接的第一氨基酸序列,所述第一氨基酸序列与所述第二氨基酸序列在自然界中不天然连接。可以使通常存在于单独蛋白质中的氨基酸序列在融合多肽中聚在一起,或者可以将通常存在于相同蛋白质中的氨基酸序列以新排列置于融合多肽中,例如,本公开文本的因子VIII结构域与Ig Fc结构域的融合。融合蛋白是例如通过化学合成或者通过产生和翻译其中以所需关系编码肽区的多核苷酸来产生。嵌合蛋白还可以包含通过共价非肽键或非共价键与第一氨基酸序列缔合的第二氨基酸序列。
如本文所用,术语“插入位点”是指FVIII多肽或其片段、变体或衍生物中的位置,所述位置紧邻可以插入异源部分的位置的上游。“插入位点”被指定为编号,所述编号是插入位点所对应的在成熟天然FVIII(SEQ ID NO:15;图11A)中的氨基酸的编号,所述插入位点紧接插入位置的N末端。例如,短语“a3在对应于SEQ ID NO:15的氨基酸1656的插入位点包含异源部分”指示,异源部分位于对应于SEQ ID NO:15的氨基酸1656和氨基酸1657的两个氨基酸之间。
如本文所用的短语“紧接氨基酸的下游”是指紧靠氨基酸的末端羧基的位置。类似地,短语“紧接氨基酸的上游”是指紧靠氨基酸的末端胺基的位置。
如本文所用,术语“插入(inserted)”、“被插入(is inserted)”、“插入……中(inserted into)”或语法相关术语是指相对于在天然成熟人FVIII中的类似位置,异源部分在重组FVIII多肽中的位置。如本文所用,所述术语是指重组FVIII多肽相对于天然成熟人FVIII的特征,并且并非指示、暗示或意味着制备重组FVIII多肽的任何方法或过程。
如本文所用,术语“半衰期”是指特定多肽在体内的生物半衰期。半衰期可以表示为给予受试者的量的一半被从动物的循环和/或其他组织中清除所需的时间。在将给定多肽的清除曲线构建为时间的函数时,所述曲线通常是双相的,具有快速的α相和较长的β相。α相通常表示所给予的Fc多肽在血管内与血管外空间之间的平衡,并且部分取决于多肽的大小。β相通常表示多肽在血管内空间中的分解代谢。在一些实施方案中,FVIII和包含FVIII的嵌合蛋白是单相的,并且因此不具有α相,而是仅具有单一β相。因此,在某些实施方案中,如本文所用术语半衰期是指多肽在β相中的半衰期。
如本文所用,术语“连接”是指第一氨基酸序列或核苷酸序列分别与第二氨基酸序列或核苷酸序列共价或非共价接合。第一氨基酸或核苷酸序列可以与第二氨基酸或核苷酸序列直接接合或并置,或者可替代地,间插序列可以将第一序列与第二序列共价接合。术语“连接”不仅意指第一氨基酸序列在C末端或N末端与第二氨基酸序列融合,还包括将整个第一氨基酸序列(或第二氨基酸序列)插入第二氨基酸序列(或第一氨基酸序列,分别地)中的任两个氨基酸中。在一个实施方案中,第一氨基酸序列可以通过肽键或接头与第二氨基酸序列连接。第一核苷酸序列可以通过磷酸二酯键或接头与第二核苷酸序列连接。接头可以是肽或多肽(对于多肽链)或者核苷酸或核苷酸链(对于核苷酸链)或任何化学部分(对于多肽和多核苷酸链二者)。术语“连接”也用连字符(-)表示。
如本文所用,术语“与……缔合”是指在第一氨基酸链与第二氨基酸链之间形成的共价或非共价键。在一个实施方案中,术语“与……缔合”意指共价非肽键或非共价键。这种缔合可以用冒号即(:)表示。在另一个实施方案中,所述术语意指除肽键外的共价键。例如,氨基酸半胱氨酸包含硫醇基,所述硫醇基可与第二半胱氨酸残基上的硫醇基形成二硫键或二硫桥。在大多数天然存在的IgG分子中,CH1区和CL区通过二硫键缔合,并且两条重链通过在对应于使用Kabat编号系统的239和242(位置226或229,EU编号系统)的位置处的两个二硫键缔合。共价键的例子包括但不限于肽键、二硫键、σ键、π键、δ键、糖苷键、抓氢键(agnostic bond)、弯曲键、偶极键、π背键(backbond)、双键、三键、四重键、五重键、六重键、共轭键、超共轭键、芳香键、哈普托键(hapticity)或反键(antibonding)。非共价键的非限制性例子包括离子键(例如阳离子-π键或盐键)、金属键、氢键(例如二氢键、分子氢配合物、低势垒氢键或对称氢键)、范德华力、伦敦分散力、机械键、卤键、亲金作用、插层反应、堆积、熵力或化学极性。
本文所用的术语“单体-二聚体杂合物”是指包含通过二硫键相互缔合的第一多肽链和第二多肽链的嵌合蛋白,其中第一链包含凝血因子(例如,因子VIII)和第一Fc区,并且第二链包含无凝血因子的第二Fc区,基本上由所述第二Fc区组成或由所述第二Fc区组成。因此,单体-二聚体杂合构建体是包含仅具有一种凝血因子的单体方面和具有两个Fc区的二聚体方面的杂合物。
如本文所用的止血意指停止或减慢出血(bleeding)或出血症(hemorrhage);或者停止或减慢经过血管或身体部分的血流。
如本文所用,止血障碍意指基因遗传性或获得性病症,其特征在于由于形成纤维蛋白凝块的能力受损或不能形成纤维蛋白凝块,易于自发或由于创伤而出血。此类障碍的例子包括血友病。三种主要形式是血友病A(因子VIII缺乏)、血友病B(因子IX缺乏或“克里斯马斯病(Christmas disease)”)和血友病C(因子XI缺乏,轻度出血倾向)。其他止血障碍包括例如血管性血友病、因子XI缺乏(PTA缺乏)、因子XII缺乏、纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺乏或结构异常、巨血小板综合征(它是GPIb缺陷或缺乏的)。vWF受体GPIb可能缺陷并导致缺少初级凝块形成(初级止血)和增加的出血倾向,以及Glanzman和Naegeli的血小板无力症(Glanzmann血小板无力症)。在肝功能衰竭(急性和慢性形式)中,肝的凝固因子产生不足;这可能增加出血风险。
可以预防性地使用包含本公开文本的分离的核酸分子的慢病毒载体。如本文所用,术语“预防性治疗”是指在出血发作之前给予分子。在一个实施方案中,需要通用止血剂的受试者正在进行或即将进行手术。例如,本公开文本的慢病毒载体可以在手术之前或之后作为预防药来给予。本公开文本的慢病毒载体可以在手术期间或之后给予以控制急性出血发作。所述手术可以包括但不限于肝移植、肝切除、牙科手术或干细胞移植。
本公开文本的慢病毒载体还用于按需治疗。术语“按需治疗”是指响应于出血发作的症状或在可能引起出血的活动之前给予本文公开的慢病毒载体。在一方面,可以在出血开始时(如在损伤后)或在预期要出血时(如在手术前),将按需治疗给予受试者。在另一方面,可以在增加出血风险的活动(如接触运动)之前给予按需治疗。
如本文所用,术语“急性出血”是指出血发作,不管潜在原因是什么。例如,受试者可能患有创伤、尿毒症、遗传性出血性障碍(例如,因子VII缺乏)、血小板障碍或由于产生针对凝血因子的抗体而产生的抗性。
如本文所用的治疗(treat)、治疗(treatment)、治疗(treating)是指例如疾病或病症的严重程度的降低;病程持续时间的减少;与疾病或病症相关的一种或多种症状的改善;向患有疾病或病症的受试者提供有益作用,但不一定治愈疾病或病症;或者预防与疾病或病症相关的一种或多种症状。在一个实施方案中,术语“治疗(treating)”或“治疗(treatment)”意指通过给予本公开文本的慢病毒载体,将受试者中的FVIII谷水平维持在至少约1IU/dL、2IU/dL、3IU/dL、4IU/dL、5IU/dL、6IU/dL、7IU/dL、8IU/dL、9IU/dL、10IU/dL、11IU/dL、12IU/dL、13IU/dL、14IU/dL、15IU/dL、16IU/dL、17IU/dL、18IU/dL、19IU/dL、或20IU/dL。在另一个实施方案中,治疗(treating)或治疗(treatment)意指将FVIII谷水平维持在约1IU/dL与约20IU/dL之间、约2IU/dL与约20IU/dL之间、约3IU/dL与约20IU/dL之间、约4IU/dL与约20IU/dL之间、约5IU/dL与约20IU/dL之间、约6IU/dL与约20IU/dL之间、约7IU/dL与约20IU/dL之间、约8IU/dL与约20IU/dL之间、约9IU/dL与约20IU/dL之间、或约10IU/dL与约20IU/dL之间。疾病或病症的治疗(treating)或治疗(treatment)还可以包括将受试者中的FVIII活性维持在与非血友病受试者中FVIII活性的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、或20%相当的水平。在一个实施方案中,术语“治疗(treating)”或“治疗(treatment)”意指通过给予本公开文本的慢病毒载体,将受试者中的FVIII谷水平维持在至少约30IU/dL、40IU/dL、50IU/dL、60IU/dL、70IU/dL、80IU/dL、90IU/dL、100IU/dL、110IU/dL、120IU/dL、130IU/dL、140IU/dL、或150IU/dL。在另一个实施方案中,治疗(treating)或治疗(treatment)意指将FVIII谷水平维持在约10IU/dL与约20IU/dL之间、约20IU/dL与约23IU/dL之间、约30IU/dL与约40IU/dL之间、约40IU/dL与约50IU/dL之间、约50IU/dL与约60IU/dL之间、约60IU/dL与约70IU/dL之间、约70IU/dL与约80IU/dL之间、约80IU/dL与约90IU/dL之间、约90IU/dL与约100IU/dL之间、约110IU/dL与约120IU/dL之间、约120IU/dL与约130IU/dL之间、约130IU/dL与约140IU/dL之间、或约140IU/dL与约150IU/dL之间。疾病或病症的治疗(treating)或治疗(treatment)还可以包括将受试者中的FVIII活性维持在与非血友病受试者中FVIII活性的至少约30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%、或150%相当的水平。治疗所需的最低谷水平可以通过一种或多种已知方法来测量,并且可以针对每个人进行调整(增加或减少)。
如本文所用,“给予”意指将本公开文本的药学上可接受的因子VIII编码核酸分子、因子VIII多肽或包含因子VIII编码核酸分子的载体经由药学上可接受的途径给予至受试者。给予途径可以是静脉内,例如,静脉内注射和静脉内输注。另外的给予途径包括例如皮下、肌内、口服、经鼻和经肺给予。核酸分子、多肽和载体可以作为包含至少一种赋形剂的药物组合物的一部分来给予。
如本文所用,短语“有需要的受试者”包括将受益于本公开文本的核酸分子、多肽或载体的给予(例如,改进止血)的受试者(如哺乳动物受试者)。在一个实施方案中,受试者包括但不限于患有血友病的个体。在另一个实施方案中,受试者包括但不限于已经产生FVIII抑制剂并且因此需要绕路疗法的个体。受试者可以是成年人或未成年人(例如,小于12岁)。
如本文所用,术语“凝血因子”是指天然存在的或重组产生的分子或其类似物,其预防受试者的出血发作或缩短出血发作的持续时间。换句话说,其意指具有促凝活性(即,负责将纤维蛋白原转化为不溶性纤维蛋白网状物,从而引起血液凝固或凝块)的分子。“可激活的凝血因子”是呈能够被转化为活性形式的无活性形式(例如,呈其酶原形式)的凝血因子。
如本文所用的凝血活性意指参与生化反应级联的能力,所述级联以形成纤维蛋白凝块告终和/或降低出血症或出血发作的严重程度、持续时间或频率。
如本文所用,术语“异源的”或“外源的”是指此类分子通常在给定情况下(例如,在细胞中或在多肽中)未发现。例如,外源或异源分子可以例如通过转染或其他形式的基因工程化引入细胞中并且仅在操纵细胞之后存在,或者异源氨基酸序列可以存在于并非其天然存在的蛋白质中。
如本文所用,术语“异源核苷酸序列”是指并非与给定的多核苷酸序列一起天然存在的核苷酸序列。在一个实施方案中,所述异源核苷酸序列编码能够延长FVIII半衰期的多肽。在另一个实施方案中,所述异源核苷酸序列编码增加FVIII的流体动力学半径的多肽。在其他实施方案中,所述异源核苷酸序列编码改进FVIII的一种或多种药代动力学特性而不显著影响其生物学活性或功能(例如,其促凝活性)的多肽。在一些实施方案中,FVIII通过接头与异源核苷酸序列编码的多肽连接或相连。异源核苷酸序列编码的多肽部分的非限制性例子尤其包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白、美国专利申请号20100292130的PAS多肽、HAP序列、转铁蛋白或其片段、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、白蛋白结合小分子、XTEN序列、FcRn结合部分(例如,完整Fc区或其结合至FcRn的部分)、单链Fc区(ScFc区,例如,如US 2008/0260738、WO 2008/012543或WO 2008/1439545中所述)、聚甘氨酸接头、聚丝氨酸接头、选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的两种类型氨基酸的6-40个氨基酸的肽和短多肽(具有从小于50%至大于50%不同程度的二级结构)、或其两个或更多个组合。在一些实施方案中,所述异源核苷酸序列编码的多肽与非多肽部分连接。非多肽部分的非限制性例子包括聚乙二醇(PEG)、白蛋白结合小分子、聚唾液酸、羟乙基淀粉(HES)、其衍生物或其任何组合。
如本文所用,术语“Fc区”被定义为多肽中对应于天然Ig的Fc区的部分,即,如通过其两条重链的相应Fc结构域的二聚缔合所形成。天然Fc区与另一Fc区形成同二聚体。相比之下,如本文所用,术语“遗传融合的Fc区”或“单链Fc区”(scFc区)是指合成二聚Fc区,其由在单一多肽链内遗传连接(即,在单一连续基因序列中编码)的Fc结构域构成。
在一个实施方案中,“Fc区”是指单一Ig重链中的部分,所述部分在铰链区中紧接木瓜蛋白酶切割位点(即,IgG中的残基216,以重链恒定区的第一个残基为114)上游开始,并且在抗体的C末端结束。因此,完整Fc结构域至少包含铰链结构域、CH2结构域和CH3结构域。
根据Ig同种型,Ig恒定区的Fc区可以包括CH2、CH3和CH4结构域以及铰链区。包含Ig的Fc区的嵌合蛋白赋予嵌合蛋白若干种所需特性,包括增加的稳定性、增加的血清半衰期(参见Capon等人,1989,Nature 337:525)以及与Fc受体(如新生Fc受体(FcRn))结合(美国专利号6,086,875、6,485,726、6,030,613;WO 03/077834;US 2003-0235536A1),将上述文献通过引用以其整体并入本文。
当在本文中用作与本公开文本的核苷酸序列的比较时,“参考核苷酸序列”是与本公开文本的核苷酸序列基本上相同的多核苷酸序列,但是对应于FVIII序列的部分未经优化。例如,由SEQ ID NO:1的经密码子优化的BDD FVIII和编码在其3'端与SEQ ID NO:1连接的单链Fc区的异源核苷酸序列组成的核酸分子的参考核苷酸序列是由SEQ ID NO:16的初始(或“亲代”)BDD FVIII(图1I)和编码在其3'端与SEQ ID NO:16连接的单链Fc区的相同异源核苷酸序列组成的核酸分子。
如本文所用,“密码子适应指数”是指密码子使用偏好的量度。密码子适应指数(CAI)测量给定的蛋白质编码基因序列关于参考基因集的偏差(Sharp PM和Li WH,NucleicAcids Res.15(3):1281-95(1987))。CAI是通过确定在基因序列的长度上与每个密码子相关的权重(按密码子测量)的几何平均值:
Figure BDA0002701601960000271
对于每种氨基酸,在CAI中其每个密码子的权重被计算为该氨基酸的观察到的密码子频率(fi)与同义密码子的频率(fj)之间的比率:
式2:
Figure BDA0002701601960000272
如本文所用,关于核苷酸序列的术语“优化的”是指编码多肽的多核苷酸序列,其中所述多核苷酸序列已经突变以增强该多核苷酸序列的特性。在一些实施方案中,进行优化以增加转录水平,增加翻译水平,增加稳态mRNA水平,增加或减少调节蛋白(如通用转录因子)的结合,增加或减少剪接,或者增加多核苷酸序列产生的多肽的产量。可以对多核苷酸序列进行以将其优化的变化的例子包括密码子优化、G/C含量优化、去除重复序列、去除富含AT的元件、去除隐蔽剪接位点、去除阻遏转录或翻译的顺式作用元件、添加或去除多聚T或多聚A序列、在转录起始位点周围添加增强转录的序列(如Kozak共有序列)、去除可以形成茎环结构的序列、去除去稳定序列及其两个或更多个组合。
II.FVIII慢病毒基因疗法
已经探索体基因疗法作为出血性障碍并且特别是血友病A的可能治疗。基因疗法是特别有吸引力的对血友病的治疗,因为其有可能通过在单次给予编码FVIII的载体后持续内源性产生FVIII而治愈疾病。血友病A非常适合于基因替代方法,因为其临床表现可完全归因于缺少以微量(200ng/ml)在血浆中循环的单一基因产物(FVIII)。
慢病毒载体由于其大容量和经由整合来持续表达转基因的能力,作为基因递送媒介物越来越受到重视。已经在多个离体细胞疗法临床程序中将慢病毒载体评价为具有有前景的功效和安全性特征。
本公开文本通过提供包含经密码子优化的FVIII序列的慢病毒载体满足了本领域的重要需求,所述经密码子优化的FVIII序列在受试者中显示增加的表达并且在用于基因疗法方法中时可能导致更大的治疗功效。本公开文本的实施方案涉及本文所述的包含一种或多种经密码子优化的编码具有FVIII活性的多肽的核酸分子的慢病毒载体、包含所述慢病毒载体的宿主细胞(例如,肝细胞)、以及使用所公开的慢病毒载体的方法(例如,使用本文公开的慢病毒载体对出血性障碍进行的治疗)。
通常,本文公开的治疗方法涉及给予包含核酸分子的慢病毒载体,所述核酸分子包含至少一种经密码子优化的编码FVIII凝血因子的核酸序列,其中所述编码FVIII凝血因子的核酸序列与合适的表达控制序列可操作地连接,所述表达控制序列在一些实施方案中被掺入慢病毒载体(例如,复制缺陷性慢病毒载体)中。
本公开文本提供在有需要的受试者中治疗出血性障碍(例如,血友病A)的方法,所述方法包括向所述受试者给予至少一个剂量的5x1010或更少转导单位/kg(TU/kg)(或109或更少TU/kg,或108或更少TU/kg)的慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列具有:
(i)与SEQ ID NO:1的核苷酸58-2277和2320-4374的至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(ii)与SEQ ID NO:2的核苷酸58-2277和2320-4374的至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iii)与SEQ ID NO:70的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iv)与SEQ ID NO:71的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(v)与SEQ ID NO:3的核苷酸58-2277和2320-4374的至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(vi)与SEQ ID NO:4的核苷酸58-2277和2320-4374的至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(vii)与SEQ ID NO:5的核苷酸58-2277和2320-4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(viii)与SEQ ID NO:6的核苷酸58-2277和2320-4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(ix)或(i)至(viii)的任何组合。
本公开文本还提供治疗有需要的受试者的出血性障碍(例如,血友病A)的方法,所述方法包括向所述受试者给予至少一个剂量的5x1010或更少转导单位/kg(TU/kg)(或109TU/kg或更少,或108TU/kg或更少)的慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码因子VIII(FVIII)多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;
(a)其中所述第一核酸序列具有:
(i)与SEQ ID NO:3的核苷酸58-2277和2320-1791的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(ii)与SEQ ID NO:4的核苷酸58-2277和2320-1791的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iii)与SEQ ID NO:5的核苷酸58-1791的至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(iv)与SEQ ID NO:6的核苷酸58-1791的至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(b)其中所述第二核苷酸序列具有:
(i)与SEQ ID NO:3的核苷酸1792-2277和2320-4374的至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(ii)与SEQ ID NO:4的核苷酸1792-2277和2320-4374的至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iii)与SEQ ID NO:5的核苷酸1792-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(iv)与SEQ ID NO:6的核苷酸1792-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(c)(a)与(b)的任何组合;并且
其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一些实施方案中,所述剂量为约5.0x1010TU/kg、约4.9x1010TU/kg、约4.8x1010TU/kg、约4.7x1010TU/kg、约4.6x1010TU/kg、约4.5x1010TU/kg、约4.4x1010TU/kg、约4.3x1010TU/kg、约4.2x1010TU/kg、约4.1x1010TU/kg、约4.0x1010TU/kg、约3.9x1010TU/kg、约3.8x1010TU/kg、约3.7x1010TU/kg、约3.6x1010TU/kg、约3.5x1010TU/kg、约3.4x1010TU/kg、约3.3x1010TU/kg、约3.2x1010TU/kg、约3.1x1010TU/kg、约3.0x1010TU/kg、约2.9x1010TU/kg、约2.8x1010TU/kg、约2.7x1010TU/kg、约2.6x1010TU/kg、约2.5x1010TU/kg、约2.4x1010TU/kg、约2.3x1010TU/kg、约2.2x1010TU/kg、约2.1x1010TU/kg、约2.0x1010TU/kg、约1.9x1010TU/kg、约1.8x1010TU/kg、约1.7x1010TU/kg、约1.6x1010TU/kg、约1.5x1010TU/kg、约1.4x1010TU/kg、约1.3x1010TU/kg、约1.2x1010TU/kg、约1.1x1010TU/kg、或约1.0x1010TU/kg。
在一些实施方案中,所述剂量为约9.9x109TU/kg、约9.8x109TU/kg、约9.7x109TU/kg、约9.6x109TU/kg、约9.5x109TU/kg、约9.4x109TU/kg、约9.3x109TU/kg、约9.2x109TU/kg、约9.1x109TU/kg、约9.0x109TU/kg、约8.9x109TU/kg、约8.8x109TU/kg、约8.7x109TU/kg、约8.6x109TU/kg、约8.5x109TU/kg、约8.4x109TU/kg、约8.3x109TU/kg、约8.2x109TU/kg、约8.1x109TU/kg、约8.0x109TU/kg、约7.9x109TU/kg、约7.8x109TU/kg、约7.7x109TU/kg、约7.6x109TU/kg、约7.5x109TU/kg、约7.4x109TU/kg、约7.3x109TU/kg、约7.2x109TU/kg、约7.1x109TU/kg、约7.0x109TU/kg、约6.9x109TU/kg、约6.8x109TU/kg、约6.7x109TU/kg、约6.6x109TU/kg、约6.5x109TU/kg、约6.4x109TU/kg、约6.3x109TU/kg、约6.2x109TU/kg、约6.1x109TU/kg、约6.0x109TU/kg、约5.9x109TU/kg、约5.8x109TU/kg、约5.7x109TU/kg、约5.6x109TU/kg、约5.5x109TU/kg、约5.4x109TU/kg、约5.3x109TU/kg、约5.2x109TU/kg、约5.1x109TU/kg、约5.0x109TU/kg、约4.9x109TU/kg、约4.8x109TU/kg、约4.7x109TU/kg、约4.6x109TU/kg、约4.5x109TU/kg、约4.4x109TU/kg、约4.3x109TU/kg、约4.2x109TU/kg、约4.1x109TU/kg、约4.0x109TU/kg、约3.9x109TU/kg、约3.8x109TU/kg、约3.7x109TU/kg、约3.6x109TU/kg、约3.5x109TU/kg、约3.4x109TU/kg、约3.3x109TU/kg、约3.2x109TU/kg、约3.1x109TU/kg、约3.0x109TU/kg、约2.9x109TU/kg、约2.8x109TU/kg、约2.7x109TU/kg、约2.6x109TU/kg、约2.5x109TU/kg、约2.4x109TU/kg、约2.3x109TU/kg、约2.2x109TU/kg、约2.1x109TU/kg、约2.0x109TU/kg、约1.9x109TU/kg、约1.8x109TU/kg、约1.7x109TU/kg、约1.6x109TU/kg、约1.5x109TU/kg、约1.4x109TU/kg、约1.3x109TU/kg、约1.2x109TU/kg、约1.1x109TU/kg、或约1.0x109TU/kg。
在一些实施方案中,所述剂量为约9.9x108TU/kg、约9.8x108TU/kg、约9.7x108TU/kg、约9.6x108TU/kg、约9.5x108TU/kg、约9.4x108TU/kg、约9.3x108TU/kg、约9.2x108TU/kg、约9.1x108TU/kg、约9.0x108TU/kg、约8.9x108TU/kg、约8.8x108TU/kg、约8.7x108TU/kg、约8.6x108TU/kg、约8.5x108TU/kg、约8.4x108TU/kg、约8.3x108TU/kg、约8.2x108TU/kg、约8.1x108TU/kg、约8.0x108TU/kg、约7.9x108TU/kg、约7.8x108TU/kg、约7.7x108TU/kg、约7.6x108TU/kg、约7.5x108TU/kg、约7.4x108TU/kg、约7.3x108TU/kg、约7.2x108TU/kg、约7.1x108TU/kg、约7.0x108TU/kg、约6.9x108TU/kg、约6.8x108TU/kg、约6.7x108TU/kg、约6.6x108TU/kg、约6.5x108TU/kg、约6.4x108TU/kg、约6.3x108TU/kg、约6.2x108TU/kg、约6.1x108TU/kg、约6.0x108TU/kg、约5.9x108TU/kg、约5.8x108TU/kg、约5.7x108TU/kg、约5.6x108TU/kg、约5.5x108TU/kg、约5.4x108TU/kg、约5.3x108TU/kg、约5.2x108TU/kg、约5.1x108TU/kg、约5.0x108TU/kg、约4.9x108TU/kg、约4.8x108TU/kg、约4.7x108TU/kg、约4.6x108TU/kg、约4.5x108TU/kg、约4.4x108TU/kg、约4.3x108TU/kg、约4.2x108TU/kg、约4.1x108TU/kg、约4.0x108TU/kg、约3.9x108TU/kg、约3.8x108TU/kg、约3.7x108TU/kg、约3.6x108TU/kg、约3.5x108TU/kg、约3.4x108TU/kg、约3.3x108TU/kg、约3.2x108TU/kg、约3.1x108TU/kg、约3.0x108TU/kg、约2.9x108TU/kg、约2.8x108TU/kg、约2.7x108TU/kg、约2.6x108TU/kg、约2.5x108TU/kg、约2.4x108TU/kg、约2.3x108TU/kg、约2.2x108TU/kg、约2.1x108TU/kg、约2.0x108TU/kg、约1.9x108TU/kg、约1.8x108TU/kg、约1.7x108TU/kg、约1.6x108TU/kg、约1.5x108TU/kg、约1.4x108TU/kg、约1.3x108TU/kg、约1.2x108TU/kg、约1.1x108TU/kg、或约1.0x108TU/kg。
在一些实施方案中,所述剂量为小于5.0x1010TU/kg、小于4.9x1010TU/kg、小于4.8x1010TU/kg、小于4.7x1010TU/kg、小于4.6x1010TU/kg、小于4.5x1010TU/kg、小于4.4x1010TU/kg、小于4.3x1010TU/kg、小于4.2x1010TU/kg、小于4.1x1010TU/kg、小于4.0x1010TU/kg、小于3.9x1010TU/kg、小于3.8x1010TU/kg、小于3.7x1010TU/kg、小于3.6x1010TU/kg、小于3.5x1010TU/kg、小于3.4x1010TU/kg、小于3.3x1010TU/kg、小于3.2x1010TU/kg、小于3.1x1010TU/kg、小于3.0x1010TU/kg、小于2.9x1010TU/kg、小于2.8x1010TU/kg、小于2.7x1010TU/kg、小于2.6x1010TU/kg、小于2.5x1010TU/kg、小于2.4x1010TU/kg、小于2.3x1010TU/kg、小于2.2x1010TU/kg、小于2.1x1010TU/kg、小于2.0x1010TU/kg、小于1.9x1010TU/kg、小于1.8x1010TU/kg、小于1.7x1010TU/kg、小于1.6x1010TU/kg、小于1.5x1010TU/kg、小于1.4x1010TU/kg、小于1.3x1010TU/kg、小于1.2x1010TU/kg、小于1.1x1010TU/kg、或小于1.0x1010TU/kg。
在一些实施方案中,所述剂量为小于9.9x109TU/kg、小于9.8x109TU/kg、小于9.7x109TU/kg、小于9.6x109TU/kg、小于9.5x109TU/kg、小于9.4x109TU/kg、小于9.3x109TU/kg、小于9.2x109TU/kg、小于9.1x109TU/kg、小于9.0x109TU/kg、小于8.9x109TU/kg、小于8.8x109TU/kg、小于8.7x109TU/kg、小于8.6x109TU/kg、小于8.5x109TU/kg、小于8.4x109TU/kg、小于8.3x109TU/kg、小于8.2x109TU/kg、小于8.1x109TU/kg、小于8.0x109TU/kg、小于7.9x109TU/kg、小于7.8x109TU/kg、小于7.7x109TU/kg、小于7.6x109TU/kg、小于7.5x109TU/kg、小于7.4x109TU/kg、小于7.3x109TU/kg、小于7.2x109TU/kg、小于7.1x109TU/kg、小于7.0x109TU/kg、小于6.9x109TU/kg、小于6.8x109TU/kg、小于6.7x109TU/kg、小于6.6x109TU/kg、小于6.5x109TU/kg、小于6.4x109TU/kg、小于6.3x109TU/kg、小于6.2x109TU/kg、小于6.1x109TU/kg、小于6.0x109TU/kg、小于5.9x109TU/kg、小于5.8x109TU/kg、小于5.7x109TU/kg、小于5.6x109TU/kg、小于5.5x109TU/kg、小于5.4x109TU/kg、小于5.3x109TU/kg、小于5.2x109TU/kg、小于5.1x109TU/kg、小于5.0x109TU/kg、小于4.9x109TU/kg、小于4.8x109TU/kg、小于4.7x109TU/kg、小于4.6x109TU/kg、小于4.5x109TU/kg、小于4.4x109TU/kg、小于4.3x109TU/kg、小于4.2x109TU/kg、小于4.1x109TU/kg、小于4.0x109TU/kg、小于3.9x109TU/kg、小于3.8x109TU/kg、小于3.7x109TU/kg、小于3.6x109TU/kg、小于3.5x109TU/kg、小于3.4x109TU/kg、小于3.3x109TU/kg、小于3.2x109TU/kg、小于3.1x109TU/kg、小于3.0x109TU/kg、小于2.9x109TU/kg、小于2.8x109TU/kg、小于2.7x109TU/kg、小于2.6x109TU/kg、小于2.5x109TU/kg、小于2.4x109TU/kg、小于2.3x109TU/kg、小于2.2x109TU/kg、小于2.1x109TU/kg、小于2.0x109TU/kg、小于1.9x109TU/kg、小于1.8x109TU/kg、小于1.7x109TU/kg、小于1.6x109TU/kg、小于1.5x109TU/kg、小于1.4x109TU/kg、小于1.3x109TU/kg、小于1.2x109TU/kg、小于1.1x109TU/kg、或小于1.0x109TU/kg。
在一些实施方案中,所述剂量为小于9.9x108TU/kg、小于9.8x108TU/kg、小于9.7x108TU/kg、小于9.6x108TU/kg、小于9.5x108TU/kg、小于9.4x108TU/kg、小于9.3x108TU/kg、小于9.2x108TU/kg、小于9.1x108TU/kg、小于9.0x108TU/kg、小于8.9x108TU/kg、小于8.8x108TU/kg、小于8.7x108TU/kg、小于8.6x108TU/kg、小于8.5x108TU/kg、小于8.4x108TU/kg、小于8.3x108TU/kg、小于8.2x108TU/kg、小于8.1x108TU/kg、小于8.0x108TU/kg、小于7.9x108TU/kg、小于7.8x108TU/kg、小于7.7x108TU/kg、小于7.6x108TU/kg、小于7.5x108TU/kg、小于7.4x108TU/kg、小于7.3x108TU/kg、小于7.2x108TU/kg、小于7.1x108TU/kg、小于7.0x108TU/kg、小于6.9x108TU/kg、小于6.8x108TU/kg、小于6.7x108TU/kg、小于6.6x108TU/kg、小于6.5x108TU/kg、小于6.4x108TU/kg、小于6.3x108TU/kg、小于6.2x108TU/kg、小于6.1x108TU/kg、小于6.0x108TU/kg、小于5.9x108TU/kg、小于5.8x108TU/kg、小于5.7x108TU/kg、小于5.6x108TU/kg、小于5.5x108TU/kg、小于5.4x108TU/kg、小于5.3x108TU/kg、小于5.2x108TU/kg、小于5.1x108TU/kg、小于5.0x108TU/kg、小于4.9x108TU/kg、小于4.8x108TU/kg、小于4.7x108TU/kg、小于4.6x108TU/kg、小于4.5x108TU/kg、小于4.4x108TU/kg、小于4.3x108TU/kg、小于4.2x108TU/kg、小于4.1x108TU/kg、小于4.0x108TU/kg、小于3.9x108TU/kg、小于3.8x108TU/kg、小于3.7x108TU/kg、小于3.6x108TU/kg、小于3.5x108TU/kg、小于3.4x108TU/kg、小于3.3x108TU/kg、小于3.2x108TU/kg、小于3.1x108TU/kg、小于3.0x108TU/kg、小于2.9x108TU/kg、小于2.8x108TU/kg、小于2.7x108TU/kg、小于2.6x108TU/kg、小于2.5x108TU/kg、小于2.4x108TU/kg、小于2.3x108TU/kg、小于2.2x108TU/kg、小于2.1x108TU/kg、小于2.0x108TU/kg、小于1.9x108TU/kg、小于1.8x108TU/kg、小于1.7x108TU/kg、小于1.6x108TU/kg、小于1.5x108TU/kg、小于1.4x108TU/kg、小于1.3x108TU/kg、小于1.2x108TU/kg、小于1.1x108TU/kg、或小于1.0x108TU/kg。
在一些实施方案中,所述剂量为在1x108TU/kg与5x1010TU/kg之间、在1.5x108TU/kg与5x1010TU/kg之间、在2x108TU/kg与5x1010TU/kg之间、在2.5x108TU/kg与5x1010TU/kg之间、在3x108TU/kg与5x1010TU/kg之间、在3.5x108TU/kg与5x1010TU/kg之间、在4x108TU/kg与5x1010TU/kg之间、在4.5x108TU/kg与5x1010TU/kg之间、在5x108TU/kg与5x1010TU/kg之间、在5.5x108TU/kg与5x1010TU/kg之间、在6x108TU/kg与5x1010TU/kg之间、在6.5x108TU/kg与5x1010TU/kg之间、在7x108TU/kg与5x1010TU/kg之间、在7.5x108TU/kg与5x1010TU/kg之间、在8x108TU/kg与5x1010TU/kg之间、在8.5x108TU/kg与5x1010TU/kg之间、在9x108TU/kg与5x1010TU/kg之间、在9.5x108TU/kg与5x1010TU/kg之间、在1x109TU/kg与5x1010TU/kg之间、在1.5x109TU/kg与5x1010TU/kg之间、在2x109TU/kg与5x1010TU/kg之间、在2.5x109TU/kg与5x1010TU/kg之间、在3x109TU/kg与5x1010TU/kg之间、在3.5x109TU/kg与5x1010TU/kg之间、在4x109TU/kg与5x1010TU/kg之间、在4.5x109TU/kg与5x1010TU/kg之间、在5x109TU/kg与5x1010TU/kg之间、在5.5x109TU/kg与5x1010TU/kg之间、在6x109TU/kg与5x1010TU/kg之间、在6.5x109TU/kg与5x1010TU/kg之间、在7x109TU/kg与5x1010TU/kg之间、在7.5x109TU/kg与5x1010TU/kg之间、在8x109TU/kg与5x1010TU/kg之间、在8.5x109TU/kg与5x1010TU/kg之间、在9x109TU/kg与5x1010TU/kg之间、在9.5x109TU/kg与5x1010TU/kg之间、在1010TU/kg与5x1010TU/kg之间、在1.5x1010TU/kg与5x1010TU/kg之间、在2x1010TU/kg与5x1010TU/kg之间、在2.5x1010TU/kg与5x1010TU/kg之间、在3x1010TU/kg与5x1010TU/kg之间、在3.5x1010TU/kg与5x1010TU/kg之间、在4x1010TU/kg与5x1010TU/kg之间、或在4.5x1010TU/kg与5x1010TU/kg之间。
在一些实施方案中,所述剂量为在1x108TU/kg与5x1010TU/kg之间、在1x108TU/kg与4.5x1010TU/kg之间、在1x108TU/kg与4x1010TU/kg之间、在1x108TU/kg与3.5x1010TU/kg之间、在1x108TU/kg与3x1010TU/kg之间、在1x108TU/kg与2.5x1010TU/kg之间、在1x108TU/kg与2x1010TU/kg之间、在1x108TU/kg与1.5x1010TU/kg之间、在1x108TU/kg与1010TU/kg之间、在1x108TU/kg与9x109TU/kg之间、在1x108TU/kg与8.5x109TU/kg之间、在1x108TU/kg与8x109TU/kg之间、在1x108TU/kg与7.5x109TU/kg之间、在1x108TU/kg与7x109TU/kg之间、在1x108TU/kg与6.5x109TU/kg之间、在1x108TU/kg与6x109TU/kg之间、在1x108TU/kg与5.5x109TU/kg之间、在1x108TU/kg与5x109TU/kg之间、在1x108TU/kg与4.5x109TU/kg之间、在1x108TU/kg与4x109TU/kg之间、在1x108TU/kg与3.5x109TU/kg之间、在1x108TU/kg与3x109TU/kg之间、在1x108TU/kg与2.5x109TU/kg之间、在1x108TU/kg与2x109TU/kg之间、在1x108TU/kg与1.5x109TU/kg之间、在1x108TU/kg与1x109TU/kg之间、在1x108TU/kg与9.5x108TU/kg之间、在1x108TU/kg与9x108TU/kg之间、在1x108TU/kg与8.5x108TU/kg之间、在1x108TU/kg与8x108TU/kg之间、在1x108TU/kg与7.5x108TU/kg之间、在1x108TU/kg与7x108TU/kg之间、在1x108TU/kg与6.5x108TU/kg之间、在1x108TU/kg与6x108TU/kg之间、在1x108TU/kg与5.5x108TU/kg之间、在1x108TU/kg与5x108TU/kg之间、在1x108TU/kg与4.5x108TU/kg之间、在1x108TU/kg与4x108TU/kg之间、在1x108TU/kg与3.5x108TU/kg之间、在1x108TU/kg与3x108TU/kg之间、在1x108TU/kg与2.5x108TU/kg之间、在1x108TU/kg与2x108之间、或在1x108TU/kg与1.5x108TU/kg之间。
在一些实施方案中,所述剂量为在1x1010TU/kg与2x1010TU/kg之间、在1.1x1010TU/kg与1.9x1010TU/kg之间、在1.2x1010TU/kg与1.8x1010TU/kg之间、在1.3x1010TU/kg与1.7x1010TU/kg之间、或在1.4x1010TU/kg与1.6x1010TU/kg之间。在一些实施方案中,所述剂量为约1.5x1010TU/kg。在一些实施方案中,所述剂量为1.5x1010TU/kg。
在一些实施方案中,所述剂量为在1x109TU/kg与2x109TU/kg之间、在1.1x109TU/kg与1.9x109TU/kg之间、在1.2x109TU/kg与1.8x109TU/kg之间、在1.3x109TU/kg与1.7x109TU/kg之间、或在1.4x109TU/kg与1.6x109TU/kg之间。在一些实施方案中,所述剂量为1.5x109TU/kg。在某些实施方案中,所述剂量为约3.0x109TU/kg。
在一些实施方案中,所述剂量为在2.5x109TU/kg与3.5x109TU/kg之间、在2.6x109TU/kg与3.4x109TU/kg之间、在2.7x109TU/kg与3.3x109TU/kg之间、在2.8x109TU/kg与3.2x109TU/kg之间、或在2.9x109TU/kg与3.1x109TU/kg之间。在一些实施方案中,所述剂量为约3.0x109TU/kg。在一些实施方案中,所述剂量为3.0x109TU/kg。
在一些实施方案中,所述剂量为在5.5x109TU/kg与6.5x109TU/kg之间、在5.6x109TU/kg与6.4x109TU/kg之间、在5.7x109TU/kg与6.3x109TU/kg之间、在5.8x109TU/kg与6.2x109TU/kg之间、或在5.9x109TU/kg与6.1x109TU/kg之间。在一些实施方案中,所述剂量为约6.0x109TU/kg。在一些实施方案中,所述剂量为6.0x109TU/kg。
在一些实施方案中,相对于被给予包含含有SEQ ID NO:16的核酸分子的参考载体的受试者的血浆FVIII活性,在给予本公开文本的慢病毒载体后24小时、36小时或48小时,血浆FVIII活性增加。
在一些实施方案中,相对于被给予包含含有SEQ ID NO:16的核酸分子的参考载体的受试者的血浆FVIII活性,在给予慢病毒载体后48小时后,血浆FVIII活性增加。
在另一个实施方案中,相对于被给予包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的参考病毒载体或所述参考核酸分子编码的多肽的受试者,在给予慢病毒载体后约21天,血浆FVIII活性增加。
在一些实施方案中,相对于被给予包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的参考病毒载体或所述参考核酸分子编码的多肽的受试者,在给予慢病毒载体后约6小时、约12小时、约18小时、约24小时、约36小时、约48小时、约3天、约4天、约5天、约6天、约7天、约8天、约9天、约10天、约11天、约12天、约13天、约14天、约15天、约16天、约17天、约18天、约19天、约20天、约21天、约22天、约23天、约24天、约25天、约26天、约27天或约28天,血浆FVIII活性增加。
在一些实施方案中,相对于被给予包含SEQ ID NO:16的参考核酸分子的受试者中的水平,相对于被给予包含所述参考核酸分子的参考病毒载体的受试者中的水平,或者相对于给予所述参考核酸分子编码的多肽后受试者中的水平,关于受试者中的基础水平,受试者中的血浆FVIII活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约55倍、至少约60倍、至少约65倍、至少约70倍、至少约75倍、至少约80倍、至少约85倍、至少约90倍、至少约95倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、或至少约200倍。
在一些实施方案中,将所述慢病毒载体作为单一剂量或多个剂量给予。在一些实施方案中,将所述慢病毒载体剂量一次性给予或分为多个亚剂量,例如两个亚剂量、三个亚剂量、四个亚剂量、五个亚剂量、六个亚剂量或多于六个亚剂量。在一些实施方案中,给予多于一种慢病毒载体。
在一些实施方案中,将所述剂量的慢病毒载体重复给予至少两次、至少三次、至少四次、至少五次、至少六次、至少七次、至少八次、至少九次或至少十次。在一些实施方案中,将所述慢病毒载体经由静脉内注射给予。
在一些实施方案中,所述受试者是儿科受试者,而在其他方面,所述受试者是成年受试者。
在一些实施方案中,所述慢病毒载体包含至少一种组织特异性启动子,即,会调节具有FVIII活性的多肽在特定组织或细胞类型中的表达的启动子。在一些实施方案中,所述慢病毒载体中的组织特异性启动子选择性地增强具有FVIII活性的多肽在靶肝细胞中的表达。在一些实施方案中,选择性地增强具有FVIII活性的多肽在靶肝细胞中的表达的组织特异性启动子包括mTTR启动子。在一些实施方案中,所述靶肝细胞(liver cell)是肝细胞(hepatocyte)。
由于慢病毒载体可以转导所有肝细胞类型,可以通过在慢病毒载体中使用不同启动子来控制转基因(例如,FVIII)在不同细胞类型中的表达。因此,所述慢病毒载体可以包含会控制FVIII转基因在不同的组织或细胞类型(如不同的肝组织或细胞类型)中的表达的特异性启动子。因此,在一些实施方案中,所述慢病毒载体可以包含会控制FVIII转基因在肝内皮组织中的表达的内皮特异性启动子,或会控制FVIII转基因在肝细胞中的表达的肝细胞特异性启动子,或二者。
在一些实施方案中,所述慢病毒载体包含控制FVIII转基因在除了肝以外的组织中的表达的一种或多种组织特异性启动子。在一些实施方案中,将分离的核酸分子稳定地整合到靶细胞或靶组织的基因组中,例如肝细胞的基因组中或肝内皮细胞的基因组中。
在一些实施方案中,本公开文本的慢病毒载体中编码具有FVIII活性的多肽的核苷酸序列包含LV-coFVIII-6(SEQ ID NO:71),由LV-coFVIII-6(SEQ ID NO:71)组成,或基本上由LV-coFVIII-6(SEQ ID NO:71)组成。
在其他实施方案中,本公开文本的慢病毒载体中编码具有FVIII活性的多肽的核苷酸序列包含LV-coFVIII-6-XTEN(SEQ ID NO:72),由LV-coFVIII-6-XTEN(SEQ ID NO:72)组成,或基本上由LV-coFVIII-6-XTEN(SEQ ID NO:72)组成。
在一些实施方案中,本公开文本的慢病毒载体中编码具有FVIII活性的多肽的核苷酸序列还包含编码信号肽的核酸序列,其中所述编码信号肽的核酸序列具有与以下各项的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性:(i)SEQ ID NO:1的核苷酸1至57;(ii)SEQ ID NO:2的核苷酸1至57;(iii)SEQ ID NO:3的核苷酸1至57;(iv)SEQ ID NO:4的核苷酸1至57;(v)SEQ ID NO:5的核苷酸1至57;(vi)SEQ ID NO:6的核苷酸1至57;(vii)SEQ ID NO:70的核苷酸1至57;(viii)SEQ ID NO:71的核苷酸1至57;或(ix)SEQ ID NO:68的核苷酸1至57。
在一些实施方案中,本公开文本的慢病毒载体中分离的核酸分子包含选自以下各项的一种或多种特性:(a)所述核酸分子或其部分的人密码子适应指数相对于SEQ ID NO:16增加;(b)所述核苷酸序列或其部分的最优密码子的频率相对于SEQ ID NO:16增加;(c)与SEQ ID NO:16中G/C核苷酸的百分比相比,所述核苷酸序列或其部分含有更高的G/C核苷酸百分比;(d)所述核苷酸序列或其部分的相对同义密码子使用度相对于SEQ ID NO:16增加;(e)所述核苷酸序列或其部分的有效密码子数相对于SEQ ID NO:16减少;(f)所述核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列(SEQ ID NO:21和22);(g)所述核苷酸序列相对于SEQ ID NO:16含有更少的去稳定元件(SEQ ID NO:23和24);以及(h)其任何组合。
在一些实施方案中,本公开文本的慢病毒载体中分离的核酸分子还包含编码异源氨基酸序列(例如,半衰期延长剂)的异源核苷酸序列。在一些实施方案中,所述异源氨基酸序列是免疫球蛋白恒定区或其部分、XTEN、转铁蛋白、白蛋白或PAS序列。在一些实施方案中,所述异源氨基酸序列与由所述核苷酸序列编码的氨基酸序列的N末端或C末端连接,或者在选自表3的一个或多个插入位点插入由所述核苷酸序列编码的氨基酸序列中的两个氨基酸之间。
在一些实施方案中,所述FVIII多肽是全长FVIII或B结构域缺失的FVIII。
本文公开的慢病毒载体可以在哺乳动物(例如人患者)体内以低剂量(例如,1010TU/kg或更低、109TU/kg或更低、或108TU/kg或更低)使用,使用基因疗法方法对于治疗选自以下的出血性疾病或障碍将是治疗上有益的:出血性凝固障碍、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血症、腹内出血症、胸腔内出血症、骨折、中枢神经系统出血、咽喉间隙出血、腹膜后间隙出血和髂腰肌鞘出血。在一个实施方案中,所述出血性疾病或障碍是血友病。在另一个实施方案中,所述出血性疾病或障碍是血友病A。
在一些实施方案中,在给予至患者之前,在体外用低剂量(例如,1010TU/kg或更低、109TU/kg或更低、或108TU/kg或更低)的本文公开的慢病毒载体处理靶细胞(例如,肝细胞)。在某些实施方案中,在给予至患者之前,在体外用约3.0x109TU/kg的本文公开的慢病毒载体处理靶细胞(例如,肝细胞)。在又另一个实施方案中,在给予至患者之前,用低剂量(例如,1010TU/kg或更低、109TU/kg或更低、或108TU/kg或更低)的本文公开的慢病毒载体离体处理来自患者的细胞(例如,肝细胞)。
在一些实施方案中,相对于生理上正常的循环FVIII水平,在给予本文公开的慢病毒载体(例如,以1010TU/kg或更低、109TU/kg或更低、或108TU/kg或更低给予)后,血浆FVIII活性增加至少约100%、至少约110%、至少约120%、至少约130%、至少约140%、至少约150%、至少约160%、至少约170%、至少约180%、至少约190%、至少约200%、至少约210%、至少约220%、至少约230%、至少约240%、至少约250%、至少约260%、至少约270%、至少约280%、至少约290%、或至少约300%。
在一个实施方案中,相对于生理上正常的循环FVIII水平,在给予本公开文本的慢病毒载体后,血浆FVIII活性增加至少约3,000%至约5,000%。在一些实施方案中,相对于被给予包含含有SEQ ID NO:16的参考核酸分子的相应慢病毒载体的受试者,在给予本文所述的包含经密码子优化的编码具有因子VIII(FVIII)活性的多肽的基因的慢病毒载体后21天,血浆FVIII活性增加至少约10倍、至少约20倍、至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、或至少约200倍。
本公开文本还提供治疗、预防或改善有需要的受试者的止血障碍(例如,出血性障碍,如血友病A)的方法,所述方法包括向所述受试者给予治疗有效量的慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中将所述慢病毒载体作为5x1010或更少TU/kg、109或更少TU/kg、或108或更少TU/kg的至少一个剂量来给予。
通过本公开文本的慢病毒载体进行的治疗、改善和预防可以是绕路疗法(bypasstherapy)。接受绕路疗法的受试者可能已经产生针对凝血因子(例如,FVIII)的抑制剂,或者正在产生凝血因子抑制剂。
本公开文本的慢病毒载体通过促进纤维蛋白凝块的形成来治疗或预防止血障碍。由本公开文本的核酸分子编码的具有FVIII活性的多肽可以激活凝固级联的成员。凝血因子可以是外在途径、固有途径或二者的参与者。
本公开文本的慢病毒载体可以用于治疗已知可用FVIII治疗的止血障碍。可以使用本公开文本的方法治疗的止血障碍包括但不限于血友病A、血友病B、血管性血友病、因子XI缺乏(PTA缺乏)、因子XII缺乏、以及纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺乏或结构异常、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血症、腹内出血症、胸腔内出血症、骨折、中枢神经系统出血、咽喉间隙出血、腹膜后间隙出血和髂腰肌鞘出血。
用于给予至受试者的组合物包含含有核酸分子的慢病毒载体(用于基因疗法应用)以及FVIII多肽分子,所述核酸分子包含本公开文本的优化的编码FVIII凝血因子的核苷酸序列。在一些实施方案中,用于给予的组合物是在体内、在体外或离体与本公开文本的慢病毒载体接触的细胞。
在一些实施方案中,所述止血障碍是遗传性障碍。在一个实施方案中,所述受试者患有血友病A。在其他实施方案中,所述止血障碍是FVIII缺乏的结果。在其他实施方案中,所述止血障碍可能是缺陷性FVIII凝血因子的结果。
在另一个实施方案中,所述止血障碍可以是获得性障碍。获得性障碍可能源自潜在的继发性疾病或病症。无关病症可能是例如但不限于癌症、自身免疫疾病或妊娠。获得性障碍可能源自衰老或源自用于治疗潜在继发性障碍的药物疗法(例如,癌症化学疗法)。
本公开文本还涉及治疗未患止血障碍或导致获得止血障碍的继发性疾病或病症的受试者的方法。因此,本公开文本涉及治疗需要通用止血剂的受试者的方法,所述方法包括给予治疗有效量的本公开文本的慢病毒载体。例如,在一个实施方案中,需要通用止血剂的受试者正在进行或即将进行手术。本公开文本的慢病毒载体可以在手术之前或之后作为预防药来给予。
本公开文本的慢病毒载体可以在手术期间或之后给予以控制急性出血发作。手术可以包括但不限于肝移植、肝切除或干细胞移植。
在另一个实施方案中,本公开文本的慢病毒载体可以用于治疗未患止血障碍的患有急性出血发作的受试者。急性出血发作可能源自严重创伤(例如,手术)、车祸、伤口、枪击撕裂伤或导致不受控制的出血的任何其他创伤性事件。
所述慢病毒载体可以用于预防性地治疗患有止血障碍的受试者。所述慢病毒载体还可以用于治疗患有止血障碍的受试者的急性出血发作。
在另一个实施方案中,本文公开的慢病毒载体的给予和/或随后的FVIII蛋白转基因的表达不诱导受试者的免疫应答。在一些实施方案中,所述免疫应答包括产生针对FVIII的抗体。在一些实施方案中,所述免疫应答包括细胞因子分泌。在一些实施方案中,所述免疫应答包括激活B细胞、T细胞或B细胞和T细胞二者。在一些实施方案中,所述免疫应答是抑制性免疫应答,其中相对于尚未产生免疫应答的受试者中FVIII的活性,受试者的免疫应答降低FVIII蛋白的活性。在某些实施方案中,通过给予本公开文本的慢病毒载体表达FVIII蛋白防止针对FVIII蛋白或从分离的核酸分子或慢病毒载体表达的FVIII蛋白的抑制性免疫应答。
在一些实施方案中,本公开文本的慢病毒载体与促进止血的至少一种其他药剂组合给予。促进止血的所述其他药剂是具有已证实的凝血活性的治疗剂。例如但不限于,所述止血剂可以包括因子V、因子VII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原或纤维蛋白原或者前述任一项的激活形式。所述凝血因子或止血剂还可以包括抗纤维蛋白溶药,例如,ε-氨基-己酸、氨甲环酸。
在本公开文本的一个实施方案中,所述组合物(例如,慢病毒载体)是其中在给予至受试者时FVIII以可激活形式存在的组合物。这种可激活分子可以在给予至受试者后在体内的凝血位点被激活。
本公开文本的慢病毒载体可以静脉内、皮下、肌内给予或经由任何粘膜表面(例如,口服、舌下、颊、舌下、鼻、直肠、阴道)或经由肺途径给予。可以将慢病毒载体植入生物聚合物固体支持物内或与生物聚合物固体支持物连接,从而允许将所述载体缓慢释放至所需位点。
在一个实施方案中,所述慢病毒载体的给予途径是肠胃外。如本文所用,术语肠胃外包括静脉内、动脉内、腹膜内、肌内、皮下、直肠或阴道给予。肠胃外给予的静脉内形式是优选的。虽然所有这些给予形式都被明确视为在本公开文本的范围内,但是给予形式可以是注射用溶液,特别是用于静脉内或动脉内注射或滴注的溶液。通常,适于注射的药物组合物可以包含缓冲液(例如乙酸盐、磷酸盐或柠檬酸盐缓冲液)、表面活性剂(例如聚山梨醇酯)、任选地稳定剂(例如人白蛋白)等。然而,在与本文的传授内容相容的其他方法中,可以将慢病毒载体直接递送到不良细胞群的位点,从而增加患病组织对治疗剂的暴露。
用于肠胃外给药的制剂包括无菌的水性或非水性溶液、悬浮液和乳液。非水性溶剂的例子是丙二醇、聚乙二醇、植物油如橄榄油、以及可注射的有机酯如油酸乙酯。水性载体包括水、醇性/水性溶液、乳液或悬浮液,包括盐水和缓冲介质。在本公开文本中,药学上可接受的载体包括但不限于0.01-0.1M且优选地0.05M磷酸盐缓冲液或0.8%盐水。其他常见的肠胃外媒介物包括磷酸钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏液或不挥发油。静脉内媒介物包括流体和营养补充剂、电解质补充剂(如基于林格氏右旋糖的那些)等。也可以存在防腐剂和其他添加剂,如例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。
更具体地,适于注射使用的药物组合物包括无菌的水性溶液(在水溶性的情况下)或分散液,以及用于临时制备无菌可注射溶液或分散液的无菌粉末。在此类情况下,组合物必须是无菌的并且应该是易于注射的程度的流体。所述组合物应在制造和储存条件下稳定,并且将优选地抵抗微生物(如细菌和真菌)的污染作用而保存。所述载体可以是溶剂或分散介质,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)及其合适的混合物。可以例如通过使用包衣如卵磷脂,在分散液的情况下通过维持所需粒径以及通过使用表面活性剂来维持适当的流动性。
防止微生物的作用可以通过多种抗细菌和抗真菌剂(例如,对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞等)来实现。在许多情况下,将优选地在组合物中包含等渗剂,例如糖、多元醇(如甘露糖醇、山梨糖醇)或氯化钠。可注射组合物的延长吸收可以通过在组合物中包含吸收延迟剂(例如单硬脂酸铝和明胶)来实现。
在任何情况下,无菌可注射溶液可以通过以下方式来制备:将活性化合物(例如,多肽本身或与其他活性剂组合)以所需量掺入根据需要具有本文列举的一种成分或多种成分的组合的适当溶剂中,接着进行过滤灭菌。通常,分散液是通过将活性化合物掺入无菌媒介物中来制备,所述无菌媒介物含有基础分散介质和来自上文所列举的那些的其他所需成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选制备方法为真空干燥和冷冻干燥,所述真空干燥和冷冻干燥从其先前无菌过滤的溶液产生活性成分加上任何另外的所需成分的粉末。根据本领域已知的方法对注射用制剂进行加工,填充至容器(如安瓿、袋、瓶子、注射器或小瓶)中,并且在无菌条件下密封。此外,可以将所述制剂以试剂盒的形式包装和出售。此类制品将优选地具有标签或包装说明书,所述标签或包装说明书指示相关组合物可用于治疗患有或易患凝血障碍的受试者。
还可以将药物组合物配制为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂用于直肠给予。
用于治疗病症的本公开文本的组合物的有效剂量根据许多不同因素而变化,所述因素包括给予方式、靶位点、患者的生理状态、患者是人还是动物、所给予的其他药物以及治疗是预防性的还是治疗性的。通常,患者是人,但是也可以治疗非人哺乳动物,包括转基因哺乳动物。治疗剂量可以使用本领域技术人员已知的常规方法逐步增加,以优化安全性和功效。
可以将所述慢病毒载体作为单一剂量或作为多个剂量来给予,其中所述多个剂量可以连续给予或以指定时间间隔来给予。可以采用体外测定来确定给予的最佳剂量范围和/或时间表。测量凝血因子活性的体外测定是本领域已知的。另外,有效剂量可以根据从动物模型(例如,血友病犬)获得的剂量-反应曲线来推知(Mount等人2002,Blood 99(8):2670)。
在上述范围中间的剂量也旨在包含在本公开文本的范围内。可以每天、隔日、每周或根据经验分析确定的任何其他时间表向受试者给予此类剂量。示例性治疗使得需要在例如至少六个月的延长时期内给予多个剂量。
本公开文本的慢病毒载体可以在多个时机给予。单一剂量之间的间隔可以是每天、每周、每月或每年。间隔还可以是不规则的,如通过测量患者中修饰的多肽或抗原的血液水平所指示。本公开文本的慢病毒载体的剂量和频率根据由转基因编码的FVIII多肽在患者中的半衰期而变化。
本公开文本的慢病毒载体的给予的剂量和频率可以根据治疗是预防性的还是治疗性的而变化。在预防性应用中,将含有本公开文本的慢病毒载体的组合物给予至尚未处于疾病状态的患者,以增强患者的抵抗力或使疾病的影响降至最低。这种量被定义为“预防有效剂量”。在长时期内以相对不频繁的间隔给予相对低的剂量。一些患者在其余生中继续接受治疗。
本公开文本的慢病毒载体可以任选地与在需要治疗(例如,预防性或治疗性)的障碍或病症的治疗中有效的其他药剂组合给予。
如本文所用,本公开文本的慢病毒载体与辅助疗法结合或组合的给予意指所述疗法与所公开多肽的依序、同时、同延、并行、伴随或同期给予或施用。本领域技术人员将了解,组合治疗方案中各种组分的给予或施用可以定时以增强治疗的总体有效性。基于所选辅助疗法和本说明书的传授内容,技术人员(例如,医师)能够容易地在不进行过度实验的情况下辨认出有效的组合治疗方案。
应进一步了解,本公开文本的慢病毒载体可以与一种或多种药剂结合或组合使用(例如,以提供组合治疗方案)。可以与本公开文本的慢病毒载体组合的示例性药剂包括表示用于所治疗的特定障碍的当前护理标准的药剂。此类药剂可以是化学或生物性质的。术语“生物剂(biologic)”或“生物剂(biologic agent)”是指旨在用作治疗药的从活的生物体和/或其产物制备的任何药学活性剂。
要与本公开文本的慢病毒载体组合使用的药剂的量可以随受试者变化,或者可以根据本领域的知识来给予。参见例如,Bruce A Chabner等人,Antineoplastic Agents,inGoodman&Gilman's The Pharmacological Basis of Therapeutics 1233-1287(JoelG.Hardman等人编辑,第9版1996)。在另一个实施方案中,给予符合护理标准的量的这种药剂。
在某些实施方案中,将本公开文本的慢病毒载体与免疫抑制剂、抗过敏剂或抗炎剂结合给予。这些药剂通常是指用于抑制或屏蔽本文所治疗的受试者的免疫系统的物质。这些药剂包括抑制细胞因子产生、下调或抑制自身抗原表达或屏蔽MHC抗原的物质。此类药剂的例子包括2-氨基-6-芳基-5-取代的嘧啶;硫唑嘌呤;环磷酰胺;溴隐亭;达那唑;氨苯砜;戊二醛;针对MHC抗原和MHC片段的抗独特型抗体;环孢菌素A;类固醇,如糖皮质激素,例如泼尼松,甲泼尼龙和地塞米松;细胞因子或细胞因子受体拮抗剂(包括抗干扰素-γ抗体、抗干扰素-β抗体或抗干扰素-α抗体,抗肿瘤坏死因子-α抗体,抗肿瘤坏死因子-β抗体,抗白介素-2抗体和抗IL-2受体抗体);抗LFA-1抗体,包括抗CD11a抗体和抗CD18抗体;抗L3T4抗体;异源抗淋巴细胞球蛋白;全T抗体;含有LFA-3结合结构域的可溶性肽;链激酶;TGF-β;链道酶(streptodornase);FK506;RS-61443;脱氧精胍菌素;和雷帕霉素。在某些实施方案中,所述药剂是抗组胺药。如本文所用,“抗组胺药”是拮抗组胺的生理作用的药剂。抗组胺药的例子是氯苯那敏、苯海拉明、普鲁米近、色甘酸钠、阿司咪唑、马来酸阿扎他定、马来酸溴苯那敏、马来酸卡比沙明、盐酸西替利嗪、富马酸氯马斯汀、盐酸赛庚啶、马来酸右溴苯那敏、马来酸右氯苯那敏、茶苯海明、盐酸苯海拉明、琥珀酸多西拉敏、盐酸非索非那定、盐酸特非那定、盐酸羟嗪、氯雷他定、盐酸美克洛嗪、柠檬酸曲吡那敏、盐酸曲吡那敏和盐酸曲普利啶。
可以将免疫抑制剂、抗过敏剂或抗炎剂掺入慢病毒载体给予方案中。例如,免疫抑制剂或抗炎剂的给予可以在给予所公开的慢病毒载体之前开始,并且在之后以一个或多个剂量继续进行。在某些实施方案中,将所述免疫抑制剂或抗炎剂作为慢病毒载体的前驱用药来给予。
如先前所讨论,可以将本公开文本的慢病毒载体以药学有效量来给予,用于凝血障碍的体内治疗。就此而言,应了解,本公开文本的慢病毒载体可以被配制成促使给予和促进活性剂的稳定性。优选地,根据本公开文本的药物组合物包含药学上可接受的、无毒的、无菌载体,如生理盐水、无毒缓冲液、防腐剂等。当然,可以将本公开文本的药物组合物以单一剂量或多个剂量来给予,以提供药学有效量的多肽。
多种测试可用于评估凝固系统的功能:激活部分促凝血酶原激酶时间(aPTT)测试、生色测定、
Figure BDA0002701601960000461
测定、凝血酶原时间(PT)测试(也用于确定INR)、纤维蛋白原测试(通常通过Clauss法进行)、血小板计数、血小板功能测试(通常通过PFA-100进行)、TCT、出血时间、混合测试(如果将患者的血浆与正常血浆混合,是否矫正异常)、凝固因子测定、抗磷脂抗体、D-二聚体、遗传测试(例如,因子V Leiden、凝血酶原突变G20210A)、稀释拉塞尔蝰蛇毒液时间(dilute Russell's viper venom time,dRVVT)、杂项血小板功能测试、凝血弹性描记法(TEG或Sonoclot)、血栓弹力图(
Figure BDA0002701601960000462
例如,
Figure BDA0002701601960000463
)、或优球蛋白溶解时间(ELT)。
aPTT测试是测量“固有”(也称为接触激活途径)和常见凝固途径二者的功效的表现指示物。该测试一般用于测量可商购的重组凝血因子(例如,FVIII或FIX)的凝血活性。其与测量外在途径的凝血酶原时间(PT)结合使用。
Figure BDA0002701601960000471
分析提供关于止血的整体动力学的信息:凝血时间、凝块形成、凝块稳定性和溶解。血栓弹力图中的不同参数依赖于血浆凝固系统的活性、血小板功能、纤维蛋白溶解或影响这些相互作用的多种因素。该测定可以提供对次级止血的全面见解。
III.慢病毒载体
慢病毒包括牛慢病毒群、马慢病毒群、猫慢病毒群、绵羊山羊(ovinecaprine)慢病毒群和灵长类慢病毒群的成员。用于基因疗法的慢病毒载体的开发已经综述于以下文献中:Klimatcheva等人(1999)Frontiers in Bioscience 4:481-496。适于基因疗法的慢病毒载体的设计和使用描述于例如美国专利号6,207,455和6,615,782中。慢病毒的例子包括但不限于HIV-1、HIV-2、HIV-1/HIV-2拟型、HIV-1/SIV、FIV、山羊关节炎-脑炎病毒(CAEV)、马传染性贫血病毒和牛免疫缺陷病毒。
本公开文本的慢病毒载体的示意图呈现于图19中。在一些实施方案中,本公开文本的慢病毒载体是“第三代”慢病毒载体。如本文所用,术语“第三代”慢病毒载体是指具有第二代载体系统的特征并且还缺少功能性tat基因的慢病毒包装系统,如已经使tat基因从其缺失或失活的慢病毒包装系统。通常,编码rev的基因是在单独的表达构建体上提供。参见例如,Dull等人(1998)J.Virol.72:8463-8471。如本文所用,“第二代”慢病毒载体系统是指缺少功能性辅助基因的慢病毒包装系统,如已经使辅助基因vif、vpr、vpu和nef从其缺失或失活的慢病毒包装系统。参见例如,Zufferey等人(1997)Nat.Biotechnol.15:871-875。如本文所用,“包装系统”是指一组病毒构建体,其包含编码包装参与包装重组病毒的病毒蛋白的基因。通常,最终将包装系统的构建体掺入包装细胞中。
在一些实施方案中,本公开文本的第三代慢病毒载体是自失活的慢病毒载体。在一些实施方案中,所述慢病毒载体是VSV.G拟型慢病毒载体。在一些实施方案中,所述慢病毒载体包含用于转基因表达的肝细胞特异性启动子。在一些实施方案中,所述肝细胞特异性启动子是增强的转甲状腺素蛋白启动子。在一些实施方案中,所述慢病毒载体包含miR-142的一个或多个靶序列以降低针对转基因产物的免疫应答。在一些实施方案中,将miR-142的一个或多个靶序列掺入本公开文本的慢病毒载体中允许所需的转基因表达谱。例如,掺入miR-142的一个或多个靶序列可以抑制血管内和血管外造血谱系中的转基因表达,而在非造血细胞中维持转基因表达。尚未在用本公开文本的慢病毒载体系统治疗的易患肿瘤的小鼠中检测到肿瘤发生。参见Brown等人(2007)Blood 110:4144-52;Brown等人(2006)Nat.Ned.12:585-91;和Cantore等人(2015)Sci.Transl.Med.7(277):277ra28。
本公开文本的慢病毒载体包含经密码子优化的编码本文所述的BDD FVIII蛋白的多核苷酸。在一个实施方案中,优化的BDD FVIII蛋白的编码序列与表达控制序列可操作地连接。如本文所用,当两个核酸序列以允许每个组成核酸序列保留其功能性的方式共价连接时,所述两个核酸序列是可操作地连接的。当编码序列和基因表达控制序列以将编码序列的表达或转录和/或翻译置于基因表达控制序列的影响或控制下的方式共价连接时,将所述编码序列和基因表达控制序列称为可操作地连接的。如果诱导5'基因表达序列中的启动子导致编码序列的转录,并且如果两个DNA序列之间的连接的性质不会(1)导致引入移码突变,(2)干扰启动子区引导编码序列转录的能力,或(3)干扰相应的RNA转录物翻译成蛋白质的能力,则这两个DNA序列被认为是可操作地连接的。因此,如果基因表达序列能够实现编码核酸序列的转录,使得所得的转录物被翻译成所需的蛋白质或多肽,则所述基因表达序列与所述编码核酸序列可操作地连接。
在某些实施方案中,所述慢病毒载体是能够感染非分裂细胞的重组慢病毒的载体。在某些实施方案中,所述慢病毒载体是能够感染肝细胞(liver cell)(例如,肝细胞(hepatocyte))的重组慢病毒的载体。所述慢病毒基因组和所述原病毒DNA通常具有在逆转录病毒中发现的三种基因:gag、pol和env,它们侧接有两个长末端重复(LTR)序列。gag基因编码内部结构(基质、衣壳和核衣壳)蛋白;pol基因编码RNA引导的DNA聚合酶(逆转录酶)、蛋白酶和整合酶;并且env基因编码病毒包膜糖蛋白。5'和3'LTR用于促进病毒粒子RNA的转录和多聚腺苷酸化。LTR含有病毒复制所需的所有其他顺式作用的序列。慢病毒具有另外的基因,包括vif、vpr、tat、rev、vpu、nef和vpx(在HIV-l、HIV-2和/或SIV中)。
与5'LTR相邻的是基因组逆转录(tRNA引物结合位点)和将病毒RNA有效衣壳化至颗粒中(Psi位点)所需的序列。如果衣壳化(或将逆转录RNA包装至感染性病毒粒子中)所需的序列从病毒基因组丢失,则顺式缺陷(cis defect)会阻止基因组RNA的衣壳化。
然而,所得的突变体仍然能够引导所有病毒粒子蛋白的合成。本公开文本提供产生能够感染非分裂细胞的重组慢病毒的方法,所述方法包括用携带包装功能(即gag、pol和env,以及rev和tat)的两种或更多种载体转染合适的宿主细胞。如下文将公开的,缺少功能性tat基因的载体是某些应用所需的。因此,例如,第一载体可提供编码病毒gag和病毒pol的核酸,并且另一载体可提供编码病毒env的核酸以产生包装细胞。将提供异源基因的载体(在本文中被标识为转移载体)引入该包装细胞中,得到生产细胞,所述生产细胞释放携带目的外来基因的感染性病毒颗粒。
根据上文所指示的载体和外来基因的配置,第二载体可以提供编码病毒包膜(env)基因的核酸。env基因可以源自几乎任何合适的病毒,包括逆转录病毒。在一些实施方案中,env蛋白是双嗜性包膜蛋白,其允许转导人和其他物种的细胞。
逆转录病毒来源的env基因的例子包括但不限于:莫洛尼鼠白血病病毒(MoMuLV或MMLV)、哈维鼠肉瘤病毒(HaMuSV或HSV)、鼠乳腺瘤病毒(MuMTV或MMTV)、长臂猿白血病病毒(GaLV或GALV)、人免疫缺陷病毒(HIV)和劳斯肉瘤病毒(RSV)。还可以使用其他env基因,如水疱性口炎病毒(VSV)蛋白G(VSV G)、肝炎病毒和流感的env基因。在一些实施方案中,病毒env核酸序列与本文中其他地方描述的调节序列可操作地缔合。
在某些实施方案中,所述慢病毒载体缺失HIV毒力基因env、vif、vpr、vpu和nef,却没有损害所述载体转导非分裂细胞的能力。在一些实施方案中,所述慢病毒载体包含3'LTR的U3区的缺失。U3区的缺失可以是完全缺失或部分缺失。
在一些实施方案中,可以将包含本文所述的FVIII核苷酸序列的本公开文本的慢病毒载体与以下各项一起在细胞中转染:(a)包含gag、pol或gag和pol基因的第一核苷酸序列,以及(b)包含异源env基因的第二核苷酸序列;其中所述慢病毒载体缺少功能性tat基因。在其他实施方案中,将细胞用包含rev基因的第四核苷酸序列进一步转染。在某些实施方案中,所述慢病毒载体缺少选自以下的功能性基因:vif、vpr、vpu、vpx和nef或其组合。
在某些实施方案中,本公开文本的慢病毒载体包含编码gag蛋白、Rev反应元件、中枢聚嘌呤轨道(cPPT)或其任何组合的一个或多个核苷酸序列。
在一些实施方案中,所述慢病毒载体在其表面上表达改进慢病毒载体或所编码FVIII多肽的靶向和/或活性的一种或多种多肽。所述一种或多种多肽可以由慢病毒载体编码,或者可以在慢病毒载体从宿主细胞出芽期间掺入。在慢病毒产生期间,病毒颗粒从生产宿主细胞出芽离开。在出芽过程期间,所述病毒颗粒带有脂质外壳,所述脂质外壳源自宿主细胞的脂质膜。因此,所述病毒颗粒的脂质外壳可以包括先前存在于宿主细胞表面上的膜结合多肽。
在一些实施方案中,所述慢病毒载体在其表面上表达抑制在给予至人受试者后针对慢病毒载体的免疫应答的一种或多种多肽。在一些实施方案中,所述慢病毒载体的表面包含一个或多个CD47分子。CD47是“自身蛋白的标记”,其在人细胞上普遍表达。CD47的表面表达通过CD47与巨噬细胞表达的SIRPα的相互作用抑制巨噬细胞诱导的内源性细胞的吞噬作用。表达高水平CD47的细胞不太可能在体内被人巨噬细胞靶向和破坏。
在一些实施方案中,所述慢病毒载体在其表面上包含高浓度的CD47多肽分子。在一些实施方案中,所述慢病毒载体是在具有CD47的高表达水平的细胞系中产生。在某些实施方案中,所述慢病毒载体是在CD47细胞中产生,其中所述细胞在细胞膜上具有CD47的高表达。在特定实施方案中,所述慢病毒载体是在CD47HEK 293T细胞中产生的,其中所述HEK293T在细胞膜上具有CD47的高表达。在一些实施方案中,HEK 293T细胞被修饰以具有相对于未修饰的HEK 293T细胞增加的CD47表达。在某些实施方案中,CD47是人CD47。
在一些实施方案中,所述慢病毒载体具有很少或没有主要组织相容性复合物I类(MHC-I)的表面表达。表面表达的MHC-I展示来自细胞内的“非自身”蛋白的肽片段(如指示感染的蛋白质片段),从而促使针对所述细胞的免疫应答。在一些实施方案中,所述慢病毒载体是在MHC-I细胞中产生的,其中所述细胞在细胞膜上具有降低的MHC-I的表达。在一些实施方案中,所述慢病毒载体是在MHC-I-(或“MHC-I”、“MHC-1neg”或“MHC阴性”)细胞中产生的,其中所述细胞缺少MHC-I的表达。
在特定实施方案中,所述慢病毒载体包含脂质外壳,所述脂质外壳包含高浓度的CD47多肽并且缺少MHC-I多肽。在某些实施方案中,所述慢病毒载体是在CD47/MHC-I细胞系(例如,CD47/MHC-IHEK 293T细胞系)中产生。在一些实施方案中,所述慢病毒载体是在CD47/MHC-I细胞系(例如,CD47/MHC-IHEK 293T细胞系)中产生。
慢病毒载体的例子披露于以下文献中:美国专利号9,050,269和国际公开号WO9931251、W0 9712622、W0 9817815、W0 9817816和WO 9818934,将上述文献通过引用以其整体并入本文。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791或(ii)SEQ ID NO:4的核苷酸58-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一些实施方案中,所述核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374;或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:1的核苷酸58-4374或(ii)SEQ ID NO:1的核苷酸58-2277和2320-4374的至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:1的核苷酸58-4374或(ii)SEQ ID NO:1的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:2的核苷酸58-4374或(ii)SEQ ID NO:2的核苷酸58-2277和2320-4374的至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:2的核苷酸58-4374或(ii)SEQ ID NO:2的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:70的核苷酸58-4374或(ii)SEQ ID NO:70的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ IDNO:70的核苷酸58-4374或(ii)SEQ ID NO:70的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:71的核苷酸58-4374或(ii)SEQ ID NO:71的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ IDNO:71的核苷酸58-4374或(ii)SEQ ID NO:71的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:3的核苷酸58-4374或(ii)SEQ ID NO:3的核苷酸58-2277和2320-4374的至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:3的核苷酸58-4374或(ii)SEQ ID NO:3的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:4的核苷酸58-4374或(ii)SEQ ID NO:4的核苷酸58-2277和2320-4374的至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:4的核苷酸58-4374或(ii)SEQ ID NO:4的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:5的核苷酸58-4374或(ii)SEQ ID NO:5的核苷酸58-2277和2320-4374的至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:5的核苷酸58-4374或(ii)SEQ ID NO:5的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开文本提供慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:6的核苷酸58-4374或(ii)SEQ ID NO:6的核苷酸58-2277和2320-4374的至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列,并且与启动子、靶序列或二者可操作地连接。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:6的核苷酸58-4374或(ii)SEQ ID NO:6的核苷酸58-2277和2320-4374。
本公开文本的慢病毒载体在以5x1010TU/kg或更低、109TU/kg或更低、或者108TU/kg或更低的剂量给予时是治疗有效的。相对于被给予包含SEQ ID NO:16的参考核酸分子的受试者中的水平,相对于被给予包含所述参考核酸分子的参考病毒载体的受试者中的水平,或者相对于给予所述参考核酸分子编码的多肽后受试者中的水平,关于受试者中的基础水平,在此类剂量下,本公开文本的慢病毒载体的给予可以导致有需要的受试者中的血浆FVIII活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍、至少约55倍、至少约60倍、至少约65倍、至少约70倍、至少约75倍、至少约80倍、至少约85倍、至少约90倍、至少约95倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、或至少约200倍。
IV.组织特异性表达
在某些实施方案中,在慢病毒载体内包含一个或多个miRNA靶序列将是有用的,所述miRNA靶序列例如与优化的FVIII转基因可操作地连接。因此,本公开文本还提供与优化的FVIII核苷酸序列可操作连接或者以其他方式插入慢病毒载体内的至少一个miRNA序列靶标。慢病毒载体中包含的多于一个拷贝的miRNA靶序列可以增加系统的有效性。
还包括不同的miRNA靶序列。例如,表达多于一种转基因的慢病毒载体可以具有在多于一个miRNA靶序列控制下的转基因,所述miRNA靶序列可以是相同或不同的。miRNA靶序列可以是串联的,但是也包括其他排列。含有miRNA靶序列的转基因表达盒也可以以反义定向插入慢病毒载体内。反义定向可以用于产生病毒颗粒,以避免原本可能对生产细胞有毒的基因产物的表达。
在其他实施方案中,所述慢病毒载体包含1、2、3、4、5、6、7或8个拷贝的相同或不同的miRNA靶序列。然而,在某些其他实施方案中,所述慢病毒载体将不包括任何miRNA靶序列。是否要包含miRNA靶序列(以及数量)的选择将依据已知参数(如既定的组织靶标、所需的表达水平等)来指导。
在一个实施方案中,所述靶序列是miR-223靶标,已经报告所述miR-223靶标在骨髓定向祖细胞中最有效地阻断表达并且在更早期的HSPC中至少部分地阻断表达。miR-223靶标可以在分化的髓样细胞(包括粒细胞、单核细胞、巨噬细胞、髓样树突细胞)中阻断表达。miR-223靶标还可以适于依赖于淋巴谱系或红系细胞谱系中的稳健转基因表达的基因疗法应用。miR-223靶标还可以在人HSC中非常有效地阻断表达。
在另一个实施方案中,所述靶序列是miR142靶标(tccataaagt aggaaacact aca(SEQ ID NO:43))。在一个实施方案中,所述慢病毒载体包含4个拷贝的miR-142靶序列。在某些实施方案中,将造血特异性微小RNA(如miR-142(142T))的互补序列掺入慢病毒载体的3'非翻译区中,使得编码转基因的转录物易发生miRNA介导的下调。通过这种方法,可以在造血谱系抗原呈递细胞(APC)中防止转基因表达,同时在非造血细胞中维持所述转基因表达(Brown等人,Nat Med 2006)。这种策略可以对转基因表达施加严格的转录后控制,并且由此使得能够稳定递送和长期表达转基因。在一些实施方案中,miR-142调节防止经转导细胞的免疫介导的清除和/或诱导抗原特异性调节T细胞(T reg),并且介导对转基因编码的抗原的稳健的免疫耐受。
在一些实施方案中,所述靶序列是miR181靶标。Chen C-Z和Lodish H,Seminarsin Immunology(2005)17(2):155-165披露了miR-181,它是在小鼠骨髓内的B细胞中特异性表达的miRNA(Chen和Lodish,2005)。所述文献还披露,一些人miRNA与白血病相关。
所述靶序列可以与miRNA完全或部分互补。术语“完全互补”意味着,靶序列的核酸序列与识别所述靶序列的miRNA的序列100%互补。术语“部分互补”意味着,靶序列与识别所述靶序列的miRNA的序列仅部分互补,其中部分互补的序列仍然被miRNA识别。换句话说,在本公开文本的情况下,部分互补的靶序列有效识别相应miRNA,并且实现在表达该miRNA的细胞中防止或减少转基因表达。miRNA靶序列的例子描述于以下文献中:WO2007/000668、WO 2004/094642、WO 2010/055413或WO 2010/125471,上述文献通过引用以其整体并入本文。
V.编码FVIII蛋白的多核苷酸序列
本公开文本涉及慢病毒基因疗法,其中所述慢病毒载体包含经密码子优化的核酸分子,所述核酸分子包含编码具有FVIII活性的多肽的多核苷酸(核酸)序列。在一些实施方案中,所述经密码子优化的核酸分子编码全长FVIII多肽。在其他实施方案中,所述经密码子优化的核酸分子编码B结构域缺失的(BDD)FVIII多肽,其中FVIII的B结构域的全部或部分缺失。
在一个特定实施方案中,所述核酸分子编码包含具有与SEQ ID NO:17(图1J)或其片段的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的氨基酸序列的多肽。在一个实施方案中,所述核酸分子编码具有SEQ ID NO:17或其片段的氨基酸序列的多肽。
在一些实施方案中,所述核酸分子编码包含信号肽或其片段的FVIII多肽。在其他实施方案中,所述核酸分子编码缺少信号肽的FVIII多肽。在一些实施方案中,所述信号肽包含SEQ ID NO:17的氨基酸1-19。
在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791或(ii)SEQ ID NO:4的核苷酸58-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一个特定实施方案中,所述第一核酸序列具有与SEQ ID NO:3的核苷酸58-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在另一个实施方案中,所述第一核酸序列具有与SEQ ID NO:4的核苷酸58-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在其他实施方案中,所述第一核苷酸序列包含SEQ ID NO:3的核苷酸58-1791或SEQ ID NO:4的核苷酸58-1791。
在其他实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸1-1791或(ii)SEQ ID NO:4的核苷酸1-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一个实施方案中,第一核苷酸序列包含SEQ ID NO:3的核苷酸1-1791或SEQ IDNO:4的核苷酸1-1791。在另一个实施方案中,所述第二核苷酸序列具有与SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在一个特定实施方案中,所述第二核苷酸序列包含SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374。
在仍另一个实施方案中,所述第二核苷酸序列具有与SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的核苷酸1792-2277和2320-4374(即,SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在一个特定实施方案中,所述第二核苷酸序列包含SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的核苷酸1792-2277和2320-4374(即,SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)。
在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-4374或(ii)SEQ ID NO:6的核苷酸1792-4374的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在某些实施方案中,所述第二核酸序列具有与SEQ ID NO:5的核苷酸1792-4374的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在其他实施方案中,所述第二核酸序列具有与SEQ ID NO:6的核苷酸1792-4374的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在一个特定实施方案中,所述第二核酸序列包含SEQ ID NO:5的核苷酸1792-4374或SEQ ID NO:6的核苷酸1792-4374。在一些实施方案中,上文所列示的与第二核酸序列连接的第一核酸序列具有与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在其他实施方案中,上文所列示的与第二核酸序列连接的第一核酸序列具有与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在其他实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ IDNO:5的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)或(ii)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在某些实施方案中,所述第二核酸序列具有与SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在其他实施方案中,所述第二核酸序列具有与SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在一个特定实施方案中,所述第二核酸序列包含SEQ ID NO:5的核苷酸1792-2277和2320-4374或SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374或SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)。在一些实施方案中,上文所列示的与第二核酸序列连接的第一核酸序列具有与SEQ IDNO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在其他实施方案中,上文所列示的与第二核酸序列连接的第一核酸序列具有与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:1的核苷酸58-1791、(ii)SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791的至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。在其他实施方案中,所述第一核苷酸序列包含SEQ ID NO:1的核苷酸58-1791、SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791。
在其他实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:1的核苷酸1-1791、(ii)SEQ ID NO:2的核苷酸1-1791、(iii)SEQ ID NO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791的至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一个实施方案中,所述第一核苷酸序列包含SEQ ID NO:1的核苷酸1-1791、SEQID NO:2的核苷酸1-1791、(iii)SEQ ID NO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791。在另一个实施方案中,与所述第一核苷酸序列连接的所述第二核苷酸序列具有与SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在一个特定实施方案中,与所述第一核苷酸序列连接的所述第二核苷酸序列包含(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ IDNO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在其他实施方案中,与所述第一核苷酸序列连接的所述第二核苷酸序列具有与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在一个实施方案中,所述第二核苷酸序列包含(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374。
在另一个实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374的至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一个特定实施方案中,所述第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374(即,SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;并且其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
在一个实施方案中,所述第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374(即,SEQID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:1的核苷酸58至4374的至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:1的核苷酸58-2277和2320-4374(即,SEQ ID NO:1的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核酸序列具有与SEQ ID NO:1的至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:1的核苷酸58-2277和2320-4374(即,SEQ ID NO:1的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQID NO:1的核苷酸58至4374。在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:1的核苷酸1-2277和2320-4374(即,SEQ ID NO:1的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:1的核苷酸1至4374。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:2的核苷酸58至4374的至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:2的核苷酸58-2277和2320-4374的至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核酸序列具有与SEQ ID NO:2的至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:2的核苷酸58-2277和2320-4374(即,SEQ ID NO:2的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:2的核苷酸58至4374。在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:2的核苷酸1-2277和2320-4374(即,SEQ ID NO:2的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:2的核苷酸1至4374。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:70的核苷酸58至4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:70的核苷酸58-2277和2320-4374(即,SEQ ID NO:70的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核酸序列具有与SEQ ID NO:70的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在其他实施方案中,所述核苷酸序列包含SEQ ID NO:70的核苷酸58-2277和2320-4374(即,SEQ ID NO:70的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:70的核苷酸58至4374。在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:70的核苷酸1-2277和2320-4374(即,SEQ ID NO:70的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:70的核苷酸1至4374。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:71的核苷酸58至4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:71的核苷酸58-2277和2320-4374(即,SEQ ID NO:71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。在其他实施方案中,所述核酸序列具有与SEQ ID NO:71的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在其他实施方案中,所述核苷酸序列包含SEQ ID NO:71的核苷酸58-2277和2320-4374(即,SEQ ID NO:71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:71的核苷酸58至4374。在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:71的核苷酸1-2277和2320-4374(即,SEQ ID NO:71的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:71的核苷酸1至4374。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:3的核苷酸58至4374的至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:3的核苷酸58-2277和2320-4374(即,SEQ ID NO:3的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在某些实施方案中,所述核酸序列具有与SEQ ID NO:3的至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在一些实施方案中,所述核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,SEQ ID NO:3的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:3的核苷酸58至4374。在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,SEQ ID NO:3的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:3的核苷酸1至4374。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:4的核苷酸58至4374的至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:4的核苷酸58-2277和2320-4374(即,SEQ ID NO:4的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核酸序列具有与SEQ ID NO:4的至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:4的核苷酸58-2277和2320-4374(即,SEQID NO:4的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:4的核苷酸58至4374。在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:4的核苷酸1-2277和2320-4374(即,SEQ ID NO:4的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:4的核苷酸1至4374。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:5的核苷酸58至4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:5的核苷酸58-2277和2320-4374(即,SEQ ID NO:5的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在某些实施方案中,所述核酸序列具有与SEQ ID NO:5的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在一些实施方案中,所述核苷酸序列包含SEQ ID NO:5的核苷酸58-2277和2320-4374(即,SEQ ID NO:5的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:5的核苷酸58至4374。
在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:5的核苷酸1-2277和2320-4374(即,SEQ ID NO:5的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:5的核苷酸1至4374。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与SEQ ID NO:6的核苷酸58至4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在其他实施方案中,所述核苷酸序列包含具有与SEQ ID NO:6的核苷酸58-2277和2320-4374(即,SEQ ID NO:6的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列。
在某些实施方案中,所述核酸序列具有与SEQ ID NO:6的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。
在一些实施方案中,所述核苷酸序列包含SEQ ID NO:6的核苷酸58-2277和2320-4374(即,SEQ ID NO:6的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:6的核苷酸58至4374。
在仍其他实施方案中,所述核苷酸序列包含SEQ ID NO:6的核苷酸1-2277和2320-4374(即,SEQ ID NO:6的核苷酸1-4374,但不含编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:6的核苷酸1至4374。
在一些实施方案中,所述核苷酸序列包含编码信号肽的核酸序列。在某些实施方案中,所述信号肽是FVIII信号肽。在一些实施方案中,编码信号肽的核酸序列是经密码子优化的。
在一个特定实施方案中,编码信号肽的核酸序列具有与(i)SEQ ID NO:1的核苷酸1至57;(ii)SEQ ID NO:2的核苷酸1至57;(iii)SEQ ID NO:3的核苷酸1至57;(iv)SEQ IDNO:4的核苷酸1至57;(v)SEQ ID NO:5的核苷酸1至57;(vi)SEQ ID NO:6的核苷酸1至57;(vii)SEQ ID NO:70的核苷酸1至57;(viii)SEQ ID NO:71的核苷酸1至57;或(ix)SEQ IDNO:68的核苷酸1至57的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性。
SEQ ID NO:1-6、70和71是起始或“亲代”或“野生型”FVIII核苷酸序列SEQ ID NO:16的优化形式。SEQ ID NO:16编码B结构域缺失的人FVIII。尽管SEQ ID NO:1-6、70和71源自FVIII的特定的B结构域缺失的形式(SEQ ID NO:16),但应理解,本公开文本的慢病毒基因疗法方法还涉及编码FVIII的其他形式的核酸的优化形式。例如,FVIII的其他形式可以包括全长FVIII、FVIII的其他B结构域缺失(描述于下文中)、或保留FVIII活性的其他FVIII片段。
除非另外指定,否则如本文所用的“具有FVIII活性的多肽”意指具有其在凝固中的正常作用的功能性FVIII多肽。术语具有FVIII活性的多肽包括其保留全长野生型因子VIII在凝固途径中的功能的功能性片段、变体、类似物或衍生物。
“具有FVIII活性的多肽”可与FVIII蛋白、FVIII多肽或FVIII互换使用。FVIII功能的例子包括但不限于激活凝固的能力、作为因子IX的辅因子起作用的能力、或在Ca2+和磷脂存在下与因子IX形成因子X酶(tenase)复合物的能力,然后所述复合物将因子X转化为激活的形式Xa。
在一个实施方案中,具有FVIII活性的多肽包含两条多肽链,第一链具有FVIII重链,并且第二链具有FVIII轻链。在另一个实施方案中,具有FVIII活性的多肽是单链FVIII。单链FVIII可以含有在对应于成熟FVIII序列的氨基酸残基1645和/或1648处的一个或多个突变或取代。参见国际申请号PCT/US2012/045784,将所述文献通过引用以其整体并入本文。FVIII蛋白可以是人、猪、犬、大鼠或鼠FVIII蛋白。另外,对来自人与其他物种的FVIII之间的比较已经鉴定出可能为功能所需的保守残基(Cameron等人,Thromb.Haemost.79:317-22(1998);US 6,251,632)。
如本文所用,FVIII的“B结构域”与本领域已知的B结构域相同,所述B结构域是通过全长人FVIII的内部氨基酸序列同一性和凝血酶的蛋白质水解切割位点(例如,残基Ser741-Arg1648)定义的。其他人FVIII结构域是通过以下氨基酸残基定义的:A1,残基Ala1-Arg372;A2,残基Ser373-Arg740;A3,残基Ser1690-Ile2032;C1,残基Arg2033-Asn2172;C2,残基Ser2173-Tyr2332。A3-C1-C2序列包括残基Ser1690-Tyr2332。其余序列(残基Glu1649-Arg1689)通常被称为FVIII轻链激活肽。猪、小鼠和犬FVIII的所有结构域(包括B结构域)的边界的位置也是本领域中已知的。BDD FVIII的例子是
Figure BDA0002701601960000661
重组BDD FVIII(Wyeth Pharmaceuticals,Inc.)。
“B结构域缺失的FVIII”可以具有美国专利号6,316,226、6,346,513、7,041,635、5,789,203、6,060,447、5,595,886、6,228,620、5,972,885、6,048,720、5,543,502、5,610,278、5,171,844、5,112,950、4,868,112和6,458,563中披露的完全或部分缺失,将所述文献中的每一篇通过引用以其整体并入本文。在一些实施方案中,本公开文本的B结构域缺失的FVIII序列包括在美国专利号6,316,226(也在US 6,346,513中)的第4栏第4行至第5栏第28行和实施例1-5中披露的缺失中的任一种。
在一些实施方案中,本公开文本的B结构域缺失的FVIII具有在美国专利号5,789,203(也在US 6,060,447、US 5,595,886和US 6,228,620中)的第2栏第26-51行和实施例5-8中披露的缺失。在一些实施方案中,B结构域缺失的FVIII具有以下文献中描述的缺失:美国专利号5,972,885的第1栏第25行至第2栏第40行;美国专利号6,048,720的第6栏第1-22行和实施例1;美国专利号5,543,502的第2栏第17-46行;美国专利号5,171,844的第4栏第22行至第5栏第36行;美国专利号5,112,950的第2栏第55-68行、图2和实施例1;美国专利号4,868,112的第2栏第2行至第19栏第21行和表2;美国专利号7,041,635的第2栏第1行至第3栏第19行、第3栏第40行至第4栏第67行、第7栏第43行至第8栏第26行、和第11栏第5行至第13栏第39行;或者美国专利号6,458,563的第4栏第25-53行。
在一些实施方案中,B结构域缺失的FVIII具有大部分B结构域的缺失,但是仍含有将初级翻译产物在体内蛋白质水解加工为两条多肽链所必需的B结构域的氨基末端序列,如WO 91/09122中所披露,将所述文献通过引用以其整体并入本文。在一些实施方案中,B结构域缺失的FVIII经构建具有氨基酸747-1638的缺失,即,实际上完全缺失B结构域。HoebenR.C.,等人J.Biol.Chem.265(13):7318-7323(1990),将所述文献通过引用以其整体并入本文。B结构域缺失的FVIII还可以含有FVIII的氨基酸771-1666或氨基酸868-1562的缺失。Meulien P.,等人Protein Eng.2(4):301-6(1988),将所述文献通过引用以其整体并入本文。
作为本公开文本的一部分的另外的B结构域缺失包括例如以下的缺失:氨基酸982至1562或760至1639(Toole等人,Proc.Natl.Acad.Sci.U.S.A.(1986)83,5939-5942)、797至1562(Eaton,等人Biochemistry(1986)25:8343-8347)、741至1646(Kaufman(PCT公开的申请号WO 87/04187))、747-1560(Sarver,等人,DNA(1987)6:553-564)、741至1648(Pasek(PCT申请号88/00831))、816至1598或741至1689(Lagner(Behring Inst.Mitt.(1988)No82:16-25,EP 295597)),将所述文献中的每一篇通过引用以其整体并入本文。可以在任何FVIII序列中产生前述缺失中的每一种。
包括B结构域缺失的多种功能性FVIII分子披露于以下专利中:US 6,316,226和US6,346,513,两个专利均转让给Baxter;转让给In2Gen的US 7,041,635;转让给Chiron的US5,789,203、US 6,060,447、US 5,595,886和US 6,228,620;转让给Biovitrum的US 5,972,885和US 6,048,720、转让给Novo Nordisk的US 5,543,502和US 5,610,278;转让给ImmunoAg的US 5,171,844;转让给Transgene S.A.的US 5,112,950;转让给Genetics Institute的US 4,868,112,将所述专利中的每一个通过引用以其整体并入本文。
A.密码子优化
在一个实施方案中,本公开文本的慢病毒载体包含分离的核酸分子,所述核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核酸序列已经进行密码子优化。在另一个实施方案中,编码具有FVIII活性的多肽并且进行密码子优化的起始核酸序列是SEQ ID NO:16。在一些实施方案中,将编码具有FVIII活性的多肽的序列针对人表达进行密码子优化。在其他实施方案中,将编码具有FVIII活性的多肽的序列针对鼠表达进行密码子优化。SEQ ID NO:1-6、70和71是针对人表达优化的SEQ ID NO:16的经密码子优化的形式。
术语“经密码子优化的”在其涉及用于转化各种宿主的核酸分子的基因或编码区时是指所述核酸分子的基因或编码区中的密码子的改变,以反映在不改变由DNA编码的多肽的情况下宿主生物体的典型密码子使用度。这种优化包括用在该生物体的基因中更频繁使用的一个或多个密码子替代至少一个、或超过一个、或大量密码子。
包含编码任何多肽链的氨基酸的密码子的核苷酸序列中的偏差允许编码基因的序列中的变异。因为每个密码子由三个核苷酸组成,并且构成DNA的核苷酸受限于四种特定碱基,因此核苷酸有64种可能的组合,其中61种编码氨基酸(其余三个密码子编码终止翻译的信号)。显示哪个密码子编码哪种氨基酸的“遗传密码”在本文中再现为表1。因此,许多氨基酸由超过一个密码子指定。例如,氨基酸丙氨酸和脯氨酸由四种三联体编码,丝氨酸和精氨酸由六种三联体编码,而色氨酸和甲硫氨酸仅由一种三联体编码。这种简并性允许DNA碱基组成在宽范围内变化而不改变DNA所编码的蛋白质的氨基酸序列。
表1:标准遗传密码
Figure BDA0002701601960000691
许多生物体展示使用特定密码子来编码在增长肽链中插入特定氨基酸的偏好。密码子偏爱、或密码子偏好、生物体之间密码子使用度的差异是由遗传密码的简并性提供的,并且在多种生物体中被证明。密码子偏好通常与信使RNA(mRNA)的翻译效率相关,所述信使RNA的翻译效率又被认为尤其取决于所翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。所选tRNA在细胞中的优势通常反映在肽合成中最常使用的密码子。因此,可以基于密码子优化针对在给定生物体中的最佳基因表达来定制基因。
鉴于可用于各种动物、植物和微生物物种的大量基因序列,已经计算了密码子使用度的相对频率。密码子使用度表可以在例如在www.kazusa.or.jp/codon/(在2012年6月18日访问)上可获得的“密码子使用度数据库(Codon Usage Database)”中获得。参见Nakamura,Y.,等人Nucl.Acids Res.28:292(2000)。
以优化频率随机分配密码子来编码给定的多肽序列可以通过以下方式人工进行:计算每种氨基酸的密码子频率,然后将密码子随机分配至多肽序列。另外,可以使用各种算法和计算机软件程序来计算最佳序列。
在一些实施方案中,所述核酸分子包含一种或多种特性:(a)核酸分子或其部分相对于SEQ ID NO:16具有增加的人密码子适应指数;(b)核苷酸序列或其部分相对于SEQ IDNO:16具有增加的最优密码子的频率;(c)与SEQ ID NO:16中G/C核苷酸的百分比相比,所述核苷酸序列或其部分含有更高的G/C核苷酸百分比;(d)核苷酸序列或其部分相对于SEQ IDNO:16具有增加的相对同义密码子使用度;(e)核苷酸序列或其部分相对于SEQ ID NO:16具有减少的有效密码子数;(f)核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列(SEQ ID NO:21和22);(g)核苷酸序列相对于SEQ ID NO:16含有更少的去稳定元件(SEQ IDNO:23和24);(i)核苷酸序列不含多聚T序列,(j)核苷酸序列不含多聚A序列;或(k)其任何组合。在一些实施方案中,所述核酸分子含有(a)至(j)的至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或十种特征。
B.密码子适应指数
在一个实施方案中,分离的核酸分子包含本文所述的编码具有FVIII活性的多肽的核苷酸序列,其中人密码子适应指数相对于SEQ ID NO:16增加。例如,所述核苷酸序列可以具有如下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)、至少约0.91(91%)、至少约0.92(92%)、至少约0.93(93%)、至少约0.94(94%)、至少约0.95(95%)、至少约0.96(96%)、至少约0.97(97%)、至少约0.98(98%)、或至少约0.99(99%)。在一些实施方案中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。在其他实施方案中,所述核苷酸序列具有至少约.91(91%)的人密码子适应指数。在其他实施方案中,所述核苷酸序列具有至少约.91(97%)的人密码子适应指数。
在一个特定实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。
在一些实施方案中,所述核苷酸序列具有如下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)、或至少约.91(91%)。在一个特定实施方案中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。在另一个实施方案中,所述核苷酸序列具有至少约.91(91%)的人密码子适应指数。
在另一个实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374或(ii)SEQID NO:6的核苷酸1792-2277和2320-4374的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。
在一些实施方案中,所述核苷酸序列具有如下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、或至少约0.88(88%)。在一个特定实施方案中,所述核苷酸序列具有至少约.83(83%)的人密码子适应指数。在另一个实施方案中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。
在其他实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施方案中,所述核苷酸序列具有如下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、或至少约0.88(88%)。
在一个特定实施方案中,所述核苷酸序列具有至少约.75(75%)的人密码子适应指数。在另一个实施方案中,所述核苷酸序列具有至少约.83(83%)的人密码子适应指数。在另一个实施方案中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。在另一个实施方案中,所述核苷酸序列具有至少约.91(91%)的人密码子适应指数。在另一个实施方案中,所述核苷酸序列具有至少约.97(97%)的人密码子适应指数。
在一些实施方案中,分离的核酸分子相对于SEQ ID NO:16具有增加的最优密码子(FOP)的频率。在某些实施方案中,分离的核酸分子的FOP是至少约40、至少约45、至少约50、至少约55、至少约60、至少约64、至少约65、至少约70、至少约75、至少约79、至少约80、至少约85、或至少约90。
在其他实施方案中,分离的核酸分子相对于SEQ ID NO:16具有增加的相对同义密码子使用度(RCSU)。在一些实施方案中,分离的核酸分子的RCSU大于1.5。在其他实施方案中,分离的核酸分子的RCSU大于2.0。在某些实施方案中,分离的核酸分子的RCSU是至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2.0、至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6或至少约2.7。
在仍其他实施方案中,分离的核酸分子相对于SEQ ID NO:16具有减少的有效密码子数。在一些实施方案中,分离的核酸分子的有效密码子数为小于约50、小于约45、小于约40、小于约35、小于约30、或小于约25。在一个特定实施方案中,分离的核酸分子的有效密码子数为约40、约35、约30、约25、或约20。
C.G/C含量优化
在一些实施方案中,分离的核酸分子包含本文所述的编码具有FVIII活性的多肽的核苷酸序列,其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高的G/C核苷酸的百分比。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%、或至少约60%。
在一个特定实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高的G/C核苷酸的百分比。
在一些实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、或至少约58%。在一个特定实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约58%。
在另一个实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高的G/C核苷酸的百分比。
在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、或至少约57%。在一个特定实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约52%。在另一个实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约55%。在另一个实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约57%。
在其他实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的(i)核苷酸58-4374或(ii)核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高的G/C核苷酸的百分比。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约45%。
在一个特定实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约52%。在另一个实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约55%。在另一个实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约57%。在另一个实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约58%。在仍另一个实施方案中,编码具有FVIII活性的多肽的核苷酸序列的G/C含量为至少约60%。
“G/C含量”(或鸟嘌呤-胞嘧啶含量)或“G/C核苷酸的百分比”是指DNA分子中是鸟嘌呤或胞嘧啶的含氮碱基的百分比。G/C含量可以使用下式来计算:
Figure BDA0002701601960000751
人基因的G/C含量具有高异质性,其中一些基因的G/C含量低至20%,并且其他基因的G/C含量高至95%。通常,富含G/C的基因具有更高表达。事实上,已经证实,增加基因的G/C含量可以导致增加所述基因的表达,这主要是由于转录增加和更高稳态mRNA水平所致。参见Kudla等人,PLoS Biol.,4(6):e180(2006)。
D.基质附着区样序列
在一些实施方案中,分离的核酸分子包含本文所述的编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
在一个特定实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
在另一个实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
在其他实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374或(ii)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
已经鉴定出人FVIII核苷酸序列中富含AT的元件,其与酿酒酵母(Saccharomycescerevisiae)自主复制序列(ARS)和核基质附着区(MAR)共享序列相似性(Fallux等人,Mol.Cell.Biol.16:4264-4272(1996))。已经证实这些元件中的一种在体外结合核因子并阻遏氯霉素乙酰转移酶(CAT)报告基因的表达。同前。已经假设,这些序列可以有助于人FVIII基因的转录阻遏。因此,在一个实施方案中,在本公开文本的FVIII基因中消除所有MAR/ARS序列。在亲代FVIII序列(SEQ ID NO:16)中存在四个MAR/ARS ATATTT序列(SEQ IDNO:21)和三个MAR/ARS AAATAT序列(SEQ ID NO:22)。所有这些位点都发生突变以破坏优化的FVIII序列(SEQ ID NO:1-6)中的MAR/ARS序列。优化的序列中这些元件各自的位置以及相应核苷酸的序列显示于下表2中。
表2:阻遏元件的变化的总结
Figure BDA0002701601960000771
Figure BDA0002701601960000781
E.去稳定序列
在一些实施方案中,分离的核酸分子包含本文所述的编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列相对于SEQ ID NO:16含有更少的去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在一个特定实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少的去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在另一个实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少的去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在其他实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列相对于SEQ IDNO:16含有更少的去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在亲代FVIII序列(SEQ ID NO:16)中存在十个去稳定元件:六个ATTTA序列(SEQID NO:23)和四个TAAAT序列(SEQ ID NO:24)。在一个实施方案中,这些位点的序列发生突变以破坏优化的FVIII SEQ ID NO:1-6、70和71中的去稳定元件。优化的序列中这些元件各自的位置以及相应核苷酸的序列显示于表2中。
F.潜在启动子结合位点
在一些实施方案中,分离的核酸分子包含本文所述的编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列相对于SEQ ID NO:16含有更少的潜在启动子结合位点。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个、或至多5个潜在启动子结合位点。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
在一个特定实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少的潜在启动子结合位点。
在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个、或至多5个潜在启动子结合位点。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
在另一个实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少的潜在启动子结合位点。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个、或至多5个潜在启动子结合位点。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
在其他实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列相对于SEQ IDNO:16含有更少的潜在启动子结合位点。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个、或至多5个潜在启动子结合位点。在其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施方案中,编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
TATA盒是通常在真核生物的启动子区中发现的调节序列。其用作通用转录因子TATA结合蛋白(TBP)的结合位点。TATA盒通常包含序列TATAA(SEQ ID NO:28)或相似变体。然而,编码序列内的TATA盒可以抑制全长蛋白质的翻译。在野生型BDD FVIII序列(SEQ IDNO:16)中存在十个潜在启动子结合序列:五个TATAA序列(SEQ ID NO:28)和五个TTATA序列(SEQ ID NO:29)。在一些实施方案中,在本公开文本的FVIII基因中消除至少1个、至少2个、至少3个或至少4个启动子结合位点。在一些实施方案中,在本公开文本的FVIII基因中消除至少5个启动子结合位点。在其他实施方案中,在本公开文本的FVIII基因中消除至少6个、至少7个或至少8个启动子结合位点。在一个实施方案中,在本公开文本的FVIII基因中消除至少9个启动子结合位点。在一个特定实施方案中,在本公开文本的FVIII基因中消除所有启动子结合位点。优化序列中每个潜在启动子结合位点的位置和相应核苷酸的序列显示于表2中。
G.其他顺式作用负调节元件
除了上述MAR/ARS序列、去稳定元件和潜在启动子位点以外,在野生型BDD FVIII序列(SEQ ID NO:16)中可以鉴定出若干种另外的潜在抑制性序列。在未优化的BDD FVIII序列中可以鉴定出两个富含AU的序列元件(ARE)(ATTTTATT(SEQ ID NO:30);和ATTTTTAA(SEQ ID NO:31)),以及多聚A位点(AAAAAAA;SEQ ID NO:26)、多聚T位点(TTTTTT;SEQ IDNO:25)和剪接位点(GGTGAT;SEQ ID NO:27)。可以从优化的FVIII序列去除这些元件中的一个或多个。在优化序列中这些位点各自的位置和相应核苷酸的序列显示于表2中。
在某些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列不含一种或多种顺式作用负调节元件,例如,剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。
在另一个实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第二核酸序列具有与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列不含一种或多种顺式作用负调节元件,例如,剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。
在其他实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含一种或多种顺式作用负调节元件,例如,剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。
在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。
在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列不含多聚T序列(SEQ ID NO:25)。
在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列不含多聚A序列(SEQ ID NO:26)。
在一些实施方案中,分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中所述第一核酸序列具有与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791的至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性;其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列不含ARE元件(SEQ ID NO:30或SEQ ID NO:31)。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含多聚T序列(SEQ ID NO:25)。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含多聚A序列(SEQ ID NO:26)。
在一些实施方案中,分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含具有与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,但不含编码B结构域或B结构域片段的核苷酸)的至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含ARE元件(SEQ ID NO:30或SEQ ID NO:31)。
在其他实施方案中,本公开文本的优化的FVIII序列不含抗病毒基序、茎环结构和重复序列中的一个或多个。
在仍其他实施方案中,转录起始位点周围的核苷酸变为kozak共有序列(GCCGCCACCATGC(SEQ ID NO:32),其中加下划线的核苷酸是起始密码子)。在其他实施方案中,可以添加或去除限制位点以促进克隆过程。
H.异源核苷酸序列
在一些实施方案中,分离的核酸分子还包含异源核苷酸序列。在一些实施方案中,分离的核酸分子还包含至少一个异源核苷酸序列。所述异源核苷酸序列可以在5'端、在3'端与本公开文本的优化的BDD-FVIII核苷酸序列连接,或者插入优化的BDD-FVIII核苷酸序列的中间。因此,在一些实施方案中,由异源核苷酸序列编码的异源氨基酸序列与由核苷酸序列编码的FVIII氨基酸序列的N末端或C末端连接,或者插入FVIII氨基酸序列中的两个氨基酸之间。在一些实施方案中,可以将异源氨基酸序列在选自表3的一个或多个插入位点处插入两个氨基酸之间。在一些实施方案中,可以将异源氨基酸序列在以下文献中披露的任何位点插入由本公开文本的核酸分子编码的FVIII多肽内:国际公开号WO 2013/123457 A1和WO 2015/106052 A1,或美国公开号2015/0158929 A1,将所述文献通过引用以其整体并入本文。
在一些实施方案中,将由异源核苷酸序列编码的异源氨基酸序列插入B结构域或其片段内。在一些实施方案中,将异源氨基酸序列插入FVIII内,紧接对应于成熟人FVIII(SEQ ID NO:15)的氨基酸745的氨基酸的下游。在一个特定实施方案中,FVIII包含对应于成熟人FVIII(SEQ ID NO:15)的氨基酸746-1646的缺失,并且将由异源核苷酸序列编码的异源氨基酸序列插入,紧接对应于成熟人FVIII(SEQ ID NO:15)的氨基酸745的下游。
表3:异源部分插入位点
Figure BDA0002701601960000861
Figure BDA0002701601960000871
注意:插入位点指示对应于成熟人FVIII(SEQ ID NO:15)的氨基酸位置的氨基酸位置。
在其他实施方案中,分离的核酸分子还包含两个、三个、四个、五个、六个、七个或八个异源核苷酸序列。在一些实施方案中,所有异源核苷酸序列是相同的。在一些实施方案中,至少一个异源核苷酸序列与其他异源核苷酸序列不同。在一些实施方案中,本公开文本可以包含串联的两个、三个、四个、五个、六个或多于七个异源核苷酸序列。
在一些实施方案中,所述异源核苷酸序列编码氨基酸序列。在一些实施方案中,由异源核苷酸序列编码的氨基酸序列是可以延长FVIII分子的半衰期的异源部分(“半衰期延长剂”)。
在一些实施方案中,所述异源部分是具有非结构化或结构化特征的肽或多肽,所述特征与掺入本公开文本的蛋白质中时体内半衰期的延长相关。非限制性例子包括白蛋白、白蛋白片段、免疫球蛋白的Fc片段、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、HAP序列、XTEN序列、转铁蛋白或其片段、PAS多肽、聚甘氨酸接头、聚丝氨酸接头、白蛋白结合部分或者这些多肽的任何片段、衍生物、变体或组合。在一个特定实施方案中,所述异源氨基酸序列是免疫球蛋白恒定区或其部分、转铁蛋白、白蛋白或PAS序列。
在一些方面,异源部分包括血管性血友病因子或其片段。在其他相关方面,异源部分可以包括非多肽部分的附着位点(例如,半胱氨酸氨基酸),所述非多肽部分是例如聚乙二醇(PEG)、羟乙基淀粉(HES)、聚唾液酸、或者这些元件的任何衍生物、变体或组合。在一些方面,异源部分包含半胱氨酸氨基酸,所述半胱氨酸氨基酸作为非多肽部分的附着位点起作用,所述非多肽部分是例如聚乙二醇(PEG)、羟乙基淀粉(HES)、聚唾液酸、或者这些元件的任何衍生物、变体或组合。
在一个具体实施方案中,第一异源核苷酸序列编码第一异源部分,所述第一异源部分是本领域中已知的半衰期延长分子,并且第二异源核苷酸序列编码第二异源部分,所述第二异源部分也可以是本领域中已知的半衰期延长分子。在某些实施方案中,所述第一异源部分(例如,第一Fc部分)和所述第二异源部分(例如,第二Fc部分)彼此缔合形成二聚体。在一个实施方案中,所述第二异源部分是第二Fc部分,其中所述第二Fc部分与所述第一异源部分(例如,第一Fc部分)连接或缔合。例如,所述第二异源部分(例如,第二Fc部分)可以通过接头与所述第一异源部分(例如,第一Fc部分)连接,或者通过共价或非共价键与所述第一异源部分缔合。
在一些实施方案中,所述异源部分是多肽,所述多肽包含至少约10个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2500个、至少约3000个、或至少约4000个氨基酸,基本上由其组成,或者由其组成。
在其他实施方案中,所述异源部分是多肽,所述多肽包含约100至约200个氨基酸、约200至约300个氨基酸、约300至约400个氨基酸、约400至约500个氨基酸、约500至约600个氨基酸、约600至约700个氨基酸、约700至约800个氨基酸、约800至约900个氨基酸、或约900至约1000个氨基酸,基本上由其组成,或者由其组成。
在某些实施方案中,异源部分在不显著影响FVIII蛋白的生物学活性或功能的情况下改进FVIII蛋白的一种或多种药代动力学特性。
在某些实施方案中,异源部分延长本公开文本的FVIII蛋白的体内和/或体外半衰期。在其他实施方案中,异源部分促使本公开文本的FVIII蛋白或其片段(例如,在FVIII蛋白的蛋白质水解切割后包含异源部分的片段)的可视化或定位。本公开文本的FVIII蛋白或其片段的可视化和/或定位可以是在体内、在体外、离体或其组合。
在其他实施方案中,异源部分增加本公开文本的FVIII蛋白或其片段(例如,在FVIII蛋白的蛋白质水解切割后包含异源部分的片段)的稳定性。如本文所用,术语“稳定性”是指响应于环境条件(例如,升高的或降低的温度)对FVIII蛋白的一种或多种物理特性的维持的本领域公认的量度。在某些方面,物理特性可以是对FVIII蛋白的共价结构的维持(例如,不存在蛋白质水解切割、不需要的氧化或脱酰胺)。在其他方面,物理特性还可以是呈适当折叠状态的FVIII蛋白的存在(例如,不存在可溶性或不溶性聚集体或沉淀)。
在一方面,FVIII蛋白的稳定性是通过测定FVIII蛋白的生物物理特性来测量的,所述生物物理特性是例如热稳定性、pH解折叠谱、糖基化的稳定去除、溶解度、生物化学功能(例如,与蛋白质、受体或配体结合的能力)等,和/或其组合。在另一方面,生物化学功能是通过相互作用的结合亲和力来证实的。在一个方面中,蛋白质稳定性的量度是热稳定性,即,对热激的抗性。稳定性可以使用本领域中已知的方法(如HPLC(高效液相色谱)、SEC(尺寸排阻色谱)、DLS(动态光散射)等)来测量。测量热稳定性的方法包括但不限于差式扫描量热法(DSC)、差式扫描荧光测定法(DSF)、圆二色性(CD)和热激测定。
在某些方面,由本公开文本的核酸分子编码的FVIII蛋白包含至少一种半衰期延长剂,即,异源部分,其相对于缺少这种异源部分的相应FVIII蛋白的体内半衰期延长FVIII蛋白的体内半衰期。FVIII蛋白的体内半衰期可以通过本领域技术人员已知的任何方法来确定,所述方法是例如活性测定(生色测定或一段式凝血aPTT测定)、ELISA、ROTEMTM等。
在一些实施方案中,一种或多种半衰期延长剂的存在导致与缺少此一种或多种半衰期延长剂的相应蛋白质的半衰期相比,FVIII蛋白的半衰期延长。包含半衰期延长剂的FVIII蛋白的半衰期比缺少这种半衰期延长剂的相应FVIII蛋白的体内半衰期长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、或至少约12倍。
在一个实施方案中,包含半衰期延长剂的FVIII蛋白的半衰期比缺少这种半衰期延长剂的相应蛋白质的体内半衰期长约1.5倍至约20倍、约1.5倍至约15倍、或约1.5倍至约10倍。在另一个实施方案中,与缺少半衰期延长剂的相应蛋白质的体内半衰期相比,包含这种半衰期延长剂的FVIII蛋白的半衰期延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍、或约6倍至约8倍。
在其他实施方案中,包含半衰期延长剂的FVIII蛋白的半衰期是至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时、或至少约108小时。
在仍其他实施方案中,包含半衰期延长剂的FVIII蛋白的半衰期是约15小时至约两周、约16小时至约一周、约17小时至约一周、约18小时至约一周、约19小时至约一周、约20小时至约一周、约21小时至约一周、约22小时至约一周、约23小时至约一周、约24小时至约一周、约36小时至约一周、约48小时至约一周、约60小时至约一周、约24小时至约六天、约24小时至约五天、约24小时至约四天、约24小时至约三天、或约24小时至约两天。
在一些实施方案中,包含半衰期延长剂的FVIII蛋白的每名受试者的平均半衰期是约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约六天、约七天(一周)、约八天、约九天、约10天、约11天、约12天、约13天、或约14天。
一种或多种半衰期延长剂可以与FVIII的C末端或N末端融合或者插入FVIII内。
1.免疫球蛋白恒定区或其部分
在另一个方面中,异源部分包含一个或多个免疫球蛋白恒定区或其部分(例如,Fc区)。在一个实施方案中,本公开文本的分离的核酸分子还包含编码免疫球蛋白恒定区或其部分的异源核酸序列。在一些实施方案中,所述免疫球蛋白恒定区或其部分是Fc区。
免疫球蛋白恒定区包括表示为CH(恒定重链)结构域(CH1、CH2等)的结构域。根据同种型(即IgG、IgM、IgA、IgD或IgE),恒定区可以由三个或四个CH结构域构成。一些同种型(例如IgG)恒定区还含有铰链区。参见Janeway等人2001,Immunobiology,GarlandPublishing,纽约州纽约市。
用于产生本公开文本的FVIII蛋白的免疫球蛋白恒定区或其部分可以从多种不同的来源获得。在一个实施方案中,免疫球蛋白恒定区或其部分源自人免疫球蛋白。然而,应理解,所述免疫球蛋白恒定区或其部分可以源自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,所述免疫球蛋白恒定区或其部分可以源自任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)以及任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在一个实施方案中,使用人同种型IgG1。
多个免疫球蛋白恒定区基因序列(例如,人恒定区基因序列)能够以可公开获得的存放物的形式获得。可以选择具有特定效应子功能(或缺少特定效应子功能)或具有特定修饰的恒定区结构域序列以降低免疫原性。已经公开了抗体和抗体编码基因的许多序列,并且合适的Ig恒定区序列(例如,铰链、CH2和/或CH3序列或其部分)可以使用本领域公认的技术源自这些序列。随后可以改变或合成使用任何前述方法获得的遗传物质以获得本公开文本的多肽。另外应了解,本公开文本的范围涵盖恒定区DNA序列的等位基因、变体和突变。
可以克隆免疫球蛋白恒定区或其部分的序列,例如使用聚合酶链式反应和所选用于扩增目的结构域的引物来克隆。为了从抗体克隆免疫球蛋白恒定区或其部分的序列,可以从杂交瘤、脾或淋巴细胞分离mRNA,逆转录为DNA,并通过PCR扩增抗体基因。PCR扩增方法详细描述于以下文献中:美国专利号4,683,195;4,683,202;4,800,159;4,965,188;以及例如,“PCR Protocols:A Guide to Methods and Applications”Innis等人编辑,AcademicPress,加利福尼亚州圣地亚哥(1990);Ho等人1989.Gene 77:51;Horton等人1993.MethodsEnzymol.217:270。PCR可以基于所公开的重链和轻链DNA和氨基酸序列由共有恒定区引物或由更具特异性的引物来起始。PCR还可以用于分离编码抗体轻链和重链的DNA克隆。在这种情况下,可以通过共有引物或较大同源探针(如小鼠恒定区探针)筛选文库。适于扩增抗体基因的多个引物组是本领域中已知的(例如,基于纯化的抗体的N末端序列5'引物(Benhar和Pastan.1994.Protein Engineering 7:1509);cDNA末端的快速扩增(Ruberti,F.等人1994.J.Immunol.Methods 173:33);抗体前导序列(Larrick等人1989Biochem.Biophys.Res.Commun.160:1250))。抗体序列的克隆进一步描述于以下文献中:Newman等人于1995年1月25日提交的美国专利号5,658,570,将所述文献通过引用并入本文。
本文所用的免疫球蛋白恒定区可以包括所有结构域和铰链区或其部分。在一个实施方案中,所述免疫球蛋白恒定区或其部分包含CH2结构域、CH3结构域和铰链区,即Fc区或FcRn结合配偶体。
如本文所用,术语“Fc区”被定义为多肽中对应于天然Ig的Fc区的部分,即,如通过其两条重链的相应Fc结构域的二聚缔合所形成。天然Fc区与另一Fc区形成同二聚体。相比之下,如本文所用,术语“遗传融合的Fc区”或“单链Fc区”(scFc区)是指合成二聚Fc区,其由在单一多肽链内遗传连接(即,在单一连续基因序列中编码)的Fc结构域构成。参见国际公开号WO2012/006635,将所述专利通过引用以其整体并入本文。
在一个实施方案中,“Fc区”是指单一Ig重链中的部分,所述部分在铰链区中紧接木瓜蛋白酶切割位点(即,IgG中的残基216,以重链恒定区的第一个残基为114)上游开始,并且在抗体的C末端结束。因此,完整的Fc区至少包含铰链结构域、CH2结构域和CH3结构域。
免疫球蛋白恒定区或其部分可以是FcRn结合配偶体。FcRn在成年上皮组织中有活性并在肠腔、肺气道、鼻表面、阴道表面、结肠和直肠表面中表达(美国专利号6,485,726)。FcRn结合配偶体是免疫球蛋白的结合至FcRn的一部分。
FcRn受体已经从包括人在内的若干种哺乳动物物种分离。人FcRn、猴FcRn、大鼠FcRn和小鼠FcRn的序列是已知的(Story等人1994,J.Exp.Med.180:2377)。FcRn受体在相对低pH下结合IgG(但不结合其他免疫球蛋白类别,如IgA、IgM、IgD和IgE),以内腔至浆膜方向跨细胞主动转运IgG,然后在间隙液中发现的相对较高的pH下释放IgG。其在成年上皮组织中表达(美国专利号6,485,726、6,030,613、6,086,875;WO 03/077834;US 2003-0235536A1),所述上皮组织包括肺和肠上皮(Israel等人1997,Immunology 92:69)、肾近端管状上皮(Kobayashi等人2002,Am.J.Physiol.Renal Physiol.282:F358)以及鼻上皮、阴道表面和胆道系统表面。
可用于本公开文本中的FcRn结合配偶体涵盖可由FcRn受体特异性结合的分子,包括完整IgG、IgG的Fc片段和包括FcRn受体的完整结合区的其他片段。已经基于X射线晶体学描述了IgG的Fc部分中与FcRn受体结合的区域(Burmeister等人1994,Nature 372:379)。Fc与FcRn的主要接触区域接近CH2和CH3结构域的接合处。Fc-FcRn接触全部位于单一Ig重链内。FcRn结合配偶体包括完整IgG、IgG的Fc片段和IgG的包括FcRn的完整结合区的其他片段。主要接触位点包括CH2结构域的氨基酸残基248、250-257、272、285、288、290-291、308-311和314以及CH3结构域的氨基酸残基385-387、428和433-436。所提及的免疫球蛋白或免疫球蛋白片段或区域的氨基酸编号都是基于Kabat等人1991,Sequences of Proteins ofImmunological Interest,美国公共卫生部,马里兰州贝塞斯达。
结合至FcRn的Fc区或FcRn结合配偶体可以通过FcRn有效穿梭跨越上皮障壁,由此提供全身给予所需治疗分子的非侵入性手段。另外,包含Fc区或FcRn结合配偶体的融合蛋白被表达FcRn的细胞内吞。但是这些融合蛋白再次再循环至循环中,而不是经标记以供降解,由此增加这些蛋白质的体内半衰期。在某些实施方案中,免疫球蛋白恒定区的部分是Fc区或FcRn结合配偶体,它们通常通过二硫键和其他非特异性相互作用与另一Fc区或另一FcRn结合配偶体缔合,以形成二聚体和更高阶多聚体。
两个FcRn受体可以结合单一Fc分子。晶体学数据表明,每个FcRn分子结合Fc同二聚体的单一多肽。在一个实施方案中,将FcRn结合配偶体(例如,IgG的Fc片段)与生物活性分子连接提供口服、经颊、舌下、经直肠、经阴道、作为经鼻给予的气溶胶或通过肺途径或通过眼部途径递送生物活性分子的方式。在另一个实施方案中,FVIII蛋白可以以侵入性方式(例如,皮下、静脉内)给予。
FcRn结合配偶体区域是可由FcRn受体特异性结合,随后通过Fc区的FcRn受体主动转运的分子或其部分。特异性结合是指两个分子形成在生理条件下相对稳定的复合物。特异性结合的特征在于高亲和力和低至中容量,如区别于非特异性结合,所述非特异性结合通常具有低亲和力和中至高容量。通常,在亲和常数KA高于106M-1或高于108M-1时,将结合视为特异性的。如有需要,可以通过改变结合条件在基本上不影响特异性结合的情况下减少非特异性结合。技术人员可以使用常规技术来优化适当的结合条件,如分子浓度、溶液的离子强度、温度、允许结合的时间、阻断剂(例如,血清白蛋白、乳酪蛋白)的浓度等。
在某些实施方案中,由本公开文本的核酸分子编码的FVIII蛋白包含一个或多个截短的Fc区,但是所述截短的Fc区足以将Fc受体(FcR)结合特性赋予Fc区。例如,Fc区中结合至FcRn的部分(即,FcRn结合部分)包含IgG1的约氨基酸282-438,EU编号(主要接触位点是CH2结构域的氨基酸248、250-257、272、285、288、290-291、308-311和314以及CH3结构域的氨基酸残基385-387、428和433-436)。因此,本公开文本的Fc区可以包含FcRn结合部分或由所述FcRn结合部分组成。FcRn结合部分可以源自任何同种型(包括IgGl、IgG2、IgG3和IgG4)的重链。在一个实施方案中,使用来自人同种型IgG1的抗体的FcRn结合部分。在另一个实施方案中,使用来自人同种型IgG4的抗体的FcRn结合部分。
Fc区可以从多种不同来源获得。在一个实施方案中,所述多肽的Fc区源自人免疫球蛋白。然而,应理解,Fc部分可以源自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,Fc结构域或其部分的多肽可以源自任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)以及任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在另一个实施方案中,使用人同种型IgG1。
在某些实施方案中,Fc变体赋予通过包含所述野生型Fc结构域的Fc部分赋予的至少一种效应子功能的变化(例如,Fc区结合至Fc受体(例如FcγRI、FcγRII或FcγRIII)或补体蛋白(例如,C1q)或触发抗体依赖性细胞毒性(ADCC)、吞噬作用或补体依赖性细胞毒性(CDCC)的能力的改进或降低)。在其他实施方案中,Fc变体提供工程化半胱氨酸残基。
本公开文本的Fc区可以采用本领域公认的Fc变体,已知所述Fc变体可赋予效应子功能和/或FcR或FcRn结合的变化(例如,增强或降低)。具体来说,本公开文本的Fc区可以包括例如在以下文献中披露的一个或多个氨基酸位置处的变化(例如,取代):国际PCT公开案WO 88/07089A1、WO 96/14339A1、WO 98/05787A1、WO 98/23289A1、WO 99/51642A1、WO 99/58572A1、WO 00/09560A2、WO 00/32767A1、WO 00/42072A2、WO 02/44215A2、WO 02/060919A2、WO 03/074569A2、WO 04/016750A2、WO 04/029207A2、WO 04/035752A2、WO 04/063351A2、WO 04/074455A2、WO 04/099249A2、WO 05/040217A2、WO 04/044859、WO 05/070963A1、WO 05/077981A2、WO 05/092925A2、WO 05/123780A2、WO 06/019447A1、WO 06/047350A2和WO 06/085967A2;US专利公开号US 2007/0231329、US 2007/0231329、US 2007/0237765、US 2007/0237766、US 2007/0237767、US 2007/0243188、US 2007/0248603、US2007/0286859、US 2008/0057056;或US专利5,648,260;5,739,277;5,834,250;5,869,046;6,096,871;6,121,022;6,194,551;6,242,195;6,277,375;6,528,624;6,538,124;6,737,056;6,821,505;6,998,253;7,083,784;7,404,956和7,317,091,将所述文献中的每一篇通过引用并入本文。在一个实施方案中,可以在所披露的一个或多个氨基酸位置进行特定变化(例如,本领域中披露的一个或多个氨基酸的特定取代)。在另一个实施方案中,可以在所披露的一个或多个氨基酸位置进行不同变化(例如,本领域中披露的一个或多个氨基酸位置的不同取代)。
IgG的Fc区或FcRn结合配偶体可以根据公认程序(如定点诱变等)来修饰,以产生将由FcRn结合的经修饰IgG或其Fc片段或部分。此类修饰包括远离FcRn接触位点的修饰以及在接触位点内的修饰,所述修饰保存或甚至增强与FcRn的结合。例如,人IgG1Fc(Fcγ1)中的以下单一氨基酸残基可以在不显著损失Fc对FcRn的结合亲和力的情况下被取代:P238A、S239A、K246A、K248A、D249A、M252A、T256A、E258A、T260A、D265A、S267A、H268A、E269A、D270A、E272A、L274A、N276A、Y278A、D280A、V282A、E283A、H285A、N286A、T289A、K290A、R292A、E293A、E294A、Q295A、Y296F、N297A、S298A、Y300F、R301A、V303A、V305A、T307A、L309A、Q311A、D312A、N315A、K317A、E318A、K320A、K322A、S324A、K326A、A327Q、P329A、A330Q、P331A、E333A、K334A、T335A、S337A、K338A、K340A、Q342A、R344A、E345A、Q347A、R355A、E356A、M358A、T359A、K360A、N361A、Q362A、Y373A、S375A、D376A、A378Q、E380A、E382A、S383A、N384A、Q386A、E388A、N389A、N390A、Y391F、K392A、L398A、S400A、D401A、D413A、K414A、R416A、Q418A、Q419A、N421A、V422A、S424A、E430A、N434A、T437A、Q438A、K439A、S440A、S444A、和K447A,其中例如P238A表示在位置编号238被丙氨酸取代的野生型脯氨酸。作为例子,一个具体实施方案掺入N297A突变,从而去除高度保守的N糖基化位点。除了丙氨酸以外,可以在上文指定的位置用其他氨基酸取代野生型氨基酸。可以将突变单独引入Fc中,从而产生多于一百个与天然Fc不同的Fc区。另外,这些单独突变中的两个、三个或更多个的组合可以一起引入,从而产生另外数百个Fc区。
某些上述突变可以对Fc区或FcRn结合配偶体赋予新功能。例如,一个实施方案掺入N297A,从而去除高度保守的N糖基化位点。该突变的作用是降低免疫原性,由此增强Fc区的循环半衰期,并使Fc区不能结合至FcγRI、FcγRIIA、FcγRIIB和FcγRIIIA,并且不损害对FcRn的亲和力(Routledge等人1995,Transplantation 60:847;Friend等人1999,Transplantation 68:1632;Shields等人1995,J.Biol.Chem.276:6591)。作为从上述突变产生的新功能的另一个例子,在一些情况下,对FcRn的亲和力可以增加,超过野生型的亲和力。这种增加的亲和力可以反映增加的“开启”比率、降低的“关闭”比率、或增加的“开启”比率与降低的“关闭”比率二者。相信可赋予增加的对FcRn的亲和力的突变的例子包括但不限于T256A、T307A、E380A和N434A(Shields等人2001,J.Biol.Chem.276:6591)。
另外,至少三种人Fcγ受体似乎识别IgG上位于下铰链区内的结合位点,通常是氨基酸234-237。因此,可以从这个区域的突变产生新功能的另一例子和可能降低的免疫原性,如例如通过将人IgG1的氨基酸233-236“ELLG”(SEQ ID NO:45)替代为来自IgG2的相应序列“PVA”(一个氨基酸缺失)来进行。已经显示,在已经引入此类突变时,介导多种效应子功能的FcγRI、FcγRII和FcγRIII不会结合至IgG1。Ward和Ghetie 1995,TherapeuticImmunology 2:77;以及Armour等人1999,Eur.J.Immunol.29:2613。
在另一个实施方案中,所述免疫球蛋白恒定区或其部分包含铰链区或其部分中与第二免疫球蛋白恒定区或其部分形成一个或多个二硫键的氨基酸序列。所述第二免疫球蛋白恒定区或其部分可以与第二多肽连接,从而使FVIII蛋白与所述第二多肽结合在一起。在一些实施方案中,第二多肽是增强子部分。如本文所用,术语“增强子部分”是指能够增强FVIII的促凝活性的分子、其片段或多肽组分。所述增强子部分可以是辅因子,如可溶性组织因子(sTF)或促凝肽。因此,在激活FVIII后,增强子部分可用于增强FVIII活性。
在某些实施方案中,由本公开文本的核酸分子编码的FVIII蛋白包含免疫球蛋白恒定区或其部分的氨基酸取代(例如,Fc变体),所述氨基酸取代改变Ig恒定区的非抗原依赖性效应子功能,特别是蛋白质的循环半衰期。
2.scFc区
在另一方面,异源部分包含scFc(单链Fc)区。在一个实施方案中,本公开文本的分离的核酸分子还包含编码scFc区的异源核酸序列。scFc区在同一线性多肽链内包含至少两个免疫球蛋白恒定区或其部分(例如,Fc部分或结构域(例如,2、3、4、5、6或更多个Fc部分或结构域)),所述恒定区或其部分能折叠(例如,分子内或分子间折叠)以形成通过Fc肽接头连接的一个功能性scFc区。例如,在一个实施方案中,本公开文本的多肽能够通过其scFc区与至少一种Fc受体(例如,FcRn、FcγR受体(例如,FcγRIII)或补体蛋白(例如,C1q))结合,以改进半衰期或触发免疫效应子功能(例如,抗体依赖性细胞毒性(ADCC)、吞噬作用、或补体依赖性细胞毒性(CDCC)和/或改进可制造性)。
3.CTP
在另一方面,异源部分包含人绒毛膜促性腺激素的β亚基的一种C末端肽(CTP)或其片段、变体或衍生物。已知插入重组蛋白中的一种或多种CTP肽延长该蛋白质的体内半衰期。参见例如,美国专利号5,712,122,所述专利通过引用以其整体并入本文。
示例性CTP肽包括DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL(SEQ ID NO:33)或SSSSKAPPPSLPSPSRLPGPSDTPILPQ(SEQ ID NO:34)。参见例如,美国专利申请公开号US2009/0087411 A1,所述专利通过引用并入。
4.XTEN序列
在一些实施方案中,异源部分包含一个或多个XTEN序列、其片段、变体或衍生物。如本文所用,“XTEN序列”是指长度延长的多肽,其具有非天然存在的基本上不重复的序列,所述序列主要由小亲水氨基酸构成,并且所述序列在生理条件下具有较低程度的或不具有二级或三级结构。作为异源部分,XTEN可以用作半衰期延长部分。另外,XTEN可以提供所需特性,包括但不限于增强的药代动力学参数和溶解度特征。
将包含XTEN序列的异源部分掺入本公开文本的蛋白质中可以赋予蛋白质以下有利特性中的一种或多种:构象柔性、增强的水溶解度、高蛋白酶抗性程度、低免疫原性、与哺乳动物受体的低结合或增加的流体力学(或斯托克斯(Stokes))半径。
在某些方面中,XTEN序列可以增加药代动力学特性,如较长体内半衰期或增加的曲线下面积(AUC),使得与相同的但不具有XTEN异源部分的蛋白质相比,本公开文本的蛋白质保留在体内并且具有促凝活性的时间段延长。
在一些实施方案中,可用于本公开文本的XTEN序列是具有大于约20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800、或2000个氨基酸残基的肽或多肽。在某些实施方案中,XTEN是具有大于约20至约3000个氨基酸残基、大于约30至约2500个残基、大于约40至约2000个残基、大于约50至约1500个残基、大于约60至约1000个残基、大于约70至约900个残基、大于约80至约800个残基、大于约90至约700个残基、大于约100至约600个残基、大于约110至约500个残基、或大于120至约400个残基的肽或多肽。在一个特定实施方案中,XTEN包含长度长于42个氨基酸且短于144个氨基酸的氨基酸序列。
本公开文本的XTEN序列可以包含5至14个(例如9至14个)氨基酸残基的一个或多个序列基序,或与所述序列基序至少80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,其中所述基序包含选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的4-6种类型的氨基酸(例如5种氨基酸),基本上由其组成或由其组成。参见US 2010-0239554 A1。
在一些实施方案中,XTEN包含非重叠序列基序,其中约80%、或至少约85%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%、或约100%的序列由选自从表4选择的单一基序家族的非重叠序列的多个单元组成,从而得到家族序列。
如本文所用,“家族”意味着,XTEN具有仅选自来自表4的单一基序类别的基序;即AD、AE、AF、AG、AM、AQ、BC或BD XTEN,并且选择所述XTEN中并非来自家族基序的任何其他氨基酸来实现所需特性,如允许通过编码核苷酸掺入限制性位点、掺入切割序列,或实现与FVIII的更好连接。在XTEN家族的一些实施方案中,XTEN序列包含AD基序家族、或AE基序家族、或AF基序家族、或AG基序家族、或AM基序家族、或AQ基序家族、或BC家族、或BD家族的非重叠序列基序的多个单元,并且所得XTEN展现上述同源性范围。在其他实施方案中,XTEN包含来自表4的两个或更多个基序家族的基序序列的多个单元。
可以选择这些序列来实现所需的物理/化学特征,包括诸如净电荷、亲水性、二级结构缺少或重复性缺少等特性,所述特性由基序的氨基酸组成赋予,下面将更全面地描述。在本段落的上述实施方案中,可以使用本文所述方法选择并组装掺入XTEN中的基序,以实现约36至约3000个氨基酸残基的XTEN。
表4. 12个氨基酸的XTEN序列基序和基序家族
基序家族* 基序序列 SEQ ID NO:
AD GESPGGSSGSES 73
AD GSEGSSGPGESS 74
AD GSSESGSSEGGP 75
AD GSGGEPSESGSS 76
AE,AM GSPAGSPTSTEE 77
AE,AM,AQ GSEPATSGSETP 78
AE,AM,AQ GTSESATPESGP 79
AE,AM,AQ GTSTEPSEGSAP 80
AF,AM GSTSESPSGTAP 81
AF,AM GTSTPESGSASP 82
AF,AM GTSPSGESSTAP 83
AF,AM GSTSSTAESPGP 84
AG,AM GTPGSGTASSSP 85
AG,AM GSSTPSGATGSP 86
AG,AM GSSPSASTGTGP 87
AG,AM GASPGTSSTGSP 88
AQ GEPAGSPTSTSE 89
AQ GTGEPSSTPASE 90
AQ GSGPSTESAPTE 91
AQ GSETPSGPSETA 92
AQ GPSETSTSEPGA 93
AQ GSPSEPTEGTSA 94
BC GSGASEPTSTEP 95
BC GSEPATSGTEPS 96
BC GTSEPSTSEPGA 97
BC GTSTEPSEPGSA 98
BD GSTAGSETSTEA 99
BD GSETATSGSETA 100
BD GTSESATSESGA 101
BD GTSTEASEGSAS 102
*表示单独的基序序列,其在以各种排列一起使用时产生“家族序列”
可以在本公开文本的嵌合蛋白中用作异源部分的XTEN序列的例子披露于例如以下文献中:美国专利公开号2010/0239554 A1、2010/0323956 A1、2011/0046060 A1、2011/0046061 A1、2011/0077199 A1或2011/0172146 A1;或国际专利公开号WO 2010/091122A1、WO 2010/144502 A2、WO 2010/144508 A1、WO 2011/028228 A1、WO 2011/028229 A1或WO 2011/028344 A2,将所述文献中的每一篇通过引用以其整体并入本文。
XTEN可以具有变化的长度用于插入或连接至FVIII。在一个实施方案中,所述一个或多个XTEN序列的长度是基于要在融合蛋白中实现的特性或功能来选择的。根据计划的特性或功能,XTEN可以是短长度序列或中等长度序列或更长的序列,可以用作载体。在某些实施方案中,XTEN包括约6至约99个氨基酸残基的短区段、约100至约399个氨基酸残基的中等长度、以及约400至约1000和多达约3000个氨基酸残基的较长长度。因此,插入或连接至FVIII的XTEN可以具有以下长度:约6、约12、约36、约40、约42、约72、约96、约144、约288、约400、约500、约576、约600、约700、约800、约864、约900、约1000、约1500、约2000、约2500、或多达约3000个氨基酸残基的长度。在其他实施方案中,XTEN序列的长度为约6至约50、约50至约100、约100至150、约150至250、约250至400、约400至约500、约500至约900、约900至1500、约1500至2000、或约2000至约3000个氨基酸残基。
在不对FVIII的活性造成不利影响的情况下,插入或连接至FVIII的XTEN的精确长度可以变化。在一个实施方案中,本文使用的一个或多个XTEN的长度为42个氨基酸、72个氨基酸、144个氨基酸、288个氨基酸、576个氨基酸、或864个氨基酸,并且可以选自一个或多个XTEN家族序列;即,AD、AE、AF、AG、AM、AQ、BC或BD。
在一些实施方案中,本公开文本中使用的XTEN序列与选自以下的序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%相同:AE42、AG42、AE48、AM48、AE72、AG72、AE108、AG108、AE144、AF144、AG144、AE180、AG180、AE216、AG216、AE252、AG252、AE288、AG288、AE324、AG324、AE360、AG360、AE396、AG396、AE432、AG432、AE468、AG468、AE504、AG504、AF504、AE540、AG540、AF540、AD576、AE576、AF576、AG576、AE612、AG612、AE624、AE648、AG648、AG684、AE720、AG720、AE756、AG756、AE792、AG792、AE828、AG828、AD836、AE864、AF864、AG864、AM875、AE912、AM923、AM1318、BC864、BD864、AE948、AE1044、AE1140、AE1236、AE1332、AE1428、AE1524、AE1620、AE1716、AE1812、AE1908、AE2004A、AG948、AG1044、AG1140、AG1236、AG1332、AG1428、AG1524、AG1620、AG1716、AG1812、AG1908、AG2004及其任何组合。参见US 2010-0239554A1。在一个特定实施方案中,XTEN包含AE42、AE72、AE144、AE288、AE576、AE864、AG 42、AG72、AG144、AG288、AG576、AG864或其任何组合。
可以在本公开文本的嵌合蛋白中用作异源部分的示例性XTEN序列包括XTENAE42-4(SEQ ID NO:46,由SEQ ID NO:47编码;分别见图11C和图11D)、XTEN 144-2A(SEQ IDNO:48,由SEQ ID NO:49编码;分别见图11E和图11F)、XTEN A144-3B(SEQ ID NO:50,由SEQID NO:51编码;分别见图11G和图11H)、XTEN AE144-4A(SEQ ID NO:52,由SEQ ID NO:53编码;分别见图11I和图11J)、XTEN AE144-5A(SEQ ID NO:54,由SEQ ID NO:55编码;分别见图11K和图11L)、XTEN AE144-6B(SEQ ID NO:56,由SEQ ID NO:57编码;分别见图11M和图11N)、XTEN AG144-1(SEQ ID NO:58,由SEQ ID NO:59编码;分别见图11O和图11P)、XTENAG144-A(SEQ ID NO:60,由SEQ ID NO:61编码;分别见图11Q和图11R)、XTEN AG144-B(SEQID NO:62,由SEQ ID NO:63编码;分别见图11S和图11T)、XTEN AG144-C(SEQ ID NO:64,由SEQ ID NO:65编码;分别见图11U和图11V)、和XTEN AG144-F(SEQ ID NO:66,由SEQ ID NO:67编码;分别见图11W和图11X)。在一个特定实施方案中,XTEN是由SEQ ID NO:18编码。
在一些实施方案中,XTEN的小于100%的氨基酸选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P),或者小于100%的序列由来自表4的序列基序或本文提供的XTEN序列组成。在此类实施方案中,XTEN的其余氨基酸残基选自其他14种天然L-氨基酸中的任一种,但是可以优先选自亲水性氨基酸使得XTEN序列含有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%的亲水性氨基酸。
缀合构建体中利用的XTEN中的疏水性氨基酸的含量可以是小于5%、或小于2%、或小于1%的疏水性氨基酸含量。在XTEN的构建中较不有利的疏水性残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。另外,XTEN序列可以含有小于5%或小于4%或小于3%或小于2%或小于1%或无以下氨基酸:甲硫氨酸(例如,以避免氧化),或天冬酰胺和谷氨酰胺(以避免脱酰胺)。
可以将所述一个或多个XTEN序列插入由核苷酸序列编码的氨基酸序列的C末端或N末端,或者插入由核苷酸序列编码的氨基酸序列中的两个氨基酸之间。例如,可以将XTEN插入选自表3的一个或多个插入位点处的两个氨基酸之间。FVIII内可允许XTEN插入的位点的例子可以参见例如国际公开号WO 2013/123457 A1或美国公开号2015/0158929 A1,将所述文献通过引用以其整体并入本文。
5.白蛋白或其片段、衍生物或变体
在一些实施方案中,异源部分包含白蛋白或其功能片段。人血清白蛋白(HSA,或HA)是一种全长形式的有609个氨基酸的蛋白质,其负责大部分血清渗透压,并且还起到内源和外源配体的载体的作用。如本文所用,术语“白蛋白”包括全长白蛋白或其功能性片段、变体、衍生物或类似物。白蛋白或其片段或变体的例子披露于以下文献中:美国专利公开号2008/0194481A1、2008/0004206 A1、2008/0161243 A1、2008/0261877 A1或2008/0153751A1,或者PCT申请公开号WO 2008/033413 A2、WO 2009/058322 A1或WO 2007/021494 A2,将上述文献通过引用以其整体并入本文。
在一个实施方案中,由本公开文本的核酸分子编码的FVIII蛋白包含与第二异源部分进一步连接的白蛋白、其片段或变体,所述第二异源部分选自免疫球蛋白恒定区或其部分(例如,Fc区)、PAS序列、HES和PEG。
6.白蛋白结合部分
在某些实施方案中,所述异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白结合结构域、白蛋白结合抗体片段或其任何组合。
例如,白蛋白结合蛋白可以是细菌白蛋白结合蛋白、抗体或抗体片段,包括结构域抗体(参见美国专利号6,696,245)。例如,白蛋白结合蛋白可以是细菌白蛋白结合结构域,如一种链球菌蛋白G(Konig,T.和Skerra,A.(1998)J.Immunol.Methods 218,73-83)。可以用作缀合配偶体的白蛋白结合肽的其他例子是例如具有Cys-Xaa1-Xaa2-Xaa3-Xaa4-Cys共有序列的那些,其中Xaa1是Asp、Asn、Ser、Thr或Trp;Xaa2是Asn、Gln、His、Ile、Leu或Lys;Xaa3是Ala、Asp、Phe、Trp或Tyr;并且Xaa4是Asp、Gly、Leu、Phe、Ser或Thr,如以下文献中所述:美国专利申请公开号2003/0069395,或Dennis等人(Dennis等人(2002)J.Biol.Chem.277,35035-35043)。
来自链球菌蛋白G的结构域3是细菌白蛋白结合结构域的例子,如以下文献所披露:Kraulis等人,FEBS Lett.378:190-194(1996)和Linhult等人,Protein Sci.11:206-213(2002)。白蛋白结合肽的例子包括具有核心序列DICLPRWGCLW(SEQ ID NO:35)的一系列肽。参见例如,Dennis等人,J.Biol.Chem.2002,277:35035-35043(2002)。白蛋白结合抗体片段的例子披露于以下文献中:Muller和Kontermann,Curr.Opin.Mol.Ther.9:319-326(2007);Roovers等人,Cancer Immunol.Immunother.56:303-317(2007);和Holt等人,Prot.Eng.Design Sci.,21:283-288(2008),将上述文献通过引用以其整体并入本文。这种白蛋白结合部分的例子是如Trussel等人,Bioconjugate Chem.20:2286-2292(2009)所披露的2-(3-马来酰亚胺基丙酰胺基)-6-(4-(4-碘苯基)丁酰胺基)己酸酯(“Albu”标签)。
脂肪酸、特别是长链脂肪酸(LCFA)和长链脂肪酸样白蛋白结合化合物可以用于延长本公开文本的FVIII蛋白的体内半衰期。LCFA样白蛋白结合化合物的例子是16-(1-(3-(9-(((2,5-二氧代吡咯烷-1-基氧基)羰氧基)-甲基)-7-磺基-9H-芴-2-基氨基)-3-氧代丙基)-2,5-二氧代吡咯烷-3-基硫基)十六烷酸(参见例如,WO 2010/140148)。
7.PAS序列
在其他实施方案中,所述异源部分是PAS序列。如本文所用的PAS序列意指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,所述氨基酸序列在生理条件下形成随机螺旋构象。因此,PAS序列是包含丙氨酸、丝氨酸和脯氨酸、基本上由所述氨基酸组成或由所述氨基酸组成的构件块、氨基酸聚合物或序列盒,其可以用作嵌合蛋白中异源部分的一部分。然而,技术人员了解,在添加除了丙氨酸、丝氨酸和脯氨酸以外的残基作为PAS序列中的次要成分时,氨基酸聚合物还可以形成随机螺旋构象。
如本文所用,术语“次要成分”意指可以在PAS序列中添加除了丙氨酸、丝氨酸和脯氨酸以外的氨基酸至某种程度,例如,高达约12%,即,PAS序列的100个氨基酸中的约12个;高达约10%,即,PAS序列的100个氨基酸中的约10个;高达约9%,即,100个氨基酸中的约9个;高达约8%,即,100个氨基酸中的约8个;约6%,即,100个氨基酸中的约6个;约5%,即,100个氨基酸中的约5个;约4%,即,100个氨基酸中的约4个;约3%,即,100个氨基酸中的约3个;约2%,即,100个氨基酸中的约2个;约1%,即,100个氨基酸中的约1个。与丙氨酸、丝氨酸和脯氨酸不同的氨基酸可以选自Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Thr、Trp、Tyr和Val。
在生理条件下,PAS序列段形成随机螺旋构象,并且由此可以介导增加的针对FVIII蛋白的体内和/或体外稳定性。由于随机螺旋结构域自身不具有稳定结构或功能,基本上保留了由FVIII蛋白介导的生物学活性。在其他实施方案中,尤其关于血浆中的蛋白质水解、免疫原性、等电点/静电行为、与细胞表面受体的结合或内化,形成随机螺旋结构域的PAS序列具有生物惰性,但仍然是生物可降解的,这提供了优于合成聚合物如PEG的明显优势。
形成随机螺旋构象的PAS序列的非限制性例子包含选自以下的氨基酸序列:ASPAAPAPASPAAPAPSAPA(SEQ ID NO:36)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO:37)、APSSPSPSAPSSPSPASPSS(SEQ ID NO:38)、APSSPSPSAPSSPSPASPS(SEQ ID NO:39)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO:40)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO:41)和ASAAAPAAASAAASAPSAAA(SEQ ID NO:42)或其任何组合。PAS序列的另外的例子是从例如美国专利公开号2010/0292130 A1和PCT申请公开号WO 2008/155134 A1得知。
8.HAP序列
在某些实施方案中,所述异源部分是富含甘氨酸的同氨基酸聚合物(HAP)。HAP序列可以包含甘氨酸的重复序列,所述重复序列具有至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸、或500个氨基酸的长度。在一个实施方案中,HAP序列能够延长与所述HAP序列融合或连接的部分的半衰期。HAP序列的非限制性例子包括但不限于(Gly)n、(Gly4Ser)n或S(Gly4Ser)n,其中n是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20。在一个实施方案中,n是20、21、22、23、24、25、26、26、28、29、30、31、32、33、34、35、36、37、38、39、或40。在另一个实施方案中,n是50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、或200。
9.转铁蛋白或其片段
在某些实施方案中,所述异源部分是转铁蛋白或其片段。可以使用任何转铁蛋白来制备本公开文本的FVIII蛋白。作为例子,野生型人TF(TF)是679个氨基酸的蛋白质,大约75KDa(不计糖基化),具有似乎源自基因重复的两个主要结构域N(约330个氨基酸)和C(约340个氨基酸)。参见GenBank登录号NM001063、XM002793、M12530、XM039845、XM 039847和S95936(www.ncbi.nlm.nih.gov/),将所有登录号通过引用以其整体并入本文。转铁蛋白包含两个结构域,即N结构域和C结构域。N结构域包含两个子结构域N1结构域和N2结构域,并且C结构域包含两个子结构域C1结构域和C2结构域。
在一个实施方案中,所述转铁蛋白异源部分包括转铁蛋白剪接变体。在一个例子中,转铁蛋白剪接变体可以是人转铁蛋白的剪接变体,例如Genbank登录号AAA61140。在另一个实施方案中,所述嵌合蛋白的转铁蛋白部分包括转铁蛋白序列的一个或多个结构域,例如N结构域、C结构域、N1结构域、N2结构域、C1结构域、C2结构域或其任何组合。
10.清除受体
在某些实施方案中,所述异源部分是清除受体、其片段、变体或衍生物。LRP1是600kDa膜内在蛋白,其参与受体介导的多种蛋白质如因子X的清除。参见例如,Narita等人,Blood 91:555-560(1998)。
11.血管性血友病因子或其片段
在某些实施方案中,所述异源部分是血管性血友病因子(VWF)或其一个或多个片段。
VWF(也称为F8VWF)是存在于血浆中的大型多聚糖蛋白,并且在内皮(在Weibel-Palade体中)、巨核细胞(血小板的α颗粒)和内皮下结缔组织中组成性地产生。基础的VWF单体是2813个氨基酸的蛋白质。每个单体含有多个具有特定功能的特定结构域,即D'和D3结构域(其一起结合至因子VIII)、A1结构域(其结合至血小板GPIb-受体、肝素和/或可能的胶原)、A3结构域(其结合至胶原)、C1结构域(其中RGD结构域在被激活时结合至血小板整联蛋白αIIbβ3)和在蛋白质C末端的“半胱氨酸结”结构域(其是VWF与血小板源性生长因子(PDGF)、转化生长因子-β(TGFβ)和β-人绒毛膜促性腺激素(βHCG)共享的)。
人VWF的2813单体氨基酸序列在Genbank中报告为登录号NP000543.2。编码人VWF的核苷酸序列在Genbank中报告为登录号NM000552.3。SEQ ID NO:44(图11B)是由SEQ IDNO:43编码的氨基酸序列。D'结构域包括SEQ ID NO:44的氨基酸764至866。D3结构域包括SEQ ID NO:44的氨基酸867至1240。
在血浆中,95%-98%FVIII是以与全长VWF的紧密非共价复合物来循环。这种复合物的形成对于在体内维持适当的FVIIII血浆水平是重要的。Lenting等人,Blood.92(11):3983-96(1998);Lenting等人,J.Thromb.Haemost.5(7):1353-60(2007)。在FVIII由于在重链中的位置372和740以及轻链中的位置1689的蛋白质水解而被激活时,从激活的FVIII去除结合至FVIII的VWF。
在某些实施方案中,所述异源部分是全长血管性血友病因子。在其他实施方案中,异源部分是血管性血友病因子片段。如本文所用,本文所用的术语“VWF片段(VWFfragment)”或“VWF片段(VWF fragments)”意指任何VWF片段,其与FVIII相互作用并保留通常由全长VWF提供给FVIII的至少一种或多种特性,所述特性例如防止过早激活为FVIIIa、防止过早蛋白质水解、防止可导致过早清除的与磷脂膜的缔合、防止与可以结合裸FVIII而不是VWF结合的FVIII的FVIII清除受体结合、和/或稳定FVIII重链和轻链相互作用。在一个具体实施方案中,所述异源部分是包含VWF的D'结构域和D3结构域的(VWF)片段。包含D'结构域和D3结构域的VWF片段还可以包含选自以下的VWF结构域:A1结构域、A2结构域、A3结构域、D1结构域、D2结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、其一个或多个片段及其任何组合。与VWF片段融合的具有FVIII活性的多肽的另外的例子披露于以下文献中:2012年7月3日提交的美国临时专利申请号61/667,901和美国公开号2015/0023959 A1,将这两篇文献均通过引用以其整体并入本文。
12.接头部分
在某些实施方案中,所述异源部分是肽接头。
如本文所用,术语“肽接头”或“接头部分”是指连接多肽链的线性氨基酸序列中的两个结构域的肽或多肽序列(例如,合成肽或多肽序列)。
在一些实施方案中,可以将编码肽接头的异源核苷酸序列插入本公开文本的优化的FVIII多核苷酸序列与编码例如上述异源部分之一(如白蛋白)的异源核苷酸序列之间。肽接头可以向嵌合多肽分子提供柔性。接头通常不被切割,但是可能需要这种切割。在一个实施方案中,这些接头在加工期间不被去除。
可以存在于本公开文本的嵌合蛋白中的接头类型是蛋白酶可切割的接头,其包含切割位点(即,蛋白酶切割位点底物,例如,因子XIa、Xa或凝血酶切割位点)并且其可以在切割位点的N末端侧或C末端侧或两侧上包括另外的接头。这些可切割接头在掺入本公开文本的构建体中时产生具有异源切割位点的嵌合分子。
在一个实施方案中,由本公开文本的核酸分子编码的FVIII多肽包含两个或更多个Fc结构域或部分,其通过cscFc接头连接以形成包含于单条多肽链中的Fc区。cscFc接头侧接有至少一个细胞内加工位点,即,由细胞内酶切割的位点。多肽在至少一个细胞内加工位点的切割产生包含至少两条多肽链的多肽。
其他肽接头可以任选地用于本公开文本的构建体中,例如以将FVIII蛋白与Fc区连接。可以结合本公开文本使用的一些示例性接头包括例如更详细地描述于下文中的包含GlySer氨基酸的多肽。
在一个实施方案中,所述肽接头是合成的,即非天然存在的。在一个实施方案中,肽接头包括包含氨基酸序列的肽(或多肽)(其可以是或可以不是天然存在的),所述氨基酸序列将第一线性氨基酸序列与第二线性氨基酸序列连接或遗传融合,第一线性氨基酸序列与第二线性氨基酸序列在自然界中并非天然地连接或遗传融合的。例如,在一个实施方案中,所述肽接头可以包含非天然存在的多肽,所述多肽是天然存在的多肽的修饰形式(例如,包含突变,如添加、取代或缺失)。在另一个实施方案中,所述肽接头可以包含非天然存在的氨基酸。在另一个实施方案中,所述肽接头可以包含存在于线性序列中的天然存在的氨基酸,所述线性序列在自然界中不存在。在另一个实施方案中,所述肽接头可以包含天然存在的多肽序列。
例如,在某些实施方案中,肽接头可以用于融合相同的Fc部分,由此形成同二聚scFc区。在其他实施方案中,肽接头可以用于融合不同的Fc部分(例如野生型Fc部分和Fc部分变体),由此形成异二聚scFc区。
在另一个实施方案中,肽接头包含gly-ser接头或由其组成。在一个实施方案中,scFc或cscFc接头包含免疫球蛋白铰链的至少一部分和gly-ser接头。如本文所用,术语“gly-ser接头”是指由甘氨酸和丝氨酸残基组成的肽。在某些实施方案中,可以将所述gly-ser接头插入肽接头的两个其他序列之间。在其他实施方案中,gly-ser接头附接于肽接头的另一序列的一端或两端。在又其他实施方案中,两个或更多个gly-ser接头串联掺入肽接头中。在一个实施方案中,本公开文本的肽接头包含上铰链区的至少一部分(例如,源自IgG1、IgG2、IgG3或IgG4分子)、中铰链区的至少一部分(例如,源自IgG1、IgG2、IgG3或IgG4分子)和一系列gly/ser氨基酸残基。
本公开文本的肽接头的长度为至少一个氨基酸并且可以具有变化的长度。在一个实施方案中,本公开文本的肽接头的长度为约1至约50个氨基酸。如在此上下文中所用,术语“约”指示+/-两个氨基酸残基。由于接头长度必须是正整数,长度为约1至约50个氨基酸的长度意指长度为1-3至48-52个氨基酸的长度。在另一个实施方案中,本公开文本的肽接头的长度为约10至约20个氨基酸。在另一个实施方案中,本公开文本的肽接头的长度为约15至约50个氨基酸。在另一个实施方案中,本公开文本的肽接头的长度为约20至约45个氨基酸。在另一个实施方案中,本公开文本的肽接头的长度为约15至约35或约20至约30个氨基酸。在另一个实施方案中,本公开文本的肽接头的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、500、1000、或2000个氨基酸。在一个实施方案中,本公开文本的肽接头的长度为20或30个氨基酸。
在一些实施方案中,所述肽接头可以包含至少2、至少3、至少4、至少5、至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、或至少100个氨基酸。在其他实施方案中,所述肽接头可以包含至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、或至少1,000个氨基酸。在一些实施方案中,所述肽接头可以包含至少约10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、或2000个氨基酸。所述肽接头可以包含1-5个氨基酸、1-10个氨基酸、1-20个氨基酸、10-50个氨基酸、50-100个氨基酸、100-200个氨基酸、200-300个氨基酸、300-400个氨基酸、400-500个氨基酸、500-600个氨基酸、600-700个氨基酸、700-800个氨基酸、800-900个氨基酸、或900-1000个氨基酸。
可以使用本领域中已知的技术将肽接头引入多肽序列中。可以通过DNA序列分析来确认修饰。可以使用质粒DNA转化宿主细胞用于稳定产生所产生的多肽。
I.单体-二聚体杂合物
在一些实施方案中,还包含异源核苷酸序列的本公开文本的分离的核酸分子编码包含FVIII的单体-二聚体杂合分子。
本文所用的术语“单体-二聚体杂合物”是指包含通过二硫键相互缔合的第一多肽链和第二多肽链的嵌合蛋白,其中所述第一链包含因子VIII和第一Fc区,并且第二链包含无FVIII的第二Fc区,基本上由无FVIII的第二Fc区组成,或由无FVIII的第二Fc区组成。因此,单体-二聚体杂合构建体是包含仅具有一种凝血因子的单体方面和具有两个Fc区的二聚体方面的杂合物。
J.表达控制元件
在一些实施方案中,本公开文本的核酸分子或载体还包含至少一个表达控制序列。如本文所用的表达控制序列是有利于与其可操作地连接的编码核酸的有效转录和翻译的任何调节核苷酸序列,如启动子序列或启动子-增强子组合。例如,本公开文本的分离的核酸分子可以与至少一个转录控制序列可操作地连接。
基因表达控制序列可以是例如哺乳动物或病毒启动子,如组成型或诱导型启动子。组成型哺乳动物启动子包括但不限于以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(HPRT)、腺苷脱氨酶、丙酮酸激酶、β-肌动蛋白启动子和其他组成型启动子。在真核细胞中组成性地发挥作用的示例性病毒启动子包括例如来自以下病毒的启动子:巨细胞病毒(CMV)、猿猴病毒(例如,SV40)、乳头瘤病毒、腺病毒、人免疫缺陷病毒(HIV)、劳斯肉瘤病毒、巨细胞病毒、莫洛尼白血病病毒的长末端重复序列(LTR)和其他逆转录病毒,以及单纯疱疹病毒的胸苷激酶启动子。
其他组成型启动子是本领域普通技术人员已知的。可用作本公开文本的基因表达序列的启动子还包括诱导型启动子。诱导型启动子在诱导剂的存在下表达。例如,在某些金属离子存在下诱导金属硫蛋白启动子以促进转录和翻译。其他诱导型启动子是本领域普通技术人员已知的。
在一个实施方案中,本公开文本包括在组织特异性启动子和/或增强子控制下的转基因表达。在另一个实施方案中,启动子或其他表达控制序列选择性增强转基因在肝细胞中的表达。肝特异性启动子的例子包括但不限于小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子和小鼠白蛋白启动子。在特定实施方案中,所述启动子包括mTTR启动子。mTTR启动子描述于以下文献中:R.H.Costa等人,1986,Mol.Cell.Biol.6:4697。F8启动子描述于以下文献中:Figueiredo和Brownlee,1995,J.Biol.Chem.270:11828-11838。
可以使用一种或多种增强子进一步增强表达水平以实现治疗功效。一种或多种增强子可以单独提供,或与一种或多种启动子元件一起提供。通常,表达控制序列包含多个增强子元件和组织特异性启动子。在一个实施方案中,增强子包含一个或多个拷贝的α-1-微球蛋白/比库宁蛋白(bikunin)增强子(Rouet等人,1992,J.Biol.Chem.267:20765-20773;Rouet等人,1995,Nucleic Acids Res.23:395-404;Rouet等人,1998,Biochem.J.334:577-584;Ill等人,1997,Blood Coagulation Fibrinolysis 8:S23-S30)。在另一个实施方案中,增强子源自肝特异性转录因子结合位点,如EBP、DBP、HNF1、HNF3、HNF4、HNF6和Enh1,包含HNF1、(有义)-HNF3、(有义)-HNF4、(反义)-HNF1、(反义)-HNF6、(有义)-EBP、(反义)-HNF4(反义)。
在一个特定例子中,可用于本公开文本的启动子包含SEQ ID NO:69(即,ET启动子;图11Y),其也被称为GenBank编号AY661265。还参见Vigna等人,Molecular Therapy 11(5):763(2005)。其他合适的载体和基因调节元件的例子描述于以下文献中:WO 02/092134、EP1395293或美国专利号6,808,905、7,745,179或7,179,903,将所述文献通过引用以其整体并入本文。
一般而言,表达控制序列应视需要包括分别参与转录和翻译起始的5'非转录序列和5'非翻译序列,如TATA盒、加帽序列、CAAT序列等。特别地,此类5'非转录序列将包括启动子区,所述启动子区包括用于对可操作连接的编码核酸进行转录控制的启动子序列。基因表达序列视需要任选地包括增强子序列或上游激活子序列。
VI.药物组合物
含有本文公开的慢病毒基因疗法载体或本公开文本的宿主细胞(例如,本文公开的慢病毒基因疗法载体所靶向的肝细胞)的组合物可以含有合适的药学上可接受的载体。例如,所述组合物可以含有有利于将活性化合物加工为设计用于递送至作用位点的制剂的赋形剂和/或助剂。
可以将药物组合物配制用于通过推注注射进行肠胃外给予(即静脉内、皮下或肌内)。注射用配制品可以以单位剂型存在,例如在添加有防腐剂的安瓿中或多剂量容器中存在。组合物可以采取例如于油性或水性媒介物中的悬浮液、溶液或乳液的形式,并且含有配制剂,如悬浮剂、稳定剂和/或分散剂。可替代地,活性成分可以呈粉末形式,用于用合适的媒介物(例如,无热原水)构造。
用于肠胃外给予的合适的配制品还包括呈水溶性形式(例如,水溶性盐)的活性化合物的水溶液。另外,可以给予作为适当油性注射悬浮液的活性化合物的悬浮液。合适的亲脂溶剂或媒介物包括脂肪油(例如,芝麻油)或合成脂肪酸酯(例如,油酸乙酯或甘油三酯)。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和葡聚糖。任选地,悬浮液还可以含有稳定剂。脂质体还可以用于包封本公开文本的分子,用于递送至细胞或间质空间中。示例性药学上可接受的载体是生理上相容的溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗和吸收延迟剂、水、盐水、磷酸盐缓冲盐水、右旋糖、甘油、乙醇等。在一些实施方案中,所述组合物包含等渗剂,例如,糖、多元醇(如甘露醇、山梨醇)或氯化钠。在其他实施方案中,所述组合物包含增强活性成分的贮存期限或有效性的药学上可接受的物质(如润湿剂)或少量辅助物质(如润湿剂或乳化剂、防腐剂或缓冲剂)。
本公开文本的组合物可以呈多种形式,包括例如液体(例如,可注射和可输注的溶液)、分散液、悬浮液、半固体和固体剂型。优选形式取决于给予方式和治疗应用。
可以将组合物配制为溶液、微乳液、分散液、脂质体或适于高药物浓度的其他有序结构。无菌可注射溶液可以通过以下方式制备:将活性成分以所需量掺入视需要具有上文所列举成分中的一种或组合的适当溶剂中,之后过滤灭菌。通常,分散液是通过以下方式来制备:将活性成分掺入无菌媒介物中,所述媒介物含有基础分散介质和来自上文所列举的那些成分的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选制备方法是真空干燥和冷冻干燥,从而从预先无菌过滤的溶液产生活性成分加上任何其他所需成分的粉末。可以例如通过以下方式维持溶液的适当流动性:使用包衣如卵磷脂,在分散液情况下维持所需粒径,以及使用表面活性剂。可注射组合物的延长吸收可以通过以下方式来实现:在组合物中包括延迟吸收的试剂,例如,单硬脂酸盐和明胶。
活性成分可以用控制释放配制品或装置来配制。此类配制品和装置的例子包括植入物、经皮贴剂和微包封递送系统。可以使用生物可降解的生物相容性聚合物,例如,乙烯基乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。制备此类配制品和装置的方法是本领域已知的。参见例如,Sustained and Controlled Release Drug Delivery Systems,J.R.Robinson编辑,Marcel Dekker,Inc.,纽约,1978。
可注射长效配制品可以通过以下方式来制备:形成药物于生物可降解聚合物(如聚丙交酯-聚乙交酯)中的微包封基质。根据药物与聚合物的比率以及所采用聚合物的性质,可以控制药物释放的速率。其他示例性生物可降解聚合物是聚原酸酯和聚酐。可注射长效配制品还可以通过将药物捕集于脂质体或微乳液中来制备。
可以将补充性活性化合物掺入组合物中。在一个实施方案中,用另一种凝血因子或其变体、片段、类似物或衍生物配制本公开文本的嵌合蛋白。例如,凝血因子包括但不限于因子V、因子VII、因子VIII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原、纤维蛋白原、血管性血友病因子或重组可溶性组织因子(rsTF)或前述任一种的激活形式。止血剂的凝血因子还可以包括抗溶纤维蛋白药,例如ε-氨基己酸、氨甲环酸。
可以调整剂量方案以提供最佳所需反应。例如,可以给予单次推注,可以随时间给予若干次分开剂量,或者可以如治疗情况的紧迫性所示成比例地减少或增加剂量。有利的是以剂量单位形式配制肠胃外组合物,以便于剂量的给予和一致性。参见例如,Remington's Pharmaceutical Sciences(Mack Pub.Co.,宾夕法尼亚州伊斯顿市,1980)。
除了活性化合物以外,液体剂型还可以含有惰性成分,如水、乙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油、甘油、四氢糠醇、聚乙二醇和山梨聚糖的脂肪酸酯。
合适的药物载体的非限制性例子还描述于E.W.Martin的Remington'sPharmaceutical Sciences中。赋形剂的一些例子包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、稻米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、二醇、水、乙醇等。所述组合物还可以含有pH缓冲试剂以及润湿或乳化剂。
对于口服给予,所述药物组合物可以采取通过常规手段制备的片剂或胶囊的形式。还可以将组合物制备为液体,例如糖浆剂或悬浮液。液体可以包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒介物(例如,扁桃仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可以包括矫味剂、着色剂和甜味剂。可替代地,所述组合物可以作为干产物存在,用于用水或另一种合适的媒介物来构造。
对于经颊给予,所述组合物可以采取根据常规方案的片剂或锭剂的形式。
对于通过吸入给予,根据本公开文本使用的化合物便捷地以含有或不含赋形剂的雾化气溶胶的形式或以气溶胶喷雾剂的形式从任选地具有推进剂的加压包或雾化器递送,所述推进剂是例如二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他合适的气体。在加压气溶胶的情况下,剂量单位可以通过提供阀以递送计量量来确定。例如用于吸入器或吹入器中的明胶的胶囊和药筒可以经配制含有化合物与合适的粉末基质如乳糖或淀粉的粉末混合物。
还可以将药物组合物配制为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂用于直肠给予。
在一个实施方案中,所述药物组合物包含慢病毒载体和药学上可接受的载体,所述慢病毒载体包含优化的编码具有因子VIII活性的多肽的核酸分子。在另一个实施方案中,所述药物组合物包含宿主细胞(例如,肝细胞)和药学上可接受的载体,所述宿主细胞包含慢病毒载体,所述慢病毒载体包含优化的编码具有因子VIII活性的多肽的核酸分子。
在一些实施方案中,所述组合物是通过选自以下的途径来给予:局部给予、眼内给予、肠胃外给予、鞘内给予、硬膜下给予和口服给予。肠胃外给予可以是静脉内或皮下给予。
在其他实施方案中,所述组合物用于治疗有需要的受试者的出血性疾病或病症。所述出血性疾病或病症选自出血性凝固障碍、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血症、腹内出血症、胸腔内出血症、骨折、中枢神经系统出血、咽喉间隙出血、腹膜后间隙出血、髂腰肌鞘出血和其他任何组合。在仍其他实施方案中,所述受试者被排定进行手术。在又其他实施方案中,所述治疗是预防性的或按需的。
本文所述的所有各个方面、实施方案和选择都可以以任何和所有变化组合。
本说明书中所提到的所有出版物、专利和专利申请都通过引用并入本文,并入程度如同明确且单独地指示每个单独出版物、专利或专利申请通过引用并入一般。
已经概括描述了本公开文本,通过参考本文所提供的实施例可以获得进一步的理解。这些实施例仅用于说明的目的,而不旨在加以限制。
实施例
实施例1.密码子优化策略
通过控制密码子使用偏好产生八种经密码子优化的BDD FVIII变体,包括coFVIII-3(SEQ ID NO:1;图1A)、coFVIII-4(SEQ ID NO:2;图1B)、coFVIII-5(SEQ ID NO:70;图1C)、coFVIII-6(SEQ ID NO:71;图1D)、coFVIII-52(SEQ ID NO:3;图1E)、coFVIII-62(SEQ ID NO:4;图1F)、coFVIII-25(SEQ ID NO:5;图1G)、和coFVIII-26(SEQ ID NO:6;图1H)。如先前所述(参见Gaspar等人,“EuGene:maximizing synthetic gene design forheterologous expression,”Bioinformatics 28:2683-84(2012))使用在线工具Eugene促使密码子优化,并且监测若干个密码子使用度参数,如密码子适应指数(CAI)和相对同义密码子使用度(RSCU)(表5)。将所有变体都调整为CAI≥83%且RSCU≥1.63,同时亲代B结构域缺失的FVIII序列在优化前的CAI为74%且RSCU为1.12(表5)。
表5:密码子优化参数
Figure BDA0002701601960001141
Figure BDA0002701601960001151
除了CAI的总体增加以外,基于相对于未优化的BDD FVIII序列(图2A),CAI在编码区中的分布(如图2所示),将八种变体设计为三个类别。第一类别包括在整个编码区中具有均匀的高CAI分布的BDD FVIII变体(参见图2C-图2F)。第一类别包括coFVIII-3(图2C)、coFVIII-4(图2D)、coFVIII-5(图2E)、coFVIII-6(图2F),以及先前所述的coFVIII-1(参见国际公开号WO2014/127215(SEQ ID NO:1))(图2B)。第二类别包括在编码序列的N末端部分具有较低CAI并且在编码序列的C末端部分具有较高CAI的BDD-FVIII变体(参见图2G和图2H)。第二类别包括coFVIII-52(图2G)和coFVIII-62(图2H)。第三类别包括在编码序列的N末端部分具有较高CAI并且在编码序列的C末端部分具有较低CAI的BDD FVIII变体(参见图2I和图2J)。第三类别包括coFVIII-25(图2I)和coFVIII-26(图2J)。
在不受任何理论束缚的情况下,推测较高的CAI可能与较快的蛋白质翻译相关,并且这三个类别可能表示蛋白质合成从开始到结束的不同速率。例如,相对于具有较高CAI的区域的翻译,具有较低CAI的区域的翻译可能进行缓慢。如果是这样的话,那么例如coFVIII-52或coFVIII-62中具有较低CAI的N末端部分可能最初进行缓慢,接着具有较高CAI的C末端部分更快地翻译。这在不减慢总体蛋白质合成的情况下,对于翻译期间的蛋白质折叠和翻译后修饰可能是优选的。对于coFVIII-25和coFVIII-26变体可能观察到相反的作用,它们在N末端部分具有较高CAI并且在C末端部分具有较低CAI。
为了确保mRNA的稳定性,调整所有经密码子优化的FVIII变体以避开多个位点,包括隐蔽剪接位点、过早多聚A位点、RNA不稳定性基序(ARE)和重复序列,并且调整GC含量(参见表2)。
实施例2.来自pcDNA3质粒的coFVIII变体的克隆和表达
设计含有各种FVIII变体的表达质粒用于体内表达。将未优化的BDD FVIII(图1I;SEQ ID NO:16)和coFVIII-1(图11Z;SEQ ID NO:68)多核苷酸克隆至pcDNA3骨架(Invitrogen)中,其中用ET启动子替代CMV启动子(参见图3)。所得质粒FVIII-311(BDDFVIII)和FVIII-303(coFVIII-1)分别驱动未优化的BDD FVIII和coFVIII-1的表达。
在Hem A小鼠中通过流体动力学注射5μg DNA/小鼠的FVIII-303或FVIII-311来评价FVIII-311和FVIII-303的体内表达。在注射后24、48和72小时收集血浆样品,并且通过FVIII特异性生色测定来确定FVIII活性。
如图4中所示,在注射后72小时,用FVIII-311治疗的小鼠的血浆FVIII活性(BDDFVIII;正方形)为74±43mU/mL,而在注射后72小时,用FVIII-303治疗的小鼠的血浆FVIII活性(coFVIII-1;圆形)为452±170mU/mL(图4)。这表示coFVIII-1的表达相对于未优化的BDD FVIII增加了大约六倍。
实施例3.使用慢病毒载体系统克隆并表达coFVIII变体
为了进一步评估经密码子优化的BDD FVIII变体的表达水平,将编码序列克隆至在ET启动子控制下的慢病毒质粒中(参见Amendola等人,“Coordinate dual-genetransgenesis by lentiviral vectors carrying synthetic bidirectionalpromoters,”Nature Biol.23:108-16(2005);国际公开号WO 2000/066759 A1)。pLV-coFVIII-52的质粒图谱显示于图5中;并且以相同的方式构建含有未优化的BDD FVIII(LV-2116)、coFVIII-1(LV-coFVIII-1)、coFVIII-3(LV-coFVIII-3)、coFVIII-4(LV-coFVIII-4)、coFVIII-5(LV-coFVIII-5)、和coFVIII-6(LV-coFVIII-6)、coFVIII-62(LV-coFVIII-62)、coFVIII-25(LV-coFVIII-25)、和coFVIII-26(LV-coFVIII-26)的质粒,但是由使用NheI和SalI位点的每个所指示的编码序列替代coFVIII-52片段(表6)。
表6:编码FVIII变体的表达质粒
Figure BDA0002701601960001161
Figure BDA0002701601960001171
通过以5μg DNA/小鼠(图6A、图6B)或20μg DNA/小鼠(图6C)的剂量进行流体动力学注射在HemA小鼠中评价慢病毒的经密码子优化的FVIII变体。如图6中所示,coFVIII-3(图6A;三角形)、coFVIII-4(图6A;倒三角形)、coFVIII-5(图6A;菱形)、coFVIII-6(图6A;空心圆形)、coFVIII-25(图6B;三角形)、coFVIII-26(图6B;倒三角形)、coFVIII-52(图6C;正方形)、和coFVIII-62(图6C;实心圆形)中的每一个均展现高于coFVIII-1(图6A,圆形;图6B,圆形;和图6C,三角形)的FVIII活性。特别地,coFVIII-25和coFVIII-26在注射后72小时展现类似的表达水平,达到比coFVIII-1的活性高约3倍的活性(图6B),这转换为与未优化的亲代BDD FVIII相比高24倍的FVIII活性(参见图4)。coFVIII-52(正方形)和coFVIII-62(实心圆形)二者在注射后72小时均实现了甚至更高的表达,从而展现比coFVIII-1(三角形)分别高6倍和高4倍的表达,以及比未优化的亲代BDD FVIII(空心圆形)分别高50倍和高30倍的表达(图6C)。这些数据指示,与相反的CAI分布相比,在编码序列的N末端部分的较低CAI与在编码序列的C末端部分的较高CAI的组合可能对于FVIII表达更有益。
实施例4:经密码子优化的FVIII变体在HemA小鼠中的长期慢病毒表达
评价了被鉴定为在流体动力学注射后72小时驱动FVIII在HemA小鼠中的高表达的变体通过慢病毒载体介导的基因转移进行的长期FVIII表达。通过瞬时转染在293T细胞中产生慢病毒载体,并将其通过超速离心浓缩至约5E9TU/ml。然后通过眼眶后注射以1E8TU/小鼠的剂量将慢病毒载体给予至12-14日龄HemA小鼠中。对于注射LV-2116的小鼠,在慢病毒注射后21天,平均血浆FVIII活性为约0.04IU/ml(BDD FVIII;图7)。相对于LV-2116(未优化的B结构域缺失的FVIII)对照,在注射后21天,coFVIII-1、coFVIII-5、coFVIII-52、coFVIII-6和coFVIII-62中的每一个均导致较高的循环FVIII水平。特别地,在注射后21天,coFVIII-1和coFVIII-5注射产生约1.8IU/mL的FVIII血浆活性水平,coFVIII-52产生约4.9IU/mL的FVIII血浆活性水平,coFVIII-6产生约4.6IU/mL的FVIII血浆活性水平,并且coFVIII-62产生约2.5IU/mL的FVIII血浆活性水平(图7)。在注射LV-coFVIII-6和LV-coFVIII-52的小鼠中观察到的FVIII血浆水平(分别为4.6IU/ml和4.9IU/ml)比在注射LV-2116(未优化的BDD-FVIII)对照的小鼠中观察到的血浆水平高超过100倍。
实施例5.coFVIII-XTEN融合构建体
测试XTEN改进稳态FVIII表达的能力。首先,将144个氨基酸的XTEN的编码序列("XTEN144";SEQ ID NO:18)分别插入coFVIII-52和coFVIII-1的核苷酸1193处(或在所编码多肽的前764个氨基酸之后),以产生coFVIII-52-XTEN(图8A;SEQ ID NO:19)和coFVIII-1-XTEN(图8B;SEQ ID NO:20)。然后如上所述将coFVIII-1-XTEN序列克隆至在ET启动子控制下的pcDNA3骨架(Invitrogen)中,以产生FVIII-306表达质粒;并且如上文所公开将coFVIII-52-XTEN序列克隆至在ET启动子控制下的慢病毒质粒中,以产生pLV-coFVIII-52-XTEN(图9)。将FVIII-306(coFVIII-1-XTEN)以5μg DNA/小鼠通过流体动力学注射给予至HemA小鼠。与FVIII-303(coFVIII-1;图10A,小圆形)和FVIII-311(BDD FVIII;图10A,正方形)相比,在注射后72小时,在HemA小鼠中XTEN144与coFVIII-1的融合物(FVIII-306;图10A,大圆形)导致分别高约5倍和33倍的FVIII表达。还使用慢病毒载体在HemA小鼠中评价XTEN插入对FVIII表达的作用(图10B)。将LV-coFVIII-52-XTEN以1E8TU/小鼠通过眼眶后注射给予至12-14日龄HemA小鼠。与LV-coFVIII52和LV-2116(BDD-FVIII)相比,在注射后21天,在HemA小鼠中XTEN144与coFVIII-52的融合物(图10B)导致分别高约4倍和450倍的FVIII表达。
将如上所述制备包含与XTEN144融合且与ET启动子融合的coFVIII-3、co-FVIII-4、coFVIII-5、coFVIII-6、coFVIII-62、coFVIII-25和coFVIII-26中的每一种的慢病毒载体。将测试载体的FVIII蛋白表达。
实施例6.coFVIII构建体的表达
如图9中所示,通过标准分子克隆技术将经密码子优化的FVIII变体克隆至慢病毒质粒中。然后通过瞬时转染在HEK293细胞中产生慢病毒载体并将其通过超速离心进行分离。
将FVIII慢病毒载体通过静脉内注射以1.5E10TU/kg LV-FVIII变体的剂量给予至14日龄HemA小鼠幼鼠。在LV-FVIII治疗后21天测量FVIII血浆活性,并且在LV-FVIII治疗后第150天在从LV-FVIII治疗的动物收集的肝尸检样品中测量每个细胞的载体拷贝数(VCN)。虽然不管给予何种LV-FVIII变体,所有动物中的VCN值相似(图12B),但是用coFVIII变体治疗的动物中的FVIII活性水平比用wtBDD-FVIII治疗的动物中的FVIII活性水平高30至100倍(图12A和图12C;表7)。这些数据指示,FVIII密码子优化改进慢病毒载体环境中的FVIII表达。
表7:经密码子优化的FVIII构建体的相对表达
Figure BDA0002701601960001191
实施例7.在慢病毒治疗后在HemA小鼠中的FVIII转基因表达介导的免疫应答
评价实施例6中LV-FVIII治疗的小鼠的长期FVIII表达和抗FVIII抗体形成。如通过FVIII血浆活性所证明的FVIII表达在同一治疗组内的动物之间变化(图13A)。例如,用表达coFVIII-5变体的慢病毒载体治疗的三只小鼠(命名为1、2和3)在大约16周内显示一致的FVIII表达,而用相同慢病毒载体治疗的三只同窝出生仔畜(命名为4、5和6)截至治疗后约10周显示FVIII血浆活性水平急剧下降(图13A)。在小鼠1、2和3中观察到的一致的FVIII血浆活性与不可检测或极低的抗FVIII抗体水平相关(图13B;小鼠1、2和3)。相反,展现FVIII血浆活性急剧下降的小鼠还展现增加的抗FVIII抗体水平(图13B;小鼠4、5和6)。这些数据表明,FVIII转基因表达在动物亚组中诱导抗FVIII抗体形成,并且所得抗FVIII抗体从循环消除转基因FVIII蛋白。
评估FVIII表达与抗FVIII抗体形成之间的关系。将实施例6的LV-FVIII治疗的小鼠分为两组:呈抗FVIII抗体阴性的小鼠和呈抗FVIII抗体阳性的小鼠。如图14中所示,生理水平的转基因FVIII表达不诱导针对转基因FVIII的免疫应答(图14,圆形)。然而,超生理水平的FVIII表达显现出诱导抗FVIII抗体形成,使得FVIII表达水平越高,抗FVIII抗体诱导的可能性越大。这些数据表明,在经受FVIII基因疗法治疗的患者中维持生理水平的FVIII表达可能是有益的。
为了确定FVIII表达诱导的免疫应答是否导致表达转基因的肝细胞的损失,在来自抗FVIII抗体阳性和阴性小鼠的肝尸检样品中评价载体拷贝数(图15)和FVIII RNA转录水平(图16)。如图15中所示,载体拷贝数的分布在抗FVIII抗体阳性和阴性小鼠中相同,这指示尽管产生了抗FVIII抗体,但具有LV-FVIII整合的细胞得以维持。这表明,LV-FVIII介导的FVIII转基因表达不会诱导针对表达FVIII的肝细胞的细胞毒性T淋巴细胞(CTL)应答。为了进一步确认这些结果,通过RNA原位杂交评估FVIII RNA转录(图16C和图16D)。在收获肝时,小鼠coFVIII-52-B不具有可检测的循环FVIII并且具有高水平的抗FVIII抗体(图16A和图16B)。然而,来自coFVIII-52-B小鼠的肝组织中的RNA转录信号和FVIII-RNA阳性细胞的数量与FVIII-52-A小鼠是可比较的,所述FVIII-52-A小鼠在尸检时具有约4IU/ml的循环FVIII。因此,FVIII表达未在实验HemA小鼠中诱导CTL应答。
实施例8.LV-FVIII治疗的HemA新生小鼠中的FVIII长期表达
为了评估使用慢病毒系统通过靶向肝治疗儿科HemA患者的功效,通过颞静脉注射向2日龄HemA小鼠给予约1.5E10TU/kg的LV-coFVIII-52XTEN、LV-coFVIII6-XTEN或表达wtBDD-FVIII的慢病毒载体。针对两种变体和对照观察到一致的长期FVIII表达,这证实在所治疗小鼠的分裂肝细胞中维持整合的FVIII表达级联(图17)。这些数据表明,LV-FVIII可能潜在地用于治疗儿科和成年HemA患者二者。
实施例9.对HemA新生小鼠中的LV-FVIII的评价
使用慢病毒载体(LV)的离体基因疗法进行基因替代对于多种适应症具有已证实的临床功效,并且在所治疗患者的多年随访中未显示肿瘤发生的证据。全身性递送的LV-FIX介导持久的FIX表达并且在血友病动物模型中耐受良好。在临床前和临床环境中显示的大包装容量、通过基因整合维持长期转基因表达的能力、在人群中缺少预先存在的抗LV抗体(ab)以及有利的体内分布图(profile)使LV成为有前景的用于体内基因递送(特别是用于具有大cDNA尺寸的基因候选物如FVIII)的媒介物。
为了评价LV-FVIII用于治疗血友病A(HemA)的潜在用途,将置于肝细胞特异性启动子下的经密码子优化的人FVIII(hFVIII)变体构建至含有微小RNA-142靶序列的多个拷贝的LV系统中,以使抗原呈递细胞中的FVIII表达最小化并降低诱导抗FVIII抗体的概率。LV-hFVIII载体是通过瞬时转染293T细胞,接着通过超速离心浓缩1000倍来产生的,并将其在HemA小鼠模型中进行评价。在静脉内给予LV-hFVIII后,通过FVIII活性和抗原测定监测循环hFVIII水平,通过经由定量PCR测量LV DNA拷贝和经由原位杂交测量转基因RNA来评估肝中的LV转导效率,通过总抗hFVIII抗体ELISA测量抗hFVIII抗体。
在新生儿期治疗的HemA小鼠中针对所有LV-hFVIII变体观察到持久FVIII表达。在1.5E10转导单位/kg剂量下,编码经密码子优化的hFVIII的LV(LV-cohFVIII)产生比编码野生型hFVIII的LV高30至100倍的循环FVIII(图12C),而肝细胞中的载体拷贝数和FVIII RNA阳性细胞的百分比在所测试的所有组中是可比较的(图12B)。密码子优化与XTEN(一种可能通过增加有效负载的流体动力学尺寸改进循环半衰期的非结构化亲水性多肽)的组合(LV-cohFVIII-XTEN)在血浆中产生30-50IU/mL FVIII活性,这表示正常循环FVIII水平的3,000%至5,000%(图12A、图17)。此外,仅在具有超生理水平的hFVIII的小鼠中检测到抗hFVIII ab(图14),但是在抗hFVIII抗体阳性小鼠中没有观察到针对LV转导的细胞的细胞毒性T淋巴细胞应答(图15和图16A-图16D)。我们的结果支持进一步开发LV-FVIII用于血友病A的体内基因疗法。
实施例10:HemA小鼠中的LV-FVIII治疗的剂量反应
为了确定HemA小鼠中LV-FVIII治疗的剂量反应,通过眼眶后注射以以下四个剂量水平用LV-coFVIII-6或LV-coFVIII-6-XTEN治疗12-14日龄HemA幼鼠:1.3x1010TU/kg、4.5x109TU/kg、1.5x109TU/kg和8.3x108TU/kg。
通过FVIII生色测定测量所治疗小鼠中LV-FVIII介导的FVIII表达水平,并且在图18A(LV-coFVIII-6)和图18B(LV-coFVIII-6-XTEN)中标绘FVIII表达水平峰值。
在LV-FVIII治疗后,1.3E10TU/kg、4.5x109TU/kg、1.5x109TU/kg和8.3x108TU/kg治疗组的平均FVIII表达水平峰值对于LV-coFVIII-6分别为正常值的882%、662%、15%和12%;对于LV-coFVIII-6-XTEN分别为正常值的1793%、431%、10%和10%。
对于当前的FVIII替代疗法,用于FVIII预防的目标谷水平在正常值的1%-3%之间,其为患有血友病A的患者提供重要保护。在所测试的最低LV-FVIII剂量8.3x108TU/kg下,LV-coFVIII-6和LV-coFVIII-6-XTEN治疗二者均在HemA小鼠中产生正常循环FVIII的≥10%,这表明1x109TU/kg LV-FVIII治疗对于血友病A患者可能具有潜在治疗益处。
实施例11:在猪尾猕猴(Pigtail Macaque)中两种慢病毒载体的探索性单一剂量IV输注研究
1.目的:该研究的目标是分别确定慢病毒载体(LV)因子VIII基因疗法在猪尾猕猴中用于治疗血友病A的剂量/反应关系。
2.测试系统和论证:猪尾猕猴(豚尾猕猴(M.nemestrina)),首次用于实验的雄性,1至5岁,2至5kg。猪尾猕猴是本LV基因疗法剂量/反应研究的适当药理学活性模型。此时,需要在实验室动物中进行研究以支持监管申请(regulatory submission),并且认为低级物种不是研究LV剂量反应关系的可行模型。要使用的动物数量是得到有意义的结果所需的最小数量。
3.动物护理、居住和环境条件:用于动物护理和居住的通用程序将符合AAALAC国际建议、在“实验室动物的护理和使用指南(Guide for Care and Use of LaboratoryAnimals)”(国家研究委员会(National Research Council),现行版)中所述的现行要求、如美国农业部(U.S.Department of Agriculture)经由动物福利法案(Animal WelfareAct)的要求所述的现行要求(修订版),并且将遵照测试设备SOP。在研究启动前,研究设计由机构动物护理和应用委员会(Institutional Animal Care and Use Committee,IACUC)进行审查和批准。
3.1检疫和适应:将对NHP进行检疫和适应。将对所有动物进行粪便检查、TB测试、体格检查和临床病理学健康筛选(仅血液学和血清化学),以确保将仅对健康的NHP给药。在检疫期间,还将对动物进行两次抽血,相隔大约1周。
将在含有柠檬酸钠的一个或多个管中收集具有约4mL目标体积的全血样品,并将其置于湿冰上直至离心。根据体积,将血浆分割为约500μL/等分试样的4个等分试样的靶标,并且立即在液氮上冷冻。将在不含抗凝剂但是可能含有血清分离凝胶的管(SST管)中收集具有约1mL目标体积的全血样品。将允许SST管在室温下凝块至少30分钟,然后将其离心以获得大约300μL血清(根据体积)的靶标。一旦分离血清,立即将其在干冰上冷冻。将所有管在1300相对离心力(RCF)的设定下离心至少10分钟。将在冷冻的离心机组中将柠檬酸钠管加工至4℃的温度,并将在离心机组中将SST管加工至室温,并且将在加工后将所有样品在冷冻器组中冷冻以维持-85℃至-60℃直至运输用于分析。
在开始给药之前,将使NHP习惯于约束椅。将使NHP逐渐适应至少3个事件以接受长达连续1小时的椅约束。注意,超出1小时后,动物可以在椅中另外持续长达20分钟,以允许有足够长的时间使其返回其居住笼。
3.2动物居住和环境条件:在研究期间,NHP将两只一组或三只一组居住。在研究期间,如果发生事件(明显的临床体征、同笼动物的严重侵犯等)使得有正当理由分开,则NHP可以单独居住。单独居住的任何动物可以接受由我们的兽医工作人员决定的增强的富集。
将设定研究室的温度和湿度范围以分别维持64至84°F和50%±20%。将设定光照循环以维持12小时开灯/12小时关灯。每年至少两次由外聘顾问监测换气和增压读数,以确保环境控制提供最少每小时10次新鲜空气换气。
3.3.饲喂:将每天两次向猴子饲喂PMI认证的灵长类动物饮食5048,但是在指定的禁食期间或者在动物离开其居住笼进行研究事件(例如,在被置于约束椅中进行剂量给予和血液采集时)时除外。还将向饮食中补充新鲜水果和/或新鲜蔬菜和/或补充剂。
制造商将提供每个批次的PMI认证的灵长类动物饮食的分析报告。将审查分析报告以确保可接受的标准和免于可能干扰研究的目的或进行的污染物水平。将在测试设备记录中保留分析结果。饮食补充剂无需分析。
3.4水:动物将经由自动补水系统随意获得来自West Jefferson市政供水的淡水,但是在约束期间(例如,在血液采集、椅适应和给药等期间)除外。
定期分析供水以确保可接受的标准和免于可能干扰研究的目的或进行的污染物水平。将在测试设备记录中保留结果。
4.测试品和对照品:
表8:对照LV因子VIII
Figure BDA0002701601960001241
4.3测试品和对照品组分的保留样品:因为持续时间超过4周,所以将从该研究中的每个测试品取目标1mL用于存档的保留样品。
4.4未使用的散装(bulk)测试品的处置:任何未使用的配制的测试品可以被保留用于未来的研究,被运输至赞助商的委托实验室,进行处置或者返回。
4.5配制品制备、操作和储存:测试品将准备好使用配制品。在该研究中将不存在配制品制备。
4.6配制品分析和稳定性:对于该研究将不进行配制品分析或稳定性。
5.实验设计
5.1组分配和标识:在组分配前,将通过动物的纹身来标识动物。要用于给药的动物将基于体重数据将使用分层随机化程序(Provantis)来随机分配。
在分配至剂量组后,将向每只动物分配在研究内唯一的动物标识号并且用笼牌标识。每个笼牌将含有信息,所述信息包括但不限于研究编号、组分配和动物标识号。将使用纹身来匹配笼牌上的研究动物编号。
5.2剂量给予:将在每只动物各自的第1天给药之前向动物给予(经由缓慢推注注射)前驱用药方案,如下:
表9
Figure BDA0002701601960001242
Figure BDA0002701601960001251
a.第2组将与第1组错开20天开始,并且第3组将与第1组错开10天开始。
b.将地塞米松(4mg/mL)作为缓慢推注注射(约1-2min)基于最近的体重以0.075mL/kg的剂量体积来给予。
c.将苯海拉明(50mg/mL)作为缓慢推注注射(约1-2min)基于最近的体重以0.07mL/kg的剂量体积来给予。
将以以下目标剂量水平中的每一水平向动物给予测试品。
表10
Figure BDA0002701601960001252
a.给予每个NHP的实际剂量体积(mL/kg)将基于该动物最近的体重。
b.TBD-有待确定,通过修正添加
c.TU-转导单位,并且是对多少病毒可以感染细胞的测量。
每只动物将在头部或隐静脉血管中插入导管,并使用注射泵(例如KDS220或等效物)以其各自剂量水平接受一次静脉内剂量(以1mL/分钟为目标),接着接受0.9%氯化钠溶液的0.4至0.8mL冲洗。冲洗时间将被视为剂量时间的结束。
5.3临床观察:将对所有动物进行死亡率和/或垂死率(moribundity)的观察,在接收当天和尸检当天进行至少一次,并且在此后7天(一周)在检疫、适应和研究期间每天进行两次。
从接收动物起并且持续到寿命的最后一天,将每天进行至少一次笼侧临床观察,但是在每个给药日,将在给药前进行最少一次笼侧临床观察,并且在给药后2小时(+/-15分钟)进行至少一次。
5.4体重:将记录所有动物的单独体重,在检疫期间进行至少一次,并且在动物选择以供组分配之前(第-1周)进行一次,将在第1天、第8天、第15天、第22天、第29天、第36天、第43天、第50天和第53天记录体重。将使用针对每个各自的组在第1天记录的体重进行用于给药的剂量体积确定。
5.5临床病理学:将根据下文的时间表收集用于临床病理学(血液学、临床化学和凝固)评价的样本。所有NHP在每个收集间隔前将禁食过夜。
表11
Figure BDA0002701601960001253
Figure BDA0002701601960001261
将从股骨血管或其他合适的末梢血管收集用于血液学、临床化学和凝固评价的血液(以1.5至3.0mL/样品为目标)。注意,可以调整血液体积以适应IACUC指南。用于血液学的管将含有K3EDTA作为抗凝剂。用于血清化学确定的管将不含抗凝剂,但是可以含有血清分离凝胶。用于凝固的管将含有柠檬酸钠作为抗凝剂。
在需要时,如果可能的话,可以收集来自垂死动物的血液用于临床病理学评价。最终报告中将包括临床病理学结果和临床病理学家的报告。
5.5.1血液学:要评价的血液学参数是:
表12
Figure BDA0002701601960001262
将在分析后丢弃血液学样本(残余血液)。
5.5.2临床化学:要评价的临床化学参数是:
表13
Figure BDA0002701601960001263
将在研究结束之前丢弃分析后的残余血清。
5.5.3凝固:要评价的凝固参数是:
表14
Figure BDA0002701601960001264
将在分析后丢弃凝固样本(残余血液)。
5.6生物分析学分析和药代动力学评价
5.6.1血液样本收集:将根据下文的时间表收集用于生物分析学分析的血液样品并加工为血浆和血清。将收集至第8天的血浆和血清样品运输至第4.3节中所列的PI,其中将从血浆确定因子VIII的表达,并且可以从血浆和血清确定潜在细胞因子评价。
(i)禁食要求:除非与其他程序的禁食同时进行,否则动物在血液收集之前不会禁食。
(ii)将在含有柠檬酸钠的管中收集具有约1mL的目标体积的全血样品并将其置于湿冰上直至离心。根据体积,将血浆分割为约100μL/等分试样的4个等分试样的靶标,并且立即在液氮上冷冻,然后储存在冷冻器组中以维持-85℃至-60℃直至运输以供分析。
(iii)将在不含抗凝剂但是可能含有血清分离凝胶的管(SST管)中收集具有约1mL目标体积的全血样品。将允许管在室温下凝块至少30分钟,然后将其离心以获得含有大约200μL血清(根据体积)的2个等分试样的靶标。一旦分离血清,立即将其在干冰上冷冻,然后储存在冷冻器组中以维持-85℃至-60℃直至运输以供分析。
(iv)将所有管在1300相对离心力(RCF)的设定下离心至少10分钟。将在冷冻的离心机组中将柠檬酸钠管加工至4℃的温度,并且将在离心机组中将SST管加工至室温。
(v)收集部位:股骨血管或另一个合适的血管。
(vi)最终储存:冷冻(-85℃至-60℃)
表15
Figure BDA0002701601960001271
a.第2组和第3组的第-2周和第-1周样品将基于第1组的第1天在与第1组动物相同的时间收集。b.第2组将与第1组错开20天开始,并且第3组将与第1组错开10天开始。
表16
Figure BDA0002701601960001281
a.第2组和第3组的第-2周和第-1周样品将基于第1组的第1天在与第1组动物相同的时间收集。b.在所指示的收集日之后以及在研究结束时,将所有样品运输至Bioverativ以供分析。
5.6.2因子VIII表达和细胞因子评价:将从血浆确定因子VIII的表达,并且将从血清确定潜在细胞因子评价。
5.6.3外周血单核细胞(PBMC):将从约10mL(在第30天仅约4mL)的从每只猴子收集的血液分离PBMC。用1体积的PBS稀释血液并将其轻轻地覆盖在15-cc锥形管中的1体积的Ficoll上。在关闭制动器的情况下将管以650xg、20℃离心30分钟。收集PBMC层,用DPBS洗涤,以450xg在20℃下离心10分钟(使用制动器),并将细胞沉淀重悬于氯化铵(1-3mL)中并孵育5分钟以切割红细胞,用DPBS洗涤两次,以150xg在20℃下离心10分钟(使用制动器),然后将其重悬于冷冻介质(90%FBS/10%DMSO)中。将分离的PBMC储存于冷冻器组中以维持-85℃至-60℃。
表17
Figure BDA0002701601960001282
a.PBMC将在现场通过Ficoll分离来分离。将分离的PBMC储存于冷冻器组中以维持-85℃至-60℃。b.第2组和第3组的第-2周和第-1周样品将基于第1组的第1天在与第1组动物相同的时间收集。c.第30天PBMC样品将仅为约4mL,并且将相应地调整用于分离的程序。
5.7尸检
5.7.1非排定的尸检:将对死亡或以非排定的间隔终结生命的所有研究动物进行完整尸检。除非发生严重自溶,否则被发现死亡的动物将进行完整尸检。在可能时,所有非排定的尸检将由可供咨询的经认证的兽医病理学家来进行。如果可行,在安乐死之前,将努力收集血液样品用于临床病理学。如果进行收集,则将组织固定在适当固定剂中,并且将确定是否将任一种所述组织加工用于组织病理学评价或丢弃。
5.7.2排定的尸检:将在第53天将动物安乐死。动物将在尸检前进行称重,用氯胺酮(10mg/kg,经由IM注射)镇静以供运输至尸检,并且将通过给予过量巴比妥酸盐人道地终结生命,接着进行放血。
所有排定的尸检将由可供(在可能的情况下)咨询的经认证的兽医病理学家进行。每次尸检将包括检查身体外表面和所有孔口;颅腔、胸腔、腹腔和骨盆腔及其内容物;以及收集组织。
将从所有动物收集下文所列组织(在存在的情况下)并对其进行加工。
组织病理学:将收集肝和脾的切片并置于10%中性缓冲福尔马林(NBF)中。猴子标识将与在尸检期间所取的组织一起保留。
不会收集任何器官重量数据。
DNA和RNA样品收集:对于肝、右叶、肝左叶、肝中叶、肝方叶、肝尾状叶和脾:
表18
Figure BDA0002701601960001291
a.将如所指示对DNA和RNA碎片称重。
对于脑(皮质)、左心室、右心室、右肾、右腋窝淋巴结、肺、右睾丸、左睾丸、胸腺、肌肉(右侧腓肠肌):
表19
Figure BDA0002701601960001292
Figure BDA0002701601960001301
a.将如所指示对DNA和RNA碎片称重。
如上所述对并非用于组织病理学评价的肝样品和脾样品进行急速冷冻,并将其运输至PI以供DNA和RNA的潜在提取和分子分析。
将丢弃所有其他组织和残骸。
5.7.3组织加工:将收集用于组织病理学评价的肝和脾切片进行修剪,以常规方式加工,包埋于石蜡中,以大约5微米切片,安置在载玻片上并用苏木素和曙红染色。
5.7.4.组织病理学评价:研究病理学家将用显微镜检查制备的每个载玻片。将用显微镜检查在非排定的尸检(在研究期间死亡的动物)中鉴定的任何肉眼可见的病灶。将进行内部同行评审。研究文件和最终报告中将包括解剖病理学叙述。
6.统计学分析:将通过方差的参数或非参数分析(ANOVA)针对测试品作用分析在Battelle使用Provantis系统收集的所有适当的定量寿命内数据。对于所有数据,将通过Shapiro-Wilks检验确定常态,并且将通过Levene检验确定方差齐性。可以对数据进行对数转换以符合参数假设。对于确定为正态分布并且在组间均匀的参数数据,将使用ANOVA F检验确定在组平均值之间是否存在差异。如果ANOVA F检验是显著的,则将使用Dunnett检验进行针对对照与每个比较组之间的差异的检验,所述Dunnett检验针对多重比较进行调整。对于非正态分布和/或不均匀的非参数数据,将使用Kruskal-Wallis检验来确定在组平均值之间是否存在差异。如果Kruskal-Wallis检验是显著的,则将使用Wilcoxon检验和Bonferroni-Holm方法来进行针对对照与每个比较组之间的差异的检验,以针对多重比较进行校正。所有统计学检验都将在指示的情况下在考虑多重比较之后,在0.05显著性水平(p<0.05)下进行。
实施例12:猪尾猕猴中的单一剂量LV-coFVIII6XTEN研究
用从CD47/MHC-I293T细胞产生的LV-coFVIII-6-XTEN以3E9TU/kg剂量在1.5mL/分钟的输注速率下经由静脉内(IV)输注治疗三只雄性猪尾猕猴(3.5-4.3kg体重)。为了控制抗人FVIII抗体形成,从LV治疗的第-1天至第7天使用以10mg/kg的剂量每天肌内注射SOLU-
Figure BDA0002701601960001302
(甲基泼尼松龙)来治疗动物。在LV治疗之前三十(30)分钟,还使用以4mg/kg的剂量IV注射右扑尔敏(右氯苯那敏)来治疗动物,以控制潜在的过敏反应。在LV治疗后第7天、第10天和第14天收集血浆样品,并针对人FVIII活性和抗原水平进行分析。三只动物中的血浆水平峰值测量为FVIII活性正常值的102%、54%和67%(图20A),分别对应于187ng/mL、75ng/mL和131ng/mL的人FVIII抗原水平(图20B)。这些数据证实,在非人灵长类动物中,可以以相对较低的LV剂量水平实现治疗有益的人FVIII表达。
实施例13:在猪尾猕猴中的先导LV-coFVIII6和LV-coFVIII6XTEN剂量反应研究
用从CD47高/MHC-I293T细胞产生的LV-coFVIII-6或LV-coFVIII-6-XT EN在1.5mL/分钟的输注速率下经由静脉内(IV)输注治疗十只雄性猪尾猕猴(3.5-4.3kg体重)。LV-coFVIII-6的剂量为3E9TU/kg或6E9TU/kg,并且LV-coFVIII-6-XTEN的剂量为1E9TU/kg或3E9TU/kg。为了控制抗人FVIII抗体形成,从LV治疗的第-1天至第7天使用以10mg/kg的剂量每天肌内注射SOLU-
Figure BDA0002701601960001311
(甲基泼尼松龙)来治疗动物。在LV治疗之前三十(30)分钟,还使用以4mg/kg的剂量IV注射右扑尔敏(右氯苯那敏)来治疗动物,以控制潜在的过敏反应。在LV治疗后第0天、第1天、第3天、第7天、第14天、第21天、第28天、第45天和第60天收集血浆样品,并针对人FVIII活性和抗原水平进行分析。在LV-coFVIII-6治疗后,将3E9或6E9TU/kg治疗组的血浆水平峰值分别取平均值为FVIII活性正常值的5%或12%(图21A),分别对应于5ng/mL或9ng/mL的平均人FVIII抗原水平(图21B)。在LV-coFVIII-6-XTEN治疗后,将1E9或3E9TU/kg治疗组的血浆水平峰值分别取平均值为FVIII活性正常值的20%或75%(图22A),分别对应于31ng/mL或140ng/mL的平均人FVIII抗原水平(图22B)。这些数据证实,LV-coFVIII-6和LV-coFVIII-6-XTEN二者均可以在非人灵长类动物中实现治疗有益的人FVIII表达。
***
具体实施方案的前述描述将如此充分地揭示本公开文本的一般性质,其他人可以在不背离本公开文本的一般概念的情况下,通过应用本领域技术范围内的知识,无需过度实验即可针对各种应用容易地修改和/或调整此类特定实施方案。因此,基于本文给出的传授内容和指导,这些调整和修改旨在包含在所公开实施方案的等效方案的含义和范围内。应理解,本文中的措辞或术语是出于描述而非限制的目的,因此本说明书的术语或措辞将由本领域技术人员根据传授内容和指导来解释。
考虑到本文公开的公开文本的说明书和实践,本公开文本的其他实施方案对于本领域技术人员而言是显而易见的。说明书和实施例旨在被视为仅是示例性的,以下权利要求书指示了本公开文本的真实范围和精神。
本文引用的所有专利和出版物均通过引用以其整体并入本文。
序列表
<110> 比奥维拉迪维治疗股份有限公司(BIOVERATIV THERAPEUTICS INC.)
<120> 表达因子VIII的慢病毒载体的用途
<130> 609628: SA9-460PC
<150> 62/625,145
<151> 2018-02-01
<150> 62/671,915
<151> 2018-05-15
<150> 62/793,158
<151> 2019-01-16
<160> 103
<170> PatentIn version 3.5
<210> 1
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-5
<400> 1
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 2
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-4
<400> 2
atgcagatcg agctgagcac gtgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc 60
accaggaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg 120
ggcgagctgc ccgtggacgc caggttcccc cccagggtgc ccaagagctt ccccttcaac 180
acgagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccatct gttcaatatc 240
gccaagccca ggcccccctg gatggggctg ctggggccca cgatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaatg ggcccatggc cagcgacccc ctgtgcctga cctactctta cctgagccac 540
gtggatctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggatagggac 720
gccgccagcg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggtct 780
ctgcccggcc tgatcggctg ccacaggaag agcgtgtact ggcacgtgat cggcatgggg 840
accacccccg aggtgcacag catcttcctg gagggccaca cgttcctggt gaggaatcac 900
aggcaggcca gcctggagat cagcccgatc accttcctga ccgcccagac cctgctgatg 960
gacctggggc agttcctgct gttctgccat atcagctctc accagcacga cggcatggag 1020
gcctacgtga aggtggatag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gaggttcgac 1140
gacgacaata gcccgagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcatt acatcgccgc cgaggaggag gattgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggtcttacaa gagccagtac ctgaacaacg ggccccagag gatcggcagg 1320
aagtacaaga aggtgaggtt catggcctac accgacgaga ccttcaagac cagggaggcg 1380
atccagcacg agagcgggat cctggggccc ctgctgtacg gcgaggtggg cgacacgctg 1440
ctgatcatct tcaagaacca ggccagcagg ccgtacaata tctaccccca cgggatcacc 1500
gacgtgaggc ccctgtactc taggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacgggccc 1620
acgaagagcg accccaggtg cctgaccagg tactacagct ctttcgtgaa catggagagg 1680
gacctggcca gcggcctgat cgggcccctg ctgatctgct acaaggagag cgtggatcag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttcagcgt gttcgacgag 1800
aataggtctt ggtacctgac cgagaatatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg atcccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040
atggtgtacg aggataccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccataact ccgacttcag gaataggggc 2160
atgaccgccc tgctgaaggt gagctcttgc gacaagaaca ccggcgacta ctacgaggat 2220
agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggtct 2280
ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gacgaccctg 2340
cagagcgacc aggaggagat cgactacgac gacacgatca gcgtggagat gaagaaggag 2400
gatttcgaca tctacgacga ggacgagaat cagagcccca ggtctttcca gaagaagacc 2460
aggcattact tcatcgccgc cgtggagagg ctgtgggact acggcatgag cagctctccc 2520
cacgtgctga ggaatagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca ggggcgagct gaacgagcac 2640
ctgggcctgc tggggcccta catcagggcc gaggtggagg ataacatcat ggtgaccttc 2700
aggaatcagg ccagcaggcc ctatagcttc tatagctctc tgatcagcta cgaggaggat 2760
cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820
ttctggaagg tgcagcacca catggccccc acgaaggacg agttcgactg caaggcctgg 2880
gcctacttca gcgacgtgga tctggagaag gacgtgcaca gcggcctgat cgggcccctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaatatg 3060
gagaggaatt gcagggcccc ctgcaatatc cagatggagg acccgacctt caaggagaat 3120
tacaggttcc acgccatcaa cggctacatc atggacacgc tgcccggcct ggtcatggcc 3180
caggatcaga ggatcaggtg gtatctgctg agcatgggga gcaacgagaa tatccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaatctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccgggatc 3360
tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac gctgttcctg 3420
gtgtactcta acaagtgcca gacccccctg gggatggcca gcggccacat cagggacttc 3480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag gctgcactat 3540
tccggaagca tcaacgcctg gagcacgaag gagcccttca gctggatcaa ggtggatctg 3600
ctggccccca tgatcatcca cgggatcaag acccagggcg ccaggcagaa gttcagctct 3660
ctgtatatca gccagttcat catcatgtac tctctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac gctgatggtg ttcttcggca acgtggactc tagcgggatc 3780
aagcacaata tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccat 3840
tactctatca ggtctaccct gaggatggag ctgatgggct gcgacctgaa cagctgcagc 3900
atgcccctgg ggatggagag caaggccatc agcgacgccc agatcaccgc cagctcttac 3960
ttcaccaaca tgttcgccac ctggagcccg agcaaggcca ggctgcacct gcagggcagg 4020
tctaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag 4080
aagaccatga aggtgaccgg cgtgaccacg cagggcgtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat cagctctagc caggacggcc accagtggac cctgttcttc 4200
cagaacggca aggtgaaggt gttccagggc aaccaggata gcttcacccc cgtggtgaac 4260
agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgcgaggccc aggatctgta ttga 4374
<210> 3
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52
<400> 3
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 4
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62
<400> 4
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 5
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25
<400> 5
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 6
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26
<400> 6
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 7
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-NT58
<400> 7
gcgacccgcc gatactacct gggagcagtg gagctctcct gggattacat gcagagcgac 60
cttggggagc tgcccgtgga tgccaggttc cctccccggg tgccaaagtc gtttccgttc 120
aacacctccg tggtgtacaa gaaaactctg ttcgtggagt tcaccgacca cctgttcaat 180
atcgccaagc ccagacctcc ctggatgggg ctgttgggac ctaccatcca agcggaggtg 240
tacgacactg tggtcatcac tctgaagaac atggcctcgc atcccgtgtc cctgcacgcc 300
gtgggagtgt cttactggaa agcgtccgag ggggccgaat acgacgacca gacctcgcag 360
agagaaaagg aagatgacaa ggtgttccca ggaggatcgc acacctacgt gtggcaagtg 420
ttgaaggaga acggcccaat ggcctccgac ccgctgtgcc tgacctactc gtacctgtcc 480
cacgtggacc tcgtgaagga cctcaactcg ggactgattg gagccctgct ggtctgcagg 540
gaaggctcac tggcgaaaga aaagactcag accttgcaca agttcattct gctgttcgct 600
gtgttcgacg aggggaagtc gtggcacagc gagactaaga actccctgat gcaagataga 660
gatgccgcct ccgcccgggc ctggcctaag atgcacaccg tgaacggtta cgtgaaccgc 720
tccctccctg gcctgattgg atgccaccgg aagtccgtgt actggcacgt gatcgggatg 780
gggaccaccc ccgaggtgca cagcatcttc ctggaaggtc acacatttct cgtgcgcaac 840
caccggcagg cctccctgga aatcagcccc attaccttcc tcactgccca gactctgctg 900
atggacctgg gacagttcct gctgttctgc catatctcct cccaccaaca tgacggaatg 960
gaggcatacg tgaaggtcga ttcctgccct gaggaacccc agctccgcat gaagaacaat 1020
gaggaagccg aggactacga cgacgacctg acggatagcg agatggatgt ggtccggttc 1080
gatgacgata acagcccttc cttcatccaa attcgctcgg tggcaaagaa gcaccccaag 1140
acctgggtgc attacattgc ggcggaagaa gaggactggg attatgcccc gcttgtcctc 1200
gctcctgacg accggagcta caagagccag tacctgaaca acggtccaca gaggatcggt 1260
agaaagtaca agaaggtccg cttcatggcc tataccgacg aaaccttcaa aactagagag 1320
gccatccaac acgaatccgg catcctgggc ccgctcttgt acggagaagt cggcgacacc 1380
cttctcatta tcttcaagaa ccaggcttcc cggccgtaca acatctatcc gcatgggatc 1440
actgacgtgc gcccactgta ctcgcggcgc ctgcccaagg gtgtcaaaca cctgaaggat 1500
tttccgatcc ttccgggaga aatcttcaag tacaagtgga ccgtgaccgt ggaagatggc 1560
ccaactaagt ctgaccctag atgcctcacc cgctactact catccttcgt caacatggag 1620
cgcgacctgg ccagcggact gatcggcccg ctgctgattt gctacaagga atcagtggac 1680
caacggggaa accagatcat gtcggataag aggaacgtca tcctcttctc cgtg 1734
<210> 8
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-CT
<400> 8
tttgacgaaa accggtcgtg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 9
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62-NT58
<400> 9
gccactcgcc ggtactacct tggagccgtg gagctttcat gggactacat gcagagcgac 60
ctgggcgaac tccccgtgga tgccagattc cccccccgcg tgccaaagtc cttccccttt 120
aacacctccg tggtgtacaa gaaaaccctc tttgtcgagt tcactgacca cctgttcaac 180
atcgccaagc cgcgcccacc ttggatgggc ctcctgggac cgaccattca agctgaagtg 240
tacgacaccg tggtgatcac cctgaagaac atggcgtccc accccgtgtc cctgcatgcg 300
gtcggagtgt cctactggaa ggcctccgaa ggagctgagt acgacgacca gactagccag 360
cgggaaaagg aggacgataa agtgttcccg ggcggctcgc atacttacgt gtggcaagtc 420
ctgaaggaaa acggacctat ggcatccgat cctctgtgcc tgacttactc ctacctttcc 480
catgtggacc tcgtgaagga cctgaacagc gggctgattg gtgcacttct cgtgtgccgc 540
gaaggttcgc tcgctaagga aaagacccag accctccata agttcatcct tttgttcgct 600
gtgttcgatg aaggaaagtc atggcattcc gaaactaaga actcgctgat gcaggaccgg 660
gatgccgcct cagcccgcgc ctggcctaaa atgcatacag tcaacggata cgtgaatcgg 720
tcactgcccg ggctcatcgg ttgtcacaga aagtccgtgt actggcacgt catcggcatg 780
ggcactacgc ctgaagtgca ctccatcttc ctggaagggc acaccttcct cgtgcgcaac 840
caccgccagg cctctctgga aatctccccg attacctttc tgaccgccca gactctgctc 900
atggacctgg ggcagttcct tctcttctgc cacatctcca gccatcagca cgacggaatg 960
gaggcctacg tgaaggtgga ctcatgcccg gaagaacctc agttgcggat gaagaacaac 1020
gaggaggccg aggactatga cgacgatttg actgactccg agatggacgt cgtgcggttc 1080
gatgacgaca acagccccag cttcatccag attcgcagcg tggccaagaa gcaccccaaa 1140
acctgggtgc actacatcgc ggccgaggaa gaagattggg actacgcccc gttggtgctg 1200
gcacccgatg accggtcgta caagtcccag tatctgaaca atggtccgca gcggattggc 1260
agaaagtaca agaaagtgcg gttcatggcg tacactgacg aaacgtttaa gacccgggag 1320
gccattcaac atgagagcgg cattctggga ccactgctgt acggagaggt cggcgatacc 1380
ctgctcatca tcttcaaaaa ccaggcctcc cggccttaca acatctaccc tcacggaatc 1440
accgacgtgc ggccactcta ctcgcggcgc ctgccgaagg gcgtcaagca cctgaaagac 1500
ttccctatcc tgccgggcga aatcttcaag tataagtgga ccgtcaccgt ggaggacggg 1560
cccaccaaga gcgatcctag gtgtctgact cggtactact ccagcttcgt gaacatggaa 1620
cgggacctgg catcgggact cattggaccg ctgctgatct gctacaaaga gtcggtggat 1680
caacgcggca accagatcat gtccgacaag cgcaacgtga tcctgttctc cgtg 1734
<210> 10
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62-CT
<400> 10
tttgatgaaa acagatcctg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 11
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25-NT58
<400> 11
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 12
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25-CT
<400> 12
ttcgacgaga acaggagctg gtacctgact gaaaacatcc agcggttcct ccccaacccc 60
gcgggcgtgc agctggaaga tcctgagttt caggcatcaa acatcatgca ctccattaac 120
ggctacgtgt tcgattcgct gcagctgagc gtgtgtctgc acgaagtggc ctactggtac 180
atcctgtcca ttggtgccca gactgacttc ctgtccgtgt ttttctccgg ctacacgttc 240
aagcacaaga tggtgtacga ggacaccctg accctcttcc ctttttccgg cgaaactgtg 300
tttatgagca tggagaatcc cggcctgtgg atcttgggct gccacaacag cgacttccgt 360
aacagaggaa tgactgcgct gctcaaggtg tccagctgcg acaagaacac cggagactat 420
tatgaggact catacgagga catctccgcc tacctcctgt ccaagaataa cgccattgaa 480
cctcggagct tcagccagaa cccacccgtg cttaagagac atcaacggga gatcactagg 540
accaccctgc agtcagacca ggaggaaatc gactacgatg acaccatctc ggtcgagatg 600
aagaaggagg actttgacat ctacgacgaa gatgaaaacc agagcccgag gtcgttccaa 660
aagaaaaccc gccactactt tattgctgct gtcgagcggc tgtgggacta cggaatgtcg 720
tcctcgccgc acgtgctccg caaccgagcc cagagcggct cggtgccgca attcaagaag 780
gtcgtgttcc aggagttcac tgacgggagc ttcactcagc ctttgtaccg gggagaactc 840
aatgaacatc tcggcctcct cggaccttac atcagagcag aagtggaaga taacatcatg 900
gtcactttcc gtaaccaagc cagccgcccg tactcgttct actcctccct catttcttac 960
gaagaggacc agcggcaggg cgcagaaccg cgcaagaact tcgtgaagcc caacgaaacc 1020
aagacctact tctggaaagt gcagcatcat atggccccga ctaaggacga gtttgactgc 1080
aaagcctggg cctacttctc cgatgtggac ttggagaagg acgtccactc cggcctcatc 1140
ggtcccctgc tcgtgtgcca taccaatacc ctgaaccccg cacacggtcg ccaggtcacc 1200
gtgcaggagt tcgctctgtt cttcactatc ttcgacgaaa ctaagtcctg gtacttcacc 1260
gagaacatgg agaggaactg cagagccccc tgtaacatcc agatggagga cccgacgttc 1320
aaggaaaact accggttcca cgccattaac ggatacatca tggatacgct gccgggtctt 1380
gtgatggccc aggatcaacg gatcagatgg tacttattgt cgatgggcag caacgagaac 1440
atccactcta ttcacttctc cggtcatgtg ttcactgtgc ggaagaagga agagtacaag 1500
atggccctgt acaaccttta tcccggagtg ttcgaaactg tggaaatgct gccgtcgaag 1560
gccggcattt ggcgcgtgga gtgtttgatt ggagaacatc tccatgcggg gatgtcaacc 1620
ctgttcctgg tgtatagcaa caagtgccag actccgcttg ggatggcgtc aggacacatt 1680
agggatttcc agatcactgc gtccggccag tacggccaat gggcccctaa gctggcccgc 1740
ctgcattact ccggatccat taacgcctgg tcaaccaagg agccattctc ctggatcaag 1800
gtggaccttc tggcccccat gattatccac ggaattaaga cccagggggc ccggcagaag 1860
ttctcctcac tgtacatcag ccagttcata atcatgtact ccctggacgg aaagaagtgg 1920
caaacctaca gggggaacag caccggcaca ctgatggtct ttttcggaaa tgtggactcc 1980
tccgggatta agcataacat cttcaaccct ccgattatcg ctcggtacat tagacttcac 2040
cctacccact acagcattcg ctccaccctg cggatggaac tgatgggctg cgatctgaac 2100
tcgtgcagca tgccgttggg aatggagtcc aaagcaattt ccgacgcgca gatcaccgcc 2160
tcgtcctact ttaccaacat gttcgccacg tggtcaccgt ccaaggcccg gctgcacctc 2220
cagggaagat ccaacgcatg gcggccacag gtcaacaacc ctaaggagtg gctccaggtg 2280
gacttccaga aaaccatgaa ggtcaccgga gtcacaaccc agggagtgaa gtcgctgctg 2340
acttctatgt acgtcaagga gttcctgatc tccagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaatggaaa ggtcaaggtg tttcagggca atcaggattc attcaccccg 2460
gtggtgaact cccttgatcc acccctcctg acccgctacc ttcgcatcca cccacagtcc 2520
tgggtgcacc agatcgcgct gaggatggag gtcctgggat gcgaagccca ggacctgtac 2580
tga 2583
<210> 13
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26-NT58
<400> 13
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 14
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26-CT
<400> 14
ttcgacgaga acaggagctg gtacctcact gaaaacatcc agaggttcct cccaaacccc 60
gcaggagtgc aactggagga ccctgagttt caggcctcga atatcatgca ctcgattaac 120
ggttacgtgt tcgactcgct gcagctgagc gtgtgcctcc atgaagtcgc ttactggtac 180
attctgtcca tcggcgccca gactgacttc ctgagcgtgt tcttttccgg ttacaccttt 240
aagcacaaga tggtgtacga agataccctg accctgttcc ctttctccgg cgaaacggtg 300
ttcatgtcga tggagaaccc gggtctgtgg attctgggat gccacaacag cgactttcgg 360
aaccgcggaa tgactgccct gctgaaggtg tcctcatgcg acaagaacac cggagactac 420
tacgaggact cctacgagga tatctcagcc tacctcctgt ccaagaacaa cgcgatcgag 480
ccgcgcagct tcagccagaa cccgcctgtg ctgaagaggc accagcgaga aattacccgg 540
accaccctcc aatcggatca ggaggaaatc gactacgacg acaccatctc ggtggaaatg 600
aagaaggaag atttcgatat ctacgacgag gacgaaaatc agtcccctcg ctcattccaa 660
aagaaaacta gacactactt tatcgccgcg gtggaaagac tgtgggacta tggaatgtca 720
tccagccctc acgtccttcg gaaccgggcc cagagcggat cggtgcctca gttcaagaaa 780
gtggtgttcc aggagttcac cgacggcagc ttcacccagc cgctgtaccg gggagaactg 840
aacgaacacc tgggcctgct cggtccctac atccgcgcgg aagtggagga taacatcatg 900
gtgaccttcc gtaaccaagc atccagacct tactccttct attcctccct gatctcatac 960
gaggaggacc agcgccaagg cgccgagccc cgcaagaact tcgtcaagcc caacgagact 1020
aagacctact tctggaaggt ccaacaccat atggccccga ccaaggatga gtttgactgc 1080
aaggcctggg cctacttctc cgacgtggac cttgagaagg atgtccattc cggcctgatc 1140
gggccgctgc tcgtgtgtca caccaacacc ctgaacccag cgcatggacg ccaggtcacc 1200
gtccaggagt ttgctctgtt cttcaccatt tttgacgaaa ctaagtcctg gtacttcacc 1260
gagaatatgg agcgaaactg tagagcgccc tgcaatatcc agatggaaga tccgactttc 1320
aaggagaact atagattcca cgccatcaac gggtacatca tggatactct gccggggctg 1380
gtcatggccc aggatcagag gattcggtgg tacttgctgt caatgggatc gaacgaaaac 1440
attcactcca ttcacttctc cggtcacgtg ttcactgtgc gcaagaagga ggagtacaag 1500
atggcgctgt acaatctgta ccccggggtg ttcgaaactg tggagatgct gccgtccaag 1560
gccggcatct ggagagtgga gtgcctgatc ggagagcacc tccacgcggg gatgtccacc 1620
ctcttcctgg tgtactcgaa taagtgccag accccgctgg gcatggcctc gggccacatc 1680
agagacttcc agatcacagc aagcggacaa tacggccaat gggcgccgaa gctggcccgc 1740
ttgcactact ccggatcgat caacgcatgg tccaccaagg aaccgttctc gtggattaag 1800
gtggacctcc tggcccctat gattatccac ggaattaaga cccagggcgc caggcagaag 1860
ttctcctccc tgtacatctc gcaattcatc atcatgtaca gcctggacgg gaagaagtgg 1920
cagacttaca ggggaaactc caccggcacc ctgatggtct ttttcggcaa cgtggattcc 1980
tccggcatta agcacaacat cttcaaccca ccgatcatag ccagatatat taggctccac 2040
cccactcact actcaatccg ctcaactctt cggatggaac tcatggggtg cgacctgaac 2100
tcctgctcca tgccgttggg gatggaatca aaggctatta gcgacgccca gatcaccgcg 2160
agctcctact tcactaacat gttcgccacc tggagcccct ccaaggccag gctgcacttg 2220
cagggacggt caaatgcctg gcggccgcaa gtgaacaatc cgaaggaatg gcttcaagtg 2280
gatttccaaa agaccatgaa agtgaccgga gtcaccaccc agggagtgaa gtcccttctg 2340
acctcgatgt atgtgaagga gttcctgatt agcagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaacggaaa ggtcaaggtg ttccagggga accaggactc gttcacaccc 2460
gtggtgaact ccctggaccc cccactgctg acgcggtact tgaggattca tcctcagtcc 2520
tgggtccatc agattgcatt gcgaatggaa gtcctgggct gcgaggccca ggacctgtac 2580
tga 2583
<210> 15
<211> 2332
<212> PRT
<213> 人(Homo sapiens)
<400> 15
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 16
<211> 4371
<212> DNA
<213> 人工序列
<220>
<223> BDD-FVIII (非优化的; "亲本"), 核苷酸序列
<400> 16
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371
<210> 17
<211> 1438
<212> PRT
<213> 人工序列
<220>
<223> BDD-FVIII (非优化的; "亲本"), 氨基酸序列
<400> 17
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 18
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN 核苷酸序列
<400> 18
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 19
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-XTEN
<400> 19
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccccccagt gctgaagagg 2760
caccagaggg agatcaccag gaccaccctg cagtctgacc aggaggagat cgactatgat 2820
gacaccatca gcgtggagat gaagaaggag gacttcgaca tctacgacga ggacgagaac 2880
cagagcccca ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg 2940
ctgtgggact atggcatgtc cagcagcccc catgtgctga ggaacagggc ccagtctggc 3000
agcgtgcccc agttcaagaa agtcgtgttc caggagttca ccgacggcag cttcacccag 3060
cccctgtaca gaggggagct gaacgagcac ctgggcctgc tgggccccta catcagggcc 3120
gaggtggagg acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc 3180
tacagcagcc tgatcagcta cgaggaggac cagaggcagg gggctgagcc caggaagaac 3240
tttgtgaagc ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc 3300
accaaggacg agttcgactg caaggcctgg gcctacttct ctgacgtgga cctggagaag 3360
gacgtgcact ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct 3420
gcccatggca ggcaggtgac tgtgcaggag ttcgccctgt tcttcaccat cttcgatgaa 3480
accaagagct ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc 3540
cagatggagg accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc 3600
atggacaccc tgcctggcct ggtcatggcc caggaccaga ggatcaggtg gtatctgctg 3660
agcatgggca gcaacgagaa catccacagc atccacttct ctggccacgt gttcactgtg 3720
aggaagaagg aggagtacaa gatggccctg tacaacctgt accctggggt gttcgaaacc 3780
gtggagatgc tgcccagcaa ggccggcatc tggagggtgg agtgcctgat tggggagcac 3840
ctgcacgccg gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg 3900
ggcatggcct ctggccacat cagggacttc cagatcactg cctctggcca gtacggccag 3960
tgggccccca agctggccag gctgcactac tccggaagca tcaatgcctg gagcaccaag 4020
gagcccttca gctggatcaa agtggacctg ctggccccca tgatcatcca cggcatcaag 4080
acccaggggg ccaggcagaa gttctccagc ctgtacatca gccagttcat catcatgtac 4140
agcctggacg gcaagaagtg gcagacctac aggggcaaca gcaccggcac cctgatggtg 4200
ttcttcggca acgtggacag cagcggcatc aagcacaaca tcttcaaccc ccccatcatc 4260
gccagataca tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag 4320
ctgatgggct gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc 4380
tctgacgccc agatcactgc ctccagctac ttcaccaaca tgtttgccac ctggagcccc 4440
agcaaggcca ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac 4500
cccaaggagt ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc 4560
cagggggtga agagcctgct gaccagcatg tacgtgaagg agttcctgat ctccagcagc 4620
caggacggcc accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc 4680
aaccaggaca gcttcacccc tgtggtcaac agcctggacc cccccctgct gaccagatac 4740
ctgaggatcc acccccagag ctgggtgcac cagatcgccc tgaggatgga ggtgctgggc 4800
tgtgaggccc aggacctgta ctga 4824
<210> 20
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-1-XTEN
<400> 20
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccctccagt gctgaagcgg 2760
caccagcgcg agatcacccg cactaccctg cagagtgatc aggaagagat cgactacgac 2820
gatacaattt ctgtggaaat gaagaaagag gacttcgata tctatgacga agatgagaac 2880
cagagtcctc gatcattcca gaagaaaacc aggcattact ttattgccgc agtggagcgg 2940
ctgtgggatt atggcatgtc ctctagtcct cacgtgctgc gaaatagggc ccagtcagga 3000
agcgtcccac agttcaagaa agtggtcttc caggagttta cagacgggtc ctttactcag 3060
ccactgtaca ggggcgaact gaacgagcac ctgggactgc tggggcccta tatcagagca 3120
gaagtggagg ataacattat ggtcaccttc agaaatcagg cctctcggcc ttacagtttt 3180
tattcaagcc tgatctctta cgaagaggac cagcgacagg gagctgaacc acgaaaaaac 3240
ttcgtgaagc ctaatgagac caaaacatac ttttggaagg tgcagcacca tatggcccca 3300
acaaaagacg agttcgattg caaggcatgg gcctattttt ctgacgtgga tctggagaag 3360
gacgtgcaca gtggcctgat tggcccactg ctggtgtgcc atactaacac cctgaatcca 3420
gcccacggcc ggcaggtcac tgtccaggag ttcgctctgt tctttaccat ctttgatgag 3480
acaaagagct ggtacttcac cgaaaacatg gagcgaaatt gcagggctcc atgtaacatt 3540
cagatggaag accccacatt caaggagaac taccgctttc atgctatcaa tggatacatc 3600
atggatactc tgcccgggct ggtcatggca caggaccaga gaatccggtg gtatctgctg 3660
agcatgggca gcaacgagaa tatccactca attcatttca gcgggcacgt gtttactgtc 3720
aggaagaaag aagagtacaa gatggccctg tacaacctgt atcccggcgt gttcgaaacc 3780
gtcgagatgc tgcctagcaa ggccggaatc tggagagtgg aatgcctgat tggagagcac 3840
ctgcatgctg ggatgtctac cctgtttctg gtgtacagta ataagtgtca gacacccctg 3900
ggaatggcat ccgggcatat cagggatttc cagattaccg catctggaca gtacggacag 3960
tgggcaccta agctggctag actgcactat tccggatcta tcaacgcttg gtccacaaaa 4020
gagcctttct cttggattaa ggtggacctg ctggccccaa tgatcattca tggcatcaaa 4080
actcagggag ctcggcagaa gttctcctct ctgtacatct cacagtttat catcatgtac 4140
agcctggatg ggaagaaatg gcagacatac cgcggcaata gcacaggaac tctgatggtg 4200
ttctttggca acgtggacag cagcggaatc aagcacaaca ttttcaatcc ccctatcatt 4260
gctagataca tccggctgca cccaacccat tattctattc gaagtacact gaggatggaa 4320
ctgatgggat gcgatctgaa cagttgttca atgcccctgg ggatggagtc caaggcaatc 4380
tctgacgccc agattaccgc cagctcctac ttcactaata tgtttgctac ctggagccct 4440
tccaaagcaa gactgcacct gcaaggccgc agcaacgcat ggcgaccaca ggtgaacaat 4500
cccaaggagt ggttgcaggt cgattttcag aaaactatga aggtgaccgg ggtcacaact 4560
cagggcgtga aaagtctgct gacctcaatg tacgtcaagg agttcctgat ctctagttca 4620
caggacggac atcagtggac actgttcttt cagaacggga aggtgaaagt cttccagggc 4680
aatcaggatt cctttacacc tgtggtcaac agtctagacc ctccactgct gaccagatac 4740
ctgagaatcc accctcagtc ctgggtgcac cagattgccc tgagaatgga agtgctggga 4800
tgcgaggccc aggatctgta ctga 4824
<210> 21
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> MAR/ARS
<400> 21
atattt 6
<210> 22
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> MAR/ARS
<400> 22
aaatat 6
<210> 23
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 去稳定元件
<400> 23
attta 5
<210> 24
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 去稳定元件
<400> 24
taaat 5
<210> 25
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 多聚T位点
<400> 25
tttttt 6
<210> 26
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 多聚A位点
<400> 26
aaaaaaa 7
<210> 27
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 剪接位点
<400> 27
ggtgat 6
<210> 28
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> TATA盒
<400> 28
tataa 5
<210> 29
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> TATA盒
<400> 29
ttata 5
<210> 30
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 富含AU的序列元件
<400> 30
attttatt 8
<210> 31
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 富含AU的序列元件
<400> 31
atttttaa 8
<210> 32
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> kozak共有序列
<400> 32
gccgccacca tgc 13
<210> 33
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> CTP肽
<400> 33
Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser
1 5 10 15
Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu
20 25 30
<210> 34
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> CTP肽
<400> 34
Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu Pro Ser Pro Ser Arg
1 5 10 15
Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro Gln
20 25
<210> 35
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 白蛋白结合肽核心序列
<400> 35
Asp Ile Cys Leu Pro Arg Trp Gly Cys Leu Trp
1 5 10
<210> 36
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 36
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala
20
<210> 37
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 37
Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro
1 5 10 15
Ala Ala Pro Ser
20
<210> 38
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 38
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser Ser
20
<210> 39
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 39
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser
<210> 40
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 40
Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro
1 5 10 15
Ser Ser Pro Ala
20
<210> 41
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 41
Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro
1 5 10 15
Ala Ala Pro Ser Ala Pro Pro Ala
20
<210> 42
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 42
Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro
1 5 10 15
Ser Ala Ala Ala
20
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> miR142靶
<400> 43
tccataaagt aggaaacact aca 23
<210> 44
<211> 2332
<212> PRT
<213> 人(Homo sapiens)
<400> 44
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 45
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 人IgG1的氨基酸233-236
<400> 45
Glu Leu Leu Gly
1
<210> 46
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE42-4, 蛋白质序列
<400> 46
Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser
35 40
<210> 47
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE42-4, DNA序列
<400> 47
ggcgcgccag gttctcctgc tggctccccc acctcaacag aagaggggac aagcgaaagc 60
gctacgcctg agagtggccc tggctctgag ccagccacct ccggctctga aacccctgcc 120
tcgagc 126
<210> 48
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-2A, 蛋白质序列
<400> 48
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
1 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
130 135 140
<210> 49
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-2A, DNA序列
<400> 49
ggcgcgccaa ccagtacgga gccgtccgag gggagcgcac caggaagccc ggctgggagc 60
ccgacttcta ccgaagaggg tacatctacc gaaccaagtg aaggttcagc accaggcacc 120
tcaacagaac cctctgaggg ctcggcgcct ggtacaagtg agtccgccac cccagaatcc 180
gggcctggga caagcacaga accttcggaa gggagtgccc ctggaacatc cgaatcggca 240
accccagaat cagggccagg atctgagccc gcgacttcgg gctccgagac gcctgggaca 300
tccaccgagc cctccgaagg atcagcccca ggcaccagca cggagccctc tgagggaagc 360
gcacctggta ccagcgaaag cgcaactccc gaatcaggtc ccggtacgag cgagtcggcg 420
accccggaga gcgggccagg tgcctcgagc 450
<210> 50
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-3B, 蛋白质序列
<400> 50
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
65 70 75 80
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 51
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-3B, DNA序列
<400> 51
ggcgcgccaa gtcccgctgg aagcccaact agcaccgaag aggggacctc agagtccgcc 60
acccccgagt ccggccctgg ctctgagcct gccactagcg gctccgagac tcctggcaca 120
tccgaaagcg ctacacccga gagtggaccc ggcacctcta ccgagcccag tgagggctcc 180
gcccctggaa caagcaccga gcccagcgaa ggcagcgccc cagggacctc cacagagccc 240
agtgaaggca gtgctcctgg caccagcacc gaaccaagcg agggctctgc acccgggacc 300
tccaccgagc caagcgaagg ctctgcccct ggcacttcca ccgagcccag cgaaggcagc 360
gcccctggga gccccgctgg ctctcccacc agcactgagg agggcacatc taccgaacca 420
agtgaaggct ctgcaccagg tgcctcgagc 450
<210> 52
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-4A, 蛋白质序列
<400> 52
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 95
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
100 105 110
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 53
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-4A, DNA序列
<400> 53
ggcgcgccaa cgtccgaaag tgctacccct gagtcaggcc ctggtagtga gcctgccaca 60
agcggaagcg aaactccggg gacctcagag tctgccactc ccgaatcggg gccaggctct 120
gaaccggcca cttcagggag cgaaacacca ggaacatcgg agagcgctac cccggagagc 180
gggccaggaa ctagtactga gcctagcgag ggaagtgcac ctggtacaag cgagtccgcc 240
acacccgagt ctggccctgg ctctccagcg ggctcaccca cgagcactga agagggctct 300
cccgctggca gcccaacgtc gacagaagaa ggatcaccag caggctcccc cacatcaaca 360
gaggagggta catcagaatc tgctactccc gagagtggac ccggtacctc cactgagccc 420
agcgagggga gtgcaccagg tgcctcgagc 450
<210> 54
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-5A, 蛋白质序列
<400> 54
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
85 90 95
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
100 105 110
Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
130 135 140
<210> 55
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-5A, DNA序列
<400> 55
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 56
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-6B, 蛋白质序列
<400> 56
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala
100 105 110
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 57
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-6B, DNA序列
<400> 57
ggcgcgccaa catctaccga gccttccgaa ggctctgccc ctgggacctc agaatctgca 60
acccctgaaa gcggccctgg aacctccgaa agtgccactc ccgagagcgg cccagggaca 120
agcgagtcag caacccctga gtctggaccc ggcagcgagc ctgcaacctc tggctcagag 180
actcccggct cagaacccgc tacctcaggc tccgagacac ccggctctcc tgctgggagt 240
cccacttcca ccgaggaagg aacatccact gagcctagtg agggctctgc ccctggaacc 300
agcacagagc caagtgaggg cagtgcacca ggatccgagc cagcaaccag cgggtccgag 360
actcccggga cctctgagtc tgccacccca gagagcggac ccggcacttc aaccgagccc 420
tccgaaggat cagcaccagg tgcctcgagc 450
<210> 58
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-1, 蛋白质序列
<400> 58
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser
1 5 10 15
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
20 25 30
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
35 40 45
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser
50 55 60
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
65 70 75 80
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
85 90 95
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser
100 105 110
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
115 120 125
Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
130 135 140
<210> 59
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-1, DNA序列
<400> 59
ggcgcgccac ccgggtcgtc cccgtcggcg tccaccggaa cagggccagg gtcatccccg 60
tcagcgtcga ctgggacggg acccgggaca cccggttcgg ggactgcatc ctcctcgcct 120
ggttcgtcca ccccgtcagg agccacgggt tcgccgggaa gcagcccaag cgcatccact 180
ggtacagggc ctggggcttc accgggtact tcatccacgg ggtcaccggg aacgcccgga 240
tcggggacgg cttcctcatc accaggatcg tcaacaccct cgggcgcaac gggcagcccc 300
ggaacccctg gttcgggtac ggcgtcgtcg agccccggtg cgagcccggg aacaagctcg 360
acaggatcgc ctggggcgtc acccggcacg tcgagcacag gcagccccgg aacccctgga 420
tcgggaaccg cgtcgtcaag cgcctcgagc 450
<210> 60
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-A, 蛋白质序列
<400> 60
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 61
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-A, DNA序列
<400> 61
ggcgcgccag gtgcctcgcc gggaacatca tcaactggtt cacccgggtc atccccctcg 60
gcctcaaccg ggacgggtcc cggctcatcc cccagcgcca gcactggaac aggtcctggc 120
actcctggtt ccggtacggc atcgtcatcc ccgggaagct caacaccgtc cggagcgaca 180
ggatcacctg gctcgtcacc ttcggcgtca actggaacgg ggccaggggc ctcacccgga 240
acgtcctcga ctgggtcgcc tggtacgccg ggatcaggaa cggcctcatc ctcgcctggg 300
tcctcaacgc cctcgggtgc gactggttcg ccgggaactc ctggctcggg gacggcctcg 360
tcgtcgcctg gggcatcacc ggggacgagc tccacggggt cccctggagc gtcaccgggg 420
acctcctcga caggtagccc ggcctcgagc 450
<210> 62
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-B, 蛋白质序列
<400> 62
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
1 5 10 15
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
65 70 75 80
Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro
100 105 110
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 63
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-B, DNA序列
<400> 63
ggcgcgccag gtacaccggg cagcggcacg gcttcgtcgt cacccggctc gtccacaccg 60
tcgggagcta cgggaagccc aggagcgtca ccgggaacgt cgtcaacggg gtcaccgggt 120
acgccaggta gcggcacggc cagcagctcg ccaggttcat cgaccccgtc gggagcgact 180
gggtcgcccg gatcaagccc gtcagcttcc actggaacag gacccgggtc gtcgccgtca 240
gcctcaacgg ggacaggacc tggttcatcg acgccgtcag gggcgacagg ctcgcccgga 300
tcgtcaacac cctcgggggc aacggggagc cctggtgcgt cgcctggaac ctcatccacc 360
ggaagcccgg gggcctcgcc gggtacgagc tccacgggat cgcccggagc gtcccccgga 420
acttcaagca cagggagccc tgcctcgagc 450
<210> 64
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-C, 蛋白质序列
<400> 64
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro
1 5 10 15
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
50 55 60
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
85 90 95
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 65
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-C, DNA序列
<400> 65
ggcgcgccag gtacacccgg atcgggtaca gcgtcatcga gccccggtgc gtcacctggt 60
acgtcgagca cggggtcgcc aggggcgtcc cctgggacgt cctcaacagg ctcgcccggt 120
gcgtcacccg gcacgtcgtc cacgggttca cctggtagct ccccttccgc gtccactggc 180
accgggcctg gaactccggg gagcggcaca gcgagctcgt cgccgggagc atcgcctggg 240
acatcgagca ccgggtcgcc aggagcatcg cccggaacat ccagcacagg aagccccggc 300
gcgtcgcccg ggacatcaag cacaggttcc ccgggatcga gcacgccgtc cggagccact 360
ggatcaccag ggagctcgac accttccggc gcaacgggat cgcccggagc cagcccgggt 420
acgtcaagca ctggctcccc tgcctcgagc 450
<210> 66
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-F, 蛋白质序列
<400> 66
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
85 90 95
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 67
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-F, DNA序列
<400> 67
ggcgcgccag gctccagccc ctccgcgagc acgggaaccg gaccaggttc gtcaccctca 60
gcatcaacgg ggacgggacc gggggcgtca ccaggaacgt cctccaccgg ctcgccgggt 120
gcatcacccg gaacgtcatc gaccggatcg ccagggagct cgacgccatc aggcgcaaca 180
ggatcacctg gctcaagccc tagcgcgtca accggcacgg gtccgggtgc ctcccctggc 240
acgtccagca ccggatcacc cggatcgagc ccatccgcct caaccggaac cggacccggt 300
acaccagggt cgggaacagc ctcctcgtca ccaggctcct caaccccctc gggagccacg 360
ggttcgcccg gttcgtcaac gccttccgga gcaactggta gccccggagc atcgccagga 420
acttcgagca cggggtcgcc cgcctcgagc 450
<210> 68
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-1, DNA序列
<400> 68
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atcctccagt gctgaagagg caccagaggg agatcacccg cactaccctg 2340
cagagtgatc aggaagagat cgactacgac gatacaattt ctgtggaaat gaagaaagag 2400
gacttcgata tctatgacga agatgagaac cagagtcctc gatcattcca gaagaaaacc 2460
aggcattact ttattgccgc agtggagcgg ctgtgggatt atggcatgtc ctctagtcct 2520
cacgtgctgc gaaatagggc ccagtcagga agcgtcccac agttcaagaa agtggtcttc 2580
caggagttta cagacgggtc ctttactcag ccactgtaca ggggcgaact gaacgagcac 2640
ctgggactgc tggggcccta tatcagagca gaagtggagg ataacattat ggtcaccttc 2700
agaaatcagg cctctcggcc ttacagtttt tattcaagcc tgatctctta cgaagaggac 2760
cagcgacagg gagctgaacc acgaaaaaac ttcgtgaagc ctaatgagac caaaacatac 2820
ttttggaagg tgcagcacca tatggcccca acaaaagacg agttcgattg caaggcatgg 2880
gcctattttt ctgacgtgga tctggagaag gacgtgcaca gtggcctgat tggcccactg 2940
ctggtgtgcc atactaacac cctgaatcca gcccacggcc ggcaggtcac tgtccaggag 3000
ttcgctctgt tctttaccat ctttgatgag acaaagagct ggtacttcac cgaaaacatg 3060
gagcgaaatt gcagggctcc atgtaacatt cagatggaag accccacatt caaggagaac 3120
taccgctttc atgctatcaa tggatacatc atggatactc tgcccgggct ggtcatggca 3180
caggaccaga gaatccggtg gtatctgctg agcatgggca gcaacgagaa tatccactca 3240
attcatttca gcgggcacgt gtttactgtc aggaagaaag aagagtacaa gatggccctg 3300
tacaacctgt atcccggcgt gttcgaaacc gtcgagatgc tgcctagcaa ggccggaatc 3360
tggagagtgg aatgcctgat tggagagcac ctgcatgctg ggatgtctac cctgtttctg 3420
gtgtacagta ataagtgtca gacacccctg ggaatggcat ccgggcatat cagggatttc 3480
cagattaccg catctggaca gtacggacag tgggcaccta agctggctag actgcactat 3540
tccggatcta tcaacgcttg gtccacaaaa gagcctttct cttggattaa ggtggacctg 3600
ctggccccaa tgatcattca tggcatcaaa actcagggag ctcggcagaa gttctcctct 3660
ctgtacatct cacagtttat catcatgtac agcctggatg ggaagaaatg gcagacatac 3720
cgcggcaata gcacaggaac tctgatggtg ttctttggca acgtggacag cagcggaatc 3780
aagcacaaca ttttcaatcc ccctatcatt gctagataca tccggctgca cccaacccat 3840
tattctattc gaagtacact gaggatggaa ctgatgggat gcgatctgaa cagttgttca 3900
atgcccctgg ggatggagtc caaggcaatc tctgacgccc agattaccgc cagctcctac 3960
ttcactaata tgtttgctac ctggagccct tccaaagcaa gactgcacct gcaaggccgc 4020
agcaacgcat ggcgaccaca ggtgaacaat cccaaggagt ggttgcaggt cgattttcag 4080
aaaactatga aggtgaccgg ggtcacaact cagggcgtga aaagtctgct gacctcaatg 4140
tacgtcaagg agttcctgat ctctagttca caggacggac atcagtggac actgttcttt 4200
cagaacggga aggtgaaagt cttccagggc aatcaggatt cctttacacc tgtggtcaac 4260
agtctagacc ctccactgct gaccagatac ctgagaatcc accctcagtc ctgggtgcac 4320
cagattgccc tgagaatgga agtgctggga tgcgaggccc aggatctgta ctga 4374
<210> 69
<211> 577
<212> DNA
<213> 人工序列
<220>
<223> ET启动子, DNA序列
<400> 69
ctcgaggtca attcacgcga gttaataatt accagcgcgg gccaaataaa taatccgcga 60
ggggcaggtg acgtttgccc agcgcgcgct ggtaattatt aacctcgcga atattgattc 120
gaggccgcga ttgccgcaat cgcgaggggc aggtgacctt tgcccagcgc gcgttcgccc 180
cgccccggac ggtatcgata agcttaggag cttgggctgc aggtcgaggg cactgggagg 240
atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat taggacatgt 300
ttgaacaggg gccgggcgat cagcaggtag ctctagagga tccccgtctg tctgcacatt 360
tcgtagagcg agtgttccga tactctaatc tccctaggca aggttcatat ttgtgtaggt 420
tacttattct ccttttgttg actaagtcaa taatcagaat cagcaggttt ggagtcagct 480
tggcagggat cagcagcctg ggttggaagg agggggtata aaagcccctt caccaggaga 540
agccgtcaca cagatccaca agctcctgcc accatgg 577
<210> 70
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-5
<400> 70
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 71
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-6
<400> 71
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 72
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-6-XTEN
<400> 72
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760
caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820
gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880
cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940
ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000
tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060
ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120
gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180
tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240
ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300
accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360
gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420
gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480
actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540
cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600
atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660
tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720
cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780
gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840
ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900
ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960
tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020
gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080
acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140
agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200
tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260
gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320
ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380
agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440
tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500
ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560
cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620
caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680
aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740
ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800
tgcgaggccc aggacctgta ctga 4824
<210> 73
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 73
Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser
1 5 10
<210> 74
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 74
Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser
1 5 10
<210> 75
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 75
Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro
1 5 10
<210> 76
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 76
Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser
1 5 10
<210> 77
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE, AM基序
<400> 77
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
1 5 10
<210> 78
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE, AM, AQ基序
<400> 78
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
1 5 10
<210> 79
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE, AM, AQ基序
<400> 79
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1 5 10
<210> 80
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE, AM, AQ基序
<400> 80
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
1 5 10
<210> 81
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF, AM基序
<400> 81
Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro
1 5 10
<210> 82
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF, AM基序
<400> 82
Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro
1 5 10
<210> 83
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF, AM基序
<400> 83
Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro
1 5 10
<210> 84
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF, AM基序
<400> 84
Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro
1 5 10
<210> 85
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG, AM基序
<400> 85
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
1 5 10
<210> 86
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG, AM基序
<400> 86
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
1 5 10
<210> 87
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG, AM基序
<400> 87
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
1 5 10
<210> 88
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG, AM基序
<400> 88
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
1 5 10
<210> 89
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 89
Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu
1 5 10
<210> 90
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 90
Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu
1 5 10
<210> 91
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 91
Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu
1 5 10
<210> 92
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 92
Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala
1 5 10
<210> 93
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 93
Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 94
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 94
Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala
1 5 10
<210> 95
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 95
Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro
1 5 10
<210> 96
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 96
Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser
1 5 10
<210> 97
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 97
Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 98
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 98
Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala
1 5 10
<210> 99
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 99
Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala
1 5 10
<210> 100
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 100
Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala
1 5 10
<210> 101
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 101
Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala
1 5 10
<210> 102
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 102
Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser
1 5 10
<210> 103
<211> 1607
<212> PRT
<213> 人工序列
<220>
<223> coFVIII-6-XTEN 蛋白质序列
<400> 103
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Thr
755 760 765
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr
770 775 780
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
785 790 795 800
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr
805 810 815
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro
820 825 830
Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
835 840 845
Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
850 855 860
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
865 870 875 880
Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
885 890 895
Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ala
900 905 910
Ser Ser Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
915 920 925
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser
930 935 940
Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn
945 950 955 960
Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala
965 970 975
Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val
980 985 990
Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val
995 1000 1005
Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr
1010 1015 1020
Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile
1025 1030 1035
Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln
1040 1045 1050
Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu
1055 1060 1065
Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys
1070 1075 1080
Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met
1085 1090 1095
Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
1100 1105 1110
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly
1115 1120 1125
Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly
1130 1135 1140
Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
1145 1150 1155
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1160 1165 1170
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1175 1180 1185
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1190 1195 1200
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1205 1210 1215
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1220 1225 1230
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1235 1240 1245
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1250 1255 1260
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1265 1270 1275
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1280 1285 1290
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1295 1300 1305
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1310 1315 1320
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1325 1330 1335
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1340 1345 1350
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1355 1360 1365
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1370 1375 1380
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1385 1390 1395
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1400 1405 1410
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1415 1420 1425
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1430 1435 1440
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1445 1450 1455
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1460 1465 1470
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1475 1480 1485
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1490 1495 1500
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1505 1510 1515
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1520 1525 1530
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1535 1540 1545
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1550 1555 1560
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1565 1570 1575
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1580 1585 1590
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1595 1600 1605

Claims (47)

1.一种治疗有需要的受试者的出血性障碍的方法,所述方法包括向所述受试者给予至少一个剂量的5x1010或更少转导单位/kg(TU/kg)的慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列具有:
(i)与SEQ ID NO:1的核苷酸58-2277和2320-4374的至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(ii)与SEQ ID NO:2的核苷酸58-2277和2320-4374的至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iii)与SEQ ID NO:70的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iv)与SEQ ID NO:71的核苷酸58-2277和2320-4374的至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(v)与SEQ ID NO:3的核苷酸58-2277和2320-4374的至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(vi)与SEQ ID NO:4的核苷酸58-2277和2320-4374的至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(vii)与SEQ ID NO:5的核苷酸58-2277和2320-4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(viii)与SEQ ID NO:6的核苷酸58-2277和2320-4374的至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(ix)或(i)至(viii)的任何组合。
2.一种治疗有需要的受试者的出血性障碍的方法,所述方法包括向所述受试者给予至少一个剂量的5x1010或更少转导单位/kg(TU/kg)的慢病毒载体,所述慢病毒载体包含分离的核酸分子,所述分离的核酸分子包含核苷酸序列,所述核苷酸序列包含编码因子VIII(FVIII)多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;
(a)其中所述第一核酸序列具有:
(i)与SEQ ID NO:3的核苷酸58-2277和2320-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(ii)与SEQ ID NO:4的核苷酸58-2277和2320-1791的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iii)与SEQ ID NO:5的核苷酸58-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(iv)与SEQ ID NO:6的核苷酸58-1791的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(b)其中所述第二核苷酸序列具有:
(i)与SEQ ID NO:3的核苷酸1792-2277和2320-4374的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(ii)与SEQ ID NO:4的核苷酸1792-2277和2320-4374的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;
(iii)与SEQ ID NO:5的核苷酸1792-2277和2320-4374的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(iv)与SEQ ID NO:6的核苷酸1792-2277和2320-4374的至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性;或
(c)(a)与(b)的任何组合;并且
其中所述N末端部分和所述C末端部分一起具有FVIII多肽活性。
3.根据权利要求1或2所述的方法,其中所述剂量为约5x1010TU/kg、约4.5x1010TU/kg、约4x1010TU/kg、约3.5x1010TU/kg、约3x1010TU/kg、约2.5x1010TU/kg、约2x1010TU/kg、约1.5x1010TU/kg、约1x1010TU/kg、约9.5x109TU/kg、约9x109TU/kg、约8.5x109TU/kg、约8x109TU/kg、约7.5x109TU/kg、约7x109TU/kg、约6.5x109TU/kg、约6x109TU/kg、约5.5x109TU/kg、约5x109TU/kg、约4.5x109TU/kg、约4x109TU/kg、约3.5x109TU/kg、约3x109TU/kg、约2.5x109TU/kg、约2x109TU/kg、约1.5x109TU/kg、约1x109TU/kg、约9.5x108TU/kg、约9x108TU/kg、约8.5x108TU/kg、约8x108TU/kg、约7.5x108TU/kg、约7x108TU/kg、约6.5x108TU/kg、约6x108TU/kg、约5.5x108TU/kg、约5x108TU/kg、约4.5x108TU/kg、约4x108TU/kg、约3.5x108TU/kg、约3x108TU/kg、约2.5x108TU/kg、约2x108TU/kg、约1.5x108TU/kg、或约1x108TU/kg。
4.根据权利要求1或2所述的方法,其中所述剂量为小于约5x1010TU/kg、小于约4.5x1010TU/kg、小于约4x1010TU/kg、小于约3.5x1010TU/kg、小于约3x1010TU/kg、小于约2.5x1010TU/kg、小于约2x1010TU/kg、小于约1.5x1010TU/kg、小于约1x1010TU/kg、小于约9.5x109TU/kg、小于约9x109TU/kg、小于约8.5x109TU/kg、小于约8x109TU/kg、小于约7.5x109TU/kg、小于约7x109TU/kg、小于约6.5x109TU/kg、小于约6x109TU/kg、小于约5.5x109TU/kg、小于约5x109TU/kg、小于约4.5x109TU/kg、小于约4x109TU/kg、小于约3.5x109TU/kg、小于约3x109TU/kg、小于约2.5x109TU/kg、小于约2x109TU/kg、小于约1.5x109TU/kg、小于约1x109TU/kg、小于约9.5x108TU/kg、小于约9x108TU/kg、小于约8.5x108TU/kg、小于约8x108TU/kg、小于约7.5x108TU/kg、小于约7x108TU/kg、小于约6.5x108TU/kg、小于约6x108TU/kg、小于约5.5x108TU/kg、小于约5x108TU/kg、小于约4.5x108TU/kg、小于约4x108TU/kg、小于约3.5x108TU/kg、小于约3x108TU/kg、小于约2.5x108TU/kg、小于约2x108TU/kg、小于约1.5x108TU/kg、或小于约1x108TU/kg。
5.根据权利要求1或2所述的方法,其中所述剂量为在1x108与5x1010TU/kg之间、在1x108与5x109TU/kg之间、在1x108与1x109TU/kg之间、在1x108与1x1010TU/kg之间、在1x109与5x1010TU/kg之间、在2x109与5x1010TU/kg之间、在3x109与5x1010TU/kg之间、在4x109与5x1010TU/kg之间、在5x109与5x1010TU/kg之间、在6x109与5x1010TU/kg之间、在7x109与5x1010TU/kg之间、8x109与5x1010TU/kg之间、在9x109与5x1010TU/kg之间、在1010与5x1010TU/kg之间、在1.5x1010与5x1010TU/kg之间、在2x1010与5x1010TU/kg之间、在2.5x1010与5x1010TU/kg之间、在3x1010与5x1010TU/kg之间、在3.5x1010与5x1010TU/kg之间、在4x1010与5x1010TU/kg之间、或在4.5x1010与5x1010TU/kg之间。
6.根据权利要求1或2所述的方法,其中所述剂量为在1x109与5x1010TU/kg之间、在1x109与4.5x1010TU/kg之间、在1x109与4x1010TU/kg之间、在1x109与3.5x1010TU/kg之间、在1x109与3x1010TU/kg之间、在1x109与2.5x1010TU/kg之间、在1x109与2x1010TU/kg之间、在1x109与1.5x1010TU/kg之间、在1x109与1x1010TU/kg之间、在1x109与9x109TU/kg之间、在1x109与8x109TU/kg之间、在1x109与7x109TU/kg之间、在1x109与6x109TU/kg之间、在1x109与5x109TU/kg之间、在1x109与4x109TU/kg之间、在1x109与3x109TU/kg之间、以及在1x109与2x109TU/kg之间。
7.根据权利要求1或2所述的方法,其中所述剂量为在1x1010与2x1010TU/kg之间、在1.1x1010与1.9x1010TU/kg之间、在1.2x1010与1.8x1010TU/kg之间、在1.3x1010与1.7x1010TU/kg之间、或在1.4x1010与1.6x1010TU/kg之间。
8.根据权利要求1或2所述的方法,其中所述剂量为约1.5x1010TU/kg。
9.根据权利要求1或2所述的方法,其中所述剂量为约1.0x109TU/kg。
10.根据权利要求1或2所述的方法,其中所述剂量为约3.0x109TU/kg。
11.根据权利要求1或2所述的方法,其中所述剂量为约6.0x109TU/kg。
12.根据权利要求1或2所述的方法,其中所述剂量为约1x108TU/kg、约8.3x108TU/kg、约1.5x109TU/kg、约4.5x109TU/kg、或约1.3x1010TU/kg。
13.根据权利要求1或2所述的方法,其中所述剂量为在2.5x109TU/kg与3.5x109TU/kg之间、在2.6x109TU/kg与3.4x109TU/kg之间、在2.7x109TU/kg与3.3x109TU/kg之间、在2.8x109TU/kg与3.2x109TU/kg之间、或在2.9x109TU/kg与3.1x109TU/kg之间。
14.根据权利要求1或2所述的方法,其中所述剂量为在5.5x109TU/kg与6.5x109TU/kg之间、在5.6x109TU/kg与6.4x109TU/kg之间、在5.7x109TU/kg与6.3x109TU/kg之间、在5.8x109TU/kg与6.2x109TU/kg之间、或在5.9x109TU/kg与6.1x109TU/kg之间。
15.根据权利要求1至14中任一项所述的方法,其中在给予所述慢病毒载体后24小时至48小时,相对于被给予包含含有SEQ ID NO:16的核酸分子的参考载体的受试者,血浆FVIII活性增加。
16.根据权利要求15所述的方法,其中所述血浆FVIII活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、或至少约200倍。
17.根据权利要求1至16中任一项所述的方法,其中将所述慢病毒载体作为单一剂量或多个剂量给予。
18.根据权利要求1至17中任一项所述的方法,其中将所述慢病毒载体经由静脉内注射给予。
19.根据权利要求1至18中任一项所述的方法,其中所述受试者是儿科受试者。
20.根据权利要求1至18中任一项所述的方法,其中所述受试者是成年受试者。
21.根据权利要求1至20中任一项所述的方法,其中所述慢病毒载体包含组织特异性启动子。
22.根据权利要求21所述的方法,其中所述组织特异性启动子选择性地增强所述具有FVIII活性的多肽在靶肝细胞中的表达。
23.根据权利要求22所述的方法,其中选择性地增强所述具有FVIII活性的多肽在靶肝细胞中的表达的组织特异性启动子包括mTTR启动子。
24.根据权利要求22或23所述的方法,其中所述靶肝细胞是肝细胞。
25.根据权利要求24所述的方法,其中将所述分离的核酸分子稳定地整合至所述肝细胞的基因组中。
26.根据权利要求1至25中任一项所述的方法,其中所述出血性障碍是血友病A。
27.根据权利要求1至26中任一项所述的方法,其中所述分离的核酸分子包含LV-coFVIII-6(SEQ ID NO:71)。
28.根据权利要求1至26中任一项所述的方法,其中所述分离的核酸分子包含LV-coFVIII-6-XTEN(SEQ ID NO:72)。
29.根据权利要求1至28中任一项所述的方法,其中将所述剂量的慢病毒载体一次性给予或分为至少两个亚剂量。
30.根据权利要求1至28中任一项所述的方法,其中将所述剂量的慢病毒载体重复至少两次。
31.根据权利要求1至30中任一项所述的方法,其中编码具有FVIII活性的多肽的核苷酸序列还包含编码信号肽的核酸序列,其中所述编码信号肽的核酸序列具有与以下各项的至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性:
(i)SEQ ID NO:1的核苷酸1至57;
(ii)SEQ ID NO:2的核苷酸1至57;
(iii)SEQ ID NO:3的核苷酸1至57;
(iv)SEQ ID NO:4的核苷酸1至57;
(v)SEQ ID NO:5的核苷酸1至57;
(vi)SEQ ID NO:6的核苷酸1至57;
(vii)SEQ ID NO:70的核苷酸1至57;
(viii)SEQ ID NO:71的核苷酸1至57;或
(ix)SEQ ID NO:68的核苷酸1至57。
32.根据权利要求1至31中任一项所述的方法,其中编码具有FVIII活性的多肽的核苷酸序列包含选自以下各项的一种或多种特性:
(a)所述核酸分子或其部分的人密码子适应指数相对于SEQ ID NO:16增加;
(b)所述核苷酸序列或其部分的最优密码子的频率相对于SEQ ID NO:16增加;
(c)与SEQ ID NO:16中G/C核苷酸的百分比相比,所述核苷酸序列或其部分含有更高的G/C核苷酸百分比;
(d)所述核苷酸序列或其部分的相对同义密码子使用度相对于SEQ ID NO:16增加;
(e)所述核苷酸序列或其部分的有效密码子数相对于SEQ ID NO:16减少;
(f)所述核苷酸序列相对于SEQ ID NO:16含有更少的MARS/ARS序列(SEQ ID NO:21和22);
(g)所述核苷酸序列相对于SEQ ID NO:16含有更少的去稳定元件(SEQ ID NO:23和24);以及
(h)其任何组合。
33.根据权利要求1至32中任一项所述的方法,其中编码具有FVIII活性的多肽的核苷酸序列还包含编码异源氨基酸序列的异源核苷酸序列。
34.根据权利要求33所述的方法,其中所述异源氨基酸序列是免疫球蛋白恒定区或其部分、XTEN、转铁蛋白、白蛋白或PAS序列。
35.根据权利要求33或34所述的方法,其中所述异源氨基酸序列与由编码具有FVIII活性的多肽的核苷酸序列编码的氨基酸序列的N末端或C末端连接,或者在选自表3的一个或多个插入位点插入由所述核苷酸序列编码的氨基酸序列中的两个氨基酸之间。
36.根据权利要求1至35中任一项所述的方法,其中所述FVIII多肽是全长FVIII或B结构域缺失的FVIII。
37.根据权利要求1至36中任一项所述的方法,其中所述慢病毒载体包含脂质外壳。
38.根据权利要求37所述的方法,其中所述脂质外壳包含一种或多种CD47多肽。
39.根据权利要求38所述的方法,其中所述CD47多肽是人CD47多肽。
40.根据权利要求37至39中任一项所述的方法,其中所述脂质外壳包含高浓度的CD47多肽。
41.根据权利要求37至40中任一项所述的方法,其中所述脂质外壳不包含MHC-I多肽。
42.根据权利要求37至41中任一项所述的方法,其中所述脂质外壳包含高浓度的CD47多肽并且不包含MHC-I多肽。
43.根据权利要求1至42中任一项所述的方法,其中所述慢病毒载体是在宿主细胞中产生的。
44.根据权利要求43所述的方法,其中所述宿主细胞表达CD47。
45.根据权利要求43或44所述的方法,其中所述宿主细胞不表达MHC-I。
46.根据权利要求43至45中任一项所述的方法,其中所述宿主细胞呈CD47/MHC-I-
47.根据权利要求43至46中任一项所述的方法,其中所述宿主细胞是CD47/MHC-I-HEK293T细胞。
CN201980022379.7A 2018-02-01 2019-01-31 表达因子viii的慢病毒载体的用途 Pending CN111918674A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862625145P 2018-02-01 2018-02-01
US62/625,145 2018-02-01
US201862671915P 2018-05-15 2018-05-15
US62/671,915 2018-05-15
US201962793158P 2019-01-16 2019-01-16
US62/793,158 2019-01-16
PCT/US2019/016122 WO2019152692A1 (en) 2018-02-01 2019-01-31 Use of lentiviral vectors expressing factor viii

Publications (1)

Publication Number Publication Date
CN111918674A true CN111918674A (zh) 2020-11-10

Family

ID=65409653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980022379.7A Pending CN111918674A (zh) 2018-02-01 2019-01-31 表达因子viii的慢病毒载体的用途

Country Status (14)

Country Link
US (1) US20210038744A1 (zh)
EP (1) EP3746136A1 (zh)
JP (2) JP2021512126A (zh)
KR (1) KR20200118089A (zh)
CN (1) CN111918674A (zh)
AU (1) AU2019215063A1 (zh)
BR (1) BR112020015228A2 (zh)
CA (1) CA3090136A1 (zh)
CO (1) CO2020010376A2 (zh)
IL (1) IL276402A (zh)
MX (1) MX2020008152A (zh)
SG (1) SG11202007114VA (zh)
TW (1) TW201946929A (zh)
WO (1) WO2019152692A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113234673A (zh) * 2021-05-14 2021-08-10 上海赛笠生物科技有限公司 一种优化的食蟹猴单个核细胞分离方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2959747T3 (es) 2013-02-15 2024-02-28 Bioverativ Therapeutics Inc Gen del factor VIII optimizado
LT3411478T (lt) 2016-02-01 2022-09-26 Bioverativ Therapeutics Inc. Optimizuoti viii faktoriaus genai
EP3235908A1 (en) 2016-04-21 2017-10-25 Ecole Normale Superieure De Lyon Methods for selectively modulating the activity of distinct subtypes of cells
KR20200034668A (ko) 2017-05-08 2020-03-31 플래그쉽 파이어니어링 이노베이션스 브이, 인크. 막 융합을 촉진시키기 위한 조성물 및 그의 용도
SG11202011015QA (en) * 2018-05-15 2020-12-30 Flagship Pioneering Innovations V Inc Fusosome compositions and uses thereof
WO2021067389A1 (en) * 2019-09-30 2021-04-08 Bioverativ Therapeutics Inc. Lentiviral vector formulations
CN111808863B (zh) * 2020-06-23 2021-05-28 康霖生物科技(杭州)有限公司 一种密码子优化的凝血因子viii基因及其构建体
KR20230074703A (ko) * 2020-06-24 2023-05-31 바이오버라티브 테라퓨틱스 인크. 유리 인자 viii을 상기 단백질이 발현되도록 변형된 렌티바이러스 벡터의 제제로부터 제거하는 방법
EP4320242A1 (en) 2021-04-08 2024-02-14 Sana Biotechnology, Inc. Cd8-specific antibody constructs and compositions thereof
EP4083217A1 (en) * 2021-04-26 2022-11-02 Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas O.A., M.P. (CIEMAT) In vivo lentiviral gene therapy for the treatment of primary hyperoxaluria type 1

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017136358A1 (en) * 2016-02-01 2017-08-10 Bioverativ Therapeutics Inc. Optimized factor viii genes

Family Cites Families (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4868112A (en) 1985-04-12 1989-09-19 Genetics Institute, Inc. Novel procoagulant proteins
KR910006424B1 (ko) 1985-08-21 1991-08-24 인코텍스 비.브이 편성브리프(brief) 제조방법
WO1987004187A1 (en) 1986-01-03 1987-07-16 Genetics Institute, Inc. METHOD FOR PRODUCING FACTOR VIII:c-TYPE PROTEINS
US5595886A (en) 1986-01-27 1997-01-21 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5610278A (en) 1986-06-24 1997-03-11 Novo Nordisk A/S Process for producing a coagulation active complex of factor VIII fragments
WO1988007089A1 (en) 1987-03-18 1988-09-22 Medical Research Council Altered antibodies
US6060447A (en) 1987-05-19 2000-05-09 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US5171844A (en) 1987-06-12 1992-12-15 Gist-Brocades N.W. Proteins with factor viii activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
US6346513B1 (en) 1987-06-12 2002-02-12 Baxter Trading Gmbh Proteins with factor VIII activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
DE3720246A1 (de) 1987-06-19 1988-12-29 Behringwerke Ag Faktor viii:c-aehnliches molekuel mit koagulationsaktivitaet
FR2619314B1 (fr) 1987-08-11 1990-06-15 Transgene Sa Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant
US6780613B1 (en) 1988-10-28 2004-08-24 Genentech, Inc. Growth hormone variants
EP0461200B1 (en) 1989-02-21 1997-01-22 Washington University Modified forms of reproductive hormones
SE465222C5 (sv) 1989-12-15 1998-02-10 Pharmacia & Upjohn Ab Ett rekombinant, humant faktor VIII-derivat och förfarande för dess framställning
IE922437A1 (en) 1991-07-25 1993-01-27 Idec Pharma Corp Recombinant antibodies for human therapy
SE504074C2 (sv) 1993-07-05 1996-11-04 Pharmacia Ab Proteinberedning för subkutan, intramuskulär eller intradermal administrering
GB9422383D0 (en) 1994-11-05 1995-01-04 Wellcome Found Antibodies
US6485726B1 (en) 1995-01-17 2002-11-26 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6030613A (en) 1995-01-17 2000-02-29 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6086875A (en) 1995-01-17 2000-07-11 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of immunogens
US6096871A (en) 1995-04-14 2000-08-01 Genentech, Inc. Polypeptides altered to contain an epitope from the Fc region of an IgG molecule for increased half-life
US6121022A (en) 1995-04-14 2000-09-19 Genentech, Inc. Altered polypeptides with increased half-life
US5739277A (en) 1995-04-14 1998-04-14 Genentech Inc. Altered polypeptides with increased half-life
US5869046A (en) 1995-04-14 1999-02-09 Genentech, Inc. Altered polypeptides with increased half-life
SE9503380D0 (sv) 1995-09-29 1995-09-29 Pharmacia Ab Protein derivatives
US6013516A (en) 1995-10-06 2000-01-11 The Salk Institute For Biological Studies Vector and method of use for nucleic acid delivery to non-dividing cells
US6458563B1 (en) 1996-06-26 2002-10-01 Emory University Modified factor VIII
EP0918872B1 (en) 1996-08-02 2008-02-20 Bristol-Myers Squibb Company A method for inhibiting immunoglobulin-induced toxicity resulting from the use of immunoglobulins in therapy and in vivo diagnosis
GB9621680D0 (en) 1996-10-17 1996-12-11 Oxford Biomedica Ltd Lentiviral vectors
DE69703974T2 (de) 1996-10-17 2001-07-19 Oxford Biomedica Ltd Retrovirale vektoren
GB9622500D0 (en) 1996-10-29 1997-01-08 Oxford Biomedica Ltd Therapeutic gene
WO1998023289A1 (en) 1996-11-27 1998-06-04 The General Hospital Corporation MODULATION OF IgG BINDING TO FcRn
US6277375B1 (en) 1997-03-03 2001-08-21 Board Of Regents, The University Of Texas System Immunoglobulin-like domains with increased half-lives
CA2225189C (en) 1997-03-06 2010-05-25 Queen's University At Kingston Canine factor viii gene, protein and methods of use
US6207455B1 (en) 1997-05-01 2001-03-27 Lung-Ji Chang Lentiviral vectors
GB9722131D0 (en) 1997-10-20 1997-12-17 Medical Res Council Method
US5994136A (en) 1997-12-12 1999-11-30 Cell Genesys, Inc. Method and means for producing high titer, safe, recombinant lentivirus vectors
US6528624B1 (en) 1998-04-02 2003-03-04 Genentech, Inc. Polypeptide variants
US6242195B1 (en) 1998-04-02 2001-06-05 Genentech, Inc. Methods for determining binding of an analyte to a receptor
JP2002510481A (ja) 1998-04-02 2002-04-09 ジェネンテック・インコーポレーテッド 抗体変異体及びその断片
US6194551B1 (en) 1998-04-02 2001-02-27 Genentech, Inc. Polypeptide variants
GB9809951D0 (en) 1998-05-08 1998-07-08 Univ Cambridge Tech Binding molecules
CA2341029A1 (en) 1998-08-17 2000-02-24 Abgenix, Inc. Generation of modified molecules with increased serum half-lives
EP1006183A1 (en) 1998-12-03 2000-06-07 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Recombinant soluble Fc receptors
US6737056B1 (en) 1999-01-15 2004-05-18 Genentech, Inc. Polypeptide variants with altered effector function
ES2694002T3 (es) 1999-01-15 2018-12-17 Genentech, Inc. Polipéptido que comprende una región Fc de IgG1 humana variante
JP4979851B2 (ja) 1999-04-29 2012-07-18 ジービーピー アイピー リミテッド ライアビリティ カンパニー 高いタイターで安全な組換えレンチウイルスベクターの作製方法
AU2001259063A1 (en) 2000-04-12 2001-10-30 Human Genome Sciences, Inc. Albumin fusion proteins
GB0029407D0 (en) 2000-12-01 2001-01-17 Affitech As Product
DK1355919T3 (da) 2000-12-12 2011-03-14 Medimmune Llc Molekyler med længere halveringstider, sammensætninger og anvendelser deraf
JP4336771B2 (ja) 2001-03-09 2009-09-30 モルフォシス アーゲー 血清アルブミン結合部分
EP1395293B1 (en) 2001-05-14 2009-07-22 Gbp Ip, Llc Lentiviral vectors encoding clotting factors for gene therapy
KR101271635B1 (ko) 2001-12-21 2013-06-12 휴먼 게놈 사이언시즈, 인코포레이티드 알부민 융합 단백질
EP1463751B1 (en) 2001-12-21 2013-05-22 Human Genome Sciences, Inc. Albumin fusion proteins
US20080194481A1 (en) 2001-12-21 2008-08-14 Human Genome Sciences, Inc. Albumin Fusion Proteins
US20040002587A1 (en) 2002-02-20 2004-01-01 Watkins Jeffry D. Fc region variants
US20040132101A1 (en) 2002-09-27 2004-07-08 Xencor Optimized Fc variants and methods for their generation
AU2003209446B2 (en) 2002-03-01 2008-09-25 Immunomedics, Inc. Bispecific antibody point mutations for enhancing rate of clearance
US7317091B2 (en) 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
CN100343393C (zh) 2002-03-15 2007-10-17 布赖汉姆妇女医院 适合治疗剂全身性递送的中央气道给药
US6615782B1 (en) 2002-04-12 2003-09-09 Delphi Technologies, Inc. Two-step finger follower rocker arm
ATE536188T1 (de) 2002-08-14 2011-12-15 Macrogenics Inc Fcgammariib-spezifische antikörper und verfahren zur verwendung davon
DK2345671T3 (en) 2002-09-27 2016-02-15 Xencor Inc Optimized Fc variants and methods for their formation
AU2003286467B2 (en) 2002-10-15 2009-10-01 Abbvie Biotherapeutics Inc. Alteration of FcRn binding affinities or serum half-lives of antibodies by mutagenesis
GB2395337B (en) 2002-11-14 2005-12-28 Gary Michael Wilson Warning Unit
WO2004063351A2 (en) 2003-01-09 2004-07-29 Macrogenics, Inc. IDENTIFICATION AND ENGINEERING OF ANTIBODIES WITH VARIANT Fc REGIONS AND METHODS OF USING SAME
US7041635B2 (en) 2003-01-28 2006-05-09 In2Gen Co., Ltd. Factor VIII polypeptide
US8388955B2 (en) 2003-03-03 2013-03-05 Xencor, Inc. Fc variants
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
ES2298745T3 (es) 2003-04-24 2008-05-16 Fondazione Centro San Raffaele Del Monte Tabor Promotores bidireccionales de sintesis y utilizacion de los mismos.
TWI353991B (en) 2003-05-06 2011-12-11 Syntonix Pharmaceuticals Inc Immunoglobulin chimeric monomer-dimer hybrids
GB0324368D0 (en) 2003-10-17 2003-11-19 Univ Cambridge Tech Polypeptides including modified constant regions
GB0325379D0 (en) * 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
WO2005077981A2 (en) 2003-12-22 2005-08-25 Xencor, Inc. Fc POLYPEPTIDES WITH NOVEL Fc LIGAND BINDING SITES
BRPI0506771A (pt) 2004-01-12 2007-05-22 Applied Molecular Evolution anticorpo, e, composição farmacêutica
WO2005092925A2 (en) 2004-03-24 2005-10-06 Xencor, Inc. Immunoglobulin variants outside the fc region
WO2005123780A2 (en) 2004-04-09 2005-12-29 Protein Design Labs, Inc. Alteration of fcrn binding affinities or serum half-lives of antibodies by mutagenesis
WO2006085967A2 (en) 2004-07-09 2006-08-17 Xencor, Inc. OPTIMIZED ANTI-CD20 MONOCONAL ANTIBODIES HAVING Fc VARIANTS
CN101987870B (zh) 2004-07-15 2013-07-03 赞科股份有限公司 优化的Fc变体
WO2006047350A2 (en) 2004-10-21 2006-05-04 Xencor, Inc. IgG IMMUNOGLOBULIN VARIANTS WITH OPTIMIZED EFFECTOR FUNCTION
KR20130114758A (ko) 2005-05-27 2013-10-17 오스페달레 산 라파엘 에스.알.엘. Mi-rna를 포함하는 유전자 벡터
JP2009504157A (ja) 2005-08-12 2009-02-05 ヒューマン ジノーム サイエンシーズ, インコーポレイテッド アルブミン融合タンパク質
US8048848B2 (en) 2006-02-03 2011-11-01 Prolor Biotech Ltd. Long-acting interferons and derivatives thereof and methods thereof
GB0614780D0 (en) 2006-07-25 2006-09-06 Ucb Sa Biological products
WO2008033413A2 (en) 2006-09-14 2008-03-20 Human Genome Sciences, Inc. Albumin fusion proteins
US20080260738A1 (en) 2007-04-18 2008-10-23 Moore Margaret D Single chain fc, methods of making and methods of treatment
BRPI0811857A2 (pt) 2007-05-14 2014-10-21 Biogen Idec Inc Regiões fc (scfc) de cadeia simples, polipeptídeos de aglutinação que as compreendem e métodos relacionados.
SI2173890T1 (sl) 2007-06-21 2011-06-30 Univ Muenchen Tech Biološko aktivni proteini, ki imajo povečano in vivo in/ali in vitro stabilnost
WO2010055413A1 (en) 2008-11-12 2010-05-20 Fondazione Centro San Raffaele Del Monte Tabor Gene vector for inducing transgene-specific immune tolerance
MX362028B (es) 2009-02-03 2019-01-04 Amunix Pharmaceuticals Inc Polipeptidos recombinantes extendidos y composiciones que comprenden los mismos.
US8680050B2 (en) 2009-02-03 2014-03-25 Amunix Operating Inc. Growth hormone polypeptides fused to extended recombinant polypeptides and methods of making and using same
US8703717B2 (en) 2009-02-03 2014-04-22 Amunix Operating Inc. Growth hormone polypeptides and methods of making and using same
US9050269B2 (en) 2009-03-10 2015-06-09 The Trustees Of The University Of Pennsylvania Protection of virus particles from phagocytosis by expression of CD47
BRPI1010873B1 (pt) 2009-04-30 2020-04-14 Fond Centro San Raffaele Del Monte Tabor usos de um vetor de genes, de uma composição farmacêutica e de uma célula
US20120134977A1 (en) 2009-06-01 2012-05-31 Yeda Research And Development Co. Ltd. Prodrugs containing albumin binding probe
MX354555B (es) 2009-06-08 2018-03-09 Amunix Operating Inc Polipeptidos de la hormona de crecimiento y metodos de preparacion y su uso.
ES2705249T3 (es) 2009-06-08 2019-03-22 Amunix Operating Inc Polipéptidos reguladores de glucosa y métodos para su producción y uso
GB0911870D0 (en) * 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
AU2010290077C1 (en) 2009-08-24 2015-12-03 Bioverativ Therapeutics Inc. Coagulation factor IX compositions and methods of making and using same
WO2011028344A2 (en) 2009-08-25 2011-03-10 Amunix Operating Inc. Interleukin-1 receptor antagonist compositions and methods of making and using same
MX2013000301A (es) 2010-07-09 2013-05-09 Biogen Idec Hemophilia Inc Factores quimericos de coagulacion.
BR112014017165B1 (pt) 2012-01-12 2023-05-02 Bioverativ Therapeutics Inc Proteína quimérica compreendendo uma proteína de fator viii, composição farmacêutica, e seus usos
EP3549953A1 (en) 2012-02-15 2019-10-09 Bioverativ Therapeutics Inc. Recombinant factor viii proteins
ES2771208T3 (es) 2012-02-15 2020-07-06 Bioverativ Therapeutics Inc Composiciones de factor VIII y métodos de preparación y uso de las mismas
ES2959747T3 (es) 2013-02-15 2024-02-28 Bioverativ Therapeutics Inc Gen del factor VIII optimizado
CN106456718A (zh) 2014-01-10 2017-02-22 比奥根Ma公司 因子viii嵌合蛋白及其用途
GB201412494D0 (en) * 2014-07-14 2014-08-27 Ospedale San Raffaele And Fond Telethon Vector production

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017136358A1 (en) * 2016-02-01 2017-08-10 Bioverativ Therapeutics Inc. Optimized factor viii genes

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MICHELA MILANI: "Genome editing for scalable production of alloantigen-free lentiviral vectors for in vivo gene therapy", 《EMBO MOLECULAR MEDICINE》, vol. 9, no. 11, pages 1558 *
NISHA G SOSALE: ""Marker of Self"CD47 on lentiviral vectors decreases macrophage-mediated clearance and increases delivery to SIRPA-expressing lung carcinoma tumors", 《MOLECULAR THERAPY ——METHODS & CLINICAL DEVELOPMENT》, pages 1 - 13 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113234673A (zh) * 2021-05-14 2021-08-10 上海赛笠生物科技有限公司 一种优化的食蟹猴单个核细胞分离方法

Also Published As

Publication number Publication date
AU2019215063A1 (en) 2020-09-03
CO2020010376A2 (es) 2021-01-29
US20210038744A1 (en) 2021-02-11
BR112020015228A2 (pt) 2020-12-29
RU2020128705A (ru) 2022-03-01
CA3090136A1 (en) 2019-08-08
JP2023179463A (ja) 2023-12-19
TW201946929A (zh) 2019-12-16
EP3746136A1 (en) 2020-12-09
JP2021512126A (ja) 2021-05-13
IL276402A (en) 2020-09-30
KR20200118089A (ko) 2020-10-14
SG11202007114VA (en) 2020-08-28
MX2020008152A (es) 2020-11-24
WO2019152692A1 (en) 2019-08-08

Similar Documents

Publication Publication Date Title
CN109072214B (zh) 优化的因子viii基因
CN111918674A (zh) 表达因子viii的慢病毒载体的用途
US20210115425A1 (en) Optimized factor ix gene
CN111247251A (zh) 核酸分子及其用途
CN113227385A (zh) 核酸分子及其用于非病毒基因疗法的用途
US20200199626A1 (en) Use of lentiviral vectors expressing factor ix
CN115279896A (zh) 慢病毒载体配制品
RU2803163C2 (ru) Применение лентивирусных векторов, экспрессирующих фактор viii
RU2816873C2 (ru) Применение лентивирусных векторов, экспрессрующих фактор ix
RU2819144C2 (ru) Молекулы нуклеиновой кислоты и пути их применения
CN118019758A (zh) 编码免疫原性降低的因子viii多肽的核酸

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination