CN113227385A - 核酸分子及其用于非病毒基因疗法的用途 - Google Patents

核酸分子及其用于非病毒基因疗法的用途 Download PDF

Info

Publication number
CN113227385A
CN113227385A CN201980065714.1A CN201980065714A CN113227385A CN 113227385 A CN113227385 A CN 113227385A CN 201980065714 A CN201980065714 A CN 201980065714A CN 113227385 A CN113227385 A CN 113227385A
Authority
CN
China
Prior art keywords
nucleic acid
itr
acid molecule
seq
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980065714.1A
Other languages
English (en)
Inventor
P·扎卡斯
D·德尔格
S·帕塔罗育-怀特
刘彤瑶
A·塞雷金
R·T·彼得斯
J·刘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bioverativ Therapeutics Inc
Original Assignee
Bioverativ Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioverativ Therapeutics Inc filed Critical Bioverativ Therapeutics Inc
Publication of CN113227385A publication Critical patent/CN113227385A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/713Double-stranded nucleic acids or oligonucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • A61K48/0033Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being non-polymeric
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14041Use of virus, viral particle or viral elements as a vector
    • C12N2750/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14211Erythrovirus, e.g. B19 virus
    • C12N2750/14241Use of virus, viral particle or viral elements as a vector
    • C12N2750/14243Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14311Parvovirus, e.g. minute virus of mice
    • C12N2750/14341Use of virus, viral particle or viral elements as a vector
    • C12N2750/14343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14311Parvovirus, e.g. minute virus of mice
    • C12N2750/14371Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Abstract

本公开文本提供了核酸分子,其包含第一反向末端重复(ITR)、第二ITR和编码靶序列的基因盒。在一些实施例中,靶序列编码miRNA和/或治疗性蛋白质。在某些实施例中,治疗性蛋白质包含凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合。在一些实施例中,第一ITR和/或第二ITR是非腺相关病毒(AAV)的ITR。本公开文本还提供了治疗受试者中的肝脏代谢病症的方法,其包括将核酸分子或由其编码的多肽施用于受试者。

Description

核酸分子及其用于非病毒基因疗法的用途
相关申请
本申请要求2018年8月9日提交的美国临时专利申请序列号62/716,826的优先权,将所述申请的全部公开内容通过提述在此并入本文。
对电子提交的序列表的引用
以ASCII文本文件电子提交的序列表(名称:SA9-465PC_SL_ST25.txt;大小:460,648字节;创建日期:2019年8月8日)的内容通过引用以其整体并入本文。
背景技术
基因疗法提供了治疗多种疾病的持久手段的可能性。过去,许多基因疗法治疗通常依赖于使用病毒。有多种可以选择用于这个目的的病毒剂,每种病毒剂具有不同特性,这使得它们更适于或更不适于基因疗法。Zhou等,Adv Drug Deliv Rev.106(Pt A):3-26,2016。然而,一些病毒载体的不期望特性(包括其免疫原性谱或其引起癌症的倾向)已经导致临床安全性问题,并且直到最近,限制其在某些应用(例如,疫苗和溶瘤策略)中的临床使用。Cotter等,Front Biosci.10:1098-105(2005)。
腺相关病毒(AAV)是一种最常研究的基因疗法载体。AAV是包围并保护大约4.8千碱基(kb)的小的单链DNA基因组的蛋白质外壳。Naso等,BioDrugs,31(4):317-334,2017。AAV属于细小病毒家族并且依赖于与其他病毒(主要是腺病毒)共感染以复制。同上。其单链基因组含有三个基因Rep(复制)、Cap(衣壳)和aap(组装)。同上。这些编码序列侧接有基因组复制和包装所需的反向末端重复(ITR)。同上。这两个顺式作用AAV ITR的长度为大约145个核苷酸,具有中断的回文序列,所述回文序列可以折叠成在DNA复制的起始期间起引物作用的T形发夹结构。
然而,使用常规AAV作为基因递送载体具有某些缺点。一个主要缺点与AAV的约4.5kb异源DNA的有限病毒包装能力有关。(Dong等,Hum Gene Ther.7(17):2101-12,1996)。另外,施用AAV载体可诱导人的免疫应答。虽然已显示AAV的免疫原性低于一些其他病毒(即腺病毒),但是衣壳蛋白可以触发人免疫系统的多种组分。参见Naso等,2017。AAV是人群中的常见病毒,并且大多数人已经暴露于AAV,因此大多数人已经产生针对其先前所暴露的特定变异体的免疫应答。这种预先存在的适应性应答可包括中和抗体(NAb)和T细胞,它们可降低随后用AAV再感染的临床功效和/或已经被转导的细胞的消除,这可能使具有预先存在的抗AAV免疫力的患者没有资格接受基于AVV的基因疗法治疗。此外,有证据表明,AAV ITR的T形发夹环易受结合AAV ITR的T形发夹结构的宿主细胞蛋白质/蛋白质复合物的抑制。参见例如,Zhou等,Scientific Reports 7:5432(2017年7月14日)。
因此,本领域需要在体外和体内环境中有效且持久地表达靶序列(例如,治疗性蛋白质和/或miRNA),同时避免现有AAV载体技术的一些无意的结果和限制。
发明内容
在某些方面中,提供了核酸分子,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在某些示例性实施例中,第一ITR包含SEQ ID NO:180中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:181中所述的核苷酸序列。在某些示例性实施例中,第一ITR包含SEQ ID NO:183中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:184中所述的核苷酸序列。在某些示例性实施例中,第一ITR包含SEQ ID NO:185中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:186中所述的核苷酸序列。在某些示例性实施例中,第一ITR包含SEQ IDNO:187中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:188中所述的核苷酸序列。
在某些示例性实施例中,第一ITR和/或第二ITR由SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列组成。在某些示例性实施例中,第一ITR和第二ITR是彼此的反向互补物。
在某些示例性实施例中,核酸分子还包含启动子。在某些示例性实施例中,激活子是组织特异性启动子。在某些示例性实施例中,启动子驱动异源多核苷酸序列在选自以下的器官中的表达:肌肉、中枢神经系统(CNS)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道或其任何组合。在某些示例性实施例中,启动子驱动异源多核苷酸序列在以下细胞中的表达:肝细胞、内皮细胞、心肌细胞、骨骼肌细胞、窦状细胞、传入神经元、传出神经元、中间神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、室管膜细胞、肺上皮细胞、许旺细胞(Schwann cell)、卫星细胞、感光细胞、视网膜神经节细胞或其任何组合。在某些示例性实施例中,启动子定位于异源多核苷酸序列的5'。在某些示例性实施例中,启动子选自小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子、小鼠白蛋白启动子、三重四脯氨酸(TTP)启动子、CASI启动子、CAG启动子、巨细胞病毒(CMV)启动子、α1-抗胰蛋白酶(AAT)、肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)、结蛋白(DES)、SPc5-12、2R5Sc5-12、dMCK、tMCK和磷酸甘油酸激酶(PGK)启动子。
在某些示例性实施例中,异源多核苷酸序列还包含内含子序列。在某些示例性实施例中,内含子序列定位于异源多核苷酸序列的5'。在某些示例性实施例中,内含子序列定位于启动子的3'。在某些示例性实施例中,内含子序列包含合成内含子序列。在某些示例性实施例中,内含子序列包含SEQ ID NO:115或192。
在某些示例性实施例中,基因盒还包含转录后调控元件。在某些示例性实施例中,转录后调控元件定位于异源多核苷酸序列的3'。在某些示例性实施例中,转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(WPRE)、微小RNA结合位点、DNA核靶向序列或其任何组合。在某些示例性实施例中,微小RNA结合位点包含与miR142-3p的结合位点。
在某些示例性实施例中,基因盒还包含3'UTR多聚(A)尾序列。在某些示例性实施例中,3'UTR多聚(A)尾序列选自bGH多聚(A)、肌动蛋白多聚(A)、血红蛋白多聚(A)及其任何组合。在某些示例性实施例中,3'UTR多聚(A)尾序列包含bGH多聚(A)。
在某些示例性实施例中,基因盒还包含增强子序列。在某些示例性实施例中,增强子序列定位于第一ITR与第二ITR之间。
在某些示例性实施例中,核酸分子从5'至3'包含:第一ITR、基因盒和第二ITR;其中基因盒包含组织特异性启动子序列、内含子序列、异源多核苷酸序列、转录后调控元件和3'UTR多聚(A)尾序列。在某些示例性实施例中,基因盒从5'至3'包含:组织特异性启动子序列、内含子序列、异源多核苷酸序列、转录后调控元件和3'UTR多聚(A)尾序列。在某些示例性实施例中,组织特异性启动子序列包含TTT启动子;内含子是合成内含子;转录后调控元件包含WPRE;并且3'UTR多聚(A)尾序列包含bGHpA。
在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。
在某些示例性实施例中,异源多核苷酸序列编码凝血因子、生长因子、激素、细胞因子、抗体、其片段或其任何组合。
在某些示例性实施例中,异源多核苷酸序列编码选自以下的生长因子:肾上腺髓质素(AM)、血管生成素(Ang)、自分泌运动因子、骨形态发生蛋白(BMP)(例如,BMP2、BMP4、BMP5、BMP7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(CNTF)、白血病抑制因子(LIF)、白介素-6(IL-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-CSF)、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞集落刺激因子(GM-CSF))、表皮生长因子(EGF)、肝配蛋白(例如,肝配蛋白A1、肝配蛋白A2、肝配蛋白A3、肝配蛋白A4、肝配蛋白A5、肝配蛋白B1、肝配蛋白B2、肝配蛋白B3)、促红细胞生成素(EPO)、成纤维细胞生长因子(FGF)(例如,FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15、FGF16、FGF17、FGF18、FGF19、FGF20、FGF21、FGF22、FGF23)、胎牛促体素(FBS)、GDNF家族成员(例如,神经胶质细胞系衍生的神经营养因子(GDNF)、神经秩蛋白、普塞芬蛋白(persephin)、阿特敏蛋白(artemin))、生长分化因子-9(GDF9)、肝细胞生长因子(HGF)、肝细胞瘤衍生的生长因子(HDGF)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(IGF-1)或IGF-2、白介素(IL)(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7)、角质形成细胞生长因子(KGF)、迁移刺激因子(MSF)、巨噬细胞刺激蛋白(MSP或肝细胞生长因子样蛋白(HGFLP))、肌生成抑制蛋白(GDF-8)、神经调节蛋白(例如,神经调节蛋白1(NRG1)、NRG2、NRG3、NRG4)、神经营养蛋白(例如,脑衍生的神经营养因子(BDNF)、神经生长因子(NGF)、神经营养蛋白-3(NT-3)、NT-4、胎盘生长因子(PGF)、血小板衍生的生长因子(PDGF)、肾胺酶(renalase)(RNLS)、T细胞生长因子(TCGF)、血小板生成素(TPO)、转化生长因子(例如,转化生长因子α(TGF-α)、TGF-β、肿瘤坏死因子-α(TNF-α)和血管内皮生长因子(VEGF)及其任何组合。
在某些示例性实施例中,异源多核苷酸序列编码激素。
在某些示例性实施例中,异源多核苷酸序列编码细胞因子。
在某些示例性实施例中,异源多核苷酸序列编码抗体或其片段。
在某些示例性实施例中,异源多核苷酸序列编码选自以下的基因:X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白(frataxin))、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)及其任何组合。
在某些示例性实施例中,异源多核苷酸序列编码微小RNA(miRNA)。在某些示例性实施例中,miRNA下调选自以下的靶基因的表达:SOD1、HTT、RHO及其任何组合。
在某些示例性实施例中,异源多核苷酸序列编码选自以下的凝血因子:因子I(FI)、因子II(FII)、因子III(FIII)、因子IV(FVI)、因子V(FV)、因子VI(FVI)、因子VII(FVII)、因子VIII(FVIII)、因子IX(FIX)、因子X(FX)、因子XI(FXI)、因子XII(FXII)、因子XIII(FVIII)、血管性血友病因子(Von Willebrand factor,VWF)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原激活物抑制剂-1(PAI-1)、纤溶酶原激活物抑制剂-2(PAI2)及其任何组合。
在某些示例性实施例中,凝血因子是FVIII。在某些示例性实施例中,FVIII包含全长成熟FVIII。在某些示例性实施例中,FVIII包含与具有SEQ ID NO:106的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。
在某些示例性实施例中,FVIII包含A1结构域、A2结构域、A3结构域、C1结构域、C2结构域以及部分或无B结构域。在某些示例性实施例中,FVIII包含与SEQ ID NO:109的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。
在某些示例性实施例中,凝血因子包含异源部分。在某些示例性实施例中,异源部分选自白蛋白或其片段、免疫球蛋白Fc区、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、PAS序列、HAP序列、转铁蛋白或其片段、白蛋白结合部分、其衍生物或其任何组合。在某些示例性实施例中,异源部分连接至FVIII的N末端或C末端或者插入FVIII的两个氨基酸之间。在某些示例性实施例中,异源部分在选自表4中所列插入位点的一个或多个插入位点插入两个氨基酸之间。
在某些示例性实施例中,FVIII还包含A1结构域、A2结构域、C1结构域、C2结构域、任选的B结构域和异源部分,其中异源部分紧邻对应于成熟FVIII(SEQ ID NO:106)的氨基酸745的下游插入。
在某些示例性实施例中,FVIII还包含FcRn结合配偶体。在某些示例性实施例中,FcRn结合配偶体包含免疫球蛋白恒定结构域的Fc区。
在某些示例性实施例中,编码FVIII的核酸序列经密码子优化。在某些示例性实施例中,编码FVIII的核酸序列经密码子优化以供在人体内表达。
在某些示例性实施例中,编码FVIII的核酸序列包含与SEQ ID NO:107的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。
在某些示例性实施例中,编码FVIII的核酸序列包含与SEQ ID NO:71的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。
在某些示例性实施例中,异源多核苷酸序列经密码子优化。在某些示例性实施例中,异源多核苷酸序列经密码子优化以供在人体内表达。
在某些示例性实施例中,核酸分子是用递送剂配制。在某些示例性实施例中,递送剂包含脂质纳米颗粒。在某些示例性实施例中,递送剂选自脂质体、非脂质聚合分子和内体及其任何组合。
在某些示例性实施例中,核酸分子经配制用于静脉内、经皮、皮内、皮下、经肺或口服递送或其任何组合。在某些示例性实施例中,核酸分子经配制用于静脉内递送。
在某些方面中,提供了包含如本文所述的核酸分子的载体。
在某些方面中,提供了包含如本文所述的核酸分子的宿主细胞。
在某些方面中,提供了药物组合物,其包含如本文所述的核酸分子或载体以及医药上可接受的赋形剂。
在某些方面中,提供了药物组合物,其包含如本文所述的宿主细胞以及医药上可接受的赋形剂。
在某些方面中,提供了套组(试剂盒),其包含如本文所述的核酸分子以及用于将核酸分子施用于有需要的受试者的说明书。
在某些方面中,提供了用于产生如本文所述的核酸分子的杆状病毒系统。
在某些示例性实施例中,在昆虫细胞中产生如本文所述的核酸分子。
在某些方面中,提供了包含如本文所述的核酸分子的纳米颗粒递送系统。
在某些方面中,提供了产生多肽的方法,其包括在适宜条件下培养如本文所述的宿主细胞和回收多肽。
在某些方面中,提供了产生具有凝血活性的多肽的方法,其包括:在适宜条件下培养如本文所述的宿主细胞和回收具有凝血活性的多肽。
在某些方面中,提供了在有需要的受试者体内表达异源多核苷酸序列的方法,其包括将如本文所述的核酸分子、如本文所述的载体或如本文所述的药物组合物施用于受试者。
在某些方面中,提供了在有需要的受试者体内表达凝血因子的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。
在某些方面中,提供了治疗有需要的受试者的疾病或病症的方法,其包括将如本文所述的核酸分子、如本文所述的载体或如本文所述的药物组合物施用于受试者。
在某些方面中,提供了治疗患有凝血因子缺乏的受试者的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。
在某些方面中,提供了治疗有需要的受试者中的凝血因子缺乏的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。
在某些示例性实施例中,核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合地施用。在某些示例性实施例中,核酸分子静脉内施用的。
在某些示例性实施例中,所述方法还包括将第二药剂施用于受试者。
在某些示例性实施例中,受试者是哺乳动物。在某些示例性实施例中,受试者是人。
在某些示例性实施例中,相对于施用前受试者体内的FVIII活性,将核酸分子施用于受试者导致增加的FVIII活性,其中FVIII活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。
在某些示例性实施例中,受试者患有出血病症。在某些示例性实施例中,出血病症是血友病。在某些示例性实施例中,出血病症是血友病A。
在某些方面中,提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在某些方面中,提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII(FVIII)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在某些方面中,提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。
在某些示例性实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在某些方面中,提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。
在某些示例性实施例中,肝脏代谢病症选自苯丙酮尿症(PKU)、尿素循环疾病、溶酶体贮积病症和糖原贮积病。在某些示例性实施例中,肝脏代谢病症是苯丙酮尿症(PKU)。
在某些示例性实施例中,核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合地施用。在某些示例性实施例中,核酸分子静脉内施用的。
在某些示例性实施例中,所述方法还包括将第二药剂施用于受试者。
在某些示例性实施例中,受试者是哺乳动物。在某些示例性实施例中,受试者是人。
在某些方面中,提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。
在某些示例性实施例中,核酸分子是用递送剂配制。在某些示例性实施例中,递送剂包含脂质纳米颗粒。
在某些方面中,提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中。
在某些示例性实施例中,SbcCD复合物中的破坏包含SbcC基因和/或SbcD基因中的基因破坏。在某些示例性实施例中,SbcCD复合物中的破坏包含SbcC基因中的基因破坏。在某些示例性实施例中,SbcCD复合物中的破坏包含SbcD基因中的基因破坏。
在某些示例性实施例中,核酸分子包含第一反向末端重复(ITR)和第二ITR,其中第一和/或第二ITR是非腺相关病毒(非AAV)ITR。
在某些示例性实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在某些示例性实施例中,核酸分子还包含基因盒,其中基因盒侧接有第一ITR和第二ITR。
在某些示例性实施例中,基因盒包含异源多核苷酸序列。
在某些示例性实施例中,适宜载体是低拷贝载体。在某些示例性实施例中,适宜载体是pBR322。
在某些示例性实施例中,细菌宿主菌株不能拆分十字形DNA结构。
在某些示例性实施例中,细菌宿主菌株是PMC103,其包含基因型sbcC、recD、mcrA、ΔmcrBCF。在某些示例性实施例中,细菌宿主菌株是PMC107,其包含基因型recBC、recJ、sbcBC、mcrA、ΔmcrBCF。在某些示例性实施例中,细菌宿主菌株是SURE,其包含基因型recB、recJ、sbcC、mcrA、ΔmcrBCF、umuC、uvrC。
在某些方面中,提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中,其中核酸分子包含第一反向末端重复(ITR)和第二ITR,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
附图简述
图1A-1B是单链凝血因子(例如,FVIII)表达盒的示意图。显示了来自非AAV的5'ITR(在ssDNA结构的末端具有发夹环)、来自非AAV的3'ITR(具有发夹环)、启动子序列(例如,TTPp或CAGp)和转基因序列(例如,在B结构域内插入XTEN144的FVIIIco6XTEN序列)的位置。示例性表达盒还显示了其他可能的组件,例如内含子序列、WPREmut序列和bGHpA序列。
图1C-1F是用于制备单链凝血因子表达盒(如图1A-1B中所示的盒)的质粒的示意图,其中盒的ITR衍生自AAV2(图1C)、B19(图1D)、GPV(图1E),或者是野生型B19 ITR序列(图1F)。用PvuII(在PvuII位点)(图1C)或LguI(在LguI位点)(图1D-1F)消化包含如此处所示的ssFVIII表达盒的质粒构建体,以精确释放包含ITR和表达盒的序列。使双链DNA在95℃下热变性以产生ssDNA,然后在4℃下温育以允许ITR结构形成。
图2A是系统发生树,其说明了各种细小病毒家族成员之间的关系。B19、AAV-2和GPV用轮廓框标记。
图2B是包括发夹结构在内的各种盒的示意图。
图3A和3B是B19、GPV和AAV2的ITR(图3A)以及B19和GPV的ITR(图3B)的比对。灰色阴影显示了同源性。
图4A-4C显示了在Hem A小鼠体内在通过流体力学注射(HDI)施用单链FVIII-AAV裸DNA(ssAAV-FVIII;图1C)、ssDNA-B19 FVIII(图1D)或ssDNA-GPV FVIII(图1E)后的FVIII血浆活性。在用50μg/小鼠(图4C)、20μg/小鼠(图4A和4B)、10μg/小鼠(图4A、4B和4C)或5μg/小鼠(图4A)的ssDNA的单次HDI处理的小鼠体内,在24小时、3天、2周、3周、1个月、2个月、3个月、4个月、5个月和6个月时,量测血浆样品中的FVIII活性(作为人体内正常生理水平的百分比)。给出5μg/小鼠的质粒DNA的HDI作为对照(图4A、4B和4C)。
图5显示了在单次流体力学注射等摩尔量的单链裸DNA(ssAAV-FVIII,图1A)、含有ITR序列的双链AAV-FVIII DNA(dsDNA)、不含ITR序列的双链FVIII DNA(无ITR的dsDNA)或不含ITR或细菌序列的环化双链FVIII DNA(微环)后,血友病A小鼠血浆中的FVIII活性。dsDNA是通过用PvuII对AAV-FVIII质粒(图2C)进行酶切割来产生,但没有进行热变性。无ITR的dsDNA是通过用AflII对AAV-FVIII质粒(图2C)进行酶切割来产生并且随后进行纯化。微环DNA是通过在AflII位点连接无ITR DNA的dsDNA来产生。经3个月或4个月收集小鼠血浆并且通过生色活性测定来确定FVIII。
图6显示了在流体力学注射30μg单链裸FVIII-DNA(图1A、图1D-1F)后,血友病A小鼠血浆中的FVIII活性。每周收集血浆持续7周并且通过生色测定来确定FVIII活性。在35天(描绘为黑色箭头)后,通过流体力学注射向接受FVIII-B19d135和FVIII-GPVd162 ssDNA的小鼠再次施用30μg。
图7A是单链鼠类苯丙氨酸羟化酶(例如,PAH)表达盒的示意图。显示了来自非AAV的5'ITR(在ssDNA结构的末端具有发夹环)、来自非AAV的3'ITR(具有发夹环)、启动子序列(例如,CAGp)和转基因序列(例如,3xFLAG_mPAH序列)的位置。示例性表达盒还显示了其他可能的组件,例如WPREmut序列和bGHpA序列。
图7B-7D显示了在通过流体力学注射单次施用含有鼠类PAH cDNA和非AAV ITRB19d135或GPVd162的单链DNA之前(第0天)和之后,苯丙酮尿症(PKU)小鼠体内苯丙氨酸(Phe)的血浆浓度。在ssDNA施用后第3、7、14、28、42和56天收集血浆。残余苯丙氨酸水平显示为以μg/ml计的浓度(图7B-7C)或显示为施用前的百分比(图7D)。水平线描绘了施用前的基线Phe水平。
图7E显示了来自用含有鼠类PAH转基因和B19d135或GPVd165 ITR的ssDNA处理的PKU小鼠的肝脏裂解物的蛋白质免疫印迹。在处理后第81天收集肝脏,并提取蛋白质裂解物。每个孔代表单只动物。使用M2抗FLAG抗体侦检FLAG标记的鼠类PAH蛋白,并且包括GAPDH上样对照以供比较。
图8A-B显示了在用囊封FVIII-AAV DNA(图1A-1C)的脂质纳米颗粒转导后,Huh7细胞上清液中的FVIII活性水平。将在CAGp启动子(图1B)下的质粒FVIII-AAV以等于3的胺与磷酸(NP)比率囊封,并且以通过picogreen测定确定的不同浓度应用于Huh7细胞(图8A)。将在TTPp启动子(图1A)下的质粒、双链线性(ds)和单链(ss)AAV-FVIII以等于2的NP比率也囊封于脂质纳米颗粒中,并且用于以不同DNA浓度转导Huh7细胞(图8B)。与人FACT血浆标准品相比,通过生色活性测定来量测FVIII。
发明详述
本公开文本描述了质粒样核酸分子,其包含第一反向末端重复(ITR)、第二ITR和基因盒(例如,编码靶序列(本文中也称作异源多核苷酸序列),例如治疗性蛋白质或miRNA),其中第一ITR和/或第二ITR是非腺相关病毒的ITR(例如,第一ITR和/或第二ITR来自非AAV)。在一些实施例中,基因盒编码治疗性蛋白质,例如,靶序列编码治疗性蛋白质。在一些实施例中,治疗性蛋白质包含选自以下的蛋白质:凝血因子、生长因子、激素、细胞因子、抗体、其片段或其组合。在一些实施例中,基因盒编码X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合。
在一些实施例中,治疗性蛋白质包含凝血因子。在一个特定实施例中,治疗性蛋白质包含FVIII或FIX蛋白。
在一些实施例中,基因盒编码miRNA。在某些实施例中,miRNA下调选自以下的靶基因的表达:SOD1、HTT、RHO或其任何组合。
在某些实施例中,非AAV选自病毒科细小病毒科(Parvoviridae)的成员及其任何组合。本公开文本还涉及在有需要的受试者体内表达治疗性蛋白质(例如,凝血因子(例如,FVIII))的方法,其包括将包含第一反向末端重复(ITR)、第二ITR和基因盒(例如,编码治疗性蛋白质或miRNA)的核酸分子施用于受试者,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在某些实施例中,本公开文本描述了分离的核酸分子,其包含与选自SEQ IDNO:113和120的核苷酸序列具有序列同源性的核苷酸序列。
在某些实施例中,本公开文本提供了核酸分子,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含异源多核苷酸序列,其中第一和/或第二ITR衍生自细小病毒B19或鹅细小病毒(GPV)。
本公开文本的示例性构建体说明于附图和序列表中。为了提供对说明书和申请专利范围的清晰理解,下文提供了以下定义。
I.定义
应注意,术语“一个/一种(a)”或“一个/一种(an)”实体是指一个/一种或多个/多种所述实体:例如,“一个核苷酸序列”应理解为代表一个或多个核苷酸序列。类似地,“一种治疗性蛋白质”和“一种miRNA”应理解为分别代表一种或多种治疗性蛋白质和一种或多种miRNA。因此,术语“一个/一种(a)”(或“一个/一种(an)”)、“一个/一种或多个/多种”和“至少一个/一种”在本文中可互换使用。
术语“约”在本文中用于意指大约、大致、大约地或在…左右。在术语“约”结合数字范围使用时,其通过扩展所述数值上下的边界来修饰所述范围。通常,术语“约”在本文中用于向上或向下(较高或较低)以10%的差异修饰高于和低于所述值的数值。
同样如本文所用,“和/或”是指并且涵盖一个或多个相关列示项目的任何和所有可能组合,以及在替代方案(“或”)中解释时组合的缺少。
“核酸”、“核酸分子”、“核苷酸”、“一个或多个核苷酸的序列”和“多核苷酸”可互换使用并且是指呈单链形式或双链螺旋的核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯聚合形式或其任何磷酸酯类似物,如硫代磷酸酯和硫代酸酯。单链核酸序列是指单链DNA(ssDNA)或单链RNA(ssRNA)。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子、特别是DNA或RNA分子仅仅是指分子的一级和二级结构,并且不将其限制为任何特定三级形式。因此,这个术语包括尤其在线性或环状DNA分子(例如,限制性片段)、质粒、超螺旋化DNA和染色体中发现的双链DNA。在讨论特定双链DNA分子的结构时,在本文中可以根据常规习惯描述序列,仅沿DNA的非转录链(即,具有与mRNA同源的序列的链)以5’至3’方向给出序列。“重组DNA分子”是已经经历分子生物学操纵的DNA分子。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。本公开文本的“核酸组合物”包含如本文所述的一种或多种核酸。
如本文所用,“反向末端重复”(或“ITR”)是指位于单链核酸序列的5'端或3'端的核酸子序列,其包含一组核苷酸(初始序列),之后下游是其反向互补物,即回文序列。初始序列与反向互补物之间的插入核苷酸序列可以具有任何长度,包括零。在一个实施例中,可用于本公开文本的ITR包含一个或多个“回文序列”。ITR可以具有任何数目的功能。在一些实施例中,本文所述的ITR形成发夹结构。在一些实施例中,ITR形成T形发夹结构。在一些实施例中,ITR形成非T形发夹结构,例如U形发夹结构。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的长期存活。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的永久存活(例如,持续细胞的整个寿命)。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的稳定性。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的保留。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的持久性。在一些实施例中,ITR抑制或防止核酸分子在细胞的细胞核中的降解。
在一个实施例中,初始序列和/或反向互补物包含约2-600个核苷酸、约2-550个核苷酸、约2-500个核苷酸、约2-450个核苷酸、约2-400个核苷酸、约2-350个核苷酸、约2-300个核苷酸或约2-250个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约5-600个核苷酸、约10-600个核苷酸、约15-600个核苷酸、约20-600个核苷酸、约25-600个核苷酸、约30-600个核苷酸、约35-600个核苷酸、约40-600个核苷酸、约45-600个核苷酸、约50-600个核苷酸、约60-600个核苷酸、约70-600个核苷酸、约80-600个核苷酸、约90-600个核苷酸、约100-600个核苷酸、约150-600个核苷酸、约200-600个核苷酸、约300-600个核苷酸、约350-600个核苷酸、约400-600个核苷酸、约450-600个核苷酸、约500-600个核苷酸或约550-600个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约5-550个核苷酸、约5至500个核苷酸、约5-450个核苷酸、约5至400个核苷酸、约5-350个核苷酸、约5至300个核苷酸或约5-250个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约10-550个核苷酸、约15-500个核苷酸、约20-450个核苷酸、约25-400个核苷酸、约30-350个核苷酸、约35-300个核苷酸或约40-250个核苷酸。在某些实施例中,初始序列和/或反向互补物包含约225个核苷酸、约250个核苷酸、约275个核苷酸、约300个核苷酸、约325个核苷酸、约350个核苷酸、约375个核苷酸、约400个核苷酸、约425个核苷酸、约450个核苷酸、约475个核苷酸、约500个核苷酸、约525个核苷酸、约550个核苷酸、约575个核苷酸或约600个核苷酸。在特定实施例中,初始序列和/或反向互补物包含约400个核苷酸。
在其他实施例中,初始序列和/或反向互补物包含约2-200个核苷酸、约5-200个核苷酸、约10-200个核苷酸、约20-200个核苷酸、约30-200个核苷酸、约40-200个核苷酸、约50-200个核苷酸、约60-200个核苷酸、约70-200个核苷酸、约80-200个核苷酸、约90-200个核苷酸、约100-200个核苷酸、约125-200个核苷酸、约150-200个核苷酸或约175-200个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-150个核苷酸、约5-150个核苷酸、约10-150个核苷酸、约20-150个核苷酸、约30-150个核苷酸、约40-150个核苷酸、约50-150个核苷酸、约75-150个核苷酸、约100-150个核苷酸或约125-150个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-100个核苷酸、约5-100个核苷酸、约10-100个核苷酸、约20-100个核苷酸、约30-100个核苷酸、约40-100个核苷酸、约50-100个核苷酸或约75-100个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-50个核苷酸、约10-50个核苷酸、约20-50个核苷酸、约30-50个核苷酸、约40-50个核苷酸、约3-30个核苷酸、约4-20个核苷酸或约5-10个核苷酸。在另一个实施例中,初始序列和/或反向互补物由2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸组成。在其他实施例中,初始序列与反向互补物之间的插入核苷酸是(例如,由以下组成)0个核苷酸、1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸。
因此,如本文所用的“ITR”可以折叠回于自身并形成双链区段。例如,在折叠形成双螺旋时,序列GATCXXXXGATC包含GATC的初始序列及其补体(3'CTAG5')。在一些实施例中,ITR包含初始序列与反向互补物之间的连续回文序列(例如,GATCGATC)。在一些实施例中,ITR包含初始序列与反向互补物之间的中断的回文序列(例如,GATCXXXXGATC)。在一些实施例中,连续或中断的回文序列的互补部分彼此相互作用以形成“发夹环”结构。如本文所用,在单链核苷酸分子上的至少两个互补序列碱基配对形成双链部分时,产生“发夹环”结构。在一些实施例中,仅ITR的一部分形成发夹环。在其他实施例中,整个ITR形成发夹环。
在本公开文本中,至少一个ITR是非腺病毒相关病毒(非AAV)的ITR。在某些实施例中,ITR是病毒科细小病毒科的非AAV成员的ITR。在一些实施例中,ITR是依赖病毒属(Dependovirus)或红病毒属(Erythrovirus)的非AAV成员的ITR。在特定实施例中,ITR是以下病毒的ITR:鹅细小病毒(GPV)、番鸭细小病毒(MDPV)或红病毒属细小病毒B19(也称为细小病毒B19、灵长类红细小病毒1、B19病毒和红病毒)。在某些实施例中,两个ITR中的一个ITR是AAV的ITR。在其他实施例中,构建体中两个ITR中的一个ITR是选自以下的AAV血清型的ITR:血清型1、2、3、4、5、6、7、8、9、10、11及其任何组合。在一个特定实施例中,ITR衍生自AAV血清型2,例如AAV血清型2的ITR。
在本公开文本的某些方面中,核酸分子包含两个ITR,5'ITR和3'ITR,其中5'ITR位于核酸分子的5'末端,并且3'ITR位于核酸分子的3'末端。5'ITR和3'ITR可以衍生自相同病毒或不同病毒。在某些实施例中,5'ITR衍生自AAV并且3'ITR并非衍生自AAV病毒(例如,非AAV)。在一些实施例中,3'ITR衍生自AAV并且5'ITR并非衍生自AAV病毒(例如,非AAV)。在其他实施例中,5'ITR并非衍生自AAV病毒(例如,非AAV),并且3'ITR衍生自相同或不同的非AAV病毒。
如本文所用的术语“细小病毒”涵盖细小病毒科,包括但不限于自主复制的细小病毒和依赖病毒。自主细小病毒包括例如以下属的成员:博卡病毒属(Bocavirus)、依赖病毒属、红病毒属、阿留申病毒属(Amdovirus)、细小病毒属(Parvovirus)、浓核病毒属(Densovirus)、重复病毒属(Iteravirus)、康特拉病毒属(Contravirus)、禽细小病毒属(Aveparvovirus)、反刍类细小病毒属(Copiparvovirus)、原细小病毒属(Protoparvovirus)、四型细小病毒属(Tetraparvovirus)、双义浓核病毒属(Ambidensovirus)、短浓核病毒属(Brevidensovirus)、肝胰浓核病毒属(Hepandensovirus)和对虾浓核病毒属(Penstyldensovirus)。
示例性自主细小病毒包括但不限于猪细小病毒、小鼠微小病毒、犬细小病毒、水貂肠炎病毒、牛细小病毒、鸡细小病毒、猫瘟病毒、猫细小病毒、鹅细小病毒、H1细小病毒、番鸭细小病毒、蛇细小病毒和B19病毒。其他自主细小病毒是本领域的技术人员已知的。参见例如,FIELDS等VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。
如本文所用的术语“非AAV”涵盖来自细小病毒科的核酸、蛋白质和病毒,不包括细小病毒科的任何腺相关病毒(AAV)。“非AAV”包括但不限于以下属的自主复制成员:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属和对虾浓核病毒属。
如本文所用,术语“腺相关病毒”(AAV)包括但不限于AAV 1型、AAV 2型、AAV 3型(包括3A型和3B型)、AAV 4型、AAV 5型、AAV 6型、AAV7型、AAV 8型、AAV 9型、AAV 10型、AAV11型、AAV 12型、AAV 13型、蛇AAV、禽AAV、牛AAV、犬AAV、马AAV、绵羊AAV、山羊AAV、虾AAV、Gao等(J.Virol.78:6381(2004))和Moris等(Virol.33:375(2004))所披露的那些AAV血清型和进化枝以及目前已知或将来发现的任何其他AAV。参见例如,FIELDS等VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。
如本文所用,术语“衍生自”是指组分从指定分子或生物体分离或使用指定分子或生物体制备,或者信息(例如,氨基酸或核酸序列)来自指定分子或生物体。例如,衍生自第二核酸序列(例如,ITR)的核酸序列(例如,ITR)可包括与第二核酸序列的核苷酸序列相同或基本上相似的核苷酸序列。在核苷酸或多肽的情况下,衍生的物质可以通过例如天然存在的突变诱发、人工定向突变诱发或人工随机突变诱发来获得。用于衍生核苷酸或多肽的突变诱发可以是有意定向的或有意随机的,或者是各自的混合。突变诱发核苷酸或多肽以产生衍生自第一核苷酸或多肽的不同核苷酸或多肽可以是随机事件(例如,由于聚合酶失真而引起),并且所衍生的核苷酸或多肽的鉴定可通过适当的筛选方法(例如,如本文所讨论)来进行。多肽的突变诱发通常需要操纵编码多肽的多核苷酸。在一些实施例中,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸序列具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其他实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少90%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少80%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少70%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少60%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少50%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。
在某些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中衍生自非AAV(或AAV)的ITR的ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在某些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含至少约129个核苷酸,并且其中衍生自非AAV(或AAV)的ITR的ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在某些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含至少约102个核苷酸,并且其中衍生自非AAV(或AAV)的ITR的ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。
在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含非AAV(或AAV)的ITR的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。
在某些实施例中,在正确比对时,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸序列的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其他实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少90%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少80%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAVITR(或分别地,AAV ITR)的同源部分至少70%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少60%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少50%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。
“无衣壳(capsid-free)”或“无衣壳(capsid-less)”载体或核酸分子是指不具有衣壳的载体构建体。在一些实施例中,无衣壳载体或核酸分子不含编码例如AAV Rep蛋白的序列。
如本文所用,“编码区”或“编码序列”是多核苷酸中由可翻译成氨基酸的密码子组成的部分。虽然“终止密码子”(TAG、TGA或TAA)通常不翻译成氨基酸,但是可以认为其是编码区的一部分,但是任何侧接序列(例如启动子、核糖体结合位点、转录终止子、内含子等)不是编码区的一部分。编码区的边界通常由5’末端的起始密码子(编码所得多肽的胺基末端)和3’末端的翻译终止密码子(编码所得多肽的羧基末端)来决定。两个或更多个编码区可存在于单一多核苷酸构建体中(例如,在单一载体上),或者存在于单独的多核苷酸构建体中(例如,在单独的(不同的)载体上)。然后,结果就是单一载体可仅含有单个编码区,或者包含两个或更多个编码区。
哺乳动物细胞分泌的某些蛋白质与分泌信号肽相关,一旦生长中的蛋白质链跨越糙面内质网的输出已经起始所述分泌信号肽便从成熟蛋白质切割下来。本领域的技术人员知道,信号肽通常融合至多肽的N末端,并且是从完整或“全长”多肽切割下来以产生多肽的分泌或“成熟”形式。在某些实施例中,天然信号肽或所述序列的保留指导多肽分泌的能力的功能衍生物与所述多肽可操作地相关。可替代地,可以使用异源哺乳动物信号肽(例如,人组织纤溶酶原激活物(TPA)或小鼠β-葡糖醛酸糖苷酶信号肽)或其功能衍生物。
术语“下游”是指核苷酸序列位于参考核苷酸序列的3’。在某些实施例中,下游核苷酸序列是指转录起点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。
术语“上游”是指核苷酸序列位于参考核苷酸序列的5’。在某些实施例中,上游核苷酸序列是指位于编码区或转录起点的5’侧的序列。例如,大多数启动子位于转录起始位点的上游。
如本文所用,术语“基因调控区”或“调控区”是指位于编码区的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码区的转录、RNA加工、稳定性或翻译的核苷酸序列。调控区可以包括启动子、翻译前导序列、内含子、多聚腺苷酸化识别序列、RNA加工位点、效应子结合位点或茎环结构。如果意图在真核细胞中表达编码区,则多聚腺苷酸化信号和转录终止序列通常将位于编码序列的3’。
编码产物(例如,miRNA或基因产物(例如,多肽,如治疗性蛋白质))的多核苷酸可以包括与一个或多个编码区可操作地缔合的启动子和/或其他表达(例如,转录或翻译)控制组件。在可操作缔合中,以将基因产物的表达置于一个或多个调控区的影响或控制下的方式将基因产物(例如,多肽)的编码区与所述一个或多个调控区缔合。例如,如果启动子功能的诱导引起编码由编码区所编码的基因产物的mRNA的转录,并且如果启动子与编码区之间的连接的性质不干扰启动子指导基因产物表达的能力或者不干扰DNA模板被转录的能力,则编码区和启动子“可操作地缔合”。除了启动子以外的其他表达控制组件(例如,增强子、操纵子、阻遏物和转录终止信号)也可以与编码区可操作地缔合以指导基因产物表达。
“转录控制序列”是指提供编码序列在宿主细胞中的表达的DNA调控序列,如启动子、增强子、终止子等。多种转录控制区是本领域的技术人员已知的。这些转录控制区包括但不限于作用于脊椎动物细胞中的转录控制区,例如但不限于来自巨细胞病毒(立即早期启动子,与内含子-A结合)、猿猴病毒40(早期启动子)和逆转录病毒(如劳斯肉瘤病毒)的启动子和增强子区段。其他转录控制区包括衍生自脊椎动物基因的那些控制区,如肌动蛋白、热休克蛋白、牛生长激素和兔β-珠蛋白,以及能够控制真核细胞中的基因表达的其他序列。其他适宜转录控制区包括组织特异性启动子和增强子以及淋巴因子诱导型启动子(例如,可由干扰素或白介素诱导的启动子)。
类似地,多种翻译控制组件是本领域的技术人员已知的。这些翻译控制组件包括但不限于核糖体结合位点、翻译起始和终止密码子以及衍生自微小核糖核酸病毒的组件(特别是内部核糖体进入位点,或IRES,也称为CITE序列)。
如本文所用的术语“表达”是指多核苷酸产生基因产物(例如,RNA或多肽)的过程。其包括但不限于多核苷酸转录为信使RNA(mRNA)、转移RNA(tRNA)、小发夹RNA(shRNA)、小干扰RNA(siRNA)或任何其他RNA产物,以及mRNA翻译为多肽。表达产生“基因产物”。如本文所用,基因产物可以是核酸(例如,通过基因转录产生的信使RNA)或从转录物翻译的多肽。本文所述的基因产物还包括具有转录后修饰(例如,多聚腺苷酸化或剪接)的核酸,或者具有翻译后修饰(例如,甲基化、糖基化、脂质添加、与其他蛋白质亚基缔合或蛋白质水解切割)的多肽。如本文所用,术语“产量”是指通过基因表达产生的多肽的量。
“载体”是指用于将核酸克隆和/或转移至宿主细胞中的任何媒剂。载体可以是复制子,另一核酸区段可以与其连接以实现所连接区段的复制。“复制子”是指在体内起自主复制单元的作用(即,能够在其自身控制下复制)的任何基因组件(例如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括在体外、离体或在体内将核酸引入细胞中的媒剂。本领域已知并使用大量载体,包括例如质粒、经修饰真核病毒或经修饰细菌病毒。将多核苷酸插入适宜载体中可以通过将适当多核苷酸片段连接至具有互补粘性末端的所选载体中来完成。
可以对载体进行工程化以编码可选标记或报告物,其提供对已经并入载体的细胞的选择或鉴定。可选标记或报告物的表达允许鉴定和/或选择并入并表达含于载体上的其他编码区的宿主细胞。本领域已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙胺磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花色苷调控基因、异戊烷基转移酶基因等。本领域已知并使用的报告物的例子包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸糖苷酶(Gus)等。还可以将可选标记视为报告物。
如本文所用的术语“宿主细胞”是指例如可以或已经用作ssDNA或载体的接受者的微生物、酵母细胞、昆虫细胞和哺乳动物细胞。所述术语包括已经转导的初始细胞的后代。因此,如本文所用的“宿主细胞”通常是指已经用外源DNA序列转导的细胞。应理解,由于天然、偶然或刻意突变,单个亲代细胞的后代的形态或基因组或总DNA补体可能不一定与初始亲代完全相同。在一些实施例中,宿主细胞可以是体外宿主细胞。
术语“可选标记”是指能够基于标记基因的效应(即,对抗生素的抗性、对除草剂的抗性、比色标记、酶、荧光标记等)加以选择的鉴定因子(通常是抗生素或化学抗性基因),其中所述效应用于跟踪所关注核酸的遗传和/或鉴定已经遗传所关注核酸的细胞或生物体。本领域已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙胺磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花色苷调控基因、异戊烷基转移酶基因等。
术语“报告基因”是指编码能够基于报告基因的效应加以鉴定的鉴定因子的核酸,其中所述效应用于跟踪所关注核酸的遗传性、鉴定已经遗传所关注核酸的细胞或生物体和/或量测基因表达诱导或转录。本领域已知并使用的报告基因的例子包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸糖苷酶(Gus)等。也可以将可选标记基因视为报告基因。
“启动子”与“启动子序列”可互换使用并且是指能够控制编码序列或功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3'。启动子可以整体衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同组件构成,或者甚至包含合成DNA区段。本领域的技术人员应理解,不同的启动子可以指导基因在不同组织或细胞类型中、或在不同发育阶段、或响应不同环境或生理条件而表达。使基因在大多数细胞类型中在大多数时间表达的启动子一般被称为“组成型启动子”。使基因在特定细胞类型中表达的启动子一般被称为“细胞特异性启动子”或“组织特异性启动子”。使基因在发育或细胞分化的特定阶段表达的启动子一般被称为“发育特异性启动子”或“细胞分化特异性启动子”。在用诱导启动子的试剂、生物分子、化学品、配位体、光等暴露或处理细胞后被诱导并且使基因表达的启动子一般被称为“诱导型启动子”或“可调型启动子”。还认识到,由于在大多数情况下,尚未完全界定调控序列的确切边界,所以不同长度的DNA片段可以具有相同的启动子活性。
启动子序列通常在其3’末端以转录起始位点为界,并向上游(5’方向)延伸以包括以高于背景的可侦检水平起始转录所必需的最小数目的碱基或组件。在启动子序列内将发现转录起始位点(例如通过用核酸酶S1标示(mapping)方便地界定)以及负责RNA聚合酶的结合的蛋白质结合结构域(共有序列)。
在一些实施例中,核酸分子包含组织特异性启动子。在某些实施例中,组织特异性启动子驱动治疗性蛋白质(例如,凝血因子)在肝脏中(例如,在肝细胞和/或内皮细胞中)的表达。在特定实施例中,启动子选自小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子、小鼠白蛋白启动子、三重四脯氨酸(TTP)启动子、CASI启动子、CAG启动子、巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)启动子及其任何组合。在一些实施例中,启动子选自肝脏特异性启动子(例如,α1-抗胰蛋白酶(AAT))、肌肉特异性启动子(例如,肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)和结蛋白(DES))、合成启动子(例如,SPc5-12、2R5Sc5-12、dMCK和tMCK)及其任何组合。在一个特定实施例中,启动子包含TTP启动子。
术语“限制性内切核酸酶”与“限制酶”可互换使用并且是指在双链DNA内的特定核苷酸序列内结合并切割的酶。
术语“质粒”是指通常携带并非细胞的中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式的染色体外组件。此类组件可以是衍生自任何来源的单链或双链DNA或RNA的线性、环状或超螺旋化的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已经接合或重组至独特构建体中,所述构建体能够将用于所选基因产物的启动子片段和DNA序列以及适当的3'非翻译序列引入细胞中。
可以使用的真核病毒载体包括但不限于腺病毒载体、逆转录病毒载体、腺相关病毒载体、痘病毒(例如,牛痘病毒载体)、杆状病毒载体或疱疹病毒载体。非病毒载体包括质粒、脂质体、带电脂质(细胞转染剂)、DNA-蛋白质复合物和生物聚合物。
“克隆载体”是指“复制子”,其是单位长度的连续复制的核酸并且其包含复制起点,如质粒、噬菌体或粘粒,另一核酸区段可以与所述复制子连接以实现所连接区段的复制。某些克隆载体能够在一种细胞类型(例如,细菌)中复制,并在另一细胞类型(例如,真核细胞)中表达。克隆载体通常包含一个或多个可以用于选择包含载体的细胞的序列和/或一个或多个用于插入所关注核酸序列的多重克隆位点。
术语“表达载体”是指设计为使得所插入核酸序列在插入宿主细胞中之后能够表达的媒剂。将所插入核酸序列以如上所述的与调控区可操作地缔合地放置。
通过业内熟知的方法将载体引入宿主细胞中,所述方法是例如转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沈淀、脂转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白。如本文所用,“培养(culture)”、“培养(to culture)”和“培养(culturing)”意指在允许细胞生长或分裂的体外条件下温育细胞或使细胞维持存活状态。如本文所用,“所培养细胞”意指在体外繁殖的细胞。
如本文所用,术语“多肽”旨在涵盖单数“多肽”以及复数“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并且不涉及产物的具体长度。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一条或多条链的任何其他术语包括于“多肽”的定义内,并且术语“多肽”可以代替这些术语中的任一个术语或与其互换使用。术语“多肽”还意图指多肽的表达后修饰的产物,所述修饰包括但不限于糖基化、乙酰化、磷酸化、酰胺化、通过已知的保护/阻断基团衍生、蛋白质水解切割或通过非天然存在的氨基酸修饰。多肽可以从天然生物来源衍生或通过重组技术产生,但不一定是从指定的核酸序列翻译。其能以任何方式产生,包括通过化学合成产生。
术语“氨基酸”包括丙氨酸(Ala或A);精氨酸(Arg或R);天冬酰胺(Asn或N);天冬氨酸(Asp或D);半胱氨酸(Cys或C);谷氨酰胺(Gln或Q);谷氨酸(Glu或E);甘氨酸(Gly或G);组氨酸(His或H);异亮氨酸(Ile或I);亮氨酸(Leu或L);赖氨酸(Lys或K);甲硫氨酸(Met或M);苯丙氨酸(Phe或F);脯氨酸(Pro或P);丝氨酸(Ser或S);苏氨酸(Thr或T);色氨酸(Trp或W);酪氨酸(Tyr或Y);和缬氨酸(Val或V)。非传统氨基酸也在本公开文本的范围内,并且包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其他氨基酸残基类似物,如Ellman等Meth.Enzym.202:301-336(1991)中所述的那些。为了产生此类非天然存在的氨基酸残基,可使用Noren等Science 244:182(1989)和Ellman等(同上)的程序。简言之,这些程序涉及用非天然存在的氨基酸残基化学激活抑制剂tRNA,之后进行RNA的体外转录和翻译。引入非传统氨基酸也可使用本领域已知的肽化学来实现。如本文所用,术语“极性氨基酸”包括具有零个净电荷,但是在其侧链的不同部分具有非零部分电荷的氨基酸(例如,M、F、W、S、Y、N、Q、C)。这些氨基酸可参与疏水相互作用和静电相互作用。如本文所用,术语“带电氨基酸”包括在其侧链上具有非零净电荷的氨基酸(例如,R、K、H、E、D)。这些氨基酸可参与疏水相互作用和静电相互作用。
本公开文本中还包括多肽的片段或变异体及其任何组合。术语“片段”或“变异体”在涉及本公开文本的多肽结合结构域或结合分子时包括保留参考多肽的至少一些特性(例如,对FcRn结合结构域或Fc变异体的FcRn结合亲和性、对FVIII变异体的凝结活性或对VWF片段的FVIII结合活性)的任何多肽。除了本文中其他地方讨论的特定抗体片段以外,多肽片段包括蛋白质水解片段以及缺失片段,但是不包括天然存在的全长多肽(或成熟多肽)。本公开文本的多肽结合结构域或结合分子的变异体包括如上所述的片段,以及由于氨基酸取代、缺失或插入而具有改变的氨基酸序列的多肽。变异体可以是天然存在的或非天然存在的。非天然存在的变异体可以使用本领域已知的突变诱发技术来产生。变异体多肽可以包含保守或非保守氨基酸取代、缺失或添加。
“保守氨基酸取代”是用具有类似侧链的氨基酸残基替代氨基酸残基的取代。业内已经定义具有类似侧链的氨基酸残基的家族,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果用来自相同侧链家族的另一氨基酸替代多肽中的氨基酸,则将取代视为保守的。在另一个实施例中,氨基酸串可以用结构上类似但侧链家族成员的顺序和/或组成不同的串来保守地替代。
如本领域已知的术语“同一性百分比”是两个或更多个多肽序列或者两个或更多个多核苷酸序列之间的关系,如通过比较序列所确定。在业内,根据具体情况,“同一性”也意指多肽或多核苷酸序列之间的序列关联性程度,如通过此类序列的串之间的匹配所确定。“同一性”可通过已知方法容易地计算,所述方法包括但不限于以下文献中所述的那些方法:Computational Molecular Biology(Lesk,A.M.编)Oxford University Press,NewYork(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编)AcademicPress,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.编)Humana Press,New Jersey(1994);Sequence Analysis in MolecularBiology(von Heinje,G.编)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编)Stockton Press,New York(1991)。确定同一性的较佳方法设计为给出所测试序列之间的最佳匹配。确定同一性的方法被编纂于可公开获得的计算机程序中。序列比对和同一性百分比计算可使用序列分析软件来进行,所述序列分析软件是例如LASERGENE生物信息学计算套件的Megalign程序(DNASTAR Inc.,威斯康星州麦迪逊市)、GCG程序套件(Wisconsin Package 9.0版,Genetics Computer Group(GCG),威斯康星州麦迪逊市)、BLASTP、BLASTN、BLASTX(Altschul等,J.Mol.Biol.215:403(1990))和DNASTAR(DNASTAR,Inc.1228S.Park St.威斯康星州麦迪逊市53715 USA)。在本申请的上下文中将理解,如果使用序列分析软件进行分析,除非另外指定,否则分析结果将基于所参考程序的“缺省值”。如本文所用的“缺省值”将意指在首次初始化时最初用软件加载的任一组值或参数。出于确定本公开文本的治疗性蛋白质(例如,凝血因子)序列与参考序列之间的同一性百分比的目的,仅使用参考序列中对应于本公开文本的治疗性蛋白质(例如,凝血因子)序列中的核苷酸的核苷酸来计算同一性百分比。例如,在比较含有B结构域的全长FVIII核苷酸序列与本公开文本的优化的B结构域缺失(BDD)FVIII核苷酸序列时,将使用包括A1、A2、A3、C1和C2结构域的比对部分来计算同一性百分比。全长FVIII序列的编码B结构域的部分(其将在比对中产生大的“空位”)中的核苷酸将不会被计为错配。另外,在确定本公开文本的优化的BDD FVIII序列或其指定部分(例如,SEQ ID NO:3的核苷酸58-2277和2320-4374)与参考序列之间的同一性百分比时,将通过比对、用匹配核苷酸数除以如本文所述的优化的BDD-FVIII序列或其指定部分的完整序列中的核苷酸总数来计算同一性百分比。
如本文所用,对应于本公开文本的特定序列中的核苷酸的核苷酸是通过比对本公开文本的序列以最大化与参考序列的同一性来鉴定。用于鉴定参考序列中的等效氨基酸的编号是基于用于鉴定本公开文本的序列中的相应氨基酸的编号。
“融合”或“嵌合”蛋白包含连接至第二氨基酸序列的第一氨基酸序列,所述第一氨基酸序列在自然界中并非天然地与所述第二氨基酸序列连接。可以使通常存在于单独蛋白质中的氨基酸序列在融合多肽中聚在一起,或者可以将通常存在于相同蛋白质中的氨基酸序列以新排列置于融合多肽(例如,本公开文本的因子VIII结构域与Ig Fc结构域的融合物)中。例如通过化学合成或通过产生并翻译其中以所需关系编码肽区的多核苷酸来产生融合蛋白。嵌合蛋白还可以包含通过共价非肽键或非共价键与第一氨基酸序列缔合的第二氨基酸序列。
如本文所用,术语“插入位点”是指多肽或其片段、变异体或衍生物中的如下位置,其紧邻可插入异源部分的位置的上游。将“插入位点”指定为编号,所述编号是氨基酸在参考序列中的编号。例如,FVIII中的“插入位点”是指成熟天然FVIII(SEQ ID NO:15)中插入位点所对应的氨基酸序列的编号,其紧邻插入位置的N末端。例如,词组“a3在对应于SEQ IDNO:15的氨基酸1656的插入位点包含异源部分”指示,异源部分位于对应于SEQ ID NO:15的氨基酸1656和氨基酸1657的两个氨基酸之间。
如本文所用的词组“紧邻氨基酸的下游”是指与氨基酸的末端羧基紧紧相邻的位置。类似地,词组“紧邻氨基酸的上游”是指与氨基酸的末端胺基紧紧相邻的位置。
如本文所用的术语“插入(inserted)”、“被插入(is inserted)”、“插入于(inserted into)”或语法相关术语涉及相对于亲代多肽中的类似位置,异源部分在多肽(例如,凝血因子)中的位置。例如,在某些实施例中,“插入”等涉及相对于天然成熟人FVIII中的类似位置,异源部分在重组FVIII多肽中的位置。如本文所用,所述术语是指多肽的特征,并且并非指示、暗示或意味着制备多肽的任何方法或工艺。
如本文所用,术语“半衰期”是指特定多肽在体内的生物半衰期。半衰期可以表示为施用于受试者的数量的一半被从动物的循环和/或其他组织中清除所需的时间。在将给定多肽的清除曲线构建为时间函数时,所述曲线通常是二相的,具有快速的α相和较长的β相。α相通常代表所施用的Fc多肽在血管内与血管外空间之间的平衡,并且部分取决于多肽的大小。β相通常代表多肽在血管内空间中的分解代谢。在一些实施例中,治疗性蛋白质(例如,凝血因子,例如FVIII)和包含所述治疗性蛋白质的嵌合蛋白是单相的,并且因此不具有α相,而是只具有单一β相。因此,在某些实施例中,如本文所用的术语半衰期是指多肽在β相中的半衰期。
如本文所用的术语“连接”是指第一氨基酸序列或核苷酸序列分别与第二氨基酸序列或核苷酸序列共价或非共价接合。第一氨基酸或核苷酸序列可以与第二氨基酸或核苷酸序列直接接合或并置,或者可替代地,插入序列可以将第一序列共价接合至第二序列。术语“连接”不仅意指第一氨基酸序列与第二氨基酸序列在C末端或N末端融合,还包括将完整的第一氨基酸序列(或第二氨基酸序列)插入第二氨基酸序列(或分别地,第一氨基酸序列)中的任两个氨基酸之间。在一个实施例中,第一氨基酸序列可通过肽键或接头连接至第二氨基酸序列。第一核苷酸序列可通过磷酸二酯键或接头连接至第二核苷酸序列。接头可为肽或多肽(对于多肽链)或者核苷酸或核苷酸链(对于核苷酸链)或者任何化学部分(对于多肽和多核苷酸链二者)。术语“连接”还通过连字符(-)来指示。
如本文所用的止血意指停止或减慢出血(bleeding)或出血症(hemorrhage);或者停止或减慢血液流经血管或身体部分。
如本文所用的止血病症意指遗传上的遗传性或获得性病症,特征在于由于形成纤维蛋白凝块的能力受损或无能,倾向于自发地或由于创伤而出血。此类病症的例子包括血友病。三种主要形式是血友病A(因子VIII缺乏)、血友病B(因子IX缺乏或“克雷司马斯病”)和血友病C(因子XI缺乏,轻度出血倾向)。其他止血病症包括例如血管性血友病、因子XI缺乏(PTA缺乏)、因子XII缺乏、纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺乏或结构异常、GPIb缺陷或缺乏的巨血小板综合征。vWF受体GPIb可能缺陷并导致缺少初级凝块形成(初级止血)和增加的出血倾向、以及Glanzman和Naegeli的血小板无力症(Glanzmann血小板无力症)。在肝功能衰竭(急性和慢性形式)中,肝脏的凝结因子产生不足;这可能增加出血风险。
可以预防性地使用本公开文本的分离的核酸分子、分离的多肽或包含分离核酸分子的载体。如本文所用,术语“预防性治疗”是指在出血发作之前施用分子。在一个实施例中,需要通用止血剂的受试者正在进行或即将进行手术。本公开文本的多核苷酸、多肽或载体可以作为预防药在手术之前或之后施用。本公开文本的多核苷酸、多肽或载体可以在手术期间或之后施用以控制急性出血发作。手术可以包括但不限于肝移植、肝切除、牙科手术或干细胞移植。
本公开文本的分离的核酸分子、分离的多肽或载体也用于按需治疗。术语“按需治疗”是指响应出血发作的症状或者在可能引起出血的活动之前施用分离的核酸分子、分离的多肽或载体。在一个方面中,可以在出血开始时(如在损伤后)或在预期要出血时(如在手术前),将按需治疗施用于受试者。在另一个方面中,可以在增加出血风险的活动(如接触运动)之前施用按需治疗。
如本文所用,术语“急性出血”是指不论潜在原因的出血发作。例如,受试者可能患有创伤、尿毒症、遗传性出血病症(例如,因子VII缺乏)、血小板病症或由于产生针对凝血因子的抗体而产生的抗性。
如本文所用的治疗(treat)、治疗(treatment)、治疗(treating)是指例如疾病或病症的严重程度的降低;病程持续时间的减少;与疾病或病症相关的一种或多种症状的改善;向患有疾病或病症的受试者提供有益作用,但不一定治愈疾病或病症;或者预防与疾病或病症相关的一种或多种症状。在一个实施例中,术语“治疗(treating)”或“治疗(treatment)”意指在受试者体内通过施用本公开文本的分离的核酸分子、分离的多肽或载体维持例如FVIII谷水平为至少约1 IU/dL、2 IU/dL、3 IU/dL、4 IU/dL、5 IU/dL、6 IU/dL、7 IU/dL、8 IU/dL、9 IU/dL、10 IU/dL、11 IU/dL、12 IU/dL、13 IU/dL、14 IU/dL、15 IU/dL、16 IU/dL、17 IU/dL、18 IU/dL、19 IU/dL、20 IU/dL、25 IU/dL、30 IU/dL、35 IU/dL、40IU/dL、45 IU/dL、50 IU/dL、55 IU/dL、60 IU/dL、65 IU/dL、70 IU/dL、75 IU/dL、80 IU/dL、85 IU/dL、90 IU/dL、95 IU/dL、100 IU/dL、105 IU/dL、110 IU/dL、115 IU/dL、120 IU/dL、125 IU/dL、130 IU/dL、135 IU/dL、140 IU/dL、145 IU/dL或150 IU/dL。在另一个实施例中,治疗(treating)或治疗(treatment)意指维持FVIII谷水平为约1-约150IU/dL、约1-约125 IU/dL、约1-约100IU/dL、约1-约90 IU/dL、约1-约85 IU/dL、约1-约80 IU/dL、约1-约75 IU/dL、约1-约70 IU/dL、约1-约65 IU/dL、约1-约60 IU/dL、约1-约55 IU/dL、约1-约50 IU/dL、约1-约45 IU/dL、约1-约40 IU/dL、约1-约35 IU/dL、约1-约30 IU/dL、约1-约25IU/dL、约25-约125 IU/dL、约50-约100 IU/dL、约50-约75 IU/dL、约75-约100 IU/dL、约1-约20 IU/dL、约2-约20 IU/dL、约3-约20 IU/dL、约4-约20 IU/dL、约5-约20 IU/dL、约6-约20 IU/dL、约7-约20 IU/dL、约8-约20 IU/dL、约9-约20 IU/dL或约10-约20 IU/dL。疾病或病症的治疗(treatment)或治疗(treating)还可以包括维持受试者体内的FVIII活性为以下水平:与非血友病受试者体内的FVIII活性的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%相当。治疗所需的最低谷水平可通过一种或多种已知方法来量测,并且可针对每个个人加以调节(增加或减小)。
如本文所用,“施用”意指通过医药上可接受的途径将本公开文本的医药上可接受的核酸分子、从所述核酸分子表达的多肽或包含所述核酸分子的载体施用于受试者。施用途径可为静脉内的,例如静脉内注射和静脉内输注。其他施用途径包括例如皮下、肌内、口服、经鼻和经肺施用。核酸分子、多肽和载体可作为包含至少一种赋形剂的药物组合物的一部分来施用。
如本文所用的术语“医药上可接受的”是指分子实体和组合物在施用于人时在生理上可耐受并且通常不会产生毒性或过敏反应或类似的不良反应(如胃部不适、头晕等)。任选地,如本文所用,术语“医药上可接受的”意指由联邦政府或州政府的管理机构批准或者在美国药典或其他公认药典中列示用于动物,更特别是用于人。
如本文所用,词组“有需要的受试者”包括将受益于本公开文本的核酸分子、多肽或载体的施用于例如以改良止血的受试者(如哺乳动物受试者)。在一个实施例中,受试者包括但不限于患有血友病的个体。在另一个实施例中,受试者包括但不限于已经产生针对治疗性蛋白质(例如,凝血因子,例如FVIII)的抑制剂,并且因此需要绕路疗法的个体。受试者可以是成年人或未成年人(例如,小于12岁)。
如本文所用,术语“治疗性蛋白质”是指本领域已知可以施用于受试者的任何多肽。在一些实施例中,治疗性蛋白质包含选自以下的蛋白质:凝血因子、生长因子、抗体、其功能片段或其组合。如本文所用,术语“凝血因子”是指天然存在的或重组产生的分子或其类似物,其预防受试者的出血发作或缩短出血发作的持续时间。换句话说,其意指具有促凝血活性(即,负责将纤维蛋白原转化为不溶性纤维蛋白的网状物,从而引起血液凝结或凝血)的分子。如本文所用的“凝血因子”包括激活的凝血因子、其酶原或可激活的凝血因子。“可激活的凝血因子”是呈无活性形式(例如,呈其酶原形式)的凝血因子,其能够被转化为活性形式。术语“凝血因子”包括但不限于因子I(FI)、因子II(FII)、因子V(FV)、FVII、FVIII、FIX、因子X(FX)、因子XI(FXI)、因子XII(FXII)、因子XIII(FXIII)、血管性血友病因子(VWF)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原激活物抑制剂-1(PAI-1)、纤溶酶原激活物抑制剂-2(PAI2)、其酶原、其激活形式或其任何组合。
如本文所用的凝血活性意指参与生化反应级联的能力,所述级联以形成纤维蛋白凝块告终和/或降低出血症或出血发作的严重程度、持续时间或频率。
如本文所用,“生长因子”包括本领域已知的包括细胞因子和激素在内的任何生长因子。在一些实施例中,生长因子选自肾上腺髓质素(AM)、血管生成素(Ang)、自分泌运动因子、骨形态发生蛋白(BMP)(例如,BMP2、BMP4、BMP5、BMP7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(CNTF)、白血病抑制因子(LIF)、白介素-6(IL-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-CSF)、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞集落刺激因子(GM-CSF))、表皮生长因子(EGF)、肝配蛋白(例如,肝配蛋白A1、肝配蛋白A2、肝配蛋白A3、肝配蛋白A4、肝配蛋白A5、肝配蛋白B1、肝配蛋白B2、肝配蛋白B3)、促红细胞生成素(EPO)、成纤维细胞生长因子(FGF)(例如,FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15、FGF16、FGF17、FGF18、FGF19、FGF20、FGF21、FGF22、FGF23)、胎牛促体素(FBS)、GDNF家族成员(例如,神经胶质细胞系衍生的神经营养因子(GDNF)、神经秩蛋白、普塞芬蛋白、阿特敏蛋白)、生长分化因子-9(GDF9)、肝细胞生长因子(HGF)、肝细胞瘤衍生的生长因子(HDGF)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(IGF-1)或IGF-2、白介素(IL)(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7)、角质形成细胞生长因子(KGF)、迁移刺激因子(MSF)、巨噬细胞刺激蛋白(MSP或肝细胞生长因子样蛋白(HGFLP))、肌生成抑制蛋白(GDF-8)、神经调节蛋白(例如,神经调节蛋白1(NRG1)、NRG2、NRG3、NRG4)、神经营养蛋白(例如,脑衍生的神经营养因子(BDNF)、神经生长因子(NGF)、神经营养蛋白-3(NT-3)、NT-4、胎盘生长因子(PGF)、血小板衍生的生长因子(PDGF)、肾胺酶(RNLS)、T细胞生长因子(TCGF)、血小板生成素(TPO)、转化生长因子(例如,转化生长因子α(TGF-α)、TGF-β、肿瘤坏死因子-α(TNF-α)和血管内皮生长因子(VEGF)。
在一些实施例中,治疗性蛋白质由选自以下的基因编码:X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合。
如本文所用,术语“异源的”或“外源的”是指此类分子通常在给定背景下(例如,在细胞中或在多肽中)未发现。例如,可以将外源或异源分子引入细胞中并且仅在例如通过转染或其他形式的遗传工程化操纵细胞之后存在,或者异源氨基酸序列可以存在于其天然不存在的蛋白质中。
如本文所用,术语“异源核苷酸序列”是指不与给定多核苷酸序列一起天然存在的核苷酸序列。在一个实施例中,异源核苷酸序列编码能够延长治疗性蛋白质(例如,凝血因子,例如FVIII)的半衰期的多肽。在另一个实施例中,异源核苷酸序列编码增加治疗性蛋白质(例如,凝血因子,例如FVIII)的流体力学半径的多肽。在其他实施例中,异源核苷酸序列编码改良治疗性蛋白质的一种或多种药物代谢动力学特性但不显著影响其生物学活性或功能(例如,促凝血活性)的多肽。在一些实施例中,治疗性蛋白质通过接头与异源核苷酸序列编码的多肽连接或相连。异源核苷酸序列编码的多肽部分的非限制性例子尤其包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白、美国专利申请号20100292130的PAS多肽、HAP序列、转铁蛋白或其片段、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、白蛋白结合小分子、XTEN序列、FcRn结合部分(例如,完整Fc区或其结合至FcRn的部分)、单链Fc区(ScFc区,例如如US 2008/0260738、WO 2008/012543或WO 2008/1439545中所述)、聚甘氨酸接头、聚丝氨酸接头、选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的两种类型氨基酸的6-40个氨基酸的肽和短多肽(具有从小于50%至大于50%变化的二级结构程度)、或其两个或更多个组合。在一些实施例中,异源核苷酸序列编码的多肽连接至非多肽部分。非多肽部分的非限制性例子包括聚乙二醇(PEG)、白蛋白结合小分子、聚唾液酸、羟乙基淀粉(HES)、其衍生物或其任何组合。
如本文所用,术语“Fc区”定义为多肽中对应于天然Ig的Fc区的部分,即如通过其两条重链的相应Fc结构域的二聚缔合所形成。天然Fc区与另一Fc区形成同二聚体。相比之下,如本文所用的术语“基因融合的Fc区”或“单链Fc区”(scFc区)是指合成二聚Fc区,其包括基因连接于单条多肽链内(即,编码于单个连续基因序列中)的Fc结构域。
在一个实施例中,“Fc区”是指单条Ig重链的如下部分,其始于紧邻木瓜蛋白酶切割位点(即,IgG中的残基216,以重链恒定区的第一个残基为114)上游的铰链区并终于抗体的C末端。因此,完整Fc结构域至少包含铰链结构域、CH2结构域和CH3结构域。
根据Ig同种型,Ig恒定区的Fc区可以包括CH2、CH3和CH4结构域以及铰链区。包含Ig的Fc区的嵌合蛋白赋予嵌合蛋白若干种所需特性,包括增加的稳定性、增加的血清半衰期(参见Capon等,1989,Nature 337:525)以及与Fc受体(如新生Fc受体(FcRn))的结合(美国专利号6,086,875、6,485,726、6,030,613;WO 03/077834;US2003-0235536A1),将上述文献通过引用以其整体并入本文。
“参考核苷酸序列”在本文中用作与本公开文本的核苷酸序列的比较时,是与本公开文本的核苷酸序列基本上相同的多核苷酸序列,但是所述参考序列未经优化。例如,由SEQ ID NO:1的密码子优化的BDD FVIII和在其3'端连接至SEQ ID NO:1的编码单链Fc区的异源核苷酸序列组成的核酸分子的参考核苷酸序列是由SEQ ID NO:16的初始(或“亲代”)BDD FVIII和在其3'端连接至SEQ ID NO:16的编码单链Fc区的相同异源核苷酸序列组成的核酸分子。
如本文所用,关于核苷酸序列的术语“优化”是指编码多肽的多核苷酸序列,其中所述多核苷酸序列已经突变以增强所述多核苷酸序列的特性。在一些实施例中,进行优化以增加转录水平、增加翻译水平、增加稳态mRNA水平、增加或减少调控蛋白(如通用转录因子)的结合、增加或减少剪接或增加多核苷酸序列产生的多肽的产量。可以对多核苷酸序列进行以使其优化的变化的例子包括密码子优化、G/C含量优化、去除重复序列、去除富含AT的组件、去除隐蔽剪接位点、去除阻遏转录或翻译的顺式作用组件、添加或去除多聚T或多聚A序列、在转录起始位点周围添加增强转录的序列(如Kozak共有序列)、去除可以形成茎环结构的序列、去除去稳定序列及其两个或更多个组合。
II.核酸分子
本公开文本涉及编码靶序列的质粒样无衣壳的核酸分子,其中靶序列编码治疗性蛋白质或可以调节靶蛋白(例如,miRNA)的表达的基因。衣壳是病毒的蛋白质外壳,包封病毒的遗传物质。已知衣壳通过保护病毒基因组、将基因组递送至宿主和与宿主相互作用来辅助病毒粒子的功能。然而,尤其在用于基因疗法中时,病毒衣壳可以是限制载体的包装能力和/或诱导免疫应答方面的因素。
AAV载体已经作为一种更常见类型的基因疗法载体出现。然而,衣壳的存在限制了AAV载体在基因疗法中的效用。具体地,衣壳自身可能将载体中包括的转基因的大小限制到低至小于4.5kb。即使在添加调控组件之前,可用于基因疗法中的多种治疗性蛋白质也可以轻易超过这个大小。
此外,构成衣壳的蛋白质可能起到受试者的免疫系统可靶向的抗原的作用。AAV在一般群体中非常常见,大多数人在其一生中已经暴露于AAV。因此,大多数潜在的基因疗法接受者可能已经产生过针对AAV的免疫应答,并且因此更有可能排斥所述疗法。
本公开文本的某些方面旨在克服AAV载体的这些缺陷。具体地,本公开文本的某些方面涉及核酸分子,其包含第一ITR、第二ITR和基因盒(例如,编码治疗性蛋白质和/或miRNA)。在一些实施例中,第一ITR和第二ITR侧接于包含异源多核苷酸序列的基因盒。在一些实施例中,核酸分子不包含编码衣壳蛋白、复制蛋白和/或组装蛋白的基因。在一些实施例中,基因盒编码治疗性蛋白质。在一些实施例中,治疗性蛋白质包含凝血因子。在一些实施例中,基因盒编码miRNA。在某些实施例中,基因盒定位于第一ITR与第二ITR之间。在一些实施例中,核酸分子还包含一个或多个非编码区。在某些实施例中,所述一个或多个非编码区包含启动子序列、内含子、转录后调控元件、3'UTR多聚(A)序列或其任何组合。
在一个实施例中,基因盒是单链核酸。在另一个实施例中,基因盒是双链核酸。
在一个实施例中,核酸分子包含:
(a)作为细小病毒科的非AAV家族成员的ITR(例如,B19或GPV ITR)的第一ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码miRNA或治疗性蛋白质(例如,凝血因子)的核苷酸;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;
(g)作为细小病毒科的非AAV家族成员的ITR(例如,B19或GPV ITR)的第二ITR。
在一个实施例中,核酸分子包含:
(a)作为细小病毒科的非AAV家族成员的ITR的第一ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码miRNA的核苷酸,其中所述miRNA下调选自以下的靶基因的表达:SOD1、HTT、RHO及其任何组合;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;
(g)作为细小病毒科的非AAV家族成员的ITR的第二ITR。
在一个实施例中,核酸分子包含:
(a)作为细小病毒科的非AAV家族成员的ITR的第一ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合的核苷酸;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;
(g)作为细小病毒科的非AAV家族成员的ITR的第二ITR。
在一个实施例中,核酸分子包含:
(a)作为AAV(例如,AAV血清型2基因组)的ITR的第一ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码FVIII的核苷酸;其中所述核苷酸与选自SEQ ID NO:1-14或SEQ ID NO:71的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性,其中所述核苷酸编码的FVIII保留FVIII活性;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和
(g)作为AAV(例如,AAV血清型2基因组)的ITR的第二ITR。
在一个实施例中,核酸分子包含:
(a)作为AAV(例如,AAV血清型2基因组)的ITR的第一ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码miRNA的核苷酸,其中所述miRNA下调靶基因的表达,所述靶基因是例如SOD1、HTT、RHO及其任何组合;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和
(g)作为AAV(例如,AAV血清型2基因组)的ITR的第二ITR。
在一个实施例中,核酸分子包含:
(a)作为AAV(例如,AAV血清型2基因组)的ITR的第一ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合的核苷酸;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和
(g)作为AAV(例如,AAV血清型2基因组)的ITR的第二ITR。
在另一个实施例中,核酸分子包含:
(a)第一ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码miRNA或治疗性蛋白质(例如,凝血因子)的核苷酸;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和
(g)第二ITR,
其中第一ITR或第二ITR中的一个是细小病毒科的非AAV家族成员的ITR,并且另一个ITR是AAV(例如,AAV血清型2基因组)的ITR。
在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:111中所述的AAV2 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:124中所述的AAV2 3’ITR序列的3’ITR。
在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:111中所述的AAV2 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如CAG启动子;
(c)内含子,例如合成内含子;
(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:193中所述的AAV2 3’ITR序列的3’ITR。
在另一个实施例中,核酸分子包含:
(a)第一ITR;
(b)组织特异性启动子序列,TTP激活子;
(c)内含子,例如合成内含子;
(d)编码miRNA或治疗性蛋白质(例如,凝血因子)的核苷酸;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和
(g)第二ITR,
其中第一ITR是合成ITR,第二ITR是合成ITR,或者第一ITR和第二ITR二者都是合成ITR。
在另一个实施例中,核酸分子包含:
(a)第一B19 ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)第二B19 ITR。
在另一个实施例中,核酸分子包含:
(a)第一GPV ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)第二GPV ITR。
在另一个实施例中,核酸分子包含:
(a)第一B19 ITR;
(b)泛在启动子序列,例如CAG启动子;
(c)内含子,例如合成内含子;
(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)第二B19 ITR。
在另一个实施例中,核酸分子包含:
(a)第一GPV ITR;
(b)泛在启动子序列,例如CAG启动子;
(c)内含子,例如合成内含子;
(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)第二GPV ITR。
在另一个实施例中,核酸分子包含:
(a)第一B19 ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)第二B19 ITR。
在另一个实施例中,核酸分子包含:
(a)第一GPV ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)第二GPV ITR。
在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:180中所述的B19d135 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:181中所述的B19d135 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:183中所述的GPVd162 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:184中所述的GPVd162 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:185中所述的全长B19 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:186中所述的全长B19 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:187中所述的全长GPV 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如TTP启动子;
(c)内含子,例如合成内含子;
(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:188中所述的全长GPV 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:180中所述的B19d135 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如CAG启动子;
(c)内含子,例如合成内含子;
(d)编码PAH的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:181中所述的B19d135 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:183中所述的GPVd162 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如CAG启动子;
(c)内含子,例如合成内含子;
(d)编码PAH的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:184中所述的GPVd162 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:185中所述的全长B19 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如CAG启动子;
(c)内含子,例如合成内含子;
(d)编码PAH的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:186中所述的全长B19 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:
(a)带有SEQ ID NO:187中所述的全长GPV 5’ITR序列的5’ITR;
(b)组织特异性启动子序列,例如CAG启动子;
(c)内含子,例如合成内含子;
(d)编码PAH的异源多核苷酸序列;
(e)转录后调控元件,例如WPRE;
(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或
(g)带有SEQ ID NO:188中所述的全长GPV 3’ITR序列的3’ITR。
A.反向末端重复
本公开文本的某些方面涉及核酸分子,其包含第一ITR(例如,5'ITR)和第二ITR(例如,3'ITR)。通常,ITR参与细小病毒(例如,AAV)从原核质粒进行DNA复制和拯救或切除(Samulski等,1983,1987;Senapathy等,1984;Gottlieb和Muzyczka,1988)。另外,ITR似乎是AAV原病毒整合和将AAV DNA包装至病毒粒子中所需的最小序列(McLaughlin等,1988;Samulski等,1989)。这些组件是细小病毒基因组的有效操纵必需的。假设,对于ITR功能必不可少的最小限定组件是Rep结合位点(例如,RBS;对于AAV2,GCGCGCTCGCTCGCTC(SEQ IDNO:104))和末端解链位点(例如,TRS;对于AAV2,AGTTGG(SEQ ID NO:105))加上允许发夹形成的可变回文序列。回文核苷酸区域通常作为DNA复制的起点以及作为病毒的包装信号以顺式一起作用。ITR中的互补序列在DNA复制期间折叠成发夹结构。在一些实施例中,ITR折叠成发夹T形结构。在其他实施例中,ITR折叠成非T形发夹结构,例如折叠成U形发夹结构。数据表明,AAV ITR的T形发夹结构可以抑制由ITR侧接的转基因的表达。参见例如,Zhou等,Scientific Reports7:5432(2017年7月14日)。通过利用不形成T形发夹结构的ITR,可以避免这种形式的抑制。因此,在某些方面中,与包含形成T形发夹的AAV ITR的多核苷酸相比,包含非AAV ITR的多核苷酸具有改良的转基因表达。
在一些实施例中,ITR包含天然存在的ITR,例如,ITR包含细小病毒ITR的全部或一部分。在一些实施例中,ITR包含合成序列。在一个实施例中,第一ITR或第二ITR包含合成序列。在另一个实施例中,第一ITR和第二ITR各自包含合成序列。在一些实施例中,第一ITR或第二ITR包含天然存在的序列。在另一个实施例中,第一ITR和第二ITR各自包含天然存在的序列。
在一些实施例中,ITR包含天然存在的ITR的一部分(例如,截短的ITR)或由所述部分组成。在一些实施例中,ITR包含天然存在的ITR的片段或由所述片段组成,其中所述片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中ITR保留天然存在的ITR的功能特性。在某些实施例中,ITR包含天然存在的ITR的片段或由所述片段组成,其中所述片段包含至少约129个核苷酸;其中ITR保留天然存在的ITR的功能特性。在某些实施例中,ITR包含天然存在的ITR的片段或由所述片段组成,其中所述片段包含至少约102个核苷酸;其中ITR保留天然存在的ITR的功能特性。
在一些实施例中,ITR包含天然存在的ITR的一部分或由所述部分组成,其中所述片段包含天然存在的ITR的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%;其中所述片段保留天然存在的ITR的功能特性。
在某些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在其他实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少90%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少80%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少70%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少60%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少50%的序列同一性;其中ITR保留天然存在的ITR的功能特性。
在一些实施例中,ITR包含来自AAV基因组的ITR。在一些实施例中,ITR是选自以下的AAV基因组的ITR:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11及其任何组合。在一个特定实施例中,ITR是AAV2基因组的ITR。在另一个实施例中,ITR是经遗传工程化以在其5′和3′端包括衍生自一个或多个AAV基因组的ITR的合成序列。
在一些实施例中,ITR并非衍生自AAV基因组。在一些实施例中,ITR是非AAV的ITR。在一些实施例中,ITR是来自选自但不限于以下的病毒科细小病毒科的非AAV基因组的ITR:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在某些实施例中,ITR衍生自红病毒属细小病毒B19(人病毒)。在另一个实施例中,ITR衍生自番鸭细小病毒(MDPV)株。在某些实施例中,MDPV株被减弱,例如MDPV株FZ91-30。在其他实施例中,MDPV株是病原性的,例如MDPV株YY。在一些实施例中,ITR衍生自猪细小病毒,例如猪细小病毒U44978。在一些实施例中,ITR衍生自小鼠微小病毒,例如小鼠微小病毒U34256。在一些实施例中,ITR衍生自犬细小病毒,例如犬细小病毒M19296。在一些实施例中,ITR衍生自水貂肠炎病毒,例如水貂肠炎病毒D00765。在一些实施例中,ITR衍生自依赖细小病毒(Dependoparvovirus)。在一个实施例中,依赖细小病毒是依赖病毒属鹅细小病毒(GPV)株。在一个具体实施例中,GPV株被减弱,例如GPV株82-0321V。在另一个具体实施例中,GPV株是病原性的,例如GPV株B。
核酸分子的第一ITR和第二ITR可以衍生自相同基因组(例如,衍生自相同病毒的基因组),或衍生自不同基因组(例如,衍生自两种或更多种不同病毒基因组的基因组)。在某些实施例中,第一ITR和第二ITR衍生自相同的AAV基因组。在一个具体实施例中,存在于本发明的核酸分子中的这两个ITR是相同的,并且特别地可以是AAV2 ITR。在其他实施例中,第一ITR衍生自AAV基因组并且第二ITR并非衍生自AAV基因组(例如,非AAV基因组)。在其他实施例中,第一ITR并非衍生自AAV基因组(例如,非AAV基因组)并且第二ITR衍生自AAV基因组。在仍其他实施例中,第一ITR和第二ITR二者都并非衍生自AAV基因组(例如,非AAV基因组)。在一个特定实施例中,第一ITR和第二ITR是相同的。
在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在其他实施例中,第一ITR和第二ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合,其中第一ITR和第二ITR衍生自相同的基因组。在其他实施例中,第一ITR和第二ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合,其中第一ITR和第二ITR衍生自不同的基因组。
在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自红病毒属细小病毒B19(人病毒)。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自红病毒属细小病毒B19(人病毒)。
在某些实施例中,第一ITR和/或第二ITR包含衍生自B19的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQ ID NO:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的B19 ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQ ID NO:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。
在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:167、168、169、170和171的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:167中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:168中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:169中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:170中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:171中所述的核苷酸序列或由所述核苷酸序列组成。
表1.样品细小病毒ITR序列。
Figure BDA0003006446640000491
Figure BDA0003006446640000501
Figure BDA0003006446640000511
在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:167组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:168中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:168组成。在某些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:169中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ ID NO:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,保留衍生出它的B19ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:169中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ IDNO:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。
在某些实施例中,第一ITR和/或第二ITR包含衍生自B19的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第二ITR是第一ITR的反向互补物。在一些实施例中,第一ITR是第二ITR的反向互补物。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:180、181、185和186的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物保留衍生出它的B19 ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:180、181、185和186的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。
在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:180中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:180组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:181中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:181组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:185中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:185组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:186中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:186组成。
在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:180、181、185和186的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ IDNO:185中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQID NO:186中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:185中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:186中所述的核苷酸序列或由所述核苷酸序列组成。
在一些实施例中,第一ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:185中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:186中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:186中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:185中所述的核苷酸序列或由所述核苷酸序列组成。
在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自GPV。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自GPV。
在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:172组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:173中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:173组成。在某些实施例中,第一ITR和/或第二ITR包含衍生自GPV的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQ ID NO:172、173、174、175和176的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含衍生自GPV的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQID NO:172、173、174、175和176的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:172、173、174、175和176的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:172中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ IDNO:173中所述的核苷酸序列或由所述核苷酸序列组成。
在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:174中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:175中所述的核苷酸序列或由所述核苷酸序列组成。
在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:176中所述的核苷酸序列或由所述核苷酸序列组成。
在某些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:174中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ ID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:174中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。
在某些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:176中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ ID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:176中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。
在某些实施例中,第一ITR和/或第二ITR包含衍生自GPV的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第二ITR是第一ITR的反向互补物。在一些实施例中,第一ITR是第二ITR的反向互补物。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:183、184、187和188的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:183、184、187和188的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。
在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:183中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:183组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:184中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:184组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:187中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:187组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:188中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:188组成。
在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:183、184、187和188的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ IDNO:187中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQID NO:188中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:187中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:188中所述的核苷酸序列或由所述核苷酸序列组成。
在一些实施例中,第一ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:187中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:188中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:188中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:187中所述的核苷酸序列或由所述核苷酸序列组成。
在某些实施例中,第一ITR或第二ITR中的一个包含衍生自AAV2的ITR的全部或一部分或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:177或178中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的AAV2 ITR的功能特性。在一些实施例中,第一ITR或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:177或178中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:177或178中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:177中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:178中所述的核苷酸序列或由所述核苷酸序列组成。
在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自番鸭细小病毒(MDPV)株。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自番鸭细小病毒(MDPV)株。在某些实施例中,MDPV株被减弱,例如MDPV株FZ91-30。在其他实施例中,MDPV株是病原性的,例如MDPV株YY。
在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自依赖细小病毒。在一些实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自依赖细小病毒。在其他实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自依赖病毒属鹅细小病毒(GPV)株。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自依赖病毒属GPV株。在某些实施例中,GPV株被减弱,例如GPV株82-0321V。在其他实施例中,GPV株是病原性的,例如GPV株B。
在某些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自选自以下的基因组:猪细小病毒,例如猪细小病毒株U44978;小鼠微小病毒,例如小鼠微小病毒株U34256;犬细小病毒,例如犬细小病毒株M19296;水貂肠炎病毒,例如水貂肠炎病毒株D00765;及其任何组合。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自选自以下的基因组:猪细小病毒,例如猪细小病毒株U44978;小鼠微小病毒,例如小鼠微小病毒株U34256;犬细小病毒,例如犬细小病毒株M19296;水貂肠炎病毒,例如水貂肠炎病毒株D00765;及其任何组合。
在另一个特定实施例中,ITR是经遗传工程化以在其5′和3′端包括并非衍生自AAV基因组的ITR的合成序列。在另一个特定实施例中,ITR是经遗传工程化以在其5′和3′端包括衍生自一个或多个非AAV基因组的ITR的合成序列。存在于本发明的核酸分子中的这两个ITR可为相同或不同的非AAV基因组。具体地,ITR可衍生自相同的非AAV基因组。在一个具体实施例中,存在于本发明的核酸分子中的这两个ITR是相同的,并且特别地可为AAV2 ITR。
在一些实施例中,ITR序列包含一个或多个回文序列。本文所公开的ITR的回文序列包括但不限于天然回文序列(即,在自然界中发现的序列)、合成序列(即,未在自然界中发现的序列)(如伪回文序列)及其组合或经修饰形式。“伪回文序列”是包括不完美的回文序列在内的回文DNA序列,其与形成二级结构的天然AAV或非AAV回文序列中的序列共享小于80%(包括小于70%、60%、50%、40%、30%、20%、10%或5%或无)核酸序列同一性。天然回文序列可以从本文所公开的任何基因组获得或衍生。合成回文序列可以基于本文所公开的任何基因组。
回文序列可以是连续或中断的。在一些实施例中,回文序列是中断的,其中回文序列包含第二序列的插入。在一些实施例中,第二序列包含启动子、增强子、整合酶的整合位点(例如,Cre或Flp重组酶的位点)、基因产物的开放阅读框或其组合。
在一些实施例中,ITR形成发夹环结构。在一个实施例中,第一ITR形成发夹结构。在另一个实施例中,第二ITR形成发夹结构。仍然在另一个实施例中,第一ITR和第二ITR二者都形成发夹结构。在一些实施例中,第一ITR和/或第二ITR不形成T形发夹结构。在某些实施例中,第一ITR和/或第二ITR形成非T形发夹结构。在一些实施例中,非T形发夹结构包含U形发夹结构。
在一些实施例中,本文所述的核酸分子中的ITR可以是转录激活的ITR。转录激活的ITR可以包含已经通过包括至少一个转录活性元件而被转录激活的野生型ITR的全部或一部分。多种类型的转录活性元件适用于这个背景。在一些实施例中,转录活性元件是组成型转录活性元件。组成型转录活性元件提供持续水平的基因转录,并且在需要持续表达转基因时是较佳的。在其他实施例中,转录活性元件是诱导型转录活性元件。诱导型转录活性元件通常在诱导物(或诱导条件)不存在下展现低活性,并且在诱导物存在下(或切换至诱导条件)上调。当仅在某些时间或在某些位置需要表达时或当需要使用诱导剂逐步增加表达水平时,诱导型转录活性元件可能是较佳的。转录活性元件也可以具有组织特异性;也就是说,其仅在某些组织或细胞类型中展现活性。
能以多种方式将转录活性元件并入ITR中。在一些实施例中,将转录活性元件并入ITR的任何部分的5′或ITR的任何部分的3′。在其他实施例中,转录激活的ITR的转录活性元件位于两个ITR序列之间。如果转录活性元件包含两个或更多个必须被间隔开的组件,则那些组件可与ITR的部分交替。在一些实施例中,ITR的发夹结构缺失并用转录组件的反向重复来替代。这后一种排列将产生仿真结构中的缺失部分的发夹。多个串联转录活性元件也可存在于转录激活的ITR中,并且这些组件可以相邻或间隔开。另外,可将蛋白质结合位点(例如,Rep结合位点)引入转录激活的ITR的转录活性元件中。转录活性元件可包含使得能够通过RNA聚合酶受控转录DNA以形成RNA的任何序列,并且可包含例如如下文所定义的转录活性元件。
转录激活的ITR向具有相对受限的核苷酸序列长度的核酸分子提供转录激活和ITR功能二者,这有效地使可以携带并从核酸分子表达的转基因的长度最大化。将转录活性元件并入ITR中能以多种方式来完成。对ITR序列和转录活性元件的序列需求的比较可以提供对编码ITR内的组件的方式的了解。例如,可以通过在复制转录活性元件的功能组件的ITR序列中引入特定变化将转录活性添加至ITR。业内存在多种技术可有效添加、缺失和/或改变特定位点的具体核苷酸序列(参见例如,Deng和Nickoloff(1992)Anal.Biochem.200:81-88)。产生转录激活的ITR的另一方式涉及在ITR中的所需位置引入限制位点。另外,可以使用本领域已知的方法将多个转录激活元件并入转录激活的ITR中。
通过说明,可以通过包括一个或多个如以下等转录活性元件来产生转录激活的ITR:TATA盒、GC盒、CCAAT盒、Sp1位点、Inr区、CRE(cAMP调控组件)位点、ATF-1/CRE位点、APBβ盒、APBα盒、CArG盒、CCAC盒或如本领域已知参与转录的任何其他组件。
本公开文本的多个方面提供了克隆本文所述的核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入适宜细菌宿主菌株中。如本领域已知,核酸的复杂二级结构(例如,长回文区)可能不稳定并且难以在细菌宿主菌株中克隆。例如,本公开文本的包含第一ITR和第二ITR(例如,非AAV细小病毒ITR,例如B19或GPV ITR)的核酸分子可能难以使用常规方法来克隆。长DNA回文序列抑制DNA复制并且在大肠杆菌(E.coli)、芽孢杆菌属(Bacillus)、链球菌属(Steptococcus)、链霉菌属(Streptomyces)、酿酒酵母(S.cerevisiae)、小鼠和人的基因组中不稳定。这些效应是由于通过链内碱基配对形成发夹或十字形结构所致。在大肠杆菌中,在SbcC或SbcD突变体中可以显著克服对DNA复制的抑制。SbcD是核酸酶亚基,并且SbcC是SbcCD复合物的ATP酶亚基。大肠杆菌SbcCD复合物是负责防止长回文序列复制的外切核酸酶复合物。SbcCD复合物是具有ATP依赖性双链DNA外切核酸酶活性和ATP非依赖性单链DNA内切核酸酶活性的核复合物。SbcCD可以识别DNA回文序列并通过攻击所产生的发夹结构来瓦解复制叉。
在某些实施例中,适宜细菌宿主菌株不能拆分十字形DNA结构。在某些实施例中,适宜细菌宿主菌株包含SbcCD复合物中的破坏。在一些实施例中,SbcCD复合物中的破坏包含SbcC基因和/或SbcD基因中的基因破坏。在某些实施例中,SbcCD复合物中的破坏包含SbcC基因中的基因破坏。包含SbcC基因中的基因破坏的各种细菌宿主菌株是本领域已知的。例如但不限于,细菌宿主菌株PMC103包含基因型sbcC、recD、mcrA、ΔmcrBCF;细菌宿主菌株PMC107包含基因型recBC、recJ、sbcBC、mcrA、ΔmcrBCF;并且细菌宿主菌株SURE包含基因型recB、recJ、sbcC、mcrA、ΔmcrBCF、umuC、uvrC。因此,在一些实施例中,克隆本文所述的核酸分子的方法包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入宿主菌株PMC103、PMC107或SURE中。在某些实施例中,克隆本文所述的核酸分子的方法包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入宿主菌株PMC103中。
适宜载体是本领域已知的并且描述于本文中的其他地方。在某些实施例中,用于本公开文本的克隆方法中的适宜载体是低拷贝载体。在某些实施例中,用于本公开文本的克隆方法中的适宜载体是pBR322。
因此,本公开文本提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中,其中核酸分子包含第一反向末端重复(ITR)和第二ITR,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
B.治疗性蛋白质
本公开文本的某些方面涉及包含第一ITR、第二ITR和编码靶序列的基因盒的核酸分子,其中靶序列编码治疗性蛋白质。在一些实施例中,基因盒编码一种治疗性蛋白质。在一些实施例中,基因盒编码多于一种治疗性蛋白质。在一些实施例中,基因盒编码相同治疗性蛋白质的两个或更多个拷贝。在一些实施例中,基因盒编码相同治疗性蛋白质的两种或更多种变异体。在一些实施例中,基因盒编码两种或更多种不同的治疗性蛋白质。
本公开文本的某些实施例涉及包含第一ITR、第二ITR和编码治疗性蛋白质的基因盒的核酸分子,其中治疗性蛋白质包含凝血因子。在一些实施例中,凝血因子选自FI、FII、FIII、FIV、FV、FVI、FVII、FVIII、FIX、FX、FXI、FXII、FXIII、VWF、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原激活物抑制剂-1(PAI-1)、纤溶酶原激活物抑制剂-2(PAI2)、其任何酶原、其任何活性形式及其任何组合。在一个实施例中,凝血因子包含FVIII或其变异体或片段。在另一个实施例中,凝血因子包含FIX或其变异体或片段。在另一个实施例中,凝血因子包含FVII或其变异体或片段。在另一个实施例中,凝血因子包含VWF或其变异体或片段。
1.凝血因子
在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子VIII多肽。除非另外指定,否则如本文所用的“因子VIII”在整个本申请中缩写为“FVIII”,意指具有其在凝结中的正常作用的功能性FVIII多肽。因此,术语FVIII包括功能性变异体多肽。“FVIII蛋白”可与FVIII多肽(或蛋白质)或FVIII互换使用。FVIII功能的例子包括但不限于激活凝结的能力、作为因子IX的辅因子作用的能力或在Ca2+和磷脂存在下与因子IX形成因子Ⅹ酶(tenase)复合物的能力,所述复合物然后将因子X转化为激活形式Xa。FVIII蛋白可以是人、猪、犬、大鼠或鼠类FVIII蛋白。另外,来自人和其他物种的FVIII之间的比较已经鉴定出可能为功能所需的保守残基(Cameron等,Thromb.Haemost.79:317-22(1998);US 6,251,632)。全长多肽和多核苷酸序列是已知的,许多功能片段、突变体和经修饰形式也是已知的。多个FVIII氨基酸和核苷酸序列披露于例如以下文献中:美国公开号2015/0158929 A1、2014/0308280 A1和2014/0370035 A1以及国际公开号WO 2015/106052 A1。FVIII多肽包括例如全长FVIII、在N末端缺少Met的全长FVIII、成熟FVIII(缺少信号序列)、在N末端具有额外Met的成熟FVIII和/或完全或部分缺失B结构域的FVIII。FVIII变异体包括部分或完全缺失的B结构域缺失。
a.FVIII和编码FVIII蛋白的多核苷酸序列
在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子VIII多肽。除非另外指定,否则如本文所用的“因子VIII”在整个本申请中缩写为“FVIII”,意指具有其在凝结中的正常作用的功能性FVIII多肽。因此,术语FVIII包括功能性变异体多肽。“FVIII蛋白”可与FVIII多肽(或蛋白质)或FVIII互换使用。FVIII功能的例子包括但不限于激活凝结的能力、作为因子IX的辅因子作用的能力或在Ca2+和磷脂存在下与因子IX形成因子Ⅹ酶复合物的能力,所述复合物然后将因子X转化为激活形式Xa。FVIII蛋白可以是人、猪、犬、大鼠或鼠类FVIII蛋白。另外,来自人和其他物种的FVIII之间的比较已经鉴定出可能为功能所需的保守残基(Cameron等,Thromb.Haemost.79:317-22(1998);US 6,251,632)。全长多肽和多核苷酸序列是已知的,许多功能片段、突变体和经修饰形式也是已知的。多个FVIII氨基酸和核苷酸序列披露于例如以下文献中:美国公开号2015/0158929 A1、2014/0308280 A1和2014/0370035 A1以及国际公开号WO 2015/106052 A1。FVIII多肽包括例如全长FVIII、在N末端缺少Met的全长FVIII、成熟FVIII(缺少信号序列)、在N末端具有额外Met的成熟FVIII和/或完全或部分缺失B结构域的FVIII。FVIII变异体包括部分或完全缺失的B结构域缺失。
本文所用的嵌合蛋白中的FVIII部分具有FVIII活性。FVIII活性可以通过业内任何已知方法来量测。多种测试可用于评估凝结系统的功能:激活部分促凝血酶原激酶时间(aPTT)测试、生色测定、ROTEM测定、凝血酶原时间(PT)测试(也用于确定INR)、纤维蛋白原测试(通常通过克劳斯法进行)、血小板计数、血小板功能测试(通常通过PFA-100进行)、TCT、出血时间、混合测试(如果将患者的血浆与正常血浆混合,是否矫正异常)、凝结因子测定、抗磷脂抗体、D-二聚体、遗传测试(例如,因子V Leiden、凝血酶原突变G20210A)、稀释鲁塞尔蝰蛇毒时间(dRVVT)、杂项血小板功能测试、凝血弹性描记法(TEG或Sonoclot)、凝血弹性量测法(
Figure BDA0003006446640000641
例如
Figure BDA0003006446640000642
)或优球蛋白溶解时间(ELT)。
aPTT测试是量测“固有”(也称为接触激活路径)和常见凝结路径二者的功效的表达指示物。这个测试一般用于量测市售重组凝血因子(例如,FVIII)的凝血活性。其与量测外在路径的凝血酶原时间(PT)结合使用。
ROTEM分析提供关于止血的整体动力学的信息:凝血时间、凝块形成、凝块稳定性和溶解。凝血弹性量测法中的不同参数依赖于血浆凝结系统的活性、血小板功能、纤维蛋白溶解或影响这些相互作用的许多因素。这个分析可以提供次级止血的全面见解。
生色测定机制是基于血液凝结级联的原理,其中在激活的因子IX、磷脂和钙离子存在下,激活的FVIII加速因子X转化为因子Xa。因子Xa活性是通过水解对因子Xa具有特异性的对硝基苯胺(pNA)底物来评估。在405nM下量测的对硝基苯胺的初始释放速率与因子Xa活性成正比,并且因此与样品中的FVIII活性成正比。
生色测定得到了国际血栓形成与止血学会(ISTH)的科学标准化委员会(SSC)的FVIII和因子IX小组委员会的推荐。从1994以来,生色测定也已经是欧洲药典中用于指定FVIII浓缩物效力的参考方法。因此,在一个实施例中,包含FVIII的嵌合多肽具有与包含成熟FVIII或BDD FVIII的嵌合多肽(例如,
Figure BDA0003006446640000651
Figure BDA0003006446640000652
)相当的FVIII活性。
在另一个实施例中,本公开文本的包含FVIII的嵌合蛋白的因子Xa产生速率与包含成熟FVIII或BDD FVIII的嵌合蛋白(例如,
Figure BDA0003006446640000653
Figure BDA0003006446640000654
Figure BDA0003006446640000655
)相当。
为了将因子X激活为因子Xa,激活的因子IX(因子IXa)在Ca2+、膜磷脂和FVIII辅因子存在下水解因子X中的一个精氨酸-异亮氨酸键以形成因子Xa。因此,FVIII与因子IX的相互作用在凝结路径中具有关键作用。在某些实施例中,包含FVIII的嵌合多肽能以与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,
Figure BDA0003006446640000656
Figure BDA0003006446640000657
)相当的速率与因子IXa相互作用。
另外,FVIII结合至血管性血友病因子,同时在循环中无活性。FVIII在不结合至VWF时快速降解,并且通过凝血酶的作用从VWF释放。在一些实施例中,包含FVIII的嵌合多肽以与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,
Figure BDA0003006446640000658
Figure BDA0003006446640000659
)相当的水平结合至血管性血友病因子。
可在钙和磷脂存在下通过激活的蛋白质C使FVIII失活。激活的蛋白质C在A1结构域中的精氨酸336之后切割FVIII重链,从而破坏因子X底物相互作用位点,并在A2结构域中的精氨酸562之后切割,从而增强A2结构域的解离并且破坏与因子IXa的相互作用位点。这种切割还对切A2结构域(43kDa)并产生A2-N(18kDa)和A2-C(25kDa)结构域。因此,激活的蛋白质C可催化重链中的多个切割位点。在一个实施例中,通过激活的蛋白质C以与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,
Figure BDA00030064466400006510
Figure BDA00030064466400006511
)相当的水平使包含FVIII的嵌合多肽失活。
在其他实施例中,包含FVIII的嵌合蛋白具有与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,
Figure BDA00030064466400006512
Figure BDA00030064466400006513
)相当的体内FVIII活性。在一个特定实施例中,在HemA小鼠尾静脉横断模型中,包含FVIII的嵌合多肽能够以与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,
Figure BDA00030064466400006514
Figure BDA00030064466400006515
)相当的水平保护HemA小鼠。
如本文所用的FVIII的“B结构域”与本领域已知的B结构域相同,所述B结构域是通过成熟人FVIII的内部氨基酸序列同一性和凝血酶的蛋白质水解切割位点(例如,残基Ser741-Arg1648)来定义。其他人FVIII结构域是相对于成熟人FVIII,通过以下氨基酸残基来定义:成熟FVIII的A1,残基Ala1-Arg372;A2,残基Ser373-Arg740;A3,残基Ser1690-Ile2032;C1,残基Arg2033-Asn2172;C2,残基Ser2173-Tyr2332。除非另外指示,否则在不提及任何SEQ ID编号的情况下,本文中使用的序列残基编号对应于不含信号肽序列(19个氨基酸)的FVIII序列。A3-C1-C2序列(也称为FVIII重链)包括残基Ser1690-Tyr2332。其余序列(残基Glu1649-Arg1689)通常被称为FVIII轻链激活肽。猪、小鼠和犬FVIII的所有结构域(包括B结构域)的边界的位置也是本领域已知的。在一个实施例中,FVIII的B结构域缺失(“B结构域缺失的FVIII”或“BDD FVIII”)。BDD FVIII的例子是
Figure BDA0003006446640000661
(重组BDDFVIII)。在一个特定实施例中,B结构域缺失的FVIII变异体包含成熟FVIII的氨基酸残基746至1648的缺失。
“B结构域缺失的FVIII”可以具有以下文献中披露的完全或部分缺失:美国专利号6,316,226、6,346,513、7,041,635、5,789,203、6,060,447、5,595,886、6,228,620、5,972,885、6,048,720、5,543,502、5,610,278、5,171,844、5,112,950、4,868,112和6,458,563以及国际公开号WO 2015106052 A1(PCT/US2015/010738)。在一些实施例中,用于本公开文本的方法中的B结构域缺失的FVIII序列包含美国专利号6,316,226(也在US 6,346,513中)的第4栏第4行至第5栏第28行和实例1-5中披露的缺失中的任何一个。在另一个实施例中,B结构域缺失的因子VIII是S743/Q1638 B结构域缺失的因子VIII(SQ BDD FVIII)(例如,具有氨基酸744至氨基酸1637的缺失的因子VIII,例如具有成熟FVIII的氨基酸1-743和氨基酸1638-2332的因子VIII)。在一些实施例中,用于本公开文本的方法中的B结构域缺失的FVIII具有美国专利号5,789,203(还有US 6,060,447、US 5,595,886和US 6,228,620)的第2栏第26-51行和实例5-8中披露的缺失。在一些实施例中,B结构域缺失的因子VIII具有以下文献中所述的缺失:美国专利号5,972,885的第1栏第25行至第2栏第40行;美国专利号6,048,720的第6栏第1-22行和实例1;美国专利号5,543,502的第2栏第17-46行;美国专利号5,171,844的第4栏第22行至第5栏第36行;美国专利号5,112,950的第2栏第55-68行、图2和实例1;美国专利号4,868,112的第2栏第2行至第19栏第21行和表2;美国专利号7,041,635的第2栏第1行至第3栏第19行、第3栏第40行至第4栏第67行、第7栏第43行至第8栏第26行和第11栏第5行至第13栏第39行;或美国专利号6,458,563的第4栏第25-53行。在一些实施例中,B结构域缺失的FVIII具有大部分B结构域的缺失,但是仍含有将初级翻译产物在体内蛋白质水解加工为两条多肽链所必需的B结构域的胺基末端序列,如WO 91/09122中所披露。在一些实施例中,B结构域缺失的FVIII构建为具有氨基酸747-1638的缺失,即实际上完全缺失B结构域。Hoeben R.C.等J.Biol.Chem.265(13):7318-7323(1990)。B结构域缺失的因子VIII还可以含有FVIII的氨基酸771–1666或氨基酸868-1562的缺失。Meulien P.等Protein Eng.2(4):301-6(1988)。作为本发明的一部分的其他B结构域缺失包括:氨基酸982至1562或760至1639(Toole等,Proc.Natl.Acad.Sci.U.S.A.(1986)83,5939-5942)、797至1562(Eaton,等Biochemistry(1986)25:8343-8347)、741至1646(KaufmaN(PCT公开申请号WO 87/04187))、747-1560(Sarver等,DNA(1987)6:553-564)、741至1648(Pasek(PCT申请号88/00831))或者816至1598或741至1648(Lagner(Behring Inst.Mitt.(1988)第82期:16-25、EP 295597))的缺失。在一个特定实施例中,B结构域缺失的FVIII包含成熟FVIII的氨基酸残基746至1648的缺失。在另一个实施例中,B结构域缺失的FVIII包含成熟FVIII的氨基酸残基745至1648的缺失。在一些实施例中,BDD FVIII包含含有对应于成熟全长FVIII的氨基酸765至1652中的缺失的单链FVIII(也称为rVIII-SingleChain和
Figure BDA0003006446640000671
)。参见美国专利号7,041,635。
在其他实施例中,BDD FVIII包括含有B结构域的如下片段的FVIII多肽,所述片段保留一个或多个N连接糖基化位点,例如对应于全长FVIII序列的氨基酸序列的残基757、784、828、900、963或任选地943。B结构域片段的例子包括B结构域的226个氨基酸或163个氨基酸,如Miao,H.Z.等,Blood 103(a):3412-3419(2004);Kasuda,A等,J.Thromb.Haemost.6:1352-1359(2008)和Pipe,S.W.等,J.Thromb.Haemost.9:2235-2242(2011)中所披露(即,保留B结构域的前226个氨基酸或163个氨基酸)。在仍其他实施例中,BDD FVIII还包含在残基309处的点突变(从Phe至Ser)以改良BDD FVIII蛋白的表达。参见Miao,H.Z.等,Blood 103(a):3412-3419(2004)。在仍其他实施例中,BDD FVIII包括含有B结构域的一部分,但是不含一个或多个弗林蛋白酶切割位点(例如,Arg1313和Arg 1648)的FVIII多肽。参见Pipe,S.W.等,J.Thromb.Haemost.9:2235-2242(2011)。在一些实施例中,BDD FVIII包含含有对应于成熟全长FVIII的氨基酸765至1652中的缺失的单链FVIII(也称为rVIII-SingleChain和
Figure BDA0003006446640000681
参见美国专利号7,041,635。可以在任何FVIII序列中产生前述每一种缺失。
已知众多种功能FVIII变异体,如上文和下文所讨论。另外,已经在血友病患者体内鉴定出FVIII中的数百种非功能性突变,并且已经确定,这些突变对FVIII功能的影响更多归因于其在FVIII的三维结构内的位置而不是取代的性质(Cutler等,Hum.Mutat.19:274-8(2002)),将所述文献通过引用以其整体并入本文。另外,来自人和其他物种的FVIII之间的比较已经鉴定出可能为功能所需的保守残基(Cameron等,Thromb.Haemost.79:317-22(1998);US 6,251,632),将所述文献通过引用以其整体并入本文。
在一些实施例中,FVIII多肽包含其FVIII变异体或片段,其中其FVIII变异体或片段具有FVIII活性。在一些实施例中,基因盒编码全长FVIII多肽。在其他实施例中,基因盒编码B结构域缺失的(BDD)FVIII多肽,其中缺失FVIII的B结构域的全部或一部分。在一个特定实施例中,基因盒编码包含与SEQ ID NO:106、107、109、110、111或112具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的多肽。在一些实施例中,基因盒编码具有SEQ ID NO:17的氨基酸序列的多肽或其片段。在一些实施例中,基因盒编码具有SEQ ID NO:106的氨基酸序列的多肽或其片段。在一些实施例中,基因盒包含与SEQ ID NO:107具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒编码具有SEQ ID NO:109的氨基酸序列的多肽或其片段。在一些实施例中,基因盒包含与SEQ ID NO:16具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与SEQ ID NO:109具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。
在一些实施例中,本公开文本的基因盒编码包含信号肽的FVIII多肽或其片段。在其他实施例中,基因盒编码缺少信号肽的FVIII多肽。在一些实施例中,信号肽包含SEQ IDNO:17的氨基酸1-19。
在一些实施例中,基因盒包含编码FVIII多肽的核苷酸序列,其中核苷酸序列经密码子优化。在某些实施例中,基因盒包含国际申请号PCT/US2017/015879中披露的核苷酸序列,将所述申请通过引用以其整体并入本文。在一些实施例中,基因盒包含编码FVIII多肽的核苷酸序列,其中核苷酸序列经密码子优化。在某些实施例中,基因盒包含与选自SEQ IDNO:1-14的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与SEQ ID NO:71具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与SEQ ID NO:19具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。
i.编码FVIII多肽的密码子优化的核苷酸序列
在一些实施例中,本公开文本的核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中第一ITR和第二ITR衍生自AAV基因组,并且其中基因盒包含编码FVIII多肽的密码子优化的核苷酸序列。在一些实施例中,密码子优化的核苷酸序列编码全长FVIII多肽。在其他实施例中,密码子优化的核苷酸序列编码B结构域缺失的(BDD)FVIII多肽,其中缺失FVIII的B结构域的全部或一部分。在一个特定实施例中,密码子优化的核苷酸序列编码包含与SEQ ID NO:17具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的多肽或其片段。在一个实施例中,密码子优化的核苷酸序列编码具有SEQ ID NO:17的氨基酸序列的多肽或其片段。
在一些实施例中,密码子优化的核苷酸序列编码包含信号肽的FVIII多肽或其片段。在其他实施例中,密码子优化的序列编码缺少信号肽的FVIII多肽。在一些实施例中,信号肽包含SEQ ID NO:17的氨基酸1-19。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791或(ii)SEQ ID NO:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个特定实施例中,第一核酸序列与SEQ ID NO:3的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在另一个实施例中,第一核酸序列与SEQ ID NO:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第一核苷酸序列包含SEQ ID NO:3的核苷酸58-1791或SEQ ID NO:4的核苷酸58-1791。
在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸1-1791或(ii)SEQ ID NO:4的核苷酸1-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个实施例中,第一核苷酸序列包含SEQ ID NO:3的核苷酸1-1791或SEQ ID NO:4的核苷酸1-1791。在另一个实施例中,第二核苷酸序列与SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核苷酸序列包含SEQ IDNO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374。在仍另一个实施例中,第二核苷酸序列与SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374)具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核苷酸序列包含SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374)。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374或(ii)SEQ ID NO:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在某些实施例中,第二核酸序列与SEQ ID NO:5的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第二核酸序列与SEQ ID NO:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核酸序列包含SEQ IDNO:5的核苷酸1792-4374或SEQ ID NO:6的核苷酸1792-4374。在一些实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374)或(ii)SEQ IDNO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQID NO:6的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在某些实施例中,第二核酸序列与SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第二核酸序列与SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核酸序列包含SEQ ID NO:5的核苷酸1792-2277和2320-4374或SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374或SEQ ID NO:6的核苷酸1792-4374)。在一些实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:1的核苷酸58-1791、(ii)SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在其他实施例中,第一核苷酸序列包含SEQ ID NO:1的核苷酸58-1791、SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791。
在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:1的核苷酸1-1791、(ii)SEQ ID NO:2的核苷酸1-1791、(iii)SEQ ID NO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个实施例中,第一核苷酸序列包含SEQID NO:1的核苷酸1-1791、SEQ ID NO:2的核苷酸1-1791、(iii)SEQ ID NO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791。在另一个实施例中,与第一核苷酸序列连接的第二核苷酸序列与SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,与第一核苷酸序列连接的第二核苷酸序列包含(i)SEQID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在其他实施例中,与第一核苷酸序列连接的第二核苷酸序列与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个实施例中,第二核苷酸序列包含(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374。
在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个特定实施例中,第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在一些实施例中,编码FVIII多肽的密码子优化的序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQID NO:71的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374)具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个实施例中,第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374)。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:1的核苷酸58至4374具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ IDNO:1的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQID NO:1的核苷酸58-4374)具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:1具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:1的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸58-4374)或SEQ ID NO:1的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:1的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸1-4374)或SEQ ID NO:1的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:2的核苷酸58至4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:2的核苷酸58-2277和2320-4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:2具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:2的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:2的核苷酸58-4374)或SEQ ID NO:2的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ IDNO:2的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ IDNO:2的核苷酸1-4374)或SEQ ID NO:2的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:70的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:70的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:70的核苷酸58-4374)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:70具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:70的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:70的核苷酸58-4374)或SEQ ID NO:70的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:70的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:70的核苷酸1-4374)或SEQ ID NO:70的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:71的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:71的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:71的核苷酸58-4374)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:71具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:71的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:71的核苷酸58-4374)或SEQ ID NO:71的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:71的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:71的核苷酸1-4374)或SEQ ID NO:71的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:3的核苷酸58至4374具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:3的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸58-4374)具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与SEQ ID NO:3具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸58-4374)或SEQ ID NO:3的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸1-4374)或SEQ IDNO:3的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:4的核苷酸58至4374具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:4的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:4的核苷酸58-4374)具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:4的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:4的核苷酸58-4374)或SEQ ID NO:4的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:4的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:4的核苷酸1-4374)或SEQ ID NO:4的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:5的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:5的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸58-4374)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与SEQ ID NO:5具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含SEQ ID NO:5的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸58-4374)或SEQ ID NO:5的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:5的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1-4374)或SEQ ID NO:5的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:6的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:6的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸58-4374)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与SEQ ID NO:6具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含SEQ ID NO:6的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸58-4374)或SEQ ID NO:6的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:6的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1-4374)或SEQ ID NO:6的核苷酸1至4374。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码信号肽的核酸序列。在某些实施例中,信号肽是FVIII信号肽。在一些实施例中,编码信号肽的核酸序列经密码子优化。在一个特定实施例中,编码信号肽的核酸序列与(i)SEQ ID NO:1的核苷酸1至57;(ii)SEQ ID NO:2的核苷酸1至57;(iii)SEQ ID NO:3的核苷酸1至57;(iv)SEQ IDNO:4的核苷酸1至57;(v)SEQ ID NO:5的核苷酸1至57;(vi)SEQ ID NO:6的核苷酸1至57;(vii)SEQ ID NO:70的核苷酸1至57;(viii)SEQ ID NO:71的核苷酸1至57;或(ix)SEQ IDNO:68的核苷酸1至57具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
SEQ ID NO:1-6、70和71是起始或“亲代”或“野生型”FVIII核苷酸序列SEQ ID NO:16的优化形式。SEQ ID NO:16编码B结构域缺失的人FVIII。虽然SEQ ID NO:1-6、70和71衍生自FVIII的特定B结构域缺失形式(SEQ ID NO:16),但是应理解,本公开文本还包括编码FVIII的其他形式的核酸的优化形式。例如,FVIII的其他形式可以包括全长FVIII、FVIII的其他B结构域缺失(本文所述)或保留FVIII活性的其他FVIII片段。
在一个实施例中,基因盒包含FVIII构建体,其包括如表2A-2F中所列示的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2A中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2B中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2C中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2D中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2E中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2F中所述的多核苷酸序列。
在某些实施例中,分离的核酸分子包含与SEQ ID NO:179、182、189或194的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:179的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:182的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:189的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:194的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子保留表达功能性FVIII蛋白的能力。
表2A:示例性AAV-FVIII构建体(核苷酸1-6526;SEQ ID NO:110)
Figure BDA0003006446640000791
Figure BDA0003006446640000801
Figure BDA0003006446640000811
Figure BDA0003006446640000821
Figure BDA0003006446640000831
表2B:带有B19d135 ITR的示例性B19-FVIII构建体(核苷酸1-6762;SEQ ID NO:179)
Figure BDA0003006446640000832
Figure BDA0003006446640000841
Figure BDA0003006446640000851
Figure BDA0003006446640000861
Figure BDA0003006446640000871
Figure BDA0003006446640000881
表2C:带有GPVd162 ITR的示例性GPV-FVIII构建体(核苷酸1-6830;SEQ ID NO:182)
Figure BDA0003006446640000882
Figure BDA0003006446640000891
Figure BDA0003006446640000901
Figure BDA0003006446640000911
Figure BDA0003006446640000921
Figure BDA0003006446640000931
Figure BDA0003006446640000941
表2D:带有全长B19 ITR的示例性B19-FVIII构建体(核苷酸1-7032;SEQ ID NO:189)
Figure BDA0003006446640000942
Figure BDA0003006446640000951
Figure BDA0003006446640000961
Figure BDA0003006446640000971
Figure BDA0003006446640000981
Figure BDA0003006446640000991
表2E:示例性AAV-FVIII构建体(核苷酸1-6824;SEQ ID NO:190)
Figure BDA0003006446640000992
Figure BDA0003006446640001001
Figure BDA0003006446640001011
Figure BDA0003006446640001021
Figure BDA0003006446640001031
Figure BDA0003006446640001041
Figure BDA0003006446640001051
表2F:带有全长GPV ITR的示例性GPV-FVIII构建体(核苷酸1-7154;SEQ ID NO:194)
Figure BDA0003006446640001052
Figure BDA0003006446640001061
Figure BDA0003006446640001071
Figure BDA0003006446640001081
Figure BDA0003006446640001091
Figure BDA0003006446640001101
在一个实施例中,基因盒包含苯丙氨酸羟化酶(PAH)构建体,其包括如表10A和10B中所列示的多核苷酸序列。在一个实施例中,基因盒包含PAH构建体,其包括表10A中所述的多核苷酸序列。在一个实施例中,基因盒包含PAH构建体,其包括表10B中所述的多核苷酸序列。
在某些实施例中,分离的核酸分子包含与SEQ ID NO:197或198的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:197的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:198的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子保留表达功能性苯丙氨酸羟化酶的能力。
A.密码子适应指数
在一个实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。例如,密码子优化的核苷酸序列可具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)、至少约0.91(91%)、至少约0.92(92%)、至少约0.93(93%)、至少约0.94(94%)、至少约0.95(95%)、至少约0.96(96%)、至少约0.97(97%)、至少约0.98(98%)或至少约0.99(99%)。在一些实施例中,密码子优化的核苷酸序列具有至少约.88(88%)的人密码子适应指数。在其他实施例中,密码子优化的核苷酸序列具有至少约.91(91%)的人密码子适应指数。在其他实施例中,密码子优化的核苷酸序列具有至少约.91(97%)的人密码子适应指数。
在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)或至少约.91(91%)。在一个特定实施例中,核苷酸序列具有至少约.88(88%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约.91(91%)的人密码子适应指数。
在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374或(ii)SEQ ID NO:6的核苷酸1792-2277和2320-4374具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定实施例中,核苷酸序列具有至少约.83(83%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约.88(88%)的人密码子适应指数。
在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定实施例中,核苷酸序列具有至少约0.75(75%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.83(83%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.88(88%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.91(91%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.97(97%)的人密码子适应指数。
在一些实施例中,本公开文本的编码FVIII多肽的密码子优化的核苷酸序列具有相对于SEQ ID NO:16增加的最优密码子频率(FOP)。在某些实施例中,编码FVIII多肽的密码子优化的核苷酸序列的FOP是至少约40、至少约45、至少约50、至少约55、至少约60、至少约64、至少约65、至少约70、至少约75、至少约79、至少约80、至少约85或至少约90。
在其他实施例中,本公开文本的编码FVIII多肽的密码子优化的核苷酸序列具有相对于SEQ ID NO:16增加的同义密码子相对使用度(RCSU)。在一些实施例中,分离的核酸分子的RCSU大于1.5。在其他实施例中,分离的核酸分子的RCSU大于2.0。在某些实施例中,分离的核酸分子的RCSU是至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2.0、至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6或至少约2.7。
在仍其他实施例中,本公开文本的编码FVIII多肽的密码子优化的核苷酸序列具有相对于SEQ ID NO:16减少的密码子有效数。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有以下密码子有效数:小于约50、小于约45、小于约40、小于约35、小于约30或小于约25。在一个特定实施例中,分离的核酸分子具有以下密码子有效数:约40、约35、约30、约25或约20。
B.G/C含量优化
在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,密码子优化的核苷酸序列含有更高百分比的G/C核苷酸。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有以下G/C含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%或至少约60%。
在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高百分比的G/C核苷酸。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含以下G/C含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%或至少约58%。在一个特定实施例中,编码具有FVIII活性的多肽的核苷酸序列具有至少约58%的G/C含量。
在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374)或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,密码子优化的核苷酸序列含有更高百分比的G/C核苷酸。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有以下G/C含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%或至少约57%。在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约52%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约55%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约57%的G/C含量。
在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高百分比的G/C核苷酸。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约45%的G/C含量。在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约52%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约55%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约57%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约58%的G/C含量。在仍另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约60%的G/C含量。
“G/C含量”(或鸟嘌呤-胞嘧啶含量)或“G/C核苷酸的百分比”是指DNA分子中是鸟嘌呤或胞嘧啶的含氮碱基的百分比。G/C含量可使用下式计算:
Figure BDA0003006446640001161
人基因的G/C含量具有高异质性,其中一些基因的G/C含量低至20%,并且其他基因的G/C含量高至95%。通常,富含G/C的基因具有更高表达。事实上,已证实,增加基因的G/C含量可导致基因表达增加,这主要是由于转录增加和较高稳态mRNA水平所致。参见Kudla等,PLoS Biol.,4(6):e180(2006)。
C.基质附着区样序列
在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。
在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。
在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。
在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374或(ii)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。
已经鉴定出人FVIII核苷酸序列中富含AT的组件,其与酿酒酵母(Saccharomycescerevisiae)自主复制序列(ARS)和核基质附着区(MAR)共享序列相似性。(Fallux等,Mol.Cell.Biol.16:4264-4272(1996))。已经证实这些组件中的一种在体外结合核因子并阻遏氯霉素乙酰转移酶(CAT)报告基因的表达。同上。已经假设,这些序列可能有助于人FVIII基因的转录阻遏。因此,在一个实施例中,在本公开文本的编码FVIII多肽的密码子优化的核苷酸序列中消除所有MAR/ARS序列。在亲代FVIII序列(SEQ ID NO:16)中存在4个MAR/ARS ATATTT序列(SEQ ID NO:21)和3个MAR/ARS AAATAT序列(SEQ ID NO:22)。所有这些位点都发生突变以破坏优化的FVIII序列(SEQ ID NO:1-6)中的MAR/ARS序列。优化的序列中这些组件各自的位置以及相应核苷酸的序列显示于下表3中。
表3:阻遏组件的变化概述
Figure BDA0003006446640001181
Figure BDA0003006446640001191
D.去稳定序列
在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。
在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少去稳定元件。在其他实施例中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。
在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少去稳定元件。在其他实施例中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。
在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于SEQID NO:16含有更少去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。
在亲代FVIII序列(SEQ ID NO:16)中存在10个去稳定元件:6个ATTTA序列(SEQ IDNO:23)和4个TAAAT序列(SEQ ID NO:24)。在一个实施例中,这些位点的序列发生突变以破坏优化的FVIII SEQ ID NO:1-6、70和71中的去稳定元件。优化的序列中这些组件各自的位置以及相应核苷酸的序列显示于表3中。
E.潜在启动子结合位点
在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中所述核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。
在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。
在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。
在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。
TATA盒是通常在真核生物的启动子区中发现的调控序列。其用作通用转录因子TATA结合蛋白(TBP)的结合位点。TATA盒通常包含序列TATAA(SEQ ID NO:28)或相似变异体。然而,编码序列内的TATA盒可以抑制全长蛋白质的翻译。在野生型BDD FVIII序列(SEQID NO:16)中存在10个潜在启动子结合序列:5个TATAA序列(SEQ ID NO:28)和5个TTATA序列(SEQ ID NO:29)。在一些实施例中,在本公开文本的FVIII基因中消除至少1个、至少2个、至少3个或至少4个激活子结合位点。在一些实施例中,在本公开文本的FVIII基因中消除至少5个激活子结合位点。在其他实施例中,在本公开文本的FVIII基因中消除至少6个、至少7个或至少8个激活子结合位点。在一个实施例中,在本公开文本的FVIII基因中消除至少9个激活子结合位点。在一个特定实施例中,在本公开文本的FVIII基因中消除所有启动子结合位点。优化的序列中每个潜在启动子结合位点的位置以及相应核苷酸的序列显示于表3中。
F.其他顺式作用负调控组件
除了上述的MAR/ARS序列、去稳定元件和潜在启动子位点以外,在野生型BDDFVIII序列(SEQ ID NO:16)中还可以鉴定出若干个其他潜在抑制性序列。在未经优化的BDDFVIII序列中可以鉴定出两个富含AU的序列组件(ARE)(ATTTTATT(SEQ ID NO:30);和ATTTTTAA(SEQ ID NO:31))以及多聚A位点(AAAAAAA;SEQ ID NO:26)、多聚T位点(TTTTTT;SEQ ID NO:25)和剪接位点(GGTGAT;SEQ ID NO:27)。这些组件中的一个或多个可以从优化的FVIII序列去除。优化的序列中这些位点各自的位置以及相应核苷酸的序列显示于表3中。
在某些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。
在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。
在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。
在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含多聚T序列(SEQID NO:25)。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含多聚A序列(SEQ ID NO:26)。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ IDNO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含ARE组件(SEQ ID NO:30或SEQ ID NO:31)。
在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ IDNO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含多聚T序列(SEQ ID NO:25)。在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含多聚A序列(SEQ ID NO:26)。在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含ARE组件(SEQ ID NO:30或SEQ ID NO:31)。
在其他实施例中,本公开文本的优化的FVIII序列不含抗病毒基序、茎环结构和重复序列中的一个或多个。
在仍其他实施例中,转录起始位点周围的核苷酸变为kozak共有序列(GCCGCCACCATGC(SEQ ID NO:32),其中加下划线的核苷酸是起始密码子)。在其他实施例中,可添加或去除限制位点以有助于克隆过程。
b.FIX和编码FIX蛋白的多核苷酸序列
在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含FIX多肽。在一些实施例中,FIX多肽包含FIX或其变异体或片段,其中FIX或其变异体或片段具有FIX活性。
人FIX是丝氨酸蛋白酶,其是血液凝结级联的固有路径的重要组分。如本文所用的“因子IX”或“FIX”是指凝结因子蛋白和种类及其序列变异体,并且包括但不限于人FIX前体多肽(“prepro”)的461单链氨基酸序列、成熟人FIX(SEQ ID NO:125)的415单链氨基酸序列和R338L FIX(Padua)变异体(SEQ ID NO:126)。FIX包括具有血液凝结FIX的典型特征的任何形式的FIX分子。如本文所用,“因子IX”和“FIX”旨在涵盖包含以下的多肽:结构域GlA(含有γ-羧基谷氨酸残基的区域)、EGF1和EGF2(含有与人表皮生长因子同源的序列的区域)、激活肽(由成熟FIX的残基R136-R180形成的“AP”)和C末端蛋白酶结构域(“Pro”)或本领域已知的这些结构域的同义词,或者可为保留天然蛋白的生物学活性的至少一部分的截短片段或序列变异体。已经克隆出FIX或序列变异体,如美国专利号4,770,999和7,700,734中所述,并且编码人FIX的cDNA已经被分离,表征并克隆至表达载体中(参见例如,Choo等,Nature 299:178-180(1982);Fair等,Blood 64:194-204(1984);和Kurachi等,Proc.Natl.Acad.Sci.,U.S.A.79:6461-6464(1982))。由Simioni等在2009年表征的FIX的一种特定变异体R338L FIX(Padua)变异体(SEQ ID NO:2)包含获得功能突变,所述突变与Padua变异体活性相对于天然FIX的几乎8倍增加相关(表4)。FIX变异体还可包括具有一个或多个不影响FIX多肽的FIX活性的保守氨基酸取代的任何FIX多肽。在一些实施例中,FIX变异体包含通过可切割接头(例如,
Figure BDA0003006446640001282
)融合的rFIX-白蛋白。参见US 7,939,632,通过引用以其整体并入本文。
表4:示例性FIX序列
Figure BDA0003006446640001281
Figure BDA0003006446640001291
Figure BDA0003006446640001301
Figure BDA0003006446640001311
*灰色阴影=信号肽;下划线=XTEN序列;粗体=Fc。
**美国专利号9,856,468的SEQ ID NO:67,所述专利通过引用以其整体并入本文。
FIX多肽为55kDa,合成为由三个区域构成的前原多肽链(SEQ ID NO:125):28个氨基酸的信号肽(SEQ ID NO:127的氨基酸1至28)、谷氨酸残基的γ-羧基化所需的18个氨基酸的前肽(氨基酸29至46)和415个氨基酸的成熟因子IX(SEQ ID NO:125或126)。前肽是γ-羧基谷氨酸结构域N末端的18个氨基酸残基的序列。前肽结合维生素K依赖性γ羧化酶,然后通过内源蛋白酶从FIX的前体多肽切割,所述内源蛋白酶最可能是PACE(成对碱性氨基酸切割酶),也称为弗林蛋白酶或PCSK3。在不进行γ羧基化的情况下,Gla结构域不能结合钙以采取将蛋白质锚定至带负电的磷脂表面所必需的正确构象,从而使因子IX无功能。即使将其羧基化,Gla结构域也依赖于前肽的切割以获得正常功能,因为保留的前肽干扰与钙和磷脂的最优结合所必需的Gla结构域的构象变化。在人体内,所得成熟因子IX由肝细胞作为无活性酶原分泌至血流中,所述酶原是415个氨基酸残基的单链蛋白,其含有以重量计大约17%的碳水化合物(Schmidt,A.E.等(2003)Trends Cardiovasc Med,13:39)。
成熟FIX由若干个结构域构成,所述结构域以N末端至C末端构型是:GLA结构域、EGF1结构域、EGF2结构域、激活肽(AP)结构域和蛋白酶(或催化)结构域。短接头连接EGF2结构域与AP结构域。FIX含有两种激活肽,分别由R145-A146和R180-V181形成。在激活后,单链FIX变为2链分子,其中两条链通过二硫键连接。凝血因子可以通过替代其激活肽来工程化,从而得到改变的激活特异性。在哺乳动物体内,成熟FIX必须由激活的因子XI激活以产生因子IXa。在将FIX激活为FIXa之后,蛋白酶结构域提供FIX的催化活性。激活的因子VIII(FVIIIa)是完全表达FIXa活性的特定辅因子。
在某些实施例中,FIX多肽包含血浆衍生的FIX的Thr148等位基因形式,并且具有与内源FIX类似的结构和功能特征。
许多功能性FIX变异体是本领域已知的。国际公开号WO 02/040544 A3在第4页第9-30行和第15页第6-31行披露了展现增加的对肝素抑制的抗性的突变体。国际公开号WO03/020764 A2在表2和表3(在第14-24页)和第12页第1-27行披露了具有降低的T细胞免疫原性的FIX突变体。国际公开号WO 2007/149406 A2在第4页第1行至第19页第11行披露了功能性突变体FIX分子,其展现增加的蛋白质稳定性、增加的体内和体外半衰期以及增加的蛋白酶抗性。WO 2007/149406 A2在第19页第12行至第20行第9行还披露了嵌合的和其他变异体FIX分子。国际公开号WO 08/118507 A2在第5页第14行至第6页第5行披露了展现增加的凝血活性的FIX突变体。国际公开号WO 09/051717 A2在第9页第11行至第20页第2行披露了FIX突变体,其具有增加的N连接和/或O连接糖基化位点数目,这导致增加的半衰期和/或回收率。国际公开号WO 09/137254 A2在第2页第[006]段至第5页第[011]段以及第16页第[044]段至第24页第[057]段还披露了具有增加的糖基化位点数目的因子IX突变体。国际公开号WO 09/130198 A2在第4页第26行至第12页第6行披露了功能性突变体FIX分子,其具有增加的糖基化位点数目,这导致增加的半衰期。国际公开号WO 09/140015 A2在第11页第[0043]段至第13页第[0053]段披露了功能性FIX突变体,其具有增加的可用于聚合物(例如,PEG)缀合的Cys残基数。2011年7月11日提交并且作为WO 2012/006624于2012年1月12日公开的国际申请号PCT/US2011/043569中所述的FIX多肽也通过引用以其整体并入本文。在一些实施例中,FIX多肽包含融合至白蛋白的FIX多肽(例如,FIX-白蛋白)。在某些实施例中,FIX多肽是
Figure BDA0003006446640001321
或rIX-FP。
另外,已经在血友病受试者体内鉴定出FIX中的数百个非功能性突变,其中许多突变披露于国际公开号WO 09/137254 A2的第11-14页的表6中。此类非功能性突变不包括于本发明中,但提供了哪些突变更有可能或更不可能产生功能性FIX多肽的额外指导。
在一个实施例中,FIX多肽(或融合多肽的因子IX部分)包含与SEQ ID NO:1或2中所述的序列(SEQ ID NO:125或126的氨基酸1至415)或者可替代地与前肽序列或与前肽和信号序列(全长FIX)至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的氨基酸序列。在另一个实施例中,FIX多肽包含与SEQ ID NO:2中所述的序列至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的氨基酸序列。
FIX促凝剂活性表示为一个或多个国际单位(IU)。1 IU的FIX活性大致对应于1毫升正常人血浆中FIX的量。若干种测定可用于量测FIX活性,包括一步式凝血测定(激活部分促凝血酶原激酶时间;aPTT)、凝血酶产生时间(TGA)和旋转凝血弹性量测法
Figure BDA0003006446640001331
本发明考虑了与FIX序列、天然(如来自人、非人灵长类动物、哺乳动物(包括家畜))序列片段和非天然序列变异体具有同源性的序列,所述序列保留FIX的生物活性或生物功能的至少一部分和/或可用于预防、治疗、调解或改善凝结因子相关疾病、缺乏、病症或病症(例如,与创伤、手术或凝结因子缺乏相关的出血发作)。与人FIX具有同源性的序列可通过标准同源性搜索技术(如NCBI BLAST)来发现。
在某些实施例中,FIX序列经过密码子优化。密码子优化的FIX序列的例子包括但不限于国际公开号WO 2016/004113 A1的SEQ ID NO:1和54-58,将所述专利通过引用以其整体并入本文。
c.FVII和编码FVII蛋白的多核苷酸序列
在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子VII多肽。在一些实施例中,FVII多肽包含FVII或其变异体或片段,其中其变异体或片段具有FVII活性。
“因子VII”(“FVII”或“F7”;也称为因子7、凝结因子VII、血清因子VII、血清凝血酶原转化加速因子、SPCA、前转化素(proconvertin)和依他凝血素α(eptacogα))是丝氨酸蛋白酶,其是凝结级联的一部分。在一个实施例中,本文所述的核酸中的凝血因子是FVII。重组激活的因子VII(“FVII”)已经广泛用于治疗大出血,如发生在患有以下疾病的患者中的大出血:血友病A或B、缺乏凝结因子XI、FVII、血小板功能缺陷、血小板减少症或血管性血友病。
重组激活的FVII(rFVIIa;
Figure BDA0003006446640001332
)用于治疗以下患者的出血发作:(i)具有针对FVIII或FIX的中和抗体(抑制剂)的血友病患者,(ii)具有FVII缺乏的患者,或(iii)正在进行外科手术的患有血友病A或B且具有抑制剂的患者。然而,
Figure BDA0003006446640001333
展示较差功效。通常需要高浓度的FVIIa重复剂量来控制出血,因为FVIIa与激活的血小板的亲和性低,半衰期短,并且在组织因子不存在下酶活性较差。因此,对于具有FVIII和FIX抑制剂和/或具有FVII缺乏的血友病患者,对更好的治疗和预防选择存在未满足的医疗需求。
在一个实施例中,基因盒编码FVII的成熟形式或其变异体。FVII包括Gla结构域、两个EGF结构域(EGF-1和EGF-2)以及丝氨酸蛋白酶结构域(或肽酶S1结构域),所述丝氨酸蛋白酶结构域在丝氨酸蛋白酶的肽酶S1家族的所有成员之间高度保守,如例如糜蛋白酶的情况。FVII作为单链酶原(即,可激活的FVII)和完全激活的双链形式出现。
C.生长因子
在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,并且其中治疗性蛋白质包含生长因子。生长因子可以选自本领域已知的任何生长因子。在一些实施例中,生长因子是激素。在其他实施例中,生长因子是细胞因子。在一些实施例中,生长因子是趋化因子。
在一些实施例中,生长因子是肾上腺髓质素(AM)。在一些实施例中,生长因子是血管生成素(Ang)。在一些实施例中,生长因子是自分泌运动因子。在一些实施例中,生长因子是骨形态发生蛋白(BMP)。在一些实施例中,BMP选自BMP2、BMP4、BMP5和BMP7。在一些实施例中,生长因子是睫状神经营养因子家族成员。在一些实施例中,睫状神经营养因子家族成员选自睫状神经营养因子(CNTF)、白血病抑制因子(LIF)、白介素-6(IL-6)。在一些实施例中,生长因子是集落刺激因子。在一些实施例中,集落刺激因子选自巨噬细胞集落刺激因子(m-CSF)、粒细胞集落刺激因子(G-CSF)和粒细胞巨噬细胞集落刺激因子(GM-CSF)。在一些实施例中,生长因子是表皮生长因子(EGF)。在一些实施例中,生长因子是肝配蛋白。在一些实施例中,肝配蛋白选自肝配蛋白A1、肝配蛋白A2、肝配蛋白A3、肝配蛋白A4、肝配蛋白A5、肝配蛋白B1、肝配蛋白B2和肝配蛋白B3。在一些实施例中,生长因子是促红细胞生成素(EPO)。在一些实施例中,生长因子是成纤维细胞生长因子(FGF)。在一些实施例中,FGF选自FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15、FGF16、FGF17、FGF18、FGF19、FGF20、FGF21、FGF22和FGF23。在一些实施例中,生长因子是胎牛促体素(FBS)。在一些实施例中,生长因子是GDNF家族成员。在一些实施例中,GDNF家族成员选自神经胶质细胞系衍生的神经营养因子(GDNF)、神经秩蛋白、普塞芬蛋白和阿特敏蛋白。在一些实施例中,生长因子是生长分化因子-9(GDF9)。在一些实施例中,生长因子是肝细胞生长因子(HGF)。在一些实施例中,生长因子是肝细胞瘤衍生的生长因子(HDGF)。在一些实施例中,生长因子是胰岛素。在一些实施例中,生长因子是胰岛素样生长因子。在一些实施例中,胰岛素样生长因子是胰岛素样生长因子-1(IGF-1)或IGF-2。在一些实施例中,生长因子是白介素(IL)。在一些实施例中,IL选自IL-1、IL-2、IL-3、IL-4、IL-5、IL-6和IL-7。在一些实施例中,生长因子是角质形成细胞生长因子(KGF)。在一些实施例中,生长因子是迁移刺激因子(MSF)。在一些实施例中,生长因子是巨噬细胞刺激蛋白(MSP或肝细胞生长因子样蛋白(HGFLP))。在一些实施例中,生长因子是肌生成抑制蛋白(GDF-8)。在一些实施例中,生长因子是神经调节蛋白。在一些实施例中,神经调节蛋白选自神经调节蛋白1(NRG1)、NRG2、NRG3和NRG4。在一些实施例中,生长因子是神经营养蛋白。在一些实施例中,生长因子是脑衍生的神经营养因子(BDNF)。在一些实施例中,生长因子是神经生长因子(NGF)。在一些实施例中,NGF是神经营养蛋白-3(NT-3)或NT-4。在一些实施例中,生长因子是胎盘生长因子(PGF)。在一些实施例中,生长因子是血小板衍生的生长因子(PDGF)。在一些实施例中,生长因子是肾胺酶(RNLS)。在一些实施例中,生长因子是T细胞生长因子(TCGF)。在一些实施例中,生长因子是血小板生成素(TPO)。在一些实施例中,生长因子是转化生长因子。在一些实施例中,转化生长因子是转化生长因子α(TGF-α)或TGF-β。在一些实施例中,生长因子是肿瘤坏死因子-α(TNF-α)。在一些实施例中,生长因子是血管内皮生长因子(VEGF)。
D.微小RNA(miRNA)
微小RNA(miRNA)是通过抑制翻译或诱导信使RNA(mRNA)降解来负调控基因表达的小非编码RNA分子(约18-22个核苷酸)。从其发现以来,miRNA已经参与多种细胞过程,包括细胞凋亡、分化和细胞增生,并且其已显示在致癌中具有关键作用。miRNA调控基因表达的能力使得体内miRNA表达成为基因疗法中有价值的工具。
本公开文本的某些方面涉及质粒样核酸分子,其包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码miRNA,并且其中第一ITR和/或第二ITR是非腺相关病毒的ITR(例如,第一ITR和/或第二ITR来自非AAV)。miRNA可以是本领域已知的任何miRNA。在一些实施例中,miRNA下调靶基因的表达。在某些实施例中,靶基因选自SOD1、HTT、RHO或其任何组合。
在一些实施例中,基因盒编码一种miRNA。在一些实施例中,基因盒编码多于一种miRNA。在一些实施例中,基因盒编码两种或更多种不同的miRNA。在一些实施例中,基因盒编码相同miRNA的两个或更多个拷贝。在一些实施例中,基因盒编码相同治疗性蛋白质的两种或更多种变异体。在某些实施例中,基因盒编码一种或多种miRNA以及一种或多种治疗性蛋白质。
在一些实施例中,miRNA是天然存在的miRNA。在一些实施例中,miRNA是工程化miRNA。在一些实施例中,miRNA是人工miRNA。在某些实施例中,miRNA包含Evers等,Molecular Therapy 26(9):1-15(印刷版之前的电子版,2018年6月)披露的miHTT工程化的miRNA。在某些实施例中,miRNA包含Dirren等,Annals of Clinical and TranslationalNeurology 2(2):167-84(2015年2月)披露的miR SOD1人工miRNA。在某些实施例中,miRNA包含miR-708,其靶向RHO(参见Behrman等,JCB 192(6):919-27(2011))。
在一些实施例中,miRNA通过下调基因抑制剂的表达来上调所述基因的表达。在一些实施例中,抑制剂是天然(例如,野生型)抑制剂。在一些实施例中,抑制剂得自突变的、异源性和/或错误表达的基因。
E.异源部分
在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,并且其中治疗性蛋白质包含至少一个异源部分。在一些实施例中,异源部分融合至治疗性蛋白质的N末端或C末端。在其他实施例中,异源部分插入治疗性蛋白质内的两个氨基酸之间。
在一些实施例中,治疗性蛋白质包含FVIII多肽和异源部分,所述异源部分插入FVIII多肽内的两个氨基酸之间。在一些实施例中,异源部分在选自表5的一个或多个插入位点插入FVIII多肽内。在一些实施例中,异源氨基酸序列可以在以下文献中披露的任何位点插入本公开文本的核酸分子编码的凝血因子多肽内:国际公开号WO 2013/123457 A1、WO2015/106052 A1或美国公开号2015/0158929 A1,将上述文献通过引用以其整体并入本文。在一个特定实施例中,治疗性蛋白质包含FVIII和异源部分,其中所述异源部分紧邻相对于成熟FVIII的氨基酸745下游插入FVIII内。在一个特定实施例中,治疗性蛋白质包含FVIII和XTEN,其中所述XTEN紧邻相对于成熟FVIII的氨基酸745下游插入FVIII内。在一个特定实施例中,FVIII包含对应于成熟人FVIII(SEQ ID NO:15)的氨基酸746-1646的缺失,并且异源部分紧邻对应于成熟人FVIII(SEQ ID NO:15)的氨基酸745下游插入。
表5:FVIII异源部分插入位点
Figure BDA0003006446640001361
Figure BDA0003006446640001371
在一些实施例中,治疗性蛋白质包含FIX多肽和异源部分,所述异源部分插入FIX多肽内的两个氨基酸之间。在一些实施例中,异源部分在选自表5的一个或多个插入位点插入FIX多肽内。在一些实施例中,异源氨基酸序列可以在国际申请号PCT/US2017/015879中所披露的任何位点插入本公开文本的核酸分子编码的凝血因子多肽内,将所述申请通过引用以其整体并入本文。在一个特定实施例中,治疗性蛋白质包含FIX多肽和异源部分,其中所述异源部分紧邻相对于成熟FIX的氨基酸166下游插入FIX多肽内。在一个特定实施例中,治疗性蛋白质包含FIX多肽和XTEN,其中所述XTEN紧邻相对于成熟FVIII的氨基酸166下游插入FIX内。
表6:FIX异源部分插入位点
Figure BDA0003006446640001372
Figure BDA0003006446640001381
在其他实施例中,本公开文本的治疗性蛋白质还包含2个、3个、4个、5个、6个、7个或8个异源核苷酸序列。在一些实施例中,所有异源部分是相同的。在一些实施例中,至少一个异源部分与其他异源部分不同。在一些实施例中,本公开文本可包含2个、3个、4个、5个、6个或多于7个串联的异源部分。
在一些实施例中,异源部分增加治疗性蛋白质的半衰期(是“半衰期延长剂”)。
在一些实施例中,异源部分是具有非结构化或结构化特征的肽或多肽,所述特征与并入本公开文本的蛋白质中时体内半衰期的延长相关。非限制性例子包括白蛋白、白蛋白片段、免疫球蛋白的Fc片段、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、HAP序列、XTEN序列、转铁蛋白或其片段、PAS多肽、聚甘氨酸接头、聚丝氨酸接头、白蛋白结合部分或者这些多肽的任何片段、衍生物、变异体或组合。在一个特定实施例中,异源氨基酸序列是免疫球蛋白恒定区或其部分、转铁蛋白、白蛋白或PAS序列。在一些方面中,异源部分包括血管性血友病因子或其片段。在其他相关方面中,异源部分可以包括非多肽部分的附着位点(例如,半胱氨酸氨基酸),所述非多肽部分是例如聚乙二醇(PEG)、羟乙基淀粉(HES)、聚唾液酸或者这些组件的任何衍生物、变异体或组合。在一些方面中,异源部分包含半胱氨酸氨基酸,其用作非多肽部分的附着位点,所述非多肽部分是例如聚乙二醇(PEG)、羟乙基淀粉(HES)、聚唾液酸或者这些组件的任何衍生物、变异体或组合。
在一个具体实施例中,第一异源部分是本领域已知的半衰期延长分子,并且第二异源部分是本领域已知的半衰期延长分子。在某些实施例中,第一异源部分(例如,第一Fc部分)和第二异源部分(例如,第二Fc部分)彼此缔合形成二聚体。在一个实施例中,第二异源部分是第二Fc部分,其中第二Fc部分与第一异源部分(例如,第一Fc部分)连接或缔合。例如,第二异源部分(例如,第二Fc部分)可以通过接头连接至第一异源部分(例如,第一Fc部分),或者通过共价或非共价键与第一异源部分缔合。
在一些实施例中,异源部分是如下多肽,其包含至少约10个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2500个、至少约3000个或至少约4000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。在其他实施例中,异源部分是如下多肽,其包含约100个至约200个氨基酸、约200个至约300个氨基酸、约300个至约400个氨基酸、约400个至约500个氨基酸、约500个至约600个氨基酸、约600个至约700个氨基酸、约700个至约800个氨基酸、约800个至约900个氨基酸或约900个至约1000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。
在某些实施例中,异源部分改良治疗性蛋白质的一种或多种药物代谢动力学特性但不显著影响其生物学活性或功能。
在某些实施例中,异源部分增加本公开文本的治疗性蛋白质的体内和/或体外半衰期。在其他实施例中,异源部分有助于本公开文本的治疗性蛋白质或其片段(例如,在FVIII蛋白的蛋白质水解切割后包含异源部分的片段)的可视化或定位。本公开文本的治疗性蛋白质或其片段的可视化和/或定位可以是体内的、体外的、离体的或其组合。
在其他实施例中,异源部分增加本公开文本的治疗性蛋白质或其片段(例如,在治疗性蛋白质(例如,凝血因子)的蛋白质水解切割后包含异源部分的片段)的稳定性。如本文所用,术语“稳定性”是指本领域公认的响应环境条件(例如,升高或降低的温度)维持治疗性蛋白质的一种或多种物理特性的量度。在某些方面中,物理特性可以是维持治疗性蛋白质的共价结构(例如,不存在蛋白质水解切割、不期望的氧化或脱酰胺作用)。在其他方面中,物理特性还可以是处于正确折叠状态的治疗性蛋白质的存在(例如,不存在可溶性或不溶性聚集体或沈淀物)。在一个方面中,治疗性蛋白质的稳定性是通过测定治疗性蛋白质的生物物理特性来量测,所述生物物理特性是例如热稳定性、pH解折叠谱、糖基化的稳定去除、溶解度、生化功能(例如,结合至蛋白质、受体或配位体的能力)等和/或其组合。在另一个方面中,生化功能是通过相互作用的结合亲和性来证实。在一个方面中,蛋白质稳定性的量度是热稳定性,即对热激发的抗性。稳定性可以使用本领域已知的方法来量测,如HPLC(高效液相色谱)、SEC(尺寸排阻色谱)、DLS(动态光散射)等。量测热稳定性的方法包括但不限于差式扫描量热法(DSC)、差式扫描荧光测定法(DSF)、圆二色性(CD)和热激发测定。
在某些方面中,由本公开文本的核酸分子编码的治疗性蛋白质包含至少一种半衰期延长剂,即相对于缺少这种异源部分的相应治疗性蛋白质的体内半衰期增加治疗性蛋白质的体内半衰期的异源部分。治疗性蛋白质的体内半衰期可以通过本领域的技术人员已知的任何方法来确定,例如活性测定(例如,生色测定或一步式凝血aPTT测定,其中治疗性蛋白质包含FVIII多肽)、ELISA、
Figure BDA0003006446640001401
等。
在一些实施例中,一种或多种半衰期延长剂的存在导致治疗性蛋白质的半衰期与缺少这一种或多种半衰期延长剂的相应蛋白质的半衰期相比有所增加。包含半衰期延长剂的治疗性蛋白质的半衰期是缺少这种半衰期延长剂的相应治疗性蛋白质的体内半衰期的至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍长。
在一个实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是缺少这种半衰期延长剂的相应蛋白质的体内半衰期的约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍至约10倍长。在另一个实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期与缺少这种半衰期延长剂的相应蛋白质的体内半衰期相比延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。
在其他实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。
在仍其他实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是约15小时至约2周、约16小时至约1周、约17小时至约1周、约18小时至约1周、约19小时至约1周、约20小时至约1周、约21小时至约1周、约22小时至约1周、约23小时至约1周、约24小时至约1周、约36小时至约1周、约48小时至约1周、约60小时至约1周、约24小时至约6天、约24小时至约5天、约24小时至约4天、约24小时至约3天或约24小时至约2天。
在一些实施例中,包含半衰期延长剂的治疗性蛋白质的每名受试者的平均半衰期是约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约6天、约7天(1周)、约8天、约9天、约10天、约11天、约12天、约13天或约14天。
一种或多种半衰期延长剂可融合至治疗性蛋白质的C末端或N末端或插入治疗性蛋白质内。
1.免疫球蛋白恒定区或其部分
在另一个方面中,异源部分包含一个或多个免疫球蛋白恒定区或其部分(例如,Fc区)。在一个实施例中,本公开文本的分离的核酸分子还包含编码免疫球蛋白恒定区或其部分的异源核酸序列。在一些实施例中,免疫球蛋白恒定区或其部分是Fc区。
免疫球蛋白恒定区包括表示为CH(恒定重)结构域(CH1、CH2等)的结构域。根据同种型(即IgG、IgM、IgA、IgD或IgE),恒定区可以包括3个或4个CH结构域。一些同种型(例如IgG)恒定区还含有铰链区。参见Janeway等2001,Immunobiology,Garland Publishing,N.Y.,N.Y。
本公开文本的免疫球蛋白恒定区或其部分可以从多种不同来源获得。在一个实施例中,免疫球蛋白恒定区或其部分衍生自人免疫球蛋白。然而,应理解,免疫球蛋白恒定区或其部分可以衍生自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,免疫球蛋白恒定区或其部分可以衍生自任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)以及任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在一个实施例中,使用人同种型IgG1。
多个免疫球蛋白恒定区基因序列(例如,人恒定区基因序列)能以可公开获得的存放物的形式获得。可选择具有特定效应子功能(或缺少特定效应子功能)或具有特定修饰的恒定区结构域序列以降低免疫原性。已经公开了许多抗体和抗体编码基因的序列并且适宜的Ig恒定区序列(例如,铰链、CH2和/或CH3序列或其部分)可使用本领域公认的技术衍生自这些序列。然后可改变或合成使用任何前述方法获得的遗传物质以获得本公开文本的多肽。应进一步了解,本公开文本的范围涵盖恒定区DNA序列的等位基因、变异体和突变。
免疫球蛋白恒定区或其部分的序列可例如使用聚合酶链式反应和所选用于扩增所关注结构域的引物来克隆。为了从抗体克隆免疫球蛋白恒定区或其部分的序列,可从杂交瘤、脾脏或淋巴细胞分离mRNA,逆转录成DNA,并通过PCR扩增抗体基因。PCR扩增方法详细描述于以下文献中:美国专利号4,683,195;4,683,202;4,800,159;4,965,188;以及例如,“PCR Protocols:A Guide to Methods and Applications”Innis等编,Academic Press,San Diego,CA(1990);Ho等1989.Gene 77:51;Horton等1993.Methods Enzymol.217:270。PCR可以基于所公开的重链和轻链DNA和氨基酸序列由共有恒定区引物或由更具特异性的引物来起始。PCR还可用于分离编码抗体轻链和重链的DNA克隆。在这种情况下,可通过共有引物或较大同源探针(如小鼠恒定区探针)筛选文库。适于扩增抗体基因的多个引物组是本领域已知的(例如,基于经纯化抗体的N末端序列的5’引物(Benhar和Pastan.1994.ProteinEngineering 7:1509);cDNA末端的快速扩增(Ruberti,F.等1994.J.Immunol.Methods173:33);抗体前导序列(Larrick等1989Biochem.Biophys.Res.Commun.160:1250))。抗体序列的克隆还描述于Newman等于1995年1月25日提交的美国专利号5,658,570中,将所述专利通过引用并入本文。
本文所用的免疫球蛋白恒定区可以包括所有结构域和铰链区或其部分。在一个实施例中,免疫球蛋白恒定区或其部分包含CH2结构域、CH3结构域和铰链区,即Fc区或FcRn结合配偶体。
如本文所用,术语“Fc区”定义为多肽中对应于天然Ig的Fc区的部分,即如通过其两条重链的相应Fc结构域的二聚缔合所形成。天然Fc区与另一Fc区形成同二聚体。相比之下,如本文所用的术语“基因融合的Fc区”或“单链Fc区”(scFc区)是指合成二聚Fc区,其包括基因连接于单条多肽链内(即,编码于单个连续基因序列中)的Fc结构域。参见国际公开号WO 2012/006635,通过引用以其整体并入本文。
在一个实施例中,“Fc区”是指单条Ig重链的如下部分,其始于紧邻木瓜蛋白酶切割位点(即,IgG中的残基216,以重链恒定区的第一个残基为114)上游的铰链区并终于抗体的C末端。因此,完整Fc区至少包含铰链结构域、CH2结构域和CH3结构域。
免疫球蛋白恒定区或其部分可为FcRn结合配偶体。FcRn在成人上皮组织中有活性并在肠腔、肺气道、鼻表面、阴道表面、结肠和直肠表面中表达(美国专利号6,485,726)。FcRn结合配偶体是免疫球蛋白的结合至FcRn的一部分。
已经从包括人类在内的若干哺乳动物物种分离出FcRn受体。人FcRn、猴FcRn、大鼠FcRn和小鼠FcRn的序列是已知的(Story等1994,J.Exp.Med.180:2377)。FcRn受体在相对低pH下结合IgG(但不结合其他免疫球蛋白类别,如IgA、IgM、IgD和IgE),以内腔至浆膜方向跨细胞主动转运IgG,然后在间质液中发现的相对高pH下释放IgG。其在成人上皮组织中表达(美国专利号6,485,726、6,030,613、6,086,875;WO 03/077834;US2003-0235536A1),包括肺和肠上皮(Israel等1997,Immunology 92:69)、肾近端小管上皮(Kobayashi等2002,Am.J.Physiol.Renal Physiol.282:F358)以及鼻上皮、阴道表面和胆道系统表面。
可用于本公开文本中的FcRn结合配偶体涵盖可由FcRn受体特异性结合的分子,包括完整IgG、IgG的Fc片段和包括FcRn受体的完整结合区的其他片段。已经基于X射线晶体学描述了IgG的Fc部分中结合至FcRn受体的区域(Burmeister等1994,Nature 372:379)。Fc与FcRn的主要接触区域靠近CH2和CH3结构域的接合点。Fc-FcRn接触全部位于单条Ig重链内。FcRn结合配偶体包括完整IgG、IgG的Fc片段和IgG的包括FcRn的完整结合区的其他片段。主要接触位点包括CH2结构域的氨基酸残基248、250-257、272、285、288、290-291、308-311和314以及CH3结构域的氨基酸残基385-387、428和433-436。对免疫球蛋白或免疫球蛋白片段或区域的氨基酸编号的提及都是基于Kabat等1991,Sequences of Proteins ofImmunological Interest,U.S.Department of Public Health,Bethesda,Md。
结合至FcRn的Fc区或FcRn结合配偶体可以通过FcRn有效穿梭跨越上皮障壁,由此提供全身施用所需治疗分子的非侵入性手段。另外,包含Fc区或FcRn结合配偶体的融合蛋白被表达FcRn的细胞内吞。但是这些融合蛋白再次再循环进循环中,而不是经标记以供降解,由此增加这些蛋白质的体内半衰期。在某些实施例中,免疫球蛋白恒定区的部分是Fc区或FcRn结合配偶体,其通常通过二硫键和其他非特异性相互作用与另一Fc区或另一FcRn结合配偶体缔合,以形成二聚体和更高阶多聚体。
两个FcRn受体可以结合单个Fc分子。晶体学数据表明,每个FcRn分子结合Fc同二聚体的单一多肽。在一个实施例中,将FcRn结合配偶体(例如,IgG的Fc片段)与生物活性分子连接提供口服、经颊、舌下、经直肠、经阴道、作为经鼻施用的气溶胶或通过肺途径或通过眼部途径递送生物活性分子的手段。在另一个实施例中,凝血因子蛋白能以侵入性方式(例如,皮下、静脉内)施用。
FcRn结合配偶体区域是可由FcRn受体特异性结合,随后通过Fc区的FcRn受体主动转运的分子或其部分。特异性结合是指两个分子形成在生理条件下相对稳定的复合物。特异性结合的特征在于区分于通常具有低亲和性和中至高容量的非特异性结合的高亲和性和低至中容量。通常,在亲和常数KA高于106M-1或高于108M-1时,将结合视为特异性的。如果需要,可以通过改变结合条件在不显著影响特异性结合的情况下减少非特异性结合。熟习此项技术者使用常规技术可以优化适当的结合条件,如分子浓度、溶液的离子强度、温度、允许结合的时间、阻断剂(例如,血清白蛋白、奶酪蛋白)浓度等。
在某些实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含一个或多个截短Fc区,但是其足以将Fc受体(FcR)结合特性赋予Fc区。例如,Fc区中结合至FcRn的部分(即,FcRn结合部分)包含IgG1的约氨基酸282-438,EU编号(主要接触位点是CH2结构域的氨基酸248、250-257、272、285、288、290-291、308-311和314以及CH3结构域的氨基酸残基385-387、428和433-436)。因此,本公开文本的Fc区可以包含FcRn结合部分或由所述FcRn结合部分组成。FcRn结合部分可以衍生自任何同种型(包括IgGl、IgG2、IgG3和IgG4)的重链。在一个实施例中,使用来自人同种型IgG1的抗体的FcRn结合部分。在另一个实施例中,使用来自人同种型IgG4的抗体的FcRn结合部分。
Fc区可以从多种不同来源获得。在一个实施例中,多肽的Fc区衍生自人免疫球蛋白。然而,应理解,Fc部分可以衍生自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,Fc结构域或其部分的多肽可以衍生自任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)以及任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在另一个实施例中,使用人同种型IgG1。
在某些实施例中,Fc变异体赋予至少一种由包含所述野生型Fc结构域的Fc部分赋予的效应子功能的变化(例如,Fc区结合至Fc受体(例如FcγRI、FcγRII或FcγRIII)或补体蛋白(例如,C1q)或触发抗体依赖性细胞毒性(ADCC)、吞噬作用或补体依赖性细胞毒性(CDCC)的能力的改进或降低)。在其他实施例中,Fc变异体提供工程化半胱氨酸残基。
本公开文本的Fc区可利用本领域公认的Fc变异体,已知所述Fc变异体可赋予效应子功能和/或FcR或FcRn结合的变化(例如,增强或降低)。具体来说,本公开文本的Fc区可包括例如在以下文献中披露的一个或多个氨基酸位置处的变化(例如,取代):国际PCT公开案WO 88/07089A1、WO 96/14339A1、WO 98/05787A1、WO 98/23289A1、WO 99/51642A1、WO 99/58572A1、WO 00/09560A2、WO 00/32767A1、WO 00/42072A2、WO 02/44215A2、WO 02/060919A2、WO 03/074569A2、WO 04/016750A2、WO 04/029207A2、WO 04/035752A2、WO 04/063351A2、WO 04/074455A2、WO 04/099249A2、WO 05/040217A2、WO 04/044859、WO 05/070963A1、WO 05/077981A2、WO 05/092925A2、WO 05/123780A2、WO 06/019447A1、WO 06/047350A2和WO 06/085967A2;美国专利公开号US 2007/0231329、US 2007/0231329、US2007/0237765、US 2007/0237766、US 2007/0237767、US 2007/0243188、US 20070248603、US 20070286859、US 20080057056;或美国专利5,648,260;5,739,277;5,834,250;5,869,046;6,096,871;6,121,022;6,194,551;6,242,195;6,277,375;6,528,624;6,538,124;6,737,056;6,821,505;6,998,253;7,083,784;7,404,956和7,317,091,将每篇文献通过引用并入本文。在一个实施例中,可在一个或多个所公开的氨基酸位置进行特定变化(例如,业内披露的一个或多个氨基酸的特定取代)。在另一个实施例中,可在一个或多个所公开氨基酸位置进行不同变化(例如,业内披露的一个或多个氨基酸位置的不同取代)。
IgG的Fc区或FcRn结合配偶体可根据公认程序(如定点突变诱发等)来修饰,以产生将由FcRn结合的经修饰IgG或其Fc片段或部分。此类修饰包括远离FcRn接触位点的修饰以及在接触位点内的修饰,所述修饰保留或甚至增强与FcRn的结合。例如,可在不显著损失Fc对FcRn的结合亲和性的情况下取代人IgG1 Fc(Fcγ1)中的以下单个氨基酸残基:P238A、S239A、K246A、K248A、D249A、M252A、T256A、E258A、T260A、D265A、S267A、H268A、E269A、D270A、E272A、L274A、N276A、Y278A、D280A、V282A、E283A、H285A、N286A、T289A、K290A、R292A、E293A、E294A、Q295A、Y296F、N297A、S298A、Y300F、R301A、V303A、V305A、T307A、L309A、Q311A、D312A、N315A、K317A、E318A、K320A、K322A、S324A、K326A、A327Q、P329A、A330Q、P331A、E333A、K334A、T335A、S337A、K338A、K340A、Q342A、R344A、E345A、Q347A、R355A、E356A、M358A、T359A、K360A、N361A、Q362A、Y373A、S375A、D376A、A378Q、E380A、E382A、S383A、N384A、Q386A、E388A、N389A、N390A、Y391F、K392A、L398A、S400A、D401A、D413A、K414A、R416A、Q418A、Q419A、N421A、V422A、S424A、E430A、N434A、T437A、Q438A、K439A、S440A、S444A和K447A,其中例如P238A代表在位置编号238处由丙氨酸取代的野生型脯氨酸。作为例子,一个具体实施例并入N297A突变,从而去除高度保守的N糖基化位点。除了丙氨酸以外,可在上文指定的位置用其他氨基酸取代野生型氨基酸。可将突变单独引入Fc中,从而产生多于一百个与天然Fc不同的Fc区。另外,这些单独突变中的2个、3个或更多个的组合可一起引入,从而产生另外数百个Fc区。
某些上述突变可以对Fc区或FcRn结合配偶体赋予新功能。例如,一个实施例并入N297A,从而去除高度保守的N糖基化位点。这个突变的作用是降低免疫原性,由此增强Fc区的循环半衰期,并使Fc区不能结合至FcγRI、FcγRIIA、FcγRIIB和FcγRIIIA,并且不损害对FcRn的亲和性(Routledge等1995,Transplantation 60:847;Friend等1999,Transplantation68:1632;Shields等1995,J.Biol.Chem.276:6591)。作为从上述突变产生的新功能的另一例子,对FcRn的亲和性可以增加,在一些情况下超过野生型的亲和性。这种增加的亲和性可以反映增加的“缔合”速率、降低的“解离”速率或增加的“缔合”速率与降低的“解离”速率二者。相信可赋予增加的对FcRn的亲和性的突变的例子包括但不限于T256A、T307A、E380A和N434A(Shields等2001,J.Biol.Chem.276:6591)。
另外,至少三种人Fcγ受体似乎识别IgG上下铰链区内的结合位点,通常是氨基酸234-237。因此,如例如通过将人IgG1的氨基酸233-236“ELLG”(SEQ ID NO:45)替代为来自IgG2的相应序列“PVA”(一个氨基酸缺失),可以从这个区域的突变产生新功能的另一例子和可能降低的免疫原性。已经显示,在已经引入此类突变时,介导多种效应子功能的FcγRI、FcγRII和FcγRIII不会结合至IgG1。Ward和Ghetie 1995,Therapeutic Immunology2:77;和Armour等1999,Eur.J.Immunol.29:2613。
在另一个实施例中,免疫球蛋白恒定区或其部分包含铰链区或其部分中的与第二免疫球蛋白恒定区或其部分形成一个或多个二硫键的氨基酸序列。第二免疫球蛋白恒定区或其部分可以连接至第二多肽,使治疗性蛋白质与第二多肽结合在一起。在一些实施例中,第二多肽是增强子部分。如本文所用,术语“增强子部分”是指能够增强治疗性蛋白质的活性的分子、其片段或多肽组分。增强子部分可以是辅因子,如其中治疗性蛋白质是凝血因子、可溶性组织因子(sTF)或促凝血肽。因此,在激活凝血因子后,增强子部分可用于增强凝血因子活性。
在某些实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含对免疫球蛋白恒定区或其部分的氨基酸取代(例如,Fc变异体),所述氨基酸取代改变Ig恒定区的抗原非依赖性效应子功能,特别是蛋白质的循环半衰期。
2.scFc区
在另一个方面中,异源部分包含scFc(单链Fc)区。在一个实施例中,本公开文本的分离的核酸分子还包含编码scFc区的异源核酸序列。scFc区在同一线性多肽链内包含至少两个免疫球蛋白恒定区或其部分(例如,Fc部分或结构域(例如,2、3、4、5、6个或更多个Fc部分或结构域)),所述恒定区或其部分能够折叠(例如,分子内或分子间折叠)以形成一个由Fc肽接头连接的功能性scFc区。例如,在一个实施例中,本公开文本的多肽能够通过其scFc区结合至至少一种Fc受体(例如,FcRn、FcγR受体(例如,FcγRIII)或补体蛋白(例如,C1q)),以改良半衰期或触发免疫效应子功能(例如,抗体依赖性细胞毒性(ADCC)、吞噬作用或补体依赖性细胞毒性(CDCC)和/或改善可制造性)。
3.CTP
在另一个方面中,异源部分包含人绒毛膜促性腺激素的β亚基的一种C末端肽(CTP)或其片段、变异体或衍生物。已知插入重组蛋白中的一种或多种CTP肽增加所述蛋白质的体内半衰期。参见例如,美国专利号5,712,122,通过引用以其整体并入本文。
示例性CTP肽包括DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL(SEQ ID NO:33)或SSSSKAPPPSLPSPSRLPGPSDTPILPQ(SEQ ID NO:34)。参见例如,美国专利申请公开号US2009/0087411 A1,通过引用并入。
4.XTEN序列
在一些实施例中,异源部分包含一个或多个XTEN序列、其片段、变异体或衍生物。如本文所用,“XTEN序列”是指延伸长度的多肽,其具有非天然存在的基本上不重复的序列,所述序列主要由小亲水氨基酸构成,并且所述序列在生理条件下具有较低程度的或不具有二级或三级结构。作为异源部分,XTEN可以用作半衰期延长部分。另外,XTEN可以提供所需特性,包括但不限于增强的药物代谢动力学参数和溶解度特征。
将包含XTEN序列的异源部分并入本公开文本的蛋白质中可以赋予蛋白质以下有利特性中的一种或多种:构象柔性、增强的水溶解度、高蛋白酶抗性程度、低免疫原性、与哺乳动物受体的低结合或增加的流体力学(或斯托克斯(Stokes))半径。
在某些方面中,XTEN序列可以增加药物代谢动力学特性,如较长体内半衰期或增加的曲线下面积(AUC),使得与相同的但不具有XTEN异源部分的蛋白质相比,本公开文本的蛋白质保持在体内并且持续增加的时间段具有促凝血活性。
在一些实施例中,可用于本公开文本的XTEN序列是具有大于约20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸残基的肽或多肽。在某些实施例中,XTEN是具有大于约20至约3000个氨基酸残基、大于30至约2500个残基、大于40至约2000个残基、大于50至约1500个残基、大于60至约1000个残基、大于70至约900个残基、大于80至约800个残基、大于90至约700个残基、大于100至约600个残基、大于110至约500个残基或大于120至约400个残基的肽或多肽。在一个特定实施例中,XTEN包含长度长于42个氨基酸并且短于144个氨基酸的氨基酸序列。
本公开文本的XTEN序列可以包含一个或多个5至14(例如,9至14)个氨基酸残基的序列基序或与所述序列基序至少80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,其中所述基序包含4至6种类型的选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的氨基酸(例如,5种氨基酸),基本上由所述氨基酸组成或由所述氨基酸组成。参见US 2010-0239554 A1。
在一些实施例中,XTEN包含非重迭序列基序,其中约80%、或至少约85%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%或约100%的序列由选自从表7选择的单一基序家族的非重迭序列的多个单元组成,从而得到家族序列。如本文所用,“家族”意指,XTEN具有仅选自表7的单一基序类别的基序;即,AD、AE、AF、AG、AM、AQ、BC或BD XTEN,并且选择XTEN中并非来自家族基序的任何其他氨基酸以实现所需特性,如允许通过编码核苷酸并入限制位点、并入切割序列,或实现与治疗性蛋白质的更佳连接。在XTEN家族的一些实施例中,XTEN序列包含AD基序家族、或AE基序家族、或AF基序家族、或AG基序家族、或AM基序家族、或AQ基序家族、或BC家族、或BD家族的非重迭序列基序的多个单元,并且所得XTEN展现上述同源性范围。在其他实施例中,XTEN包含来自表7的两个或更多个基序家族的基序序列的多个单元。可以选择这些序列以实现所需的物理/化学特征,包括如净电荷、亲水性、缺少二级结构或缺少重复性等由基序的氨基酸组成所赋予的特性,更全面地描述于下文中。在本段落的上述实施例中,可以使用本文所述方法选择并组装并入XTEN中的基序,以得到约36至约3000个氨基酸残基的XTEN。
表7.12个氨基酸的XTEN序列基序和基序家族
基序家族* 基序序列 SEQ ID NO:
AD GESPGGSSGSES 73
AD GSEGSSGPGESS 74
AD GSSESGSSEGGP 75
AD GSGGEPSESGSS 76
AE、AM GSPAGSPTSTEE 77
AE、AM、AQ GSEPATSGSETP 78
AE、AM、AQ GTSESATPESGP 79
AE、AM、AQ GTSTEPSEGSAP 80
AF、AM GSTSESPSGTAP 81
AF、AM GTSTPESGSASP 82
AF、AM GTSPSGESSTAP 83
AF、AM GSTSSTAESPGP 84
AG、AM GTPGSGTASSSP 85
AG、AM GSSTPSGATGSP 86
AG、AM GSSPSASTGTGP 87
AG、AM GASPGTSSTGSP 88
AQ GEPAGSPTSTSE 89
AQ GTGEPSSTPASE 90
AQ GSGPSTESAPTE 91
AQ GSETPSGPSETA 92
AQ GPSETSTSEPGA 93
AQ GSPSEPTEGTSA 94
BC GSGASEPTSTEP 95
BC GSEPATSGTEPS 96
BC GTSEPSTSEPGA 97
BC GTSTEPSEPGSA 98
BD GSTAGSETSTEA 99
BD GSETATSGSETA 100
BD GTSESATSESGA 101
BD GTSTEASEGSAS 102
*表示单独基序序列,其在以各种排列一起使用时产生“家族序列”
可以用作本公开文本的治疗性蛋白质中的异源部分的XTEN序列的例子披露于例如以下文献中:美国专利公开号2010/0239554 A1、2010/0323956 A1、2011/0046060 A1、2011/0046061 A1、2011/0077199A1或2011/0172146 A1,或者国际专利公开号WO2010091122 A1、WO 2010144502 A2、WO 2010144508A1、WO 2011028228 A1、WO 2011028229A1或WO 2011028344 A2,将每篇文献通过引用以其整体并入本文。
XTEN可具有变化的长度以供插入或连接至治疗性蛋白质。在一个实施例中,所述一个或多个XTEN序列的长度是基于要在融合蛋白中实现的特性或功能来选择。根据预期的特性或功能,XTEN可以是可用作载剂的短或中等长度的序列或较长的序列。在某些实施例中,XTEN包括约6至约99个氨基酸残基的短区段、约100至约399个氨基酸残基的中等长度和约400至约1000以及多达约3000个氨基酸残基的较长长度。因此,插入或连接至治疗性蛋白质的XTEN可具有约6、约12、约36、约40、约42、约72、约96、约144、约288、约400、约500、约576、约600、约700、约800、约864、约900、约1000、约1500、约2000、约2500或多达约3000个氨基酸残基的长度。在其他实施例中,XTEN序列的长度为约6至约50、约50至约100、约100至150、约150至250、约250至400、约400至约500、约500至约900、约900至1500、约1500至2000或约2000至约3000个氨基酸残基。在对治疗性蛋白质的活性没有不利影响的情况下,插入或连接至治疗性蛋白质的XTEN的精确长度可以变化。在一个实施例中,本文所用的一个或多个XTEN具有42个氨基酸、72个氨基酸、144个氨基酸、288个氨基酸、576个氨基酸或864个氨基酸的长度,并且可选自一个或多个XTEN家族序列;即,AD、AE、AF、AG、AM、AQ、BC或BD。
在一些实施例中,治疗性蛋白质包含FVIII多肽和XTEN,其中XTEN包含288个氨基酸。在一个实施例中,治疗性蛋白质包含FVIII多肽和XTEN,其中XTEN包含288个氨基酸,并且XTEN插入FVIII多肽的B结构域内。在一个特定实施例中,治疗性蛋白质包含FVIII多肽和包含SEQ ID NO:109的XTEN,并且XTEN插入FVIII多肽的B结构域内。在一个特定实施例中,治疗性蛋白质包含FVIII多肽和包含SEQ ID NO:109的XTEN,并且XTEN紧邻成熟FVIII的氨基酸745下游插入FVIII多肽内。
在一些实施例中,治疗性蛋白质包含FIX多肽和XTEN,其中XTEN包含72个氨基酸。在一个实施例中,治疗性蛋白质包含FIX多肽和XTEN,其中XTEN包含72个氨基酸,并且XTEN紧邻成熟FIX的氨基酸166下游插入FIX多肽内。
在一些实施例中,用于本公开文本中的XTEN序列与选自以下的序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同:AE42、AG42、AE48、AM48、AE72、AG72、AE108、AG108、AE144、AF144、AG144、AE180、AG180、AE216、AG216、AE252、AG252、AE288、AG288、AE324、AG324、AE360、AG360、AE396、AG396、AE432、AG432、AE468、AG468、AE504、AG504、AF504、AE540、AG540、AF540、AD576、AE576、AF576、AG576、AE612、AG612、AE624、AE648、AG648、AG684、AE720、AG720、AE756、AG756、AE792、AG792、AE828、AG828、AD836、AE864、AF864、AG864、AM875、AE912、AM923、AM1318、BC864、BD864、AE948、AE1044、AE1140、AE1236、AE1332、AE1428、AE1524、AE1620、AE1716、AE1812、AE1908、AE2004A、AG948、AG1044、AG1140、AG1236、AG1332、AG1428、AG1524、AG1620、AG1716、AG1812、AG1908、AG2004及其任何组合。参见US 2010-0239554 A1。在一个特定实施例中,XTEN包含AE42、AE72、AE144、AE288、AE576、AE864、AG 42、AG72、AG144、AG288、AG576、AG864或其任何组合。
可用作本公开文本的治疗性蛋白质中的异源部分的示例性XTEN序列包括XTENAE42-4(SEQ ID NO:46,由SEQ ID NO:47编码)、XTEN AE144-2A(SEQ ID NO:48,由SEQ IDNO:49编码)、XTEN AE144-3B(SEQ ID NO:50,由SEQ ID NO:51编码)、XTEN AE144-4A(SEQID NO:52,由SEQ ID NO:53编码)、XTEN AE144-5A(SEQ ID NO:54,由SEQ ID NO:55编码)、XTEN AE144-6B(SEQ ID NO:56,由SEQ ID NO:57编码)、XTEN AG144-1(SEQ ID NO:58,由SEQ ID NO:59编码)、XTEN AG144-A(SEQ ID NO:60,由SEQ ID NO:61编码)、XTEN AG144-B(SEQ ID NO:62,由SEQ ID NO:63编码)、XTEN AG144-C(SEQ ID NO:64,由SEQ ID NO:65编码)和XTEN AG144-F(SEQ ID NO:66,由SEQ ID NO:67编码)。在一个特定实施例中,XTEN由SEQ ID NO:18编码。
在另一个实施例中,XTEN序列选自AE36(SEQ ID NO:130)、AE42(SEQ ID NO:131)、AE72(SEQ ID NO:132)、AE78(SEQ ID NO:133)、AE144(SEQ ID NO:134)、AE144_2A(SEQ IDNO:48)、AE144_3B(SEQ ID NO:50)、AE144_4A(SEQ ID NO:52)、AE144_5A(SEQ ID NO:54)、AE144_6B(SEQ ID NO:135)、AG144(SEQ ID NO:136)、AG144_A(SEQ ID NO:137)、AG144_B(SEQ ID NO:62)、AG144_C(SEQ ID NO:64)、AG144_F(SEQ ID NO:66)、AE288(SEQ ID NO:138)、AE288_2(SEQ ID NO:139)、AG288(SEQ ID NO:140)、AE576(SEQ ID NO:141)、AG576(SEQ ID NO:142)、AE864(SEQ ID NO:143)、AG864(SEQ ID NO:144)、XTEN_AE72_2A_1(SEQID NO:145)、XTEN_AE72_2A_2(SEQ ID NO:146)、XTEN_AE72_3B_1(SEQ ID NO:147)、XTEN_AE72_3B_2(SEQ ID NO:148)、XTEN_AE72_4A_2(SEQ ID NO:149)、XTEN_AE72_5A_2(SEQ IDNO:150)、XTEN_AE72_6B_1(SEQ ID NO:151)、XTEN_AE72_6B_2(SEQ ID NO:152)、XTEN_AE72_1A_1(SEQ ID NO:153)、XTEN_AE72_1A_2(SEQ ID NO:154)、XTEN_AE144_1A(SEQ IDNO:155)、AE150(SEQ ID NO:156)、AG150(SEQ ID NO:157)、AE294(SEQ ID NO:158)、AG294(SEQ ID NO:159)及其任何组合。在一个具体实施例中,XTEN序列选自下组:AE72、AE144和AE288。本发明的某些XTEN序列的氨基酸序列显示于表8中。
表8.XTEN序列
Figure BDA0003006446640001531
Figure BDA0003006446640001541
Figure BDA0003006446640001551
Figure BDA0003006446640001561
Figure BDA0003006446640001571
在一些实施例中,XTEN的小于100%的氨基酸选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P),或者小于100%的序列由来自表7的序列基序或本文所提供的XTEN序列组成。在此类实施例中,XTEN的其余氨基酸残基选自其他14种天然L-氨基酸中的任一种,但是可优先地选自亲水氨基酸,使得XTEN序列含有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%的亲水氨基酸。缀合构建体中所利用的XTEN中疏水氨基酸的含量可以小于5%、或小于2%、或小于1%疏水氨基酸含量。在XTEN构建中较不有利的疏水残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。另外,XTEN序列可含有小于5%或小于4%或小于3%或小于2%或小于1%或无以下氨基酸:甲硫氨酸(例如,以避免氧化)、或天冬酰胺和谷氨酰胺(以避免脱酰胺)。
所述一个或多个XTEN序列可以插入治疗性蛋白质的C末端或N末端处,或者插入治疗性蛋白质的氨基酸序列中的两个氨基酸之间。例如,如果治疗性蛋白质包含FVIII多肽,则XTEN可以在选自表5的一个或多个插入位点插入两个氨基酸之间。如果治疗性蛋白质包含FIX多肽,则XTEN可以在选自表5的一个或多个插入位点插入两个氨基酸之间。
可以根据本发明使用的XTEN序列的其他例子披露于以下文献中:美国专利公开号2010/0239554 A1、2010/0323956 A1、2011/0046060 A1、2011/0046061 A1、2011/0077199A1或2011/0172146 A1,或者国际专利公开号WO 2010091122 A1、WO 2010144502 A2、WO2010144508 A1、WO 2011028228 A1、WO 2011028229 A1、WO 2011028344 A2、WO 2014/011819 A2或WO 2015/023891。
5.白蛋白或其片段、衍生物或变异体
在一些实施例中,异源部分包含白蛋白或其功能片段。人血清白蛋白(HSA或HA)是其全长形式的609个氨基酸的蛋白质,负责血清渗透压的大部分,并且还用作内源和外源配位体的载剂。如本文所用的术语“白蛋白”包括全长白蛋白或其功能片段、变异体、衍生物或类似物。白蛋白或其片段或变异体的例子披露于以下文献中:美国专利公开号2008/0194481A1、2008/0004206 A1、2008/0161243 A1、2008/0261877 A1或2008/0153751 A1,或者PCT申请公开号2008/033413 A2、2009/058322 A1或2007/021494 A2,将上述文献通过引用以其整体并入本文。
在一个实施例中,本公开文本的治疗性蛋白质包含进一步连接至第二异源部分的白蛋白、其片段或变异体,所述第二异源部分选自免疫球蛋白恒定区或其部分(例如,Fc区)、PAS序列、HES、PEG及其任何组合。
6.白蛋白结合部分
在某些实施例中,异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白结合结构域、白蛋白结合抗体片段或其任何组合。
例如,白蛋白结合蛋白可以是细菌白蛋白结合蛋白、抗体或抗体片段,包括结构域抗体(参见美国专利号6,696,245)。例如,白蛋白结合蛋白可以是细菌白蛋白结合结构域,如一种链球菌蛋白G(Konig,T.和Skerra,A.(1998)J.Immunol.Methods 218,73-83)。可以用作缀合配偶体的白蛋白结合肽的其他例子是例如具有Cys-Xaa1-Xaa2-Xaa3-Xaa4-Cys共有序列的那些白蛋白结合肽,其中Xaa1是Asp、Asn、Ser、Thr或Trp;Xaa2是Asn、Gln、His、Ile、Leu或Lys;Xaa3是Ala、Asp、Phe、Trp或Tyr;并且Xaa4是Asp、Gly、Leu、Phe、Ser或Thr,如美国专利申请2003/0069395或Dennis等(Dennis等(2002)J.Biol.Chem.277,35035-35043)中所述。
如Kraulis等,FEBS Lett.378:190-194(1996)和Linhult等,Protein Sci.11:206-213(2002)所披露的来自链球菌蛋白G的结构域3是细菌白蛋白结合结构域的例子。白蛋白结合肽的例子包括具有核心序列DICLPRWGCLW(SEQ ID NO:35)的一系列肽。参见例如,Dennis等,J.Biol.Chem.2002,277:35035-35043(2002)。白蛋白结合抗体片段的例子披露于以下文献中:Muller和Kontermann,Curr.Opin.Mol.Ther.9:319-326(2007);Roovers等,Cancer Immunol.Immunother.56:303-317(2007);和Holt等,Prot.Eng.Design Sci.,21:283-288(2008),将上述文献通过引用以其整体并入本文。这种白蛋白结合部分的例子是如Trussel等,Bioconjugate Chem.20:2286-2292(2009)所披露的2-(3-马来酰亚胺基丙酰胺基)-6-(4-(4-碘苯基)丁酰胺基)己酸酯(“Albu”标签)。
脂肪酸、特别是长链脂肪酸(LCFA)和长链脂肪酸样白蛋白结合化合物可以用于延长本公开文本的凝血因子蛋白的体内半衰期。LCFA样白蛋白结合化合物的例子是16-(l-(3-(9-(((2,5-二氧代吡咯烷-l-基氧基)羰氧基)-甲基)-7-磺基-9H-芴-2-基胺基)-3-氧代丙基)-2,5-二氧代吡咯烷-3-基硫基)十六烷酸(参见例如,WO 2010/140148)。
7.PAS序列
在其他实施例中,异源部分是PAS序列。如本文所用的PAS序列意指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,所述氨基酸序列在生理条件下形成随机螺旋构象。因此,PAS序列是包含丙氨酸、丝氨酸和脯氨酸、基本上由所述氨基酸组成或由所述氨基酸组成的结构单元、氨基酸聚合物或序列盒,其可以用作嵌合蛋白中异源部分的一部分。然而,熟习此项技术者知道,在添加除了丙氨酸、丝氨酸和脯氨酸以外的残基作为PAS序列中的次要成分时,氨基酸聚合物还可以形成随机螺旋构象。如本文所用的术语“次要成分”意指,可以在PAS序列中添加除了丙氨酸、丝氨酸和脯氨酸以外的氨基酸至某种程度,例如,高达约12%,即PAS序列的100个氨基酸中的约12个;高达约10%,即PAS序列的100个氨基酸中的约10个;高达约9%,即100个氨基酸中的约9个;高达约8%,即100个氨基酸中的约8个;约6%,即100个氨基酸中的约6个;约5%,即100个氨基酸中的约5个;约4%,即100个氨基酸中的约4个;约3%,即100个氨基酸中的约3个;约2%,即100个氨基酸中的约2个;约1%,即100个氨基酸中的约1个。与丙氨酸、丝氨酸和脯氨酸不同的氨基酸可以选自Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Thr、Trp、Tyr和Val。
在生理条件下,PAS序列段形成随机螺旋构象,由此可以介导凝血因子蛋白的增加的体内和/或体外稳定性。由于随机螺旋结构域自身不具有稳定结构或功能,基本上保留了由凝血因子蛋白介导的生物学活性。在其他实施例中,尤其关于血浆中的蛋白质水解、免疫原性、等电点/静电行为、与细胞表面受体的结合或内化,形成随机螺旋结构域的PAS序列具有生物惰性,但仍然是生物可降解的,这提供了优于如PEG等合成聚合物的明显优势。
形成随机螺旋构象的PAS序列的非限制性例子包含选自以下的氨基酸序列:ASPAAPAPASPAAPAPSAPA(SEQ ID NO:36)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO:37)、APSSPSPSAPSSPSPASPSS(SEQ ID NO:38)、APSSPSPSAPSSPSPASPS(SEQ ID NO:39)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO:40)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO:41)、ASAAAPAAASAAASAPSAAA(SEQ ID NO:42)及其任何组合。PAS序列的其他例子是从例如以下文献得知:美国专利公开号2010/0292130 A1和PCT申请公开号WO 2008/155134 A1。
8.HAP序列
在某些实施例中,异源部分是富含甘氨酸的同氨基酸聚合物(HAP)。HAP序列可以包含甘氨酸的重复序列,所述重复序列的长度为至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸或500个氨基酸。在一个实施例中,HAP序列能够延长融合至或连接至HAP序列的部分的半衰期。HAP序列的非限制性例子包括但不限于(Gly)n、(Gly4Ser)n或S(Gly4Ser)n,其中n是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一个实施例中,n是20、21、22、23、24、25、26、26、28、29、30、31、32、33、34、35、36、37、38、39或40。在另一个实施例中,n是50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200。
9.转铁蛋白或其片段
在某些实施例中,异源部分是转铁蛋白或其片段。任何转铁蛋白都可用于制备本公开文本的凝血因子蛋白。作为例子,野生型人TF(TF)是679个氨基酸的蛋白质,大约75KDA(不计糖基化),具有似乎源自基因重复的两个主要结构域N(约330个氨基酸)和C(约340个氨基酸)。参见GenBank登录号NM001063、XM002793、M12530、XM039845、XM 039847和S95936(www.ncbi.nlm.nih.gov/),将所有登录号通过引用以其整体并入本文。转铁蛋白包含两个结构域N结构域和C结构域。N结构域包含两个子结构域N1结构域和N2结构域,并且C结构域包含两个子结构域C1结构域和C2结构域。
在一个实施例中,转铁蛋白异源部分包括转铁蛋白剪接变异体。在一个例子中,转铁蛋白剪接变异体可以是人转铁蛋白的剪接变异体,例如Genbank登录号AAA61140。在另一个实施例中,嵌合蛋白的转铁蛋白部分包括转铁蛋白序列的一个或多个结构域,例如N结构域、C结构域、N1结构域、N2结构域、C1结构域、C2结构域或其任何组合。
10.清除受体
在某些实施例中,异源部分是清除受体、其片段、变异体或衍生物。LRP1是600kDa膜内在蛋白,其参与受体介导的如因子X等多种蛋白质的清除。参见例如,Narita等,Blood91:555-560(1998)。
11.血管性血友病因子或其片段
在某些实施例中,异源部分是血管性血友病因子(VWF)或其一个或多个片段。
VWF(也称为F8VWF)是存在于血浆中的大多聚糖蛋白,并且在内皮(在怀布尔-帕拉德体(Weibel-Palade body)中)、巨核细胞(血小板的α颗粒)和内皮下结缔组织中组成性地产生。基本VWF单体是2813个氨基酸的蛋白质。每个单体含有多个具有特定功能的特定结构域,即D'和D3结构域(其一起结合至因子VIII)、A1结构域(其结合至血小板GPIb-受体、肝素和/或可能地胶原)、A3结构域(其结合至胶原)、C1结构域(其中RGD结构域在被激活时结合至血小板整联蛋白αIIbβ3)和在蛋白质C末端的“半胱氨酸结”结构域(其是VWF与血小板衍生的生长因子(PDGF)、转化生长因子-β(TGFβ)和β-人绒毛膜促性腺激素(βHCG)共享的)。
人VWF的2813单体氨基酸序列是作为Genbank中的登录号NP000543.2来报道。编码人VWF的核苷酸序列是作为Genbank中的登录号NM000552.3来报道。SEQ ID NO:129是由SEQID NO:128编码的氨基酸序列。D’结构域包括SEQ ID NO:129的氨基酸764至866。D3结构域包括SEQ ID NO:44的氨基酸867至1240。
在血浆中,95%-98%的FVIII以与全长VWF的紧密非共价复合物来循环。这种复合物的形成对于在体内维持适当的FVIIII血浆水平是重要的。Lenting等,Blood.92(11):3983-96(1998);Lenting等,J.Thromb.Haemost.5(7):1353-60(2007)。在FVIII由于在重链中的位置372和740以及轻链中的位置1689的蛋白质水解而被激活时,从激活的FVIII去除结合至FVIII的VWF。
在某些实施例中,异源部分是全长血管性血友病因子。在其他实施例中,异源部分是血管性血友病因子片段。如本文所用,本文所用的术语“VWF片段(VWF fragment)”或“VWF片段(VWF fragments)”意指任何VWF片段,其与FVIII相互作用并保留至少一种或多种通常由全长VWF提供给FVIII的特性,所述特性是例如防止过早激活为FVIIIa、防止过早蛋白质水解、防止可导致过早清除的与磷脂膜的缔合、防止与可以结合裸FVIII而不是VWF结合FVIII的FVIII清除受体结合和/或稳定FVIII重链和轻链相互作用。在一个具体实施例中,异源部分是包含VWF的D’结构域和D3结构域的(VWF)片段。包含D’结构域和D3结构域的VWF片段还可以包含选自以下的VWF结构域:A1结构域、A2结构域、A3结构域、D1结构域、D2结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、其一个或多个片段及其任何组合。融合至VWF片段的具有FVIII活性的多肽的其他例子披露于以下文献中:2012年7月3日提交的美国临时专利申请号61/667,901和美国公开号2015/0023959 A1,将这两篇文献都通过引用以其整体并入本文。
12.接头部分
在某些实施例中,异源部分是肽接头。
如本文所用,术语“肽接头”或“接头部分”是指连接多肽链的线性氨基酸序列中的两个结构域的肽或多肽序列(例如,合成肽或多肽序列)。
在一些实施例中,肽接头可插入本公开文本的治疗性蛋白质与上述异源部分(如白蛋白)之间。肽接头可向嵌合多肽分子提供柔性。接头通常不被切割,但是可能需要这种切割。在一个实施例中,在加工期间不去除这些接头。
可存在于本公开文本的嵌合蛋白中的一种类型的接头是蛋白酶可切割的接头,其包含切割位点(即,蛋白酶切割位点底物,例如因子XIa、Xa或凝血酶切割位点)并可在切割位点的N末端或C末端或两侧上包括其他接头。这些可切割接头在并入本公开文本的构建体中时产生具有异源切割位点的嵌合分子。
在一个实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含两个或更多个Fc结构域或部分,其通过cscFc接头连接以形成包含于单条多肽链中的Fc区。cscFc接头侧接有至少一个细胞内加工位点,即由细胞内酶切割的位点。多肽在所述至少一个细胞内加工位点的切割产生包含至少两条多肽链的多肽。
其他肽接头可以任选地用于本公开文本的构建体中,例如以将凝血因子蛋白连接至Fc区。可以结合本公开文本使用的一些示例性接头包括例如更详细地描述于下文中的包含GlySer氨基酸的多肽。
在一个实施例中,肽接头是合成的,即非天然存在的。在一个实施例中,肽接头包括包含如下氨基酸序列的肽(或多肽)(其可以是或可以不是天然存在的),所述氨基酸序列将第一线性氨基酸序列与在自然界中并非与其天然地连接或遗传融合的第二线性氨基酸序列连接或遗传融合。例如,在一个实施例中,肽接头可以包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变,如添加、取代或缺失)。在另一个实施例中,肽接头可以包含非天然存在的氨基酸。在另一个实施例中,肽接头可以包含存在于在自然界中不存在的线性序列中的天然存在的氨基酸。在仍另一个实施例中,肽接头可以包含天然存在的多肽序列。
例如,在某些实施例中,肽接头可以用于融合相同的Fc部分,由此形成同二聚scFc区。在其他实施例中,肽接头可以用于融合不同的Fc部分(例如野生型Fc部分和Fc部分变异体),由此形成异二聚scFc区。
在另一个实施例中,肽接头包含gly-ser接头或由所述gly-ser接头组成。在一个实施例中,scFc或cscFc接头包含免疫球蛋白铰链的至少一部分和gly-ser接头。如本文所用,术语“gly-ser接头”是指由甘氨酸和丝氨酸残基组成的肽。在某些实施例中,所述gly-ser接头可以插入肽接头的两个其他序列之间。在其他实施例中,gly-ser接头连接于肽接头的另一序列的一个或两个末端。在又其他实施例中,两个或更多个gly-ser接头串联并入肽接头中。在一个实施例中,本公开文本的肽接头包含上铰链区的至少一部分(例如,衍生自IgG1、IgG2、IgG3或IgG4分子)、中铰链区的至少一部分(例如,衍生自IgG1、IgG2、IgG3或IgG4分子)和一系列gly/ser氨基酸残基。
本公开文本的肽接头的长度为至少一个氨基酸并且可以具有变化的长度。在一个实施例中,本公开文本的肽接头的长度为约1至约50个氨基酸。如在此上下文中所用,术语“约”指示+/-两个氨基酸残基。由于接头长度必须是正整数,长度为约1至约50个氨基酸的长度意指长度为1-3至48-52个氨基酸的长度。在另一个实施例中,本公开文本的肽接头的长度为约10至约20个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约15至约50个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约20至约45个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约15至约35或约20至约30个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、500、1000或2000个氨基酸。在一个实施例中,本公开文本的肽接头的长度为20或30个氨基酸。
在一些实施例中,肽接头可以包含至少2、至少3、至少4、至少5、至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90或至少100个氨基酸。在其他实施例中,肽接头可以包含至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1,000个氨基酸。在一些实施例中,肽接头可以包含至少约10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或2000个氨基酸。肽接头可以包含1-5个氨基酸、1-10个氨基酸、1-20个氨基酸、10-50个氨基酸、50-100个氨基酸、100-200个氨基酸、200-300个氨基酸、300-400个氨基酸、400-500个氨基酸、500-600个氨基酸、600-700个氨基酸、700-800个氨基酸、800-900个氨基酸或900-1000个氨基酸。
可使用本领域已知的技术将肽接头引入多肽序列中。可通过DNA序列分析来确认修饰。可使用质粒DNA转化宿主细胞用于稳定产生所产生的多肽。
13.单体-二聚体杂合物
在一些实施例中,本公开文本的治疗性蛋白质包含含有凝血因子的单体-二聚体杂合物分子。
本文所用的术语“单体-二聚体杂合物”是指包含通过二硫键相互缔合的第一多肽链和第二多肽链的嵌合蛋白,其中第一链包含凝血因子(例如,FVIII)和第一Fc区,并且第二链包含无凝血因子的第二Fc区,基本上由所述第二Fc区组成或由所述第二Fc区组成。因此,单体-二聚体杂合构建体是包含仅具有一种凝血因子的单体方面和具有两个Fc区的二聚体方面的杂合物。
14.表达控制序列
在一些实施例中,本公开文本的核酸分子还包含至少一个表达控制序列。如本文所用的表达控制序列是有助于与其可操作地连接的编码核酸的有效转录和翻译的任何调控核苷酸序列,如启动子序列或启动子-增强子组合。例如,本公开文本的核酸分子可以可操作地连接至至少一个转录控制序列。基因表达控制序列可以是例如哺乳动物或病毒启动子,如组成型或诱导型启动子。
组成型哺乳动物启动子包括但不限于以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(HPRT)、腺苷脱胺酶、丙酮酸激酶、β-肌动蛋白启动子和其他组成型启动子。在真核细胞中组成性地发挥作用的示例性病毒启动子包括例如来自以下病毒的启动子:巨细胞病毒(CMV)、猿猴病毒(例如,SV40)、乳头状瘤病毒、腺病毒、人免疫缺陷病毒(HIV)、劳斯肉瘤病毒、巨细胞病毒、莫罗尼白血病病毒的长末端重复(LTR)和其他逆转录病毒、以及单纯疱疹病毒的胸苷激酶启动子。其他组成型启动子是本领域的技术人员已知的。可用作本公开文本的基因表达序列的启动子还包括诱导型启动子。诱导型启动子是在诱导剂存在下表达。例如,在某些金属离子存在下诱导金属硫蛋白启动子以促进转录和翻译。其他诱导型启动子是本领域的技术人员已知的。
在一个实施例中,本公开文本包括转基因在组织特异性启动子和/或增强子控制下的表达。在另一个实施例中,启动子或其他表达控制序列选择性地增强转基因在肝细胞中的表达。在某些实施例中,启动子或其他表达控制序列选择性地增强转基因在肝细胞、窦状细胞和/或内皮细胞中的表达。在一个特定实施例中,启动子或其他表达控制序列选择性地增强转基因在内皮细胞中的表达。在某些实施例中,启动子或其他表达控制序列选择性地增强转基因在以下中的表达:肌肉细胞、中枢神经系统、眼睛、肝脏、心脏或其任何组合。肝脏特异性启动子的例子包括但不限于小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子和小鼠白蛋白启动子。在一个特定实施例中,启动子包含mTTR启动子。mTTR启动子描述于R.H.Costa等,1986,Mol.Cell.Biol.6:4697中。F8启动子描述于Figueiredo和Brownlee,1995,J.Biol.Chem.270:11828-11838中。在一些实施例中,启动子选自肝脏特异性启动子(例如,α1-抗胰蛋白酶(AAT))、肌肉特异性启动子(例如,肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)和结蛋白(DES))、合成启动子(例如,SPc5-12、2R5Sc5-12、dMCK和tMCK)及其任何组合。
在一个实施例中,启动子选自小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子、小鼠白蛋白启动子、TTPp、CASI启动子、CAG启动子、巨细胞病毒(CMV)启动子、α1-抗胰蛋白酶(AAT)、肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)、结蛋白(DES)、SPc5-12、2R5Sc5-12、dMCK和tMCK、磷酸甘油酸激酶(PGK)启动子及其任何组合。
可以使用一种或多种增强子进一步增强表达水平以实现治疗功效。一种或多种增强子可以单独提供,或与一种或多种启动子组件一起提供。通常,表达控制序列包含多个增强子组件和组织特异性启动子。在一个实施例中,增强子包含一个或多个拷贝的α-1-微球蛋白/比库宁蛋白(bikunin)增强子(Rouet等,1992,J.Biol.Chem.267:20765-20773;Rouet等,1995,Nucleic Acids Res.23:395-404;Rouet等,1998,Biochem.J.334:577-584;Ill等,1997,Blood Coagulation Fibrinolysis 8:S23-S30)。在另一个实施例中,增强子衍生自肝脏特异性转录因子结合位点,如EBP、DBP、HNF1、HNF3、HNF4、HNF6和Enh1,包含HNF1、(有义)-HNF3、(有义)-HNF4、(反义)-HNF1、(反义)-HNF6、(有义)-EBP、(反义)-HNF4(反义)。
在一个特定例子中,可用于本公开文本的启动子包含SEQ ID NO:69(即,ET启动子),其还作为GenBank编号AY661265而已知。还参见Vigna等,Molecular Therapy 11(5):763(2005)。其他适宜载体和基因调控组件的例子描述于以下文献中:WO 02/092134、EP1395293或美国专利号6,808,905、7,745,179或7,179,903,将上述文献通过引用以其整体并入本文。
在一个实施例中,本公开文本的核酸分子还包含内含子序列。在一些实施例中,内含子序列定位于编码FVIII多肽的核酸序列的5'。在一些实施例中,内含子序列是天然存在的内含子序列。在一些实施例中,内含子序列是合成序列。在一些实施例中,内含子序列衍生自天然存在的内含子序列。在某些实施例中,内含子序列包含SV40小T内含子。在一个实施例中,内含子序列包含SEQ ID NO:115。
在一些实施例中,核酸分子还包含转录后调控元件。在某些实施例中,转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(WPRE)。在一个特定实施例中,转录后调控元件包含SEQ ID NO:120。
在一些实施例中,核酸分子包含微小RNA(miRNA)结合位点。在一个实施例中,miRNA结合位点是miR-142-3p的miRNA结合位点。在其他实施例中,miRNA结合位点选自Rennie等,RNA Biol.13(6):554-560(2016)所披露的miRNA结合位点以及可在http://sfold.wadsworth.org/starmirDB.php获得的STarMirDB,将上述文献通过引用以其整体并入本文。
在一些实施例中,核酸分子包含一个或多个DNA核靶向序列(DTS)。DTS促进含有此类序列的DNA分子易位至核中。在某些实施例中,DTS包含SV40增强子序列。在某些实施例中,DTS包含c-Myc增强子序列。在一些实施例中,DTS介于第一ITR与第二ITR之间。在一些实施例中,DTS在第一ITR的3'和治疗性蛋白质的5'。在其他实施例中,DTS在治疗性蛋白质的3'和第二ITR的5'。
在一些实施例中,核酸分子还包含3'UTR多聚(A)尾序列。在一个实施例中,3'UTR多聚(A)尾序列包含bGH多聚(A)。在一个实施例中,3'UTR多聚(A)尾包含肌动蛋白多聚(A)位点。在一个实施例中,3'UTR多聚(A)尾包含血红蛋白多聚(A)位点。
在一个特定实施例中,3'UTR多聚(A)尾序列包含SEQ ID NO:122。
III.组织特异性表达
在某些实施例中,有用的是在载体内包括一个或多个miRNA靶序列,其例如与凝血因子转基因可操作地连接。因此,本公开文本还提供了至少一个与凝血因子核苷酸序列可操作地连接或以其他方式插入载体内的miRNA序列靶标。载体中包括的多于一个拷贝的miRNA靶序列可以增加系统的有效性。还包括不同miRNA靶序列。例如,表达多于一种转基因的载体可以具有在多于一个可以相同或不同的miRNA靶序列控制下的转基因。miRNA靶序列可以是串联的,但是也包括其他排列。含有miRNA靶序列的转基因表达盒也能以反义定向插入载体内。反义定向可用于产生病毒颗粒,以避免原本可能对产生细胞有毒的基因产物的表达。在其他实施例中,载体包含1、2、3、4、5、6、7或8个拷贝的相同或不同的miRNA靶序列。然而,在某些其他实施例中,载体将不包括任何miRNA靶序列。是否要包括miRNA靶序列(以及数量)的选择将通过如预期的组织靶标、所需的表达水平等已知参数来指导。
在一个实施例中,靶序列是miR-223靶标,已经报道其可在骨髓定向祖细胞中以及至少部分地在更原始的HSPC中最有效地阻断表达。miR-223靶标可以在分化的髓样细胞(包括粒细胞、单核细胞、巨噬细胞、髓样树突细胞)中阻断表达。miR-223靶标还可以适于依赖于淋巴或红细胞谱系中的稳健转基因表达的基因疗法应用。miR-223靶标还可在人HSC中非常有效地阻断表达。
在另一个实施例中,靶序列是miR142靶标(tccataaagt aggaaacact acA(SEQ IDNO:43))。在一个实施例中,载体包含4个拷贝的miR-142靶序列。在某些实施例中,将造血特异性微小RNA(如miR-142(142T))的互补序列并入载体(例如,慢病毒载体(LV))的3'非翻译区中,使得编码转基因的转录物易发生miRNA介导的下调。通过这种方法,可以在造血谱系抗原呈递细胞(APC)中防止转基因表达,同时在非造血细胞中维持所述转基因表达(Brown等,Nat Med 2006)。这种策略可以对转基因表达施加严格的转录后控制,并且由此使得能够稳定递送和长期表达转基因。在一些实施例中,miR-142调控防止经转导细胞的免疫介导的清除和/或诱导抗原特异性调控T细胞(T reg),并且介导对转基因编码抗原的稳固的免疫耐受。
在一些实施例中,靶序列是miR181靶标。Chen C-Z和Lodish H,Seminars inImmunology(2005)17(2):155-165披露了miR-181,它是在小鼠骨髓内的B细胞中特异性表达的miRNA(Chen和Lodish,2005)。所述文献还披露,一些人miRNA与白血病相关。
靶序列可以与miRNA完全或部分互补。术语“完全互补”意指,靶序列的核酸序列与识别所述靶序列的miRNA的序列100%互补。术语“部分互补”意指,靶序列与识别所述靶序列的miRNA的序列仅部分互补,借此部分互补的序列仍然被miRNA识别。换句话说,在本公开文本的上下文中,部分互补的靶序列有效识别相应miRNA,并且实现在表达所述miRNA的细胞中防止或减少转基因表达。miRNA靶序列的例子描述于以下文献中:WO 2007/000668、WO2004/094642、WO 2010/055413或WO 2010/125471,将上述文献通过引用以其整体并入本文。
在一些实施例中,转基因表达靶向肝脏。在某些实施例中,转基因表达靶向肝细胞。在其他实施例中,转基因表达靶向内皮细胞。在一个特定实施例中,转基因表达靶向天然表达内源FVIII的任何组织。
在一些实施例中,转基因表达靶向中枢神经系统。在某些实施例中,转基因表达靶向神经元。在一些实施例中,转基因表达靶向传入神经元。
在一些实施例中,转基因表达靶向传出神经元。在一些实施例中,转基因表达靶向中间神经元。在一些实施例中,转基因表达靶向神经胶质细胞。
在一些实施例中,转基因表达靶向星形胶质细胞。在一些实施例中,转基因表达靶向少突胶质细胞。在一些实施例中,转基因表达靶向小神经胶质细胞。在一些实施例中,转基因表达靶向室管膜细胞。在一些实施例中,转基因表达靶向许旺细胞。在一些实施例中,转基因表达靶向卫星细胞。
在一些实施例中,转基因表达靶向肌肉组织。在一些实施例中,转基因表达靶向平滑肌。在一些实施例中,转基因表达靶向心肌。在一些实施例中,转基因表达靶向骨骼肌。
在一些实施例中,转基因表达靶向眼睛。在一些实施例中,转基因表达靶向感光细胞。在一些实施例中,转基因表达靶向视网膜神经节细胞。
IV.宿主细胞
本公开文本还提供了包含本公开文本的核酸分子或载体的宿主细胞。如本文所用,术语“转化”应在广义上使用,是指将DNA引入受体宿主细胞中,这改变了基因型并因此导致受体细胞的变化。
“宿主细胞”是指已经用使用重组DNA技术构建并且编码至少一种异源基因的载体转化的细胞。本公开文本的宿主细胞较佳地具有哺乳动物来源;最佳地具有人或小鼠来源。相信本领域的技术人员有能力优先地确定最适合于其目的的特定宿主细胞系。示例性宿主细胞系包括但不限于CHO、DG44和DUXB11(中国仓鼠卵巢系,DHFR-)、HELA(人宫颈癌)、CVI(猴肾系)、COS(具有SV40 T抗原的CVI的衍生物)、R1610(中国仓鼠成纤维细胞)、BALBC/3T3(小鼠成纤维细胞)、HAK(仓鼠肾系)、SP2/O(小鼠骨髓瘤)、P3x63-Ag3.653(小鼠骨髓瘤)、BFA-1c1BPT(牛内皮细胞)、RAJI(人淋巴细胞)、
Figure BDA0003006446640001691
NS0、CAP、BHK21和HEK 293(人肾)。在一个特定实施例中,宿主细胞选自:CHO细胞、HEK293细胞、BHK21细胞、
Figure BDA0003006446640001692
细胞、NS0细胞、CAP细胞及其任何组合。在一些实施例中,本公开文本的宿主细胞具有昆虫来源。在一个特定实施例中,宿主细胞是SF9细胞。宿主细胞系通常可以从商业服务、美国组织培养物保藏中心(American Tissue Culture Collection)或从公开文献获得。
将本公开文本的核酸分子或载体引入宿主细胞中可以通过本领域的技术人员熟知的多种技术来完成。这些技术包括但不限于转染(包括电泳和电穿孔)、原生质粒融合、磷酸钙沈淀、与包膜DNA的细胞融合、显微注射和完整病毒感染。参见Ridgway,A.A.G.“Mammalian Expression Vectors”第24.2章,第470-472页Vectors,Rodriguez和Denhardt编(Butterworths,Boston,Mass.1988)。最佳地,通过电穿孔将质粒引入宿主中。使转化的细胞在适于产生轻链和重链的条件下生长,并测定重链和/或轻链蛋白质合成。示例性测定技术包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、或荧光激活细胞分选仪分析(FACS)、免疫组织化学等。
使包含本公开文本的分离的核酸分子或载体的宿主细胞在适当生长培养基中生长。如本文所用,术语“适当生长培养基”意指含有细胞生长所需营养素的培养基。细胞生长所需的营养素可以包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。任选地,培养基可含有一种或多种选择因子。任选地,培养基可含有小牛血清或胎牛血清(FCS)。在一个实施例中,培养基基本上不含IgG。生长培养基通常将例如通过药物选择或必需营养素的缺乏来选择含有DNA构建体的细胞,所述营养素通过DNA构建体上或与DNA构建体共转染的可选标记来补充。所培养的哺乳动物细胞通常在市售的含血清或无血清培养基(例如,MEM、DMEM、DMEM/F12)中生长。在一个实施例中,培养基是CDoptiCHO(Invitrogen,加利福尼亚州卡尔斯巴德)。在另一个实施例中,培养基是CD17(Invitrogen,加利福尼亚州卡尔斯巴德)。适合于所用特定细胞系的培养基的选择在本领域的技术人员的水平内。
V.多肽的制备
本公开文本还提供了由本公开文本的核酸分子编码的多肽。在其他实施例中,本公开文本的多肽由包含本公开文本的核酸分子的载体编码。在又其他实施例中,本公开文本的多肽由包含本公开文本的核酸分子的宿主细胞产生。
在其他实施例中,本公开文本还提供了产生具有凝血因子(例如,FVIII)活性的多肽的方法,其包括在产生具有凝血因子(例如,FVIII)活性的多肽的条件下培养本公开文本的宿主细胞,以及回收具有凝血因子(例如,FVIII)活性的多肽。在一些实施例中,具有凝血因子(例如,FVIII)活性的多肽的表达相对于在相同条件下培养但包含参考核苷酸序列(例如,SEQ ID NO:16,亲代FVIII基因序列)的宿主细胞有所增加。
在其他实施例中,本公开文本提供了增加具有凝血因子(例如,FVIII)活性的多肽的表达的方法,其包括在由核酸分子表达具有凝血因子(例如,FVIII)活性的多肽的条件下培养本公开文本的宿主细胞,其中具有凝血因子(例如,FVIII)活性的多肽的表达相对于在相同条件下培养但包含参考核酸分子(例如,SEQ ID NO:16,亲代FVIII基因序列)的宿主细胞有所增加。
在其他实施例中,本公开文本提供了改良具有凝血因子(例如,FVIII)活性的多肽的产量的方法,其包括在通过本文所公开的核酸分子产生具有凝血因子(例如,FVIII)活性的多肽的条件下培养宿主细胞,其中具有凝血因子(例如,FVIII)活性的多肽的产量相对于在相同条件下培养但包含参考核酸序列(例如,SEQ ID NO:16,亲代FVIII基因序列)的宿主细胞有所提高。
本公开文本的治疗性蛋白质(例如,凝血因子)可以在转基因动物(如啮齿类动物、山羊、绵羊、猪或牛)体内合成。术语“转基因动物”是指已经将外来基因并入基因组中的非人动物。因为这个基因是在种系组织中存在,其从亲代传递给后代。将外源基因引入单细胞胚胎中(Brinster等1985,Proc.Natl.Acad.Sci.USA 82:4438)。产生转基因动物的方法是本领域已知的,包括产生免疫球蛋白分子的转基因学(Wagner等1981,Proc.Natl.Acad.Sci.USA 78:6376;McKnight等1983,Cell 34:335;Brinster等1983,Nature 306:332;Ritchie等1984,Nature 312:517;Baldassarre等2003,Theriogenology59:831;Robl等2003,Theriogenology 59:107;Malassagne等2003,Xenotransplantation 10(3):267)。
VII.药物组合物
含有本公开文本的核酸分子、核酸分子编码的多肽、载体或宿主细胞的组合物可含有适宜的医药上可接受的载剂。例如,所述组合物可含有有助于将活性化合物加工成设计用于递送至作用位点的制剂的赋形剂和/或助剂。
在一个实施例中,本公开文本涉及药物组合物,其包含(a)本文所公开的核酸分子、载体、多肽或宿主细胞;和(b)医药上可接受的赋形剂。
在一些实施例中,药物组合物还包含递送剂。在某些实施例中,递送剂包含脂质纳米颗粒(LNP)。在其他实施例中,药物组合物还包含脂质体、其他聚合分子和外来体。
如本文所用,“脂质纳米颗粒”是指包含多个通过分子间力相互物理缔合的脂质分子的纳米颗粒。脂质纳米颗粒可以是例如微球体(包括单层和多层囊泡,例如脂质体)、乳液中的分散相、胶束或悬浮液中的内相。
在一些实施例中,本公开文本提供了包封的核酸分子组合物,其可以包括包封本发明的核酸分子的脂质纳米颗粒宿主。脂质纳米颗粒可以包含一种或多种脂质(例如,阳离子脂质、非阳离子脂质和PEG修饰的脂质)。在某些实施例中,本公开文本的脂质纳米颗粒配制为将本发明的一种或多种核酸分子递送至一种或多种靶细胞。适宜脂质的例子包括但不限于磷脂酰基化合物(例如,磷脂酰基乙醇胺、鞘脂、磷脂酰基胆碱、磷脂酰基丝氨酸、磷脂酰基甘油、神经节苷脂和脑苷脂)。“阳离子脂质”是指在某一pH(例如,生理pH)下携带净正电荷的任何脂质种类。
在某些实施例中,本公开文本的脂质纳米颗粒具有某一N/P比率。如本文所用,“N/P比率”或“NP比率”是指可带正电的聚合物胺基与带负电的核酸磷酸基的比率。脂质纳米颗粒/核酸分子复合物的N/P特征可以影响如表面净电荷、稳定性和大小等特性。如本文所述的脂质纳米颗粒的NP比率可以是约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100和其间的任何比率。例如,如本文所述的脂质纳米颗粒的NP比率可以是约18、约36或约72。
因此,在某些实施例中,药物组合物包含包封于脂质纳米颗粒中的本公开文本的核酸分子以及医药上可接受的赋形剂。
药物组合物可经配制用于通过推注注射肠胃外施用(即静脉内、皮下或肌内)。注射用配制物能以单位剂型存在,例如在添加有防腐剂的安瓿中或多剂量容器中。组合物可采取如于油性或水性媒剂中的悬浮液、溶液或乳液等形式,并且含有如悬浮剂、稳定剂和/或分散剂等配制剂。可替代地,活性成分可呈粉末形式,用于用适宜媒剂(例如,无热原水)来构造。
适于肠胃外施用的配制物还包括呈水溶性形式(例如,水溶性盐)的活性化合物的水溶液。另外,可以施用作为适当油性注射悬浮液的活性化合物的悬浮液。适宜亲脂溶剂或媒剂包括脂肪油(例如,芝麻油)或合成脂肪酸酯(例如,油酸乙酯或甘油三酯)。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和葡聚糖。任选地,悬浮液还可以含有稳定剂。脂质体还可以用于包封本公开文本的分子,用于递送至细胞或间质空间中。示例性医药上可接受的载剂是生理上相容的溶剂、分散介体、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、水、盐水、磷酸盐缓冲盐水、右旋糖、甘油、乙醇等。在一些实施例中,组合物包含等渗剂,例如糖、多元醇(如甘露醇、山梨醇)或氯化钠。在其他实施例中,组合物包含增强活性成分的贮存期限或有效性的医药上可接受的物质(如润湿剂)或少量辅助物质(如润湿剂或乳化剂、防腐剂或缓冲剂)。
本公开文本的组合物可以呈多种形式,包括例如液体(例如,可注射和可输注的溶液)、分散液、悬浮液、半固体和固体剂型。较佳形式取决于施用方式和治疗应用。
组合物可以配制为溶液、微乳液、分散液、脂质体或其他适于高药物浓度的有序结构。无菌可注射溶液可以通过以下方式制备:将活性成分以所需量并入视需要具有上文所列举成分中的一种或组合的适当溶剂中,之后过滤灭菌。通常,分散液是通过以下方式来制备:将活性成分并入无菌媒剂中,所述媒剂含有基础分散介体和来自上文所列举的那些成分的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,较佳制备方法是真空干燥和冷冻干燥,其从预先无菌过滤的溶液产生活性成分加上任何其他所需成分的粉末。可以例如通过以下方式维持溶液的适当流动性:通过使用如卵磷脂等包衣,在分散液情况下通过维持所需粒径,以及通过使用表面活性剂。可注射组合物的延长吸收可以通过以下方式来实现:在组合物中包括延迟吸收的试剂,例如单硬脂酸盐和明胶。
活性成分可以用受控释放配制物或装置来配制。此类配制物和装置的例子包括植入物、经皮贴剂和微包封递送系统。可以使用生物可降解的生物兼容性聚合物,例如乙烯乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。制备此类配制物和装置的方法是本领域已知的。参见例如,Sustained and Controlled Release Drug Delivery Systems,J.R.Robinson编,Marcel Dekker,Inc.,New York,1978。
可注射长效配制物可以通过以下方式来制备:形成药物于生物可降解聚合物(如聚丙交酯-聚乙交酯)中的微包封基质。根据药物与聚合物的比率以及所采用聚合物的性质,可以控制药物释放速率。其他示例性生物可降解聚合物是聚原酸酯和聚酐。可注射长效配制物还可以通过将药物捕集于脂质体或微乳液中来制备。
可以将补充性活性化合物并入组合物中。在一个实施例中,用凝血因子或其变异体、片段、类似物或衍生物配制本公开文本的核酸分子。例如,凝血因子包括但不限于因子V、因子VII、因子VIII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原、纤维蛋白原、血管性血友病因子或重组可溶性组织因子(rsTF)或前述任一种的激活形式。凝血因子或止血剂还可以包括抗纤维蛋白溶药,例如ε-氨基己酸、氨甲环酸。
可以调节剂量方案以提供最佳所需反应。例如,可以施用单次推注,可以随时间施用若干次分开剂量,或者可以如治疗情况的紧迫性所示的成比例地减少或增加剂量。有利的是以剂量单位形式配制肠胃外组合物,以便于施用和剂量均匀。参见例如,Remington'sPharmaceutical Sciences(Mack Pub.Co.,Easton,Pa.1980)。
除了活性化合物以外,液体剂型还可以含有惰性成分,如水、乙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油、甘油、四氢糠醇、聚乙二醇和山梨聚糖的脂肪酸酯。
适宜药物载剂的非限制性例子也描述于E.W.Martin的Remington'sPharmaceutical Sciences中。赋形剂的一些例子包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、水稻、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂乳粉、甘油、丙烯、二醇、水、乙醇等。组合物还可以含有pH缓冲试剂以及润湿剂或乳化剂。
对于口服施用,药物组合物可以采取通过常规手段制备的片剂或胶囊的形式。还可以将组合物制备为液体,例如糖浆或悬浮液。液体可以包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒剂(例如,扁桃仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可以包括矫味剂、着色剂和甜味剂。可替代地,组合物可以作为干产品存在,用于用水或另一种适宜媒剂来构造。
对于经颊施用,组合物可以采取根据常规方案的片剂或锭剂的形式。
对于通过吸入施用,根据本公开文本使用的化合物便捷地以含有或不含赋形剂的雾化气溶胶的形式或以气溶胶喷雾剂的形式从任选地具有推进剂的加压包或雾化器递送,所述推进剂是例如二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他适宜气体。在加压气溶胶的情况下,剂量单位可以通过提供递送计量量的阀来确定。例如用于吸入器或吹入器中的明胶的胶囊和药筒可以配制含有化合物与如乳糖或淀粉等适宜粉末基质的粉末混合物。
药物组合物还可以经配制用于作为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂经直肠施用。
在一些实施例中,组合物是通过选自以下的途径来施用:局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用和口服施用。肠胃外施用可以是静脉内或皮下施用。
VIII.治疗方法
在一些方面中,本公开文本涉及治疗有需要的受试者的疾病或病症的方法,其包括施用本文所公开的核酸分子、载体、多肽或药物组合物。
在一些实施例中,核酸分子包含第一ITR、第二ITR和基因盒,其中基因盒编码靶序列,其中靶序列编码治疗性蛋白质,并且其中核酸分子用于治疗有需要的受试者的疾病或病症。在一些实施例中,疾病或病症影响选自以下的器官:肌肉、中枢神经系统(CNS)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道及其任何组合。在一些实施例中,受试者患有选自以下的疾病或病症:DMD(杜氏肌营养不良)、XLMTM(X连锁肌小管性肌病)、帕金森病、SMA(脊髓性肌萎缩)、弗里德赖希共济失调、GUCY2D-LCA(利伯先天性黑矇)、XLRS(X连锁视网膜劈裂症)、AMD(年龄相关性黄斑变性)、ACHM(全色盲)、RPF65介导的IRD及其任何组合。
在一些实施例中,核酸分子包含第一ITR、第二ITR和基因盒,其中基因盒编码靶序列,其中靶序列编码miRNA,并且其中核酸分子用于治疗有需要的受试者的疾病或病症。在一些实施例中,疾病或病症包含肌萎缩侧索硬化(ALS)、亨廷顿病和/或常染色体显性色素性视网膜炎。
在一些实施例中,核酸分子包含第一ITR、第二ITR和基因盒,其中基因盒编码靶序列,其中靶序列编码凝血因子,并且其中核酸分子用于治疗有需要的受试者的出血疾病或病症。出血疾病或病症选自出血凝结病症、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤(trauma capitis)、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髂腰肌鞘出血及其任何组合。在仍其他实施例中,安排受试者进行手术。在又其他实施例中,治疗是预防性的或按需的。
本公开文本提供了治疗出血病症的方法,其包括将本公开文本的核酸分子、载体或多肽施用于有需要的受试者。在一些实施例中,出血病症的特征在于缺乏凝血因子(例如,FVIII)。在一些实施例中,出血病症是血友病。在一些实施例中,出血病症是血友病A。在治疗出血病症的方法的一些实施例中,在施用于后24小时,凝血因子(例如,FVIII)的血浆活性相对于施用参考核酸分子(例如,SEQ ID NO:16,亲代FVIII基因序列)、包含参考核酸分子的载体或参考核酸分子编码的多肽的受试者有所增加。
本公开文本还涉及治疗、改善或预防受试者的止血病症的方法,其包括施用治疗有效量的本公开文本的分离的核酸分子或由本公开文本的核酸分子编码的具有凝血因子(例如,FVIII)活性的多肽。通过分离的核酸分子或所编码多肽进行的治疗、改善和预防可以是绕路疗法。接受绕路疗法的受试者可能已经产生针对凝血因子(例如,FVIII)的抑制剂,或者正在产生凝血因子抑制剂。
本公开文本的核酸分子、载体或多肽通过促进纤维蛋白凝块的形成治疗或预防止血病症。由本公开文本的核酸分子编码的具有凝血因子(例如,FVIII)活性的多肽可以激活凝结级联的成员。凝血因子可以是外在路径、固有路径或二者的参与者。
本公开文本的核酸分子、载体或多肽可用于治疗已知可用凝血因子治疗的止血病症。可使用本公开文本的方法治疗的止血病症包括但不限于血友病A、血友病B、血管性血友病、因子XI缺乏(PTA缺乏)、因子XII缺乏、以及纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺乏或结构异常、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。
在一些实施例中,止血病症是遗传性病症。在一个实施例中,受试者患有血友病A。在其他实施例中,止血病症是缺乏凝血因子的结果。在其他实施例中,止血病症是缺乏FVIII的结果。在其他实施例中,止血病症可能是缺陷性FVIII凝血因子的结果。
在另一个实施例中,止血病症可以是获得性病症。获得性病症可能源自潜在的继发性疾病或病症。无关病症可以是(作为例子但不限制)癌症、自身免疫疾病或妊娠。获得性病症可能源自衰老或源自治疗潜在继发性病症的药物疗法(例如,癌症化学疗法)。
本公开文本还涉及治疗未患止血病症或导致获得止血病症的继发性疾病或病症的受试者的方法。本公开文本因此涉及治疗需要通用止血剂的受试者的方法,其包括施用治疗有效量的本公开文本的分离的核酸分子、载体或多肽。例如,在一个实施例中,需要通用止血剂的受试者正在进行或即将进行手术。本公开文本的分离的核酸分子、载体或多肽可以作为预防药在手术之前或之后施用。本公开文本的分离的核酸分子、载体或多肽可以在手术期间或之后施用以控制急性出血发作。手术可以包括但不限于肝移植、肝切除或干细胞移植。
在另一个实施例中,本公开文本的分离的核酸分子、载体或多肽可以用于治疗患有急性出血发作但未患止血病症的受试者。急性出血发作可能源自严重创伤(例如,手术)、车祸、伤口、枪击撕裂(laceration gun shot)或导致不受控制的出血的任何其他创伤性事件。
分离的核酸分子、载体或蛋白质可以用于预防性治疗患有止血病症的受试者。分离的核酸分子、载体或蛋白质可以用于治疗患有止血病症的受试者的急性出血发作。
在另一个实施例中,通过施用本公开文本的分离的核酸分子或载体表达凝血因子蛋白不诱导受试者的免疫应答。在一些实施例中,免疫应答包含产生针对凝血因子的抗体。在一个实施例中,免疫应答包含产生针对FVIII的抗体。在一些实施例中,免疫应答包含细胞因子分泌。在一些实施例中,免疫应答包含激活B细胞、T细胞或B细胞和T细胞二者。在一些实施例中,免疫应答是抑制性免疫应答,其中相对于未产生免疫应答的受试者的凝血因子的活性,受试者的免疫应答降低凝血因子蛋白的活性。在某些实施例中,通过施用本公开文本的分离的核酸分子或载体表达凝血因子蛋白预防针对凝血因子蛋白或从分离的核酸分子或载体表达的凝血因子蛋白的抑制性免疫应答。
在一些实施例中,本公开文本的分离的核酸分子、载体或蛋白质组合物与至少一种促进止血的其他药剂组合施用。促进止血的所述其他药剂是具有已证实的凝血活性的治疗剂。作为例子但不限制,止血剂可以包括FV、FVII、FIX、FX、FXI、FXII、FXIII、凝血酶原或纤维蛋白原或前述任一种的激活形式。凝血因子或止血剂还可以包括抗纤维蛋白溶药,例如ε-氨基己酸、氨甲环酸。
在本公开文本的一个实施例中,组合物(例如,分离的核酸分子、载体或多肽)是凝血因子在施用于受试者时以可激活的形式存在的组合物。这种可激活的分子可以在施用于受试者后在体内于凝血位点被激活。
因此,在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
因此,在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
本公开文本还提供了治疗肝脏代谢病症的方法,其包括将本公开文本的核酸分子、载体或多肽施用于有需要的受试者。在一些实施例中,肝脏代谢病症选自苯丙酮尿(
图7E显示了来自用含有鼠类PAH转基因和B19d135或GPCd165 ITR的ssDNA处理的PKU小鼠的肝脏裂解物的蛋白质免疫印迹。在处理后第81天收集肝脏,并提取蛋白质裂解物。每个孔代表单只动物。使用M2抗FLAG抗体侦检FLAG标记的鼠类PAH蛋白,并且包括GAPDH上样对照以供比较。
)、尿素循环疾病(例如,缺乏转胺甲酰酶(OTC)或精胺琥珀酸合成酶(ASS))、溶酶体贮积病症(例如,粘多糖贮积症)和糖原贮积病(例如,I、II、III、IV型糖原贮积病)。其他肝脏代谢病症包括但不限于威尔森病(Wilson’s disease)、α-1抗胰蛋白酶缺乏、妊娠期同种免疫肝病(GALD)、脂肪酸氧化缺陷、半乳糖血症、脂质贮积病、酪氨酸血症和过氧化物酶体病症。
在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码治疗性蛋白质(例如,正常的肝脏代谢功能所需的蛋白质)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码治疗性蛋白质(例如,正常的肝脏代谢功能所需的蛋白质)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
分离的核酸分子、载体或多肽可以用以下方式施用:静脉内、皮下、肌内或通过任何粘膜表面,例如口服、舌下、经颊、舌下、经鼻、经直肠、经阴道或通过经肺途径。可以将凝血因子蛋白植入生物聚合物固相支持体内或与所述固相支持体连接,从而允许将嵌合蛋白缓慢释放至所需位点。
对于口服施用,药物组合物可以采取通过常规手段制备的片剂或胶囊的形式。还可以将组合物制备为液体,例如糖浆或悬浮液。液体可以包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒剂(例如,扁桃仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可以包括矫味剂、着色剂和甜味剂。可替代地,组合物可以作为干产品存在,用于用水或另一种适宜媒剂来构造。
对于经颊和舌下施用,组合物可以采取根据常规方案的片剂、锭剂或速溶薄膜的形式。
对于通过吸入施用,根据本公开文本使用的具有凝血因子活性的多肽便捷地以气溶胶喷雾剂的形式从具有适宜推进剂(例如,二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他适宜气体)的加压包或雾化器(例如,于PBS中)递送。在加压气溶胶的情况下,剂量单位可以通过提供递送计量量的阀来确定。例如用于吸入器或吹入器中的明胶的胶囊和药筒可配制含有化合物与如乳糖或淀粉等适宜粉末基质的粉末混合物。
在一个实施例中,分离的核酸分子、载体或多肽的施用途径是肠胃外的。如本文所用的术语肠胃外包括静脉内、动脉内、腹膜内、肌内、皮下、直肠或阴道施用。肠胃外施用的静脉内形式是较佳的。虽然所有这些施用形式都明确地考虑在本公开文本的范围内,但是施用形式可以是注射用溶液,特别是用于静脉内或动脉内注射或滴注。通常,适于注射的药物组合物可以包含缓冲液(例如乙酸盐、磷酸盐或柠檬酸盐缓冲液)、表面活性剂(例如聚山梨醇酯)、任选地稳定剂(例如人白蛋白)等。然而,在与本文的传授内容兼容的其他方法中,可以将分离的核酸分子、载体或多肽直接递送至不良细胞群的位点,由此增加患病组织对治疗剂的暴露。
用于肠胃外施用的制剂包括无菌的水性或非水性溶液、悬浮液和乳液。非水性溶剂的例子是丙二醇、聚乙二醇、植物油如橄榄油、以及可注射的有机酯如油酸乙酯。水性载剂包括水、醇性/水性溶液、乳液或悬浮液,包括盐水和缓冲介体。在本公开文本中,医药上可接受的载剂包括但不限于0.01-0.1M且较佳地0.05M磷酸盐缓冲液或0.8%盐水。其他常见肠胃外媒剂包括磷酸钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏液或固定油。静脉内媒剂包括流体和营养补充剂、电解质补充剂(如基于林格氏右旋糖的那些)等。也可以存在防腐剂和其他添加剂,如例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。
更具体地,适于注射使用的药物组合物包括无菌的水性溶液(水溶性的)或分散液、以及用于临时制备无菌可注射溶液或分散液的无菌粉末。在此类情况下,组合物必须是无菌的并且应当是易于注射的程度的流体。其在制造和储存条件下应当稳定,并且将较佳地抵抗微生物(如细菌和真菌)的污染作用而保存。载剂可以是溶剂或分散介体,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)及其适宜混合物。可以例如通过以下方式维持适当流动性:通过使用如卵磷脂等包衣,在分散液情况下通过维持所需粒径,以及通过使用表面活性剂。
药物组合物还可以经配制用于作为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂经直肠施用。
用于治疗病症的本公开文本的组合物的有效剂量根据许多不同因素而变化,所述因素包括施用方式、靶位点、患者的生理状态、患者是人还是动物、所施用的其他药物以及治疗是预防性的还是治疗性的。通常,患者是人,但是也可治疗非人哺乳动物,包括转基因哺乳动物。治疗剂量可使用本领域的技术人员已知的常规方法逐步增加,以优化安全性和功效。
本公开文本的核酸分子、载体或多肽可以任选地与在需要治疗(例如,预防性或治疗性)的病症或病症的治疗中有效的其他药剂组合施用。
如本文所用,与辅助疗法结合或组合的本公开文本的分离的核酸分子、载体或多肽的施用意指依序、同时、同延、并行、伴随或同期施用或施用所述疗法和所公开多肽。本领域的技术人员应了解,组合治疗方案中各种组分的施用或施用可以定时以增强治疗的整体有效性。基于所选辅助疗法和本说明书的传授内容,熟习此项技术者(例如,医师)在不进行过度实验的情况下便能够容易地辨别有效的组合治疗方案。
应进一步了解,本公开文本的分离的核酸分子、载体或多肽可以与一种或多种药剂结合或组合使用(例如,以提供组合治疗方案)。本公开文本的多肽或多核苷酸可以组合的示例性药剂包括代表用于所治疗的特定病症的当前护理标准的药剂。此类药剂在本质上可以是化学的或生物的。术语“生物剂(biologic)”或“生物剂(biologic agent)”是指预期用作治疗剂的从活的生物体和/或其产物制备的任何药学活性剂。
要与本公开文本的多核苷酸或多肽组合使用的药剂的量可以随受试者变化,或者可以根据本领域的知识来施用。参见例如,Bruce A Chabner等,Antineoplastic Agents,于Goodman&Gilman's The Pharmacological Basis of Therapeutics 1233-1287(JoelG.Hardman等编,第9版1996).。在另一个实施例中,施用符合护理标准的量的这种药剂。
在一个实施例中,本文还公开了套组,其包含本文所公开的核酸分子以及将核酸分子施用于有需要的受试者的说明书。在另一个实施例中,本文公开了用于产生本文所提供的核酸分子的杆状病毒系统。核酸分子是在昆虫细胞中产生。在另一个实施例中,提供了表达构建体的纳米颗粒递送系统。表达构建体包含本文所公开的核酸分子。
IX.基因疗法
本公开文本的某些方面提供了在受试者体内表达基因构建体的方法,其包括将本公开文本的分离的核酸分子施用于有需要的受试者。在一些方面中,本公开文本提供了增加受试者体内多肽的表达的方法,其包括将本公开文本的分离的核酸分子施用于有需要的受试者。在其他方面中,本公开文本提供了调节有需要的受试者体内多肽的表达的方法,其包括将本公开文本的分离的核酸分子(例如,包含miRNA的核酸序列)施用于受试者。在一些方面中,本公开文本提供了下调有需要的受试者体内靶基因的表达的方法,其包括将本公开文本的分离的核酸分子(例如,包含miRNA的核酸序列)施用于受试者。
已经探索出体基因疗法作为多种病症的可能的治疗,所述病症包括但不限于血友病A。基因疗法是血友病的非常有吸引力的治疗,因为其可能在载体的单次施用于后通过连续内源性产生凝血因子(例如,FVIII)治愈所述疾病。血友病A非常适合于基因替代方法,因为其临床表达可完全归因于缺少以微小量(200ng/ml)在血浆中循环的单一基因产物(例如,FVIII)。
已经显示使用常规的基于病毒的基因递送诱导人的免疫应答。病毒衣壳蛋白可触发人免疫系统的多种组分。基于AAV的基因递送一直是有吸引力的,因为AAV是人群中的常见病毒,大多数人已经暴露于AAV,并且已经显示AAV的免疫原性低于例如腺病毒。因此,大多数人已经产生针对其先前所暴露的特定变异体的免疫应答。这种预先存在的适应性应答可包括NAb和T细胞,它们可降低随后用AAV再感染的临床功效和/或已经被转导的细胞的消除,这使具有预先存在的抗AAV免疫力的患者没有资格接受基于AVV的基因疗法治疗。本公开文本的核酸分子可用于基于非病毒的基因疗法。由于使用本公开文本的核酸分子的基因递送不需要病毒衣壳,所以除非之后向受试者再次施用(或再次给药),否则不会产生针对病毒组分的免疫力。因此,本公开文本的核酸分子允许长期基因递送策略的再次给药。
另外,如本文所述,本公开文本的核酸分子包含非AAV细小病毒ITR,所述ITR侧接于基因盒以在施用后驱动稳定的转基因表达。ITR的存在是稳定的转基因表达所必需的,如图5中所示,其中不含ITR的核酸不能实现稳定的转基因表达(参见,“无ITR的dsDNA”和“微环”)。
本公开文本的凝血因子蛋白可以在哺乳动物(例如,人患者)体内产生,使用基因治疗方法对于选自以下的出血疾病或病症的治疗将是治疗上有益的:出血凝结病症、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。在一个实施例中,出血疾病或病症是血友病。在另一个实施例中,出血疾病或病症是血友病A。
其他病症也适于使用本文所公开的核酸分子治疗。在某些实施例中,使用本文所述方法治疗影响选自以下的靶器官的疾病或病症:肌肉、中枢神经系统(CNS)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道或其任何组合。在某些实施例中,使用本文所述方法治疗选自以下的疾病或病症:DMD(杜氏肌营养不良)、XLMTM(X连锁肌小管性肌病)、帕金森病、SMA(脊髓性肌萎缩)、弗里德赖希共济失调、GUCY2D-LCA(利伯先天性黑矇)、XLRS(X连锁视网膜劈裂症)、AMD(年龄相关性黄斑变性)、ACHM(全色盲)、RPF65介导的IRD(表9)。
表9.可通过本文所公开的方法治疗的疾病和病症。
Figure BDA0003006446640001841
Figure BDA0003006446640001851
1:SOD1基因的突变占遗传性ALS病例的20%。野生型SOD1已经在神经培养中显示抗细胞凋亡特性,同时已经观察到突变体SOD1在脊髓线粒体中而不是肝脏线粒体中促进细胞凋亡,但是其在这两种线粒体中同等表达。下调突变的SOD1表达可能在ALS中抑制运动神经元变性。2:HD是由于基因重复部分的长度超过正常范围而引起的若干种三核苷酸重复病症中的一种。HTT含有重复多次的三个DNA碱基(胞嘧啶-腺嘌呤-鸟嘌呤(CAG))的序列(即...CAGCAGCAG...),称为三核苷酸重复。CAG是氨基酸谷氨酰胺的3字母遗传密码(密码子),因此一系列CAG导致产生称为聚谷氨酰胺段(或聚Q段)的谷氨酰胺链以及基因的重复部分聚Q区。通常,人们在聚Q区中具有少于36个重复谷氨酰胺,这导致产生细胞质蛋白亨廷顿蛋白。然而,36个或更多个谷氨酰胺的序列导致产生具有不同特征的蛋白质。这种改变的形式称为突变体亨廷顿蛋白(mHTT),增加某些神经元类型的衰变率。通常,CAG重复数与这个过程受影响的程度相关,并且占症状发作年龄变化的约60%。其余变化归因于环境和修改HD机制的其他基因。36-39个重复产生疾病的外显率降低形式,其症状具有迟得多的发作和较慢的进展。在一些情况下,发作可能迟至使得从未注意到症状。在极大重复计数的情况下,HD具有完全外显率并且可以在20岁以下发生,这时将其称为幼年型HD、运动不能-僵硬或韦斯特法尔(Westphal)变异体HD。这种情况占HD载剂的约7%。3:大多数导致色素性视网膜炎的RHO基因突变改变视紫质蛋白的折叠或转运。少数突变引起视紫质组成性激活而不是响应光才被激活。研究表明,改变的视紫质形式干扰必需的细胞功能,从而引起视杆自毁(经历细胞凋亡)。由于视杆是低光条件下的视力所必需的,因此这些细胞的损失在患有色素性视网膜炎的人中引起进行性夜盲症。
在一些实施例中,使用本文所述方法治疗溶酶体贮积病症。在一些实施例中,溶酶体贮积病症选自MLD(异染性脑白质营养不良)、MPS(粘多糖贮积症)、PKU(苯丙酮尿症)、庞贝糖原贮积病II型或其任何组合。
在一些实施例中,本文所述方法用于微小RNA(miRNA)疗法中。在一些实施例中,miRNA治疗因基因或蛋白质过表达而引起的病症。在一些实施例中,miRNA治疗因蛋白质积累而引起的病症。在一些实施例中,miRNA治疗因基因或蛋白质错误表达而引起的病症。在一些实施例中,miRNA治疗因突变体基因表达而引起的病症。在一些实施例中,miRNA治疗因异源基因表达而引起的病症。在某些实施例中,miRNA疗法治疗选自以下的病症:ALS(肌萎缩侧索硬化)、亨廷顿病、AdRP(常染色体显性色素性视网膜炎)及其任何组合。在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗ALS,其中核酸分子包含编码miRNA的基因盒,其中miRNA靶向SOD1的表达。在某些实施例中,miRNA包含Dirren等,Annals of Clinical and Translational Neurology 2(2):167-84(2015年2月)披露的miR SOD1人工miRNA。SOD1基因的突变占遗传性ALS病例的20%。野生型SOD1已经在神经培养中显示抗细胞凋亡特性,同时已经观察到突变体SOD1在脊髓线粒体中而不是肝脏线粒体中促进细胞凋亡,但是其在这两种线粒体中同等表达。下调突变的SOD1表达可能在ALS中抑制运动神经元变性。
在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗亨廷顿病,其中核酸分子包含编码miRNA的基因盒,其中miRNA靶向HTT的表达。在某些实施例中,miRNA包含Evers等,Molecular Therapy26(9):1-15(印刷版之前的电子版,2018年6月)披露的miHTT工程化的miRNA。亨廷顿病是由于基因重复部分的长度超过正常范围而引起的若干种三核苷酸重复病症中的一种。HTT含有重复多次的三个DNA碱基(胞嘧啶-腺嘌呤-鸟嘌呤(CAG))的序列(即...CAGCAGCAG...),其被称为三核苷酸重复。CAG是氨基酸谷氨酰胺的3字母遗传密码(密码子),因此一系列的这些重复导致产生称为聚谷氨酰胺段(或聚Q段)的谷氨酰胺链以及基因的重复部分聚Q区。通常,人们在聚Q区中具有少于36个重复谷氨酰胺,这导致产生细胞质蛋白亨廷顿蛋白。然而,36个或更多个谷氨酰胺的序列导致产生具有不同特征的蛋白质。这种改变的形式称为突变体亨廷顿蛋白(mHTT),增加某些神经元类型的衰变率。通常,CAG重复数与这个过程受影响的程度相关,并且占症状发作年龄变化的约60%。其余变化归因于环境和修改亨廷顿病机制的其他基因。36-39个重复产生疾病的外显率降低形式,其症状具有迟得多的发作和较慢的进展。在一些情况下,发作可能迟至使得从未注意到症状。在极大重复计数的情况下,亨廷顿病具有完全外显率并且可以在20岁以下发生,这时将其称为幼年型亨廷顿病、运动不能-僵硬或韦斯特法尔变异体亨廷顿病。这种情况占亨廷顿病载剂的约7%。
在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗常染色体显性色素性视网膜炎(AdRP),其中核酸分子包含编码miRNA的基因盒,其中miRNA靶向RHO(视紫质)的表达。在某些实施例中,miRNA包含miR-708(参见Behrman等,JCB192(6):919-27(2011))。大多数导致色素性视网膜炎的RHO基因突变改变视紫质蛋白的折叠或转运。少数突变引起视紫质组成性激活而不是响应光才被激活。研究表明,改变的视紫质形式干扰必需的细胞功能,从而引起视杆自毁(经历细胞凋亡)。由于视杆是低光条件下的视力所必需的,因此这些细胞的损失在患有色素性视网膜炎的人中引起进行性夜盲症。
本文所述的所有各个方面、实施例和选择都能以任何和所有变化组合。
本说明书中所提到的所有出版物、专利和专利申请都通过引用并入本文,并入程度如同指示每个单独出版物、专利或专利申请明确且单独地通过引用并入一般。
已经一般性地描述了本公开文本,通过参考本文所提供的实例可以获得进一步的理解。这些实例仅用于说明的目的,而不旨在是限制性的。
实施例
实施例1.带有AAV和非AAV细小病毒ITR的FVIII表达构建体的产生。
实例1a.将密码子优化的FVIII基因和来自AAV的反向末端重复(ITR)区克隆至基因盒中。
FVIII基因盒是基于AAV血清型2的基因组来产生。然而,源自任何血清型(包括合成的)的ITR区可以用于这种方法中(图1A)。
设计在肝脏特异性启动子(TTPp)或泛在启动子(CAGp,图1A和1B)调控下编码侧接有来自AAV的反向末端重复(ITR)区的密码子优化的FVIII编码序列(AAV-FVIII)的表达质粒AAV2-FVIIIco6XTEN用于体外和体内表达,如图1C中所示。基因盒还含有WPRE和bGHpA组件用于转基因的最佳表达(图1A-1C)。将ITR侧接的密码子优化的FVIII序列克隆至包含ColE1复制起点和赋予氨苄青霉素抗性的β-内酰胺酶的表达盒的质粒骨架中(图1C)。侧接于表达盒的限制性内切核酸酶PvuII的识别位点经工程化以允许在PvuII消化时准确切除AAV-FVIII构建体(图1C)。
实例1b.将密码子优化的FVIII基因和来自非AAV细小病毒的反向末端重复(ITR)区克隆至基因盒中。
基于AAV所属的病毒科细小病毒科的成员之间的种系发生关系(图2A),假设依赖病毒属的其他非AAV成员和红病毒属的成员利用类似的细胞机制维持病毒生命周期并建立持久的潜在性感染。因此,可以利用源自这些病毒的基因组的ITR区研发AAV样(但并非基于AAV)基因表达盒。测试以下细小病毒的ITR区对研发用于基因疗法应用的基因构建体的适合性:依赖病毒属鹅细小病毒(GPV)株B和红病毒属B19细小病毒(图2A)。
细小病毒ITR区在质粒载体于细菌细胞中繁殖期间的不稳定性对基因构建体的产生和操作造成挑战。已经成功产生一些含有全长AAV2 ITR(145nt)的基因构建体,但是这些构建体非常不稳定,并且大多数基于AAV2 ITR的质粒含有ITR区的截短的130nt形式(例示于表1中)。类似地,所产生的带有B19 ITR和GPV ITR二者的全长序列的质粒构建体在细菌宿主中展现高度不稳定性(数据未显示),这显著限制了这些ITR对于研发用于基因疗法应用的基因载体的实用性。
先前已经研发出用于拯救带有ITR的截短形式的重组B19病毒的反求遗传学系统(Manaresi等Virology 508(2017):54-62)(表2B,ITR ID:B19d135)。因此,利用B19d135ITR产生遗传上稳定的FVIII表达质粒B19-FVIIIco6XTEN(图1D)。为了进一步利用这种方法合成基于GPV ITR的构建体,比较B19 ITR、GPV ITR和AAV2 ITR的全长野生型序列(图3A)。分别基于与B19 ITR和AVV2 ITR序列中对于ITR功能非必要的前135个和前15个核苷酸的同源性,假设可以去除GPV ITR的前162个核苷酸以合成具有完整功能的ITR(图3A,加框序列)的稳定基因构建体。因此,与带有相应ITR的截短形式的构建体AAV2-FVIIIco6XTEN和B19-FVIIIco6XTEN类似,使用GPVd162(表2C)产生稳定FVIII表达质粒构建体GPV-FVIIIco6XTEN(图1E)。值得注意的是,全长B19 ITR和GPV ITR二者都比全长AAV2 ITR长得多(表1),并且不会形成AAV ITR的独特的T形发夹结构(图2B)。
含有全长B19 ITR序列的质粒在细菌宿主细胞中展现高度不稳定性,因为可能产生仅含有3’ITR的FVIIIco6XTEN表达构建体。使用标准分子克隆技术,可能无法获得含有5’和3’全长B19 ITR二者的阳性克隆。为了产生侧接有全长B19 ITR的FVIIIco6XTEN表达构建体B19wt-FVIIIco6XTEN(图1F),使用特定宿主大肠杆菌菌株PMC103。PMC103含有基因sbcC的缺失,所述基因编码识别并消除十字形DNA结构的外切核酸酶。不受理论束缚,认为使用缺少sbcC的菌株PMC103可允许复制长回文序列(即,含有复杂二级结构的序列)并成功克隆B19wt-FVIIIco6XTEN以及GPVwt-FVIIIco6XTEN。所得质粒编码383个碱基对的野生型B195’和3’ITR序列(表2D),并且另一种质粒编码444个碱基对的野生型GPV 5’和3’ITR序列(表2F)。
如实例1a中所述产生含有侧接有非AAV细小病毒ITR(B19d135、GPVd162和B19wt)的FVIII表达盒的质粒B19-FVIIIco6XTEN(图1D;表2B)、GPV-FVIIIco6XTEN(图1E;表2C)和B19wt-FVIIIco6XTEN(图1F,表2D)。使用限制性内切核酸酶LguI的识别位点侧接于所有FVIII表达盒(图1D-1F)。
实例1c.含有侧接有AAV和非AAV细小病毒ITR的FVIII表达盒的单链DNA片段的制备。
假设侧接于FVIII表达盒的ITR区内发夹结构的形成会驱动靶细胞的持久转导。对于概念验证研究,分别用PvuII和LguI消化基于AAV ITR的质粒AAV2-FVIIIco6XTEN以及基于非AAV ITR的质粒B19-FVIIIco6XTEN和GPV-FVIIIco6XTEN。具有形成的发夹ITR结构的单链(ss)AAV-FVIII、B19-FVIII或GPV-FVIII片段是通过以下方式来产生:在95℃下使PvuII或LguI消化的双链DNA片段产物(FVIII表达盒和质粒骨架)变性,然后在4℃下冷却以允许回文ITR序列折叠(图1A-1B)。在HemA(血友病A)小鼠模型中测试所得ssAAV-FVIII、ssB19-FVIII或ssGPV-FVIII建立肝细胞的持久转导的能力。
实例1d.使用杆状病毒表达系统产生FVIII表达构建体。
将利用描述于Li等,PLoS ONE 8(8):e69879(2013)中的杆状病毒表达系统在昆虫细胞中产生呈闭端DNA(ceDNA)分子形式的AAV-FVIII、B19-FVIII和GPV-FVIII构建体。已经证实ceDNA表达盒的全身递送建立肝细胞的持久转导,并驱动肝脏中的稳定长期转基因表达。
实例2.在HemA小鼠体内,包含侧接有AAV和非AAV细小病毒ITR的FVIII表达盒的基因构建体的全身注射导致长期FVIII表达。
实例2a.ssAAV-FVIII介导的FVIII表达的体内评价。
为了验证带有AAV ITR区的ssAAV-FVIII在体内介导持久转基因表达的能力,在5-12周龄血友病A(HemA)小鼠(4只动物/组)中以5μg、10μg、20μg ssDNA基因表达盒(ssAAV-FVIII)通过流体力学注射全身递送所述基因表达盒(图4A)。HDI导致所注射材料主要递送至实验动物的肝脏中。在单次流体力学注射ssAAV-FVIII后18小时、3天、2周、3周、1个月、2个月、3个月和4个月,从实验动物收集血浆样品。通过生色FVIII活性测定分析血液中的FVIII血浆活性。用5μg/小鼠的亲代表达质粒注射的对照动物在施用后不久即显示高FVIII血浆活性水平。然而,循环FVIII的水平快速下降,并且截至注射后(p.i.)15天变得无法侦检。相比之下,用5、10和20μg/小鼠的ssAAV-FVIII注射的实验动物产生了转基因的长期表达,循环FVIII的稳定水平分别为正常FVIII水平的约8%、16%和32%(图4A)。观察到强剂量反应,表明所注射剂量与治疗结果之间高度相关。
实例2b.ssB19-FVIII和ssGPV-FVIII介导的FVIII表达的体内评价。
为了评价来自分别带有非AAV细小病毒ITR区B19d135和GPVd162的ssB19-FVIII和ssGPV-FVIII的FVIII的体内表达,在5-12周龄血友病A(HemA)小鼠体内通过HDI全身递送10或20μg/小鼠的ssB19-FVIII以及10或50μg/小鼠的ssGPV-FVIII基因表达盒。在注射后1、3、7、14、21、28、42、56、84、112、140和168天收集血液样品,并通过生色FVIII活性测定分析血液中的FVIII活性。如在AAV-FVIII构建体的情况下所观察到的,用5μg/小鼠的亲代FVIII表达质粒注射的对照动物在注射后24小时显示高FVIII血浆活性水平,其快速下降,并且截至注射后14天变得无法侦检。用ssB19-FVIII注射的实验动物在注射后3天显示峰值FVIII血浆活性,其然后在21天期间逐渐下降,并且在注射后28天左右稳定。(图4B)另一方面,用ssGPV-FVIII注射的HemA小鼠在第112天左右产生稳定的FVIII血浆活性水平,其在剩余观察阶段期间维持(图4C)。值得注意的是,用10μg/小鼠的ssAAV-FVIII(图4A)或ssGPV-FVIII(图4C)注射的动物产生了非常相似的稳定FVIII血浆活性水平,表明AAV2 ITR和GPV ITR区二者都包含有效建立靶细胞的持久转导所需的遗传因子。
实例2c.FVIII在hemA小鼠体内的稳定长期表达的ITR和发夹需求的体内评价。
为了比较单链DNA盒与替代核酸治疗剂的稳定性和长期表达,用PvuII或AflII消化FVIIIco6XTEN质粒构建体(图1A)以产生具有或不具有AAV ITR序列的双链线性DNA。纯化不具有ITR的线性双链DNA以产生‘无ITR的dsDNA’构建体。最后,通过重迭AflII识别位点连接纯化的不具有ITR的dsDNA,导致形成微环DNA。这种小环状质粒样DNA构建体缺乏任何细菌序列和/或ITR序列。通过流体力学注射用等摩尔浓度的DNA构建体注射HemA小鼠,并根据在2-4个月期间收集的血浆确定FVIII活性水平。所有DNA构建体都产生了在30%-60%正常范围内的初始治疗水平的FVIII,然而,只有单链DNA在注射后持续4个月显示32%的转基因表达的稳定持久性(图5)。所有双链DNA和微环DNA都在第14-42天达到了6%-10%正常值的稳定表达水平,然而,这些平台期仅代表所观察到的初始FVIII活性的10%。因为瞬时升高水平的FVIII表达可以导致形成中和抗药物抗体,因此在血友病A环境中的免疫耐受性需要稳定表达。
实例2d.野生型与衍生B19 ITR的体内比较。
为了比较B19衍生ITR(B19d135,图1D,表2C)与全长B19 ITR(表2C)的作用,产生侧接有248个碱基对的ITR(图1F)的FVIIIco6XTEN表达盒。用30μg侧接有B19d135(图1D)、GPVd165(图1E)或野生型B19 ITR(图1F)的单链FVIII-DNA流体力学注射血友病A小鼠。在注射后3、7、14、21、28和35天收集所有群组的血浆,B19d135和GPVd165构建体的其他样品在第42天、第55天和第84天采集,并通过生色测定分析FVIII活性(图6)。与衍生B19 ITR相比,全长ITR导致FVIII表达增加约2.5倍。此外,来自野生型ITR的FVIII的表达一开始稳定。
实例2e.体内单链裸DNA的再次施用的评价。
当前基因治疗方式的关键限制是由于形成针对基因疗法载体的病毒衣壳的抗药物抗体而无法再次施用治疗剂。然而,不存在免疫原性蛋白质的基因疗法系统可以再次给药,以使患者逐步增加至所需治疗水平。为了评价我们的侧接非AAV ITR的单链盒是否可以再次施用,在第0天和第35天用30μg含有B19d135 ITR和GPVd165 ITR的ssDNA注射hemA小鼠(图6)。在观察的第一个月期间,施用GPVd165-FVIII的小鼠达到了大约5%正常值的稳定FVIII水平。在ssDNA的第二剂量后,FVIII水平上升至10%,之后略有下降,显示FVIII水平的2倍增加。在第一周期间,施用B19d135-FVIII的小鼠达到了8%的稳定FVIII水平,其上升约3.5倍至30%,之后下降至25%。这些数据证实,在血友病A小鼠体内,再次施用具有非AAVITR的单链DNA可以增加FVIII的稳定表达水平。
实例3.带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的FVIII表达构建体的产生和体内评价。
实例3a.B19 ITR和GPV ITR的最小必需序列的确定。
基于依赖病毒属AAV2和GPV以及红病毒属B19的ITR序列之间的比较(Gene Bank登录号分别为NC_001401.2、U25749.1和KY940273.1),设计用带有此类ITR的基因构建体持久转导真核细胞所需的GPV和B19细小病毒ITR的最小序列,其具有或不具有其他序列(间隔子、插入、倒位、添加和/或用其他细小病毒ITR的野生型序列重组)(图3A和3B)。AAV2 ITR、GPV ITR和B19 ITR的序列比对揭示了所有三种病毒物种之间的保守区B19v1和GPVv1(呈现于表2A-2C中),其作为连续序列而不含可变序列的间隔子区。同样,基于B19 ITR与GPV ITR之间的序列比较设计最小必需序列变异体B19v3和GPVv3。由于带有GPVd162 ITR的FVIII表达构建体在体内实验中的表达优于带有B19d135 ITR的基因构建体,假设B19v3序列包含在B19 ITR与GPV ITR序列之间保守的最小B19 ITR序列区,并且GPVv3序列包含在GPV ITR序列中存在并且在B19 ITR序列中缺少的最小GPV ITR序列区(表2B和2C)。序列B19v2和GPVv2分别是通过排除B19ITR和GPV ITR序列的ITR回文序列区中前135个和前162个核苷酸以及相应互补的135个和162个核苷酸来产生(表2B和2C)。
实例3b.B19 ITR和GPV ITR及其衍生物的回文区在功能性基因构建体上的定向。
细小病毒ITR的一部分是由自我互补的回文区组成。先前已证实,对于重组感染性B19细小病毒,所拯救的带有呈正向和反向定向的回文区的病毒展现类似的生长特性(Manaresi等Virology 508(2017):54-62)。因此,提出不管此类ITR的回文区关于基因表达盒是呈5’和3’ITR组合的正向、反向或任何可能组合,带有B19 ITR和GPV ITR及其衍生物的基因表达构建体保持功能性。为了验证这个假设,将使用相同物种ITR的相同以及反向的互补序列,将B19d135 ITR和GPVd162 ITR以及野生型B19 ITR和GPV ITR以正向、反向和倒转定向并入FVIIIco6XTEN表达盒中。将产生来自这些质粒的单链DNA并如实例2a、2b和2d中所述在血友病A小鼠体内测试由TTPp启动子驱动的肝脏定向的FVIII表达。除了研究相同物种ITR的所有定向以外,还将产生GPV和B19野生型ITR及其衍生物的组合并在血友病A小鼠体内测试FVIII表达。这些表达盒将含有1个B19来源的ITR和1个GPV来源的ITR,以确定非同源ITR序列是否可以增强所需转基因的附加型连环化以及长期表达。将通过流体力学注射用10、20或50μg含有前述表达盒的ssDNA注射血友病A小鼠,并且将从在注射后以每周间隔收集的鼠类血浆量测FVIII。将对施用这些表达盒的小鼠体内的FVIII表达和寿命的影响与施用B19d135、GPVd162和相应野生型ITR表达盒的小鼠体内的FVIII表达和寿命进行直接比较(表2B、2C、2D和2F)。
实例3c.在HemA小鼠体内带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的基因构建体的全身注射。
为了评价来自带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ssDNA构建体的FVIII体内表达,将在5-12周龄HemA小鼠体内通过HDI全身递送5、10、20或50μg/小鼠的每种ssDNA基因表达盒。将在注射后1、3、7、14、21和28天,然后在4个月期间每个月一次收集血液样品。将通过生色FVIII活性测定分析血液中的FVIII活性。
实例4.带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ceDNA表达构建体在昆虫细胞中的产生和体内评价。
实例4a.使用杆状病毒表达系统产生带有B19d135 ITR和GPVd162 ITR的ceDNA表达构建体。
与实例1d中所述的AAV-FVIII、B19-FVIII和GPV-FVIII构建体类似,将使用杆状病毒表达系统在昆虫细胞中产生呈ceDNA形式的带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的基因构建体的FVIII表达。
实例4b.在HemA小鼠体内带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ceDNA表达构建体的全身注射。
为了评价来自带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ceDNA构建体的FVIII体内表达,将在5-12周龄HemA小鼠体内通过HDI全身递送5、10、20或50μg/小鼠的每种ceDNA基因表达盒。将在注射后1、3、7、14、21和28天,然后在4个月期间每个月一次收集血液样品。将通过生色FVIII活性测定分析血液中的FVIII活性。
实例5.ssDNA和ceDNAFVIII表达构建体的脂质纳米颗粒配制物的产生。
在如实例1和4中所述产生每种ssDNA或ceDNA后,将使用适当的脂质组合物通过微流体混合将每种基因构建体配制到脂质纳米颗粒(LNP)中(LNP-ssDNA和LNP-ceDNA)。将调节脂质与DNA的比率(N/P)以优化细胞转导和FVIII表达。将使用配制到LNP中的编码侧接有AAV或非AAV细小病毒ITR的FVIII表达盒的亲代质粒作为转导效率的对照。
实例6.LNP-ssDNA和LNP-ceDNA的体外和体内评价。
实例6a.在所培养肝细胞中ssDNA和ceDNA介导的FVIII表达的体外评价。
如实例5中所述将ssDNA或ceDNA FVIII表达基因构建体和相应的亲代对照质粒配制到LNP中用于靶向基因递送。将Huh7细胞以1x 105个细胞/孔接种至24孔组织培养板中并温育过夜。在第二天,将LNP-ssDNA或配制物以1000、500、250、125和62.5ng/孔添加至细胞上。在转导后24小时更换培养基后,在转导后48小时收获培养基。与人血浆FACT标准品相比,通过生色FVIII活性测定量测培养基中的FVIII活性。将带有在CAGp启动子下并且侧接有AAV ITR的FVIIIco6XTEN盒的质粒以72、36和18的N/P比率包封于脂质纳米颗粒中(图8A)。在转导Huh7细胞后,在条件化培养基中量测FVIII。以18的N/P比率转导细胞产生了36和72的比率的增加的FVIII水平,且1μg/ml的峰值剂量产生超过2 IU/ml。这个数据证实了LNP递送在肝脏靶细胞中的实用性。为了研究通过LNP递送ssDNA在肝脏特异性启动子下的转导效率,将在TTPp启动子下的FVIIIco6XTEN盒以2N/p比率包封并转导Huh7细胞(图8B)。与我们的先前数据一致(图8A),与36的比率相比,18的N/P比率导致增加的FVIII活性水平。另外,这个数据证实了FVIII ssDNA在肝细胞中的概念验证LNP递送。在24小时后,用2μg/ml单链FVIIIco6XTEN-AAV转导的约2x105个Huh7细胞产生了0.33 IU/ml FVIII。
另外,文献中已经显示,细胞组蛋白沿rAAV附加体规则定位,从而产生与细胞染色体DNA核小体模式类似的染色质样结构。因此,还将通过Southern印迹来评估这些构建体建立持久转导靶细胞所需的染色质样核小体结构的能力。
实例6b.在HemA小鼠体内在静脉内施用后对LNP配制的ssDNA和ceDNA介导的长期FVIII表达的评价。
将以5、10、20、40、100ug/小鼠通过IV注射将LNP-ssDNA、LNP-ceDNA或LNP-pDNA(质粒对照)施用于5-12周龄HemA小鼠,N=4/组。将在注射后48小时开始长达6个月中的所选时间点收集血液样品,并将通过生色FVIII活性测定分析血液中的FVIII活性。将针对实例1和4中所述的每种基因构建体比较用LNP-ssDNA或LNP-ceDNA处理的小鼠体内的FVIII表达谱与用LNP-pDNA处理的小鼠的FVIII表达谱。
实例6c.在加强注射后ssDNA或ceDNA介导的FVIII表达的体内评价。
将在初始注射后2个月向实例6b中用LNP-ssDNA或LNP-ceDNA处理的小鼠的亚组施用相同剂量的相应LNP的额外IV注射加强。将在加强注射后48小时开始长达6个月中的所选时间点收集血液样品。将通过生色FVIII活性测定分析血液中的FVIII活性。将用LNP-ssDNA或LNP-ceDNA处理的小鼠体内的FVIII表达谱与用相应LNP-pDNA处理的小鼠的FVIII表达谱进行比较。
实例7.带有B19或GPV来源的ITR的基因表达构建体在基因疗法中的一般使用的实用性。
实例7a.带有B19或GPV来源的ITR的报告基因构建体的产生。
为了证实基于非AAV ITR的基因表达系统作为平台在基因疗法应用中的一般使用的实用性,基于实例1b中所述的构建体用侧接有B19d135 ITR或GPVd162 ITR的绿色荧光蛋白(GFP)或荧光素酶(luc)产生包含表达盒的报告基因构建体。因此,通过常规分子克隆技术用GFP或luc的ORF替代B19-FVIIIco6XTEN(图1C)和GPV-FVIIIco6XTEN(图1D)中FVIII的开放阅读框(ORF)。
还产生含有鼠类苯丙氨酸羟化酶(PAH)转基因的侧接有B19d135 ITR或GPVd162ITR的表达盒(图7A),使用其在苯丙酮尿的相关小鼠模型中评价PAH表达和血液苯丙氨酸浓度的降低。使用这个模型,通过流体力学注射将200μg侧接有非AAV ITR的ssDNA施用于PKU小鼠(n=3)用于肝脏表达。在第3、7、14、28、42、56、70和81天收集血液样品,并分离血浆用于苯丙氨酸浓度确定(图7B-7C)。接受含有B19d135 ITR的表达盒的小鼠在第3天展现苯丙氨酸水平从370μg/ml至210μg/ml的下降,所述水平稳定维持至第81天(图7B)。接受GPVd162ITR盒的小鼠在第14天显示血液苯丙氨酸水平从350μg/ml至310μg/ml的下降,所述水平继续下降至截至第42天的250μg/ml的稳定水平(图7C)。血液苯丙氨酸浓度的这些下降代表与注射前浓度相比45%和30%的降低(图7D)。为了确认鼠类PAH蛋白在肝脏中的存在,对在注射后第81天取自所处理小鼠的肝脏裂解物进行蛋白质印迹。使用抗FLAG标签抗体侦检鼠类PAH蛋白,图7E显示在6只所处理动物的5只中可侦检的鼠类PAH蛋白,并且在用含有B19d135ITR的ssDNA处理的小鼠体内观察到显著较高的蛋白质水平。这些数据与在图7B-7D中观察到的血液苯丙氨酸减少一致。总而言之,这些证实示,单链DNA递送可以导致功能性肝酶的长期表达。
实验中所用的各种PAH构建体的序列陈述于表10A和10B中。
表10A:带有B19d135 ITR的B19-PAH构建体(核苷酸1-4146;SEQ ID NO:197)
Figure BDA0003006446640001961
Figure BDA0003006446640001971
Figure BDA0003006446640001981
Figure BDA0003006446640001991
表10B:带有GPVd162 ITR的GPV-PAH构建体(核苷酸1-4214;SEQ ID NO:198)
Figure BDA0003006446640001992
Figure BDA0003006446640002001
Figure BDA0003006446640002011
Figure BDA0003006446640002021
Figure BDA0003006446640002031
实例7b.带有B19或GPV来源的ITR的ssDNA报告基因构建体的制备。
将如实例1c中所述制备ssDNA报告基因/PAH构建体。简言之,将用LguI消化质粒。具有形成的发夹ITR结构的ssDNA片段将通过以下方式来产生:使LguI消化的双链DNA片段产物(报告基因表达盒和质粒骨架)在95℃下变性,然后在4℃下冷却以允许回文ITR序列折叠(图1A)。将在小鼠体内测试所得ssDNA构建体建立肝脏、肌肉组织、眼睛中的光感受器和中枢神经系统(CNS)的持久转导的能力。
实例7c.ssDNA介导的报告基因表达的体内评价。
为了验证实例7b中所述的ssDNA报告基因构建体在体内介导持久转基因表达的能力,将用5、10或20μg/小鼠的报告基因ssDNA向5-12周龄小鼠(4只动物/组)全身注射,局部注射至靶肌肉组织和CNS细胞,和/或视网膜下注射至靶感光细胞。
为了评价来自基于B19 ITR和GPV ITR的表达构建体的PAH,将使用相关疾病的小鼠模型。这些基因构建体将通过HDI全身递送以靶向肝脏。
序列表
<110> 比奥维拉迪维治疗股份有限公司(BIOVERATIV THERAPEUTICS INC.)
<120> 核酸分子及其用于非病毒基因疗法的用途
<130> 615112: SA9-465TW
<150> 62/716,826
<151> 2018-08-09
<160> 198
<170> PatentIn 3.5版
<210> 1
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-5
<400> 1
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 2
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-4
<400> 2
atgcagatcg agctgagcac gtgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc 60
accaggaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg 120
ggcgagctgc ccgtggacgc caggttcccc cccagggtgc ccaagagctt ccccttcaac 180
acgagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccatct gttcaatatc 240
gccaagccca ggcccccctg gatggggctg ctggggccca cgatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaatg ggcccatggc cagcgacccc ctgtgcctga cctactctta cctgagccac 540
gtggatctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggatagggac 720
gccgccagcg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggtct 780
ctgcccggcc tgatcggctg ccacaggaag agcgtgtact ggcacgtgat cggcatgggg 840
accacccccg aggtgcacag catcttcctg gagggccaca cgttcctggt gaggaatcac 900
aggcaggcca gcctggagat cagcccgatc accttcctga ccgcccagac cctgctgatg 960
gacctggggc agttcctgct gttctgccat atcagctctc accagcacga cggcatggag 1020
gcctacgtga aggtggatag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gaggttcgac 1140
gacgacaata gcccgagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcatt acatcgccgc cgaggaggag gattgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggtcttacaa gagccagtac ctgaacaacg ggccccagag gatcggcagg 1320
aagtacaaga aggtgaggtt catggcctac accgacgaga ccttcaagac cagggaggcg 1380
atccagcacg agagcgggat cctggggccc ctgctgtacg gcgaggtggg cgacacgctg 1440
ctgatcatct tcaagaacca ggccagcagg ccgtacaata tctaccccca cgggatcacc 1500
gacgtgaggc ccctgtactc taggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacgggccc 1620
acgaagagcg accccaggtg cctgaccagg tactacagct ctttcgtgaa catggagagg 1680
gacctggcca gcggcctgat cgggcccctg ctgatctgct acaaggagag cgtggatcag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttcagcgt gttcgacgag 1800
aataggtctt ggtacctgac cgagaatatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg atcccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040
atggtgtacg aggataccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccataact ccgacttcag gaataggggc 2160
atgaccgccc tgctgaaggt gagctcttgc gacaagaaca ccggcgacta ctacgaggat 2220
agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggtct 2280
ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gacgaccctg 2340
cagagcgacc aggaggagat cgactacgac gacacgatca gcgtggagat gaagaaggag 2400
gatttcgaca tctacgacga ggacgagaat cagagcccca ggtctttcca gaagaagacc 2460
aggcattact tcatcgccgc cgtggagagg ctgtgggact acggcatgag cagctctccc 2520
cacgtgctga ggaatagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca ggggcgagct gaacgagcac 2640
ctgggcctgc tggggcccta catcagggcc gaggtggagg ataacatcat ggtgaccttc 2700
aggaatcagg ccagcaggcc ctatagcttc tatagctctc tgatcagcta cgaggaggat 2760
cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820
ttctggaagg tgcagcacca catggccccc acgaaggacg agttcgactg caaggcctgg 2880
gcctacttca gcgacgtgga tctggagaag gacgtgcaca gcggcctgat cgggcccctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaatatg 3060
gagaggaatt gcagggcccc ctgcaatatc cagatggagg acccgacctt caaggagaat 3120
tacaggttcc acgccatcaa cggctacatc atggacacgc tgcccggcct ggtcatggcc 3180
caggatcaga ggatcaggtg gtatctgctg agcatgggga gcaacgagaa tatccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaatctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccgggatc 3360
tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac gctgttcctg 3420
gtgtactcta acaagtgcca gacccccctg gggatggcca gcggccacat cagggacttc 3480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag gctgcactat 3540
tccggaagca tcaacgcctg gagcacgaag gagcccttca gctggatcaa ggtggatctg 3600
ctggccccca tgatcatcca cgggatcaag acccagggcg ccaggcagaa gttcagctct 3660
ctgtatatca gccagttcat catcatgtac tctctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac gctgatggtg ttcttcggca acgtggactc tagcgggatc 3780
aagcacaata tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccat 3840
tactctatca ggtctaccct gaggatggag ctgatgggct gcgacctgaa cagctgcagc 3900
atgcccctgg ggatggagag caaggccatc agcgacgccc agatcaccgc cagctcttac 3960
ttcaccaaca tgttcgccac ctggagcccg agcaaggcca ggctgcacct gcagggcagg 4020
tctaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag 4080
aagaccatga aggtgaccgg cgtgaccacg cagggcgtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat cagctctagc caggacggcc accagtggac cctgttcttc 4200
cagaacggca aggtgaaggt gttccagggc aaccaggata gcttcacccc cgtggtgaac 4260
agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgcgaggccc aggatctgta ttga 4374
<210> 3
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52
<400> 3
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 4
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62
<400> 4
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 5
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25
<400> 5
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 6
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26
<400> 6
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 7
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-NT58
<400> 7
gcgacccgcc gatactacct gggagcagtg gagctctcct gggattacat gcagagcgac 60
cttggggagc tgcccgtgga tgccaggttc cctccccggg tgccaaagtc gtttccgttc 120
aacacctccg tggtgtacaa gaaaactctg ttcgtggagt tcaccgacca cctgttcaat 180
atcgccaagc ccagacctcc ctggatgggg ctgttgggac ctaccatcca agcggaggtg 240
tacgacactg tggtcatcac tctgaagaac atggcctcgc atcccgtgtc cctgcacgcc 300
gtgggagtgt cttactggaa agcgtccgag ggggccgaat acgacgacca gacctcgcag 360
agagaaaagg aagatgacaa ggtgttccca ggaggatcgc acacctacgt gtggcaagtg 420
ttgaaggaga acggcccaat ggcctccgac ccgctgtgcc tgacctactc gtacctgtcc 480
cacgtggacc tcgtgaagga cctcaactcg ggactgattg gagccctgct ggtctgcagg 540
gaaggctcac tggcgaaaga aaagactcag accttgcaca agttcattct gctgttcgct 600
gtgttcgacg aggggaagtc gtggcacagc gagactaaga actccctgat gcaagataga 660
gatgccgcct ccgcccgggc ctggcctaag atgcacaccg tgaacggtta cgtgaaccgc 720
tccctccctg gcctgattgg atgccaccgg aagtccgtgt actggcacgt gatcgggatg 780
gggaccaccc ccgaggtgca cagcatcttc ctggaaggtc acacatttct cgtgcgcaac 840
caccggcagg cctccctgga aatcagcccc attaccttcc tcactgccca gactctgctg 900
atggacctgg gacagttcct gctgttctgc catatctcct cccaccaaca tgacggaatg 960
gaggcatacg tgaaggtcga ttcctgccct gaggaacccc agctccgcat gaagaacaat 1020
gaggaagccg aggactacga cgacgacctg acggatagcg agatggatgt ggtccggttc 1080
gatgacgata acagcccttc cttcatccaa attcgctcgg tggcaaagaa gcaccccaag 1140
acctgggtgc attacattgc ggcggaagaa gaggactggg attatgcccc gcttgtcctc 1200
gctcctgacg accggagcta caagagccag tacctgaaca acggtccaca gaggatcggt 1260
agaaagtaca agaaggtccg cttcatggcc tataccgacg aaaccttcaa aactagagag 1320
gccatccaac acgaatccgg catcctgggc ccgctcttgt acggagaagt cggcgacacc 1380
cttctcatta tcttcaagaa ccaggcttcc cggccgtaca acatctatcc gcatgggatc 1440
actgacgtgc gcccactgta ctcgcggcgc ctgcccaagg gtgtcaaaca cctgaaggat 1500
tttccgatcc ttccgggaga aatcttcaag tacaagtgga ccgtgaccgt ggaagatggc 1560
ccaactaagt ctgaccctag atgcctcacc cgctactact catccttcgt caacatggag 1620
cgcgacctgg ccagcggact gatcggcccg ctgctgattt gctacaagga atcagtggac 1680
caacggggaa accagatcat gtcggataag aggaacgtca tcctcttctc cgtg 1734
<210> 8
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-CT
<400> 8
tttgacgaaa accggtcgtg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 9
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62-NT58
<400> 9
gccactcgcc ggtactacct tggagccgtg gagctttcat gggactacat gcagagcgac 60
ctgggcgaac tccccgtgga tgccagattc cccccccgcg tgccaaagtc cttccccttt 120
aacacctccg tggtgtacaa gaaaaccctc tttgtcgagt tcactgacca cctgttcaac 180
atcgccaagc cgcgcccacc ttggatgggc ctcctgggac cgaccattca agctgaagtg 240
tacgacaccg tggtgatcac cctgaagaac atggcgtccc accccgtgtc cctgcatgcg 300
gtcggagtgt cctactggaa ggcctccgaa ggagctgagt acgacgacca gactagccag 360
cgggaaaagg aggacgataa agtgttcccg ggcggctcgc atacttacgt gtggcaagtc 420
ctgaaggaaa acggacctat ggcatccgat cctctgtgcc tgacttactc ctacctttcc 480
catgtggacc tcgtgaagga cctgaacagc gggctgattg gtgcacttct cgtgtgccgc 540
gaaggttcgc tcgctaagga aaagacccag accctccata agttcatcct tttgttcgct 600
gtgttcgatg aaggaaagtc atggcattcc gaaactaaga actcgctgat gcaggaccgg 660
gatgccgcct cagcccgcgc ctggcctaaa atgcatacag tcaacggata cgtgaatcgg 720
tcactgcccg ggctcatcgg ttgtcacaga aagtccgtgt actggcacgt catcggcatg 780
ggcactacgc ctgaagtgca ctccatcttc ctggaagggc acaccttcct cgtgcgcaac 840
caccgccagg cctctctgga aatctccccg attacctttc tgaccgccca gactctgctc 900
atggacctgg ggcagttcct tctcttctgc cacatctcca gccatcagca cgacggaatg 960
gaggcctacg tgaaggtgga ctcatgcccg gaagaacctc agttgcggat gaagaacaac 1020
gaggaggccg aggactatga cgacgatttg actgactccg agatggacgt cgtgcggttc 1080
gatgacgaca acagccccag cttcatccag attcgcagcg tggccaagaa gcaccccaaa 1140
acctgggtgc actacatcgc ggccgaggaa gaagattggg actacgcccc gttggtgctg 1200
gcacccgatg accggtcgta caagtcccag tatctgaaca atggtccgca gcggattggc 1260
agaaagtaca agaaagtgcg gttcatggcg tacactgacg aaacgtttaa gacccgggag 1320
gccattcaac atgagagcgg cattctggga ccactgctgt acggagaggt cggcgatacc 1380
ctgctcatca tcttcaaaaa ccaggcctcc cggccttaca acatctaccc tcacggaatc 1440
accgacgtgc ggccactcta ctcgcggcgc ctgccgaagg gcgtcaagca cctgaaagac 1500
ttccctatcc tgccgggcga aatcttcaag tataagtgga ccgtcaccgt ggaggacggg 1560
cccaccaaga gcgatcctag gtgtctgact cggtactact ccagcttcgt gaacatggaa 1620
cgggacctgg catcgggact cattggaccg ctgctgatct gctacaaaga gtcggtggat 1680
caacgcggca accagatcat gtccgacaag cgcaacgtga tcctgttctc cgtg 1734
<210> 10
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62-CT
<400> 10
tttgatgaaa acagatcctg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 11
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25-NT58
<400> 11
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 12
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25-CT
<400> 12
ttcgacgaga acaggagctg gtacctgact gaaaacatcc agcggttcct ccccaacccc 60
gcgggcgtgc agctggaaga tcctgagttt caggcatcaa acatcatgca ctccattaac 120
ggctacgtgt tcgattcgct gcagctgagc gtgtgtctgc acgaagtggc ctactggtac 180
atcctgtcca ttggtgccca gactgacttc ctgtccgtgt ttttctccgg ctacacgttc 240
aagcacaaga tggtgtacga ggacaccctg accctcttcc ctttttccgg cgaaactgtg 300
tttatgagca tggagaatcc cggcctgtgg atcttgggct gccacaacag cgacttccgt 360
aacagaggaa tgactgcgct gctcaaggtg tccagctgcg acaagaacac cggagactat 420
tatgaggact catacgagga catctccgcc tacctcctgt ccaagaataa cgccattgaa 480
cctcggagct tcagccagaa cccacccgtg cttaagagac atcaacggga gatcactagg 540
accaccctgc agtcagacca ggaggaaatc gactacgatg acaccatctc ggtcgagatg 600
aagaaggagg actttgacat ctacgacgaa gatgaaaacc agagcccgag gtcgttccaa 660
aagaaaaccc gccactactt tattgctgct gtcgagcggc tgtgggacta cggaatgtcg 720
tcctcgccgc acgtgctccg caaccgagcc cagagcggct cggtgccgca attcaagaag 780
gtcgtgttcc aggagttcac tgacgggagc ttcactcagc ctttgtaccg gggagaactc 840
aatgaacatc tcggcctcct cggaccttac atcagagcag aagtggaaga taacatcatg 900
gtcactttcc gtaaccaagc cagccgcccg tactcgttct actcctccct catttcttac 960
gaagaggacc agcggcaggg cgcagaaccg cgcaagaact tcgtgaagcc caacgaaacc 1020
aagacctact tctggaaagt gcagcatcat atggccccga ctaaggacga gtttgactgc 1080
aaagcctggg cctacttctc cgatgtggac ttggagaagg acgtccactc cggcctcatc 1140
ggtcccctgc tcgtgtgcca taccaatacc ctgaaccccg cacacggtcg ccaggtcacc 1200
gtgcaggagt tcgctctgtt cttcactatc ttcgacgaaa ctaagtcctg gtacttcacc 1260
gagaacatgg agaggaactg cagagccccc tgtaacatcc agatggagga cccgacgttc 1320
aaggaaaact accggttcca cgccattaac ggatacatca tggatacgct gccgggtctt 1380
gtgatggccc aggatcaacg gatcagatgg tacttattgt cgatgggcag caacgagaac 1440
atccactcta ttcacttctc cggtcatgtg ttcactgtgc ggaagaagga agagtacaag 1500
atggccctgt acaaccttta tcccggagtg ttcgaaactg tggaaatgct gccgtcgaag 1560
gccggcattt ggcgcgtgga gtgtttgatt ggagaacatc tccatgcggg gatgtcaacc 1620
ctgttcctgg tgtatagcaa caagtgccag actccgcttg ggatggcgtc aggacacatt 1680
agggatttcc agatcactgc gtccggccag tacggccaat gggcccctaa gctggcccgc 1740
ctgcattact ccggatccat taacgcctgg tcaaccaagg agccattctc ctggatcaag 1800
gtggaccttc tggcccccat gattatccac ggaattaaga cccagggggc ccggcagaag 1860
ttctcctcac tgtacatcag ccagttcata atcatgtact ccctggacgg aaagaagtgg 1920
caaacctaca gggggaacag caccggcaca ctgatggtct ttttcggaaa tgtggactcc 1980
tccgggatta agcataacat cttcaaccct ccgattatcg ctcggtacat tagacttcac 2040
cctacccact acagcattcg ctccaccctg cggatggaac tgatgggctg cgatctgaac 2100
tcgtgcagca tgccgttggg aatggagtcc aaagcaattt ccgacgcgca gatcaccgcc 2160
tcgtcctact ttaccaacat gttcgccacg tggtcaccgt ccaaggcccg gctgcacctc 2220
cagggaagat ccaacgcatg gcggccacag gtcaacaacc ctaaggagtg gctccaggtg 2280
gacttccaga aaaccatgaa ggtcaccgga gtcacaaccc agggagtgaa gtcgctgctg 2340
acttctatgt acgtcaagga gttcctgatc tccagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaatggaaa ggtcaaggtg tttcagggca atcaggattc attcaccccg 2460
gtggtgaact cccttgatcc acccctcctg acccgctacc ttcgcatcca cccacagtcc 2520
tgggtgcacc agatcgcgct gaggatggag gtcctgggat gcgaagccca ggacctgtac 2580
tga 2583
<210> 13
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26-NT58
<400> 13
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 14
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26-CT
<400> 14
ttcgacgaga acaggagctg gtacctcact gaaaacatcc agaggttcct cccaaacccc 60
gcaggagtgc aactggagga ccctgagttt caggcctcga atatcatgca ctcgattaac 120
ggttacgtgt tcgactcgct gcagctgagc gtgtgcctcc atgaagtcgc ttactggtac 180
attctgtcca tcggcgccca gactgacttc ctgagcgtgt tcttttccgg ttacaccttt 240
aagcacaaga tggtgtacga agataccctg accctgttcc ctttctccgg cgaaacggtg 300
ttcatgtcga tggagaaccc gggtctgtgg attctgggat gccacaacag cgactttcgg 360
aaccgcggaa tgactgccct gctgaaggtg tcctcatgcg acaagaacac cggagactac 420
tacgaggact cctacgagga tatctcagcc tacctcctgt ccaagaacaa cgcgatcgag 480
ccgcgcagct tcagccagaa cccgcctgtg ctgaagaggc accagcgaga aattacccgg 540
accaccctcc aatcggatca ggaggaaatc gactacgacg acaccatctc ggtggaaatg 600
aagaaggaag atttcgatat ctacgacgag gacgaaaatc agtcccctcg ctcattccaa 660
aagaaaacta gacactactt tatcgccgcg gtggaaagac tgtgggacta tggaatgtca 720
tccagccctc acgtccttcg gaaccgggcc cagagcggat cggtgcctca gttcaagaaa 780
gtggtgttcc aggagttcac cgacggcagc ttcacccagc cgctgtaccg gggagaactg 840
aacgaacacc tgggcctgct cggtccctac atccgcgcgg aagtggagga taacatcatg 900
gtgaccttcc gtaaccaagc atccagacct tactccttct attcctccct gatctcatac 960
gaggaggacc agcgccaagg cgccgagccc cgcaagaact tcgtcaagcc caacgagact 1020
aagacctact tctggaaggt ccaacaccat atggccccga ccaaggatga gtttgactgc 1080
aaggcctggg cctacttctc cgacgtggac cttgagaagg atgtccattc cggcctgatc 1140
gggccgctgc tcgtgtgtca caccaacacc ctgaacccag cgcatggacg ccaggtcacc 1200
gtccaggagt ttgctctgtt cttcaccatt tttgacgaaa ctaagtcctg gtacttcacc 1260
gagaatatgg agcgaaactg tagagcgccc tgcaatatcc agatggaaga tccgactttc 1320
aaggagaact atagattcca cgccatcaac gggtacatca tggatactct gccggggctg 1380
gtcatggccc aggatcagag gattcggtgg tacttgctgt caatgggatc gaacgaaaac 1440
attcactcca ttcacttctc cggtcacgtg ttcactgtgc gcaagaagga ggagtacaag 1500
atggcgctgt acaatctgta ccccggggtg ttcgaaactg tggagatgct gccgtccaag 1560
gccggcatct ggagagtgga gtgcctgatc ggagagcacc tccacgcggg gatgtccacc 1620
ctcttcctgg tgtactcgaa taagtgccag accccgctgg gcatggcctc gggccacatc 1680
agagacttcc agatcacagc aagcggacaa tacggccaat gggcgccgaa gctggcccgc 1740
ttgcactact ccggatcgat caacgcatgg tccaccaagg aaccgttctc gtggattaag 1800
gtggacctcc tggcccctat gattatccac ggaattaaga cccagggcgc caggcagaag 1860
ttctcctccc tgtacatctc gcaattcatc atcatgtaca gcctggacgg gaagaagtgg 1920
cagacttaca ggggaaactc caccggcacc ctgatggtct ttttcggcaa cgtggattcc 1980
tccggcatta agcacaacat cttcaaccca ccgatcatag ccagatatat taggctccac 2040
cccactcact actcaatccg ctcaactctt cggatggaac tcatggggtg cgacctgaac 2100
tcctgctcca tgccgttggg gatggaatca aaggctatta gcgacgccca gatcaccgcg 2160
agctcctact tcactaacat gttcgccacc tggagcccct ccaaggccag gctgcacttg 2220
cagggacggt caaatgcctg gcggccgcaa gtgaacaatc cgaaggaatg gcttcaagtg 2280
gatttccaaa agaccatgaa agtgaccgga gtcaccaccc agggagtgaa gtcccttctg 2340
acctcgatgt atgtgaagga gttcctgatt agcagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaacggaaa ggtcaaggtg ttccagggga accaggactc gttcacaccc 2460
gtggtgaact ccctggaccc cccactgctg acgcggtact tgaggattca tcctcagtcc 2520
tgggtccatc agattgcatt gcgaatggaa gtcctgggct gcgaggccca ggacctgtac 2580
tga 2583
<210> 15
<211> 2332
<212> PRT
<213> 人(Homo sapiens)
<400> 15
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 16
<211> 4371
<212> DNA
<213> 人工序列
<220>
<223> BDD-FVIII(未优化;“亲代”),核苷酸序列
<400> 16
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371
<210> 17
<211> 1438
<212> PRT
<213> 人工序列
<220>
<223> BDD-FVIII(未优化;“亲代”),氨基酸序列
<400> 17
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 18
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN核苷酸序列
<400> 18
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 19
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-XTEN
<400> 19
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccccccagt gctgaagagg 2760
caccagaggg agatcaccag gaccaccctg cagtctgacc aggaggagat cgactatgat 2820
gacaccatca gcgtggagat gaagaaggag gacttcgaca tctacgacga ggacgagaac 2880
cagagcccca ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg 2940
ctgtgggact atggcatgtc cagcagcccc catgtgctga ggaacagggc ccagtctggc 3000
agcgtgcccc agttcaagaa agtcgtgttc caggagttca ccgacggcag cttcacccag 3060
cccctgtaca gaggggagct gaacgagcac ctgggcctgc tgggccccta catcagggcc 3120
gaggtggagg acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc 3180
tacagcagcc tgatcagcta cgaggaggac cagaggcagg gggctgagcc caggaagaac 3240
tttgtgaagc ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc 3300
accaaggacg agttcgactg caaggcctgg gcctacttct ctgacgtgga cctggagaag 3360
gacgtgcact ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct 3420
gcccatggca ggcaggtgac tgtgcaggag ttcgccctgt tcttcaccat cttcgatgaa 3480
accaagagct ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc 3540
cagatggagg accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc 3600
atggacaccc tgcctggcct ggtcatggcc caggaccaga ggatcaggtg gtatctgctg 3660
agcatgggca gcaacgagaa catccacagc atccacttct ctggccacgt gttcactgtg 3720
aggaagaagg aggagtacaa gatggccctg tacaacctgt accctggggt gttcgaaacc 3780
gtggagatgc tgcccagcaa ggccggcatc tggagggtgg agtgcctgat tggggagcac 3840
ctgcacgccg gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg 3900
ggcatggcct ctggccacat cagggacttc cagatcactg cctctggcca gtacggccag 3960
tgggccccca agctggccag gctgcactac tccggaagca tcaatgcctg gagcaccaag 4020
gagcccttca gctggatcaa agtggacctg ctggccccca tgatcatcca cggcatcaag 4080
acccaggggg ccaggcagaa gttctccagc ctgtacatca gccagttcat catcatgtac 4140
agcctggacg gcaagaagtg gcagacctac aggggcaaca gcaccggcac cctgatggtg 4200
ttcttcggca acgtggacag cagcggcatc aagcacaaca tcttcaaccc ccccatcatc 4260
gccagataca tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag 4320
ctgatgggct gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc 4380
tctgacgccc agatcactgc ctccagctac ttcaccaaca tgtttgccac ctggagcccc 4440
agcaaggcca ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac 4500
cccaaggagt ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc 4560
cagggggtga agagcctgct gaccagcatg tacgtgaagg agttcctgat ctccagcagc 4620
caggacggcc accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc 4680
aaccaggaca gcttcacccc tgtggtcaac agcctggacc cccccctgct gaccagatac 4740
ctgaggatcc acccccagag ctgggtgcac cagatcgccc tgaggatgga ggtgctgggc 4800
tgtgaggccc aggacctgta ctga 4824
<210> 20
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-1-XTEN
<400> 20
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccctccagt gctgaagcgg 2760
caccagcgcg agatcacccg cactaccctg cagagtgatc aggaagagat cgactacgac 2820
gatacaattt ctgtggaaat gaagaaagag gacttcgata tctatgacga agatgagaac 2880
cagagtcctc gatcattcca gaagaaaacc aggcattact ttattgccgc agtggagcgg 2940
ctgtgggatt atggcatgtc ctctagtcct cacgtgctgc gaaatagggc ccagtcagga 3000
agcgtcccac agttcaagaa agtggtcttc caggagttta cagacgggtc ctttactcag 3060
ccactgtaca ggggcgaact gaacgagcac ctgggactgc tggggcccta tatcagagca 3120
gaagtggagg ataacattat ggtcaccttc agaaatcagg cctctcggcc ttacagtttt 3180
tattcaagcc tgatctctta cgaagaggac cagcgacagg gagctgaacc acgaaaaaac 3240
ttcgtgaagc ctaatgagac caaaacatac ttttggaagg tgcagcacca tatggcccca 3300
acaaaagacg agttcgattg caaggcatgg gcctattttt ctgacgtgga tctggagaag 3360
gacgtgcaca gtggcctgat tggcccactg ctggtgtgcc atactaacac cctgaatcca 3420
gcccacggcc ggcaggtcac tgtccaggag ttcgctctgt tctttaccat ctttgatgag 3480
acaaagagct ggtacttcac cgaaaacatg gagcgaaatt gcagggctcc atgtaacatt 3540
cagatggaag accccacatt caaggagaac taccgctttc atgctatcaa tggatacatc 3600
atggatactc tgcccgggct ggtcatggca caggaccaga gaatccggtg gtatctgctg 3660
agcatgggca gcaacgagaa tatccactca attcatttca gcgggcacgt gtttactgtc 3720
aggaagaaag aagagtacaa gatggccctg tacaacctgt atcccggcgt gttcgaaacc 3780
gtcgagatgc tgcctagcaa ggccggaatc tggagagtgg aatgcctgat tggagagcac 3840
ctgcatgctg ggatgtctac cctgtttctg gtgtacagta ataagtgtca gacacccctg 3900
ggaatggcat ccgggcatat cagggatttc cagattaccg catctggaca gtacggacag 3960
tgggcaccta agctggctag actgcactat tccggatcta tcaacgcttg gtccacaaaa 4020
gagcctttct cttggattaa ggtggacctg ctggccccaa tgatcattca tggcatcaaa 4080
actcagggag ctcggcagaa gttctcctct ctgtacatct cacagtttat catcatgtac 4140
agcctggatg ggaagaaatg gcagacatac cgcggcaata gcacaggaac tctgatggtg 4200
ttctttggca acgtggacag cagcggaatc aagcacaaca ttttcaatcc ccctatcatt 4260
gctagataca tccggctgca cccaacccat tattctattc gaagtacact gaggatggaa 4320
ctgatgggat gcgatctgaa cagttgttca atgcccctgg ggatggagtc caaggcaatc 4380
tctgacgccc agattaccgc cagctcctac ttcactaata tgtttgctac ctggagccct 4440
tccaaagcaa gactgcacct gcaaggccgc agcaacgcat ggcgaccaca ggtgaacaat 4500
cccaaggagt ggttgcaggt cgattttcag aaaactatga aggtgaccgg ggtcacaact 4560
cagggcgtga aaagtctgct gacctcaatg tacgtcaagg agttcctgat ctctagttca 4620
caggacggac atcagtggac actgttcttt cagaacggga aggtgaaagt cttccagggc 4680
aatcaggatt cctttacacc tgtggtcaac agtctagacc ctccactgct gaccagatac 4740
ctgagaatcc accctcagtc ctgggtgcac cagattgccc tgagaatgga agtgctggga 4800
tgcgaggccc aggatctgta ctga 4824
<210> 21
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> MAR/ARS
<400> 21
atattt 6
<210> 22
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> MAR/ARS
<400> 22
aaatat 6
<210> 23
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 去稳定组件
<400> 23
attta 5
<210> 24
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 去稳定组件
<400> 24
taaat 5
<210> 25
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 多聚T位点
<400> 25
tttttt 6
<210> 26
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 多聚A位点
<400> 26
aaaaaaa 7
<210> 27
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 剪接位点
<400> 27
ggtgat 6
<210> 28
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> TATA盒
<400> 28
tataa 5
<210> 29
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> TATA盒
<400> 29
ttata 5
<210> 30
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 富含AU的序列组件
<400> 30
attttatt 8
<210> 31
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 富含AU的序列组件
<400> 31
atttttaa 8
<210> 32
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> kozak共有序列
<400> 32
gccgccacca tgc 13
<210> 33
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> CTP肽
<400> 33
Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser
1 5 10 15
Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu
20 25 30
<210> 34
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> CTP肽
<400> 34
Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu Pro Ser Pro Ser Arg
1 5 10 15
Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro Gln
20 25
<210> 35
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 白蛋白结合肽核心序列
<400> 35
Asp Ile Cys Leu Pro Arg Trp Gly Cys Leu Trp
1 5 10
<210> 36
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 36
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala
20
<210> 37
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 37
Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro
1 5 10 15
Ala Ala Pro Ser
20
<210> 38
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 38
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser Ser
20
<210> 39
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 39
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser
<210> 40
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 40
Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro
1 5 10 15
Ser Ser Pro Ala
20
<210> 41
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 41
Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro
1 5 10 15
Ala Ala Pro Ser Ala Pro Pro Ala
20
<210> 42
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 42
Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro
1 5 10 15
Ser Ala Ala Ala
20
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> miR142靶标
<400> 43
tccataaagt aggaaacact aca 23
<210> 44
<211> 2332
<212> PRT
<213> 人(Homo sapiens)
<400> 44
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 45
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 人IgG1的氨基酸233-236
<400> 45
Glu Leu Leu Gly
1
<210> 46
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE42-4,蛋白质序列
<400> 46
Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser
35 40
<210> 47
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE42-4,DNA序列
<400> 47
ggcgcgccag gttctcctgc tggctccccc acctcaacag aagaggggac aagcgaaagc 60
gctacgcctg agagtggccc tggctctgag ccagccacct ccggctctga aacccctgcc 120
tcgagc 126
<210> 48
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-2A,蛋白质序列
<400> 48
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
1 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
130 135 140
<210> 49
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-2A,DNA序列
<400> 49
ggcgcgccaa ccagtacgga gccgtccgag gggagcgcac caggaagccc ggctgggagc 60
ccgacttcta ccgaagaggg tacatctacc gaaccaagtg aaggttcagc accaggcacc 120
tcaacagaac cctctgaggg ctcggcgcct ggtacaagtg agtccgccac cccagaatcc 180
gggcctggga caagcacaga accttcggaa gggagtgccc ctggaacatc cgaatcggca 240
accccagaat cagggccagg atctgagccc gcgacttcgg gctccgagac gcctgggaca 300
tccaccgagc cctccgaagg atcagcccca ggcaccagca cggagccctc tgagggaagc 360
gcacctggta ccagcgaaag cgcaactccc gaatcaggtc ccggtacgag cgagtcggcg 420
accccggaga gcgggccagg tgcctcgagc 450
<210> 50
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-3B,蛋白质序列
<400> 50
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
65 70 75 80
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 51
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-3B,DNA序列
<400> 51
ggcgcgccaa gtcccgctgg aagcccaact agcaccgaag aggggacctc agagtccgcc 60
acccccgagt ccggccctgg ctctgagcct gccactagcg gctccgagac tcctggcaca 120
tccgaaagcg ctacacccga gagtggaccc ggcacctcta ccgagcccag tgagggctcc 180
gcccctggaa caagcaccga gcccagcgaa ggcagcgccc cagggacctc cacagagccc 240
agtgaaggca gtgctcctgg caccagcacc gaaccaagcg agggctctgc acccgggacc 300
tccaccgagc caagcgaagg ctctgcccct ggcacttcca ccgagcccag cgaaggcagc 360
gcccctggga gccccgctgg ctctcccacc agcactgagg agggcacatc taccgaacca 420
agtgaaggct ctgcaccagg tgcctcgagc 450
<210> 52
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-4A,蛋白质序列
<400> 52
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 95
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
100 105 110
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 53
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-4A,DNA序列
<400> 53
ggcgcgccaa cgtccgaaag tgctacccct gagtcaggcc ctggtagtga gcctgccaca 60
agcggaagcg aaactccggg gacctcagag tctgccactc ccgaatcggg gccaggctct 120
gaaccggcca cttcagggag cgaaacacca ggaacatcgg agagcgctac cccggagagc 180
gggccaggaa ctagtactga gcctagcgag ggaagtgcac ctggtacaag cgagtccgcc 240
acacccgagt ctggccctgg ctctccagcg ggctcaccca cgagcactga agagggctct 300
cccgctggca gcccaacgtc gacagaagaa ggatcaccag caggctcccc cacatcaaca 360
gaggagggta catcagaatc tgctactccc gagagtggac ccggtacctc cactgagccc 420
agcgagggga gtgcaccagg tgcctcgagc 450
<210> 54
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-5A,蛋白质序列
<400> 54
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
85 90 95
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
100 105 110
Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
130 135 140
<210> 55
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-5A,DNA序列
<400> 55
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 56
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-6B,蛋白质序列
<400> 56
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala
100 105 110
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 57
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-6B,DNA序列
<400> 57
ggcgcgccaa catctaccga gccttccgaa ggctctgccc ctgggacctc agaatctgca 60
acccctgaaa gcggccctgg aacctccgaa agtgccactc ccgagagcgg cccagggaca 120
agcgagtcag caacccctga gtctggaccc ggcagcgagc ctgcaacctc tggctcagag 180
actcccggct cagaacccgc tacctcaggc tccgagacac ccggctctcc tgctgggagt 240
cccacttcca ccgaggaagg aacatccact gagcctagtg agggctctgc ccctggaacc 300
agcacagagc caagtgaggg cagtgcacca ggatccgagc cagcaaccag cgggtccgag 360
actcccggga cctctgagtc tgccacccca gagagcggac ccggcacttc aaccgagccc 420
tccgaaggat cagcaccagg tgcctcgagc 450
<210> 58
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-1,蛋白质序列
<400> 58
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser
1 5 10 15
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
20 25 30
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
35 40 45
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser
50 55 60
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
65 70 75 80
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
85 90 95
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser
100 105 110
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
115 120 125
Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
130 135 140
<210> 59
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-1,DNA序列
<400> 59
ggcgcgccac ccgggtcgtc cccgtcggcg tccaccggaa cagggccagg gtcatccccg 60
tcagcgtcga ctgggacggg acccgggaca cccggttcgg ggactgcatc ctcctcgcct 120
ggttcgtcca ccccgtcagg agccacgggt tcgccgggaa gcagcccaag cgcatccact 180
ggtacagggc ctggggcttc accgggtact tcatccacgg ggtcaccggg aacgcccgga 240
tcggggacgg cttcctcatc accaggatcg tcaacaccct cgggcgcaac gggcagcccc 300
ggaacccctg gttcgggtac ggcgtcgtcg agccccggtg cgagcccggg aacaagctcg 360
acaggatcgc ctggggcgtc acccggcacg tcgagcacag gcagccccgg aacccctgga 420
tcgggaaccg cgtcgtcaag cgcctcgagc 450
<210> 60
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-A,蛋白质序列
<400> 60
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 61
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-A,DNA序列
<400> 61
ggcgcgccag gtgcctcgcc gggaacatca tcaactggtt cacccgggtc atccccctcg 60
gcctcaaccg ggacgggtcc cggctcatcc cccagcgcca gcactggaac aggtcctggc 120
actcctggtt ccggtacggc atcgtcatcc ccgggaagct caacaccgtc cggagcgaca 180
ggatcacctg gctcgtcacc ttcggcgtca actggaacgg ggccaggggc ctcacccgga 240
acgtcctcga ctgggtcgcc tggtacgccg ggatcaggaa cggcctcatc ctcgcctggg 300
tcctcaacgc cctcgggtgc gactggttcg ccgggaactc ctggctcggg gacggcctcg 360
tcgtcgcctg gggcatcacc ggggacgagc tccacggggt cccctggagc gtcaccgggg 420
acctcctcga caggtagccc ggcctcgagc 450
<210> 62
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-B,蛋白质序列
<400> 62
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
1 5 10 15
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
65 70 75 80
Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro
100 105 110
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 63
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-B,DNA序列
<400> 63
ggcgcgccag gtacaccggg cagcggcacg gcttcgtcgt cacccggctc gtccacaccg 60
tcgggagcta cgggaagccc aggagcgtca ccgggaacgt cgtcaacggg gtcaccgggt 120
acgccaggta gcggcacggc cagcagctcg ccaggttcat cgaccccgtc gggagcgact 180
gggtcgcccg gatcaagccc gtcagcttcc actggaacag gacccgggtc gtcgccgtca 240
gcctcaacgg ggacaggacc tggttcatcg acgccgtcag gggcgacagg ctcgcccgga 300
tcgtcaacac cctcgggggc aacggggagc cctggtgcgt cgcctggaac ctcatccacc 360
ggaagcccgg gggcctcgcc gggtacgagc tccacgggat cgcccggagc gtcccccgga 420
acttcaagca cagggagccc tgcctcgagc 450
<210> 64
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-C,蛋白质序列
<400> 64
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro
1 5 10 15
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
50 55 60
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
85 90 95
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 65
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-C,DNA序列
<400> 65
ggcgcgccag gtacacccgg atcgggtaca gcgtcatcga gccccggtgc gtcacctggt 60
acgtcgagca cggggtcgcc aggggcgtcc cctgggacgt cctcaacagg ctcgcccggt 120
gcgtcacccg gcacgtcgtc cacgggttca cctggtagct ccccttccgc gtccactggc 180
accgggcctg gaactccggg gagcggcaca gcgagctcgt cgccgggagc atcgcctggg 240
acatcgagca ccgggtcgcc aggagcatcg cccggaacat ccagcacagg aagccccggc 300
gcgtcgcccg ggacatcaag cacaggttcc ccgggatcga gcacgccgtc cggagccact 360
ggatcaccag ggagctcgac accttccggc gcaacgggat cgcccggagc cagcccgggt 420
acgtcaagca ctggctcccc tgcctcgagc 450
<210> 66
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-F,蛋白质序列
<400> 66
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
85 90 95
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 67
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-F,DNA序列
<400> 67
ggcgcgccag gctccagccc ctccgcgagc acgggaaccg gaccaggttc gtcaccctca 60
gcatcaacgg ggacgggacc gggggcgtca ccaggaacgt cctccaccgg ctcgccgggt 120
gcatcacccg gaacgtcatc gaccggatcg ccagggagct cgacgccatc aggcgcaaca 180
ggatcacctg gctcaagccc tagcgcgtca accggcacgg gtccgggtgc ctcccctggc 240
acgtccagca ccggatcacc cggatcgagc ccatccgcct caaccggaac cggacccggt 300
acaccagggt cgggaacagc ctcctcgtca ccaggctcct caaccccctc gggagccacg 360
ggttcgcccg gttcgtcaac gccttccgga gcaactggta gccccggagc atcgccagga 420
acttcgagca cggggtcgcc cgcctcgagc 450
<210> 68
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-1 DNA序列
<400> 68
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atcctccagt gctgaagagg caccagaggg agatcacccg cactaccctg 2340
cagagtgatc aggaagagat cgactacgac gatacaattt ctgtggaaat gaagaaagag 2400
gacttcgata tctatgacga agatgagaac cagagtcctc gatcattcca gaagaaaacc 2460
aggcattact ttattgccgc agtggagcgg ctgtgggatt atggcatgtc ctctagtcct 2520
cacgtgctgc gaaatagggc ccagtcagga agcgtcccac agttcaagaa agtggtcttc 2580
caggagttta cagacgggtc ctttactcag ccactgtaca ggggcgaact gaacgagcac 2640
ctgggactgc tggggcccta tatcagagca gaagtggagg ataacattat ggtcaccttc 2700
agaaatcagg cctctcggcc ttacagtttt tattcaagcc tgatctctta cgaagaggac 2760
cagcgacagg gagctgaacc acgaaaaaac ttcgtgaagc ctaatgagac caaaacatac 2820
ttttggaagg tgcagcacca tatggcccca acaaaagacg agttcgattg caaggcatgg 2880
gcctattttt ctgacgtgga tctggagaag gacgtgcaca gtggcctgat tggcccactg 2940
ctggtgtgcc atactaacac cctgaatcca gcccacggcc ggcaggtcac tgtccaggag 3000
ttcgctctgt tctttaccat ctttgatgag acaaagagct ggtacttcac cgaaaacatg 3060
gagcgaaatt gcagggctcc atgtaacatt cagatggaag accccacatt caaggagaac 3120
taccgctttc atgctatcaa tggatacatc atggatactc tgcccgggct ggtcatggca 3180
caggaccaga gaatccggtg gtatctgctg agcatgggca gcaacgagaa tatccactca 3240
attcatttca gcgggcacgt gtttactgtc aggaagaaag aagagtacaa gatggccctg 3300
tacaacctgt atcccggcgt gttcgaaacc gtcgagatgc tgcctagcaa ggccggaatc 3360
tggagagtgg aatgcctgat tggagagcac ctgcatgctg ggatgtctac cctgtttctg 3420
gtgtacagta ataagtgtca gacacccctg ggaatggcat ccgggcatat cagggatttc 3480
cagattaccg catctggaca gtacggacag tgggcaccta agctggctag actgcactat 3540
tccggatcta tcaacgcttg gtccacaaaa gagcctttct cttggattaa ggtggacctg 3600
ctggccccaa tgatcattca tggcatcaaa actcagggag ctcggcagaa gttctcctct 3660
ctgtacatct cacagtttat catcatgtac agcctggatg ggaagaaatg gcagacatac 3720
cgcggcaata gcacaggaac tctgatggtg ttctttggca acgtggacag cagcggaatc 3780
aagcacaaca ttttcaatcc ccctatcatt gctagataca tccggctgca cccaacccat 3840
tattctattc gaagtacact gaggatggaa ctgatgggat gcgatctgaa cagttgttca 3900
atgcccctgg ggatggagtc caaggcaatc tctgacgccc agattaccgc cagctcctac 3960
ttcactaata tgtttgctac ctggagccct tccaaagcaa gactgcacct gcaaggccgc 4020
agcaacgcat ggcgaccaca ggtgaacaat cccaaggagt ggttgcaggt cgattttcag 4080
aaaactatga aggtgaccgg ggtcacaact cagggcgtga aaagtctgct gacctcaatg 4140
tacgtcaagg agttcctgat ctctagttca caggacggac atcagtggac actgttcttt 4200
cagaacggga aggtgaaagt cttccagggc aatcaggatt cctttacacc tgtggtcaac 4260
agtctagacc ctccactgct gaccagatac ctgagaatcc accctcagtc ctgggtgcac 4320
cagattgccc tgagaatgga agtgctggga tgcgaggccc aggatctgta ctga 4374
<210> 69
<211> 577
<212> DNA
<213> 人工序列
<220>
<223> ET启动子,DNA序列
<400> 69
ctcgaggtca attcacgcga gttaataatt accagcgcgg gccaaataaa taatccgcga 60
ggggcaggtg acgtttgccc agcgcgcgct ggtaattatt aacctcgcga atattgattc 120
gaggccgcga ttgccgcaat cgcgaggggc aggtgacctt tgcccagcgc gcgttcgccc 180
cgccccggac ggtatcgata agcttaggag cttgggctgc aggtcgaggg cactgggagg 240
atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat taggacatgt 300
ttgaacaggg gccgggcgat cagcaggtag ctctagagga tccccgtctg tctgcacatt 360
tcgtagagcg agtgttccga tactctaatc tccctaggca aggttcatat ttgtgtaggt 420
tacttattct ccttttgttg actaagtcaa taatcagaat cagcaggttt ggagtcagct 480
tggcagggat cagcagcctg ggttggaagg agggggtata aaagcccctt caccaggaga 540
agccgtcaca cagatccaca agctcctgcc accatgg 577
<210> 70
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-5
<400> 70
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 71
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-6
<400> 71
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 72
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-6-XTEN
<400> 72
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760
caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820
gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880
cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940
ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000
tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060
ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120
gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180
tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240
ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300
accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360
gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420
gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480
actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540
cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600
atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660
tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720
cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780
gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840
ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900
ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960
tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020
gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080
acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140
agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200
tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260
gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320
ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380
agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440
tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500
ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560
cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620
caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680
aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740
ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800
tgcgaggccc aggacctgta ctga 4824
<210> 73
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 73
Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser
1 5 10
<210> 74
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 74
Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser
1 5 10
<210> 75
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 75
Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro
1 5 10
<210> 76
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 76
Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser
1 5 10
<210> 77
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM基序
<400> 77
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
1 5 10
<210> 78
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM、AQ基序
<400> 78
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
1 5 10
<210> 79
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM、AQ基序
<400> 79
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1 5 10
<210> 80
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM、AQ基序
<400> 80
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
1 5 10
<210> 81
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 81
Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro
1 5 10
<210> 82
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 82
Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro
1 5 10
<210> 83
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 83
Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro
1 5 10
<210> 84
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 84
Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro
1 5 10
<210> 85
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 85
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
1 5 10
<210> 86
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 86
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
1 5 10
<210> 87
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 87
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
1 5 10
<210> 88
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 88
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
1 5 10
<210> 89
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 89
Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu
1 5 10
<210> 90
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 90
Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu
1 5 10
<210> 91
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 91
Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu
1 5 10
<210> 92
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 92
Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala
1 5 10
<210> 93
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 93
Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 94
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 94
Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala
1 5 10
<210> 95
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 95
Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro
1 5 10
<210> 96
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 96
Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser
1 5 10
<210> 97
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 97
Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 98
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 98
Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala
1 5 10
<210> 99
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 99
Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala
1 5 10
<210> 100
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 100
Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala
1 5 10
<210> 101
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 101
Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala
1 5 10
<210> 102
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 102
Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser
1 5 10
<210> 103
<211> 1607
<212> PRT
<213> 人工序列
<220>
<223> coFVIII-6-XTEN蛋白质序列
<400> 103
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Thr
755 760 765
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr
770 775 780
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
785 790 795 800
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr
805 810 815
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro
820 825 830
Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
835 840 845
Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
850 855 860
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
865 870 875 880
Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
885 890 895
Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ala
900 905 910
Ser Ser Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
915 920 925
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser
930 935 940
Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn
945 950 955 960
Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala
965 970 975
Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val
980 985 990
Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val
995 1000 1005
Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr
1010 1015 1020
Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile
1025 1030 1035
Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln
1040 1045 1050
Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu
1055 1060 1065
Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys
1070 1075 1080
Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met
1085 1090 1095
Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
1100 1105 1110
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly
1115 1120 1125
Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly
1130 1135 1140
Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
1145 1150 1155
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1160 1165 1170
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1175 1180 1185
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1190 1195 1200
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1205 1210 1215
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1220 1225 1230
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1235 1240 1245
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1250 1255 1260
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1265 1270 1275
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1280 1285 1290
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1295 1300 1305
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1310 1315 1320
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1325 1330 1335
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1340 1345 1350
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1355 1360 1365
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1370 1375 1380
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1385 1390 1395
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1400 1405 1410
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1415 1420 1425
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1430 1435 1440
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1445 1450 1455
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1460 1465 1470
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1475 1480 1485
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1490 1495 1500
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1505 1510 1515
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1520 1525 1530
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1535 1540 1545
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1550 1555 1560
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1565 1570 1575
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1580 1585 1590
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1595 1600 1605
<210> 104
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> AAV2的Rep结合位点(RBS)
<400> 104
gcgcgctcgc tcgctc 16
<210> 105
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> AAV2的末端解链位点(TRS)
<400> 105
agttgg 6
<210> 106
<211> 2328
<212> PRT
<213> 人工序列
<220>
<223> 成熟全长FVIII
<400> 106
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu
485 490 495
Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr
500 505 510
Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr
515 520 525
Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly
530 535 540
Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg
545 550 555 560
Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val
565 570 575
Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe
580 585 590
Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala
595 600 605
Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln
610 615 620
Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile
625 630 635 640
Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe
645 650 655
Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser
660 665 670
Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu
675 680 685
Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu
690 695 700
Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser
705 710 715 720
Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu
725 730 735
Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg Gln Lys
740 745 750
Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys Thr Asp
755 760 765
Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn Val Ser
770 775 780
Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro His Gly
785 790 795 800
Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe Ser Asp
805 810 815
Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser Glu Met
820 825 830
Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val Phe Thr
835 840 845
Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly Thr Thr
850 855 860
Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser Thr Ser
865 870 875 880
Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala Gly Thr
885 890 895
Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His Tyr Asp
900 905 910
Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro Leu Thr
915 920 925
Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp Ser Lys
930 935 940
Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp Gly Lys
945 950 955 960
Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys Arg Ala
965 970 975
His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys Val Ser
980 985 990
Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala Thr Asn
995 1000 1005
Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu Asn Ser
1010 1015 1020
Pro Ser Val Trp Gln Asn Ile Ser Asp Thr Glu Phe Lys Lys Val
1025 1030 1035
Thr Pro Leu Ile His Asp Arg Met Leu Met Asp Lys Asn Ala Thr
1040 1045 1050
Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr Thr Ser Ser Lys
1055 1060 1065
Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly Pro Ile Pro Pro
1070 1075 1080
Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys Met Leu Phe Leu
1085 1090 1095
Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His Gly Lys Asn Ser
1100 1105 1110
Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln Leu Val Ser Leu
1115 1120 1125
Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe Leu Ser Glu Lys
1130 1135 1140
Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr Lys Asp Val Gly
1145 1150 1155
Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn Leu Phe Leu Thr
1160 1165 1170
Asn Leu Asp Asn Leu His Glu Asn Asn Thr His Asn Gln Glu Lys
1175 1180 1185
Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr Leu Ile Gln Glu
1190 1195 1200
Asn Val Val Leu Pro Gln Ile His Thr Val Thr Gly Thr Lys Asn
1205 1210 1215
Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg Gln Asn Val Glu
1220 1225 1230
Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu Gln Asp Phe Arg
1235 1240 1245
Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys His Thr Ala His
1250 1255 1260
Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu Gly Leu Gly Asn
1265 1270 1275
Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys Thr Thr Arg Ile
1280 1285 1290
Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr Gln Arg Ser Lys
1295 1300 1305
Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu Glu Thr Glu Leu
1310 1315 1320
Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr Gln Trp Ser Lys
1325 1330 1335
Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr Gln Ile Asp Tyr
1340 1345 1350
Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser Pro Leu Ser Asp
1355 1360 1365
Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala Asn Arg Ser Pro
1370 1375 1380
Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser Ile Arg Pro Ile
1385 1390 1395
Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser Ser His Leu Pro
1400 1405 1410
Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val Gln Glu Ser Ser
1415 1420 1425
His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu Ser Leu Ala Ile
1430 1435 1440
Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu Val Gly Ser Leu
1445 1450 1455
Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys Lys Val Glu Asn
1460 1465 1470
Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr Ser Gly Lys Val
1475 1480 1485
Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys Asp Leu Phe Pro
1490 1495 1500
Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu Asp Leu Val Glu
1505 1510 1515
Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile Lys Trp Asn Glu
1520 1525 1530
Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg Val Ala Thr Glu
1535 1540 1545
Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp Pro Leu Ala Trp
1550 1555 1560
Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu Glu Trp Lys Ser
1565 1570 1575
Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys Lys Lys Asp Thr
1580 1585 1590
Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His Ala Ile Ala Ala
1595 1600 1605
Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu Val Thr Trp Ala
1610 1615 1620
Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln Asn Pro Pro Val
1625 1630 1635
Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser
1640 1645 1650
Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met
1655 1660 1665
Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser
1670 1675 1680
Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala
1685 1690 1695
Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val
1700 1705 1710
Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys
1715 1720 1725
Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu
1730 1735 1740
Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr
1745 1750 1755
Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn
1760 1765 1770
Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr
1775 1780 1785
Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val
1790 1795 1800
Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
1805 1810 1815
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr
1820 1825 1830
Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile
1835 1840 1845
Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
1850 1855 1860
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile
1865 1870 1875
Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg
1880 1885 1890
Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe
1895 1900 1905
Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp
1910 1915 1920
Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp
1925 1930 1935
Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His
1940 1945 1950
Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys
1955 1960 1965
Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu
1970 1975 1980
Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile
1985 1990 1995
Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr
2000 2005 2010
Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile
2015 2020 2025
Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala
2030 2035 2040
Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp
2045 2050 2055
Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala
2060 2065 2070
Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys
2075 2080 2085
Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu
2090 2095 2100
Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr
2105 2110 2115
Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His
2120 2125 2130
Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His
2135 2140 2145
Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met
2150 2155 2160
Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser
2165 2170 2175
Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr
2180 2185 2190
Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu
2195 2200 2205
Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys
2210 2215 2220
Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly
2225 2230 2235
Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val
2240 2245 2250
Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr
2255 2260 2265
Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln
2270 2275 2280
Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu
2285 2290 2295
Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile
2300 2305 2310
Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
2315 2320 2325
<210> 107
<211> 7053
<212> DNA
<213> 人工序列
<220>
<223> 成熟全长FVIII
<400> 107
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340
ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400
atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460
gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520
cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580
catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640
aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700
tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760
agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820
tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880
aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940
aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct 3000
gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac 3060
aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta 3120
attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa 3180
gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta 3240
aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa 3300
gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc 3360
ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg 3420
caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag 3480
aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta 3540
ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat 3600
ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag 3660
gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag 3720
aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac 3780
ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca 3840
aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga 3900
aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca 3960
agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca 4020
ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc 4080
aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag 4140
aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct 4200
caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct 4260
atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat 4320
agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat 4380
aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc 4440
ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg 4500
aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat 4560
cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg 4620
gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct 4680
ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta 4740
ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa 4800
tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg 4860
aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa 4920
atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca 4980
gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa 5040
attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 5100
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 5160
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 5220
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 5280
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 5340
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 5400
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 5460
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 5520
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 5580
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 5640
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 5700
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 5760
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 5820
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 5880
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 5940
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 6000
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 6060
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 6120
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 6180
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 6240
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 6300
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 6360
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 6420
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 6480
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 6540
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 6600
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 6660
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 6720
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 6780
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 6840
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 6900
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 6960
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 7020
gaggttctgg gctgcgaggc acaggacctc tac 7053
<210> 108
<400> 108
000
<210> 109
<211> 1718
<212> PRT
<213> 人工序列
<220>
<223> BIVV001 BDD-FVIII(XTEN)序列(无Fc)
<400> 109
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu
485 490 495
Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr
500 505 510
Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr
515 520 525
Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly
530 535 540
Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg
545 550 555 560
Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val
565 570 575
Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe
580 585 590
Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala
595 600 605
Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln
610 615 620
Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile
625 630 635 640
Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe
645 650 655
Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser
660 665 670
Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu
675 680 685
Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu
690 695 700
Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser
705 710 715 720
Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu
725 730 735
Pro Arg Ser Phe Ser Gln Asn Gly Thr Ser Glu Ser Ala Thr Pro Glu
740 745 750
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
755 760 765
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
770 775 780
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
785 790 795 800
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
805 810 815
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
820 825 830
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
835 840 845
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
850 855 860
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
865 870 875 880
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
885 890 895
Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
900 905 910
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser
915 920 925
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
930 935 940
Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
945 950 955 960
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
965 970 975
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
980 985 990
Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
995 1000 1005
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
1010 1015 1020
Glu Pro Ser Glu Gly Ser Ala Pro Ala Ser Ser Glu Ile Thr Arg
1025 1030 1035
Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr
1040 1045 1050
Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu
1055 1060 1065
Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His
1070 1075 1080
Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser
1085 1090 1095
Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val
1100 1105 1110
Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
1115 1120 1125
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly
1130 1135 1140
Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met
1145 1150 1155
Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
1160 1165 1170
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
1175 1180 1185
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp
1190 1195 1200
Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys
1205 1210 1215
Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val
1220 1225 1230
His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr
1235 1240 1245
Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala
1250 1255 1260
Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr
1265 1270 1275
Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met
1280 1285 1290
Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn
1295 1300 1305
Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp
1310 1315 1320
Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn
1325 1330 1335
Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys
1340 1345 1350
Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val
1355 1360 1365
Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg
1370 1375 1380
Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr
1385 1390 1395
Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met
1400 1405 1410
Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln
1415 1420 1425
Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly
1430 1435 1440
Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys
1445 1450 1455
Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln
1460 1465 1470
Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile
1475 1480 1485
Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly
1490 1495 1500
Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser
1505 1510 1515
Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg
1520 1525 1530
Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu
1535 1540 1545
Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro
1550 1555 1560
Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala
1565 1570 1575
Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys
1580 1585 1590
Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln
1595 1600 1605
Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr
1610 1615 1620
Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu
1625 1630 1635
Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp
1640 1645 1650
Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val
1655 1660 1665
Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu
1670 1675 1680
Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser
1685 1690 1695
Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu
1700 1705 1710
Ala Gln Asp Leu Tyr
1715
<210> 110
<211> 6526
<212> DNA
<213> 人工序列
<220>
<223> NB15.1v32构建体(AAV-FVIIIco6XTEN-ssDNA)
<400> 110
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata 180
cgcgctctct taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt 240
cgcggccgcc tcgacgacta gcgtttaatt aaacgcgtgt ctgtctgcac atttcgtaga 300
gcgagtgttc cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat 360
tctccttttg ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg 420
gatcagcagc ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc 480
acacagatcc acaagctcct gaggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct 540
ttacgggtta tggcccttgc gtgccttgaa ttactgacac tgacatccac tttttctttt 600
tctccacagc tagcgccacc atgcagattg agctgtccac ttgtttcttc ctgtgcctcc 660
tgcgcttctg tttctccgcc actcgccggt actaccttgg agccgtggag ctttcatggg 720
actacatgca gagcgacctg ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc 780
caaagtcctt cccctttaac acctccgtgg tgtacaagaa aaccctcttt gtcgagttca 840
ctgaccacct gttcaacatc gccaagccgc gcccaccttg gatgggcctc ctgggaccga 900
ccattcaagc tgaagtgtac gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc 960
ccgtgtccct gcatgcggtc ggagtgtcct actggaaggc ctccgaagga gctgagtacg 1020
acgaccagac tagccagcgg gaaaaggagg acgataaagt gttcccgggc ggctcgcata 1080
cttacgtgtg gcaagtcctg aaggaaaacg gacctatggc atccgatcct ctgtgcctga 1140
cttactccta cctttcccat gtggacctcg tgaaggacct gaacagcggg ctgattggtg 1200
cacttctcgt gtgccgcgaa ggttcgctcg ctaaggaaaa gacccagacc ctccataagt 1260
tcatcctttt gttcgctgtg ttcgatgaag gaaagtcatg gcattccgaa actaagaact 1320
cgctgatgca ggaccgggat gccgcctcag cccgcgcctg gcctaaaatg catacagtca 1380
acggatacgt gaatcggtca ctgcccgggc tcatcggttg tcacagaaag tccgtgtact 1440
ggcacgtcat cggcatgggc actacgcctg aagtgcactc catcttcctg gaagggcaca 1500
ccttcctcgt gcgcaaccac cgccaggcct ctctggaaat ctccccgatt acctttctga 1560
ccgcccagac tctgctcatg gacctggggc agttccttct cttctgccac atctccagcc 1620
atcagcacga cggaatggag gcctacgtga aggtggactc atgcccggaa gaacctcagt 1680
tgcggatgaa gaacaacgag gaggccgagg actatgacga cgatttgact gactccgaga 1740
tggacgtcgt gcggttcgat gacgacaaca gccccagctt catccagatt cgcagcgtgg 1800
ccaagaagca ccccaaaacc tgggtgcact acatcgcggc cgaggaagaa gattgggact 1860
acgccccgtt ggtgctggca cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg 1920
gtccgcagcg gattggcaga aagtacaaga aagtgcggtt catggcgtac actgacgaaa 1980
cgtttaagac ccgggaggcc attcaacatg agagcggcat tctgggacca ctgctgtacg 2040
gagaggtcgg cgataccctg ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca 2100
tctaccctca cggaatcacc gacgtgcggc cactctactc gcggcgcctg ccgaagggcg 2160
tcaagcacct gaaagacttc cctatcctgc cgggcgaaat cttcaagtat aagtggaccg 2220
tcaccgtgga ggacgggccc accaagagcg atcctaggtg tctgactcgg tactactcca 2280
gcttcgtgaa catggaacgg gacctggcat cgggactcat tggaccgctg ctgatctgct 2340
acaaagagtc ggtggatcaa cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc 2400
tgttctccgt gtttgatgaa aacagatcct ggtacctcac tgaaaacatc cagaggttcc 2460
tcccaaaccc cgcaggagtg caactggagg accctgagtt tcaggcctcg aatatcatgc 2520
actcgattaa cggttacgtg ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg 2580
cttactggta cattctgtcc atcggcgccc agactgactt cctgagcgtg ttcttttccg 2640
gttacacctt taagcacaag atggtgtacg aagataccct gaccctgttc cctttctccg 2700
gcgaaacggt gttcatgtcg atggagaacc cgggtctgtg gattctggga tgccacaaca 2760
gcgactttcg gaaccgcgga atgactgccc tgctgaaggt gtcctcatgc gacaagaaca 2820
ccggagacta ctacgaggac tcctacgagg atatctcagc ctacctcctg tccaagaaca 2880
acgcgatcga gccgcgcagc ttcagccaga acggcgcgcc aacatcagag agcgccaccc 2940
ctgaaagtgg tcccgggagc gagccagcca catctgggtc ggaaacgcca ggcacaagtg 3000
agtctgcaac tcccgagtcc ggacctggct ccgagcctgc cactagcggc tccgagactc 3060
cgggaacttc cgagagcgct acaccagaaa gcggacccgg aaccagtacc gaacctagcg 3120
agggctctgc tccgggcagc ccagccggct ctcctacatc cacggaggag ggcacttccg 3180
aatccgccac cccggagtca gggccaggat ctgaacccgc tacctcaggc agtgagacgc 3240
caggaacgag cgagtccgct acaccggaga gtgggccagg gagccctgct ggatctccta 3300
cgtccactga ggaagggtca ccagcgggct cgcccaccag cactgaagaa ggtgcctcga 3360
gcccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc caatcggatc 3420
aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa gatttcgata 3480
tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact agacactact 3540
ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct cacgtccttc 3600
ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc caggagttca 3660
ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac ctgggcctgc 3720
tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc cgtaaccaag 3780
catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac cagcgccaag 3840
gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac ttctggaagg 3900
tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg gcctacttct 3960
ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc 4020
acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag tttgctctgt 4080
tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg gagcgaaact 4140
gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac tatagattcc 4200
acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc caggatcaga 4260
ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc attcacttct 4320
ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg tacaatctgt 4380
accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc tggagagtgg 4440
agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg gtgtactcga 4500
ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc cagatcacag 4560
caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac tccggatcga 4620
tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc ctggccccta 4680
tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc ctgtacatct 4740
cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac aggggaaact 4800
ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt aagcacaaca 4860
tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac tactcaatcc 4920
gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg 4980
ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac ttcactaaca 5040
tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg tcaaatgcct 5100
ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa aagaccatga 5160
aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg tatgtgaagg 5220
agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc caaaacggaa 5280
aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac tccctggacc 5340
ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat cagattgcat 5400
tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctgaatcagc ctgagctcgc 5460
tgatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 5520
tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 5580
ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 5640
ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 5700
ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 5760
cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 5820
tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 5880
gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 5940
ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 6000
gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgctgat 6060
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 6120
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 6180
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 6240
gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggcttctg 6300
aggcggaaag aacgggctcg agaagcttct agatatcctc tcttaaggta gcatcgagat 6360
ttaaattagg gataacaggg taatggcgcg ggccgcagga acccctagtg atggagttgg 6420
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 6480
gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcag 6526
<210> 111
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 5'ITR(5'端AAV2反向末端重复)
<400> 111
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 112
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 质粒骨架序列(PBS)-1
<400> 112
gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata cgcgctctct 60
taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt cgcggccgcc 120
tcgacgacta gcgtttaatt aa 142
<210> 113
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> TTPp(肝脏特异性启动子)
<400> 113
acgcgtgtct gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc 60
aaggttcata tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa 120
tcagcaggtt tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat 180
aaaagcccct tcaccaggag aagccgtcac acagatccac aagctcctg 229
<210> 114
<211> 2
<212> DNA
<213> 人工序列
<220>
<223> 质粒骨架序列(PBS)-2
<400> 114
ag 2
<210> 115
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成内含子
<400> 115
gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60
ccttgaatta ctgacactga catccacttt ttctttttct ccacag 106
<210> 116
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 质粒骨架序列(PBS)-3
<400> 116
ctagcgccac c 11
<210> 117
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> FVIIIco6XTEN(含有XTEN144的密码子优化的FVIII形式6的开放阅读框)
<400> 117
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760
caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820
gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880
cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940
ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000
tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060
ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120
gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180
tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240
ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300
accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360
gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420
gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480
actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540
cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600
atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660
tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720
cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780
gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840
ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900
ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960
tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020
gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080
acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140
agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200
tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260
gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320
ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380
agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440
tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500
ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560
cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620
caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680
aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740
ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800
tgcgaggccc aggacctgta ctga 4824
<210> 118
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN144
<400> 118
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 119
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 质粒骨架序列(PBS)-4
<400> 119
atcagcctga gctcgctga 19
<210> 120
<211> 595
<212> DNA
<213> 人工序列
<220>
<223> WPRE(突变的土拨鼠肝炎病毒转录后调控组件)
<400> 120
tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 60
tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 120
ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 180
gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 240
cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 300
ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 360
gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 420
gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 480
cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 540
tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgctg 595
<210> 121
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 质粒骨架序列(PBS)-5
<400> 121
atcagcct 8
<210> 122
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> bGHpA(牛生长激素多聚腺苷酸化信号)
<400> 122
cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 60
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 120
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 180
attgggaaga caatagcagg catgctgggg a 211
<210> 123
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 质粒骨架序列(PBS)-6
<400> 123
tgcggtgggc tctatggctt ctgaggcgga aagaacgggc tcgagaagct tctagatatc 60
ctctcttaag gtagcatcga gatttaaatt agggataaca gggtaatggc gcgggccgc 119
<210> 124
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 3'ITR(3'端AAV2反向末端重复)
<400> 124
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 125
<211> 415
<212> PRT
<213> 人工序列
<220>
<223> 成熟FIX多肽
<400> 125
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
405 410 415
<210> 126
<211> 415
<212> PRT
<213> 人工序列
<220>
<223> 成熟Padua(R338L)FIX多肽
<400> 126
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
405 410 415
<210> 127
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> FIX信号多肽和前肽
<400> 127
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg
35 40 45
<210> 128
<211> 8442
<212> DNA
<213> 人工序列
<220>
<223> 人VWF
<400> 128
atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60
ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120
gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180
ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240
agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300
accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360
gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420
gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480
ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540
acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600
gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660
ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720
gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780
ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840
gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900
tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960
tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020
ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080
acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140
aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200
aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260
cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320
acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380
ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440
cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500
gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560
tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620
ctggcrgagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680
gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740
gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800
ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860
tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920
gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980
tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040
gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100
tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160
atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220
agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280
agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340
ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400
agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460
tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520
acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580
catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640
ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700
aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760
tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820
gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880
tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940
tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000
ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060
tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120
tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180
agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240
ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgcctgcttc 3300
tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360
aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420
gagtgtgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480
gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540
aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600
gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660
cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720
ggaggcctgg tggtgcctcc cacagatgcc ccggtgagcc ccaccactct gtatgtggag 3780
gacatctcgg aaccgccgtt gcacgatttc tactgcagca ggctactgga cctggtcttc 3840
ctgctggatg gctcctccag gctgtccgag gctgagtttg aagtgctgaa ggcctttgtg 3900
gtggacatga tggagcggct gcgcatctcc cagaagtggg tccgcgtggc cgtggtggag 3960
taccacgacg gctcccacgc ctacatcggg ctcaaggacc ggaagcgacc gtcagagctg 4020
cggcgcattg ccagccaggt gaagtatgcg ggcagccagg tggcctccac cagcgaggtc 4080
ttgaaataca cactgttcca aatcttcagc aagatcgacc gccctgaagc ctcccgcatc 4140
gccctgctcc tgatggccag ccaggagccc caacggatgt cccggaactt tgtccgctac 4200
gtccagggcc tgaagaagaa gaaggtcatt gtgatcccgg tgggcattgg gccccatgcc 4260
aacctcaagc agatccgcct catcgagaag caggcccctg agaacaaggc cttcgtgctg 4320
agcagtgtgg atgagctgga gcagcaaagg gacgagatcg ttagctacct ctgtgacctt 4380
gcccctgaag cccctcctcc tactctgccc cccgacatgg cacaagtcac tgtgggcccg 4440
gggctcttgg gggtttcgac cctggggccc aagaggaact ccatggttct ggatgtggcg 4500
ttcgtcctgg aaggatcgga caaaattggt gaagccgact tcaacaggag caaggagttc 4560
atggaggagg tgattcagcg gatggatgtg ggccaggaca gcatccacgt cacggtgctg 4620
cagtactcct acatggtgac cgtggagtac cccttcagcg aggcacagtc caaaggggac 4680
atcctgcagc gggtgcgaga gatccgctac cagggcggca acaggaccaa cactgggctg 4740
gccctgcggt acctctctga ccacagcttc ttggtcagcc agggtgaccg ggagcaggcg 4800
cccaacctgg tctacatggt caccggaaat cctgcctctg atgagatcaa gaggctgcct 4860
ggagacatcc aggtggtgcc cattggagtg ggccctaatg ccaacgtgca ggagctggag 4920
aggattggct ggcccaatgc ccctatcctc atccaggact ttgagacgct cccccgagag 4980
gctcctgacc tggtgctgca gaggtgctgc tccggagagg ggctgcagat ccccaccctc 5040
tcccctgcac ctgactgcag ccagcccctg gacgtgatcc ttctcctgga tggctcctcc 5100
agtttcccag cttcttattt tgatgaaatg aagagtttcg ccaaggcttt catttcaaaa 5160
gccaatatag ggcctcgtct cactcaggtg tcagtgctgc agtatggaag catcaccacc 5220
attgacgtgc catggaacgt ggtcccggag aaagcccatt tgctgagcct tgtggacgtc 5280
atgcagcggg agggaggccc cagccaaatc ggggatgcct tgggctttgc tgtgcgatac 5340
ttgacttcag aaatgcatgg tgccaggccg ggagcctcaa aggcggtggt catcctggtc 5400
acggacgtct ctgtggattc agtggatgca gcagctgatg ccgccaggtc caacagagtg 5460
acagtgttcc ctattggaat tggagatcgc tacgatgcag cccagctacg gatcttggca 5520
ggcccagcag gcgactccaa cgtggtgaag ctccagcgaa tcgaagacct ccctaccatg 5580
gtcaccttgg gcaattcctt cctccacaaa ctgtgctctg gatttgttag gatttgcatg 5640
gatgaggatg ggaatgagaa gaggcccggg gacgtctgga ccttgccaga ccagtgccac 5700
accgtgactt gccagccaga tggccagacc ttgctgaaga gtcatcgggt caactgtgac 5760
cgggggctga ggccttcgtg ccctaacagc cagtcccctg ttaaagtgga agagacctgt 5820
ggctgccgct ggacctgccc ctgygtgtgc acaggcagct ccactcggca catcgtgacc 5880
tttgatgggc agaatttcaa gctgactggc agctgttctt atgtcctatt tcaaaacaag 5940
gagcaggacc tggaggtgat tctccataat ggtgcctgca gccctggagc aaggcagggc 6000
tgcatgaaat ccatcgaggt gaagcacagt gccctctccg tcgagstgca cagtgacatg 6060
gaggtgacgg tgaatgggag actggtctct gttccttacg tgggtgggaa catggaagtc 6120
aacgtttatg gtgccatcat gcatgaggtc agattcaatc accttggtca catcttcaca 6180
ttcactccac aaaacaatga gttccaactg cagctcagcc ccaagacttt tgcttcaaag 6240
acgtatggtc tgtgtgggat ctgtgatgag aacggagcca atgacttcat gctgagggat 6300
ggcacagtca ccacagactg gaaaacactt gttcaggaat ggactgtgca gcggccaggg 6360
cagacgtgcc agcccatcct ggaggagcag tgtcttgtcc ccgacagctc ccactgccag 6420
gtcctcctct taccactgtt tgctgaatgc cacaaggtcc tggctccagc cacattctat 6480
gccatctgcc agcaggacag ttgccaccag gagcaagtgt gtgaggtgat cgcctcttat 6540
gcccacctct gtcggaccaa cggggtctgc gttgactgga ggacacctga tttctgtgct 6600
atgtcatgcc caccatctct ggtctacaac cactgtgagc atggctgtcc ccggcactgt 6660
gatggcaacg tgagctcctg tggggaccat ccctccgaag gctgtttctg ccctccagat 6720
aaagtcatgt tggaaggcag ctgtgtccct gaagaggcct gcactcagtg cattggtgag 6780
gatggagtcc agcaccagtt cctggaagcc tgggtcccgg accaccagcc ctgtcagatc 6840
tgcacatgcc tcagcgggcg gaaggtcaac tgcacaacgc agccctgccc cacggccaaa 6900
gctcccacgt gtggcctgtg tgaagtagcc cgcctccgcc agaatgcaga ccagtgctgc 6960
cccgagtatg agtgtgtgtg tgacccagtg agctgtgacc tgcccccagt gcctcactgt 7020
gaacgtggcc tccagcccac actgaccaac cctggcgagt gcagacccaa cttcacctgc 7080
gcctgcagga aggaggagtg caaaagagtg tccccaccct cctgcccccc gcaccgtttg 7140
cccacccttc ggaagaccca gtgctgtgat gagtatgagt gtgcctgcaa ctgtgtcaac 7200
tccacagtga gctgtcccct tgggtacttg gcctcaaccg ccaccaatga ctgtggctgt 7260
accacaacca cctgccttcc cgacaaggtg tgtgtccacc gaagcaccat ctaccctgtg 7320
ggccagttct gggaggaggg ctgcgatgtg tgcacctgca ccgacatgga ggatgccgtg 7380
atgggcctcc gcgtggccca gtgctcccag aagccctgtg aggacagctg tcggtcgggc 7440
ttcacttacg ttctgcatga aggcgagtgc tgtggaaggt gcctgccatc tgcctgtgag 7500
gtggtgactg gctcaccgcg gggggactcc cagtcttcct ggaagagtgt cggctcccag 7560
tgggcctccc cggagaaccc ctgcctcatc aatgagtgtg tccgagtgaa ggaggaggtc 7620
tttatacaac aaaggaacgt ctcctgcccc cagctggagg tccctgtctg cccctcgggc 7680
tttcagctga gctgtaagac ctcagcgtgc tgcccaagct gtcgctgtga gcgcatggag 7740
gcctgcatgc tcaatggcac tgtcattggg cccgggaaga ctgtgatgat cgatgtgtgc 7800
acgacctgcc gctgcatggt gcaggtgggg gtcatctctg gattcaagct ggagtgcagg 7860
aagaccacct gcaacccctg ccccctgggt tacaaggaag aaaataacac aggtgaatgt 7920
tgtgggagat gtttgcctac ggcttgcacc attcagctaa gaggaggaca gatcatgaca 7980
ctgaagcgtg atgagacgct ccaggatggc tgtgatactc acttctgcaa ggtcaatgag 8040
agaggagagt acttctggga gaagagggtc acaggctgcc caccctttga tgaacacaag 8100
tgtcttgctg agggaggtaa aattatgaaa attccaggca cctgctgtga cacatgtgag 8160
gagcctgagt gcaacgacat cactgccagg ctgcagtatg tcaaggtggg aagctgtaag 8220
tctgaagtag aggtggatat ccactactgc cagggcaaat gtgccagcaa agccatgtac 8280
tccattgaca tcaacgatgt gcaggaccag tgctcctgct gctctccgac acggacggag 8340
cccatgcagg tggccctgca ctgcaccaat ggctctgttg tgtaccatga ggttctcaat 8400
gccatggagt gcaaatgctc ccccaggaag tgcagcaagt ga 8442
<210> 129
<211> 2809
<212> PRT
<213> 人工序列
<220>
<223> 人VWF
<220>
<221> 尚未归类的特征
<222> (540)..(540)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (1944)..(1944)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (2012)..(2012)
<223> Xaa可以是任何天然存在的氨基酸
<400> 129
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Cys Glu Lys Thr Leu Cys Glu Cys Ala
245 250 255
Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala Arg Thr
260 265 270
Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His Ser Ala
275 280 285
Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys Val Ser
290 295 300
Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met Cys Gln
305 310 315 320
Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu Leu Asp
325 330 335
Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His Ser Gly
340 345 350
Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn Thr Cys
355 360 365
Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys Pro Gly
370 375 380
Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp Asn Arg
385 390 395 400
Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg Asp Cys
405 410 415
Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys Ala Asp
420 425 430
Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu Pro Gly
435 440 445
Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val Ala Met
450 455 460
Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu Arg Ile
465 470 475 480
Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu Asp Leu
485 490 495
Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu Ser Pro
500 505 510
Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn Gly Asn
515 520 525
Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Xaa Glu Pro Arg Val
530 535 540
Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln Asp Leu
545 550 555 560
Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met Thr Arg
565 570 575
Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe Glu Ala
580 585 590
Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys Arg Tyr
595 600 605
Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly Ala Ser
610 615 620
Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val Ala Trp Arg Glu
625 630 635 640
Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln Val Tyr Leu Gln
645 650 655
Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu Ser Tyr Pro Asp
660 665 670
Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe Cys Pro Pro Gly
675 680 685
Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys Ala Gln Cys Pro
690 695 700
Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp Ile Phe Ser Asp
705 710 715 720
His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met His Cys Thr Met
725 730 735
Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val Leu Ser Ser Pro
740 745 750
Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg Pro Pro Met Val
755 760 765
Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys
770 775 780
Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys
785 790 795 800
Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg
805 810 815
Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr
820 825 830
Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Arg
835 840 845
Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser
850 855 860
Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu
865 870 875 880
Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser
885 890 895
Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His
900 905 910
Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly
915 920 925
Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys
930 935 940
Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu
945 950 955 960
Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile
965 970 975
Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys
980 985 990
Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu
995 1000 1005
Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val
1010 1015 1020
Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser
1025 1030 1035
Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp
1040 1045 1050
Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn
1055 1060 1065
Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp
1070 1075 1080
Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys Phe Cys Asp
1085 1090 1095
Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val
1100 1105 1110
Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu
1115 1120 1125
Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn
1130 1135 1140
Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro
1145 1150 1155
Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys
1160 1165 1170
Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp
1175 1180 1185
Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala
1190 1195 1200
Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys
1205 1210 1215
Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys
1220 1225 1230
Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val
1235 1240 1245
Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu
1250 1255 1260
His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu Val Phe Leu Leu
1265 1270 1275
Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe Glu Val Leu Lys
1280 1285 1290
Ala Phe Val Val Asp Met Met Glu Arg Leu Arg Ile Ser Gln Lys
1295 1300 1305
Trp Val Arg Val Ala Val Val Glu Tyr His Asp Gly Ser His Ala
1310 1315 1320
Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg
1325 1330 1335
Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln Val Ala Ser Thr
1340 1345 1350
Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile Phe Ser Lys Ile
1355 1360 1365
Asp Arg Pro Glu Ala Ser Arg Ile Ala Leu Leu Leu Met Ala Ser
1370 1375 1380
Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val Arg Tyr Val Gln
1385 1390 1395
Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro Val Gly Ile Gly
1400 1405 1410
Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile Glu Lys Gln Ala
1415 1420 1425
Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val Asp Glu Leu Glu
1430 1435 1440
Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys Asp Leu Ala Pro
1445 1450 1455
Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met Ala Gln Val Thr
1460 1465 1470
Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu Gly Pro Lys Arg
1475 1480 1485
Asn Ser Met Val Leu Asp Val Ala Phe Val Leu Glu Gly Ser Asp
1490 1495 1500
Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys Glu Phe Met Glu
1505 1510 1515
Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp Ser Ile His Val
1520 1525 1530
Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val Glu Tyr Pro Phe
1535 1540 1545
Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln Arg Val Arg Glu
1550 1555 1560
Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr Gly Leu Ala Leu
1565 1570 1575
Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser Gln Gly Asp Arg
1580 1585 1590
Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr Gly Asn Pro Ala
1595 1600 1605
Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile Gln Val Val Pro
1610 1615 1620
Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu Leu Glu Arg Ile
1625 1630 1635
Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp Phe Glu Thr Leu
1640 1645 1650
Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg Cys Cys Ser Gly
1655 1660 1665
Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala Pro Asp Cys Ser
1670 1675 1680
Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly Ser Ser Ser Phe
1685 1690 1695
Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe Ala Lys Ala Phe
1700 1705 1710
Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr Gln Val Ser Val
1715 1720 1725
Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val Pro Trp Asn Val
1730 1735 1740
Val Pro Glu Lys Ala His Leu Leu Ser Leu Val Asp Val Met Gln
1745 1750 1755
Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala Leu Gly Phe Ala
1760 1765 1770
Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala Arg Pro Gly Ala
1775 1780 1785
Ser Lys Ala Val Val Ile Leu Val Thr Asp Val Ser Val Asp Ser
1790 1795 1800
Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn Arg Val Thr Val
1805 1810 1815
Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala Ala Gln Leu Arg
1820 1825 1830
Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val Val Lys Leu Gln
1835 1840 1845
Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu Gly Asn Ser Phe
1850 1855 1860
Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile Cys Met Asp Glu
1865 1870 1875
Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp Thr Leu Pro Asp
1880 1885 1890
Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly Gln Thr Leu Leu
1895 1900 1905
Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu Arg Pro Ser Cys
1910 1915 1920
Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu Thr Cys Gly Cys
1925 1930 1935
Arg Trp Thr Cys Pro Xaa Val Cys Thr Gly Ser Ser Thr Arg His
1940 1945 1950
Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu Thr Gly Ser Cys
1955 1960 1965
Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp Leu Glu Val Ile
1970 1975 1980
Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg Gln Gly Cys Met
1985 1990 1995
Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser Val Glu Xaa His
2000 2005 2010
Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu Val Ser Val Pro
2015 2020 2025
Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr Gly Ala Ile Met
2030 2035 2040
His Glu Val Arg Phe Asn His Leu Gly His Ile Phe Thr Phe Thr
2045 2050 2055
Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser Pro Lys Thr Phe
2060 2065 2070
Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys Asp Glu Asn Gly
2075 2080 2085
Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val Thr Thr Asp Trp
2090 2095 2100
Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg Pro Gly Gln Thr
2105 2110 2115
Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val Pro Asp Ser Ser
2120 2125 2130
His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala Glu Cys His Lys
2135 2140 2145
Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys Gln Gln Asp Ser
2150 2155 2160
Cys His Gln Glu Gln Val Cys Glu Val Ile Ala Ser Tyr Ala His
2165 2170 2175
Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp Arg Thr Pro Asp
2180 2185 2190
Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val Tyr Asn His Cys
2195 2200 2205
Glu His Gly Cys Pro Arg His Cys Asp Gly Asn Val Ser Ser Cys
2210 2215 2220
Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro Pro Asp Lys Val
2225 2230 2235
Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala Cys Thr Gln Cys
2240 2245 2250
Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu Glu Ala Trp Val
2255 2260 2265
Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys Leu Ser Gly Arg
2270 2275 2280
Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr Ala Lys Ala Pro
2285 2290 2295
Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg Gln Asn Ala Asp
2300 2305 2310
Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp Pro Val Ser Cys
2315 2320 2325
Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly Leu Gln Pro Thr
2330 2335 2340
Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe Thr Cys Ala Cys
2345 2350 2355
Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro Ser Cys Pro Pro
2360 2365 2370
His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys Cys Asp Glu Tyr
2375 2380 2385
Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val Ser Cys Pro Leu
2390 2395 2400
Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys Gly Cys Thr Thr
2405 2410 2415
Thr Thr Cys Leu Pro Asp Lys Val Cys Val His Arg Ser Thr Ile
2420 2425 2430
Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys Asp Val Cys Thr
2435 2440 2445
Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu Arg Val Ala Gln
2450 2455 2460
Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg Ser Gly Phe Thr
2465 2470 2475
Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg Cys Leu Pro Ser
2480 2485 2490
Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly Asp Ser Gln Ser
2495 2500 2505
Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser Pro Glu Asn Pro
2510 2515 2520
Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu Glu Val Phe Ile
2525 2530 2535
Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu Val Pro Val Cys
2540 2545 2550
Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser Ala Cys Cys Pro
2555 2560 2565
Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met Leu Asn Gly Thr
2570 2575 2580
Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp Val Cys Thr Thr
2585 2590 2595
Cys Arg Cys Met Val Gln Val Gly Val Ile Ser Gly Phe Lys Leu
2600 2605 2610
Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro Leu Gly Tyr Lys
2615 2620 2625
Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg Cys Leu Pro Thr
2630 2635 2640
Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile Met Thr Leu Lys
2645 2650 2655
Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr His Phe Cys Lys
2660 2665 2670
Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys Arg Val Thr Gly
2675 2680 2685
Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala Glu Gly Gly Lys
2690 2695 2700
Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr Cys Glu Glu Pro
2705 2710 2715
Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly
2720 2725 2730
Ser Cys Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly
2735 2740 2745
Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val
2750 2755 2760
Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met
2765 2770 2775
Gln Val Ala Leu His Cys Thr Asn Gly Ser Val Val Tyr His Glu
2780 2785 2790
Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro Arg Lys Cys Ser
2795 2800 2805
Lys
<210> 130
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> AE36
<400> 130
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
20 25 30
Ser Glu Thr Pro
35
<210> 131
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> AE42
<400> 131
Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser
35 40
<210> 132
<211> 78
<212> PRT
<213> 人工序列
<220>
<223> AE72
<400> 132
Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
1 5 10 15
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
20 25 30
Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu
35 40 45
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr
50 55 60
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser
65 70 75
<210> 133
<211> 78
<212> PRT
<213> 人工序列
<220>
<223> AE78
<400> 133
Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
1 5 10 15
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
20 25 30
Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu
35 40 45
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr
50 55 60
Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser
65 70 75
<210> 134
<211> 143
<212> PRT
<213> 人工序列
<220>
<223> AE144
<400> 134
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
20 25 30
Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
50 55 60
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly
65 70 75 80
Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
100 105 110
Ser Ala Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
115 120 125
Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
<210> 135
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> AE144_6B
<400> 135
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala
100 105 110
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 136
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> AG144
<400> 136
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
1 5 10 15
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
35 40 45
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro
50 55 60
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
65 70 75 80
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
85 90 95
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
100 105 110
Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala
115 120 125
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
130 135 140
<210> 137
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> AG144_A
<400> 137
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 138
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> AE288
<400> 138
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
1 5 10 15
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
20 25 30
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
35 40 45
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
65 70 75 80
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
100 105 110
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr
115 120 125
Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
145 150 155 160
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro
165 170 175
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
180 185 190
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro
195 200 205
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr
210 215 220
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
245 250 255
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
275 280 285
<210> 139
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> AE288_2
<400> 139
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
20 25 30
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
65 70 75 80
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
85 90 95
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
100 105 110
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
115 120 125
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
145 150 155 160
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
165 170 175
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
225 230 235 240
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
245 250 255
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
275 280 285
<210> 140
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> AG288
<400> 140
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
1 5 10 15
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
20 25 30
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
35 40 45
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
50 55 60
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
65 70 75 80
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
85 90 95
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
100 105 110
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser
115 120 125
Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
130 135 140
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
145 150 155 160
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser
165 170 175
Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
180 185 190
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
195 200 205
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly
210 215 220
Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
225 230 235 240
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser
245 250 255
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
260 265 270
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
275 280 285
<210> 141
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> AE576
<400> 141
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu
20 25 30
Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
65 70 75 80
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala
100 105 110
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
115 120 125
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
145 150 155 160
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
165 170 175
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
245 250 255
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
275 280 285
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
290 295 300
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
305 310 315 320
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
325 330 335
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
340 345 350
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
355 360 365
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
370 375 380
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
385 390 395 400
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
405 410 415
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
420 425 430
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
435 440 445
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
450 455 460
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
465 470 475 480
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
485 490 495
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
500 505 510
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
515 520 525
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
530 535 540
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
545 550 555 560
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
565 570 575
<210> 142
<211> 576
<212> PRT
<213> 人工序列
<220>
<223> AG576
<400> 142
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser
1 5 10 15
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser
20 25 30
Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly
35 40 45
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
50 55 60
Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
65 70 75 80
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
85 90 95
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
100 105 110
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser
115 120 125
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
130 135 140
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser
145 150 155 160
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
165 170 175
Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
180 185 190
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser
195 200 205
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly
210 215 220
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
225 230 235 240
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
245 250 255
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
260 265 270
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
275 280 285
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
290 295 300
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser
305 310 315 320
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
325 330 335
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser
340 345 350
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
355 360 365
Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
370 375 380
Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro
385 390 395 400
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
405 410 415
Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
420 425 430
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro
435 440 445
Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly
450 455 460
Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
465 470 475 480
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser
485 490 495
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser
500 505 510
Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
515 520 525
Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser
530 535 540
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser
545 550 555 560
Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser
565 570 575
<210> 143
<211> 864
<212> PRT
<213> 人工序列
<220>
<223> AE864
<400> 143
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
1 5 10 15
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu
20 25 30
Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
35 40 45
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
50 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
65 70 75 80
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
85 90 95
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala
100 105 110
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
115 120 125
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
130 135 140
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
145 150 155 160
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
165 170 175
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
180 185 190
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
195 200 205
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
210 215 220
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
225 230 235 240
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
245 250 255
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
260 265 270
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
275 280 285
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
290 295 300
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
305 310 315 320
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
325 330 335
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
340 345 350
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
355 360 365
Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
370 375 380
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
385 390 395 400
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
405 410 415
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
420 425 430
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
435 440 445
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
450 455 460
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
465 470 475 480
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
485 490 495
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro
500 505 510
Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
515 520 525
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
530 535 540
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
545 550 555 560
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
565 570 575
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
580 585 590
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
595 600 605
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
610 615 620
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
625 630 635 640
Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr
645 650 655
Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
660 665 670
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
675 680 685
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr
690 695 700
Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
705 710 715 720
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu
725 730 735
Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro
740 745 750
Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
755 760 765
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro
770 775 780
Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr
785 790 795 800
Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
805 810 815
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro
820 825 830
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
835 840 845
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
850 855 860
<210> 144
<211> 864
<212> PRT
<213> 人工序列
<220>
<223> AG864
<400> 144
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
145 150 155 160
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
165 170 175
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
180 185 190
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
195 200 205
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
210 215 220
Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
225 230 235 240
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro
245 250 255
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
260 265 270
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
275 280 285
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro
290 295 300
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
305 310 315 320
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
325 330 335
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
340 345 350
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
355 360 365
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
370 375 380
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
385 390 395 400
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
405 410 415
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
420 425 430
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
435 440 445
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
450 455 460
Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
465 470 475 480
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro
485 490 495
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
500 505 510
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
515 520 525
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro
530 535 540
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
545 550 555 560
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
565 570 575
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
580 585 590
Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala
595 600 605
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
610 615 620
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
625 630 635 640
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
645 650 655
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
660 665 670
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro
675 680 685
Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala
690 695 700
Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
705 710 715 720
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
725 730 735
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
740 745 750
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
755 760 765
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
770 775 780
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
785 790 795 800
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
805 810 815
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
820 825 830
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
835 840 845
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
850 855 860
<210> 145
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_2A_1
<400> 145
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
1 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 146
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_2A_2
<400> 146
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser
50 55 60
Ala Thr Pro Glu Ser Gly Pro Gly
65 70
<210> 147
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_3B_1
<400> 147
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 148
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_3B_2
<400> 148
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
1 5 10 15
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 149
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_4A_2
<400> 149
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly
1 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser
20 25 30
Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 150
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_5A_2
<400> 150
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
50 55 60
Ser Pro Thr Ser Thr Glu Glu Gly
65 70
<210> 151
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_6B_1
<400> 151
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly
65 70
<210> 152
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_6B_2
<400> 152
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
1 5 10 15
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 153
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_1A_1
<400> 153
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 154
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE72_1A_2
<400> 154
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly
65 70
<210> 155
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN_AE144_1A
<400> 155
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
85 90 95
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly
100 105 110
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 156
<211> 150
<212> PRT
<213> 人工序列
<220>
<223> AE150
<400> 156
Gly Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
1 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
35 40 45
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
50 55 60
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
65 70 75 80
Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
85 90 95
Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
100 105 110
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
115 120 125
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
130 135 140
Ser Ala Pro Ala Ser Ser
145 150
<210> 157
<211> 150
<212> PRT
<213> 人工序列
<220>
<223> G150
<400> 157
Gly Ala Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly
1 5 10 15
Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser
20 25 30
Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly
35 40 45
Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly
50 55 60
Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro
65 70 75 80
Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly
85 90 95
Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly
100 105 110
Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser
115 120 125
Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr
130 135 140
Gly Ser Pro Ala Ser Ser
145 150
<210> 158
<211> 294
<212> PRT
<213> 人工序列
<220>
<223> AE294
<400> 158
Gly Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
1 5 10 15
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
20 25 30
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
35 40 45
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
50 55 60
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
65 70 75 80
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
85 90 95
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
100 105 110
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly
115 120 125
Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser
130 135 140
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
145 150 155 160
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser
165 170 175
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
180 185 190
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
195 200 205
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly
210 215 220
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
225 230 235 240
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
245 250 255
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
260 265 270
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
275 280 285
Ser Ala Pro Ala Ser Ser
290
<210> 159
<211> 294
<212> PRT
<213> 人工序列
<220>
<223> AG294
<400> 159
Gly Ala Pro Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
1 5 10 15
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly
20 25 30
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
35 40 45
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
50 55 60
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
65 70 75 80
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
85 90 95
Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
100 105 110
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
115 120 125
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
130 135 140
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
145 150 155 160
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
165 170 175
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
180 185 190
Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
195 200 205
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
210 215 220
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr
225 230 235 240
Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
245 250 255
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
260 265 270
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
275 280 285
Thr Gly Ser Ala Ser Ser
290
<210> 160
<211> 1016
<212> PRT
<213> 人工序列
<220>
<223> FIX-连接符-白蛋白
<400> 160
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro
405 410 415
Val Ser Gln Thr Ser Lys Leu Thr Arg Ala Glu Thr Val Phe Pro Asp
420 425 430
Val Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly
435 440 445
Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu
450 455 460
Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr
465 470 475 480
Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp
485 490 495
Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr
500 505 510
Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu
515 520 525
Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn
530 535 540
Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe
545 550 555 560
His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala
565 570 575
Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys
580 585 590
Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala
595 600 605
Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala
610 615 620
Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly
625 630 635 640
Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe
645 650 655
Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr
660 665 670
Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp
675 680 685
Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile
690 695 700
Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser
705 710 715 720
His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro
725 730 735
Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr
740 745 750
Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala
755 760 765
Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys
770 775 780
Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Phe Cys
785 790 795 800
Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln
805 810 815
Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr
820 825 830
Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln
835 840 845
Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val
850 855 860
Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala
865 870 875 880
Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu
885 890 895
Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu
900 905 910
Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr
915 920 925
Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile
930 935 940
Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu
945 950 955 960
Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys
965 970 975
Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala
980 985 990
Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala
995 1000 1005
Ala Ser Gln Ala Ala Leu Gly Leu
1010 1015
<210> 161
<211> 424
<212> PRT
<213> 人工序列
<220>
<223> FIX
<400> 161
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro
405 410 415
Val Ser Gln Thr Ser Lys Leu Thr
420
<210> 162
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 连接符
<400> 162
Arg Ala Glu Thr Val Phe Pro Asp Val
1 5
<210> 163
<211> 585
<212> PRT
<213> 人工序列
<220>
<223> 白蛋白
<400> 163
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575
Ala Ala Ser Gln Ala Ala Leu Gly Leu
580 585
<210> 164
<211> 763
<212> PRT
<213> 人工序列
<220>
<223> FIX(XTEN )-Fc
<400> 164
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Gly Pro Ser Pro Gly Ser Pro Thr Ser Thr Glu Glu
210 215 220
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
225 230 235 240
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
245 250 255
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
260 265 270
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser
275 280 285
Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe Thr Arg Val Val
290 295 300
Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp Gln Val Val Leu
305 310 315 320
Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile Val Asn Glu Lys
325 330 335
Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly Val Lys Ile Thr
340 345 350
Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu His Thr Glu Gln
355 360 365
Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn Tyr Asn Ala Ala
370 375 380
Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu Leu Asp Glu Pro
385 390 395 400
Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile Ala Asp Lys Glu
405 410 415
Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr Val Ser Gly Trp
420 425 430
Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val Leu Gln Tyr Leu
435 440 445
Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu Ser Thr Lys Phe
450 455 460
Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His Glu Gly Gly Arg
465 470 475 480
Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val Thr Glu Val Glu
485 490 495
Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly Glu Glu Cys Ala
500 505 510
Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser Arg Tyr Val Asn
515 520 525
Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr His Thr Cys Pro
530 535 540
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
545 550 555 560
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
565 570 575
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
580 585 590
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
595 600 605
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
610 615 620
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
625 630 635 640
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
645 650 655
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
660 665 670
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
675 680 685
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
690 695 700
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
705 710 715 720
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
725 730 735
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
740 745 750
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
755 760
<210> 165
<211> 712
<212> PRT
<213> 人工序列
<220>
<223> FIX-FXIa-AE288
<400> 165
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly
405 410 415
Lys Leu Thr Arg Ala Glu Thr Gly Gly Thr Ser Glu Ser Ala Thr Pro
420 425 430
Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
435 440 445
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro
450 455 460
Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
465 470 475 480
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
485 490 495
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu
500 505 510
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
515 520 525
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
530 535 540
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala
545 550 555 560
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu
565 570 575
Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
580 585 590
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu
595 600 605
Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly
610 615 620
Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
625 630 635 640
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr
645 650 655
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
660 665 670
Gly Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
675 680 685
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr
690 695 700
Glu Pro Ser Glu Gly Ser Ala Pro
705 710
<210> 166
<211> 944
<212> PRT
<213> 人工序列
<220>
<223> FIX-Fc-Fc
<400> 166
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr
450 455 460
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
465 470 475 480
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
485 490 495
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
500 505 510
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
515 520 525
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
530 535 540
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
545 550 555 560
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
565 570 575
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
580 585 590
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
595 600 605
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
610 615 620
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
625 630 635 640
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
645 650 655
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
660 665 670
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
675 680 685
Arg Arg Arg Arg Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
690 695 700
Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg Arg Arg Arg Asp Lys Thr
705 710 715 720
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
725 730 735
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
740 745 750
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
755 760 765
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
770 775 780
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
785 790 795 800
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
805 810 815
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
820 825 830
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
835 840 845
Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
850 855 860
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
865 870 875 880
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
885 890 895
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
900 905 910
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
915 920 925
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
930 935 940
<210> 167
<211> 383
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒B19 KY940273.1
<400> 167
ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60
aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120
cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180
gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240
ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300
taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360
tttggtgtct tcttttaaat ttt 383
<210> 168
<211> 248
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒B19 d135
<400> 168
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaatttt 248
<210> 169
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒v1 AAV2
<400> 169
cggcgcgccg cttgatctta gtggcacgtc aaccagcgct ggcccagagc caaccctaat 60
tccggaagtc ctcagtccgc catcttgccc gcctaccggc ggcgaccggc ggcatcattt 120
ggtgttctt 129
<210> 170
<211> 113
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒V2
<400> 170
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagtgtct tcttttaaat ttt 113
<210> 171
<211> 340
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒V3
<400> 171
caaatcagat gccgccggtc gccgccggta ggcgggactt ccggtacaag atggcggaca 60
attacgtcat ttcctgtgac gtatttcctg tgacgtactt ccggtggcgg gacttccgga 120
attttggctc tgggccagct tgcttggggt tgccttgacc aagcgcgcgc cgcttgatca 180
ccccaagcgc tggcccagag ccacctaacc ggaagtcccc ccaccggaag tgacgtcaca 240
ggaaagacgt cacaggaagt aattgtccgc catcttgtac cggaagtccc gcaccggcgg 300
cgaccggcgg catctgattt ggtgtcttct tttaaatttt 340
<210> 172
<211> 444
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒U25749.1
<400> 172
ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60
tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120
gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180
tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240
accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300
cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360
cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420
ggatattttg cgcgccagga agtg 444
<210> 173
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒GPV AAV2 V1
<400> 173
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tg 282
<210> 174
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒GPV AAV2 V1
<400> 174
ttgaccacgc gcatgccgcg cggtcagccc aatagttaag ccgggtgacc acacgtgaca 60
ggaagcacgg gatgtgcgtc accggaagca gtgaccgggc tggttcgaac gaacgaaccc 120
tccaactcaa ggacaagagg atatt 145
<210> 175
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒GPV V2
<400> 175
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cgactcaagg acaagaggat attttgcgcg ccaggaagtg 120
<210> 176
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒GPV V3
<400> 176
gggaacaatc aggggaagtg accggtgacg tcatgtaact tgcgtcactt cccgttcgaa 60
cgaacgaacg agactcaagg acaagaggcg cgccaggaag tg 102
<210> 177
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒AAV2 NC_001401.2
<400> 177
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 178
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 细小病毒Gtx
<400> 178
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct 130
<210> 179
<211> 6762
<212> DNA
<213> 人工序列
<220>
<223> B19-FVIII构建体
<400> 179
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaattttgc ggcaattcag tcgataacta taacggtcct aaggtagcga tttaaatacg 300
cgctctctta aggtagcccc gggacgcgtc aattgagatc tggatccggt accgaattcg 360
cggccgcctc gacgactagc gtttaattaa acgcgtgtct gtctgcacat ttcgtagagc 420
gagtgttccg atactctaat ctccctaggc aaggttcata tttgtgtagg ttacttattc 480
tccttttgtt gactaagtca ataatcagaa tcagcaggtt tggagtcagc ttggcaggga 540
tcagcagcct gggttggaag gagggggtat aaaagcccct tcaccaggag aagccgtcac 600
acagatccac aagctcctga ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt 660
acgggttatg gcccttgcgt gccttgaatt actgacactg acatccactt tttctttttc 720
tccacagcta gcgccaccat gcagattgag ctgtccactt gtttcttcct gtgcctcctg 780
cgcttctgtt tctccgccac tcgccggtac taccttggag ccgtggagct ttcatgggac 840
tacatgcaga gcgacctggg cgaactcccc gtggatgcca gattcccccc ccgcgtgcca 900
aagtccttcc cctttaacac ctccgtggtg tacaagaaaa ccctctttgt cgagttcact 960
gaccacctgt tcaacatcgc caagccgcgc ccaccttgga tgggcctcct gggaccgacc 1020
attcaagctg aagtgtacga caccgtggtg atcaccctga agaacatggc gtcccacccc 1080
gtgtccctgc atgcggtcgg agtgtcctac tggaaggcct ccgaaggagc tgagtacgac 1140
gaccagacta gccagcggga aaaggaggac gataaagtgt tcccgggcgg ctcgcatact 1200
tacgtgtggc aagtcctgaa ggaaaacgga cctatggcat ccgatcctct gtgcctgact 1260
tactcctacc tttcccatgt ggacctcgtg aaggacctga acagcgggct gattggtgca 1320
cttctcgtgt gccgcgaagg ttcgctcgct aaggaaaaga cccagaccct ccataagttc 1380
atccttttgt tcgctgtgtt cgatgaagga aagtcatggc attccgaaac taagaactcg 1440
ctgatgcagg accgggatgc cgcctcagcc cgcgcctggc ctaaaatgca tacagtcaac 1500
ggatacgtga atcggtcact gcccgggctc atcggttgtc acagaaagtc cgtgtactgg 1560
cacgtcatcg gcatgggcac tacgcctgaa gtgcactcca tcttcctgga agggcacacc 1620
ttcctcgtgc gcaaccaccg ccaggcctct ctggaaatct ccccgattac ctttctgacc 1680
gcccagactc tgctcatgga cctggggcag ttccttctct tctgccacat ctccagccat 1740
cagcacgacg gaatggaggc ctacgtgaag gtggactcat gcccggaaga acctcagttg 1800
cggatgaaga acaacgagga ggccgaggac tatgacgacg atttgactga ctccgagatg 1860
gacgtcgtgc ggttcgatga cgacaacagc cccagcttca tccagattcg cagcgtggcc 1920
aagaagcacc ccaaaacctg ggtgcactac atcgcggccg aggaagaaga ttgggactac 1980
gccccgttgg tgctggcacc cgatgaccgg tcgtacaagt cccagtatct gaacaatggt 2040
ccgcagcgga ttggcagaaa gtacaagaaa gtgcggttca tggcgtacac tgacgaaacg 2100
tttaagaccc gggaggccat tcaacatgag agcggcattc tgggaccact gctgtacgga 2160
gaggtcggcg ataccctgct catcatcttc aaaaaccagg cctcccggcc ttacaacatc 2220
taccctcacg gaatcaccga cgtgcggcca ctctactcgc ggcgcctgcc gaagggcgtc 2280
aagcacctga aagacttccc tatcctgccg ggcgaaatct tcaagtataa gtggaccgtc 2340
accgtggagg acgggcccac caagagcgat cctaggtgtc tgactcggta ctactccagc 2400
ttcgtgaaca tggaacggga cctggcatcg ggactcattg gaccgctgct gatctgctac 2460
aaagagtcgg tggatcaacg cggcaaccag atcatgtccg acaagcgcaa cgtgatcctg 2520
ttctccgtgt ttgatgaaaa cagatcctgg tacctcactg aaaacatcca gaggttcctc 2580
ccaaaccccg caggagtgca actggaggac cctgagtttc aggcctcgaa tatcatgcac 2640
tcgattaacg gttacgtgtt cgactcgctg caactgagcg tgtgcctcca tgaagtcgct 2700
tactggtaca ttctgtccat cggcgcccag actgacttcc tgagcgtgtt cttttccggt 2760
tacaccttta agcacaagat ggtgtacgaa gataccctga ccctgttccc tttctccggc 2820
gaaacggtgt tcatgtcgat ggagaacccg ggtctgtgga ttctgggatg ccacaacagc 2880
gactttcgga accgcggaat gactgccctg ctgaaggtgt cctcatgcga caagaacacc 2940
ggagactact acgaggactc ctacgaggat atctcagcct acctcctgtc caagaacaac 3000
gcgatcgagc cgcgcagctt cagccagaac ggcgcgccaa catcagagag cgccacccct 3060
gaaagtggtc ccgggagcga gccagccaca tctgggtcgg aaacgccagg cacaagtgag 3120
tctgcaactc ccgagtccgg acctggctcc gagcctgcca ctagcggctc cgagactccg 3180
ggaacttccg agagcgctac accagaaagc ggacccggaa ccagtaccga acctagcgag 3240
ggctctgctc cgggcagccc agccggctct cctacatcca cggaggaggg cacttccgaa 3300
tccgccaccc cggagtcagg gccaggatct gaacccgcta cctcaggcag tgagacgcca 3360
ggaacgagcg agtccgctac accggagagt gggccaggga gccctgctgg atctcctacg 3420
tccactgagg aagggtcacc agcgggctcg cccaccagca ctgaagaagg tgcctcgagc 3480
ccgcctgtgc tgaagaggca ccagcgagaa attacccgga ccaccctcca atcggatcag 3540
gaggaaatcg actacgacga caccatctcg gtggaaatga agaaggaaga tttcgatatc 3600
tacgacgagg acgaaaatca gtcccctcgc tcattccaaa agaaaactag acactacttt 3660
atcgccgcgg tggaaagact gtgggactat ggaatgtcat ccagccctca cgtccttcgg 3720
aaccgggccc agagcggatc ggtgcctcag ttcaagaaag tggtgttcca ggagttcacc 3780
gacggcagct tcacccagcc gctgtaccgg ggagaactga acgaacacct gggcctgctc 3840
ggtccctaca tccgcgcgga agtggaggat aacatcatgg tgaccttccg taaccaagca 3900
tccagacctt actccttcta ttcctccctg atctcatacg aggaggacca gcgccaaggc 3960
gccgagcccc gcaagaactt cgtcaagccc aacgagacta agacctactt ctggaaggtc 4020
caacaccata tggccccgac caaggatgag tttgactgca aggcctgggc ctacttctcc 4080
gacgtggacc ttgagaagga tgtccattcc ggcctgatcg ggccgctgct cgtgtgtcac 4140
accaacaccc tgaacccagc gcatggacgc caggtcaccg tccaggagtt tgctctgttc 4200
ttcaccattt ttgacgaaac taagtcctgg tacttcaccg agaatatgga gcgaaactgt 4260
agagcgccct gcaatatcca gatggaagat ccgactttca aggagaacta tagattccac 4320
gccatcaacg ggtacatcat ggatactctg ccggggctgg tcatggccca ggatcagagg 4380
attcggtggt acttgctgtc aatgggatcg aacgaaaaca ttcactccat tcacttctcc 4440
ggtcacgtgt tcactgtgcg caagaaggag gagtacaaga tggcgctgta caatctgtac 4500
cccggggtgt tcgaaactgt ggagatgctg ccgtccaagg ccggcatctg gagagtggag 4560
tgcctgatcg gagagcacct ccacgcgggg atgtccaccc tcttcctggt gtactcgaat 4620
aagtgccaga ccccgctggg catggcctcg ggccacatca gagacttcca gatcacagca 4680
agcggacaat acggccaatg ggcgccgaag ctggcccgct tgcactactc cggatcgatc 4740
aacgcatggt ccaccaagga accgttctcg tggattaagg tggacctcct ggcccctatg 4800
attatccacg gaattaagac ccagggcgcc aggcagaagt tctcctccct gtacatctcg 4860
caattcatca tcatgtacag cctggacggg aagaagtggc agacttacag gggaaactcc 4920
accggcaccc tgatggtctt tttcggcaac gtggattcct ccggcattaa gcacaacatc 4980
ttcaacccac cgatcatagc cagatatatt aggctccacc ccactcacta ctcaatccgc 5040
tcaactcttc ggatggaact catggggtgc gacctgaact cctgctccat gccgttgggg 5100
atggaatcaa aggctattag cgacgcccag atcaccgcga gctcctactt cactaacatg 5160
ttcgccacct ggagcccctc caaggccagg ctgcacttgc agggacggtc aaatgcctgg 5220
cggccgcaag tgaacaatcc gaaggaatgg cttcaagtgg atttccaaaa gaccatgaaa 5280
gtgaccggag tcaccaccca gggagtgaag tcccttctga cctcgatgta tgtgaaggag 5340
ttcctgatta gcagcagcca ggacgggcac cagtggaccc tgttcttcca aaacggaaag 5400
gtcaaggtgt tccaggggaa ccaggactcg ttcacacccg tggtgaactc cctggacccc 5460
ccactgctga cgcggtactt gaggattcat cctcagtcct gggtccatca gattgcattg 5520
cgaatggaag tcctgggctg cgaggcccag gacctgtact gaatcagcct gagctcgctg 5580
atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 5640
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 5700
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 5760
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 5820
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 5880
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 5940
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 6000
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 6060
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 6120
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgctgatca 6180
gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 6240
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 6300
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 6360
gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 6420
gcggaaagaa cgggctcgag aagcttctag atatcctctc ttaaggtagc atcgagattt 6480
aaattaggga taacagggta atggcgcggg ccgcaaaatt taaaagaaga caccaaatca 6540
gatgccgccg gtcgccgccg gtaggcggga cttccggtac aagatggcgg acaattacgt 6600
catttcctgt gacgtcattt cctgtgacgt cacttccggt gggcgggact tccggaatta 6660
gggttggctc tgggccagcg cttggggttg acgtgccact aagatcaagc ggcgcgccgc 6720
ttgtcttagt gtcaaggcaa ccccaagcaa gctggcccag ag 6762
<210> 180
<211> 248
<212> DNA
<213> 人工序列
<220>
<223> 5' ITR
<400> 180
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaatttt 248
<210> 181
<211> 248
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 181
aaaatttaaa agaagacacc aaatcagatg ccgccggtcg ccgccggtag gcgggacttc 60
cggtacaaga tggcggacaa ttacgtcatt tcctgtgacg tcatttcctg tgacgtcact 120
tccggtgggc gggacttccg gaattagggt tggctctggg ccagcgcttg gggttgacgt 180
gccactaaga tcaagcggcg cgccgcttgt cttagtgtca aggcaacccc aagcaagctg 240
gcccagag 248
<210> 182
<211> 6830
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 182
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tggcggcaat tcagtcgata 300
actataacgg tcctaaggta gcgatttaaa tacgcgctct cttaaggtag ccccgggacg 360
cgtcaattga gatctggatc cggtaccgaa ttcgcggccg cctcgacgac tagcgtttaa 420
ttaaacgcgt gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct 480
aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc 540
agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg 600
gtataaaagc cccttcacca ggagaagccg tcacacagat ccacaagctc ctgaggtaag 660
tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt gcgtgccttg 720
aattactgac actgacatcc actttttctt tttctccaca gctagcgcca ccatgcagat 780
tgagctgtcc acttgtttct tcctgtgcct cctgcgcttc tgtttctccg ccactcgccg 840
gtactacctt ggagccgtgg agctttcatg ggactacatg cagagcgacc tgggcgaact 900
ccccgtggat gccagattcc ccccccgcgt gccaaagtcc ttccccttta acacctccgt 960
ggtgtacaag aaaaccctct ttgtcgagtt cactgaccac ctgttcaaca tcgccaagcc 1020
gcgcccacct tggatgggcc tcctgggacc gaccattcaa gctgaagtgt acgacaccgt 1080
ggtgatcacc ctgaagaaca tggcgtccca ccccgtgtcc ctgcatgcgg tcggagtgtc 1140
ctactggaag gcctccgaag gagctgagta cgacgaccag actagccagc gggaaaagga 1200
ggacgataaa gtgttcccgg gcggctcgca tacttacgtg tggcaagtcc tgaaggaaaa 1260
cggacctatg gcatccgatc ctctgtgcct gacttactcc tacctttccc atgtggacct 1320
cgtgaaggac ctgaacagcg ggctgattgg tgcacttctc gtgtgccgcg aaggttcgct 1380
cgctaaggaa aagacccaga ccctccataa gttcatcctt ttgttcgctg tgttcgatga 1440
aggaaagtca tggcattccg aaactaagaa ctcgctgatg caggaccggg atgccgcctc 1500
agcccgcgcc tggcctaaaa tgcatacagt caacggatac gtgaatcggt cactgcccgg 1560
gctcatcggt tgtcacagaa agtccgtgta ctggcacgtc atcggcatgg gcactacgcc 1620
tgaagtgcac tccatcttcc tggaagggca caccttcctc gtgcgcaacc accgccaggc 1680
ctctctggaa atctccccga ttacctttct gaccgcccag actctgctca tggacctggg 1740
gcagttcctt ctcttctgcc acatctccag ccatcagcac gacggaatgg aggcctacgt 1800
gaaggtggac tcatgcccgg aagaacctca gttgcggatg aagaacaacg aggaggccga 1860
ggactatgac gacgatttga ctgactccga gatggacgtc gtgcggttcg atgacgacaa 1920
cagccccagc ttcatccaga ttcgcagcgt ggccaagaag caccccaaaa cctgggtgca 1980
ctacatcgcg gccgaggaag aagattggga ctacgccccg ttggtgctgg cacccgatga 2040
ccggtcgtac aagtcccagt atctgaacaa tggtccgcag cggattggca gaaagtacaa 2100
gaaagtgcgg ttcatggcgt acactgacga aacgtttaag acccgggagg ccattcaaca 2160
tgagagcggc attctgggac cactgctgta cggagaggtc ggcgataccc tgctcatcat 2220
cttcaaaaac caggcctccc ggccttacaa catctaccct cacggaatca ccgacgtgcg 2280
gccactctac tcgcggcgcc tgccgaaggg cgtcaagcac ctgaaagact tccctatcct 2340
gccgggcgaa atcttcaagt ataagtggac cgtcaccgtg gaggacgggc ccaccaagag 2400
cgatcctagg tgtctgactc ggtactactc cagcttcgtg aacatggaac gggacctggc 2460
atcgggactc attggaccgc tgctgatctg ctacaaagag tcggtggatc aacgcggcaa 2520
ccagatcatg tccgacaagc gcaacgtgat cctgttctcc gtgtttgatg aaaacagatc 2580
ctggtacctc actgaaaaca tccagaggtt cctcccaaac cccgcaggag tgcaactgga 2640
ggaccctgag tttcaggcct cgaatatcat gcactcgatt aacggttacg tgttcgactc 2700
gctgcaactg agcgtgtgcc tccatgaagt cgcttactgg tacattctgt ccatcggcgc 2760
ccagactgac ttcctgagcg tgttcttttc cggttacacc tttaagcaca agatggtgta 2820
cgaagatacc ctgaccctgt tccctttctc cggcgaaacg gtgttcatgt cgatggagaa 2880
cccgggtctg tggattctgg gatgccacaa cagcgacttt cggaaccgcg gaatgactgc 2940
cctgctgaag gtgtcctcat gcgacaagaa caccggagac tactacgagg actcctacga 3000
ggatatctca gcctacctcc tgtccaagaa caacgcgatc gagccgcgca gcttcagcca 3060
gaacggcgcg ccaacatcag agagcgccac ccctgaaagt ggtcccggga gcgagccagc 3120
cacatctggg tcggaaacgc caggcacaag tgagtctgca actcccgagt ccggacctgg 3180
ctccgagcct gccactagcg gctccgagac tccgggaact tccgagagcg ctacaccaga 3240
aagcggaccc ggaaccagta ccgaacctag cgagggctct gctccgggca gcccagccgg 3300
ctctcctaca tccacggagg agggcacttc cgaatccgcc accccggagt cagggccagg 3360
atctgaaccc gctacctcag gcagtgagac gccaggaacg agcgagtccg ctacaccgga 3420
gagtgggcca gggagccctg ctggatctcc tacgtccact gaggaagggt caccagcggg 3480
ctcgcccacc agcactgaag aaggtgcctc gagcccgcct gtgctgaaga ggcaccagcg 3540
agaaattacc cggaccaccc tccaatcgga tcaggaggaa atcgactacg acgacaccat 3600
ctcggtggaa atgaagaagg aagatttcga tatctacgac gaggacgaaa atcagtcccc 3660
tcgctcattc caaaagaaaa ctagacacta ctttatcgcc gcggtggaaa gactgtggga 3720
ctatggaatg tcatccagcc ctcacgtcct tcggaaccgg gcccagagcg gatcggtgcc 3780
tcagttcaag aaagtggtgt tccaggagtt caccgacggc agcttcaccc agccgctgta 3840
ccggggagaa ctgaacgaac acctgggcct gctcggtccc tacatccgcg cggaagtgga 3900
ggataacatc atggtgacct tccgtaacca agcatccaga ccttactcct tctattcctc 3960
cctgatctca tacgaggagg accagcgcca aggcgccgag ccccgcaaga acttcgtcaa 4020
gcccaacgag actaagacct acttctggaa ggtccaacac catatggccc cgaccaagga 4080
tgagtttgac tgcaaggcct gggcctactt ctccgacgtg gaccttgaga aggatgtcca 4140
ttccggcctg atcgggccgc tgctcgtgtg tcacaccaac accctgaacc cagcgcatgg 4200
acgccaggtc accgtccagg agtttgctct gttcttcacc atttttgacg aaactaagtc 4260
ctggtacttc accgagaata tggagcgaaa ctgtagagcg ccctgcaata tccagatgga 4320
agatccgact ttcaaggaga actatagatt ccacgccatc aacgggtaca tcatggatac 4380
tctgccgggg ctggtcatgg cccaggatca gaggattcgg tggtacttgc tgtcaatggg 4440
atcgaacgaa aacattcact ccattcactt ctccggtcac gtgttcactg tgcgcaagaa 4500
ggaggagtac aagatggcgc tgtacaatct gtaccccggg gtgttcgaaa ctgtggagat 4560
gctgccgtcc aaggccggca tctggagagt ggagtgcctg atcggagagc acctccacgc 4620
ggggatgtcc accctcttcc tggtgtactc gaataagtgc cagaccccgc tgggcatggc 4680
ctcgggccac atcagagact tccagatcac agcaagcgga caatacggcc aatgggcgcc 4740
gaagctggcc cgcttgcact actccggatc gatcaacgca tggtccacca aggaaccgtt 4800
ctcgtggatt aaggtggacc tcctggcccc tatgattatc cacggaatta agacccaggg 4860
cgccaggcag aagttctcct ccctgtacat ctcgcaattc atcatcatgt acagcctgga 4920
cgggaagaag tggcagactt acaggggaaa ctccaccggc accctgatgg tctttttcgg 4980
caacgtggat tcctccggca ttaagcacaa catcttcaac ccaccgatca tagccagata 5040
tattaggctc caccccactc actactcaat ccgctcaact cttcggatgg aactcatggg 5100
gtgcgacctg aactcctgct ccatgccgtt ggggatggaa tcaaaggcta ttagcgacgc 5160
ccagatcacc gcgagctcct acttcactaa catgttcgcc acctggagcc cctccaaggc 5220
caggctgcac ttgcagggac ggtcaaatgc ctggcggccg caagtgaaca atccgaagga 5280
atggcttcaa gtggatttcc aaaagaccat gaaagtgacc ggagtcacca cccagggagt 5340
gaagtccctt ctgacctcga tgtatgtgaa ggagttcctg attagcagca gccaggacgg 5400
gcaccagtgg accctgttct tccaaaacgg aaaggtcaag gtgttccagg ggaaccagga 5460
ctcgttcaca cccgtggtga actccctgga ccccccactg ctgacgcggt acttgaggat 5520
tcatcctcag tcctgggtcc atcagattgc attgcgaatg gaagtcctgg gctgcgaggc 5580
ccaggacctg tactgaatca gcctgagctc gctgatcata atcaacctct ggattacaaa 5640
atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac 5700
gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc 5760
ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt 5820
ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc 5880
tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc 5940
gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg 6000
gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt 6060
ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc 6120
cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt 6180
cggatctccc tttgggccgc ctccccgctg atcagcctcg actgtgcctt ctagttgcca 6240
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 6300
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 6360
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 6420
tgctggggat gcggtgggct ctatggcttc tgaggcggaa agaacgggct cgagaagctt 6480
ctagatatcc tctcttaagg tagcatcgag atttaaatta gggataacag ggtaatggcg 6540
cgggccgcca cttcctggcg cgcaaaatat cctcttgtcc ttgagtctca ttggagggtt 6600
cgttcgttcg aaccagccaa tcaggggagg gggaagtgac gcaagttccg gtcacatgct 6660
tccggtgacg cacatccggt gacgtagttc cggtcacgtg cttcctgtca cgtgtttccg 6720
gtcacgtgac ttccggtcat gtgacttccg gtgacgtgtt tccggcttaa ctattgggct 6780
gaccgcgcgg catgcgcgtg gtcaacctaa cagccggaaa cacgtcaccg 6830
<210> 183
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> 5' ITR
<400> 183
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tg 282
<210> 184
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 184
cacttcctgg cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt 60
cgaaccagcc aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga 120
cgcacatccg gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg 180
acttccggtc atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc 240
ggcatgcgcg tggtcaacct aacagccgga aacacgtcac cg 282
<210> 185
<211> 383
<212> DNA
<213> 人工序列
<220>
<223> 5' ITR
<400> 185
ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60
aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120
cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180
gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240
ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300
taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360
tttggtgtct tcttttaaat ttt 383
<210> 186
<211> 383
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 186
aaaatttaaa agaagacacc aaatcagatg ccgccggtcg ccgccggtag gcgggacttc 60
cggtacaaga tggcggacaa ttacgtcatt tcctgtgacg tcatttcctg tgacgtcact 120
tccggtgggc gggacttccg gaattagggt tggctctggg ccagcgcttg gggttgacgt 180
gccactaaga tcaagcggcg cgccgcttgt cttagtgtca aggcaacccc aagcaagctg 240
gcccagagcc aaccctaatt ccggaagtcc cgcccaccgg aagtgacgtc acaggaaatg 300
acgtcacagg aaatgacgta attgtccgcc atcttgtacc ggaagtcccg cctaccggcg 360
gcgaccggcg gcatctgatt tgg 383
<210> 187
<211> 444
<212> DNA
<213> 人工序列
<220>
<223> 5' ITR
<400> 187
ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60
tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120
gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180
tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240
accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300
cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360
cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420
ggatattttg cgcgccagga agtg 444
<210> 188
<211> 444
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 188
cacttcctgg cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt 60
cgaaccagcc aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga 120
cgcacatccg gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg 180
acttccggtc atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc 240
ggcatgcgcg tggtcaacct aacagccgga aacacgtcac cggaagtcac atgaccggaa 300
gtcacgtgac cggaaacacg tgacaggaag cacgtgaccg gaactacgtc accggatgtg 360
cgtcaccgga agcatgtgac cggaacttgc gtcacttccc cctcccctga ttggctggtt 420
cgaacgaacg aaccctccaa tgag 444
<210> 189
<211> 7032
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 189
ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60
aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120
cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180
gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240
ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300
taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360
tttggtgtct tcttttaaat tttgcggcaa ttcagtcgat aactataacg gtcctaaggt 420
agcgatttaa atacgcgctc tcttaaggta gccccgggac gcgtcaattg agatctggat 480
ccggtaccga attcgcggcc gcctcgacga ctagcgttta attaaacgcg tgtctgtctg 540
cacatttcgt agagcgagtg ttccgatact ctaatctccc taggcaaggt tcatatttgt 600
gtaggttact tattctcctt ttgttgacta agtcaataat cagaatcagc aggtttggag 660
tcagcttggc agggatcagc agcctgggtt ggaaggaggg ggtataaaag ccccttcacc 720
aggagaagcc gtcacacaga tccacaagct cctgaggtaa gtgccgtgtg tggttcccgc 780
gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattactga cactgacatc 840
cactttttct ttttctccac agctagcgcc accatgcaga ttgagctgtc cacttgtttc 900
ttcctgtgcc tcctgcgctt ctgtttctcc gccactcgcc ggtactacct tggagccgtg 960
gagctttcat gggactacat gcagagcgac ctgggcgaac tccccgtgga tgccagattc 1020
cccccccgcg tgccaaagtc cttccccttt aacacctccg tggtgtacaa gaaaaccctc 1080
tttgtcgagt tcactgacca cctgttcaac atcgccaagc cgcgcccacc ttggatgggc 1140
ctcctgggac cgaccattca agctgaagtg tacgacaccg tggtgatcac cctgaagaac 1200
atggcgtccc accccgtgtc cctgcatgcg gtcggagtgt cctactggaa ggcctccgaa 1260
ggagctgagt acgacgacca gactagccag cgggaaaagg aggacgataa agtgttcccg 1320
ggcggctcgc atacttacgt gtggcaagtc ctgaaggaaa acggacctat ggcatccgat 1380
cctctgtgcc tgacttactc ctacctttcc catgtggacc tcgtgaagga cctgaacagc 1440
gggctgattg gtgcacttct cgtgtgccgc gaaggttcgc tcgctaagga aaagacccag 1500
accctccata agttcatcct tttgttcgct gtgttcgatg aaggaaagtc atggcattcc 1560
gaaactaaga actcgctgat gcaggaccgg gatgccgcct cagcccgcgc ctggcctaaa 1620
atgcatacag tcaacggata cgtgaatcgg tcactgcccg ggctcatcgg ttgtcacaga 1680
aagtccgtgt actggcacgt catcggcatg ggcactacgc ctgaagtgca ctccatcttc 1740
ctggaagggc acaccttcct cgtgcgcaac caccgccagg cctctctgga aatctccccg 1800
attacctttc tgaccgccca gactctgctc atggacctgg ggcagttcct tctcttctgc 1860
cacatctcca gccatcagca cgacggaatg gaggcctacg tgaaggtgga ctcatgcccg 1920
gaagaacctc agttgcggat gaagaacaac gaggaggccg aggactatga cgacgatttg 1980
actgactccg agatggacgt cgtgcggttc gatgacgaca acagccccag cttcatccag 2040
attcgcagcg tggccaagaa gcaccccaaa acctgggtgc actacatcgc ggccgaggaa 2100
gaagattggg actacgcccc gttggtgctg gcacccgatg accggtcgta caagtcccag 2160
tatctgaaca atggtccgca gcggattggc agaaagtaca agaaagtgcg gttcatggcg 2220
tacactgacg aaacgtttaa gacccgggag gccattcaac atgagagcgg cattctggga 2280
ccactgctgt acggagaggt cggcgatacc ctgctcatca tcttcaaaaa ccaggcctcc 2340
cggccttaca acatctaccc tcacggaatc accgacgtgc ggccactcta ctcgcggcgc 2400
ctgccgaagg gcgtcaagca cctgaaagac ttccctatcc tgccgggcga aatcttcaag 2460
tataagtgga ccgtcaccgt ggaggacggg cccaccaaga gcgatcctag gtgtctgact 2520
cggtactact ccagcttcgt gaacatggaa cgggacctgg catcgggact cattggaccg 2580
ctgctgatct gctacaaaga gtcggtggat caacgcggca accagatcat gtccgacaag 2640
cgcaacgtga tcctgttctc cgtgtttgat gaaaacagat cctggtacct cactgaaaac 2700
atccagaggt tcctcccaaa ccccgcagga gtgcaactgg aggaccctga gtttcaggcc 2760
tcgaatatca tgcactcgat taacggttac gtgttcgact cgctgcaact gagcgtgtgc 2820
ctccatgaag tcgcttactg gtacattctg tccatcggcg cccagactga cttcctgagc 2880
gtgttctttt ccggttacac ctttaagcac aagatggtgt acgaagatac cctgaccctg 2940
ttccctttct ccggcgaaac ggtgttcatg tcgatggaga acccgggtct gtggattctg 3000
ggatgccaca acagcgactt tcggaaccgc ggaatgactg ccctgctgaa ggtgtcctca 3060
tgcgacaaga acaccggaga ctactacgag gactcctacg aggatatctc agcctacctc 3120
ctgtccaaga acaacgcgat cgagccgcgc agcttcagcc agaacggcgc gccaacatca 3180
gagagcgcca cccctgaaag tggtcccggg agcgagccag ccacatctgg gtcggaaacg 3240
ccaggcacaa gtgagtctgc aactcccgag tccggacctg gctccgagcc tgccactagc 3300
ggctccgaga ctccgggaac ttccgagagc gctacaccag aaagcggacc cggaaccagt 3360
accgaaccta gcgagggctc tgctccgggc agcccagccg gctctcctac atccacggag 3420
gagggcactt ccgaatccgc caccccggag tcagggccag gatctgaacc cgctacctca 3480
ggcagtgaga cgccaggaac gagcgagtcc gctacaccgg agagtgggcc agggagccct 3540
gctggatctc ctacgtccac tgaggaaggg tcaccagcgg gctcgcccac cagcactgaa 3600
gaaggtgcct cgagcccgcc tgtgctgaag aggcaccagc gagaaattac ccggaccacc 3660
ctccaatcgg atcaggagga aatcgactac gacgacacca tctcggtgga aatgaagaag 3720
gaagatttcg atatctacga cgaggacgaa aatcagtccc ctcgctcatt ccaaaagaaa 3780
actagacact actttatcgc cgcggtggaa agactgtggg actatggaat gtcatccagc 3840
cctcacgtcc ttcggaaccg ggcccagagc ggatcggtgc ctcagttcaa gaaagtggtg 3900
ttccaggagt tcaccgacgg cagcttcacc cagccgctgt accggggaga actgaacgaa 3960
cacctgggcc tgctcggtcc ctacatccgc gcggaagtgg aggataacat catggtgacc 4020
ttccgtaacc aagcatccag accttactcc ttctattcct ccctgatctc atacgaggag 4080
gaccagcgcc aaggcgccga gccccgcaag aacttcgtca agcccaacga gactaagacc 4140
tacttctgga aggtccaaca ccatatggcc ccgaccaagg atgagtttga ctgcaaggcc 4200
tgggcctact tctccgacgt ggaccttgag aaggatgtcc attccggcct gatcgggccg 4260
ctgctcgtgt gtcacaccaa caccctgaac ccagcgcatg gacgccaggt caccgtccag 4320
gagtttgctc tgttcttcac catttttgac gaaactaagt cctggtactt caccgagaat 4380
atggagcgaa actgtagagc gccctgcaat atccagatgg aagatccgac tttcaaggag 4440
aactatagat tccacgccat caacgggtac atcatggata ctctgccggg gctggtcatg 4500
gcccaggatc agaggattcg gtggtacttg ctgtcaatgg gatcgaacga aaacattcac 4560
tccattcact tctccggtca cgtgttcact gtgcgcaaga aggaggagta caagatggcg 4620
ctgtacaatc tgtaccccgg ggtgttcgaa actgtggaga tgctgccgtc caaggccggc 4680
atctggagag tggagtgcct gatcggagag cacctccacg cggggatgtc caccctcttc 4740
ctggtgtact cgaataagtg ccagaccccg ctgggcatgg cctcgggcca catcagagac 4800
ttccagatca cagcaagcgg acaatacggc caatgggcgc cgaagctggc ccgcttgcac 4860
tactccggat cgatcaacgc atggtccacc aaggaaccgt tctcgtggat taaggtggac 4920
ctcctggccc ctatgattat ccacggaatt aagacccagg gcgccaggca gaagttctcc 4980
tccctgtaca tctcgcaatt catcatcatg tacagcctgg acgggaagaa gtggcagact 5040
tacaggggaa actccaccgg caccctgatg gtctttttcg gcaacgtgga ttcctccggc 5100
attaagcaca acatcttcaa cccaccgatc atagccagat atattaggct ccaccccact 5160
cactactcaa tccgctcaac tcttcggatg gaactcatgg ggtgcgacct gaactcctgc 5220
tccatgccgt tggggatgga atcaaaggct attagcgacg cccagatcac cgcgagctcc 5280
tacttcacta acatgttcgc cacctggagc ccctccaagg ccaggctgca cttgcaggga 5340
cggtcaaatg cctggcggcc gcaagtgaac aatccgaagg aatggcttca agtggatttc 5400
caaaagacca tgaaagtgac cggagtcacc acccagggag tgaagtccct tctgacctcg 5460
atgtatgtga aggagttcct gattagcagc agccaggacg ggcaccagtg gaccctgttc 5520
ttccaaaacg gaaaggtcaa ggtgttccag gggaaccagg actcgttcac acccgtggtg 5580
aactccctgg accccccact gctgacgcgg tacttgagga ttcatcctca gtcctgggtc 5640
catcagattg cattgcgaat ggaagtcctg ggctgcgagg cccaggacct gtactgaatc 5700
agcctgagct cgctgatcat aatcaacctc tggattacaa aatttgtgaa agattgactg 5760
gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 5820
atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 5880
tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 5940
ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 6000
ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 6060
gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 6120
cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 6180
gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 6240
tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 6300
cctccccgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 6360
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 6420
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 6480
caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 6540
tctatggctt ctgaggcgga aagaacgggc tcgagaagct tctagatatc ctctcttaag 6600
gtagcatcga gatttaaatt agggataaca gggtaatggc gcgggccgca aaatttaaaa 6660
gaagacacca aatcagatgc cgccggtcgc cgccggtagg cgggacttcc ggtacaagat 6720
ggcggacaat tacgtcattt cctgtgacgt catttcctgt gacgtcactt ccggtgggcg 6780
ggacttccgg aattagggtt ggctctgggc cagcgcttgg ggttgacgtg ccactaagat 6840
caagcggcgc gccgcttgtc ttagtgtcaa ggcaacccca agcaagctgg cccagagcca 6900
accctaattc cggaagtccc gcccaccgga agtgacgtca caggaaatga cgtcacagga 6960
aatgacgtaa ttgtccgcca tcttgtaccg gaagtcccgc ctaccggcgg cgaccggcgg 7020
catctgattt gg 7032
<210> 190
<211> 6824
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 190
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata 180
cgcgctctct taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt 240
cgcggccgcc tcgacgacta gcgtttaatt aaatcgaggt gagccccacg ttctgcttca 300
ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt ttttaattat 360
tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg gcggggcggg 420
gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 480
tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 540
cgcggcgggc gggagtcgct gcgcgctgcc ttcgccccgt gccccgctcc gccgccgcct 600
cgcgccgccc gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg 660
gcccttctcc ttcgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt 720
ggctgcgtga aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg 780
ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc 840
tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc 900
ctacaggcta gcgccaccat gcagattgag ctgtccactt gtttcttcct gtgcctcctg 960
cgcttctgtt tctccgccac tcgccggtac taccttggag ccgtggagct ttcatgggac 1020
tacatgcaga gcgacctggg cgaactcccc gtggatgcca gattcccccc ccgcgtgcca 1080
aagtccttcc cctttaacac ctccgtggtg tacaagaaaa ccctctttgt cgagttcact 1140
gaccacctgt tcaacatcgc caagccgcgc ccaccttgga tgggcctcct gggaccgacc 1200
attcaagctg aagtgtacga caccgtggtg atcaccctga agaacatggc gtcccacccc 1260
gtgtccctgc atgcggtcgg agtgtcctac tggaaggcct ccgaaggagc tgagtacgac 1320
gaccagacta gccagcggga aaaggaggac gataaagtgt tcccgggcgg ctcgcatact 1380
tacgtgtggc aagtcctgaa ggaaaacgga cctatggcat ccgatcctct gtgcctgact 1440
tactcctacc tttcccatgt ggacctcgtg aaggacctga acagcgggct gattggtgca 1500
cttctcgtgt gccgcgaagg ttcgctcgct aaggaaaaga cccagaccct ccataagttc 1560
atccttttgt tcgctgtgtt cgatgaagga aagtcatggc attccgaaac taagaactcg 1620
ctgatgcagg accgggatgc cgcctcagcc cgcgcctggc ctaaaatgca tacagtcaac 1680
ggatacgtga atcggtcact gcccgggctc atcggttgtc acagaaagtc cgtgtactgg 1740
cacgtcatcg gcatgggcac tacgcctgaa gtgcactcca tcttcctgga agggcacacc 1800
ttcctcgtgc gcaaccaccg ccaggcctct ctggaaatct ccccgattac ctttctgacc 1860
gcccagactc tgctcatgga cctggggcag ttccttctct tctgccacat ctccagccat 1920
cagcacgacg gaatggaggc ctacgtgaag gtggactcat gcccggaaga acctcagttg 1980
cggatgaaga acaacgagga ggccgaggac tatgacgacg atttgactga ctccgagatg 2040
gacgtcgtgc ggttcgatga cgacaacagc cccagcttca tccagattcg cagcgtggcc 2100
aagaagcacc ccaaaacctg ggtgcactac atcgcggccg aggaagaaga ttgggactac 2160
gccccgttgg tgctggcacc cgatgaccgg tcgtacaagt cccagtatct gaacaatggt 2220
ccgcagcgga ttggcagaaa gtacaagaaa gtgcggttca tggcgtacac tgacgaaacg 2280
tttaagaccc gggaggccat tcaacatgag agcggcattc tgggaccact gctgtacgga 2340
gaggtcggcg ataccctgct catcatcttc aaaaaccagg cctcccggcc ttacaacatc 2400
taccctcacg gaatcaccga cgtgcggcca ctctactcgc ggcgcctgcc gaagggcgtc 2460
aagcacctga aagacttccc tatcctgccg ggcgaaatct tcaagtataa gtggaccgtc 2520
accgtggagg acgggcccac caagagcgat cctaggtgtc tgactcggta ctactccagc 2580
ttcgtgaaca tggaacggga cctggcatcg ggactcattg gaccgctgct gatctgctac 2640
aaagagtcgg tggatcaacg cggcaaccag atcatgtccg acaagcgcaa cgtgatcctg 2700
ttctccgtgt ttgatgaaaa cagatcctgg tacctcactg aaaacatcca gaggttcctc 2760
ccaaaccccg caggagtgca actggaggac cctgagtttc aggcctcgaa tatcatgcac 2820
tcgattaacg gttacgtgtt cgactcgctg caactgagcg tgtgcctcca tgaagtcgct 2880
tactggtaca ttctgtccat cggcgcccag actgacttcc tgagcgtgtt cttttccggt 2940
tacaccttta agcacaagat ggtgtacgaa gataccctga ccctgttccc tttctccggc 3000
gaaacggtgt tcatgtcgat ggagaacccg ggtctgtgga ttctgggatg ccacaacagc 3060
gactttcgga accgcggaat gactgccctg ctgaaggtgt cctcatgcga caagaacacc 3120
ggagactact acgaggactc ctacgaggat atctcagcct acctcctgtc caagaacaac 3180
gcgatcgagc cgcgcagctt cagccagaac ggcgcgccaa catcagagag cgccacccct 3240
gaaagtggtc ccgggagcga gccagccaca tctgggtcgg aaacgccagg cacaagtgag 3300
tctgcaactc ccgagtccgg acctggctcc gagcctgcca ctagcggctc cgagactccg 3360
ggaacttccg agagcgctac accagaaagc ggacccggaa ccagtaccga acctagcgag 3420
ggctctgctc cgggcagccc agccggctct cctacatcca cggaggaggg cacttccgaa 3480
tccgccaccc cggagtcagg gccaggatct gaacccgcta cctcaggcag tgagacgcca 3540
ggaacgagcg agtccgctac accggagagt gggccaggga gccctgctgg atctcctacg 3600
tccactgagg aagggtcacc agcgggctcg cccaccagca ctgaagaagg tgcctcgagc 3660
ccgcctgtgc tgaagaggca ccagcgagaa attacccgga ccaccctcca atcggatcag 3720
gaggaaatcg actacgacga caccatctcg gtggaaatga agaaggaaga tttcgatatc 3780
tacgacgagg acgaaaatca gtcccctcgc tcattccaaa agaaaactag acactacttt 3840
atcgccgcgg tggaaagact gtgggactat ggaatgtcat ccagccctca cgtccttcgg 3900
aaccgggccc agagcggatc ggtgcctcag ttcaagaaag tggtgttcca ggagttcacc 3960
gacggcagct tcacccagcc gctgtaccgg ggagaactga acgaacacct gggcctgctc 4020
ggtccctaca tccgcgcgga agtggaggat aacatcatgg tgaccttccg taaccaagca 4080
tccagacctt actccttcta ttcctccctg atctcatacg aggaggacca gcgccaaggc 4140
gccgagcccc gcaagaactt cgtcaagccc aacgagacta agacctactt ctggaaggtc 4200
caacaccata tggccccgac caaggatgag tttgactgca aggcctgggc ctacttctcc 4260
gacgtggacc ttgagaagga tgtccattcc ggcctgatcg ggccgctgct cgtgtgtcac 4320
accaacaccc tgaacccagc gcatggacgc caggtcaccg tccaggagtt tgctctgttc 4380
ttcaccattt ttgacgaaac taagtcctgg tacttcaccg agaatatgga gcgaaactgt 4440
agagcgccct gcaatatcca gatggaagat ccgactttca aggagaacta tagattccac 4500
gccatcaacg ggtacatcat ggatactctg ccggggctgg tcatggccca ggatcagagg 4560
attcggtggt acttgctgtc aatgggatcg aacgaaaaca ttcactccat tcacttctcc 4620
ggtcacgtgt tcactgtgcg caagaaggag gagtacaaga tggcgctgta caatctgtac 4680
cccggggtgt tcgaaactgt ggagatgctg ccgtccaagg ccggcatctg gagagtggag 4740
tgcctgatcg gagagcacct ccacgcgggg atgtccaccc tcttcctggt gtactcgaat 4800
aagtgccaga ccccgctggg catggcctcg ggccacatca gagacttcca gatcacagca 4860
agcggacaat acggccaatg ggcgccgaag ctggcccgct tgcactactc cggatcgatc 4920
aacgcatggt ccaccaagga accgttctcg tggattaagg tggacctcct ggcccctatg 4980
attatccacg gaattaagac ccagggcgcc aggcagaagt tctcctccct gtacatctcg 5040
caattcatca tcatgtacag cctggacggg aagaagtggc agacttacag gggaaactcc 5100
accggcaccc tgatggtctt tttcggcaac gtggattcct ccggcattaa gcacaacatc 5160
ttcaacccac cgatcatagc cagatatatt aggctccacc ccactcacta ctcaatccgc 5220
tcaactcttc ggatggaact catggggtgc gacctgaact cctgctccat gccgttgggg 5280
atggaatcaa aggctattag cgacgcccag atcaccgcga gctcctactt cactaacatg 5340
ttcgccacct ggagcccctc caaggccagg ctgcacttgc agggacggtc aaatgcctgg 5400
cggccgcaag tgaacaatcc gaaggaatgg cttcaagtgg atttccaaaa gaccatgaaa 5460
gtgaccggag tcaccaccca gggagtgaag tcccttctga cctcgatgta tgtgaaggag 5520
ttcctgatta gcagcagcca ggacgggcac cagtggaccc tgttcttcca aaacggaaag 5580
gtcaaggtgt tccaggggaa ccaggactcg ttcacacccg tggtgaactc cctggacccc 5640
ccactgctga cgcggtactt gaggattcat cctcagtcct gggtccatca gattgcattg 5700
cgaatggaag tcctgggctg cgaggcccag gacctgtact gaatcagcct gagctcgctg 5760
atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 5820
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 5880
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 5940
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 6000
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 6060
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 6120
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 6180
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 6240
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 6300
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgctgatca 6360
gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 6420
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 6480
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 6540
gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 6600
gcggaaagaa cgggctcgag aagcttctag atatcctctc ttaaggtagc atcgagattt 6660
aaattaggga taacagggta atggcgcggg ccgcaggaac ccctagtgat ggagttggcc 6720
actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 6780
ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 6824
<210> 191
<211> 278
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 191
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 278
<210> 192
<211> 262
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 192
gtgagcgggc gggacggccc ttctccttcg ggctgtaatt agcgcttggt ttaatgacgg 60
cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 120
ggggggagcg gctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag 180
ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgttca 240
tgccttcttc tttttcctac ag 262
<210> 193
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 193
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 194
<211> 7154
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 194
ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60
tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120
gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180
tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240
accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300
cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360
cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420
ggatattttg cgcgccagga agtggcggca attcagtcga taactataac ggtcctaagg 480
tagcgattta aatacgcgct ctcttaaggt agccccggga cgcgtcaatt gagatctgga 540
tccggtaccg aattcgcggc cgcctcgacg actagcgttt aattaaacgc gtgtctgtct 600
gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg 660
tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga 720
gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac 780
caggagaagc cgtcacacag atccacaagc tcctgaggta agtgccgtgt gtggttcccg 840
cgggcctggc ctctttacgg gttatggccc ttgcgtgcct tgaattactg acactgacat 900
ccactttttc tttttctcca cagctagcgc caccatgcag attgagctgt ccacttgttt 960
cttcctgtgc ctcctgcgct tctgtttctc cgccactcgc cggtactacc ttggagccgt 1020
ggagctttca tgggactaca tgcagagcga cctgggcgaa ctccccgtgg atgccagatt 1080
ccccccccgc gtgccaaagt ccttcccctt taacacctcc gtggtgtaca agaaaaccct 1140
ctttgtcgag ttcactgacc acctgttcaa catcgccaag ccgcgcccac cttggatggg 1200
cctcctggga ccgaccattc aagctgaagt gtacgacacc gtggtgatca ccctgaagaa 1260
catggcgtcc caccccgtgt ccctgcatgc ggtcggagtg tcctactgga aggcctccga 1320
aggagctgag tacgacgacc agactagcca gcgggaaaag gaggacgata aagtgttccc 1380
gggcggctcg catacttacg tgtggcaagt cctgaaggaa aacggaccta tggcatccga 1440
tcctctgtgc ctgacttact cctacctttc ccatgtggac ctcgtgaagg acctgaacag 1500
cgggctgatt ggtgcacttc tcgtgtgccg cgaaggttcg ctcgctaagg aaaagaccca 1560
gaccctccat aagttcatcc ttttgttcgc tgtgttcgat gaaggaaagt catggcattc 1620
cgaaactaag aactcgctga tgcaggaccg ggatgccgcc tcagcccgcg cctggcctaa 1680
aatgcataca gtcaacggat acgtgaatcg gtcactgccc gggctcatcg gttgtcacag 1740
aaagtccgtg tactggcacg tcatcggcat gggcactacg cctgaagtgc actccatctt 1800
cctggaaggg cacaccttcc tcgtgcgcaa ccaccgccag gcctctctgg aaatctcccc 1860
gattaccttt ctgaccgccc agactctgct catggacctg gggcagttcc ttctcttctg 1920
ccacatctcc agccatcagc acgacggaat ggaggcctac gtgaaggtgg actcatgccc 1980
ggaagaacct cagttgcgga tgaagaacaa cgaggaggcc gaggactatg acgacgattt 2040
gactgactcc gagatggacg tcgtgcggtt cgatgacgac aacagcccca gcttcatcca 2100
gattcgcagc gtggccaaga agcaccccaa aacctgggtg cactacatcg cggccgagga 2160
agaagattgg gactacgccc cgttggtgct ggcacccgat gaccggtcgt acaagtccca 2220
gtatctgaac aatggtccgc agcggattgg cagaaagtac aagaaagtgc ggttcatggc 2280
gtacactgac gaaacgttta agacccggga ggccattcaa catgagagcg gcattctggg 2340
accactgctg tacggagagg tcggcgatac cctgctcatc atcttcaaaa accaggcctc 2400
ccggccttac aacatctacc ctcacggaat caccgacgtg cggccactct actcgcggcg 2460
cctgccgaag ggcgtcaagc acctgaaaga cttccctatc ctgccgggcg aaatcttcaa 2520
gtataagtgg accgtcaccg tggaggacgg gcccaccaag agcgatccta ggtgtctgac 2580
tcggtactac tccagcttcg tgaacatgga acgggacctg gcatcgggac tcattggacc 2640
gctgctgatc tgctacaaag agtcggtgga tcaacgcggc aaccagatca tgtccgacaa 2700
gcgcaacgtg atcctgttct ccgtgtttga tgaaaacaga tcctggtacc tcactgaaaa 2760
catccagagg ttcctcccaa accccgcagg agtgcaactg gaggaccctg agtttcaggc 2820
ctcgaatatc atgcactcga ttaacggtta cgtgttcgac tcgctgcaac tgagcgtgtg 2880
cctccatgaa gtcgcttact ggtacattct gtccatcggc gcccagactg acttcctgag 2940
cgtgttcttt tccggttaca cctttaagca caagatggtg tacgaagata ccctgaccct 3000
gttccctttc tccggcgaaa cggtgttcat gtcgatggag aacccgggtc tgtggattct 3060
gggatgccac aacagcgact ttcggaaccg cggaatgact gccctgctga aggtgtcctc 3120
atgcgacaag aacaccggag actactacga ggactcctac gaggatatct cagcctacct 3180
cctgtccaag aacaacgcga tcgagccgcg cagcttcagc cagaacggcg cgccaacatc 3240
agagagcgcc acccctgaaa gtggtcccgg gagcgagcca gccacatctg ggtcggaaac 3300
gccaggcaca agtgagtctg caactcccga gtccggacct ggctccgagc ctgccactag 3360
cggctccgag actccgggaa cttccgagag cgctacacca gaaagcggac ccggaaccag 3420
taccgaacct agcgagggct ctgctccggg cagcccagcc ggctctccta catccacgga 3480
ggagggcact tccgaatccg ccaccccgga gtcagggcca ggatctgaac ccgctacctc 3540
aggcagtgag acgccaggaa cgagcgagtc cgctacaccg gagagtgggc cagggagccc 3600
tgctggatct cctacgtcca ctgaggaagg gtcaccagcg ggctcgccca ccagcactga 3660
agaaggtgcc tcgagcccgc ctgtgctgaa gaggcaccag cgagaaatta cccggaccac 3720
cctccaatcg gatcaggagg aaatcgacta cgacgacacc atctcggtgg aaatgaagaa 3780
ggaagatttc gatatctacg acgaggacga aaatcagtcc cctcgctcat tccaaaagaa 3840
aactagacac tactttatcg ccgcggtgga aagactgtgg gactatggaa tgtcatccag 3900
ccctcacgtc cttcggaacc gggcccagag cggatcggtg cctcagttca agaaagtggt 3960
gttccaggag ttcaccgacg gcagcttcac ccagccgctg taccggggag aactgaacga 4020
acacctgggc ctgctcggtc cctacatccg cgcggaagtg gaggataaca tcatggtgac 4080
cttccgtaac caagcatcca gaccttactc cttctattcc tccctgatct catacgagga 4140
ggaccagcgc caaggcgccg agccccgcaa gaacttcgtc aagcccaacg agactaagac 4200
ctacttctgg aaggtccaac accatatggc cccgaccaag gatgagtttg actgcaaggc 4260
ctgggcctac ttctccgacg tggaccttga gaaggatgtc cattccggcc tgatcgggcc 4320
gctgctcgtg tgtcacacca acaccctgaa cccagcgcat ggacgccagg tcaccgtcca 4380
ggagtttgct ctgttcttca ccatttttga cgaaactaag tcctggtact tcaccgagaa 4440
tatggagcga aactgtagag cgccctgcaa tatccagatg gaagatccga ctttcaagga 4500
gaactataga ttccacgcca tcaacgggta catcatggat actctgccgg ggctggtcat 4560
ggcccaggat cagaggattc ggtggtactt gctgtcaatg ggatcgaacg aaaacattca 4620
ctccattcac ttctccggtc acgtgttcac tgtgcgcaag aaggaggagt acaagatggc 4680
gctgtacaat ctgtaccccg gggtgttcga aactgtggag atgctgccgt ccaaggccgg 4740
catctggaga gtggagtgcc tgatcggaga gcacctccac gcggggatgt ccaccctctt 4800
cctggtgtac tcgaataagt gccagacccc gctgggcatg gcctcgggcc acatcagaga 4860
cttccagatc acagcaagcg gacaatacgg ccaatgggcg ccgaagctgg cccgcttgca 4920
ctactccgga tcgatcaacg catggtccac caaggaaccg ttctcgtgga ttaaggtgga 4980
cctcctggcc cctatgatta tccacggaat taagacccag ggcgccaggc agaagttctc 5040
ctccctgtac atctcgcaat tcatcatcat gtacagcctg gacgggaaga agtggcagac 5100
ttacagggga aactccaccg gcaccctgat ggtctttttc ggcaacgtgg attcctccgg 5160
cattaagcac aacatcttca acccaccgat catagccaga tatattaggc tccaccccac 5220
tcactactca atccgctcaa ctcttcggat ggaactcatg gggtgcgacc tgaactcctg 5280
ctccatgccg ttggggatgg aatcaaaggc tattagcgac gcccagatca ccgcgagctc 5340
ctacttcact aacatgttcg ccacctggag cccctccaag gccaggctgc acttgcaggg 5400
acggtcaaat gcctggcggc cgcaagtgaa caatccgaag gaatggcttc aagtggattt 5460
ccaaaagacc atgaaagtga ccggagtcac cacccaggga gtgaagtccc ttctgacctc 5520
gatgtatgtg aaggagttcc tgattagcag cagccaggac gggcaccagt ggaccctgtt 5580
cttccaaaac ggaaaggtca aggtgttcca ggggaaccag gactcgttca cacccgtggt 5640
gaactccctg gaccccccac tgctgacgcg gtacttgagg attcatcctc agtcctgggt 5700
ccatcagatt gcattgcgaa tggaagtcct gggctgcgag gcccaggacc tgtactgaat 5760
cagcctgagc tcgctgatca taatcaacct ctggattaca aaatttgtga aagattgact 5820
ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 5880
tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggttg 5940
ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg 6000
tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct cctttccggg 6060
actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg ccttgcccgc 6120
tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc ggggaaatca 6180
tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc 6240
tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct gctgccggct 6300
ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc cctttgggcc 6360
gcctccccgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 6420
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 6480
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 6540
gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 6600
ctctatggct tctgaggcgg aaagaacggg ctcgagaagc ttctagatat cctctcttaa 6660
ggtagcatcg agatttaaat tagggataac agggtaatgg cgcgggccgc cacttcctgg 6720
cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt cgaaccagcc 6780
aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga cgcacatccg 6840
gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg acttccggtc 6900
atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc ggcatgcgcg 6960
tggtcaacct aacagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac 7020
cggaaacacg tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga 7080
agcatgtgac cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg 7140
aaccctccaa tgag 7154
<210> 195
<211> 648
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 195
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240
caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300
acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360
ccatgcatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc 420
ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg 480
gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg 540
cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg 600
aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 648
<210> 196
<211> 1428
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 196
atggactaca aagaccatga cggtgattat aaagatcatg atatcgatta caaggatgac 60
gatgacaagg ctgctgtggt tctggaaaat ggcgtgctga gccggaagct gagcgacttc 120
ggacaagaga caagctacat cgaggacaac agcaaccaga atggcgccgt gtctctgatc 180
ttcagcctga aagaagaagt gggcgccctg gccaaggtgc tgagactgtt cgaggaaaac 240
gagatcaatc tgacccacat cgagagcaga cccagcagac tgaacaagga cgagtacgag 300
ttcttcacct acctggacaa gcggagcaag cctgtgctgg gcagcatcat caagagcctg 360
agaaacgaca tcggcgccac cgtgcacgag ctgagcagag acaaagaaaa gaacaccgtg 420
ccatggttcc ccaggaccat ccaagagctg gacagattcg ccaaccagat cctgagctat 480
ggcgccgagc tggacgctga tcaccctggc tttaaggacc ccgtgtaccg ggccagaaga 540
aagcagtttg ccgatatcgc ctacaactac cggcacggcc agcctattcc tcgggtcgag 600
tacaccgagg aagagagaaa gacctggggc accgtgttca gaaccctgaa ggccctgtac 660
aagacccacg cctgctacga gcacaaccac atcttcccac tgctggaaaa gtactgcggc 720
ttccgcgagg acaatatccc tcagctcgaa gacgtgtccc agttcctgca gacctgcacc 780
ggctttagac tgaggcctgt tgccggactg ctgagcagca gagattttct cggcggcctg 840
gccttcagag tgttccactg tacccagtac atcagacacg gcagcaagcc catgtacacc 900
cctgagcctg atatctgcca cgagctgctg ggacatgtgc ccctgttcag cgatagaagc 960
ttcgcccagt tcagccaaga gatcggactg gcttctctgg gagcccctga cgagtacatt 1020
gagaagctgg ccaccatcta ctggttcacc gtggaattcg gcctgtgcaa agagggcgac 1080
agcatcaagg cttatggcgc tggactgctg tctagcttcg gcgagctgca gtactgtctg 1140
agcgacaagc ctaagctgct gcccctggaa ctggaaaaga ccgcctgcca agagtacaca 1200
gtgaccgagt tccagcctct gtactacgtg gccgagagct tcaacgacgc caaagaaaaa 1260
gtgcggacct tcgccgccac cattcctcgg ccttttagcg tcagatacga cccctacaca 1320
cagcgcgtgg aagtgctgga caacacacag cagctgaaga ttctggccga ctccatcaac 1380
agcgaagtgg gcattctgtg tcacgccctg cagaagatca agagctga 1428
<210> 197
<211> 4146
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 197
ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60
ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120
ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180
ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240
taaattttgc ggcaattcag tcgataacta taacggtcct aaggtagcga tttaaatacg 300
cgctctctta aggtagcccc gggacgcgtc aattgagatc tggatccggt accgaattcg 360
cggccgcctc gacgactagc gtttagtaat gagacgcaca aactaatatc acaaactgga 420
aatgtctatc aatatatagt tgctctagtt attaatagta atcaattacg gggtcattag 480
ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 540
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 600
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 660
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 720
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 780
tctacgtatt agtcatcgct attaccatgc atggtcgagg tgagccccac gttctgcttc 840
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 900
ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg 960
ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg 1020
ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc 1080
gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc 1140
tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac 1200
ggcccttctc cttcgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg 1260
tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg 1320
gggctgtccg cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt 1380
ctggcgtgtg accggcggct ctagagcctc tgctaaccat gttcatgcct tcttcttttt 1440
cctacagctc ctgggcaacg tgctggttat tgtgctgtct catcattttg gcaaagaatt 1500
ggatcgcgaa gccgccacca tggactacaa agaccatgac ggtgattata aagatcatga 1560
tatcgattac aaggatgacg atgacaaggc tgctgtggtt ctggaaaatg gcgtgctgag 1620
ccggaagctg agcgacttcg gacaagagac aagctacatc gaggacaaca gcaaccagaa 1680
tggcgccgtg tctctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct 1740
gagactgttc gaggaaaacg agatcaatct gacccacatc gagagcagac ccagcagact 1800
gaacaaggac gagtacgagt tcttcaccta cctggacaag cggagcaagc ctgtgctggg 1860
cagcatcatc aagagcctga gaaacgacat cggcgccacc gtgcacgagc tgagcagaga 1920
caaagaaaag aacaccgtgc catggttccc caggaccatc caagagctgg acagattcgc 1980
caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc 2040
cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca 2100
gcctattcct cgggtcgagt acaccgagga agagagaaag acctggggca ccgtgttcag 2160
aaccctgaag gccctgtaca agacccacgc ctgctacgag cacaaccaca tcttcccact 2220
gctggaaaag tactgcggct tccgcgagga caatatccct cagctcgaag acgtgtccca 2280
gttcctgcag acctgcaccg gctttagact gaggcctgtt gccggactgc tgagcagcag 2340
agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg 2400
cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc 2460
cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg 2520
agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg 2580
cctgtgcaaa gagggcgaca gcatcaaggc ttatggcgct ggactgctgt ctagcttcgg 2640
cgagctgcag tactgtctga gcgacaagcc taagctgctg cccctggaac tggaaaagac 2700
cgcctgccaa gagtacacag tgaccgagtt ccagcctctg tactacgtgg ccgagagctt 2760
caacgacgcc aaagaaaaag tgcggacctt cgccgccacc attcctcggc cttttagcgt 2820
cagatacgac ccctacacac agcgcgtgga agtgctggac aacacacagc agctgaagat 2880
tctggccgac tccatcaaca gcgaagtggg cattctgtgt cacgccctgc agaagatcaa 2940
gagctgagca agtaatgagc gctgatcata atcaacctct ggattacaaa atttgtgaaa 3000
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 3060
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 3120
cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 3180
gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 3240
tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 3300
ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 3360
ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt ctgcgcggga 3420
cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 3480
tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 3540
tttgggccgc ctccccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 3600
gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 3660
taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 3720
ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 3780
gcggtgggct ctatggcttc tgaggcggaa agaacgggct cgagaagctt ctagatatcc 3840
tctcttaagg tagcatcgag atttaaatta gggataacag ggtaatggcg cgggccgcaa 3900
aatttaaaag aagacaccaa atcagatgcc gccggtcgcc gccggtaggc gggacttccg 3960
gtacaagatg gcggacaatt acgtcatttc ctgtgacgtc atttcctgtg acgtcacttc 4020
cggtgggcgg gacttccgga attagggttg gctctgggcc agcgcttggg gttgacgtgc 4080
cactaagatc aagcggcgcg ccgcttgtct tagtgtcaag gcaaccccaa gcaagctggc 4140
ccagag 4146
<210> 198
<211> 4214
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸序列
<400> 198
cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60
ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120
tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180
cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240
tgagactcaa ggacaagagg atattttgcg cgccaggaag tggcggcaat tcagtcgata 300
actataacgg tcctaaggta gcgatttaaa tacgcgctct cttaaggtag ccccgggacg 360
cgtcaattga gatctggatc cggtaccgaa ttcgcggccg cctcgacgac tagcgtttag 420
taatgagacg cacaaactaa tatcacaaac tggaaatgtc tatcaatata tagttgctct 480
agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc 540
gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg 600
acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa 660
tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca 720
agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac 780
atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc 840
atgcatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 900
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 960
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 1020
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 1080
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgcg 1140
ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1200
gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctccttcgg gctgtaatta 1260
gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc ttgaggggct 1320
ccgggagggc cctttgtgcg gggggagcgg ctcggggctg tccgcggggg gacggctgcc 1380
ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 1440
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 1500
ttattgtgct gtctcatcat tttggcaaag aattggatcg cgaagccgcc accatggact 1560
acaaagacca tgacggtgat tataaagatc atgatatcga ttacaaggat gacgatgaca 1620
aggctgctgt ggttctggaa aatggcgtgc tgagccggaa gctgagcgac ttcggacaag 1680
agacaagcta catcgaggac aacagcaacc agaatggcgc cgtgtctctg atcttcagcc 1740
tgaaagaaga agtgggcgcc ctggccaagg tgctgagact gttcgaggaa aacgagatca 1800
atctgaccca catcgagagc agacccagca gactgaacaa ggacgagtac gagttcttca 1860
cctacctgga caagcggagc aagcctgtgc tgggcagcat catcaagagc ctgagaaacg 1920
acatcggcgc caccgtgcac gagctgagca gagacaaaga aaagaacacc gtgccatggt 1980
tccccaggac catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg 2040
agctggacgc tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt 2100
ttgccgatat cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacaccg 2160
aggaagagag aaagacctgg ggcaccgtgt tcagaaccct gaaggccctg tacaagaccc 2220
acgcctgcta cgagcacaac cacatcttcc cactgctgga aaagtactgc ggcttccgcg 2280
aggacaatat ccctcagctc gaagacgtgt cccagttcct gcagacctgc accggcttta 2340
gactgaggcc tgttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca 2400
gagtgttcca ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc 2460
ctgatatctg ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc 2520
agttcagcca agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc 2580
tggccaccat ctactggttc accgtggaat tcggcctgtg caaagagggc gacagcatca 2640
aggcttatgg cgctggactg ctgtctagct tcggcgagct gcagtactgt ctgagcgaca 2700
agcctaagct gctgcccctg gaactggaaa agaccgcctg ccaagagtac acagtgaccg 2760
agttccagcc tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga 2820
ccttcgccgc caccattcct cggcctttta gcgtcagata cgacccctac acacagcgcg 2880
tggaagtgct ggacaacaca cagcagctga agattctggc cgactccatc aacagcgaag 2940
tgggcattct gtgtcacgcc ctgcagaaga tcaagagctg agcaagtaat gagcgctgat 3000
cataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt 3060
gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc 3120
cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag 3180
ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc 3240
actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc 3300
cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 3360
ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg 3420
ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc 3480
ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt 3540
cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc gctgatcagc 3600
ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3660
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3720
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3780
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 3840
ggaaagaacg ggctcgagaa gcttctagat atcctctctt aaggtagcat cgagatttaa 3900
attagggata acagggtaat ggcgcgggcc gccacttcct ggcgcgcaaa atatcctctt 3960
gtccttgagt ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag 4020
tgacgcaagt tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca 4080
cgtgcttcct gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg 4140
tgtttccggc ttaactattg ggctgaccgc gcggcatgcg cgtggtcaac ctaacagccg 4200
gaaacacgtc accg 4214

Claims (122)

1.一种核酸分子,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含异源多核苷酸序列,其中所述第一ITR和/或第二ITR包含与SEQ IDNO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
2.如权利要求1的核酸分子,其中所述第一ITR包含SEQ ID NO:180中所述的核苷酸序列,并且所述第二ITR包含SEQ ID NO:181中所述的核苷酸序列。
3.如权利要求1的核酸分子,其中所述第一ITR包含SEQ ID NO:183中所述的核苷酸序列,并且所述第二ITR包含SEQ ID NO:184中所述的核苷酸序列。
4.如权利要求1的核酸分子,其中所述第一ITR包含SEQ ID NO:185中所述的核苷酸序列,并且所述第二ITR包含SEQ ID NO:186中所述的核苷酸序列。
5.如权利要求1的核酸分子,其中所述第一ITR包含SEQ ID NO:187中所述的核苷酸序列,并且所述第二ITR包含SEQ ID NO:188中所述的核苷酸序列。
6.如权利要求1的核酸分子,其中所述第一ITR和/或所述第二ITR由SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列组成。
7.如权利要求1的核酸分子,其中所述第一ITR和所述第二ITR是彼此的反向互补物。
8.如权利要求1至7中任一项的核酸分子,其还包含启动子。
9.如权利要求8的核酸分子,其中所述启动子是组织特异性启动子。
10.如权利要求8或9的核酸分子,其中所述启动子驱动所述异源多核苷酸序列在选自以下的器官中的表达:肌肉、中枢神经系统(CNS)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道或其任何组合。
11.如权利要求8至10中任一项的核酸分子,其中所述启动子驱动所述异源多核苷酸序列在以下细胞中的表达:肝细胞、内皮细胞、心肌细胞、骨骼肌细胞、窦状细胞、传入神经元、传出神经元、中间神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、室管膜细胞、肺上皮细胞、许旺细胞、卫星细胞、感光细胞、视网膜神经节细胞或其任何组合。
12.如权利要求8至11中任一项的核酸分子,其中所述启动子定位于所述异源多核苷酸序列的5'。
13.如权利要求8至12中任一项的核酸分子,其中所述启动子选自下组:小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子、小鼠白蛋白启动子、三重四脯氨酸(TTP)启动子、CASI启动子、CAG启动子、巨细胞病毒(CMV)启动子、α1-抗胰蛋白酶(AAT)、肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)、结蛋白(DES)、SPc5-12、2R5Sc5-12、dMCK、tMCK和磷酸甘油酸激酶(PGK)启动子。
14.如权利要求1至13中任一项的核酸分子,其中所述异源多核苷酸序列还包含内含子序列。
15.如权利要求14的核酸分子,其中所述内含子序列定位于所述异源多核苷酸序列的5'。
16.如权利要求14或15的核酸分子,其中所述内含子序列定位于所述启动子的3'。
17.如权利要求14至16中任一项的核酸分子,其中所述内含子序列包含合成的内含子序列。
18.如权利要求14至17中任一项的核酸分子,其中所述内含子序列包含SEQ ID NO:115或192。
19.如权利要求1至18中任一项的核酸分子,其中所述基因盒还包含转录后调控元件。
20.如权利要求19的核酸分子,其中所述转录后调控元件定位于所述异源多核苷酸序列的3'。
21.如权利要求19或20的核酸分子,其中所述转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(WPRE)、微小RNA结合位点、DNA核靶向序列或其任何组合。
22.如权利要求21的核酸分子,其中所述微小RNA结合位点包含与miR142-3p的结合位点。
23.如权利要求1至22中任一项的核酸分子,其中所述基因盒还包含3'UTR多聚(A)尾序列。
24.如权利要求23的核酸分子,其中所述3'UTR多聚(A)尾序列选自下组:bGH多聚(A)、肌动蛋白多聚(A)、血红蛋白多聚(A)及其任何组合。
25.如权利要求23或24的核酸分子,其中所述3'UTR多聚(A)尾序列包含bGH多聚(A)。
26.如权利要求1至25中任一项的核酸分子,其中所述基因盒还包含增强子序列。
27.如权利要求26的核酸分子,其中所述增强子序列定位于所述第一ITR与所述第二ITR之间。
28.如权利要求1至27中任一项的核酸分子,其中所述核酸分子从5'至3'包含:所述第一ITR、所述基因盒和所述第二ITR;其中所述基因盒包含组织特异性启动子序列、内含子序列、异源多核苷酸序列、转录后调控元件和3'UTR多聚(A)尾序列。
29.如权利要求28的核酸分子,其中所述基因盒从5'至3'包含:组织特异性启动子序列、内含子序列、所述异源多核苷酸序列、转录后调控元件和3'UTR多聚(A)尾序列。
30.如权利要求28或29的核酸分子,其中:
所述组织特异性启动子序列包含TTT启动子;
所述内含子是合成的内含子;
所述转录后调控元件包含WPRE;并且
所述3'UTR多聚(A)尾序列包含bGHpA。
31.如权利要求1至30中任一项的核酸分子,其中所述基因盒包含单链核酸。
32.如权利要求1至30中任一项的核酸分子,其中所述基因盒包含双链核酸。
33.如权利要求1至32中任一项的核酸分子,其中所述异源多核苷酸序列编码凝血因子、生长因子、激素、细胞因子、抗体、其片段或其任何组合。
34.如权利要求33的核酸分子,其中所述异源多核苷酸序列编码选自下组的生长因子:肾上腺髓质素(AM)、血管生成素(Ang)、自分泌运动因子、骨形态发生蛋白(BMP)(例如,BMP2、BMP4、BMP5、BMP7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(CNTF)、白血病抑制因子(LIF)、白介素-6(IL-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-CSF)、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞集落刺激因子(GM-CSF))、表皮生长因子(EGF)、肝配蛋白(例如,肝配蛋白A1、肝配蛋白A2、肝配蛋白A3、肝配蛋白A4、肝配蛋白A5、肝配蛋白B1、肝配蛋白B2、肝配蛋白B3)、促红细胞生成素(EPO)、成纤维细胞生长因子(FGF)(例如,FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15、FGF16、FGF17、FGF18、FGF19、FGF20、FGF21、FGF22、FGF23)、胎牛促体素(FBS)、GDNF家族成员(例如,神经胶质细胞系衍生的神经营养因子(GDNF)、神经秩蛋白、普塞芬蛋白、阿特敏蛋白)、生长分化因子-9(GDF9)、肝细胞生长因子(HGF)、肝细胞瘤衍生的生长因子(HDGF)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(IGF-1)或IGF-2、白介素(IL)(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7)、角质形成细胞生长因子(KGF)、迁移刺激因子(MSF)、巨噬细胞刺激蛋白(MSP或肝细胞生长因子样蛋白(HGFLP))、肌生成抑制蛋白(GDF-8)、神经调节蛋白(例如,神经调节蛋白1(NRG1)、NRG2、NRG3、NRG4)、神经营养蛋白(例如,脑衍生的神经营养因子(BDNF)、神经生长因子(NGF)、神经营养蛋白-3(NT-3)、NT-4、胎盘生长因子(PGF)、血小板衍生的生长因子(PDGF)、肾胺酶(RNLS)、T细胞生长因子(TCGF)、血小板生成素(TPO)、转化生长因子(例如,转化生长因子α(TGF-α)、TGF-β、肿瘤坏死因子-α(TNF-α)和血管内皮生长因子(VEGF)及其任何组合。
35.如权利要求33的核酸分子,其中所述异源多核苷酸序列编码激素。
36.如权利要求33的核酸分子,其中所述异源多核苷酸序列编码细胞因子。
37.如权利要求33的核酸分子,其中所述异源多核苷酸序列编码抗体或其片段。
38.如权利要求1至32中任一项的核酸分子,其中所述异源多核苷酸序列编码选自以下的基因:X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)及其任何组合。
39.如权利要求1至32中任一项的核酸分子,其中所述异源多核苷酸序列编码微小RNA(miRNA)。
40.如权利要求39的核酸分子,其中所述miRNA下调选自以下的靶基因的表达:SOD1、HTT、RHO及其任何组合。
41.如权利要求1至32中任一项的核酸分子,其中所述异源多核苷酸序列编码选自下组的凝血因子:因子I(FI)、因子II(FII)、因子III(FIII)、因子IV(FVI)、因子V(FV)、因子VI(FVI)、因子VII(FVII)、因子VIII(FVIII)、因子IX(FIX)、因子X(FX)、因子XI(FXI)、因子XII(FXII)、因子XIII(FVIII)、血管性血友病因子(VWF)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原激活物抑制剂-1(PAI-1)、纤溶酶原激活物抑制剂-2(PAI2)及其任何组合。
42.如权利要求41的核酸分子,其中所述凝血因子是FVIII。
43.如权利要求42的核酸分子,其中所述FVIII包含全长成熟FVIII。
44.如权利要求43的核酸分子,其中所述FVIII包含与具有SEQ ID NO:106的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。
45.如权利要求42的核酸分子,其中所述FVIII包含A1结构域、A2结构域、A3结构域、C1结构域、C2结构域、和部分结构域或无B结构域。
46.如权利要求45的核酸分子,其中所述FVIII包含与SEQ ID NO:109的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。
47.如权利要求41至46中任一项的核酸分子,其中所述凝血因子包含异源部分。
48.如权利要求47的核酸分子,其中所述异源部分选自下组:白蛋白或其片段、免疫球蛋白Fc区、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、PAS序列、HAP序列、转铁蛋白或其片段、白蛋白结合部分、其衍生物或其任何组合。
49.如权利要求47或48的核酸分子,其中所述异源部分连接至所述FVIII的N末端或C末端或者插入所述FVIII中的两个氨基酸之间。
50.如权利要求49的核酸分子,其中所述异源部分在选自表4中所列插入位点的一个或多个插入位点处插入两个氨基酸之间。
51.如权利要求42至50中任一项的核酸分子,其中所述FVIII还包含A1结构域、A2结构域、C1结构域、C2结构域、任选的B结构域和异源部分,其中所述异源部分被插入于紧邻对应于成熟FVIII(SEQ ID NO:106)的氨基酸745的下游。
52.如权利要求49至51中任一项的核酸分子,其中所述FVIII还包含FcRn结合配偶体。
53.如权利要求52的核酸分子,其中所述FcRn结合配偶体包含免疫球蛋白恒定结构域的Fc区。
54.如权利要求42至53中任一项的核酸分子,其中编码所述FVIII的核酸序列经密码子优化。
55.如权利要求42至54中任一项的核酸分子,其中编码所述FVIII的核酸序列经密码子优化以供在人体内表达。
56.如权利要求55的核酸分子,其中编码所述FVIII的核酸序列包含与SEQ ID NO:107的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。
57.如权利要求55的核酸分子,其中编码所述FVIII的核酸序列包含与SEQ ID NO:71的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。
58.如权利要求1至53中任一项的核酸分子,其中所述异源多核苷酸序列经密码子优化。
59.如权利要求58的核酸分子,其中所述异源多核苷酸序列经密码子优化以供在人体内表达。
60.如权利要求1至59中任一项的核酸分子,其中所述核酸分子用递送剂配制。
61.如权利要求60的核酸分子,其中所述递送剂包含脂质纳米颗粒。
62.如权利要求60的核酸分子,其中所述递送剂选自下组:脂质体、非脂质聚合分子和内体及其任何组合。
63.如权利要求1至62中任一项的核酸分子,其中所述核酸分子经配制用于静脉内、经皮、皮内、皮下、经肺或口服递送或其任何组合。
64.如权利要求63的核酸分子,其中所述核酸分子经配制用于静脉内递送。
65.一种载体,其包含如权利要求1至59中任一项的核酸分子。
66.一种宿主细胞,其包含如权利要求1至59中任一项的核酸分子。
67.一种药物组合物,其包含如权利要求1至59中任一项的核酸或如权利要求65的载体,和医药上可接受的赋形剂。
68.一种药物组合物,其包含如权利要求66的宿主细胞和医药上可接受的赋形剂。
69.一种套组,其包含如权利要求1至59中任一项的核酸分子和用于将所述核酸分子施用于有需要的受试者的说明书。
70.一种杆状病毒系统,其用于产生如权利要求1至59中任一项的核酸分子。
71.如权利要求70的杆状病毒系统,其中如权利要求1至59中任一项的核酸分子是在昆虫细胞中产生。
72.一种纳米颗粒递送系统,其包含如权利要求1至59中任一项的核酸分子。
73.一种产生多肽的方法,其包括在适宜条件下培养如权利要求66的宿主细胞和回收所述多肽。
74.一种产生具有凝血活性的多肽的方法,其包括:在适宜条件下培养如权利要求66的宿主细胞和回收具有凝血活性的所述多肽。
75.一种在有需要的受试者中表达异源多核苷酸序列的方法,其包括将如权利要求1至59中任一项的核酸分子、如权利要求65的载体或如权利要求67的药物组合物施用于所述受试者。
76.一种在有需要的受试者中表达凝血因子的方法,其包括将如权利要求41至57中任一项的核酸分子、如权利要求65的载体、如权利要求75的多肽或如权利要求67的药物组合物施用于所述受试者。
77.一种治疗有需要的受试者的疾病或病症的方法,其包括将如权利要求1至59中任一项的核酸分子、如权利要求65的载体或如权利要求67的药物组合物施用于所述受试者。
78.一种治疗患有凝血因子缺乏的受试者的方法,其包括将如权利要求41至57中任一项的核酸分子、如权利要求65的载体、如权利要求75的多肽或如权利要求67的药物组合物施用于所述受试者。
79.一种治疗有需要的受试者中的凝血因子缺乏的方法,其包括将如权利要求41至57中任一项的核酸分子、如权利要求65的载体、如权利要求75的多肽或如权利要求67的药物组合物施用于所述受试者。
80.如权利要求79或80的方法,其中所述核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合施用的。
81.如权利要求81的方法,其中所述核酸分子静脉内施用的。
82.如权利要求79至82中任一项的方法,其还包括将第二药剂施用于所述受试者。
83.如权利要求79至83中任一项的方法,其中所述受试者是哺乳动物。
84.如权利要求79至84中任一项的方法,其中所述受试者是人。
85.如权利要求79至85中任一项的方法,其中相对于所述施用前所述受试者中的FVIII活性,将所述核酸分子施用于所述受试者导致增加的FVIII活性,其中所述FVIII活性增加为至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。
86.如权利要求79至86中任一项的方法,其中所述受试者患有出血病症。
87.如权利要求87的方法,其中所述出血病症是血友病。
88.如权利要求87或88的方法,其中所述出血病症是血友病A。
89.一种治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于所述受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中所述第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
90.一种治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于所述受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII(FVIII)的异源多核苷酸序列,其中所述第一ITR和/或第二ITR包含与SEQID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
91.一种治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于所述受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在所述受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中所述第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。
92.如权利要求92的方法,其中所述第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
93.一种治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于所述受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在所述受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中所述第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
94.如权利要求92至94中任一项的方法,其中所述基因盒包含单链核酸。
95.如权利要求92至94中任一项的方法,其中所述基因盒包含双链核酸。
96.如权利要求92至96中任一项的方法,其中所述肝脏代谢病症选自下组:苯丙酮尿症(PKU)、尿素循环疾病、溶酶体贮积病症和糖原贮积病。
97.如权利要求97的方法,其中所述肝脏代谢病症是苯丙酮尿症(PKU)。
98.如权利要求92至98中任一项的方法,其中所述核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合地施用。
99.如权利要求99的方法,其中所述核酸分子静脉内施用的。
100.如权利要求92至100中任一项的方法,其还包括将第二药剂施用于所述受试者。
101.如权利要求92至101中任一项的方法,其中所述受试者是哺乳动物。
102.如权利要求92至102中任一项的方法,其中所述受试者是人。
103.一种治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于所述受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶的异源多核苷酸序列,其中所述第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
104.如权利要求104的方法,其中所述基因盒包含单链核酸。
105.如权利要求104的方法,其中所述基因盒包含双链核酸。
106.如权利要求104至106中任一项的方法,其中所述核酸分子是用递送剂配制。
107.如权利要求107的方法,其中所述递送剂包含脂质纳米颗粒。
108.一种克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中。
109.如权利要求109的方法,其中所述SbcCD复合物中的破坏包含SbcC基因和/或SbcD基因中的基因破坏。
110.如权利要求109或110的方法,其中所述SbcCD复合物中的破坏包含SbcC基因中的基因破坏。
111.如权利要求109或110的方法,其中所述SbcCD复合物中的破坏包含SbcD基因中的基因破坏。
112.如权利要求109至112中任一项的方法,其中所述核酸分子包含第一反向末端重复(ITR)和第二ITR,其中所述第一和/或第二ITR是非腺相关病毒(非AAV)ITR。
113.如权利要求109至113中任一项的方法,其中所述第一ITR和/或第二ITR包含与SEQID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
114.如权利要求109至114中任一项的方法,其中所述核酸分子还包含基因盒,其中所述基因盒侧接有所述第一ITR和第二ITR。
115.如权利要求115的方法,其中所述基因盒包含异源多核苷酸序列。
116.如权利要求109至116中任一项的方法,其中所述适宜载体是低拷贝载体。
117.如权利要求109至116中任一项的方法,其中所述适宜载体是pBR322。
118.如权利要求109至118中任一项的方法,其中所述细菌宿主菌株不能拆分十字形DNA结构。
119.如权利要求109至118中任一项的方法,其中所述细菌宿主菌株是PMC103,其包含基因型sbcC、recD、mcrA、ΔmcrBCF。
120.如权利要求109至118中任一项的方法,其中所述细菌宿主菌株是PMC107,其包含基因型recBC、recJ、sbcBC、mcrA、ΔmcrBCF。
121.如权利要求109至118中任一项的方法,其中所述细菌宿主菌株是SURE,其包含基因型recB、recJ、sbcC、mcrA、ΔmcrBCF、umuC、uvrC。
122.一种克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中,其中所述核酸分子包含第一反向末端重复(ITR)和第二ITR,其中所述第一ITR和/或第二ITR包含与SEQ IDNO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。
CN201980065714.1A 2018-08-09 2019-08-09 核酸分子及其用于非病毒基因疗法的用途 Pending CN113227385A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862716826P 2018-08-09 2018-08-09
US62/716,826 2018-08-09
PCT/US2019/045957 WO2020033863A1 (en) 2018-08-09 2019-08-09 Nucleic acid molecules and uses thereof for non-viral gene therapy

Publications (1)

Publication Number Publication Date
CN113227385A true CN113227385A (zh) 2021-08-06

Family

ID=67766358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980065714.1A Pending CN113227385A (zh) 2018-08-09 2019-08-09 核酸分子及其用于非病毒基因疗法的用途

Country Status (15)

Country Link
US (1) US20200069817A1 (zh)
EP (1) EP3833766A1 (zh)
JP (1) JP2021533753A (zh)
KR (1) KR20210042128A (zh)
CN (1) CN113227385A (zh)
AU (1) AU2019319984A1 (zh)
BR (1) BR112021002017A2 (zh)
CA (1) CA3108799A1 (zh)
CO (1) CO2021002965A2 (zh)
IL (1) IL280652A (zh)
MX (1) MX2021001599A (zh)
PH (1) PH12021500010A1 (zh)
SG (1) SG11202101157VA (zh)
TW (1) TW202023630A (zh)
WO (1) WO2020033863A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114250224A (zh) * 2021-12-16 2022-03-29 福建和瑞基因科技有限公司 一种用于提取或检测样本中小分子rna的核酸组合物及其试剂盒和方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10842885B2 (en) 2018-08-20 2020-11-24 Ucl Business Ltd Factor IX encoding nucleotides
CN111334528B (zh) * 2020-03-20 2022-02-18 山东农业大学 水貂肠炎细小病毒全基因组感染性克隆及其构建方法和应用
EP4189098A1 (en) 2020-07-27 2023-06-07 Anjarium Biosciences AG Compositions of dna molecules, methods of making therefor, and methods of use thereof
AU2021330936A1 (en) * 2020-08-23 2023-05-04 Bioverativ Therapeutics Inc. MODIFIED BACULOVIRUS SYSTEM FOR IMPROVED PRODUCTION OF CLOSED-ENDED DNA (ceDNA)
CN112704729A (zh) * 2020-12-28 2021-04-27 江苏纳迪芯生命科技研究院有限公司 一种细胞因子颗粒
CA3211687A1 (en) * 2021-03-19 2022-09-22 Ozan ALKAN Non-viral dna vectors and uses thereof for expressing pfic therapeutics
CN113325181A (zh) * 2021-04-25 2021-08-31 苏州市立医院(北区) 丝氨酸蛋白酶抑制剂在用于脓毒症早期预警的标志物中的应用
WO2022232029A2 (en) * 2021-04-26 2022-11-03 University Of Florida Research Foundation, Incorporated Synthetic aav vectors for repeated delivery of therapeutic genes
WO2022272056A2 (en) * 2021-06-24 2022-12-29 University Of Utah Research Foundation Compositions and methods for treating pgm1 deficiency
AU2022334711A1 (en) 2021-08-23 2024-04-04 Bioverativ Therapeutics Inc. Baculovirus expression system
WO2023028441A1 (en) 2021-08-23 2023-03-02 Bioverativ Therapeutics Inc. Engineered itr sequences and methods of use
TW202346327A (zh) * 2021-09-30 2023-12-01 美商百歐維拉提夫治療公司 編碼具有降低免疫原性的因子viii多肽之核酸
WO2023135273A2 (en) * 2022-01-14 2023-07-20 Anjarium Biosciences Ag Compositions of dna molecules encoding factor viii, methods of making thereof, and methods of use thereof
CN116064673A (zh) * 2022-10-19 2023-05-05 河南省人民医院 表达rs1的重组腺相关病毒载体及其应用

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008469A1 (en) * 2004-07-09 2006-01-12 Government Of The United States, As Represented By The Secretary, Dept. Of Health And Human Services Infectious clone of human parvovirus B19 and methods
US20070253936A1 (en) * 2006-01-31 2007-11-01 Kay Mark A Self-complementary parvoviral vectors, and methods for making and using the same
CN101124328A (zh) * 2004-12-15 2008-02-13 北卡罗来纳查佩尔山大学 嵌合载体
WO2011100330A2 (en) * 2010-02-12 2011-08-18 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Compositions and methods for preventing or treating a human parvovirus infection
US20130109742A1 (en) * 2010-01-12 2013-05-02 Curtis Hewitt Restrictive Inverted Terminal Repeats for Viral Vectors
US20140271551A1 (en) * 2013-03-15 2014-09-18 The University Of North Carolina At Chapel Hill Synthetic Adeno-Associated Virus Inverted Terminal Repeats
US20160229904A1 (en) * 2015-02-06 2016-08-11 The University Of North Carolina At Chapel Hill Optimized Human Clotting Factor VIII Gene Expression Cassettes and Their Use
US20170081392A1 (en) * 2014-05-13 2017-03-23 The Trustees Of The University Of Pennsylvania Compositions comprising aav expressing dual antibody constructs and uses thereof
US20170130245A1 (en) * 2014-06-09 2017-05-11 Voyager Therapeutics, Inc. Chimeric capsids
US20170356009A1 (en) * 2014-11-21 2017-12-14 University Of Florida Research Foundation, Inc. Genome-modified recombinant adeno-associated virus vectors
CN111247251A (zh) * 2017-08-09 2020-06-05 比奥维拉迪维治疗股份有限公司 核酸分子及其用途

Family Cites Families (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
DE3683980D1 (de) 1985-04-12 1992-04-02 Genetics Inst Neue prokoagulierungsproteine.
EP0218713B1 (en) 1985-04-22 1992-03-25 Genetics Institute, Inc. High yield production of active factor ix
KR910006424B1 (ko) 1985-08-21 1991-08-24 인코텍스 비.브이 편성브리프(brief) 제조방법
WO1987004187A1 (en) 1986-01-03 1987-07-16 Genetics Institute, Inc. METHOD FOR PRODUCING FACTOR VIII:c-TYPE PROTEINS
US5595886A (en) 1986-01-27 1997-01-21 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5610278A (en) 1986-06-24 1997-03-11 Novo Nordisk A/S Process for producing a coagulation active complex of factor VIII fragments
DE3883899T3 (de) 1987-03-18 1999-04-22 Sb2 Inc Geänderte antikörper.
US6060447A (en) 1987-05-19 2000-05-09 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US6346513B1 (en) 1987-06-12 2002-02-12 Baxter Trading Gmbh Proteins with factor VIII activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
IE69026B1 (en) 1987-06-12 1996-08-07 Immuno Ag Novel proteins with factor VIII activity process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
DE3720246A1 (de) 1987-06-19 1988-12-29 Behringwerke Ag Faktor viii:c-aehnliches molekuel mit koagulationsaktivitaet
FR2619314B1 (fr) 1987-08-11 1990-06-15 Transgene Sa Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant
US6780613B1 (en) 1988-10-28 2004-08-24 Genentech, Inc. Growth hormone variants
EP0461200B1 (en) 1989-02-21 1997-01-22 Washington University Modified forms of reproductive hormones
SE465222C5 (sv) 1989-12-15 1998-02-10 Pharmacia & Upjohn Ab Ett rekombinant, humant faktor VIII-derivat och förfarande för dess framställning
IE922437A1 (en) 1991-07-25 1993-01-27 Idec Pharma Corp Recombinant antibodies for human therapy
SE504074C2 (sv) 1993-07-05 1996-11-04 Pharmacia Ab Proteinberedning för subkutan, intramuskulär eller intradermal administrering
GB9422383D0 (en) 1994-11-05 1995-01-04 Wellcome Found Antibodies
US6030613A (en) 1995-01-17 2000-02-29 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6485726B1 (en) 1995-01-17 2002-11-26 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6086875A (en) 1995-01-17 2000-07-11 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of immunogens
US5869046A (en) 1995-04-14 1999-02-09 Genentech, Inc. Altered polypeptides with increased half-life
US6121022A (en) 1995-04-14 2000-09-19 Genentech, Inc. Altered polypeptides with increased half-life
US6096871A (en) 1995-04-14 2000-08-01 Genentech, Inc. Polypeptides altered to contain an epitope from the Fc region of an IgG molecule for increased half-life
US5739277A (en) 1995-04-14 1998-04-14 Genentech Inc. Altered polypeptides with increased half-life
SE9503380D0 (sv) 1995-09-29 1995-09-29 Pharmacia Ab Protein derivatives
US6458563B1 (en) 1996-06-26 2002-10-01 Emory University Modified factor VIII
EP0918872B1 (en) 1996-08-02 2008-02-20 Bristol-Myers Squibb Company A method for inhibiting immunoglobulin-induced toxicity resulting from the use of immunoglobulins in therapy and in vivo diagnosis
WO1998023289A1 (en) 1996-11-27 1998-06-04 The General Hospital Corporation MODULATION OF IgG BINDING TO FcRn
US6277375B1 (en) 1997-03-03 2001-08-21 Board Of Regents, The University Of Texas System Immunoglobulin-like domains with increased half-lives
CA2225189C (en) 1997-03-06 2010-05-25 Queen's University At Kingston Canine factor viii gene, protein and methods of use
GB9722131D0 (en) 1997-10-20 1997-12-17 Medical Res Council Method
US6242195B1 (en) 1998-04-02 2001-06-05 Genentech, Inc. Methods for determining binding of an analyte to a receptor
US6194551B1 (en) 1998-04-02 2001-02-27 Genentech, Inc. Polypeptide variants
DE69937291T2 (de) 1998-04-02 2008-07-10 Genentech, Inc., South San Francisco Antikörpervarianten und fragmente davon
US6528624B1 (en) 1998-04-02 2003-03-04 Genentech, Inc. Polypeptide variants
GB9809951D0 (en) 1998-05-08 1998-07-08 Univ Cambridge Tech Binding molecules
AU770555B2 (en) 1998-08-17 2004-02-26 Abgenix, Inc. Generation of modified molecules with increased serum half-lives
EP1006183A1 (en) 1998-12-03 2000-06-07 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Recombinant soluble Fc receptors
EP2386574A3 (en) 1999-01-15 2012-06-27 Genentech, Inc. Polypeptide variants with altered effector function
US6737056B1 (en) 1999-01-15 2004-05-18 Genentech, Inc. Polypeptide variants with altered effector function
JP2003530839A (ja) 2000-04-12 2003-10-21 プリンシピア ファーマスーティカル コーポレイション アルブミン融合タンパク質
WO2002040544A2 (en) 2000-11-14 2002-05-23 Board Of Regents, University Of Texas Systems Mutant human factor ix with an increased resistance to inhibition by heparin
GB0029407D0 (en) 2000-12-01 2001-01-17 Affitech As Product
EP2357187A1 (en) 2000-12-12 2011-08-17 MedImmune, LLC Molecules with extended half-lives, compositions and uses thereof
JP4336771B2 (ja) 2001-03-09 2009-09-30 モルフォシス アーゲー 血清アルブミン結合部分
DE60233047D1 (de) 2001-05-14 2009-09-03 Gbp Ip Llc Lentivirale vektoren kodierend für gerinnungsfaktoren für die gentherapie
CA2457429A1 (en) 2001-09-04 2003-03-13 Francis J. Carr Modified factor ix
KR101271635B1 (ko) 2001-12-21 2013-06-12 휴먼 게놈 사이언시즈, 인코포레이티드 알부민 융합 단백질
EP2261250B1 (en) 2001-12-21 2015-07-01 Human Genome Sciences, Inc. GCSF-Albumin fusion proteins
US20080194481A1 (en) 2001-12-21 2008-08-14 Human Genome Sciences, Inc. Albumin Fusion Proteins
US20040002587A1 (en) 2002-02-20 2004-01-01 Watkins Jeffry D. Fc region variants
US20040132101A1 (en) 2002-09-27 2004-07-08 Xencor Optimized Fc variants and methods for their generation
AU2003209446B2 (en) 2002-03-01 2008-09-25 Immunomedics, Inc. Bispecific antibody point mutations for enhancing rate of clearance
US7317091B2 (en) 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
WO2003077834A2 (en) 2002-03-15 2003-09-25 The Brigham And Women's Hospital, Inc. Central airway administration for systemic delivery of therapeutics
US7425620B2 (en) 2002-08-14 2008-09-16 Scott Koenig FcγRIIB-specific antibodies and methods of use thereof
DK1553975T3 (da) 2002-09-27 2012-05-07 Xencor Inc Optimerede Fc-varianter og fremgangsmåder til generering heraf.
PT1562972E (pt) 2002-10-15 2010-11-10 Facet Biotech Corp Alteração de afinidades de ligação ao fcrn ou semi-vidas séricas de anticorpos por mutagénese
GB2395337B (en) 2002-11-14 2005-12-28 Gary Michael Wilson Warning Unit
EP2368578A1 (en) 2003-01-09 2011-09-28 Macrogenics, Inc. Identification and engineering of antibodies with variant Fc regions and methods of using same
US7041635B2 (en) 2003-01-28 2006-05-09 In2Gen Co., Ltd. Factor VIII polypeptide
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
US8388955B2 (en) 2003-03-03 2013-03-05 Xencor, Inc. Fc variants
DK1616012T3 (da) 2003-04-24 2008-04-21 San Raffaele Centro Fond Lentivirale vektorer bærende syntetiske bidirektionelle promotorer og anvendelser deraf
TWI353991B (en) 2003-05-06 2011-12-11 Syntonix Pharmaceuticals Inc Immunoglobulin chimeric monomer-dimer hybrids
GB0324368D0 (en) 2003-10-17 2003-11-19 Univ Cambridge Tech Polypeptides including modified constant regions
US20050249723A1 (en) 2003-12-22 2005-11-10 Xencor, Inc. Fc polypeptides with novel Fc ligand binding sites
BRPI0506771A (pt) 2004-01-12 2007-05-22 Applied Molecular Evolution anticorpo, e, composição farmacêutica
AU2005227326B2 (en) 2004-03-24 2009-12-03 Xencor, Inc. Immunoglobulin variants outside the Fc region
WO2005123780A2 (en) 2004-04-09 2005-12-29 Protein Design Labs, Inc. Alteration of fcrn binding affinities or serum half-lives of antibodies by mutagenesis
WO2006085967A2 (en) 2004-07-09 2006-08-17 Xencor, Inc. OPTIMIZED ANTI-CD20 MONOCONAL ANTIBODIES HAVING Fc VARIANTS
EP3342782B1 (en) 2004-07-15 2022-08-17 Xencor, Inc. Optimized fc variants
WO2006047350A2 (en) 2004-10-21 2006-05-04 Xencor, Inc. IgG IMMUNOGLOBULIN VARIANTS WITH OPTIMIZED EFFECTOR FUNCTION
EP2002003B1 (en) 2005-05-27 2015-12-30 Ospedale San Raffaele S.r.l. Gene vector comprising mi-rna
WO2006126972A1 (en) * 2005-05-27 2006-11-30 Agency For Science, Technology And Research Method of delivering nucleic acid molecules into embryonic stem cells using baculoviral vectors
WO2007021494A2 (en) 2005-08-12 2007-02-22 Human Genome Sciences, Inc. Albumin fusion proteins
US8048848B2 (en) 2006-02-03 2011-11-01 Prolor Biotech Ltd. Long-acting interferons and derivatives thereof and methods thereof
US7939632B2 (en) 2006-06-14 2011-05-10 Csl Behring Gmbh Proteolytically cleavable fusion proteins with high molar specific activity
WO2007149406A2 (en) 2006-06-19 2007-12-27 Nautilus Technology Llc Modified coagulation factor ix polypeptides and use thereof for treatment
GB0614780D0 (en) 2006-07-25 2006-09-06 Ucb Sa Biological products
US20100254944A1 (en) 2006-09-14 2010-10-07 Mani Subramanian Albumin Fusion Proteins
US7700734B2 (en) 2007-01-09 2010-04-20 Shu-Wha Lin Recombinant human factor IX and use thereof
WO2008131242A1 (en) 2007-04-18 2008-10-30 Zymogenetics, Inc. Single chain fc, methods of making and methods of treatment
NZ581395A (en) 2007-05-14 2012-08-31 Biogen Idec Inc Single-chain fc (scfc) regions, binding polypeptides comprising same, and methods related thereto
DK2369005T3 (da) 2007-06-21 2013-06-24 Univ Muenchen Tech Biologisk aktive proteiner med forøget stabilitet in vivo og/eller in vitro
WO2009051717A2 (en) 2007-10-15 2009-04-23 The University Of North Carolina At Chapel Hill Human factor ix variants with an extended half life
AU2009244633A1 (en) 2008-04-16 2009-11-12 Bayer Healthcare Llc Modified Factor IX polypeptides and uses thereof
CA2721362A1 (en) 2008-04-16 2009-11-19 Bayer Healthcare Llc Site-directed modification of factor ix
EP2811017A2 (en) 2008-04-21 2014-12-10 Novo Nordisk Health Care AG Hyperglycosylated human coagulation factor IX
WO2010055413A1 (en) 2008-11-12 2010-05-20 Fondazione Centro San Raffaele Del Monte Tabor Gene vector for inducing transgene-specific immune tolerance
EP3178835B1 (en) 2009-02-03 2019-04-10 Amunix Pharmaceuticals, Inc. Extended recombinant polypeptides and compositions comprising same
US8680050B2 (en) 2009-02-03 2014-03-25 Amunix Operating Inc. Growth hormone polypeptides fused to extended recombinant polypeptides and methods of making and using same
US8703717B2 (en) 2009-02-03 2014-04-22 Amunix Operating Inc. Growth hormone polypeptides and methods of making and using same
WO2010125471A2 (en) 2009-04-30 2010-11-04 Fondazione Centro San Raffaele Del Monte Tabor Gene vector
WO2010140148A1 (en) 2009-06-01 2010-12-09 Yeda Research And Development Co . Ltd Prodrugs containing albumin binding probe
LT2440241T (lt) 2009-06-08 2017-10-10 Amunix Operating Inc. Augimo hormonų polipeptidai ir jų gamybos bei panaudojimo būdai
JP5839597B2 (ja) 2009-06-08 2016-01-06 アムニクス オペレーティング インコーポレイテッド グルコース調節ポリペプチド並びにその作成及び使用方法
GB0911870D0 (en) * 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
EP2470670A4 (en) 2009-08-24 2013-07-10 Amunix Operating Inc COAGULATION FACTOR VII COMPOSITIONS AND METHODS OF PREPARATION AND USE THEREOF
WO2011028344A2 (en) 2009-08-25 2011-03-10 Amunix Operating Inc. Interleukin-1 receptor antagonist compositions and methods of making and using same
PT2591006T (pt) 2010-07-09 2019-07-29 Bioverativ Therapeutics Inc Moléculas de cadeia simples processáveis e polipéptidos preparados utilizando as mesmas
CN103140237A (zh) 2010-07-09 2013-06-05 比奥根艾迪克依蒙菲利亚公司 因子ix多肽及其使用方法
EP2500434A1 (en) * 2011-03-12 2012-09-19 Association Institut de Myologie Capsid-free AAV vectors, compositions, and methods for vector production and gene delivery
EP2804623B1 (en) 2012-01-12 2019-08-07 Bioverativ Therapeutics Inc. Chimeric factor viii polypeptides and uses thereof
CN104254614A (zh) 2012-01-12 2014-12-31 比奥根艾迪克Ma公司 降低经受因子viii疗法的个体中针对因子viii的免疫原性的方法
HUE046848T2 (hu) 2012-02-15 2020-03-30 Bioverativ Therapeutics Inc VIII. faktor készítmények és eljárások elõállításukra és alkalmazásukra
EP2822577B1 (en) 2012-02-15 2019-02-06 Bioverativ Therapeutics Inc. Recombinant factor viii proteins
SG10201701037WA (en) 2012-07-11 2017-03-30 Amunix Operating Inc Factor viii complex with xten and von willebrand factor protein, and uses thereof
ES2776195T3 (es) 2013-03-15 2020-07-29 Bioverativ Therapeutics Inc Formulaciones de polipéptido de factor VIII
EP4108254A1 (en) * 2013-08-14 2022-12-28 Bioverativ Therapeutics Inc. Recombinant factor viii proteins
US10548953B2 (en) 2013-08-14 2020-02-04 Bioverativ Therapeutics Inc. Factor VIII-XTEN fusions and uses thereof
HUE059820T2 (hu) 2014-01-10 2022-12-28 Bioverativ Therapeutics Inc VIII-as faktor kimérafehérjéi és azok alkalmazása
US11008561B2 (en) 2014-06-30 2021-05-18 Bioverativ Therapeutics Inc. Optimized factor IX gene
WO2016134338A1 (en) * 2015-02-19 2016-08-25 University Of Florida Research Foundation, Inc. Recombinant aav vectors for gene therapy of human hematopoietic disorders
JP7217630B2 (ja) * 2016-02-01 2023-02-03 バイオベラティブ セラピューティクス インコーポレイテッド 最適化第viii因子遺伝子

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008469A1 (en) * 2004-07-09 2006-01-12 Government Of The United States, As Represented By The Secretary, Dept. Of Health And Human Services Infectious clone of human parvovirus B19 and methods
CN101124328A (zh) * 2004-12-15 2008-02-13 北卡罗来纳查佩尔山大学 嵌合载体
US20070253936A1 (en) * 2006-01-31 2007-11-01 Kay Mark A Self-complementary parvoviral vectors, and methods for making and using the same
US20130109742A1 (en) * 2010-01-12 2013-05-02 Curtis Hewitt Restrictive Inverted Terminal Repeats for Viral Vectors
WO2011100330A2 (en) * 2010-02-12 2011-08-18 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Compositions and methods for preventing or treating a human parvovirus infection
US20140271551A1 (en) * 2013-03-15 2014-09-18 The University Of North Carolina At Chapel Hill Synthetic Adeno-Associated Virus Inverted Terminal Repeats
US20170081392A1 (en) * 2014-05-13 2017-03-23 The Trustees Of The University Of Pennsylvania Compositions comprising aav expressing dual antibody constructs and uses thereof
US20170130245A1 (en) * 2014-06-09 2017-05-11 Voyager Therapeutics, Inc. Chimeric capsids
US20170356009A1 (en) * 2014-11-21 2017-12-14 University Of Florida Research Foundation, Inc. Genome-modified recombinant adeno-associated virus vectors
US20160229904A1 (en) * 2015-02-06 2016-08-11 The University Of North Carolina At Chapel Hill Optimized Human Clotting Factor VIII Gene Expression Cassettes and Their Use
CN111247251A (zh) * 2017-08-09 2020-06-05 比奥维拉迪维治疗股份有限公司 核酸分子及其用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANYE WANG: "Sequencing and generation of an infectious clone of the pathogenic goose parvovirus strain LH", 《ARCH VIROL .》, vol. 160, no. 3, pages 711 - 718, XP035455223, DOI: 10.1007/s00705-014-2319-5 *
贺冬梅: "鹅细小病毒HN株的分离鉴定及全基因组序列分析", 《动物医学进展》, vol. 37, no. 12, pages 13 - 18 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114250224A (zh) * 2021-12-16 2022-03-29 福建和瑞基因科技有限公司 一种用于提取或检测样本中小分子rna的核酸组合物及其试剂盒和方法
CN114250224B (zh) * 2021-12-16 2024-02-27 福建和瑞基因科技有限公司 一种用于提取或检测样本中小分子rna的核酸组合物及其试剂盒和方法

Also Published As

Publication number Publication date
WO2020033863A1 (en) 2020-02-13
EP3833766A1 (en) 2021-06-16
MX2021001599A (es) 2021-07-02
AU2019319984A1 (en) 2021-03-04
TW202023630A (zh) 2020-07-01
CO2021002965A2 (es) 2021-03-19
US20200069817A1 (en) 2020-03-05
BR112021002017A2 (pt) 2021-05-11
CA3108799A1 (en) 2020-02-13
IL280652A (en) 2021-03-25
KR20210042128A (ko) 2021-04-16
PH12021500010A1 (en) 2021-10-11
SG11202101157VA (en) 2021-03-30
JP2021533753A (ja) 2021-12-09

Similar Documents

Publication Publication Date Title
CN113227385A (zh) 核酸分子及其用于非病毒基因疗法的用途
CN111247251A (zh) 核酸分子及其用途
CN108093639B (zh) 用于肝脏中蛋白质表达的重组启动子和载体及其用途
CN109072214B (zh) 优化的因子viii基因
KR20190100318A (ko) 페닐케톤뇨증을 치료하기 위한 유전자 치료
KR20210102882A (ko) 핵산 구조체 및 사용 방법
KR20210102881A (ko) 인자 ix의 발현을 위한 조성물 및 방법
CN111918674A (zh) 表达因子viii的慢病毒载体的用途
KR20210102883A (ko) 알부민 좌위로부터 트랜스진을 발현하기 위한 조성물 및 방법
KR20210005889A (ko) Cns 퇴행에 대한 유전자 요법
KR20210082460A (ko) 프로피온산혈증을 치료하기 위한 유전자 요법
KR20230129162A (ko) 제1형 근긴장성 이영양증을 치료하기 위한 rna 표적화조성물 및 방법
KR20230023641A (ko) Gjb2-연관 난청을 치료하기 위한 조성물 및 방법
KR20230136147A (ko) 유전성 혈관부종을 치료하기 위한 조성물 및 방법
RU2803163C2 (ru) Применение лентивирусных векторов, экспрессирующих фактор viii
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)
TW202323274A (zh) 優化因子viii基因
TW202346327A (zh) 編碼具有降低免疫原性的因子viii多肽之核酸
KR20240021799A (ko) 청력 손실을 치료하기 위한 유전자 치료 전달 조성물 및 방법
KR20240049332A (ko) 최적화된 인자 viii 유전자
CN117813101A (zh) 用于治疗听力损失的基因疗法递送组合物和方法
CN117836420A (zh) 重组tert编码病毒基因组和运载体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination