CN112041437A - 用于恢复f8基因功能的腺相关病毒组合物和其使用方法 - Google Patents

用于恢复f8基因功能的腺相关病毒组合物和其使用方法 Download PDF

Info

Publication number
CN112041437A
CN112041437A CN201980025614.6A CN201980025614A CN112041437A CN 112041437 A CN112041437 A CN 112041437A CN 201980025614 A CN201980025614 A CN 201980025614A CN 112041437 A CN112041437 A CN 112041437A
Authority
CN
China
Prior art keywords
amino acid
seq
capsid protein
protein corresponding
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980025614.6A
Other languages
English (en)
Inventor
S.查特吉
L.J.史密斯
J.L.埃尔斯沃思
H.鲁宾
J.B.赖特
J.A.麦克斯维甘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
City of Hope
Cognate3 LLC
Original Assignee
City of Hope
Cognate3 LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by City of Hope, Cognate3 LLC filed Critical City of Hope
Publication of CN112041437A publication Critical patent/CN112041437A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10041Use of virus, viral particle or viral elements as a vector
    • C12N2710/10042Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10041Use of virus, viral particle or viral elements as a vector
    • C12N2710/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10061Methods of inactivation or attenuation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Hematology (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本文提供可恢复细胞中的F8基因功能的腺相关病毒(adeno‑associated virus;AAV)组合物。还提供了用于制备腺相关病毒组合物的包装系统。

Description

用于恢复F8基因功能的腺相关病毒组合物和其使用方法
相关申请
本申请要求于2018年2月19日提交的第62/632,300号美国临时专利申请、2018年2月20日提交的第62/639,919号美国临时专利申请和2018年5月16日提交的第62/672,385号美国临时专利申请的优先权,其全部公开在此以引用的方式并入本文中。
以电子方式提交的序列表的参考
ASCII文本文件(名称:610416_HMT-026PC_SeqList_ST25.txt;大小:156,992字节;和创建日期:2019年2月10日)中以电子方式提交的序列表的内容以全文引用的方式并入本文中。
政府权益声明
本发明是在政府支持下在由美国国家卫生研究院(National Institutes ofHealth)授予的授权号P30CA033572下进行。政府在本发明中享有一定权利。
背景技术
VIII因子(Factor VIII;FVIII),也称为抗血友病因子,是一种对正常凝血很重要的循环糖蛋白。VIII因子是由肝窦内皮细胞和肝外内皮细胞产生的。这种蛋白以无活性形式在血流中循环,与另一种称为血管性血友病因子(von Willebrand factor;vWF)的分子结合,直到发生损害血管的损伤为止。响应于损伤,FVIII被激活且与vWF分离。活性蛋白FVIIIa与另一称为IX因子的凝血因子相互作用,起始一系列额外的形成血凝块的化学反应。
型血友病A,也称为VIII因子缺乏症或典型血友病,是由VIII因子缺失或缺陷引起的遗传性或自发性遗传病症。在大多数情况下,它是X连锁隐性遗传的,而近三分之一的情况是由自发突变引起。临床上,血友病A的特征是内部或外部出血发作。血友病较重的个体出血更严重且更频繁,而轻度血友病的个体除手术或严重创伤后通常症状更轻;中度血友病的个体具有不同症状,这些症状在重度和轻度形式之间出现。
FVIII的基因F8位于Xq28区域内的X染色体长臂上。所述基因代表X染色体的186kb。其包括含有26个外显子和25个内含子的9kb编码区。成熟的FVIII是一种含有2332个氨基酸的单链多肽。严重FVIII缺乏症的病例中大致有40%由涉及干扰F8基因的内含子22的大倒位引起。缺失、插入和点突变占了导致血友病A的F8缺陷的剩余50-60%。
目前尚无法治愈血友病A。对于中度至重度血友病A或急性出血发作的患者,治疗通常涉及输注来自捐赠人血的重组FVIII或FVIII。还可以通过定期输注FVIII或去氨加压素(DDAVP)预防性治疗患者,后者直接促进血管性血友病因子(vWF)的释放且间接提升FVIII半衰期。
基因疗法为治愈遗传病症提供独特的机会。反转录病毒载体,包含慢病毒载体,能够将核酸整合到宿主细胞基因组中。然而,由于这些载体非靶向地插入基因组中,因此可能产生安全问题。举例来说,存在载体破坏肿瘤抑制基因或激活癌基因从而引起恶性肿瘤的风险。实际上,在一项通过用γ-反转录病毒载体转导CD34+骨髓前体来治疗X连锁重症联合免疫缺陷症(X-linked severe combined immunodeficiency;X-SCID)的临床试验中,十分之四的患者患有白血病(Hacein-Bey-Abina等人,《临床研究杂志(J.Clin.Invest.)》(2008)118(9):3132-42)。
可以使用基于核酸酶的基因编辑技术,例如大范围核酸酶、锌指核酸酶(zincfinger nuclease;ZFN)、转录活化因子样效应物核酸酶(transcription activator-likeeffector nucleases;TALEN),和聚类规则间隔的短回文重复(clustered,regularlyinterspaced,short palindromic repeat;CRISPR)技术,来校正患者基因中的缺陷。然而,由于人类基因组中与预期靶位点序列相似的位点可能发生脱靶突变,因此这些技术中的每一种均会引起安全问题。
因此,本领域需要可有效且安全地恢复血友病A患者中的F8基因功能的改进的基因治疗组合物和方法。
发明内容
本文提供可恢复细胞中的F8基因功能的腺相关病毒(adeno-associated virus;AAV)组合物,和使用其来治疗与F8基因功能降低相关联的疾病(例如血友病A)的方法。还提供用于制备腺相关病毒组合物的包装系统。
本文中所公开的AAV组合物和方法特别有利,因为其允许活体内高效校正F8基因中的突变,而无需使用外源性核酸酶(例如大范围核酸酶、锌指核酸酶、转录活化因子样核酸酶(TALEN)或RNA引导的核酸酶,如Cas9)。
因此,在一个方面中,本公开提供一种复制缺陷型腺相关病毒(AAV),其包括:AAV衣壳;和校正基因组,其包括:(i)用于编辑F8基因中的靶基因座的编辑元件;(ii)所述编辑元件5'的5'同源臂核苷酸序列,所述核苷酸序列与靶基因座5'的第一基因组区域具有同源性;和(iii)所述编辑元件3'的3'同源臂核苷酸序列,所述核苷酸序列与靶基因座3'的第二基因组区域具有同源性,其中包括5'同源臂、编辑元件和3'同源臂的所述校正基因组的所述部分可相对于F8基因基因座在有义或反义取向上。
在另一方面中,一种用于校正细胞中的F8基因中的突变的方法,所述方法包括用复制缺陷型腺相关病毒(AAV)转导细胞,所述腺相关病毒包括:AAV衣壳;和校正基因组,其包括:(i)用于编辑F8基因中的靶基因座的编辑元件;(ii)所述编辑元件5'的5'同源臂核苷酸序列,所述核苷酸序列与靶基因座5'的第一基因组区域具有同源性;和(iii)所述编辑元件3'的3'同源臂核苷酸序列,所述核苷酸序列与靶基因座3'的第二基因组区域具有同源性,其中包括5'同源臂、编辑元件和3'同源臂的所述校正基因组的所述部分可相对于F8基因基因座在有义或反义取向上,其中转导细胞无需共转导或共施用外源性核酸酶或编码外源性核酸酶的核苷酸序列。
在某些实施例中,细胞是肝细胞或内皮细胞。在某些实施例中,内皮细胞是肝窦内皮细胞。在某些实施例中,细胞是在哺乳动物受试者中,且以有效转导受试者中的细胞的量向受试者施用AAV。
在另一方面中,本公开提供一种用于治疗患有与F8基因突变相关联的疾病或病症的受试者的方法,所述方法包括向受试者施用有效量的复制缺陷型AAV,所述AAV包括:包括AAV进化枝F衣壳蛋白的AAV衣壳;和校正基因组,其包括:(i)用于编辑F8基因中的靶基因座的编辑元件;(ii)编辑元件5'的5'同源臂核苷酸序列,所述核苷酸序列与靶基因座5'的第一基因组区域具有同源性;和(iii)编辑元件3'的3'同源臂核苷酸序列,所述核苷酸序列与靶基因座3'的第二基因组区域具有同源性,其中不向受试者共施用外源性核酸酶或编码外源性核酸酶的核苷酸序列。
在某些实施例中,疾病或病症是血友病A。在某些实施例中,受试者是人类受试者。
以下实施例适用于前述方面中的每个方面。
在某些实施例中,编辑元件包括F8编码序列的一部分。在某些实施例中,F8编码序列的部分编码SEQ ID NO:25中所阐述的氨基酸序列。在某些实施例中,F8编码序列的部分包含或由以下组成:SEQ ID NO:26中所阐述的序列。在某些实施例中,F8编码序列的部分被沉默改变。
在某些实施例中,编辑元件5'到3'包括F8编码序列的一部分和聚腺苷酸化序列。在某些实施例中,F8编码序列的部分由SEQ ID NO:26中所阐述的序列组成。在某些实施例中,靶基因座是F8基因的核苷酸126,476与核苷酸126,477之间的核苷酸间键。在某些实施例中,靶基因座是与F8基因的核苷酸126,476 3'相邻的核苷酸序列。
在某些实施例中,编辑元件5'到3'包括剪接受体位点、F8编码序列的一部分和任选地聚腺苷酸化序列。在某些实施例中,与靶基因座5'相邻的核苷酸在F8基因的内含子中。在某些实施例中,F8编码序列的部分由SEQ ID NO:26中所阐述的序列组成。在某些实施例中,与靶基因座5'相邻的核苷酸在F8基因的内含子22中。
在某些实施例中,聚腺苷酸化序列是外源性聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。在某些实施例中,SV40聚腺苷酸化序列具有SEQ ID NO:23、35、36或37中所阐述的核苷酸序列。
在某些实施例中,编辑元件包括SEQ ID NO:33中所阐述的核酸序列。
在某些实施例中,5'同源臂核苷酸序列与第一基因组区域至少90%、95%、96%、97%、98%或99%一致。在某些实施例中,3'同源臂核苷酸序列与第二基因组区域至少90%、95%、96%、97%、98%或99%一致。在某些实施例中,第一基因组区域位于第一编辑窗口中,且第二基因组区域位于第二编辑窗口中。在某些实施例中,第一编辑窗口由SEQ IDNO:31、32或34中所阐述的核苷酸序列组成。在某些实施例中,第二编辑窗口由SEQ ID NO:31、32或34中所阐述的核苷酸序列组成。在某些实施例中,第一编辑窗口由SEQ ID NO:31中所阐述的核苷酸序列组成,且第二编辑窗口由SEQ ID NO:32中所阐述的核苷酸序列组成。
在某些实施例中,第一基因组区域由SEQ ID NO:31中所阐述的核苷酸序列组成。在某些实施例中,第二基因组区域由SEQ ID NO:32中所阐述的核苷酸序列组成。
在某些实施例中,5'和3'同源臂核苷酸序列中的每一个独立地具有约100到约4500个核苷酸的长度。在某些实施例中,校正基因组包括选自SEQ ID NO:38-41组成的组的核酸序列。
在某些实施例中,校正基因组进一步包括5'同源臂核苷酸序列5'的5'反向末端重复(5'inverted terminal repeat;5'ITR)核苷酸序列和3'同源臂核苷酸序列3'的3'反向末端重复(3'inverted terminal repeat;3'ITR)核苷酸序列。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少95%序列一致性,且3'ITR核苷酸序列与SEQ ID NO:19、61或63具有至少95%序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:20具有至少95%序列一致性,且3'ITR核苷酸序列与SEQ ID NO:21具有至少95%序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:46具有至少95%序列一致性,且3'ITR核苷酸序列与SEQ ID NO:19、61或63具有至少95%序列一致性。
在某些实施例中,校正基因组包括选自SEQ ID NO:42-45组成的组的核酸序列。在某些实施例中,校正基因组由选自SEQ ID NO:42-45组成的组的核酸序列组成。
在某些实施例中,当在不存在外源性核酸酶的情况下在标准AAV转导条件条件下将AAV与B淋巴母细胞群体活体外接触时,编辑元件整合到靶基因座中的整合效率为至少2%。在某些实施例中,当在不存在外源性核酸酶的情况下在标准AAV转导条件下将AAV与B淋巴母细胞群体活体外接触时,编辑元件整合到靶基因座中的等位基因频率为至少1%。
在某些实施例中,AAV衣壳包括AAV进化枝F衣壳蛋白。
在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
在某些实施例中,
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
在某些实施例中,衣壳蛋白包括SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸160的氨基酸是D;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白质中对应于SEQID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白质中对应于SEQ IDNO:2的氨基酸590的氨基酸是R;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白质中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
在某些实施例中,
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
在某些实施例中,衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。在某些实施例中,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸2的氨基酸是T;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I;所述衣壳蛋白中对应于SEQ IDNO:2的氨基酸68的氨基酸是V;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸160的氨基酸是D;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
在某些实施例中,
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸2的氨基酸是T,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是Y;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(f)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(g)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(h)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(i)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
在某些实施例中,衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在另一方面中,本公开提供一种药物组合物,其包括本文中所描述的AAV。
在另一方面中,本公开提供一种用于重组制备AAV的包装系统,其中包装系统包括:编码一种或多种AAV Rep蛋白的Rep核苷酸序列;和编码本文中所描述的一种或多种AAV进化枝F衣壳蛋白的Cap核苷酸序列;以及本文中所描述的校正基因组,其中包装系统在细胞中可操作以将校正基因组封闭在衣壳中以形成AAV。
在某些实施例中,包装系统包括含Rep核苷酸序列和Cap核苷酸序列的第一载体以及含校正基因组的第二载体。在某些实施例中,Rep核苷酸序列编码AAV2 Rep蛋白。在某些实施例中,AAV2 Rep蛋白是78/68或Rep 68/52。在某些实施例中,AAV2 Rep蛋白包括与SEQID NO:22的AAV2 Rep氨基酸序列具有最小百分比序列一致性的氨基酸序列,其中最小百分比序列一致性在编码AAV2 Rep蛋白的氨基酸序列的整个长度上为至少70%。
在某些实施例中,包装系统进一步包括第三载体,其中第三载体是辅助病毒载体。在某些实施例中,辅助病毒载体是独立的第三载体。在某些实施例中,辅助病毒载体与第一载体整合在一起。在某些实施例中,辅助病毒载体与第二载体整合在一起。在某些实施例中,第三载体包括编码辅助病毒蛋白质的基因。在某些实施例中,辅助病毒选自以下组成的组:腺病毒、疱疹病毒、牛痘病毒和巨细胞病毒(cytomegalovirus;CMV)。在某些实施例中,辅助病毒是腺病毒。在某些实施例中,腺病毒基因组包括选自E1、E2、E4和VA组成的组的一种或多种腺病毒RNA基因。在某些实施例中,辅助病毒是单纯疱疹病毒(herpes simplexvirus;HSV)。在某些实施例中,HSV基因组包括选自以下组成的组的HSV基因中的一个或多个:UL5/8/52、ICPO、ICP4、ICP22以和UL30/UL42。
在某些实施例中,第一载体和第三载体含于第一转染质粒内。在某些实施例中,第二载体和第三载体的核苷酸含于第二转染质粒内。在某些实施例中,将第一载体和第三载体的核苷酸克隆到重组辅助病毒中。在某些实施例中,将第二载体和第三载体的核苷酸克隆到重组辅助病毒中。
在另一方面中,本公开提供一种用于重组制备AAV的方法,所述方法包括在可操作以将校正基因组封闭于衣壳中以形成AAV的条件下,将本文中所描述的包装系统引入细胞中。
附图说明
图1A和1B分别是VG-F8-002-FP和VG-F8-003-FP载体的图谱。
图2是描绘编辑人类F8基因座的一系列图,如通过用报告载体转导的三个B淋巴母细胞进行流式细胞术所测量。
图3是显示哺乳动物细胞中F8的mRNA表达的图。
图4A是VG-mF8-001-Luc载体和其预期整合到小鼠基因组中的图谱。图4B是显示来自用VG-mF8-001-Luc载体转染的HEK293和NIH3T3细胞的生物发光的图。图4C是显示来自用VG-mF8-001-Luc载体转染的HEK293和NIH3T3细胞的呈相对光度计单位(relativeluminometer unit;RLU)形式的荧光素酶表达的图。
图5A图示了用于检测VG-mF8-001-Luc载体重组到小鼠基因组中的同源重组的两种PCR设计。图5B图示了用于检测VG-mF8-001-Luc载体重组到小鼠基因组中的同源重组的液滴数字PCR(droplet digital PCR;ddPCR)的设计。图5C图示了线性扩增靶基因座后的定量下一代测序方法的设计。图5D是显示在用VG-mF8-001-Luc载体转染的细胞中所测量的连锁相对于预期连锁的曲线。
图6A是一组显示以指定剂量施用VG-mF8-001-Luc载体后小鼠的生物发光的照片。图6B是显示在第7天从施用低剂量的1×1011个VG-mF8-001-Luc载体的载体基因组或高剂量的3×1012个载体基因组的小鼠获得的指示器官的生物发光总通量的图。图6C是一组显示在第7天从施用指示剂量的VG-mF8-001-Luc载体的小鼠中获得的指示器官的生物发光的照片。这个图还显示了来自所指示器官的发光总通量的图。*指示与其它各器官相比的p=0.27的显著性水平;**指示与媒剂对照相比的p<0.01的显著性水平。图6D是显示在指示剂量内施用VG-mF8-001-Luc载体的小鼠第3天和第7天肝脏的生物发光总通量的图。图6E是显示在指示剂量内肝脏中VG-mF8-001-Luc载体的编辑效率的图。图6F是显示VG-mF8-001-Luc载体在小鼠肝脏中的编辑效率相对于肝脏中的生物发光总通量所绘制的图。*指示p<0.0001的显著性水平。
图7A是一组显示在施用包装于AAVHSC15或AAVHSC17衣壳中的VG-mF8-001-Luc载体后直到63天的小鼠的生物发光图像的照片。图7B是显示来自这些小鼠的生物发光总通量相对于施用载体后的天数的图(每个处理组n=3)。*指示与媒剂对照相比的p<0.004的显著性水平。图7C是显示从施用了包装于AAVHSC15或AAVHSC17衣壳中的VG-mF8-001-Luc载体的小鼠获得的细胞中的编辑效率的图。用“HindIII”指示的载体是指已经用HindIII限制酶处理过的载体;这些载体通过人工地将插入的有效负载与靶基因组DNA分离而充当阴性对照。*指示与媒剂对照相比的p<0.004的显著性水平;**指示与包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体(AAVHSC15-mF8-Luc)相比,p<0.03的显著性水平;***指示与包装于AAVHSC17衣壳中的VG-mF8-001-Luc载体(AAVHSC17-mF8-Luc)相比,p<0.004的显著性水平。图7D是一组显示在施用包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体(AAVHSC15-mF8-Luc)后不同时间点的小鼠的肝脏、肾脏、肌肉和脑组织的生物发光图像(每张照片从左到右)的照片。不同时间点在照片的顶行中从左到右增加,且在照片的底行中从左到右继续。图7E是显示施用包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体的小鼠的肝脏、肾脏、肌肉和脑组织的生物发光总通量的图。*指示与媒剂对照相比的p=0.007的显著性水平;**指示与其它组织相比的p<0.0001的显著性水平。图7F是显示在施用直到470天后施用包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体的小鼠中的生物发光总通量的图。*指示与媒剂对照相比的p<0.0001的显著性水平。
图8A是一组显示从注射有包装于AAVHSC15和AAVHSC17衣壳中的VG-mF8-001-Luc载体的小鼠的肝脏样本中扩增的PCR产物的凝胶电泳图。图8B是显示如通过ddPCR所测量的这些小鼠的肝脏中的编辑效率的图。图8C是显示注射有包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体的小鼠的肝脏样本中的靶基因座的下一代测序结果的分析的图。
图9A、9B、9C和9D分别是pHMI-F8-001-F8、pHMI-F8-002-F8、pHMI-F8-003-F8和pHMI-F8-004-F8载体的图谱。
图10A是施用指示的载体的第3天、第7天和第14天小鼠的一组照片。作为阳性对照,使用包括由鸡β-肌动蛋白(chickenβ-actin;CBA)启动子驱动的荧光素酶编码序列的载体。图10B是显示施用指示载体的小鼠中生物发光总通量的图。*指示与施用mF8delta2A-luc载体的小鼠相比,p<0.0001的显著性水平;**指示与媒剂对照相比,p<0.0001的显著性水平。图10C是一组从上到下显示从施用指示载体的小鼠获得的肝脏、脑和肾脏的照片。图10D是显示从施用指示载体的小鼠获得的这些组织的每一个中的生物发光总通量的图。图10E是mF8delta2A-luc载体的图谱。
具体实施方式
本公开提供可以恢复细胞中的F8基因功能的腺相关病毒(AAV)组合物。还提供了用于制备腺相关病毒组合物的包装系统。
I.定义
如本文所用,术语“复制缺陷型腺相关病毒”是指包括缺少Rep和Cap基因的基因组的AAV。
如本文所用,术语“F8基因”是指编码FVIII蛋白的野生型或突变基因,包含但不限于F8基因的编码区、外显子、内含子、5'UTR、3'UTR和转录调控区。人类F8基因由Entrez基因ID 2157鉴定。野生型人类F8基因由NCBI参考序列:NG_011403.1的核苷酸5,001到191,936鉴定。全长人类F8 cDNA的示范性核苷酸序列由第NM_000132.3号NCBI参考序列鉴定。包含其19个氨基酸信号肽的全长人类FVIII多肽的示范性氨基酸序列由第NP_000123.1号NCBI参考序列鉴定。人类F8的内含子22对应于NCBI参考序列:NG_011403.1的核苷酸131,648-164,496(32,849个核苷酸)。
如本文所用,术语“校正F8基因中的突变”是指在突变F8基因的靶基因座处的一个或多个核苷酸的插入、缺失或取代,以产生能够表达野生型FVIII多肽或其功能同等物的F8基因。在某些实施例中,“校正F8基因中的突变”涉及将编码野生型FVIII多肽或其功能同等物的至少一部分的核苷酸序列插入突变F8基因中,使得野生型FVIII多肽或其功能同等物由突变F8基因基因座表达(例如在内源性F8基因启动子的控制下)。所属领域的技术人员应了解,校正基因组的包括5'同源臂、编辑元件和3'同源臂的部分可相对于靶基因座(例如人类F8基因)在有义或反义取向上。
如本文所用,术语“校正基因组”是指重组AAV基因组,其能够通过同源重组将编辑元件(例如一个或多个核苷酸或核苷酸间键)整合到靶基因座中,以校正F8基因中的遗传缺陷。在某些实施例中,靶基因座在人类F8基因中。技术人员应了解,校正基因组的包括5'同源臂、编辑元件和3'同源臂的部分可相对于靶基因座(例如人类F8基因)在有义或反义取向上。
如本文所用,术语“编辑元件”是指校正基因组的一部分,当整合在靶基因座处时,其修改靶基因座。编辑元件可介导在靶基因座处的一个或多个核苷酸的插入、缺失或取代。
如本文所用,术语“靶基因座”是指被编辑元件修改的染色体区域或核苷酸间键(例如,人类F8基因的区域或核苷酸间键)。
如本文所用,术语“同源臂”是指校正基因组的位于编辑元件的5'或3',与侧接靶基因座的基因组大体上一致的一部分。在某些实施例中,靶基因座在人类F8基因中,且同源臂包括与侧接靶基因座的基因组大体上一致的序列。
如本文所用,术语“进化枝F衣壳蛋白”是指分别与在本文SEQ ID NO:1的氨基酸1-736、138-736和203-736中所阐述的VP1、VP2或VP3氨基酸序列具有至少90%一致性的AAVVP1、VP2或VP3衣壳蛋白。如本文所用,两个核苷酸序列之间或两个氨基酸序列之间的一致性由比对的相同核苷酸或氨基酸的数量除以较长核苷酸或氨基酸序列的全长来确定。
如本文所用,术语“与F8基因突变相关联的疾病或病症”是指由F8基因的突变引起、加剧或与其遗传相关的任何疾病或病症。在某些实施例中,与F8基因突变相关联的疾病或病症是血友病A。
如本文所用,术语“编码序列”是指互补DNA(cDNA)的编码多肽的部分,其开始于起始密码子且终止于终止密码子。由于替代性剪接和/或替代性翻译起始,基因可具有一种或多种编码序列。编码序列可以是野生型或可以是沉默改变的。示范性全长野生型F8编码序列由第NM_000132.3号NCBI参考序列的核苷酸172到7,227鉴定。对应于外显子22-26的野生型F8编码序列的示范性部分阐述于SEQ ID NO:26中。
如本文所用,术语“沉默改变(silently altered)”或“沉默改变(silentalteration)”是指在不改变由基因编码的多肽的氨基酸序列的情况下的基因编码序列的改变(例如通过核苷酸取代)。在某些实施例中,沉默改变增加编码序列的表达水平。在某些实施例中,沉默改变减少脱靶到非所需基因组基因座。
如本文所用,术语“聚腺苷酸化序列”是指当转录成RNA时构成聚腺苷酸化信号序列的DNA序列。聚腺苷酸化序列可以是天然的(例如来自F8基因)或外源性的。外源性聚腺苷酸化序列可以是哺乳动物或病毒性聚腺苷酸化序列(例如SV40聚腺苷酸化序列)。
在本公开中,F8基因中的核苷酸位置是相对于起始密码子的第一个核苷酸说明。起始密码子的第一个核苷酸是位置1;起始密码子的第一个核苷酸5'的核苷酸为负数;起始密码子的第一个核苷酸3'的核苷酸为正数。技术人员应了解,由于替代性剪接和/或替代性翻译起始,基因可具有多个起始密码子。如本文所用,人类F8基因的核苷酸1是NCBI参考序列:NG_011403.1的核苷酸5172。与起始密码子5'相邻的核苷酸是核苷酸-1。因此,人类F8基因的核苷酸-1是NCBI参考序列:NG_011403.1的核苷酸5173。如本文所用,小鼠F8基因的核苷酸1是NCBI参考序列:NC_000086.7负链上的核苷酸75,383,525。
在本公开中,F8基因中的外显子和内含子是相对于涵盖起始密码子的第一个核苷酸的外显子来说明,所述起始密码子的第一个核苷酸是NCBI参考序列:NG_011403.1的核苷酸5,172。涵盖起始密码子的第一个核苷酸的外显子是外显子1。外显子1 3'的外显子从5'到3'是:外显子2、外显子3等。外显子1 3'的内含子从5'到3'是:内含子1、内含子2等。因此,F8基因从5'到3'包括:外显子1、内含子1、外显子2、内含子2、外显子3等。技术人员应了解,基因可转录成多种不同mRNA。因此,基因(例如F8)可具有多种不同的外显子和内含子集合。如本文所用,人类F8基因的外显子1是NCBI参考序列:NG_011403.1的核苷酸5,001-5,314。人类F8基因的示范性内含子1是NCBI参考序列:NG_011403.1的核苷酸5,315-28,123。人类F8基因的示范性外显子22是NCBI参考序列:NG_011403.1的核苷酸131,492-131,647(156个核苷酸)。人类F8基因的示范性内含子22是NCBI参考序列:NG_011403.1的核苷酸131,648-164,496(32,849个核苷酸)。人类F8基因的示范性外显子23是NCBI参考序列:NG_011403.1的核苷酸164,497-164,641(145个核苷酸)。人类F8基因的示范性内含子23是NCBI参考序列:NG_011403.1的核苷酸164,642-165,857(1216个核苷酸)。人类F8基因的示范性外显子24是NCBI参考序列:NG_011403.1的核苷酸165,858-166,006(149个核苷酸)。人类F8基因的示范性内含子24是NCBI参考序列:NG_011403.1的核苷酸166,007-167,115(1109个核苷酸)。人类F8基因的示范性外显子25是NCBI参考序列:NG_011403.1的核苷酸167,116-167,292(177个核苷酸)。人类F8基因的示范性内含子25是NCBI参考序列:NG_011403.1的核苷酸167,293-189,971(22,679个核苷酸)。人类F8基因的示范性外显子26是NCBI参考序列:NG_011403.1的核苷酸189,972-191,936(1965个核苷酸)。
如本文所用,术语“整合”是指通过校正基因组与靶基因之间的同源重组将编辑元件引入靶基因的靶基因座中。编辑元件的整合可导致靶基因中一个或多个核苷酸的取代、插入和/或缺失。举例来说,在某些实施例中,术语“整合”是指通过校正基因组和F8基因之间的同源重组将编辑元件引入F8基因的靶基因座中。编辑元件的整合可导致F8基因中一个或多个核苷酸的取代、插入和/或缺失。
如本文所用,术语“编辑元件整合到靶基因座中的效率”是指转导群体中发生了编辑元件整合到靶基因座中的细胞的百分比。
如本文所用,术语“编辑元件整合到靶基因座中的等位基因频率”是指转导细胞群体中发生了编辑元件整合到靶基因座中的等位基因的百分比。
如本文所用,术语“标准AAV转导条件”是指在1.5×105的感染复数(multiplicityof infection;MOI)下用AAV转导B淋巴母细胞,其中细胞在37℃下5%二氧化碳(CO2)的培育箱环境中于补充有15%胎牛血清(fetal calf serum;FCS)和2mmol/L L-谷氨酰胺的RPMI-1640培养基中培养,其中每毫升大致200,000个细胞接种对数生长期的细胞以且在同一天感染,其中将AAV调配于磷酸盐缓冲盐水(phosphate buffered saline;PBS)中,且其中以小于或等于培养基体积的5%的体积将AAV添加到含有B淋巴母细胞的细胞培养基中。
如本文所用,“外源性聚腺苷酸化序列”是指与基因(例如人基因)的内源性聚腺苷酸化序列不相同或与大体上相同的聚腺苷酸化序列。举例来说,在某些实施例中,“外源性聚腺苷酸化序列”是指与F8基因(例如人类F8基因)的内源性聚腺苷酸化序列不相同或大体上相同的聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列是相同物种(例如人类)中的非F8基因的聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列是不同物种(例如病毒)的聚腺苷酸化序列。
如本文所用,在向受试者施用AAV的情形下,术语“有效量”是指达到所期望的预防或治疗效果的AAV量。
II.腺相关病毒组合物
在一个方面中,本文提供新颖的复制缺陷型AAV组合物,其适用于恢复F8基因功能降低或有缺陷的细胞中的F8表达。这类AAV组合物在校正F8基因中的突变或恢复F8表达方面是高效的,且不需要通过外源性核酸酶(例如大范围核酸酶、锌指核酸酶、转录活化因子样酶(TALEN))或RNA引导的核酸酶(如Cas9)的作用在靶基因座处裂解基因组来辅助这类校正。因此,在某些实施例中,本文中所公开的AAV组合物不包括外源性核酸酶或编码外源性核酸酶的核苷酸序列。
在某些实施例中,本文中所公开的AAV包括:含AAV衣壳蛋白的AAV衣壳;和用于编辑F8基因中的靶基因座的校正基因组。
可用于本文中所公开的AAV组合物中的AAV衣壳蛋白包含但不限于:进化枝A AAV、进化枝B AAV、进化枝C AAV、进化枝D AAV、进化枝E AAV和进化枝F AAV的AAV衣壳蛋白和其衍生物。在某些实施例中,AAV衣壳蛋白是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9或AAVrh10的AAV衣壳蛋白或其衍生物。
在某些实施例中,AAV衣壳蛋白是进化枝F AAV衣壳蛋白。任何AAV进化枝F衣壳蛋白或其衍生物可用于本文中所公开的AAV组合物中。举例来说,在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M。在某些实施例中,衣壳蛋白中对应于SEQ IDNO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R。在某些实施例中,衣壳蛋白中对应于SEQID NO:2的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。在某些实施例中,AAV进化枝F衣壳蛋白包括SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
举例来说,在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQID NO:2的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ IDNO:2的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ IDNO:2的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。在某些实施例中,衣壳蛋白中对应于SEQ IDNO:2的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ IDNO:2的氨基酸681的氨基酸是M。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且衣壳蛋白中对应于SEQID NO:2的氨基酸505的氨基酸是R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。在某些实施例中,AAV进化枝F衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
举例来说,在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,AAV进化枝F衣壳蛋白包括与SEQID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列,其中:衣壳蛋白中对应于SEQ IDNO:2的氨基酸2的氨基酸是T;衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:2的氨基酸68的氨基酸是V;衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L;衣壳蛋白中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸2的氨基酸是T,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是Y。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。衣壳蛋白中对应于SEQID NO:2的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQID NO:2的氨基酸681的氨基酸是M。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R。在某些实施例中,衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。在某些实施例中,AAV进化枝F衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在某些实施例中,AAV衣壳包括中的两种或更多种:a)进化枝F衣壳蛋白,其包括SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17的氨基酸203-736的氨基酸序列;b)进化枝F衣壳蛋白,其包括SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17的氨基酸138-736的氨基酸序列;和c)进化枝F衣壳蛋白,其包括SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括:a)进化枝F衣壳蛋白,其具有由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17的氨基酸203-736组成的氨基酸序列;b)进化枝F衣壳蛋白,其具有由SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17的氨基酸138-736组成的氨基酸序列;和c)进化枝F衣壳蛋白,其具有由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17的氨基酸1-736组成的氨基酸序列。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括与SEQ ID NO:8的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;(b)进化枝F衣壳蛋白,其包括与SEQ ID NO:8的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括与SEQ ID NO:8的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:8的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:8的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ IDNO:8的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:8的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:8的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ ID NO:8的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:8的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:8的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:8的氨基酸1-736组成的氨基酸序列。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括与SEQ ID NO:11的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;(b)进化枝F衣壳蛋白,其包括与SEQ ID NO:11的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括与SEQ ID NO:11的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:11的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:11的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ IDNO:11的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:11的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:11的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ ID NO:11的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:11的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:11的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:11的氨基酸1-736组成的氨基酸序列。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括与SEQ ID NO:13的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;(b)进化枝F衣壳蛋白,其包括与SEQ ID NO:13的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括与SEQ ID NO:13的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:13的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:13的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ IDNO:13的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:13的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:13的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ ID NO:13的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:13的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:13的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:13的氨基酸1-736组成的氨基酸序列。
在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括与SEQ ID NO:16的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;(b)进化枝F衣壳蛋白,其包括与SEQ ID NO:16的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括与SEQ ID NO:16的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的一种或多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:16的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:16的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ IDNO:16的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括以下中的两种或更多种:(a)进化枝F衣壳蛋白,其包括SEQ ID NO:16的氨基酸203-736的氨基酸序列;(b)进化枝F衣壳蛋白,其包括SEQ ID NO:16的氨基酸138-736的氨基酸序列;和(c)进化枝F衣壳蛋白,其包括SEQ ID NO:16的氨基酸1-736的氨基酸序列。在某些实施例中,AAV衣壳包括:(a)进化枝F衣壳蛋白,其具有由SEQ ID NO:16的氨基酸203-736组成的氨基酸序列;(b)进化枝F衣壳蛋白,其具有由SEQ ID NO:16的氨基酸138-736组成的氨基酸序列;和(c)进化枝F衣壳蛋白,其具有由SEQ ID NO:16的氨基酸1-736组成的氨基酸序列。
适用于本文中所公开的AAV组合物中的校正基因组一般包括:(i)用于编辑F8基因中的靶基因座的编辑元件;(ii)编辑元件5'的5'同源臂核苷酸序列,所述核苷酸序列与靶基因座5'的第一基因组区域具有同源性;和(iii)编辑元件3'的3'同源臂核苷酸序列,所述核苷酸序列与靶基因座3'的第二基因组区域具有同源性,其中包括5'同源臂、编辑元件和3'同源臂的校正基因组的部分可相对于F8基因基因座在有义或反义取向上。在某些实施例中,校正基因组进一步包括5'同源臂核苷酸序列5'的5'反向末端重复(5'ITR)核苷酸序列和3'同源臂核苷酸序列3'的3'反向末端重复(3'ITR)核苷酸序列。
本文中所公开的校正基因组中使用的编辑元件可以介导靶基因座处一个或多个核苷酸的插入、缺失或取代。
在某些实施例中,当通过同源重组在靶基因座处正确整合时,编辑元件将F8基因中的突变校正回野生型F8序列或其功能同等物。在某些实施例中,编辑元件包括F8编码序列的一部分(例如野生型FVIII编码序列的一部分或沉默改变的F8编码序列的一部分)。
在某些实施例中,编辑元件包括F8基因(例如人类F8基因)的外显子23-26的野生型或沉默改变的序列。在某些实施例中,编辑元件至少包括F8编码序列的一部分。举例来说,在某些实施例中,编辑元件包括F8编码序列的一部分,且可任选地进一步包括编码序列3'的外源性聚腺苷酸化序列。在某些实施例中,F8编码序列的部分包括F8基因的外显子23-26的序列,任选地进一步包括与基因组(例如人类基因组)中相同的次序的外显子15-22中的一个或多个的序列。在某些实施例中,F8编码序列的部分包括F8基因的外显子15-26、16-26、17-26、18-26、19-26、20-26、21-26或22-26的序列。在某些实施例中,F8编码序列的部分包括外显子22-26的序列(SEQ ID NO:26)。在某些实施例中,编辑元件包括SEQ ID NO:33中所阐述的序列。
在某些实施例中,靶基因座是与外显子15-22中的任一个的最后一个核苷酸3'相邻的核苷酸间键或核苷酸序列。在某些实施例中,编辑元件整合到基因组(例如人类基因组)中导致产生包括F8基因(例如人类F8基因)的外显子1到X和内含子1到X-1(X减1)以及包括外显子X+1(X加1)到26的序列的F8编码序列(例如人类F8编码序列)的一部分或其沉默改变的变体的序列,其中X是选自14、15、16、17、18、19、20、21和22的任何数字,且其中编辑元件中的外显子和内含子的位置与基因组中的次序相同。在某些实施例中,X是22。
在某些实施例中,F8编码序列的部分编码包括或由SEQ ID NO:25中所阐述的序列组成的氨基酸序列。在某些实施例中,编码SEQ ID NO:25的核酸序列是野生型的(例如具有SEQ ID NO:26中所阐述的序列)。在某些实施例中,编码SEQ ID NO:25的核酸序列是沉默改变的。在某些实施例中,靶基因座是与F8基因的外显子22的最后一个核苷酸3'相邻的核苷酸间键或核苷酸序列(例如人类F8基因的核苷酸126,476与126,477之间的核苷酸间键、或人类F8基因的核苷酸126、477处开始的序列),其中编辑元件的整合导致产生5'到3'包括以下的序列:F8基因的F8基因基因座处的外显子1、内含子1、外显子2、内含子2、外显子3、内含子3、外显子4、内含子4、外显子5、内含子5、外显子6、内含子6、外显子7、内含子7、外显子8、内含子8、外显子9、内含子9、外显子10、内含子10、外显子11、内含子11、外显子12、内含子12、外显子13、内含子13、外显子14、内含子14、外显子15、内含子15、外显子16、内含子16、外显子17、内含子17、外显子18、内含子18、外显子19、内含子19、外显子20、内含子20、外显子21、内含子21、外显子22、外显子23、外显子24、外显子25和外显子26,其中外显子23、外显子24、外显子25和外显子26中的每一个的序列可独立地为野生型或沉默改变的。
在某些实施例中,编辑元件包括F8编码序列的一部分(例如野生型F8编码序列的一部分或沉默改变的F8编码序列的一部分)。这类编辑元件可进一步包括剪接受体位点和/或外源性聚腺苷酸化序列。在某些实施例中,编辑元件5'到3'包括:剪接受体位点;F8编码序列的一部分(例如野生型F8编码序列的一部分或沉默改变的F8编码序列的一部分);和外源性聚腺苷酸化序列。在某些实施例中,F8编码序列的部分包括F8基因的外显子23-26的序列,任选地进一步包括与基因组(例如人类基因组)中相同的次序的外显子15-22中的一个或多个的序列。在某些实施例中,F8编码序列的部分包括F8基因的外显子15-26、16-26、17-26、18-26、19-26、20-26、21-26或22-26的序列。
在某些实施例中,可通过同源重组将前述编辑元件整合到F8基因的内含子中(例如靶基因座5'的核苷酸在F8基因的内含子中,或靶基因座的最5'核苷酸在F8基因的内含子中)以产生5'到3'包括以下的重组序列:靶基因座5'的F8基因的一部分,所述部分包含内含子的内源性剪接供体位点但不包含内源性剪接受体位点;剪接受体位点;F8编码序列的一部分(例如野生型F8编码序列的一部分、或沉默改变的F8编码序列的一部分);和外源性聚腺苷酸化序列。这个重组序列的表达产生包括由靶基因座5'的F8基因的部分编码的氨基酸序列多肽,所述多肽与包括由F8编码序列的部分编码的FVIII多肽的部分氨基酸序列的多肽融合。
在某些实施例中,与靶基因座5'相邻的核苷酸在F8基因的内含子中。在某些实施例中,靶基因座是内含子15-22中的任一个中的核苷酸间键。在某些实施例中,靶基因座是与内含子15-22中的任一个中的核苷酸3'相邻的核苷酸序列。在某些实施例中,编辑元件整合到基因组(例如人类基因组)中导致产生包括以下的序列:外显子1到X、内含子1到X-1(X减1)和内含子X的一部分;剪接受体;和F8编码序列(例如人类F8编码序列)的一部分,其包括外显子X+1(X加1)到26的序列或其沉默改变的变体,其中X是选自14、15、16、17、18、19、20、21和22的任何数字,其中编辑元件中的外显子和内含子的位置与基因组中的次序相同,且其中剪接受体在内含子X的部分与F8编码序列的部分之间。在某些实施例中,X是22。
在某些实施例中,与靶基因座5'相邻的核苷酸在F8基因的内含子22中。在某些实施例中,靶基因座是F8基因的内含子22中的核苷酸间键。在某些实施例中,靶基因座是F8基因中的序列,其中与这个序列5'相邻的核苷酸在F8基因的内含子22中,其中这个序列的3'端可为F8基因中的任何下游核苷酸。
在某些实施例中,编辑元件内的F8编码序列的一个或多个部分可被沉默改变为与野生型F8基因的对应序列不同。沉默改变可通过本领域中已知的任何方法(例如如Mauro和Chappell(2014)《分子医学趋势(Trends Mol Med.)》20(11):604-13中所描述,其以全文引用的方式并入本文中)进行。示范性部分沉默改变的F8编码序列阐述于SEQ ID NO:33中。
因此,在某些实施例中,编辑元件包括已沉默改变为与野生型F8基因的对应外显子小于100%(例如小于95%、90%、85%、80%、75%、70%、65%、60%、55%或50%)一致的F8编码序列。在某些实施例中,编辑元件包括已沉默改变为与SEQ ID NO:26中所阐述的序列小于100%(例如小于95%、90%、85%、80%、75%、70%、65%、60%、55%或50%)一致的核苷酸序列。这类编辑元件可进一步包括F8基因编码序列3'的外源性聚腺苷酸化序列。
在某些实施例中,编辑元件进一步包括F8编码序列的部分3'的聚腺苷酸化序列。在某些实施例中,聚腺苷酸化序列是外源性聚腺苷酸化序列。在某些实施例中,外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。在某些实施例中,SV40聚腺苷酸化序列具有SEQ IDNO:23、35、36或37中所阐述的核苷酸序列。
本文中所公开的任何和所有编辑元件可进一步包含野生型F8基因中不存在的限制性核酸内切酶位点。这类限制性核酸内切酶位点允许基于限制性片段长度多态性分析或通过对靶基因座和其侧接区或从其扩增的核酸的核酸测序分析来鉴定在靶基因座处具有编辑元件整合的细胞。
本文中所公开的任何和所有编辑元件可包括一个或多个核苷酸改变,当整合到靶基因座中时,所述一个或多个核苷酸改变引起FVIII多肽中的一个或多个氨基酸突变。在某些实施例中,突变FVIII多肽是野生型FVIII多肽的功能同等物,即可以充当野生型FVIII多肽。在某些实施例中,功能上同等的FVIII多肽进一步包括野生型FVIII多肽中未发现的至少一种特征,例如抗蛋白质降解的能力。
在某些实施例中,如本文所描述的编辑元件包括至少0、1、2、10、100、200、500、1000、1500、2000、3000、4000或5000个核苷酸。在某些实施例中,编辑元件包括或由以下组成:1至5000、1至4500、1至4000、1至3000、1至2000、1至1000、1至500、1至200、1至100、1至50或1至10个核苷酸。
在某些实施例中,如本文所描述的编辑元件包括或由以下组成:部分F8编码序列(例如人类F8编码序列的外显子22-26、或SEQ ID NO:31的核苷酸4到783)、5'非翻译区(untranslated region;UTR)、3'UTR、启动子、剪接供体、剪接受体、编码非编码RNA的序列、隔离子、基因或其组合。
在某些实施例中,编辑元件包括与SEQ ID NO:33中所阐述的序列至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%一致的核酸序列。在某些实施例中,编辑元件包括SEQ ID NO:33中所阐述的核酸序列。
本文中所公开的校正基因组中使用的同源臂可导引到F8基因或基因组上附近的基因的任何区。同源臂的精确属性(identity)和定位由编辑元件和/或靶基因座的属性确定。
本文中所公开的校正基因组中采用的同源性臂与侧接靶基因座(例如F8基因中的靶基因座)的基因组大体上一致。在某些实施例中,5'同源臂与靶基因座5'的第一区域具有至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)核苷酸序列一致性。在某些实施例中,5'同源臂与第一区域具有100%核苷酸序列一致性。在某些实施例中,3'同源臂与靶基因座3'的第二区具有至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)核苷酸序列一致性。在某些实施例中,3'同源臂与第二区域具有100%核苷酸序列一致性。在某些实施例中,5'和3'同源臂各自分别与侧接靶基因座(例如F8基因中的靶基因座)的第一区域和第二区域至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)一致。在某些实施例中,5'和3'同源臂各自分别与侧接靶基因座(例如F8基因中的靶基因座)的第一区域和第二区域100%一致。在某些实施例中,5'同源臂和/或3'同源臂的核苷酸序列与侧接靶基因座的基因组的对应区域的差异包括、基本上由以下组成或由以下组成:核苷酸序列中的非编码差异。
技术人员应了解,同源臂不需要与侧接能够通过同源重组介导编辑元件整合到靶基因座中的所述靶基因座的基因组序列100%一致。举例来说,同源臂可包括人类群体中的一种或多种遗传变异和/或设计成改进表达水平或特异性的一种或多种修饰(例如核苷酸取代、插入或缺失)。人类遗传变异包含靶基因组专有的遗传性变异和从头变异,且涵盖简单的核苷酸多态性、插入、缺失、重排、倒位、重复、微重复和其组合。这类变异是本领域中已知的,且可发现于例如以下中:dnSNP数据库(参见Sherry等人《核酸研究(Nucleic AcidsRes.)》2001;29(1):308-11)、基因组变体数据库(参见《核酸研究》2014;42(Databaseissue):D986-92)、ClinVar(参见《核酸研究》2014;42(Database issue):D980-D985)、Genbank(参见《核酸研究》2016;44(Database issue):D67-D72)、ENCODE(genome.ucsc.edu/encode/terms.html)、JASPAR(参见《核酸研究》2018;46(D1):D260-D266)和PROMO(参见Messeguer等人《生物信息(Bioinformatics)》2002;18(2):333-334;Farré等人《核酸研究》2003;31(13):3651-3653,其中的每一个以引用的方式并入本文中。技术人员将进一步了解,在同源臂与侧接靶基因座的靶基因座的基因组序列不100%一致的情况下,同源臂与基因组之间的同源重组可改变侧接靶基因座的基因组序列,从而使得其变得与所使用的同源臂的序列一致。
在某些实施例中,靶基因座5'的第一基因组区域位于第一编辑窗口中,其中第一编辑窗口由SEQ ID NO:31、32或34中所阐述的核苷酸序列组成。在某些实施例中,靶基因座3'的第二基因组区域位于第二编辑窗口中,其中第二编辑窗口由SEQ ID NO:31、32或34中所阐述的核苷酸序列组成。
在某些实施例中,第一和第二编辑窗口是不同的。在某些实施例中,第一编辑窗口位于第二编辑窗口的5'。在某些实施例中,第一基因组区域由第一基因组区域位于其中的第一编辑窗口的序列的一部分组成。在某些实施例中,第一基因组区域由第一基因组区域位于其中的第一编辑窗口的序列组成。在某些实施方式中,第二基因组区域由第二基因组区域位于其中的第二编辑窗口的序列的一部分组成。在某些实施例中,第二基因组区域由第二基因组区域位于其中的第二编辑窗口的序列组成。在某些实施例中,第一编辑窗口由SEQ ID NO:31中所阐述的核苷酸序列组成;且第二编辑窗口由SEQ ID NO:32中所阐述的核苷酸序列组成。在某些实施例中,靶基因座5'的第一基因组区域由SEQ ID NO:31中所阐述的序列组成。在某些实施例中,靶基因座3'的第二基因组区域由SEQ ID NO:32中所阐述的序列组成。在某些实施例中,靶基因座5'的第一基因组区域和靶基因座3'的第二基因组区域分别由SEQ ID NO:31和32中所阐述的序列组成。
在某些实施例中,5'同源臂由与SEQ ID NO:31的核苷酸序列至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)一致的核苷酸序列组成。在某些实施例中,5'同源臂由SEQ ID NO:31中所阐述的核苷酸序列组成。在某些实施例中,3'同源臂由与SEQ IDNO:32的核苷酸序列至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)一致的核苷酸序列组成。在某些实施例中,3'同源臂由SEQ ID NO:32中所阐述的核苷酸序列组成。在某些实施例中,5'和3'同源臂分别由与SEQ ID NO:31和32的核苷酸序列至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)一致的核苷酸序列组成。在某些实施例中,5'和3'同源臂分别由SEQ ID NO:31和32中所阐述的核苷酸序列组成。
在某些实施例中,第一和第二编辑窗口相同。在某些实施例中,靶基因座是编辑窗口中的核苷酸间键或核苷酸序列,其中第一基因组区域由靶基因座5'的编辑窗口的第一部分组成,且第二基因组区域由靶基因座3'的编辑窗口的第二部分组成。在某些实施例中,编辑窗口的第一部分由编辑窗口的5'端到与靶基因座5'相邻的核苷酸的序列组成。在某些实施例中,编辑窗口的第二部分由与靶基因座3'相邻的核苷酸到编辑窗口的3'端的序列组成。在某些实施例中,编辑窗口的第一部分由编辑窗口的5'端到与靶基因座5'相邻的核苷酸的序列组成,且编辑窗口的第二部分由与靶基因座3'相邻的核苷酸到编辑窗口的3'端的序列组成。在某些实施例中,编辑窗口由SEQ ID NO:34中所阐述的核苷酸序列组成。在某些实施例中,编辑窗口的第一和第二部分具有大体上相等的长度(例如较短部分的长度与较长部分的长度的比率大于0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95、0.96、0.97、0.98或0.99)。
在某些实施例中,5'同源臂由与SEQ ID NO:34的核苷酸序列的第一部分至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)一致的核苷酸序列组成。在某些实施例中,5'同源臂由SEQ ID NO:34的核苷酸序列的第一部分组成。在某些实施例中,3'同源臂由与SEQ ID NO:34的核苷酸序列的第二部分至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)一致的核苷酸序列组成。在某些实施例中,3'同源臂由SEQ ID NO:34的核苷酸序列的第二部分组成。在某些实施例中,第一部分在SEQ ID NO:34中的第二部分的5'。在某些实施例中,5'和3'同源臂分别由与SEQ ID NO:34的核苷酸序列的第一部分和第二部分至少约90%(例如至少约95%、96%、97%、98%、99%或99.5%)一致的核苷酸序列组成,其中第一部分在SEQ ID NO:34中的第二部分的5'。在某些实施例中,5'和3'同源臂分别由SEQ ID NO:34的核苷酸序列的第一部分和第二部分组成,其中第一部分在SEQ IDNO:34中的第二部分的5'。
在某些实施例中,靶基因座5'的第一基因组区域位于第一编辑窗口中,其中第一编辑窗口由SEQ ID NO:34中所阐述的核苷酸序列组成。在某些实施例中,靶基因座3'的第二基因组区域位于由SEQ ID NO:34中所阐述的核苷酸序列组成的第二F8靶基因座中。在某些实施例中,靶基因座5'的第一基因组区域位于由SEQ ID NO:34中所阐述的核苷酸序列组成的第一F8靶基因座中;且靶基因座3'的第二基因组区域位于由SEQ ID NO:34中所阐述的核苷酸序列组成的第二F8靶基因座中。
在某些实施例中,靶基因座5'的第一基因组区域包括或由以下组成:SEQ ID NO:31中所阐述的序列。在某些实施例中,靶基因座3'的第二基因组区域包括或由以下组成:SEQ ID NO:32中所阐述的序列。在某些实施例中,靶基因座5'的第一基因组区域和靶基因座3'的第二基因组区域分别包括或由以下组成:SEQ ID NO:31和32中所阐述的序列。
在某些实施例中,5'同源臂具有约50到约4500个核苷酸(例如约100到约3000、约200到约2500、约300到约2000、约400到约1500、约500到约1000个核苷酸)的长度。在某些实施例中,5'同源臂具有约800个核苷酸的长度。在某些实施例中,5'同源臂具有约100个核苷酸的长度。在某些实施例中,3'同源臂具有约50到约4500个核苷酸(例如约100到约3000、约200到约2500、约300到约2000、约400到约1500、约500到约1000个核苷酸)的长度。在某些实施例中,3'同源臂具有约800个核苷酸的长度。在某些实施例中,3'同源臂具有约100个核苷酸的长度。在某些实施例中,5'和3'同源臂中的每一个独立地具有约50到约4500个核苷酸(例如约100到约3000、约200到约2500、约300到约2000、约400到约1500、约500到约1000个核苷酸)的长度。在某些实施例中,5'和3'同源臂中的每一个具有约800个核苷酸的长度。
在某些实施例中,5'和3'同源臂具有大体上相等的核苷酸长度。在某些实施例中,5'和3'同源臂具有不对称的核苷酸长度。在某些实施例中,核苷酸长度的不对称性由5'与3'同源臂的长度之间的差异高达90%所定义,如长度差异高达80%、70%、60%、50%、40%、30%、20%或10%。
在某些实施例中,校正基因组包括选自SEQ ID NO:38-41组成的组的核酸序列。
在某些实施例中,本文中所公开的校正基因组进一步包括5'同源臂核苷酸序列5'的5'反向末端重复(5'ITR)核苷酸序列和3'同源臂核苷酸序列3'的3'反向末端重复(3'ITR)核苷酸序列。来自任何AAV血清型或其变体的ITR序列可用于本文中所公开的校正基因组中。5'和3'ITR可来自相同血清型的AAV或来自不同血清型的AAV。用于本文中所公开的校正基因组中的示范性ITR阐述于本文SEQ ID NO:18-21、46、61和63中。
在某些实施例中,5'ITR或3'ITR来自AAV2。在某些实施例中,5'ITR和3'ITR均来自AAV2。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少95%(例如至少96%、至少97%、至少98%、至少99%或100%)序列一致性,或3'ITR核苷酸序列与SEQ ID NO:19、61或63具有至少95%(例如至少96%、至少97%、至少98%、至少99%或100%)序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:18具有至少95%(例如至少96%、至少97%、至少98%、至少99%或100%)序列一致性,且3'ITR核苷酸序列与SEQ ID NO:19、61或63具有至少95%(例如至少96%、至少97%、至少98%、至少99%或100%)序列一致性。在某些实施例中,校正基因组包括:具有SEQ ID NO:34中所阐述的核酸序列的编辑元件;具有SEQ IDNO:18的序列的5'ITR核苷酸序列;和具有SEQ ID NO:19、61或63的序列的3'ITR核苷酸序列。在某些实施例中,校正基因组包括:SEQ ID NO:34中所阐述的核酸序列;具有SEQ IDNO:18的序列的5'ITR核苷酸序列;和具有SEQ ID NO:19、61或63的序列的3'ITR核苷酸序列。
在某些实施例中,5'ITR或3'ITR来自AAV5。在某些实施例中,5'ITR和3'ITR均来自AAV5。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:20具有至少95%(例如至少96%、至少97%、至少98%、至少99%或100%)序列一致性,或3'ITR核苷酸序列与SEQ ID NO:21具有至少95%序列一致性。在某些实施例中,5'ITR核苷酸序列与SEQ ID NO:20具有至少95%(例如至少96%、至少97%、至少98%、至少99%或100%)序列一致性,且3'ITR核苷酸序列与SEQ ID NO:21具有至少95%(例如至少96%、至少97%、至少98%、至少99%或100%)序列一致性。在某些实施例中,校正基因组包括:具有SEQ ID NO:34中所阐述的核酸序列的编辑元件;具有SEQ ID NO:20的序列的5'ITR核苷酸序列;和具有SEQ ID NO:21的序列的3'ITR核苷酸序列。在某些实施例中,校正基因组包括:SEQ ID NO:34中所阐述的核酸序列;具有SEQ ID NO:20的序列的5'ITR核苷酸序列;和具有SEQ ID NO:21的序列的3'ITR核苷酸序列。
在某些实施例中,5'ITR核苷酸序列和3'ITR核苷酸序列彼此大体上互补(例如彼此互补,除5'或3'ITR中的1、2、3、4或5核苷酸位置处错配以外)。
在某些实施例中,5'ITR或3'ITR被修饰以降低或消除被Rep蛋白解析(resolution)(“非可解析的ITR”)。在某些实施例中,非可解析的ITR包括在末端解析位点的核苷酸序列中的插入、缺失或取代。这类修饰允许在转移基因组在感染的细胞中复制后形成AAV的自身互补型双链DNA基因组。示范性非可解析的ITR序列是本领域已知的(参见例如第7,790,154号和第9,783,824号美国专利中提供的那些,其以全文引用的方式并入本文中)。在某些实施例中,5'ITR包括与SEQ ID NO:46至少95%、96%、97%、98%或99%一致的核苷酸序列。在某些实施例中,5'ITR由与SEQ ID NO:46至少95%、96%、97%、98%或99%一致的核苷酸序列组成。在某些实施例中,5'ITR由SEQ ID NO:46中所阐述的核苷酸序列组成。在某些实施例中,5'ITR和3'ITR分别由SEQ ID NO:46和19中所阐述的核苷酸序列组成。在某些实施例中,5'ITR和3'ITR分别由SEQ ID NO:46和61中所阐述的核苷酸序列组成。
在某些实施例中,5'ITR包括与SEQ ID NO:18、20、46中的任一个中所阐述的核苷酸序列至少95%、96%、97%、98%或99%一致的核苷酸序列。在某些实施例中,5'ITR由与SEQ ID NO:18、20、46中的任一个中所阐述的核苷酸序列至少95%、96%、97%、98%或99%一致的核苷酸序列组成。
在某些实施例中,3'ITR包括与SEQ ID NO:19、21、61、63中的任一个中所阐述的核苷酸序列至少95%、96%、97%、98%或99%一致的核苷酸序列。在某些实施例中,3'ITR由与SEQ ID NO:19、21、61、63中的任一个中所阐述的核苷酸序列至少95%、96%、97%、98%或99%一致的核苷酸序列组成。
在某些实施例中,3'ITR侧接来源于野生型AAV2基因组序列的额外核苷酸序列。在某些实施例中,3'ITR侧接来源于与野生型AAV2 ITR相邻的野生型AAV2序列的额外37bp序列。参见例如Savy等人,《人类基因治疗方法(Human Gene Therapy Methods)》(2017)28(5):277-289(其以全文引用的方式并入本文中)。在某些实施例中,额外37bp序列在3'ITR内部。在某些实施例中,37bp序列由SEQ ID NO:62中所阐述的序列组成。在某些实施例中,3'ITR包括与SEQ ID NO:63至少95%、96%、97%、98%或99%一致的核苷酸序列。在某些实施例中,3'ITR包括SEQ ID NO:63中所阐述的核苷酸序列。在某些实施例中,3'ITR的核苷酸序列由与SEQ ID NO:63至少95%、96%、97%、98%或99%一致的核苷酸序列组成。在某些实施例中,3'ITR的核苷酸序列由SEQ ID NO:63中所阐述的核苷酸序列组成。
在某些实施例中,校正基因组包括选自SEQ ID NO:42-45组成的组的核酸序列。
在某些实施例中,校正基因组由选自SEQ ID NO:42-45组成的组的核酸序列组成。
在某些实施例中,复制缺陷型AAV包括:(a)包括SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);(b)包括SEQ ID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ IDNO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);和/或(c)包括SEQ ID NO:16的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQID NO:19、61或63的3'ITR)。
在某些实施例中,复制缺陷型AAV包括:(a)包括SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;(b)包括SEQ ID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;和/或(c)包括SEQ ID NO:16的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组。
在某些实施例中,复制缺陷型AAV包括:(a)包括SEQ ID NO:13的氨基酸203-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);(b)包括SEQ ID NO:13的氨基酸138-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ IDNO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);和/或(c)包括SEQ ID NO:13的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQID NO:19、61或63的3'ITR)。
在某些实施例中,复制缺陷型AAV包括:(a)包括SEQ ID NO:13的氨基酸203-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;(b)包括SEQ ID NO:13的氨基酸138-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;和/或(c)包括SEQ ID NO:13的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组。
本文中所公开的AAV组合物是特别有利的,因为其能够活体内和活体外高效率地校正细胞中的F8基因。在某些实施例中,当在不存在外源性核酸酶的情况下在B淋巴母细胞的标准AAV转导条件下将AAV与B淋巴母细胞群体活体外接触时,编辑元件整合到靶基因座中的整合功效为至少2%(例如至少2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在不存在外源性核酸酶的情况下在B淋巴母细胞的标准AAV转导条件下将AAV与B淋巴母细胞群体活体外接触时,编辑元件整合到靶基因座中的等位基因频率为至少1%(例如至少1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、7.5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在不存在外源性核酸酶或编码外源性核酸酶的核酸酶序列的情况下在标准AAV施用条件下向受试者施用AAV时,编辑元件整合到肝脏中的靶基因座中的整合功效为至少2%(例如至少2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在不存在外源性核酸酶或编码外源性核酸酶的核酸酶序列的情况下在标准AAV施用条件下向受试者施用AAV时,编辑元件整合到肝脏中的靶基因座中的等位基因频率为至少1%(例如至少1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、7.5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。如本文所用,术语“标准AAV施用条件”是指对于具有小鼠大小和体型的受试者,以每千克体重1.5×105个载体基因组的剂量静脉内施用AAV。技术人员应了解,应当根据受试者的大小和体型来调整剂量,以实现类似的预测功效。物种之间的示范性剂量转换由Nair等人(2016)《基础临床医药(J.Basic Clin.Pharm.)》7(2):27-31提供,其以全文引用的方式并入本文中。
可采用测定F8基因的编辑效率的任何方法。在某些实施例中,将个别细胞与已转导细胞群体分离,且使用可鉴定出正确整合到F8基因的靶基因座中的编辑元件的存在的PCR引物进行单细胞PCR。这种方法可以进一步包括使用选择性扩增未修饰的靶基因座的PCR引物对相同细胞进行单细胞PCR。以这种方式,可以确定细胞的基因型。举例来说,如果单细胞PCR显示细胞同时具有编辑的靶基因座和未修饰的靶基因座,则所述细胞将被视为编辑的F8基因是杂合的。
另外或替代地,在某些实施例中,可使用仅检测编辑的F8等位基因的引物和探针对从已转导细胞群体中提取的DNA进行线性扩增介导的PCR(linear amplificationmediated PCR;LAM-PCR)、定量PCR(quantitative PCR;qPCR)或数字液滴PCR(digitaldroplet PCR;ddPCR)。这类方法可以进一步包括额外qPCR或ddPCR(在相同反应或单独反应中)以测定样本中的总基因组的数量和未编辑的F8等位基因的数量。这些数量可用于测定编辑元件整合到靶基因座中的等位基因频率。
另外或替代地,在某些实施例中,可以通过PCR,使用与侧接校正基因组所涵盖的基因组区域的F8基因的区域结合的引物,或通过线性扩增介导的PCR(LAM-PCR),使用结合校正基因组内的区域(例如包括对于基因座而言非天然的外源性序列的区域)的引物,可从自已转导细胞群体中提取的DNA扩增F8基因座。可使用单分子下一代测序(nextgeneration sequencing;NGS)技术对所得PCR扩增子进行单独测序,以测定已转导细胞群体中存在的已编辑和未编辑F8等位基因的相对数量。这些数量可用于测定编辑元件整合到靶基因座中的等位基因频率。
在另一方面中,本公开提供药物组合物,其包括如本文中所公开的AAV以及药学上可接受的赋形剂、佐剂、稀释剂、媒剂或载体,或其组合。“药学上可接受的载体”包含当与组合物的活性成分组合时允许所述成分保留生物活性且不引起破坏性的生理反应(如非预期的免疫反应)的任何材料。药学上可接受的载体水、磷酸盐缓冲盐水、乳液(如油/水乳液)和润湿剂。包括这类载体的组合物通过熟知的常规方法调配,如以下中所阐述的那些方法:《雷明顿氏医药科学(Remington's Pharmaceutical Sciences)》,当前版,MackPublishing Co.,宾夕法尼亚州伊斯顿(Easton Pa.)18042,美国;A.Gennaro(2000)“雷明顿:医药科学和实践(Remington:The Science and Practice of Pharmacy)”,第20版,Lippincott,Williams和Wilkins;《医药剂型和药物递送系统(Pharmaceutical DosageForms and Drug Delivery Systems)》(1999)H.C.Ansel等人,第7版,Lippincott,Williams和Wilkins;和《医药赋形剂手册(Handbook of Pharmaceutical Excipients)》(2000)A.H.Kibbe等人,第3版美国医药协会(Amer.Pharmaceutical Assoc)。
III.使用方法
在另一方面中,本公开提供用于校正细胞中的F8基因中的突变或在细胞中表达FVIII多肽的方法。所述方法一般包括用如本文中所公开的复制缺陷型AAV转导细胞。这类方法在校正F8基因中的突变或恢复F8表达方面是高效的,且不需要通过外源性核酸酶(例如大范围核酸酶、锌指核酸酶、转录活化因子样酶(TALEN))或RNA引导的核酸酶(如Cas9)的作用在靶基因座处裂解基因组来辅助这类校正。因此,在某些实施例中,本文中所公开的方法涉及用如本文中所公开的复制缺陷型AAV转导细胞,而无需共转导或共施用外源性核酸酶或编码外源性核酸酶的核苷酸序列。
本文中所公开的方法可应用于在F8基因的外显子23-26中的任一个或全部或内含子22-25中的任一个或全部中具有突变的任何细胞。技术人员应了解,在F8表达中有活性的细胞备受关注。因此,在某些实施例中,所述方法应用于肝细胞、肝窦内皮细胞和/或其它内皮细胞。在某些实施例中,所述方法应用于肝脏。细胞或肝脏可以在受试者(例如人类受试者)中。
本文中所公开的方法可出于研究目的在活体外进行或可出于治疗目的离体或活体内进行。
在某些实施例中,待转导的细胞是在哺乳动物受试者中,且以有效转导受试者中的细胞的量向受试者施用AAV。因此,在某些实施例中,本公开提供一种用于治疗患有与F8基因突变相关联的疾病或病症的受试者的方法,所述方法一般包括向受试者施用有效量的如本文中所公开的复制缺陷型AAV。受试者可以是人类受试者或含有人类肝细胞的啮齿动物受试者(例如小鼠)。适合的小鼠受试者包含但不限于已植入人类肝细胞(例如人类肝细胞和人类肝窦内皮细胞)的小鼠。可使用本文中所公开的方法治疗血友病A或与外显子23-26中的任一个或全部或内含子22-25中的任一个或全部中的F8基因突变相关联的任何其它病症。在某些实施例中,转导细胞而无需共转导或共施用外源核酸酶或编码外源核酸酶的核苷酸序列。
在某些实施例中,前述方法采用复制缺陷型AAV,所述复制缺陷型AAV包括:(a)包括SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);(b)包括SEQID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);和/或(c)包括SEQID NO:16的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR)。
在某些实施例中,前述方法采用复制缺陷型AAV,所述复制缺陷型AAV包括:(a)包括SEQ ID NO:16的氨基酸203-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;(b)包括SEQ ID NO:16的氨基酸138-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;和/或(c)包括SEQ ID NO:16的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组。
在某些实施例中,前述方法采用复制缺陷型AAV,所述复制缺陷型AAV包括:(a)包括SEQ ID NO:13的氨基酸203-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);(b)包括SEQID NO:13的氨基酸138-736的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR);和/或(c)包括SEQID NO:13的氨基酸序列的AAV衣壳蛋白;和5'到3'包括以下遗传元件的校正基因组:5'ITR元件(例如SEQ ID NO:18的5'ITR)、5'同源臂(例如SEQ ID NO:27或31的5'同源臂)、人类F8的外显子23-26的编码序列(例如SEQ ID NO:26的编码序列)、任选的SV40聚腺苷酸化序列(例如SEQ ID NO:37的SV40聚腺苷酸化序列)、3'同源臂(例如SEQ ID NO:28或32的3'同源臂)和3'ITR元件(例如SEQ ID NO:19、61或63的3'ITR)。
在某些实施例中,前述方法采用复制缺陷型AAV,所述复制缺陷型AAV包括:(a)包括SEQ ID NO:13的氨基酸203-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;(b)包括SEQ ID NO:13的氨基酸138-736的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组;和/或(c)包括SEQ ID NO:13的氨基酸序列的AAV衣壳蛋白,和包括SEQ ID NO:26中所阐述的核苷酸序列的校正基因组。
本文中所公开的方法是特别有利的,因为其能够活体内和活体外高效率地校正细胞中的F8基因。在某些实施例中,当在不存在外源性核酸酶的情况下在B淋巴母细胞的标准AAV转导条件下将AAV与B淋巴母细胞群体活体外接触时,编辑元件整合到靶基因座中的整合功效为至少2%(例如至少2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在不存在外源性核酸酶的情况下在B淋巴母细胞的标准AAV转导条件下将AAV与B淋巴母细胞群体活体外接触时,编辑元件整合到靶基因座中的等位基因频率为至少1%(例如至少1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、7.5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在不存在外源性核酸酶或编码外源性核酸酶的核酸酶序列的情况下在标准AAV施用条件下向受试者施用AAV时,编辑元件整合到肝脏中的靶基因座中的整合功效为至少2%(例如至少2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。在某些实施例中,当在不存在外源性核酸酶或编码外源性核酸酶的核酸酶序列的情况下在标准AAV施用条件下向受试者施用AAV时,编辑元件整合到肝脏中的靶基因座中的等位基因频率为至少1%(例如至少1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、7.5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%)。如本文所用,术语“标准AAV施用条件”是指对于具有小鼠大小和体型的受试者,以每千克体重1.5×105个载体基因组的剂量静脉内施用AAV。技术人员应了解,应当根据受试者的大小和体型来调整剂量,以实现类似的预测功效。物种之间的示范性剂量转换由Nair等人(2016)《基础临床医药》7(2):27-31提供,其以全文引用的方式并入本文中。可采用测定F8基因的编辑效率的任何方法,包含但不限于本文中所描述的那些方法。
本文中所公开的方法也是有利的,因为其能够在活体内和活体外高效率地在细胞中表达FVIII蛋白。FVIII蛋白的表达水平是不具有F8基因中的突变的相同类型细胞中的内源性FVIII蛋白的表达水平的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在某些实施例中,FVIII蛋白的表达水平比不具有F8基因中的突变的相同类型细胞中的内源性FVIII蛋白的表达水平的高至少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9或10倍。可采用测定FVIII蛋白的表达水平的任何方法,包含但不限于ELISA、蛋白质印迹法、免疫染色和质谱法。
在某些实施例中,可以如本文所提供的或通过本领域的普通技术人员已知的任何转导方法进行用本文中所公开的AAV组合物转导细胞。在某些实施例中,细胞可以50,000;100,000;150,000;200,000;250,000;300,000;350,000;400,000;450,000;或500,000的感染复数(MOI)或以提供最优细胞转导的任何MOI与AAV进行接触。
本文中所公开的AAV组合物可通过任何适当的途径向受试者施用,包含但不限于静脉内、腹膜内、皮下、肌肉内、鼻内、局部或皮内途径。在某些实施例中,将组合物调配成用于通过静脉内注射或皮下注射施用。
IV.AAV包装系统
在另一方面中,本公开提供用于重组制备本文中所公开的复制缺陷型AAV的包装系统。这类包装系统一般包括:编码一种或多种AAV Rep蛋白的Rep核苷酸序列;编码如本文中所公开的一种或多种AAV进化枝F衣壳蛋白的Cap核苷酸序列;和如本文中所公开的用于校正F8基因的校正基因组,其中所述包装系统在细胞中可操作以将所述校正基因组封闭在衣壳中以形成AAV。
在某些实施例中,包装系统包括含Rep核苷酸序列和Cap核苷酸序列的第一载体以及含校正基因组的第二载体。如在如本文中所描述的包装系统的情形下所用,“载体”是指为用于将核酸引入到细胞中的媒剂的核酸分子(例如质粒、病毒、粘质粒、人工染色体等)。
在本文中所公开的包装系统中可采用任何AAV Rep蛋白。在包装系统的某些实施例中,Rep核苷酸序列编码AAV2 Rep蛋白。适合的AAV2 Rep蛋白包含但不限于Rep 78/68或Rep 68/52。在包装系统的某些实施例中,AAV2 Rep蛋白包括与SEQ ID NO:22的AAV2 Rep氨基酸序列具有最小百分比序列一致性的氨基酸序列,其中最小百分比序列一致性在AAV2Rep蛋白的氨基酸序列的整个长度上为至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)。在包装系统的某些实施例中,AAV2 Rep蛋白具有SEQ ID NO:22中所阐述的氨基酸序列。
在包装系统的某些实施例中,包装系统进一步包括第三载体,例如辅助病毒载体。第三载体可以是独立的第三载体,所述第三载体与第一载体整合在一起或与第二载体整合在一起。在某些实施例中,第三载体包括编码辅助病毒蛋白质的基因。
在包装系统的某些实施例中,辅助病毒选自以下组成的组:腺病毒、疱疹病毒(包含单纯性疱疹病毒(HSV))、痘病毒(如牛痘病毒)、巨细胞病毒(CMV)和杆状病毒。在包装系统的某些实施例中,其中辅助病毒是腺病毒,腺病毒基因组包括选自E1、E2、E4和VA组成的组的一种或多种腺病毒RNA基因。在包装系统的某些实施例中,其中辅助病毒是HSV,HSV基因组包括选自以下组成的组的HSV基因中的一个或多个:UL5/8/52、ICPO、ICP4、ICP22以和UL30/UL42。
在包装系统的某些实施例中,第一、第二和/或第三载体含于一个或多个转染质粒内。在某些实施例中,第一载体和第三载体含于第一转染质粒内。在某些实施例中,第二载体和第三载体含于第二转染质粒内。
在包装系统的某些实施例中,第一、第二和/或第三载体含于一个或多个重组辅助病毒内。在某些实施例中,第一载体和第三载体含于重组辅助病毒内。在某些实施例中,第二载体和第三载体含于重组辅助病毒内。
在另一方面中,本公开提供用于重组制备如本文中所描述的AAV的方法,其中所述方法包括在可操作以将校正基因组封闭在衣壳中以形成如本文所描述的AAV的条件下,用如所描述的包装系统转染或转导细胞。用于重组制备AAV的例示性方法包含瞬时转染(例如用含有如本文所描述的第一和第二载体以及任选地第三载体的一个或多个转染质粒)、病毒感染(例如用一个或多个重组辅助病毒,如腺病毒、痘病毒(如牛痘病毒)、疱疹病毒(包含HSV、巨细胞病毒或杆状病毒,其含有如本文所描述的第一和第二载体以及任选地第三载体)以及稳定的生产细胞系转染或感染(例如用稳定的生产细胞,如哺乳动物或昆虫细胞,其含有编码一种或多种AAV Rep蛋白的Rep核苷酸序列和/或编码如本文所描述的一种或多种AAV进化枝F衣壳蛋白的Cap核苷酸序列,且其中如本文所描述的校正基因组以转染质粒或重组辅助病毒的形式递送)。
V.实例
本文中所公开的重组AAV载体活体外和活体内介导高效基因编辑或基因转移。以下实例证明使用如本文中所公开的基于AAV的载体有效恢复在某些人类疾病(如血友病A)中突变的F8基因的表达。这些实例以说明性方式而非限制性方式提供。
实例1:使用AAV载体编辑人类F8基因基因座
这个实例提供F8校正载体VG-F8-002-FP和VG-F8-003-FP,各自分别含有用于将报告子(荧光蛋白(fluorescent protein;FP))编码序列插入人类F8基因的外显子22之后或插入内含子22中的编辑元件。
VG-F8-002-FP
如图1A中所示,VG-F8-002-FP载体5'到3'涵盖:5'ITR;5'同源臂,其由人类F8基因的核苷酸125,677-126,476的序列组成;T2A元件;FP编码序列;核定位信号(nuclearlocalization signal;NLS)编码序列;SV40聚腺苷酸化序列;3'同源臂,其由人类F8基因的核苷酸126,477-127,276的序列组成;和3'ITR。
将F8特异性校正载体VG-F8-002-FP整合到人基因组中的整合,将T2A元件、FP编码序列、NLS和SV40聚腺苷酸化序列插入人类F8基因的外显子22的最后一个密码子之后。T2A肽导致产生两种多肽:在外显子22末端终止的截短的F8肽,其与T2A肽的N端部分融合;和全长FP多肽,其中来自T2A肽的脯氨酸残留在N端处。因此,这种载体的整合引导荧光蛋白在存在于人类基因组中但在VG-F8-002-FP载体中未提供的F8启动子的控制下的表达。
VG-F8-003-FP
如图1B中所示,VG-F8-003-FP载体5'到3'涵盖:5'ITR;5'同源臂,其由人类F8基因的核苷酸125,777-126,576的序列组成;剪接受体元件;T2A元件;FP编码序列;NLS编码序列;SV40聚腺苷酸化序列;3'同源臂,其由人类F8基因的核苷酸126,577-127,376的序列组成;和3'ITR。
将F8特异性校正载体VG-F8-003-FP整合到人类基因组中的整合,将剪接受体、T2A元件、FP编码序列、NLS编码序列和SV40聚腺苷酸化序列插入到人类F8基因的内含子22中核苷酸126,576之后。从编辑的F8基因座转录的mRNA包括人类F8基因的外显子1-22、T2A元件、FP编码序列和NLS编码序列。2A肽导致产生两种多肽:在外显子22末端终止的截短的FVIII肽,其与2A肽的N端部分融合;和全长FP多肽,其中来自2A肽的脯氨酸残留在N端处。因此,这种载体的整合引导荧光蛋白在存在于人类基因组中但在VG-F8-003-FP载体中未提供的F8启动子的控制下的表达。
活体外检查VG-F8-002-FP和VG-F8-003-FP以评定靶向整合。在补充有15%胎牛血清(FCS)和2mM L-谷氨酰胺的RPMI中培养B淋巴母细胞细胞系16756、14623和13023。细胞以每毫升大致200,000个细胞接种,且当细胞达到每毫升500,000到1,000,000个细胞之间时拆分。
用AAVHSC17包装载体,且测试病毒粒子编辑B淋巴母细胞中人类F8基因的能力。AAVHSC-AAVS1-FP,一种包括AAV2 ITR、用于将基因组整合到AAVS1基因座的同源臂和无启动子荧光蛋白的AAV载体,用作基因整合的对照(参见例如WO 2016/049230 A1,其以全文引用的方式并入本文中)。
转导当天细胞处于对数生长期。对细胞进行计数且涂铺适当数量的细胞。通常,涂铺10,000个细胞用于流式细胞测量术分析。载体不超过培养体积的10%。基于效价和MOI计算载体,且在涂铺前计算以确保使用适当的板。
在转导之前,视需要将载体在冰上解冻且在冰上超声处理。将病毒分别添加到每个孔中,且来回吸取培养基以均匀分布病毒。在转导48小时之后,使用FACS缓冲液(1×PBS,2%FCS,0.1%叠氮化钠)收集用AAVF F8 FP载体转导的细胞。以1200RPM快速离心细胞10分钟。去除FACS缓冲液,使得残留大致200μL。紧接在流式细胞测量术分析之前添加DAPI(100μM工作储备液),到3μM的最终浓度。
通过从对应转导样本中的FP阳性细胞的百分比中减去未转导样本中的FP阳性细胞的百分比来计算基因编辑的比率。如图2中所示出,通过包装于人类F8基因座中的AAVHSC17衣壳中的VG-F8-002-FP载体编辑约3-8%的FANCD2杂合B淋巴母细胞(细胞ID:16756),通过包装于人类F8基因座中的AAVHSC17衣壳中的VG-F8-003-FP编辑约4-9%的和FANCD1杂合B淋巴细胞(细胞ID:14623)。相比之下,无法检测到FANCD1(同源重组的必需介体,也称为BRCA2)缺陷的B淋巴母细胞(细胞ID:13023)中的基因编辑比率。总之,这些数据显示使用AAV载体对F8基因基因座的编辑,以及观测到的编辑是通过同源重组介导的。
实例2:能够表达F8的人类组织
可恢复能够表达F8的一种或多种细胞类型中的F8的表达。图3显示原代人类肝窦内皮细胞(human hepatic sinusoidal endothelial cell;“HHSEC”)、人类肝癌HepG2细胞(“HepG2”)、来自正常个体的B淋巴母细胞(“F8 lymphobl.nor”)、来自具有F8内含子22倒位的患者的B淋巴母细胞(“F8 lymphobl.inv”)和原代人类肝细胞(“1ry Hepatocyte RNA”)中的F8 mRNA的水平。这些水平按照下文所描述的方案通过数字液滴PCR(ddPCR)测量。
冷冻的细胞沉淀用于RNA分离。解冻细胞且用PBS洗涤以去除DMSO。使用RNeasymini试剂盒(Qiagen)从细胞沉淀中分离总RNA,且用SimpliNano(GE Healthcare)测量浓度。每个细胞类型使用900ng RNA进行RT反应以产生cDNA,来自F8内含子22倒位的患者的B淋巴母细胞除外,其中使用450ng RNA进行RT反应。在最终数据分析中已对此进行了校正。
使用
Figure BDA0002721656370000541
反转录试剂(Applied Bioscience,目录号N8080234)来产生cDNA。所使用的
Figure BDA0002721656370000542
引物和探针显示于下表1中。将互补DNA样本以1:3稀释于蒸馏水中,且用10μl主混合物、1μl FAM探针(F8)、1μl VIC探针(GAPDH)和8μl稀释的cDNA制成混合物。根据QX200液滴发生器手册(Bio-Rad#10031907),使用DG8柱产生液滴。ddPCR的循环参数描述于表2中。PCR之后,在QX200液滴读取器上读取液滴,且使用Quantasoft软件进行分析。
表1.用于定量F8 mRNA的
Figure BDA0002721656370000543
引物和探针
分析ID 分析名称 目录号 批次号
Hs00252034_m1 F8 4331182 1276586
Hs00240767_m1 F8 4331182 1418037
Hs02758991_g1 GAPDH 4448490 P150630-001 H10
表2.ddPCR的循环参数
Figure BDA0002721656370000551
实例3:使用AAV载体活体内编辑鼠类F8基因基因座
这个实例提供在施用VG-mF8-001-Luc载体后F8基因座的活体内编辑。VG-mF8-001-Luc载体的图谱在图4A中示出。这载体5'到3'包括:5'ITR(未显示);与小鼠F8的内含子5到内含子6的第一序列具有同源性的左同源臂(“HAL”,其具有小鼠F8的核苷酸48,303-49,102的序列);剪接受体(splice acceptor;“SA”);T2A元件(“2A”);编码荧光素酶的无启动子核苷酸序列(“Luc ORF”);SV40聚腺苷酸化序列(“pA”);与小鼠F8的内含子6到内含子7的第二序列具有同源性的右同源臂(“HAR”,其具有小鼠F8的核苷酸49,103-49,902的序列);和3'ITR(未显示)。
将VG-mF8-001-Luc载体整合到小鼠基因组中的整合,将剪接受体、T2A元件、荧光素酶编码序列和SV40聚腺苷酸化序列插入到小鼠F8基因的内含子6中。从编辑的F8基因座转录的mRNA包括小鼠F8基因的外显子1-6、T2A元件和荧光素酶编码序列。T2A肽导致产生两种多肽:在外显子6末端终止的截短的FVIII肽,其与T2A肽的N端部分融合;和全长FP多肽,其中来自2A肽的脯氨酸残留在N端处。因此,这种载体的整合引导荧光素酶蛋白在小鼠基因组中存在但在VG-mF8-001-Luc载体中未提供的F8启动子的控制下的表达。
同源臂序列并不包含可用以驱动游离荧光素酶表达的转录调控元件的预测标志(参见Sabo等人(2006)《自然·方法(Nat Methods)》3:511-18;Griffith等人(2008)《核酸研究》36:D107-13;和Rando等人(2009)《生物化学年评(Annu Rev Biochem)》78:245-71中预测的转录调控元件)。为了确保荧光素酶蛋白不会从未基因组整合的编辑载体表达,将VG-mF8-001-Luc载体转染到人类HEK293和小鼠NIH3T3细胞中。如图4B中所示,在转染24小时后,未从转染的细胞中检测到生物发光。相比之下,从用包括由CMV启动子驱动的荧光素酶编码序列的阳性对照载体转染的细胞中检测到生物发光。尽管不希望受到理论所束缚,但是假设,载体大体上未整合到NIH3T3细胞的基因组中,因为通过转染,即在不存在AAVHSC递送设备的情况下,同源重组的比率很低。
图4C是显示来自用VG-mF8-001-Luc载体转染的HEK293和NIH3T3细胞的呈相对光度计单位(RLU)形式的荧光素酶表达的图。如图4C中所示,在用VG-mF8-001-Luc载体转染的HEK293和NIH3T3细胞与未转导的HEK293和NIH3T3细胞之间,测量到相同的荧光素酶表达。相比之下,从用包括由鸡β-肌动蛋白(CBA)启动子驱动的荧光素酶编码序列的阳性对照载体转染的细胞中检测到荧光素酶表达。
VG-mF8-001-Luc载体包装于AAVHSC15或AAVHSC17中(参见WO 2016/049230 A1,其以全文引用的方式并入本文中)。在不存在剪接受体的情况下,不同于VG-mF8-001-Luc的名称为VG-ΔSA-mF8-001-Luc的对照载体也包装于AAVHSC15中。为了确保一致的AAV病毒质量,对每个载体进行了一组特征分析:DNA和衣壳效价、载体蛋白质纯度(通过银染)、衣壳蛋白蛋白印迹和内毒素负荷。每种载体制剂之间的载体纯度、质量或效价无显著差异。从Charles River Laboratories获得的6-8周龄雌性C57BL/6小鼠接受低剂量的1×1010个载体基因组(每千克体重大致5×1011个载体基因组)或高剂量的3×1012个载体基因组(每千克体重大致1.5×1014个载体基因组),其通过尾静脉以最大10ml/kg的剂量向每只小鼠静脉内注射。对腹膜内注射有0.15mg/g荧光素(Caliper Life Sciences)的麻醉小鼠进行连续生物发光成像。在荧光素注射10分钟后使用SPECTRAL LagoX成像系统(SpectralInstruments Imaging,LLC)拍摄图像。对小鼠进行5分钟的大分箱(binning)腹侧成像。随后收集器官且成像。使用AMIView软件1.7.06版分析图像。
为了检测F8基因的编辑,在施用AAV载体后从小鼠收集肝脏样本,使用QIAamp DNAmini试剂盒(Qiagen)从样本中分离总DNA,且使用NanoDrop(ThermoFisher)测量DNA浓度。通过以下方法分析DNA样本:
终点PCR
使用对荧光素酶盒整合到靶位点中具有特异性的引物,通过终点PCR分析肝脏基因组DNA。引物序列提供于下表3中,且其靶向区域显示于图5A中。PCR条件提供于表4中。作为基因组PCR对照,跨越每个同源臂进行大小相当的PCR。通过Sanger测序确认每种扩增子的特异性。
表3.通过终点PCR定量F8编辑的DNA的引物
Figure BDA0002721656370000571
表4.ddPCR的循环参数
Figure BDA0002721656370000572
液滴数字PCR(ddPCR)
液滴数字PCR将DNA样本分配到油乳液中,在其中进行终点PCR反应且作为分子密度的二元测量进行定量。这种方法可以对每个基因组片段进行单独分析,且可以对编辑和未编辑的DNA链进行定量。所使用的
Figure BDA0002721656370000581
引物和探针显示于下表5中,且其靶向区域显示于图5B中。简言之,将DNA样本稀释于无核酸酶的水中到10ng/μl,且用12μl无dUTP超混合液(BioRad)、0.6μl FAM探针(F8)、0.6μl VIC探针(SA2A)、4.8μl无核酸酶水和6μl稀释的DNA(总计60ng)制成混合物。使用QX200TM AutoDGTM自动液滴生成器(BioRad)产生含有样本混合物的液滴,随后将其转移到热循环仪中进行PCR。ddPCR的循环参数描述于表6中。PCR之后,在QX200液滴读取器(BioRad)上读取液滴,且使用Quantasoft软件(BioRad)进行分析。编辑的DNA被识别为携带有效负载(如通过SA2A分析检测)和同源臂之外的基因组DNA序列(如通过F8分析检测)的单一DNA分子。因此,基于检测到的有效负载和基因组DNA在单个液滴中的共分配来计算编辑频率,超过了来自单独核酸分子的有效负载和基因组DNA的共分配的预期概率。
表5.用于定量F8编辑的DNA的
Figure BDA0002721656370000582
引物和探针
Figure BDA0002721656370000583
表6.ddPCR的循环参数
Figure BDA0002721656370000584
为了确定整合是否发生在预期的位置处,测量在整合的序列和将所述序列整合到其中的染色体之间的遗传连锁。用靶向区域的探针进行ddPCR,如图5B中所示。如图5D中所示,所测量的连锁与预期连锁很好地相关,指示整合发生在预期位置处。
下一代测序(NGS)
还通过下一代测序分析测量编辑频率。示范性方法描述于Frock等人(2015)《自然·生物技术(Nat Biotechnol)》33:179-186中。如图5C中所示,使用靶向同源臂外的基因组区域的生物素化诱饵引物的线性扩增朝向编辑插入位点延伸。通过抗生蛋白链菌素分离来纯化单链DNA产物。在接合NGS衔接子和配对末端测序后,将编辑效率测定为延伸到荧光素酶转基因中的读段相对于未编辑的插入位点的比率。为了确保准确定量,相对于人工构筑的编辑对照样本的标准对照测试这些基因分型分析。
结果
如图6A、6B和6C中所示,在施用包装于AAVHSC15中的VG-mF8-001-Luc载体7天之后,主要在肝脏中检测到来自整合的VG-mF8-001-Luc载体的生物发光,但在心脏、肺、脾和肾脏中也观测到以剂量依赖性方式的低水平的生物发光。这个结果指示,通过静脉内施用这种载体对F8基因的编辑主要发生在肝脏中,但是也可以在其它主要器官中以低水平检测到。图6D显示以不同剂量施用包装于AAVHSC15中的VG-mF8-001-Luc载体的小鼠肝脏中的生物发光总通量,且指示剂量依赖性反应。图6D显示在施用各种剂量的载体后,如通过ddPCR测量的肝脏中的编辑效率。图6F是显示VG-mF8-001-Luc载体在小鼠肝脏中的编辑效率相对于肝脏中的生物发光总通量所绘制的图,且显示这两个参数之间的弦正相关性。这些数据表明,活体内编辑效率取决于所施用的AAVHSC15-VG-mF8-001-Luc的剂量。
在一项长期研究中还评定AAV载体活体内编辑F8的能力。简言之,将VG-mF8-001-Luc载体基因组包装于AAVHSC15或AAVHSC17中(参见WO 2016/049230 A1)。通过尾静脉将每千克体重5.8×1012个载体基因组的剂量静脉内注射到各NOD.CB17-Prkdcscid/NCrCrl(NOD/SCID)6-8周龄的雄性小鼠中。载体注射63天后处死小鼠,且收集肝脏样本。使用与如上文所描述相同的方法对整个小鼠随着时间推移进行连续生物发光成像,且在肝脏样本中进行编辑效率测量。
在施用包装于AAVHSC15或AAVHSC17中的载体后的24小时内,最初可检测到来自整合的VG-mF8-001-Luc载体的发光,且在施用大致40天后达到稳定期(图7B)。在施用63天后,生物发光水平仍很高(图7A)。图7C显示在从施用了包装于AAVHSC15或AAVHSC17衣壳中的VG-mF8-001-Luc载体的小鼠获得的细胞中测量的编辑效率。用“HindIII”指示的载体是指已经用HindIII限制酶处理过的载体;这些载体通过人工地将插入的有效负载与靶基因组DNA分离而充当阴性对照。在注射包装于AAVHSC15载体中的载体7天后,在小鼠肝脏样本中观测到生物发光(图7D)。如图7E中所示,与其它主要器官的组织相比,在肝脏中检测到显著地更高水平的生物发光。图7F显示在至少470天中检测到施用包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体的正常小鼠中的生物发光。综上所述,这些数据指示,包装于AAVHSC15或AAVHSC17衣壳中的VG-mF8-001-Luc载体的静脉内递送导致在小鼠中持久编辑F8基因座。
相比之下,从VG-mF8-001-Luc载体上去除剪接受体极大地降低小鼠中的荧光素酶表达。mF8delta2A-luc载体的图谱参见图10E。与完整载体相比,施用包装于AAVHSC15衣壳中的mF8delta2A-luc载体的小鼠显示极大降低的生物发光(图10A)。当定量时,确定施用mF8delta2A-luc载体的小鼠相对于完整载体呈现出可观测到的生物发光损失96%(图10B)。如图10C中所示,与完整载体相比,在施用包装于AAVHSC15衣壳中的mF8delta2A-luc载体的小鼠的肝脏中,生物发光极大降低。在脑和肾组织中也观测到生物发光降低(图10D)。
为了检测F8基因的编辑,如上文所描述,通过终点PCR、液滴数字PCR和下一代测序分析施用VG-mF8-001-Luc载体9周后来自小鼠肝脏的DNA样本。如图8A中所示,在注射有包装于AAVHSC15和AAVHSC17中的VG-mF8-001-Luc载体的小鼠的肝脏样本中检测到编辑特异性PCR产物。在分别接受包装于AAVHSC15和AAVHSC17中的载体的注射的小鼠中,如通过ddPCR测量的肝脏中的编辑效率大致为7%和11%(图8B)。下一代测序在注射有包装于AAVHSC15中的VG-mF8-001-Luc载体的小鼠肝脏样本中检测到14.4%的类似编辑效率(图8C)。
以上结果表明,静脉内施用F8校正载体可以高效地改变(例如恢复)来自肝脏细胞的F8的表达。
图7C是显示从施用了包装于AAVHSC15或AAVHSC17衣壳中的VG-mF8-001-Luc载体的小鼠获得的细胞中的编辑效率的图。*指示与媒剂对照相比的p<0.004的显著性水平。用“HindIII”指示的载体是指已经用HindIII限制酶处理过的载体;这些载体通过人工地将插入的有效负载与靶基因组DNA分离而充当阴性对照。**指示与包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体(AAVHSC15-mF8-Luc)相比,p<0.03的显著性水平;***指示与包装于AAVHSC17衣壳中的VG-mF8-001-Luc载体(AAVHSC17-mF8-Luc)相比,p<0.004的显著性水平。图7D是一组显示在施用包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体(AAVHSC15-mF8-Luc)后不同时间点的小鼠的肝脏、肾脏、肌肉和脑组织的生物发光图像(每张照片从左到右)的照片。不同时间点在照片的顶行中从左到右增加,且在照片的底行中从左到右继续。图7E是显示施用包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体的小鼠的肝脏、肾脏、肌肉和脑组织的生物发光总通量的图。*指示与媒剂对照相比的p=0.007的显著性水平;**指示与其它组织相比的p<0.0001的显著性水平。图7F是显示在施用直到470天后施用包装于AAVHSC15衣壳中的VG-mF8-001-Luc载体的小鼠中的生物发光总通量的图。*指示与媒剂对照相比的p<0.0001的显著性水平。
实例4:用于将F8编码序列插入F8基因的F8校正载体
这个实例提供F8校正载体pHMI-F8-001-F8、pHMI-F8-002-F8、pHMI-F8-003-F8和pHMI-F8-004-F8,各自含有用于插入在人类F8基因的外显子22的最后一个核苷酸之后的F8编码序列。这些载体能够从具有内含子22倒位的突变F8基因基因座恢复F8的表达。
pHMI-F8-001-F8、pHMI-F8-002-F8、pHMI-F8-003-F8和pHMI-F8-004-F8的载体图谱分别显示于图9A、9B、9C和9D中。这些载体中的每一个5'到3'包括以下元件:5'ITR(“5'ITR Cam/NC004101/pTZAAV(FLIP)”);5'同源臂(“F8 HA-L e22,800bp”或“F8 HA-L e22”);人类F8的外显子23-26的编码序列(“外显子23”、“外显子24”、“外显子25”和“外显子26”);任选的SV40聚腺苷酸化序列(“SV40 pA”,仅在pHMI-F8-002-F8和pHMI-F8-004-F8中);3'同源臂(“F8 HA-R i22,800bp”或“F8 HA-R i22”);和3'ITR(“3'ITR Cam/NC004101/pTZAAV(FLOP)”)。这些元件的序列阐述于表7中。可以将包括独特限制性核酸内切酶的识别位点和裂解位点的靶向整合限制性盒(“TI RE盒”)插入到聚腺苷酸化序列的下游,从而利于检测所期望的同源重组。
表7:F8校正载体中的遗传元件
Figure BDA0002721656370000631
5'同源臂包括插入位点上游的野生型基因组序列,其中插入位点是F8基因的外显子22与内含子22之间的核苷酸间键。3'同源臂包括插入位点下游的野生型基因组序列。pHMI-F8-001-F8、pHMI-F8-002-F8、pHMI-F8-003-F8或pHMI-F8-004-F8载体整合到人类基因组中允许F8基因座转录为5'到3'包括以下元件的pre-mRNA:F8 pre-mRNA中从内源性5'端到插入位点的部分和部分F8编码序列(外显子22-26,排除聚腺苷酸化序列)。这个pre-mRNA的剪接产生5'到3'包括以下元件的mRNA:外显子1、内含子1、外显子2、内含子2、外显子3、内含子3、外显子4、内含子4、外显子5、内含子5、外显子6、内含子6、外显子7、内含子7、外显子8、内含子8、外显子9、内含子9、外显子10、内含子10、外显子11、内含子11、外显子12、内含子12、外显子13、内含子13、外显子14、内含子14、外显子15、内含子15、外显子16、内含子16、外显子17、内含子17、外显子18、内含子18、外显子19、内含子19、外显子20、内含子20、外显子21、内含子21、外显子22、外显子23、外显子24、外显子25和外显子26。内源性聚腺苷酸化序列存在于具有内含子22倒位的突变F8基因的下游。因此,尽管pHMI-F8-001-F8和pHMI-F8-003-F8载体不包括聚腺苷酸化序列,但编辑的F8基因的转录将被适当终止。在pHMI-F8-002-F8和pHMI-F8-004-F8载体中添加SV40聚腺苷酸化序列,以确保有效的转录终止。这些载体中的任何一种整合到人类基因组中的整合,将插入人类F8的外显子23-26的编码序列,从而恢复已通过F8基因的外显子22下游的突变(例如内含子22倒位)减弱的野生型F8蛋白的表达。
载体用进化枝F AAV衣壳(例如AAVHSC7、AAVHSC15和AAVHSC17)包装。活体外检查包装的病毒以评定靶向整合。在补充有15%胎牛血清(FCS)和2mM L-谷氨酰胺的RPMI-1640培养基中培养B淋巴母细胞。细胞以每毫升大致200,000个细胞接种,且当细胞达到每毫升500,000到1,000,000个细胞时拆分。转导当天细胞处于对数生长期。对细胞进行计数且涂铺适当数量的细胞。通常,涂铺10,000个细胞用于流式细胞测量术分析。在转导之前,视需要将载体在冰上解冻且在冰上超声处理。将病毒分别添加到每个孔中,且来回吸取培养基以均匀分布病毒。载体不超过培养体积的10%。基于效价和MOI计算载体,且在涂铺前计算以确保使用适当的板。
在转导四十八小时之后,使用FACS缓冲液(1×PBS,2%FCS,0.1%叠氮化钠)收集用载体转导的细胞。以1200RPM快速离心细胞10分钟。去除FACS缓冲液,使得残留大致200μL。紧接在流式细胞测量术分析之前添加DAPI(100μM工作储备液),到3μM的最终浓度。
***
本发明的范围不限于本文中所描述的具体实施例。事实上,除了所描述的那些之外,本发明的各种修改对于本领域技术人员来说将从前面的描述和附图中变得显而易见。这类修改旨在落入所附权利要求书的范围内。
本文所引用的全部参考文献(例如公开案或专利或专利申请)均以全文引用的方式且出于所有目的并入本文中,其程度如同每个单独的参考文献(例如公开案或专利或专利申请)出于所有目的被特别地或单独地指出以全文引用的方式并入一般。其它实施例处于所附权利要求书内。
序列表
<110> 希望之城公司(CITY OF HOPE)
同源药物公司(HOMOLOGY MEDICINES, INC.)
<120> 用于恢复F8基因功能的腺相关病毒组合物和其使用方法
<130> 610416 HMT-026PC
<150> 62/632,300
<151> 2018-02-19
<150> 62/639,919
<151> 2018-02-20
<150> 62/672,385
<151> 2018-05-16
<160> 63
<170> 专利版本3.5
<210> 1
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 腺相关AAV9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 15
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 新颖的AAV分离株
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> AAV2 5' ITR
<400> 18
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 19
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> AAV2 3' ITR
<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 20
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> AAV5 5' ITR
<400> 20
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 21
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> AAV5 3' ITR
<400> 21
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 22
<211> 621
<212> PRT
<213> 人工序列
<220>
<223> AAV2 Rep
<400> 22
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 23
<211> 198
<212> DNA
<213> 人工序列
<220>
<223> SV40聚腺苷酸化序列
<400> 23
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 24
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 剪接受体
<400> 24
ctgacctctt ctcttcctcc cacagg 26
<210> 25
<211> 209
<212> PRT
<213> 智人
<400> 25
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile
1 5 10 15
Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His
20 25 30
Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
35 40 45
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
50 55 60
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp
65 70 75 80
Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
85 90 95
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln
100 105 110
Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu
115 120 125
Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp
130 135 140
Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
145 150 155 160
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro
165 170 175
Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His
180 185 190
Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu
195 200 205
Tyr
<210> 26
<211> 627
<212> DNA
<213> 智人
<400> 26
gtcttctttg gcaatgtgga ttcatctggg ataaaacaca atatttttaa ccctccaatt 60
attgctcgat acatccgttt gcacccaact cattatagca ttcgcagcac tcttcgcatg 120
gagttgatgg gctgtgattt aaatagttgc agcatgccat tgggaatgga gagtaaagca 180
atatcagatg cacagattac tgcttcatcc tactttacca atatgtttgc cacctggtct 240
ccttcaaaag ctcgacttca cctccaaggg aggagtaatg cctggagacc tcaggtgaat 300
aatccaaaag agtggctgca agtggacttc cagaagacaa tgaaagtcac aggagtaact 360
actcagggag taaaatctct gcttaccagc atgtatgtga aggagttcct catctccagc 420
agtcaagatg gccatcagtg gactctcttt tttcagaatg gcaaagtaaa ggtttttcag 480
ggaaatcaag actccttcac acctgtggtg aactctctag acccaccgtt actgactcgc 540
taccttcgaa ttcaccccca gagttgggtg caccagattg ccctgaggat ggaggttctg 600
ggctgcgagg cacaggacct ctactga 627
<210> 27
<211> 800
<212> DNA
<213> 智人
<400> 27
agtctaataa ggaaagcaga aaagcaaagc aaccttataa tatggtgcaa taatttgcta 60
taatgaagtt atatacaaag tgaagtagaa gcatagaaga agcagcacta aatttgtctg 120
ggtgagtcag agaaggctaa ccaggaaaaa tagtttctga actaacactt gaaggaggtg 180
tagcagttca tcactgacag tgatgttggg gtgggtctgg tttcaggaga ggggaggaaa 240
ttggctttgg tctgaggctg aggtgtgggc aaagcattag cttatgtggg tccattagct 300
tatgtgagtc cacaaaaggt gtgtgtgtgt ttgtgtgtat gtgtgtgtgt gtgtgtgtgt 360
gtgtgtgtgt acgaaatggg ggctcaatga tttggtagtg gtttggtttg tcaagaagca 420
ggctgggaac tcaataagca tctttccatt catttctact gtgtatccca cagcttcaca 480
cacacatgca catttcaaca ttggtgactg cttcacttgc acacctaagg taatgatgga 540
cacacctgta gcaatgtaga ttcttcctaa gctaataatt agtttcagga ggtagcacat 600
acatttaaaa ataggttaaa ataaagtgtt attttaattg gtaggtggat ctgttggcac 660
caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc agcctctaca 720
tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact tatcgaggaa 780
attccactgg aaccttaatg 800
<210> 28
<211> 800
<212> DNA
<213> 智人
<400> 28
gtatgtaatt agtcatttaa agggaatgcc tgaatacttt aaagaatttt ggcagatttc 60
agatattgga caaacactct tagcttccac aaacttaatt ccaaaaaata atttttcact 120
tatgagcaat agagttatta cggacatatc agcaaaaatg tagtagtgtc aaggctcata 180
gatgatagaa atgaagagat gctgtattga tagaaatatg tgattcagga ctgtgtggat 240
tgatgattgt gagcttgctt atggatatcc taggtttgag gttatagtag gacaatcagg 300
ttgaaatgtc cagcaggcag taggtgaaag acaagtttag ggggcaaaac catggatgga 360
gatgaagatt catgacttcc acataaaagg atgggtgaaa ctttgggaat tgatgaattc 420
tctagaggtg agctcaagac ccttaaaggc ttaaaacctc agcgttattg tctactcttc 480
cctcattttt atgcccacaa atctggtcaa tcctttattt gcaatgcctc tcacatctct 540
ttcttctgtt tccatttata ccgctgttgc cacagcccag ggtcccatca cctcacactt 600
gatctattgt attacattcc taactagtct tcccccgttt ctaatctgtt ctccgataaa 660
agctgcacat cattttcagg ataatcatca gtcgcctgcc taaaactttt caatgtcttc 720
ccattgtctt tagaataaag ttcaaagtct tcaaatgacc ccaagcaaga taacttttgt 780
ttgccccttt agatccattt 800
<210> 29
<211> 800
<212> DNA
<213> 智人
<400> 29
agcagcacta aatttgtctg ggtgagtcag agaaggctaa ccaggaaaaa tagtttctga 60
actaacactt gaaggaggtg tagcagttca tcactgacag tgatgttggg gtgggtctgg 120
tttcaggaga ggggaggaaa ttggctttgg tctgaggctg aggtgtgggc aaagcattag 180
cttatgtggg tccattagct tatgtgagtc cacaaaaggt gtgtgtgtgt ttgtgtgtat 240
gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt acgaaatggg ggctcaatga tttggtagtg 300
gtttggtttg tcaagaagca ggctgggaac tcaataagca tctttccatt catttctact 360
gtgtatccca cagcttcaca cacacatgca catttcaaca ttggtgactg cttcacttgc 420
acacctaagg taatgatgga cacacctgta gcaatgtaga ttcttcctaa gctaataatt 480
agtttcagga ggtagcacat acatttaaaa ataggttaaa ataaagtgtt attttaattg 540
gtaggtggat ctgttggcac caatgattat tcacggcatc aagacccagg gtgcccgtca 600
gaagttctcc agcctctaca tctctcagtt tatcatcatg tatagtcttg atgggaagaa 660
gtggcagact tatcgaggaa attccactgg aaccttaatg gtatgtaatt agtcatttaa 720
agggaatgcc tgaatacttt aaagaatttt ggcagatttc agatattgga caaacactct 780
tagcttccac aaacttaatt 800
<210> 30
<211> 800
<212> DNA
<213> 智人
<400> 30
ccaaaaaata atttttcact tatgagcaat agagttatta cggacatatc agcaaaaatg 60
tagtagtgtc aaggctcata gatgatagaa atgaagagat gctgtattga tagaaatatg 120
tgattcagga ctgtgtggat tgatgattgt gagcttgctt atggatatcc taggtttgag 180
gttatagtag gacaatcagg ttgaaatgtc cagcaggcag taggtgaaag acaagtttag 240
ggggcaaaac catggatgga gatgaagatt catgacttcc acataaaagg atgggtgaaa 300
ctttgggaat tgatgaattc tctagaggtg agctcaagac ccttaaaggc ttaaaacctc 360
agcgttattg tctactcttc cctcattttt atgcccacaa atctggtcaa tcctttattt 420
gcaatgcctc tcacatctct ttcttctgtt tccatttata ccgctgttgc cacagcccag 480
ggtcccatca cctcacactt gatctattgt attacattcc taactagtct tcccccgttt 540
ctaatctgtt ctccgataaa agctgcacat cattttcagg ataatcatca gtcgcctgcc 600
taaaactttt caatgtcttc ccattgtctt tagaataaag ttcaaagtct tcaaatgacc 660
ccaagcaaga taacttttgt ttgccccttt agatccattt tcctgcttct ctaccctgct 720
tcttgttctg tgaggtgagc ttgtatagaa tacatcaaca ggttaccttg tcctccagct 780
tttggttgga tttcaccaac 800
<210> 31
<211> 565
<212> DNA
<213> 智人
<400> 31
ggaaattggc tttggtctga ggctgaggtg tgggcaaagc attagcttat gtgggtccat 60
tagcttatgt gagtccacaa aaggtgtgtg tgtgtttgtg tgtatgtgtg tgtgtgtgtg 120
tgtgtgtgtg tgtgtacgaa atgggggctc aatgatttgg tagtggtttg gtttgtcaag 180
aagcaggctg ggaactcaat aagcatcttt ccattcattt ctactgtgta tcccacagct 240
tcacacacac atgcacattt caacattggt gactgcttca cttgcacacc taaggtaatg 300
atggacacac ctgtagcaat gtagattctt cctaagctaa taattagttt caggaggtag 360
cacatacatt taaaaatagg ttaaaataaa gtgttatttt aattggtagg tggatctgtt 420
ggcaccaatg attattcacg gcatcaagac ccagggtgcc cgtcagaagt tctccagcct 480
ctacatctct cagtttatca tcatgtatag tcttgatggg aagaagtggc agacttatcg 540
aggaaattcc actggaacct taatg 565
<210> 32
<211> 241
<212> DNA
<213> 智人
<400> 32
gtatgtaatt agtcatttaa agggaatgcc tgaatacttt aaagaatttt ggcagatttc 60
agatattgga caaacactct tagcttccac aaacttaatt ccaaaaaata atttttcact 120
tatgagcaat agagttatta cggacatatc agcaaaaatg tagtagtgtc aaggctcata 180
gatgatagaa atgaagagat gctgtattga tagaaatatg tgattcagga ctgtgtggat 240
t 241
<210> 33
<211> 1447
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hF8-004-F8编码序列盒(包含FVIII部分编码序列和SV40 polyA)
<400> 33
ggaaattggc tttggtctga ggctgaggtg tgggcaaagc attagcttat gtgggtccat 60
tagcttatgt gagtccacaa aaggtgtgtg tgtgtttgtg tgtatgtgtg tgtgtgtgtg 120
tgtgtgtgtg tgtgtacgaa atgggggctc aatgatttgg tagtggtttg gtttgtcaag 180
aagcaggctg ggaactcaat aagcatcttt ccattcattt ctactgtgta tcccacagct 240
tcacacacac atgcacattt caacattggt gactgcttca cttgcacacc taaggtaatg 300
atggacacac ctgtagcaat gtagattctt cctaagctaa taattagttt caggaggtag 360
cacatacatt taaaaatagg ttaaaataaa gtgttatttt aattggtagg tggatctgtt 420
ggcaccaatg attattcacg gcatcaagac ccagggtgcc cgtcagaagt tctccagcct 480
ctacatctct cagtttatca tcatgtatag tcttgatggg aagaagtggc agacttatcg 540
aggaaattcc actggaacct taatggtctt ctttggcaat gtggattcat ctgggataaa 600
acacaatatt tttaaccctc caattattgc tcgatacatc cgtttgcacc caactcatta 660
tagcattcgc agcactcttc gcatggagtt gatgggctgt gatttaaata gttgcagcat 720
gccattggga atggagagta aagcaatatc agatgcacag attactgctt catcctactt 780
taccaatatg tttgccacct ggtctccttc aaaagctcga cttcacctcc aagggaggag 840
taatgcctgg agacctcagg tgaataatcc aaaagagtgg ctgcaagtgg acttccagaa 900
gacaatgaaa gtcacaggag taactactca gggagtaaaa tctctgctta ccagcatgta 960
tgtgaaggag ttcctcatct ccagcagtca agatggccat cagtggactc tcttttttca 1020
gaatggcaaa gtaaaggttt ttcagggaaa tcaagactcc ttcacacctg tggtgaactc 1080
tctagaccca ccgttactga ctcgctacct tcgaattcac ccccagagtt gggtgcacca 1140
gattgccctg aggatggagg ttctgggctg cgaggcacag gacctctact gaaagcttta 1200
ccaaggcctc tcgagcctct agaactatag tgagtcgtat tacgtagatc cagacatgat 1260
aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat 1320
ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt 1380
taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt 1440
ttaagct 1447
<210> 34
<211> 806
<212> DNA
<213> 智人
<400> 34
ggaaattggc tttggtctga ggctgaggtg tgggcaaagc attagcttat gtgggtccat 60
tagcttatgt gagtccacaa aaggtgtgtg tgtgtttgtg tgtatgtgtg tgtgtgtgtg 120
tgtgtgtgtg tgtgtacgaa atgggggctc aatgatttgg tagtggtttg gtttgtcaag 180
aagcaggctg ggaactcaat aagcatcttt ccattcattt ctactgtgta tcccacagct 240
tcacacacac atgcacattt caacattggt gactgcttca cttgcacacc taaggtaatg 300
atggacacac ctgtagcaat gtagattctt cctaagctaa taattagttt caggaggtag 360
cacatacatt taaaaatagg ttaaaataaa gtgttatttt aattggtagg tggatctgtt 420
ggcaccaatg attattcacg gcatcaagac ccagggtgcc cgtcagaagt tctccagcct 480
ctacatctct cagtttatca tcatgtatag tcttgatggg aagaagtggc agacttatcg 540
aggaaattcc actggaacct taatggtatg taattagtca tttaaaggga atgcctgaat 600
actttaaaga attttggcag atttcagata ttggacaaac actcttagct tccacaaact 660
taattccaaa aaataatttt tcacttatga gcaatagagt tattacggac atatcagcaa 720
aaatgtagta gtgtcaaggc tcatagatga tagaaatgaa gagatgctgt attgatagaa 780
atatgtgatt caggactgtg tggatt 806
<210> 35
<211> 246
<212> DNA
<213> 人工序列
<220>
<223> SV40聚腺苷酸化序列
<400> 35
caaggcctct cgagcctcta gaactatagt gagtcgtatt acgtagatcc agacatgata 60
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 120
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 180
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 240
taagct 246
<210> 36
<211> 198
<212> DNA
<213> 人工序列
<220>
<223> SV40聚腺苷酸化序列
<400> 36
ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 60
gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 120
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 180
tcttatcatg tctggatc 198
<210> 37
<211> 246
<212> DNA
<213> 人工序列
<220>
<223> SV40聚腺苷酸化序列
<400> 37
agcttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt 60
gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 120
ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 180
gtatcttatc atgtctggat ctacgtaata cgactcacta tagttctaga ggctcgagag 240
gccttg 246
<210> 38
<211> 2236
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hF8-001-F8校正基因组
<400> 38
agtctaataa ggaaagcaga aaagcaaagc aaccttataa tatggtgcaa taatttgcta 60
taatgaagtt atatacaaag tgaagtagaa gcatagaaga agcagcacta aatttgtctg 120
ggtgagtcag agaaggctaa ccaggaaaaa tagtttctga actaacactt gaaggaggtg 180
tagcagttca tcactgacag tgatgttggg gtgggtctgg tttcaggaga ggggaggaaa 240
ttggctttgg tctgaggctg aggtgtgggc aaagcattag cttatgtggg tccattagct 300
tatgtgagtc cacaaaaggt gtgtgtgtgt ttgtgtgtat gtgtgtgtgt gtgtgtgtgt 360
gtgtgtgtgt acgaaatggg ggctcaatga tttggtagtg gtttggtttg tcaagaagca 420
ggctgggaac tcaataagca tctttccatt catttctact gtgtatccca cagcttcaca 480
cacacatgca catttcaaca ttggtgactg cttcacttgc acacctaagg taatgatgga 540
cacacctgta gcaatgtaga ttcttcctaa gctaataatt agtttcagga ggtagcacat 600
acatttaaaa ataggttaaa ataaagtgtt attttaattg gtaggtggat ctgttggcac 660
caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc agcctctaca 720
tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact tatcgaggaa 780
attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg ataaaacaca 840
atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact cattatagca 900
ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc agcatgccat 960
tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc tactttacca 1020
atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg aggagtaatg 1080
cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc cagaagacaa 1140
tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc atgtatgtga 1200
aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt tttcagaatg 1260
gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg aactctctag 1320
acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg caccagattg 1380
ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctactgaaag ctttacgtat 1440
gtaattagtc atttaaaggg aatgcctgaa tactttaaag aattttggca gatttcagat 1500
attggacaaa cactcttagc ttccacaaac ttaattccaa aaaataattt ttcacttatg 1560
agcaatagag ttattacgga catatcagca aaaatgtagt agtgtcaagg ctcatagatg 1620
atagaaatga agagatgctg tattgataga aatatgtgat tcaggactgt gtggattgat 1680
gattgtgagc ttgcttatgg atatcctagg tttgaggtta tagtaggaca atcaggttga 1740
aatgtccagc aggcagtagg tgaaagacaa gtttaggggg caaaaccatg gatggagatg 1800
aagattcatg acttccacat aaaaggatgg gtgaaacttt gggaattgat gaattctcta 1860
gaggtgagct caagaccctt aaaggcttaa aacctcagcg ttattgtcta ctcttccctc 1920
atttttatgc ccacaaatct ggtcaatcct ttatttgcaa tgcctctcac atctctttct 1980
tctgtttcca tttataccgc tgttgccaca gcccagggtc ccatcacctc acacttgatc 2040
tattgtatta cattcctaac tagtcttccc ccgtttctaa tctgttctcc gataaaagct 2100
gcacatcatt ttcaggataa tcatcagtcg cctgcctaaa acttttcaat gtcttcccat 2160
tgtctttaga ataaagttca aagtcttcaa atgaccccaa gcaagataac ttttgtttgc 2220
ccctttagat ccattt 2236
<210> 39
<211> 2482
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hF8-002-F8校正基因组
<400> 39
agtctaataa ggaaagcaga aaagcaaagc aaccttataa tatggtgcaa taatttgcta 60
taatgaagtt atatacaaag tgaagtagaa gcatagaaga agcagcacta aatttgtctg 120
ggtgagtcag agaaggctaa ccaggaaaaa tagtttctga actaacactt gaaggaggtg 180
tagcagttca tcactgacag tgatgttggg gtgggtctgg tttcaggaga ggggaggaaa 240
ttggctttgg tctgaggctg aggtgtgggc aaagcattag cttatgtggg tccattagct 300
tatgtgagtc cacaaaaggt gtgtgtgtgt ttgtgtgtat gtgtgtgtgt gtgtgtgtgt 360
gtgtgtgtgt acgaaatggg ggctcaatga tttggtagtg gtttggtttg tcaagaagca 420
ggctgggaac tcaataagca tctttccatt catttctact gtgtatccca cagcttcaca 480
cacacatgca catttcaaca ttggtgactg cttcacttgc acacctaagg taatgatgga 540
cacacctgta gcaatgtaga ttcttcctaa gctaataatt agtttcagga ggtagcacat 600
acatttaaaa ataggttaaa ataaagtgtt attttaattg gtaggtggat ctgttggcac 660
caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc agcctctaca 720
tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact tatcgaggaa 780
attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg ataaaacaca 840
atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact cattatagca 900
ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc agcatgccat 960
tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc tactttacca 1020
atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg aggagtaatg 1080
cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc cagaagacaa 1140
tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc atgtatgtga 1200
aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt tttcagaatg 1260
gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg aactctctag 1320
acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg caccagattg 1380
ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctactgaaag ctttaccaag 1440
gcctctcgag cctctagaac tatagtgagt cgtattacgt agatccagac atgataagat 1500
acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg 1560
aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca 1620
acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaag 1680
ctgtatgtaa ttagtcattt aaagggaatg cctgaatact ttaaagaatt ttggcagatt 1740
tcagatattg gacaaacact cttagcttcc acaaacttaa ttccaaaaaa taatttttca 1800
cttatgagca atagagttat tacggacata tcagcaaaaa tgtagtagtg tcaaggctca 1860
tagatgatag aaatgaagag atgctgtatt gatagaaata tgtgattcag gactgtgtgg 1920
attgatgatt gtgagcttgc ttatggatat cctaggtttg aggttatagt aggacaatca 1980
ggttgaaatg tccagcaggc agtaggtgaa agacaagttt agggggcaaa accatggatg 2040
gagatgaaga ttcatgactt ccacataaaa ggatgggtga aactttggga attgatgaat 2100
tctctagagg tgagctcaag acccttaaag gcttaaaacc tcagcgttat tgtctactct 2160
tccctcattt ttatgcccac aaatctggtc aatcctttat ttgcaatgcc tctcacatct 2220
ctttcttctg tttccattta taccgctgtt gccacagccc agggtcccat cacctcacac 2280
ttgatctatt gtattacatt cctaactagt cttcccccgt ttctaatctg ttctccgata 2340
aaagctgcac atcattttca ggataatcat cagtcgcctg cctaaaactt ttcaatgtct 2400
tcccattgtc tttagaataa agttcaaagt cttcaaatga ccccaagcaa gataactttt 2460
gtttgcccct ttagatccat tt 2482
<210> 40
<211> 1442
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hF8-003-F8校正基因组
<400> 40
ggaaattggc tttggtctga ggctgaggtg tgggcaaagc attagcttat gtgggtccat 60
tagcttatgt gagtccacaa aaggtgtgtg tgtgtttgtg tgtatgtgtg tgtgtgtgtg 120
tgtgtgtgtg tgtgtacgaa atgggggctc aatgatttgg tagtggtttg gtttgtcaag 180
aagcaggctg ggaactcaat aagcatcttt ccattcattt ctactgtgta tcccacagct 240
tcacacacac atgcacattt caacattggt gactgcttca cttgcacacc taaggtaatg 300
atggacacac ctgtagcaat gtagattctt cctaagctaa taattagttt caggaggtag 360
cacatacatt taaaaatagg ttaaaataaa gtgttatttt aattggtagg tggatctgtt 420
ggcaccaatg attattcacg gcatcaagac ccagggtgcc cgtcagaagt tctccagcct 480
ctacatctct cagtttatca tcatgtatag tcttgatggg aagaagtggc agacttatcg 540
aggaaattcc actggaacct taatggtctt ctttggcaat gtggattcat ctgggataaa 600
acacaatatt tttaaccctc caattattgc tcgatacatc cgtttgcacc caactcatta 660
tagcattcgc agcactcttc gcatggagtt gatgggctgt gatttaaata gttgcagcat 720
gccattggga atggagagta aagcaatatc agatgcacag attactgctt catcctactt 780
taccaatatg tttgccacct ggtctccttc aaaagctcga cttcacctcc aagggaggag 840
taatgcctgg agacctcagg tgaataatcc aaaagagtgg ctgcaagtgg acttccagaa 900
gacaatgaaa gtcacaggag taactactca gggagtaaaa tctctgctta ccagcatgta 960
tgtgaaggag ttcctcatct ccagcagtca agatggccat cagtggactc tcttttttca 1020
gaatggcaaa gtaaaggttt ttcagggaaa tcaagactcc ttcacacctg tggtgaactc 1080
tctagaccca ccgttactga ctcgctacct tcgaattcac ccccagagtt gggtgcacca 1140
gattgccctg aggatggagg ttctgggctg cgaggcacag gacctctact gaaagcttta 1200
cgtatgtaat tagtcattta aagggaatgc ctgaatactt taaagaattt tggcagattt 1260
cagatattgg acaaacactc ttagcttcca caaacttaat tccaaaaaat aatttttcac 1320
ttatgagcaa tagagttatt acggacatat cagcaaaaat gtagtagtgt caaggctcat 1380
agatgataga aatgaagaga tgctgtattg atagaaatat gtgattcagg actgtgtgga 1440
tt 1442
<210> 41
<211> 1688
<212> DNA
<213> 人工序列
<220>
<223> pHMI-hF8-004-F8校正基因组
<400> 41
ggaaattggc tttggtctga ggctgaggtg tgggcaaagc attagcttat gtgggtccat 60
tagcttatgt gagtccacaa aaggtgtgtg tgtgtttgtg tgtatgtgtg tgtgtgtgtg 120
tgtgtgtgtg tgtgtacgaa atgggggctc aatgatttgg tagtggtttg gtttgtcaag 180
aagcaggctg ggaactcaat aagcatcttt ccattcattt ctactgtgta tcccacagct 240
tcacacacac atgcacattt caacattggt gactgcttca cttgcacacc taaggtaatg 300
atggacacac ctgtagcaat gtagattctt cctaagctaa taattagttt caggaggtag 360
cacatacatt taaaaatagg ttaaaataaa gtgttatttt aattggtagg tggatctgtt 420
ggcaccaatg attattcacg gcatcaagac ccagggtgcc cgtcagaagt tctccagcct 480
ctacatctct cagtttatca tcatgtatag tcttgatggg aagaagtggc agacttatcg 540
aggaaattcc actggaacct taatggtctt ctttggcaat gtggattcat ctgggataaa 600
acacaatatt tttaaccctc caattattgc tcgatacatc cgtttgcacc caactcatta 660
tagcattcgc agcactcttc gcatggagtt gatgggctgt gatttaaata gttgcagcat 720
gccattggga atggagagta aagcaatatc agatgcacag attactgctt catcctactt 780
taccaatatg tttgccacct ggtctccttc aaaagctcga cttcacctcc aagggaggag 840
taatgcctgg agacctcagg tgaataatcc aaaagagtgg ctgcaagtgg acttccagaa 900
gacaatgaaa gtcacaggag taactactca gggagtaaaa tctctgctta ccagcatgta 960
tgtgaaggag ttcctcatct ccagcagtca agatggccat cagtggactc tcttttttca 1020
gaatggcaaa gtaaaggttt ttcagggaaa tcaagactcc ttcacacctg tggtgaactc 1080
tctagaccca ccgttactga ctcgctacct tcgaattcac ccccagagtt gggtgcacca 1140
gattgccctg aggatggagg ttctgggctg cgaggcacag gacctctact gaaagcttta 1200
ccaaggcctc tcgagcctct agaactatag tgagtcgtat tacgtagatc cagacatgat 1260
aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat 1320
ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt 1380
taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt 1440
ttaagctgta tgtaattagt catttaaagg gaatgcctga atactttaaa gaattttggc 1500
agatttcaga tattggacaa acactcttag cttccacaaa cttaattcca aaaaataatt 1560
tttcacttat gagcaataga gttattacgg acatatcagc aaaaatgtag tagtgtcaag 1620
gctcatagat gatagaaatg aagagatgct gtattgatag aaatatgtga ttcaggactg 1680
tgtggatt 1688
<210> 42
<211> 2640
<212> DNA
<213> 人工序列
<220>
<223> 包含ITR的pHMI-hF8-001-F8校正基因组
<400> 42
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tggcagtcta ataaggaaag cagaaaagca aagcaacctt 240
ataatatggt gcaataattt gctataatga agttatatac aaagtgaagt agaagcatag 300
aagaagcagc actaaatttg tctgggtgag tcagagaagg ctaaccagga aaaatagttt 360
ctgaactaac acttgaagga ggtgtagcag ttcatcactg acagtgatgt tggggtgggt 420
ctggtttcag gagaggggag gaaattggct ttggtctgag gctgaggtgt gggcaaagca 480
ttagcttatg tgggtccatt agcttatgtg agtccacaaa aggtgtgtgt gtgtttgtgt 540
gtatgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtacgaaa tgggggctca atgatttggt 600
agtggtttgg tttgtcaaga agcaggctgg gaactcaata agcatctttc cattcatttc 660
tactgtgtat cccacagctt cacacacaca tgcacatttc aacattggtg actgcttcac 720
ttgcacacct aaggtaatga tggacacacc tgtagcaatg tagattcttc ctaagctaat 780
aattagtttc aggaggtagc acatacattt aaaaataggt taaaataaag tgttatttta 840
attggtaggt ggatctgttg gcaccaatga ttattcacgg catcaagacc cagggtgccc 900
gtcagaagtt ctccagcctc tacatctctc agtttatcat catgtatagt cttgatggga 960
agaagtggca gacttatcga ggaaattcca ctggaacctt aatggtcttc tttggcaatg 1020
tggattcatc tgggataaaa cacaatattt ttaaccctcc aattattgct cgatacatcc 1080
gtttgcaccc aactcattat agcattcgca gcactcttcg catggagttg atgggctgtg 1140
atttaaatag ttgcagcatg ccattgggaa tggagagtaa agcaatatca gatgcacaga 1200
ttactgcttc atcctacttt accaatatgt ttgccacctg gtctccttca aaagctcgac 1260
ttcacctcca agggaggagt aatgcctgga gacctcaggt gaataatcca aaagagtggc 1320
tgcaagtgga cttccagaag acaatgaaag tcacaggagt aactactcag ggagtaaaat 1380
ctctgcttac cagcatgtat gtgaaggagt tcctcatctc cagcagtcaa gatggccatc 1440
agtggactct cttttttcag aatggcaaag taaaggtttt tcagggaaat caagactcct 1500
tcacacctgt ggtgaactct ctagacccac cgttactgac tcgctacctt cgaattcacc 1560
cccagagttg ggtgcaccag attgccctga ggatggaggt tctgggctgc gaggcacagg 1620
acctctactg aaagctttac gtatgtaatt agtcatttaa agggaatgcc tgaatacttt 1680
aaagaatttt ggcagatttc agatattgga caaacactct tagcttccac aaacttaatt 1740
ccaaaaaata atttttcact tatgagcaat agagttatta cggacatatc agcaaaaatg 1800
tagtagtgtc aaggctcata gatgatagaa atgaagagat gctgtattga tagaaatatg 1860
tgattcagga ctgtgtggat tgatgattgt gagcttgctt atggatatcc taggtttgag 1920
gttatagtag gacaatcagg ttgaaatgtc cagcaggcag taggtgaaag acaagtttag 1980
ggggcaaaac catggatgga gatgaagatt catgacttcc acataaaagg atgggtgaaa 2040
ctttgggaat tgatgaattc tctagaggtg agctcaagac ccttaaaggc ttaaaacctc 2100
agcgttattg tctactcttc cctcattttt atgcccacaa atctggtcaa tcctttattt 2160
gcaatgcctc tcacatctct ttcttctgtt tccatttata ccgctgttgc cacagcccag 2220
ggtcccatca cctcacactt gatctattgt attacattcc taactagtct tcccccgttt 2280
ctaatctgtt ctccgataaa agctgcacat cattttcagg ataatcatca gtcgcctgcc 2340
taaaactttt caatgtcttc ccattgtctt tagaataaag ttcaaagtct tcaaatgacc 2400
ccaagcaaga taacttttgt ttgccccttt agatccattt aaatgcaggt ctagatacgt 2460
agataagtag catggcgggt taatcattaa ctacaaggaa cccctagtga tggagttggc 2520
cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg 2580
cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 2640
<210> 43
<211> 2886
<212> DNA
<213> 人工序列
<220>
<223> 包含ITR的pHMI-hF8-002-F8校正基因组
<400> 43
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tggcagtcta ataaggaaag cagaaaagca aagcaacctt 240
ataatatggt gcaataattt gctataatga agttatatac aaagtgaagt agaagcatag 300
aagaagcagc actaaatttg tctgggtgag tcagagaagg ctaaccagga aaaatagttt 360
ctgaactaac acttgaagga ggtgtagcag ttcatcactg acagtgatgt tggggtgggt 420
ctggtttcag gagaggggag gaaattggct ttggtctgag gctgaggtgt gggcaaagca 480
ttagcttatg tgggtccatt agcttatgtg agtccacaaa aggtgtgtgt gtgtttgtgt 540
gtatgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtacgaaa tgggggctca atgatttggt 600
agtggtttgg tttgtcaaga agcaggctgg gaactcaata agcatctttc cattcatttc 660
tactgtgtat cccacagctt cacacacaca tgcacatttc aacattggtg actgcttcac 720
ttgcacacct aaggtaatga tggacacacc tgtagcaatg tagattcttc ctaagctaat 780
aattagtttc aggaggtagc acatacattt aaaaataggt taaaataaag tgttatttta 840
attggtaggt ggatctgttg gcaccaatga ttattcacgg catcaagacc cagggtgccc 900
gtcagaagtt ctccagcctc tacatctctc agtttatcat catgtatagt cttgatggga 960
agaagtggca gacttatcga ggaaattcca ctggaacctt aatggtcttc tttggcaatg 1020
tggattcatc tgggataaaa cacaatattt ttaaccctcc aattattgct cgatacatcc 1080
gtttgcaccc aactcattat agcattcgca gcactcttcg catggagttg atgggctgtg 1140
atttaaatag ttgcagcatg ccattgggaa tggagagtaa agcaatatca gatgcacaga 1200
ttactgcttc atcctacttt accaatatgt ttgccacctg gtctccttca aaagctcgac 1260
ttcacctcca agggaggagt aatgcctgga gacctcaggt gaataatcca aaagagtggc 1320
tgcaagtgga cttccagaag acaatgaaag tcacaggagt aactactcag ggagtaaaat 1380
ctctgcttac cagcatgtat gtgaaggagt tcctcatctc cagcagtcaa gatggccatc 1440
agtggactct cttttttcag aatggcaaag taaaggtttt tcagggaaat caagactcct 1500
tcacacctgt ggtgaactct ctagacccac cgttactgac tcgctacctt cgaattcacc 1560
cccagagttg ggtgcaccag attgccctga ggatggaggt tctgggctgc gaggcacagg 1620
acctctactg aaagctttac caaggcctct cgagcctcta gaactatagt gagtcgtatt 1680
acgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 1740
agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 1800
taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 1860
gggaggtgtg ggaggttttt taagctgtat gtaattagtc atttaaaggg aatgcctgaa 1920
tactttaaag aattttggca gatttcagat attggacaaa cactcttagc ttccacaaac 1980
ttaattccaa aaaataattt ttcacttatg agcaatagag ttattacgga catatcagca 2040
aaaatgtagt agtgtcaagg ctcatagatg atagaaatga agagatgctg tattgataga 2100
aatatgtgat tcaggactgt gtggattgat gattgtgagc ttgcttatgg atatcctagg 2160
tttgaggtta tagtaggaca atcaggttga aatgtccagc aggcagtagg tgaaagacaa 2220
gtttaggggg caaaaccatg gatggagatg aagattcatg acttccacat aaaaggatgg 2280
gtgaaacttt gggaattgat gaattctcta gaggtgagct caagaccctt aaaggcttaa 2340
aacctcagcg ttattgtcta ctcttccctc atttttatgc ccacaaatct ggtcaatcct 2400
ttatttgcaa tgcctctcac atctctttct tctgtttcca tttataccgc tgttgccaca 2460
gcccagggtc ccatcacctc acacttgatc tattgtatta cattcctaac tagtcttccc 2520
ccgtttctaa tctgttctcc gataaaagct gcacatcatt ttcaggataa tcatcagtcg 2580
cctgcctaaa acttttcaat gtcttcccat tgtctttaga ataaagttca aagtcttcaa 2640
atgaccccaa gcaagataac ttttgtttgc ccctttagat ccatttaaat gcaggtctag 2700
atacgtagat aagtagcatg gcgggttaat cattaactac aaggaacccc tagtgatgga 2760
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 2820
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gagagggagt 2880
ggccaa 2886
<210> 44
<211> 1846
<212> DNA
<213> 人工序列
<220>
<223> 包含ITR的pHMI-hF8-003-F8校正基因组
<400> 44
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tggcggaaat tggctttggt ctgaggctga ggtgtgggca 240
aagcattagc ttatgtgggt ccattagctt atgtgagtcc acaaaaggtg tgtgtgtgtt 300
tgtgtgtatg tgtgtgtgtg tgtgtgtgtg tgtgtgtgta cgaaatgggg gctcaatgat 360
ttggtagtgg tttggtttgt caagaagcag gctgggaact caataagcat ctttccattc 420
atttctactg tgtatcccac agcttcacac acacatgcac atttcaacat tggtgactgc 480
ttcacttgca cacctaaggt aatgatggac acacctgtag caatgtagat tcttcctaag 540
ctaataatta gtttcaggag gtagcacata catttaaaaa taggttaaaa taaagtgtta 600
ttttaattgg taggtggatc tgttggcacc aatgattatt cacggcatca agacccaggg 660
tgcccgtcag aagttctcca gcctctacat ctctcagttt atcatcatgt atagtcttga 720
tgggaagaag tggcagactt atcgaggaaa ttccactgga accttaatgg tcttctttgg 780
caatgtggat tcatctggga taaaacacaa tatttttaac cctccaatta ttgctcgata 840
catccgtttg cacccaactc attatagcat tcgcagcact cttcgcatgg agttgatggg 900
ctgtgattta aatagttgca gcatgccatt gggaatggag agtaaagcaa tatcagatgc 960
acagattact gcttcatcct actttaccaa tatgtttgcc acctggtctc cttcaaaagc 1020
tcgacttcac ctccaaggga ggagtaatgc ctggagacct caggtgaata atccaaaaga 1080
gtggctgcaa gtggacttcc agaagacaat gaaagtcaca ggagtaacta ctcagggagt 1140
aaaatctctg cttaccagca tgtatgtgaa ggagttcctc atctccagca gtcaagatgg 1200
ccatcagtgg actctctttt ttcagaatgg caaagtaaag gtttttcagg gaaatcaaga 1260
ctccttcaca cctgtggtga actctctaga cccaccgtta ctgactcgct accttcgaat 1320
tcacccccag agttgggtgc accagattgc cctgaggatg gaggttctgg gctgcgaggc 1380
acaggacctc tactgaaagc tttacgtatg taattagtca tttaaaggga atgcctgaat 1440
actttaaaga attttggcag atttcagata ttggacaaac actcttagct tccacaaact 1500
taattccaaa aaataatttt tcacttatga gcaatagagt tattacggac atatcagcaa 1560
aaatgtagta gtgtcaaggc tcatagatga tagaaatgaa gagatgctgt attgatagaa 1620
atatgtgatt caggactgtg tggattaaat gcaggtctag atacgtagat aagtagcatg 1680
gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 1740
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 1800
gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 1846
<210> 45
<211> 2092
<212> DNA
<213> 人工序列
<220>
<223> 包含ITR的pHMI-hF8-004-F8校正基因组
<400> 45
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tggcggaaat tggctttggt ctgaggctga ggtgtgggca 240
aagcattagc ttatgtgggt ccattagctt atgtgagtcc acaaaaggtg tgtgtgtgtt 300
tgtgtgtatg tgtgtgtgtg tgtgtgtgtg tgtgtgtgta cgaaatgggg gctcaatgat 360
ttggtagtgg tttggtttgt caagaagcag gctgggaact caataagcat ctttccattc 420
atttctactg tgtatcccac agcttcacac acacatgcac atttcaacat tggtgactgc 480
ttcacttgca cacctaaggt aatgatggac acacctgtag caatgtagat tcttcctaag 540
ctaataatta gtttcaggag gtagcacata catttaaaaa taggttaaaa taaagtgtta 600
ttttaattgg taggtggatc tgttggcacc aatgattatt cacggcatca agacccaggg 660
tgcccgtcag aagttctcca gcctctacat ctctcagttt atcatcatgt atagtcttga 720
tgggaagaag tggcagactt atcgaggaaa ttccactgga accttaatgg tcttctttgg 780
caatgtggat tcatctggga taaaacacaa tatttttaac cctccaatta ttgctcgata 840
catccgtttg cacccaactc attatagcat tcgcagcact cttcgcatgg agttgatggg 900
ctgtgattta aatagttgca gcatgccatt gggaatggag agtaaagcaa tatcagatgc 960
acagattact gcttcatcct actttaccaa tatgtttgcc acctggtctc cttcaaaagc 1020
tcgacttcac ctccaaggga ggagtaatgc ctggagacct caggtgaata atccaaaaga 1080
gtggctgcaa gtggacttcc agaagacaat gaaagtcaca ggagtaacta ctcagggagt 1140
aaaatctctg cttaccagca tgtatgtgaa ggagttcctc atctccagca gtcaagatgg 1200
ccatcagtgg actctctttt ttcagaatgg caaagtaaag gtttttcagg gaaatcaaga 1260
ctccttcaca cctgtggtga actctctaga cccaccgtta ctgactcgct accttcgaat 1320
tcacccccag agttgggtgc accagattgc cctgaggatg gaggttctgg gctgcgaggc 1380
acaggacctc tactgaaagc tttaccaagg cctctcgagc ctctagaact atagtgagtc 1440
gtattacgta gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag 1500
aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 1560
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 1620
tcagggggag gtgtgggagg ttttttaagc tgtatgtaat tagtcattta aagggaatgc 1680
ctgaatactt taaagaattt tggcagattt cagatattgg acaaacactc ttagcttcca 1740
caaacttaat tccaaaaaat aatttttcac ttatgagcaa tagagttatt acggacatat 1800
cagcaaaaat gtagtagtgt caaggctcat agatgataga aatgaagaga tgctgtattg 1860
atagaaatat gtgattcagg actgtgtgga ttaaatgcag gtctagatac gtagataagt 1920
agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct 1980
ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 2040
ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aa 2092
<210> 46
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 截短的AAV2 5' ITR
<400> 46
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106
<210> 47
<211> 25
<212> DNA
<213> 小家鼠
<400> 47
agtccatcca tgagatggaa acaaa 25
<210> 48
<211> 24
<212> DNA
<213> 小家鼠
<400> 48
acaagccaat tcttgaagta acag 24
<210> 49
<211> 26
<212> DNA
<213> 小家鼠
<400> 49
tcctctatat gatttgaact gtctcc 26
<210> 50
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> SA2A_载体_Set2探针
<400> 50
ttctaacatg cggtgacgtg gagg 24
<210> 51
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> SA2A_载体_Set2引物1
<400> 51
cctagggccg ggattct 17
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> SA2A_载体_Set2引物2
<400> 52
cctcttctct tcctcccaca 20
<210> 53
<211> 20
<212> DNA
<213> 小家鼠
<400> 53
ggaagagctg gcactcagaa 20
<210> 54
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> F8_左A_R
<400> 54
cttaatattc ttggcatcct ccatg 25
<210> 55
<211> 21
<212> DNA
<213> 小家鼠
<400> 55
gctccagaat acacggttgt g 21
<210> 56
<211> 23
<212> DNA
<213> 小家鼠
<400> 56
ccattgactg tgtgcatttt agg 23
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> F8_右A_F
<400> 57
atgaagcttg acggtggttc 20
<210> 58
<211> 22
<212> DNA
<213> 小家鼠
<400> 58
tacgtagata agtagcatgg cg 22
<210> 59
<211> 24
<212> DNA
<213> 小家鼠
<400> 59
atgataccca tttccctaga ttcc 24
<210> 60
<211> 21
<212> DNA
<213> 小家鼠
<400> 60
ggcaccactc ctgaaataca c 21
<210> 61
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 3' ITR
<400> 61
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gcc 143
<210> 62
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 额外37 bp的3' ITR
<400> 62
gtagataagt agcatggcgg gttaatcatt aactaca 37
<210> 63
<211> 180
<212> DNA
<213> 人工序列
<220>
<223> 具有额外37 bp序列的3' ITR
<400> 63
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180

Claims (120)

1.一种用于校正细胞中的F8基因中的突变的方法,所述方法包括用复制缺陷型腺相关病毒(adeno-associated virus;AAV)转导所述细胞,所述腺相关病毒包括:
a)AAV衣壳;和
b)校正基因组,其包括:(i)用于编辑所述F8基因中的靶基因座的编辑元件;(ii)所述编辑元件5'的5'同源臂核苷酸序列,所述核苷酸序列与所述靶基因座5'的第一基因组区域具有同源性;和(iii)所述编辑元件3'的3'同源臂核苷酸序列,所述核苷酸序列与所述靶基因座3'的第二基因组区域具有同源性,
其中转导所述细胞而无需共转导或共施用外源性核酸酶或编码外源性核酸酶的核苷酸序列。
2.根据权利要求1所述的方法,其中所述细胞是肝细胞或内皮细胞。
3.根据权利要求2所述的方法,其中所述内皮细胞是肝窦内皮细胞。
4.根据权利要求2或3所述的方法,其中所述细胞是在哺乳动物受试者中,且以有效转导所述受试者中的所述细胞的量向所述受试者施用所述AAV。
5.一种用于治疗患有与F8基因突变相关联的疾病或病症的受试者的方法,所述方法包括向所述受试者施用有效量的复制缺陷型AAV,所述AAV包括:
a)AAV衣壳;和
b)校正基因组,其包括:(i)用于编辑所述F8基因中的靶基因座的编辑元件;(ii)所述编辑元件5'的5'同源臂核苷酸序列,所述核苷酸序列与所述靶基因座5'的第一基因组区域具有同源性;和(iii)所述编辑元件3'的3'同源臂核苷酸序列,所述核苷酸序列与所述靶基因座3'的第二基因组区域具有同源性,
其中未向所述受试者共施用外源性核酸酶或编码外源性核酸酶的核苷酸序列。
6.根据权利要求5所述的方法,其中所述疾病或病症是血友病A。
7.根据权利要求5或6所述的方法,其中所述受试者是人类受试者。
8.根据权利要求1至7中任一项所述的方法,其中所述编辑元件包括F8编码序列的一部分。
9.根据权利要求8所述的方法,其中所述F8编码序列的所述部分编码SEQ ID NO:25中所阐述的氨基酸序列。
10.根据权利要求9所述的方法,其中所述F8编码序列的所述部分具有SEQ ID NO:26中所阐述的氨基酸序列。
11.根据权利要求9所述的方法,其中所述F8编码序列的所述部分被沉默改变。
12.根据权利要求1至11中任一项所述的方法,其中所述编辑元件5'到3'包括F8编码序列的一部分和聚腺苷酸化序列。
13.根据权利要求12所述的方法,其中所述F8编码序列的所述部分由SEQ ID NO:26中所阐述的序列组成。
14.根据权利要求13所述的方法,其中所述靶基因座是所述F8基因的核苷酸126,476与核苷酸126,477之间的核苷酸间键。
15.根据权利要求13所述的方法,其中所述靶基因座是与所述F8基因的核苷酸126,4763'相邻的核苷酸序列。
16.根据权利要求1至11中任一项所述的方法,其中所述编辑元件5'到3'包括剪接受体位点、F8编码序列的一部分和任选地聚腺苷酸化序列。
17.根据权利要求16所述的方法,其中与所述靶基因座5'相邻的所述核苷酸在所述F8基因的内含子中。
18.根据权利要求16或17所述的方法,其中所述F8编码序列的所述部分由SEQ ID NO:26中所阐述的序列组成。
19.根据权利要求18所述的方法,其中与所述靶基因座5'相邻的所述核苷酸在所述F8基因的内含子22中。
20.根据权利要求12至19中任一项所述的方法,其中所述聚腺苷酸化序列是外源性聚腺苷酸化序列。
21.根据权利要求20所述的方法,其中所述外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。
22.根据权利要求21所述的方法,其中所述SV40聚腺苷酸化序列具有SEQ ID NO:23中所阐述的核苷酸序列。
23.根据前述权利要求中任一项所述的方法,其中所述编辑元件包括SEQ ID NO:33中所阐述的核酸序列。
24.根据前述权利要求中任一项所述的方法,其中所述5'同源臂核苷酸序列与所述第一基因组区域至少90%、95%、96%、97%、98%或99%一致。
25.根据前述权利要求中任一项所述的方法,其中所述3'同源臂核苷酸序列与所述第二基因组区域至少90%、95%、96%、97%、98%或99%一致。
26.根据前述权利要求中任一项所述的方法,其中所述第一基因组区域位于第一编辑窗口中,且所述第二基因组区域位于第二编辑窗口中。
27.根据权利要求26所述的方法,其中所述第一编辑窗口由SEQ ID NO:31、32或34中所阐述的核苷酸序列组成。
28.根据权利要求26或27所述的方法,其中所述第二编辑窗口由SEQ ID NO:31、32或34中所阐述的核苷酸序列组成。
29.根据权利要求26至28中任一项所述的方法,其中所述第一编辑窗口由SEQ ID NO:31中所阐述的核苷酸序列组成,且所述第二编辑窗口由SEQ ID NO:32中所阐述的核苷酸序列组成。
30.根据前述权利要求中任一项所述的方法,其中所述第一基因组区域由SEQ ID NO:31中所阐述的核苷酸序列组成。
31.根据前述权利要求中任一项所述的方法,其中所述第二基因组区域由SEQ ID NO:32中所阐述的核苷酸序列组成。
32.根据前述权利要求中任一项所述的方法,其中所述5'同源臂核苷酸序列和所述3'同源臂核苷酸序列中的每一个独立地具有约100到约4500个核苷酸的长度。
33.根据前述权利要求中任一项所述的方法,其中所述校正基因组包括选自SEQ IDNO:38-41组成的组的核酸序列。
34.根据前述权利要求中任一项所述的方法,其中所述校正基因组进一步包括所述5'同源臂核苷酸序列5'的5'反向末端重复(5'inverted terminal repeat;5'ITR)核苷酸序列和所述3'同源臂核苷酸序列3'的3'反向末端重复(3'inverted terminal repeat;3'ITR)核苷酸序列。
35.根据权利要求34所述的方法,其中所述5'ITR核苷酸序列与SEQ ID NO:18或46具有至少95%序列一致性,且所述3'ITR核苷酸序列与SEQ ID NO:19、61或63具有至少95%序列一致性。
36.根据权利要求34所述的方法,其中所述5'ITR核苷酸序列与SEQ ID NO:20具有至少95%序列一致性,且所述3'ITR核苷酸序列与SEQ ID NO:21具有至少95%序列一致性。
37.根据前述权利要求中任一项所述的方法,其中所述校正基因组包括选自SEQ IDNO:42-45组成的组的核酸序列。
38.根据前述权利要求中任一项所述的方法,其中所述校正基因组由选自SEQ ID NO:42-45组成的组的核酸序列组成。
39.根据前述权利要求中任一项所述的方法,其中当在不存在外源性核酸酶的情况下在标准AAV转导条件条件下将所述AAV与B淋巴母细胞群活体外体接触时,所述编辑元件整合到所述靶基因座中的整合效率为至少2%。
40.根据前述权利要求中任一项所述的方法,其中当在不存在外源性核酸酶的情况下在标准AAV转导条件下将所述AAV与B淋巴母细胞群体活体外接触时,所述编辑元件整合到所述靶基因座中的等位基因频率为至少1%。
41.根据前述权利要求中任一项所述的方法,其中所述AAV衣壳包括AAV进化枝F衣壳蛋白。
42.根据权利要求41所述的方法,其中所述AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
43.根据权利要求42所述的方法,其中:所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
44.根据权利要求42所述的方法,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
45.根据权利要求42所述的方法,其中所述衣壳蛋白包括SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
46.根据权利要求41至45中任一项所述的方法,其中所述AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
47.根据权利要求46所述的方法,其中:所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸160的氨基酸是D;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
48.根据权利要求47所述的方法,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
49.根据权利要求47所述的方法,其中所述衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
50.根据权利要求41至49中任一项所述的方法,其中所述AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
51.根据权利要求50所述的方法,其中:所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸2的氨基酸是T;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸68的氨基酸是V;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;所述衣壳蛋白中对应于SEQ IDNO:2的氨基酸160的氨基酸是D;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
52.根据权利要求50所述的方法,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸2的氨基酸是T,且
所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是Y;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(f)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(g)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(h)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(i)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
53.根据权利要求50所述的方法,其中所述衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
54.一种复制缺陷型腺相关病毒(AAV),其包括:
a)AAV衣壳,其包括AAV进化枝F衣壳蛋白;和
b)校正基因组,其包括:(i)用于编辑所述F8基因中的靶基因座的编辑元件;(ii)所述编辑元件5'的5'同源臂核苷酸序列,所述核苷酸序列与所述靶基因座5'的第一基因组区域具有同源性;和(iii)所述编辑元件3'的3'同源臂核苷酸序列,所述核苷酸序列与所述靶基因座3'的第二基因组区域具有同源性。
55.根据权利要求54所述的AAV,其中所述编辑元件包括F8编码序列的一部分。
56.根据权利要求55所述的AAV,其中所述F8编码序列的所述部分编码SEQ ID NO:25中所阐述的氨基酸序列。
57.根据权利要求56所述的AAV,其中所述F8编码序列的所述部分具有SEQ ID NO:26中所阐述的氨基酸序列。
58.根据权利要求56所述的AAV,其中所述F8编码序列被沉默改变。
59.根据权利要求54至58中任一项所述的AAV,其中所述编辑元件5'到3'包括F8编码序列的一部分和聚腺苷酸化序列。
60.根据权利要求59所述的AAV,其中所述F8编码序列的所述部分由SEQ ID NO:26中所阐述的序列组成。
61.根据权利要求60所述的AAV,其中所述靶基因座是所述F8基因的核苷酸126,476与核苷酸126,477之间的核苷酸间键。
62.根据权利要求60所述的AAV,其中所述靶基因座是与所述F8基因的核苷酸126,4763'相邻的核苷酸序列。
63.根据权利要求54至58中任一项所述的AAV,其中所述编辑元件5'到3'包括剪接受体位点、F8编码序列的一部分和任选地聚腺苷酸化序列。
64.根据权利要求63所述的AAV,其中与所述靶基因座5'相邻的所述核苷酸在所述F8基因的内含子中。
65.根据权利要求63或64所述的AAV,其中所述F8编码序列的所述部分由SEQ ID NO:26中所阐述的序列组成。
66.根据权利要求65所述的AAV,其中与所述靶基因座5'相邻的所述核苷酸在所述F8基因的内含子22中。
67.根据权利要求59至66中任一项所述的AAV,其中所述聚腺苷酸化序列是外源性聚腺苷酸化序列。
68.根据权利要求67所述的AAV,其中所述外源性聚腺苷酸化序列是SV40聚腺苷酸化序列。
69.根据权利要求68所述的AAV,其中所述SV40聚腺苷酸化序列具有SEQ ID NO:23中所阐述的核苷酸序列。
70.根据权利要求54至69中任一项所述的AAV,其中所述编辑元件包括SEQ ID NO:33中所阐述的核酸序列。
71.根据权利要求54至70中任一项所述的AAV,其中所述5'同源臂核苷酸序列与所述第一基因组区域至少90%、95%、96%、97%、98%或99%一致。
72.根据权利要求54至71中任一项所述的AAV,其中所述3'同源臂核苷酸序列与所述第二基因组区域至少90%、95%、96%、97%、98%或99%一致。
73.根据权利要求54至72中任一项所述的AAV,其中所述第一基因组区域位于第一编辑窗口中,且所述第二基因组区域位于第二编辑窗口中。
74.根据权利要求73所述的AAV,其中所述第一编辑窗口由SEQ ID NO:31、32或34中所阐述的核苷酸序列组成。
75.根据权利要求73或74所述的AAV,其中所述第二编辑窗口由SEQ ID NO:31、32或34中所阐述的核苷酸序列组成。
76.根据权利要求73至75中任一项所述的AAV,其中所述第一编辑窗口由SEQ ID NO:31中所阐述的核苷酸序列组成,且所述第二编辑窗口由SEQ ID NO:32中所阐述的核苷酸序列组成。
77.根据权利要求54至76中任一项所述的AAV,其中所述第一基因组区域由SEQ ID NO:31中所阐述的核苷酸序列组成。
78.根据权利要求54至77中任一项所述的AAV,其中所述第二基因组区域由SEQ ID NO:32中所阐述的核苷酸序列组成。
79.根据权利要求54至78中任一项所述的AAV,其中所述5'同源臂核苷酸序列和所述3'同源臂核苷酸序列中的每一个独立地具有约100到约4500个核苷酸的长度。
80.根据权利要求54至79中任一项所述的AAV,其中所述校正基因组包括选自SEQ IDNO:38-41组成的组的核酸序列。
81.根据权利要求54至80中任一项所述的AAV,其中所述校正基因组进一步包括所述5'同源臂核苷酸序列5'的5'反向末端重复(5'ITR)核苷酸序列和所述3'同源臂核苷酸序列3'的3'反向末端重复(3'ITR)核苷酸序列。
82.根据权利要求81所述的AAV,其中所述5'ITR核苷酸序列与SEQ ID NO:18或46具有至少95%序列一致性,且所述3'ITR核苷酸序列与SEQ ID NO:19、61或63具有至少95%序列一致性。
83.根据权利要求81所述的AAV,其中所述5'ITR核苷酸序列与SEQ ID NO:20具有至少95%序列一致性,且所述3'ITR核苷酸序列与SEQ ID NO:21具有至少95%序列一致性。
84.根据权利要求54至83中任一项所述的AAV,其中所述校正基因组包括选自SEQ IDNO:42-45组成的组的核酸序列。
85.根据权利要求54至84中任一项所述的AAV,其中所述校正基因组由选自SEQ ID NO:42-45组成的组的核酸序列组成。
86.根据权利要求54至85中任一项所述的AAV,其中当在不存在外源性核酸酶的情况下在标准AAV转导条件条件下将所述AAV与B淋巴母细胞群体活体外接触时,所述编辑元件整合到所述靶基因座中的整合效率为至少2%。
87.根据权利要求54至86中任一项所述的AAV,其中当在不存在外源性核酸酶的情况下在标准AAV转导条件下将所述AAV与B淋巴母细胞群体活体外接触时,所述编辑元件整合到所述靶基因座中的等位基因频率为至少1%。
88.根据权利要求54至87中任一项所述的AAV,其中所述AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
89.根据权利要求88所述的AAV,其中:所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
90.根据权利要求89所述的AAV,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
91.根据权利要求89所述的AAV,其中所述衣壳蛋白包括SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
92.根据权利要求54至91中任一项所述的AAV,其中所述AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
93.根据权利要求92所述的AAV,其中:所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸160的氨基酸是D;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
94.根据权利要求93所述的AAV,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
95.根据权利要求93所述的AAV,其中所述衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
96.根据权利要求54至95中任一项所述的AAV,其中所述AAV进化枝F衣壳蛋白包括与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少95%序列一致性的氨基酸序列。
97.根据权利要求96所述的AAV,其中:所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸2的氨基酸是T;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸68的氨基酸是V;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸151的氨基酸是R;所述衣壳蛋白中对应于SEQ IDNO:2的氨基酸160的氨基酸是D;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸206的氨基酸是C;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸590的氨基酸是R;所述衣壳蛋白中对应于SEQID NO:2的氨基酸626的氨基酸是G或Y;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C;或所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G。
98.根据权利要求97所述的AAV,其中:
(a)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸2的氨基酸是T,且
所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸312的氨基酸是Q;
(b)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸65的氨基酸是I,且
所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是Y;
(c)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸77的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸690的氨基酸是K;
(d)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸119的氨基酸是L,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸468的氨基酸是S;
(e)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸626的氨基酸是G,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸718的氨基酸是G;
(f)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸296的氨基酸是H,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸464的氨基酸是N,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸681的氨基酸是M;
(g)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸687的氨基酸是R;
(h)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸346的氨基酸是A,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R;或
(i)所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸501的氨基酸是I,所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸505的氨基酸是R,且所述衣壳蛋白中对应于SEQ ID NO:2的氨基酸706的氨基酸是C。
99.根据权利要求97所述的AAV,其中所述衣壳蛋白包括SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
100.一种药物组合物,其包括根据权利要求54至99中任一项所述的AAV。
101.一种用于重组制备AAV的包装系统,其中所述包装系统包括:
a)编码一种或多种AAV Rep蛋白的Rep核苷酸序列;
b)编码如权利要求88至99中任一项中所阐述的一种或多种AAV进化枝F衣壳蛋白的Cap核苷酸序列;和
c)如权利要求54至87中任一项中所阐述的校正基因组,其中所述包装系统在细胞中能够操作以将所述校正基因组封闭在所述衣壳中以形成所述AAV。
102.根据权利要求101所述的包装系统,其中所述包装系统包括含所述Rep核苷酸序列和所述Cap核苷酸序列的第一载体以及含所述校正基因组的第二载体。
103.根据权利要求101或102所述的包装系统,其中所述Rep核苷酸序列编码AAV2 Rep蛋白。
104.根据权利要求103所述的包装系统,其中所述AAV2 Rep蛋白是78/68或Rep 68/52。
105.根据权利要求103或104所述的包装系统,其中所述AAV2 Rep蛋白包括与SEQ IDNO:22的AAV2 Rep氨基酸序列具有最小百分比序列一致性的氨基酸序列,其中所述最小百分比序列一致性在编码所述AAV2 Rep蛋白的氨基酸序列的整个长度上为至少70%。
106.根据权利要求101至105中任一项所述的包装系统,其进一步包括第三载体,其中所述第三载体是辅助病毒载体。
107.根据权利要求106所述的包装系统,其中所述辅助病毒载体是独立的第三载体。
108.根据权利要求106所述的包装系统,其中所述辅助病毒载体与所述第一载体整合在一起。
109.根据权利要求106所述的包装系统,其中所述辅助病毒载体与所述第二载体整合在一起。
110.根据权利要求106至109中任一项所述的包装系统,其中所述第三载体包括编码辅助病毒蛋白质的基因。
111.根据权利要求106至110中任一项所述的包装系统,其中所述辅助病毒选自以下组成的组:腺病毒、疱疹病毒、牛痘病毒和巨细胞病毒(cytomegalovirus;CMV)。
112.根据权利要求111所述的包装系统,其中所述辅助病毒是腺病毒。
113.根据权利要求112所述的包装系统,其中所述腺病毒基因组包括选自E1、E2、E4和VA组成的组的一种或多种腺病毒RNA基因。
114.根据权利要求113所述的包装系统,其中所述辅助病毒是单纯疱疹病毒(herpessimplex virus;HSV)。
115.根据权利要求114所述的包装系统,其中所述HSV基因组包括选自以下组成的组的HSV基因中的一个或多个:UL5/8/52、ICPO、ICP4、ICP22以和UL30/UL42。
116.权利要求101至115中任一项所述的包装系统,其中所述第一载体和所述第三载体含于第一转染质粒内。
117.权利要求101至115中任一项所述的包装系统,其中所述第二载体和所述第三载体的核苷酸含于第二转染质粒内。
118.根据权利要求101至115中任一项所述的包装系统,其中将所述第一载体和所述第三载体的核苷酸克隆到重组辅助病毒中。
119.根据权利要求101至115中任一项所述的包装系统,其中将所述第二载体和所述第三载体的核苷酸克隆到重组辅助病毒中。
120.一种用于重组制备AAV的方法,所述方法包括在能够操作以将校正基因组封闭于衣壳中以形成所述AAV的条件下,将根据权利要求101至119中任一项所述的包装系统引入细胞中。
CN201980025614.6A 2018-02-19 2019-02-19 用于恢复f8基因功能的腺相关病毒组合物和其使用方法 Pending CN112041437A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862632300P 2018-02-19 2018-02-19
US62/632,300 2018-02-19
US201862632919P 2018-02-20 2018-02-20
US62/632,919 2018-02-20
US201862672385P 2018-05-16 2018-05-16
US62/672,385 2018-05-16
PCT/US2019/018502 WO2019161365A1 (en) 2018-02-19 2019-02-19 Adeno-associated virus compositions for restoring f8 gene function and methods of use thereof

Publications (1)

Publication Number Publication Date
CN112041437A true CN112041437A (zh) 2020-12-04

Family

ID=67618799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980025614.6A Pending CN112041437A (zh) 2018-02-19 2019-02-19 用于恢复f8基因功能的腺相关病毒组合物和其使用方法

Country Status (5)

Country Link
US (2) US11306329B2 (zh)
EP (1) EP3755795A4 (zh)
JP (1) JP7244547B2 (zh)
CN (1) CN112041437A (zh)
WO (1) WO2019161365A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022241041A2 (en) * 2021-05-11 2022-11-17 City Of Hope Adeno-associated virus compositions and methods of use thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150306250A1 (en) * 2012-12-07 2015-10-29 Haplomics, Inc. Factor viii mutation repair and tolerance induction

Family Cites Families (149)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5436146A (en) 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
AU7906691A (en) 1990-05-23 1991-12-10 United States of America, as represented by the Secretary, U.S. Department of Commerce, The Adeno-associated virus (aav)-based eucaryotic vectors
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5252479A (en) 1991-11-08 1993-10-12 Research Corporation Technologies, Inc. Safe vector for gene therapy
DE4339922C1 (de) 1993-09-03 1994-10-06 Max Planck Gesellschaft Vektor für Leber-Gentherapie
US6268212B1 (en) 1993-10-18 2001-07-31 Amgen Inc. Tissue specific transgene expression
DE4407859C1 (de) 1994-03-04 1995-03-02 Max Planck Gesellschaft Vektor für die leberspezifische Gentherapie
ATE386131T1 (de) 1994-04-13 2008-03-15 Univ Rockefeller Aav-vermittelte überbringung von dna in zellen des nervensystems
WO1996008560A1 (en) 1994-09-16 1996-03-21 The Uab Research Foundation Transduction of genes into human hematopoietic stem cells using recombinant adeno-associated viral vectors
CN1172435A (zh) 1994-09-23 1998-02-04 综合医院公司 使用非哺乳动物dna病毒在哺乳动物细胞中表达外源基因
US6924128B2 (en) 1994-12-06 2005-08-02 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant AAV vectors
US5650309A (en) 1995-05-16 1997-07-22 The Regents Of The University Of California Viral vectors
US7001764B2 (en) 1995-06-27 2006-02-21 Cell Genesys, Inc. Compositions comprising tissue specific adenoviral vectors
DE19525900C1 (de) 1995-07-15 1996-12-12 Max Planck Gesellschaft Leberspezifischer Adenovirus-Expressionsvektor
US5622856A (en) 1995-08-03 1997-04-22 Avigen High efficiency helper system for AAV vector production
US5780447A (en) 1996-06-14 1998-07-14 St. Jude Children's Research Hospital Recombinant adeno-associated viral vectors
JP2001500376A (ja) 1996-09-06 2001-01-16 カイロン コーポレイション 組換えaavベクターを使用する治療分子の肝臓特異的送達のための方法および組成物
WO1998012311A2 (en) 1996-09-11 1998-03-26 The General Hospital Corporation Use of a non-mammalian dna virus to express an exogenous gene in a mammalian cell
EP0932694A2 (en) 1996-09-11 1999-08-04 THE UNITED STATES GOVERNMENT as represented by THE DEPARTMENT OF HEALTH AND HUMAN SERVICES Aav4 vector and uses thereof
DE19644500C2 (de) 1996-10-25 1998-11-05 Deutsches Krebsforsch AAV-DNA mit Helfervirus-Sequenzen
FR2755699B1 (fr) 1996-11-08 1998-12-18 Rhone Poulenc Rorer Sa Nouvelles constructions et vecteurs pour l'expression ciblee et inductible des genes
FR2756297B1 (fr) 1996-11-22 1999-01-08 Centre Nat Rech Scient Procede de production de virus recombinants
WO1998024479A1 (en) 1996-12-02 1998-06-11 Cell Genesys, Inc. Adeno-associated viral vector-mediated delivery of dna to cells of the liver
AU5603998A (en) 1996-12-18 1998-07-15 Targeted Genetics Corporation Recombinase-activatable AAV packaging cassettes for use in the production of AV vectors
CA2275892A1 (en) 1996-12-23 1998-07-02 Gene-Cell, Inc. Nucleic acid constructs and uses thereof for direct nucleic acid incorporation into cells
US6153436A (en) 1997-01-10 2000-11-28 The Board Of Trustees Of The University Of Arkansas Method of gene delivery using wildtype adeno associated viral (AAV) vectors with insertions
CA2797661C (en) 1997-04-24 2015-06-16 University Of Washington Targeted gene modification by parvoviral vectors
US6156303A (en) 1997-06-11 2000-12-05 University Of Washington Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom
GB9715064D0 (en) 1997-07-17 1997-09-24 Ppl Therapeutics Scotland Ltd Protein expression
WO1999018227A1 (en) 1997-10-08 1999-04-15 Advanced Research And Technology Institute Chimeric parvovirus-based recombinant vector system that specifically targets the erythroid lineage
US6346415B1 (en) 1997-10-21 2002-02-12 Targeted Genetics Corporation Transcriptionally-activated AAV inverted terminal repeats (ITRS) for use with recombinant AAV vectors
US6953690B1 (en) 1998-03-20 2005-10-11 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
US6984517B1 (en) 1998-05-28 2006-01-10 The United States Of America As Represented By The Department Of Health And Human Services AAV5 vector and uses thereof
WO1999064569A1 (en) 1998-06-10 1999-12-16 Advanced Research And Technology Institute Methods and compositions for generating recombinant adeno-associated virus vectors
US6759237B1 (en) 1998-11-05 2004-07-06 The Trustees Of The University Of Pennsylvania Adeno-associated virus serotype 1 nucleic acid sequences, vectors and host cells containing same
US6491907B1 (en) 1998-11-10 2002-12-10 The University Of North Carolina At Chapel Hill Recombinant parvovirus vectors and method of making
US6919209B1 (en) 1998-12-04 2005-07-19 City Of Hope Method of genetically modifying very primitive quiescent human hematopoietic stem cells
JP4693244B2 (ja) 1999-03-18 2011-06-01 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 組換えアデノ随伴ウイルスのヘルパー無しの生産のための組成物および方法
US6610906B1 (en) 1999-06-09 2003-08-26 The Regents Of The University Of Michigan Nucleotide sequences for gene regulation and methods of use thereof
ES2284545T3 (es) 1999-11-16 2007-11-16 Genzyme Corporation Vectores y transgenes con elementos reguladores para la administracion de genes del higado.
CA2406743A1 (en) 2000-04-28 2001-11-08 The Trustees Of The University Of Pennsylvania Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids
AU2001269723B9 (en) 2000-06-01 2006-11-16 University Of North Carolina At Chapel Hill Duplexed parvovirus vectors
US7351813B2 (en) 2000-06-20 2008-04-01 The Board Of Trustees Of The Leland Stanford Junior University Liver-specific gene expression cassettes, and methods of use
US6329181B1 (en) 2000-08-07 2001-12-11 Neurologix, Inc. Helper functions for recombinant vector production
US7749492B2 (en) 2001-01-05 2010-07-06 Nationwide Children's Hospital, Inc. AAV vectors and methods
AU2002306539A1 (en) 2001-02-16 2002-09-04 The Board Of Trustees Of The Leland Stanford Junior University Minimal plasmid vectors that provide for persistent and high level gene expression and methods for using the same
DE10120265A1 (de) 2001-04-25 2002-11-14 Deutsches Krebsforsch AAV-Helferplasmide zur Helfervirus-freien Verpackung und Pseudotypisierung von AAV-Vektoren
DE60233047D1 (de) 2001-05-14 2009-09-03 Gbp Ip Llc Lentivirale vektoren kodierend für gerinnungsfaktoren für die gentherapie
AU2002305778A1 (en) 2001-05-31 2002-12-09 The Rockefeller University Method for generating replication defective viral vectors that are helper free
US8241622B2 (en) 2001-07-13 2012-08-14 University Of Iowa Research Foundation Adeno-associated virus vectors with intravector heterologous terminal palindromic sequences
US20030129203A1 (en) 2001-08-27 2003-07-10 Nautilus Biotech S.A. Mutant recombinant adeno-associated viruses
WO2003029433A2 (en) 2001-10-04 2003-04-10 Aguilar-Cordova Carlos Estuard Chimeric viral vectors for gene therapy
CA2361462A1 (en) 2001-11-07 2003-05-08 Katherine A. High Induction of tolerance to a therapeutic polypeptide
CA2406745C (en) 2001-11-13 2006-01-10 The Trustees Of The University Of Pennsylvania A method of detecting and/or identifying adeno-associated virus (aav) sequences and isolating novel sequences identified thereby
DK1453547T3 (en) 2001-12-17 2016-12-05 Univ Pennsylvania ADENOASSOCATED VIRUS (AAV) SEROTYPE 8 SEQUENCES, VECTORS CONTAINING THESE AND APPLICATIONS THEREOF
AU2002359284A1 (en) 2001-12-17 2003-06-30 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 9 sequences, vectors containing same, and uses therefor
CA2369985A1 (en) 2002-01-18 2003-07-18 Duke University Generation of recombinant adeno-associated viral vectors by a complete adenovirus-mediated approach
CA2426283C (en) 2002-04-29 2006-06-27 The Trustees Of The University Of Pennsylvania Method for direct rescue and amplification of integrated viruses from cellular dna of tissues
US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
WO2004020600A2 (en) 2002-08-28 2004-03-11 University Of Florida Modified aav
US20070202587A1 (en) 2002-09-23 2007-08-30 Applied Genetic Technologies Corporation Recombinant AAV production in mammalian cells
US7091029B2 (en) 2002-09-23 2006-08-15 Applied Genetics Technologies Corporation High titer recombinant AAV production
HUE054046T2 (hu) 2003-06-19 2021-08-30 Genzyme Corp Csökkentett immunreaktivitású AAV virionok és alkalmazásaik
US9441244B2 (en) 2003-06-30 2016-09-13 The Regents Of The University Of California Mutant adeno-associated virus virions and methods of use thereof
AU2004278684B2 (en) 2003-09-30 2011-05-12 The Trustees Of The University Of Pennsylvania Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses therefor
US7482156B2 (en) 2003-10-15 2009-01-27 Cell Genesys, Inc. Hepatocellular carcinoma specific promoter and uses thereof
US8926958B2 (en) 2004-04-06 2015-01-06 Cedars-Sinai Medical Center Prevention and treatment of vascular disease with recombinant adeno-associated virus vectors encoding apolipoprotein A-I and apolipoprotein A-I milano
WO2006065273A2 (en) 2004-05-24 2006-06-22 The Regents Of The University Of California New human parvovirus
ATE549037T1 (de) 2004-09-22 2012-03-15 St Jude Childrens Res Hospital Verbesserte expression von faktor-ix in gentherapie-vektoren
TWI293307B (en) 2004-09-30 2008-02-11 Ind Tech Res Inst A liver-specific chimeric regulatory sequence and use thereof
CN101180397A (zh) 2005-03-09 2008-05-14 得克萨斯大学体系董事会 用于癌症治疗基因的肿瘤选择性和高效率表达的新型hTMC启动子和载体
CN112029737A (zh) 2005-04-07 2020-12-04 宾夕法尼亚大学托管会 增强腺相关病毒载体功能的方法
WO2006119432A2 (en) 2005-04-29 2006-11-09 The Government Of The U.S.A., As Rep. By The Sec., Dept. Of Health & Human Services Isolation, cloning and characterization of new adeno-associated virus (aav) serotypes
US20100010068A1 (en) 2005-08-19 2010-01-14 Binhai Ren Liver-directed gene therapy
CA2622233C (en) 2005-10-20 2015-01-20 Amsterdam Molecular Therapeutics (Amt) B.V. Improved aav vectors produced in insect cells
WO2007084773A2 (en) 2006-01-20 2007-07-26 University Of North Carolina At Chapel Hill Enhanced production of infectious parvovirus vectors in insect cells
WO2008016391A2 (en) 2006-01-31 2008-02-07 The Board Of Trustees Of The Leland Stanford Junior University Self-complementary parvoviral vectors, and methods for making and using the same
WO2007120542A2 (en) 2006-03-30 2007-10-25 The Board Of Trustees Of The Leland Stanford Junior University Aav capsid library and aav capsid proteins
WO2007127428A2 (en) 2006-04-28 2007-11-08 University Of Florida Research Foundation, Inc. Double-stranded/self-complementary vectors with a truncated cba promoter and methods of gene delivery
US9725485B2 (en) 2012-05-15 2017-08-08 University Of Florida Research Foundation, Inc. AAV vectors with high transduction efficiency and uses thereof for gene therapy
DK2191001T3 (en) 2007-04-09 2016-09-19 Univ Florida RAAV VECTOR COMPOSITIONS WITH TYROSIN MODIFIED CAPSIDE PROTEINS AND PROCEDURES FOR USE THEREOF
EP1985631A1 (en) * 2007-04-20 2008-10-29 LFB Biotechnologies Demannosylated recombinant factor VIII for the treatment of patients with hemophiila A
US10696983B2 (en) 2007-05-30 2020-06-30 The Trustees Of The University Of Pennsylvania Method for transducing cells with primary cilia
EP2058401A1 (en) 2007-10-05 2009-05-13 Genethon Widespread gene delivery to motor neurons using peripheral injection of AAV vectors
US20090215879A1 (en) 2008-02-26 2009-08-27 University Of North Carolina At Chapel Hill Methods and compositions for adeno-associated virus (aav) with hi loop mutations
EP4154903A1 (en) 2008-04-22 2023-03-29 Vib Vzw Liver-specific nucleic acid regulatory elements and methods and use thereof
US8632764B2 (en) 2008-04-30 2014-01-21 University Of North Carolina At Chapel Hill Directed evolution and in vivo panning of virus vectors
WO2009134681A2 (en) 2008-04-30 2009-11-05 The Trustees Of The University Of Pennsylvania Aav7 viral vectors for targeted delivery of rpe cells
ES2538468T3 (es) 2008-05-20 2015-06-22 Eos Neuroscience, Inc. Vectores para la administración de proteínas sensibles a la luz y métodos para su utilización
US9217155B2 (en) 2008-05-28 2015-12-22 University Of Massachusetts Isolation of novel AAV'S and uses thereof
EP2425000B1 (en) 2009-04-30 2019-02-20 The Trustees Of The University Of Pennsylvania Compositions for targeting conducting airway cells comprising adeno-associated virus constructs
EP2435575A2 (en) 2009-05-28 2012-04-04 Deutsches Krebsforschungszentrum Modified aav capsid polypeptides
CA3077531C (en) 2009-06-16 2022-09-20 Genzyme Corporation Improved methods for purification of recombinant aav vectors
GB0911870D0 (en) 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
EP2287323A1 (en) 2009-07-31 2011-02-23 Association Institut de Myologie Widespread gene delivery to the retina using systemic administration of AAV vectors
WO2011038187A1 (en) 2009-09-25 2011-03-31 The Trustees Of The University Of Pennsylvania Controlled adeno-associated virus (aav) diversification and libraries prepared therefrom
US20120244127A1 (en) 2009-10-01 2012-09-27 The Trustees Of The University Of Pennsylvania AAV Vectors Expressing SEC10 for Treating Kidney Damage
WO2011088081A1 (en) 2010-01-12 2011-07-21 The University Of North Carolina At Chapel Hill Restrictive inverted terminal repeats for viral vectors
BR112012018899A2 (pt) 2010-01-28 2015-09-15 Philadelphia Children Hospital "método para purificar partículas de vetor de vírus adeno-associado."
WO2011117258A2 (en) 2010-03-22 2011-09-29 Association Institut De Myologie Methods of increasing efficiency of vector penetration of target tissue
CN102869779A (zh) 2010-03-29 2013-01-09 宾夕法尼亚大学托管会 药理学诱导的转基因消融系统
US8628966B2 (en) 2010-04-30 2014-01-14 City Of Hope CD34-derived recombinant adeno-associated vectors for stem cell transduction and systemic therapeutic gene transfer
US9839696B2 (en) * 2010-04-30 2017-12-12 City Of Hope Recombinant adeno-associated vectors for targeted treatment
EP2394667A1 (en) 2010-06-10 2011-12-14 Laboratorios Del Dr. Esteve, S.A. Vectors and sequences for the treatment of diseases
US20120014932A1 (en) 2010-07-14 2012-01-19 Golden William J Methods for treating disorders of amino acid metabolism
WO2012109570A1 (en) 2011-02-10 2012-08-16 The University Of North Carolina At Chapel Hill Viral vectors with modified transduction profiles and methods of making and using the same
ES2685611T3 (es) 2011-02-14 2018-10-10 The Children's Hospital Of Philadelphia Vector VAA8 mejorado con una actividad funcional aumentada y métodos de utilización del mismo
WO2012112832A1 (en) 2011-02-17 2012-08-23 The Trustees Of The University Of Pennsylvania Compositions and methods for altering tissue specificity and improving aav9-mediated gene transfer
GB201103062D0 (en) 2011-02-22 2011-04-06 Isis Innovation Method
EP2681327B1 (en) 2011-03-04 2018-11-21 Intrexon Corporation Vectors conditionally expressing protein
SG10201800873WA (en) 2011-04-22 2018-03-28 Univ California Adeno-associated virus virions with variant capsid and methods of use thereof
WO2013029030A1 (en) 2011-08-24 2013-02-28 The Board Of Trustees Of The Leland Stanford Junior University New aav capsid proteins for nucleic acid transfer
CA3099582A1 (en) 2011-10-27 2013-05-02 Sangamo Biosciences, Inc. Methods and compositions for modification of the hprt locus
CA2856137A1 (en) 2011-11-22 2013-05-30 The Children's Hospital Of Philadelphia Virus vectors for highly efficient transgene delivery
WO2013096955A1 (en) 2011-12-23 2013-06-27 Case Western Reserve University Targeted gene modification using hybrid recombinant adeno-associated virus
AU2013221212B2 (en) 2012-02-17 2018-08-09 The Children's Hospital Of Philadelphia AAV vector compositions and methods for gene transfer to cells, organs and tissues
BR112014025985A2 (pt) 2012-04-18 2017-07-11 Childrens Hospital Philadelphia composição e métodos para transferência de gene altamente eficaz com o uso de variantes de capsídeo de aav
CA2878401C (en) 2012-07-06 2022-07-19 University Of Iowa Research Foundation Modified adeno-associated virus vector compositions
CN104797593B (zh) 2012-09-28 2020-05-08 北卡罗来纳-查佩尔山大学 靶向少突胶质细胞的aav载体
CA2888931C (en) 2012-10-26 2023-09-05 Vrije Universiteit Brussel Vector for liver-directed gene therapy of hemophilia and methods and use thereof
JP2016500254A (ja) 2012-12-05 2016-01-12 サンガモ バイオサイエンシーズ, インコーポレイテッド 代謝疾患の調節のための方法および組成物
EP2940131B1 (en) 2012-12-25 2019-02-20 Takara Bio Inc. Aav variant
US20150352228A1 (en) 2013-01-11 2015-12-10 Bruce TORBET Methods and compositions for enhancing transduction efficiency of retroviral vectors
DK2954051T3 (da) 2013-02-08 2019-07-08 Univ Pennsylvania Modificeret kapsid til genoverførsel til behandling af nethinden
AU2014244167A1 (en) 2013-03-13 2015-10-08 The Children's Hospital Of Philadelphia Adeno-associated virus vectors and methods of use thereof
US20140271550A1 (en) 2013-03-14 2014-09-18 The Trustees Of The University Of Pennsylvania Constructs and Methods for Delivering Molecules via Viral Vectors with Blunted Innate Immune Responses
PT2984166T (pt) 2013-03-15 2020-07-16 Univ Pennsylvania Composições para tratar mps i
KR102527259B1 (ko) 2013-03-15 2023-04-27 더 칠드런스 호스피탈 오브 필라델피아 스터퍼/필러 폴리누클레오티드 서열을 포함하는 벡터 및 사용 방법
KR102298579B1 (ko) 2013-05-21 2021-09-07 유니버시티 오브 플로리다 리서치 파운데이션, 인코포레이티드 캡시드-변형된 raav3 벡터 조성물, 및 인간 간암의 유전자 요법에서의 용도
JP6600624B2 (ja) 2013-05-31 2019-10-30 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア アデノ随伴ウイルス変異体及びその使用方法
JP2016525347A (ja) 2013-07-12 2016-08-25 ザ・チルドレンズ・ホスピタル・オブ・フィラデルフィアThe Children’S Hospital Of Philadelphia Aavベクター、及び抗aav(アデノ関連ウイルス)中和抗体についてのアッセイ
DK3024498T3 (da) 2013-07-22 2020-03-02 Childrens Hospital Philadelphia Aav-variant og sammensætninger, fremgangsmåder og anvendelser til genoverførsel til celler, organer og væv
EP3564379A1 (en) 2013-09-13 2019-11-06 California Institute of Technology Selective recovery
CN110713995B (zh) 2013-10-17 2023-08-01 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
KR20220100728A (ko) 2014-03-21 2022-07-15 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 뉴클레아제 없는 게놈 편집
US10780182B2 (en) 2014-04-25 2020-09-22 The Trustees Of The University Of Pennsylvania Methods and compositions for treating metastatic breast cancer and other cancers in the brain
EP3198018B1 (en) * 2014-09-24 2020-12-09 City of Hope Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
CA2967468A1 (en) 2014-12-16 2016-06-23 Board Of Regents Of The University Of Nebraska Gene therapy for juvenile batten disease
JP6865167B2 (ja) 2014-12-17 2021-04-28 フンダシオン パラ ラ インベスティガシオン メディカ アプリカダ ウィルソン病の処置に使用するための核酸構築物及び遺伝子治療ベクター
WO2016097218A1 (en) 2014-12-17 2016-06-23 Fundación Para La Investigación Mèdica Aplicada Nucleic acid constructs and gene therapy vectors for use in the treatment of wilson's disease and other conditions
KR20230110654A (ko) 2015-02-06 2023-07-24 더 유니버시티 오브 노쓰 캐롤라이나 엣 채플 힐 최적화된 인간 응고 인자 viii 유전자 발현 카세트및 그의 용도
CN104659074B (zh) 2015-03-17 2019-04-09 京东方科技集团股份有限公司 一种oled基板、其制造方法、面板及显示装置
JP6879486B2 (ja) 2015-03-17 2021-06-02 フリーイェ・ユニヴェルシテイト・ブリュッセルVrije Universieit Brussel Fviiiおよびfix用の最適化された肝臓特異的発現系
US10058624B2 (en) 2015-04-16 2018-08-28 Emory University Recombinant promoters and vectors for protein expression in liver and use thereof
BR112018008519A2 (pt) 2015-10-28 2018-11-06 Sangamo Therapeutics Inc construtos específicos de fígado, cassetes de expressão de fator viii e métodos de uso dos mesmos
US11389546B2 (en) 2015-12-09 2022-07-19 Modernatx, Inc. Heterologous UTR sequences for enhanced mRNA expression
KR20230160411A (ko) 2016-12-30 2023-11-23 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 윌슨병을 치료하기 위한 유전자 치료
US11938197B2 (en) 2017-01-10 2024-03-26 The Sydney Children's Hospitals Network (Randwick And Westmead (Incorporating The Royal Alexandra Hospital For Children) Polynucleotides and vectors for the expression of transgenes
WO2019010091A1 (en) 2017-07-06 2019-01-10 The Board Of Trustees Of The Leland Stanford Junior University METHODS AND COMPOSITIONS FOR FACILITATING HOMOLOGOUS RECOMBINATION

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150306250A1 (en) * 2012-12-07 2015-10-29 Haplomics, Inc. Factor viii mutation repair and tolerance induction

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
THIERRY VANDENDRIESSCHE: "Hitting the Target Without Pulling the Trigger", 《MOLECULAR THERAPY》, vol. 23, no. 1, 1 January 2015 (2015-01-01), pages 4 - 6, XP055632050, DOI: 10.1038/mt.2014.230 *

Also Published As

Publication number Publication date
US20220333138A1 (en) 2022-10-20
US11306329B2 (en) 2022-04-19
US11891619B2 (en) 2024-02-06
US20190276856A1 (en) 2019-09-12
WO2019161365A1 (en) 2019-08-22
JP2021513871A (ja) 2021-06-03
EP3755795A1 (en) 2020-12-30
EP3755795A4 (en) 2022-07-20
JP7244547B2 (ja) 2023-03-22

Similar Documents

Publication Publication Date Title
JP2024020346A (ja) 筋疾患の治療のための改変aavカプシドポリペプチド
AU2018352855B2 (en) Adeno-associated virus compositions for restoring HBB gene function and methods of use thereof
CN113302201A (zh) 重组病毒载体和用于产生所述重组病毒载体的核酸
BR112021000509A2 (pt) Vetores de terapia genética para tratamento da doença de danon
JP2019205473A (ja) 血管性浮腫の治療としてのc1eiのアデノ随伴ウイルス介在性送達
US20220325302A1 (en) Adeno-associated virus compositions for restoring pah gene function and methods of use thereof
CN113508130A (zh) 用于治疗达农病的基因治疗载体
CN111718420B (zh) 一种用于基因治疗的融合蛋白及其应用
CN112449605A (zh) 反式剪接分子
US11891619B2 (en) Adeno-associated virus compositions for restoring F8 gene function and methods of use thereof
TW202129002A (zh) 用於myh7關聯之心肌病之基因療法組合物及治療
RU2808459C2 (ru) Геннотерапевтические векторы для лечения болезни данона
WO2020187272A1 (zh) 一种用于基因治疗的融合蛋白及其应用
WO2024094009A1 (zh) 用于目的基因的表达盒及其应用
WO2022238557A1 (en) Recombinant tert-encoding viral genomes and vectors
JPWO2019152843A5 (zh)
WO2022241041A2 (en) Adeno-associated virus compositions and methods of use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination