CN114989267A - 经修饰的病毒颗粒和其用途 - Google Patents

经修饰的病毒颗粒和其用途 Download PDF

Info

Publication number
CN114989267A
CN114989267A CN202210622571.3A CN202210622571A CN114989267A CN 114989267 A CN114989267 A CN 114989267A CN 202210622571 A CN202210622571 A CN 202210622571A CN 114989267 A CN114989267 A CN 114989267A
Authority
CN
China
Prior art keywords
aav
protein
capsid
capsid protein
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210622571.3A
Other languages
English (en)
Inventor
L·萨宾
C·基拉索斯
S·莫勒-谭克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN114989267A publication Critical patent/CN114989267A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14123Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14145Special targeting system for viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Virology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Toxicology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本文提供了用于使腺相关病毒(AAV)颗粒适应化的组合物和方法,所述AAV颗粒包括非灵长类动物AAV、远程AAV或其组合的衣壳。相应地适应的AAV可以是一种用于治疗有需要的患者的可行基因疗法平台,并且可能对由于针对当前治疗性AAV颗粒的抗体滴度高而被排除在涉及当前治疗性AAV颗粒的当前治疗模式之外的患者特别有用。

Description

经修饰的病毒颗粒和其用途
本申请是申请号为202080038612.3、申请日为2020年5月22日、发明名称为“经修饰的病毒颗粒和其用途”的中国发明专利申请的分案申请,原申请为国际申请号为PCT/US2020/034328的国家阶段申请,该国际申请要求申请日为2019年5月24日,申请号为62/852,791的美国申请的优先权。
对经由EFS WEB以文本文件形式提交的序列表的参考
写入文件10364WO01_ST25.txt中的序列表为269千字节,创建于2020年5月19日,并且特此通过引用并入。
技术领域
本文的公开涉及制备和使用包括非灵长类动物AAV和/或远程AAV的衣壳蛋白的重组AAV颗粒的方法。
背景技术
将基因递送至特定靶细胞中已成为用于潜在治疗多种慢性和遗传疾病的现代医学中最重要的技术之一。迄今为止,基因疗法的临床应用的进展受到缺乏理想基因递送媒剂的限制。
理想情况下,基因递送媒剂能够(1)稳定地将遗传物质引入到期望的细胞中,(2)避免将遗传物质引入到非靶细胞,以及(3)逃避被患者的免疫系统例如,患者的抗体中和。尽管目前有若干种非致病媒剂可用,但这些媒剂转导特定细胞并对宿主免疫应答保持不可见的能力仍然不够理想。
例如,基于从灵长类动物,特别地从人分离的腺相关病毒(AAV)的病毒颗粒,例如,AAV血清型AAV2、AAV4、AAV6、AAV7、AAV8和AAV9,一直是许多研究的焦点,因为AAV能够在体内转导广泛的灵长类动物物种和组织,而没有证据证明具有毒性或致病性。(Muzyczka等人(1992)《微生物学和免疫学的当前主题(Current Topics in Microbiology andImmunology)》,158:97-129)。此外,AAV安全地转导有丝分裂后组织。尽管病毒可能偶尔整合到宿主染色体中,但其很少会整合并且整合到人19号染色体中的安全港基因座中,而且只有当反式供应复制(Rep)蛋白时才会如此。AAV基因组在感染的细胞中快速循环和串联,且在感染的细胞中以稳定的游离型状态存在,以长期稳定地表达其有效负载。
另外,近年来已经实现了操纵灵长类动物AAV感染并将其重定向到特定细胞。使用病毒颗粒的靶向基因疗法的许多进展可以总结为病毒颗粒的非重组(非遗传)或重组(遗传)修饰,其导致病毒颗粒的自然趋向性的假型化、扩增和/或重新靶向。(综述于Nicklin和Baker(2002)《当前基因疗法(Curr.Gene Ther.)》2:273-93;Verheiji和Rottier(2012)《病毒学发展(Advances Virol)》2012:1-15中)。
在直接重组靶向方法中,靶向配体直接插入到病毒衣壳中或偶联到所述病毒衣壳,即,蛋白病毒衣壳基因被修饰以表达包括异源靶向配体的衣壳蛋白。靶向配体例如结合而不是重定向优先地或排他性地在靶细胞上表达的受体或标志物。(Stachler等人,(2006)《基因疗法(Gene Ther.)》.13:926–931;White等人,(2004)《循环(Circulation)》109:513–519;还参见Park等人,(2007)《生物科学前沿(Frontiers in Bioscience)》13:2653–59;Girod等人,(1999)《自然医学(Nature Medicine)》5:1052–56;Grifman等人,(2001)《分子疗法(Molecular Therapy)》3:964–75;Shi等人,(2001)《人类基因疗法(Human GeneTherapy)》12:1697–1711;Shi和Bartlett,(2003)《分子疗法》7:515–525)。
在间接重组方法中,将病毒衣壳用异源“支架”修饰,然后连接到包含靶向配体的衔接子。衔接子与支架和靶细胞结合。(Arnold等人,(2006)《分子疗法》5:125-132;Ponnazhagenv等人,(2002)《病毒学杂志(J.Virol)》.76:12900-907;还参见WO 97/05266)支架,如(1)Fc结合分子(例如,Fc受体、蛋白质A等),所述Fc结合分子与抗体衔接子的Fc结合,(2)(链球菌)亲和素,所述(链球菌)亲和素与生物素化的衔接子结合,(3)生物素,所述生物素和与(链球菌)亲和素融合的衔接子结合,(4)可检测标记,所述可检测标记可用于检测和/或分离病毒颗粒,通过能够非共价结合可检测标记和靶分子的双特异性衔接子结合,以及最近地(5)蛋白质:蛋白质结合对,所述蛋白质:蛋白质结合对形成已被描述用于各种病毒颗粒的异肽键。(参见例如,Gigout等人,(2005)《分子疗法》11:856–865;Stachler等人,(2008)《分子疗法》16:1467–1473;Quetglas等人,(2010)《病毒研究(Virus Research)》153:179–196;Ohno等人,(1997)《自然生物科技(Nature Biotechnology》15:763–767;Klimstra等人,(2005)《病毒学(Virology)》338:9–21)。
尽管取得了提供指导AAV感染能力的进展,但由于存在针对AAV衣壳(NAb)的中和抗体,重新靶向AAV作为基因递送媒剂仍然不够理想。儿童中AAV NAb的存在表明AAV感染发生在生命早期(Calcedo等人,(2011)美国基因与细胞治疗学会年会(ASGCT);Huser等人,(2017)《病毒学杂志》91:e02137-16)。已经表明,在生命早期通过AAV感染产生的抗体可能损害后续使用源自AAV的被那些预先存在的抗体识别且中和的AAV基因疗法载体。(Hurlbut等人,(2010)《分子疗法》18:1983-94;Jiang等人,(2006)《血液(Blood)》108:3321-8;Manno等人,(2006)《自然医学》12:342-7;Scallan等人,(2006)《血液》107:1810-7;Wang等人,(2010)《分子疗法》18:126-34)。此外,针对AAV血清型的中和抗体滴度的存在具有临床显著性,因为具有高滴度的患者被认为不适合涉及所述血清型的任何治疗。(Jeune等人,(2013)《人类基因疗法方法(Hum Gene Ther Methods)》24:59-67)。
因此,仍然需要非致病的病毒系统,所述病毒系统适于将所关注核酸靶向转移到各种靶细胞,并克服需要治疗的患者中预先存在的抗体造成的障碍。
发明内容
本文描述了可以同时缓解与先前和当前腺相关病毒(AAV)颗粒治疗方法相关的若干问题的策略。在不希望受理论束缚的情况下,预期大多数人将缺乏针对AAV的预先存在的NAb,而所述AAV先前所暴露于人较少。然而,此类AAV血清型被成功地操纵以用作能够靶向和感染特定细胞和/或逃避与人群中任何预先存在的抗体交叉反应的基因疗法载体的能力迄今为止仍然是未知的。
本文示出,非灵长类动物物种的AAV衣壳蛋白可以被修饰以允许将所关注核苷酸靶向引入到不同动物物种的哺乳动物细胞中。此外,本文示出的证据表明,与基于良好表征的人AAV血清型的当前AAV治疗模式相比,经如此修饰的非灵长类动物AAV颗粒被存在于人群体中的预先存在的抗体识别和/或检测的可能性较低。因此,本文描述了重组AAV病毒颗粒,所述重组AAV病毒颗粒能够感染所选择的细胞并且能够更好地通过预先存在的抗体来逃避中和。
本文描述了重组AAV病毒颗粒,所述重组AAV病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAV VP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分、或远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:
a)所述AAV VP1衣壳蛋白、
b)所述AAV VP1衣壳蛋白的任何部分、
c)所述AAV VP2衣壳蛋白、
d)所述AAV VP2衣壳蛋白的任何部分、
e)所述AAV VP3衣壳蛋白和
f)所述AAV VP3衣壳蛋白的任何部分,
其中
I.所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,和/或
II.所述ITR序列或其一部分包括与第二AAV或其一部分的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV或所述远程AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
在一些实施例中,一种重组AAV病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或远程AAV的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:
a)所述AAV VP1衣壳蛋白、
b)所述AAV VP2衣壳蛋白和
c)所述AAV VP3衣壳蛋白,
其中
I.所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,和/或
II.所述ITR序列或其一部分包括与第二AAV或其一部分的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV或所述远程AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
在一些实施例中,一种重组AAV病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分、或远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:
a.所述AAV VP1衣壳蛋白的任何部分、
b.所述AAV VP2衣壳蛋白的任何部分以及
c.所述AAV VP3衣壳蛋白的任何部分,
其中
I.所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,和/或
II.所述ITR序列或其一部分包括与第二AAV或其一部分的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV或所述远程AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
在一些重组AAV病毒颗粒实施例中,所述重组病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAV VP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,其中以下中的至少一种包括与非灵长类动物AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,并且其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,
其中整个ITR序列或所述ITR序列的一部分包括与所述非灵长类动物AAV的ITR具有显著序列同一性,例如至少95%同一性的核酸序列,任选地其中所述ITR序列包括嵌合核酸序列,并且其中所述嵌合核酸序列的与所述非灵长类动物AAV或其一部分的ITR具有显著序列同一性,例如至少95%同一性的一部分可操作地连接到所述嵌合核酸序列的与第二AAV或其一部分的ITR具有显著序列同一性,例如至少95%同一性的一部分,其中所述第二AAV与所述非灵长类动物AAV不同,并且其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
在一些实施例中,一种重组AAV病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,其中以下中的至少一种包括与非灵长类动物AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAVVP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,
其中所述ITR序列或其一部分包括与第二AAV或其一部分的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV不同,
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主,并且
任选地其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;以及
(d)(a)-(c)的任何组合。
在一些实施例中,一种重组AAV病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,其中所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分中的至少一个包括嵌合氨基酸序列,所述嵌合氨基酸序列包括可操作地连接的以下:(A)与非灵长类动物AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;(B)与第二AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,其中所述第二AAV与所述非灵长类动物AAV不同,其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主,并且任选地其中包括嵌合氨基酸序列的所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳的任何部分中的至少一个进一步包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;以及
(c)(a)和(b)的组合。
在一些重组AAV病毒颗粒实施例中,所述重组病毒颗粒包括(i)AAV衣壳,所述AAV衣壳包括AAV VP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,其中以下中的至少一种包括与远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,并且其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,
其中整个ITR序列或所述ITR序列的一部分包括与所述远程AAV的ITR具有显著序列同一性,例如至少95%同一性的核酸序列,任选地其中所述ITR序列包括嵌合核酸序列,并且其中所述嵌合核酸序列的与所述远程AAV或其一部分的ITR具有显著序列同一性,例如至少95%同一性的一部分可操作地连接到所述嵌合核酸序列的与第二AAV或其一部分的ITR具有显著序列同一性,例如至少95%同一性的一部分,其中所述第二AAV与所述远程AAV不同,并且其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
在一些实施例中,一种重组AAV病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,其中以下中的至少一种包括与远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAVVP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,
其中所述ITR序列或其一部分包括与第二AAV或其一部分的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述远程AAV不同,
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主,并且
任选地其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;以及
(d)(a)-(c)的任何组合。
在一些实施例中,一种重组AAV病毒颗粒包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,其中所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分中的至少一个包括嵌合氨基酸序列,所述嵌合氨基酸序列包括可操作地连接的以下:(A)与远程AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;(B)与第二AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,其中所述第二AAV与所述远程AAV不同,其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主,并且任选地其中包括嵌合氨基酸序列的所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳的任何部分中的至少一个进一步包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;以及
(c)(a)和(b)的组合。
在本发明的一些实施例中,一种AAV病毒颗粒包括AAV衣壳,其中所述AAV衣壳的至少一种AAV衣壳蛋白(例如,AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白)包括选自由非灵长类动物AAV的衣壳蛋白、远程AAV的衣壳蛋白及其组合组成的组的衣壳蛋白的氨基酸序列的至少一部分,并且其中所述AAV衣壳的所述至少一种AAV衣壳蛋白被修饰以包括:(a)至少一个蛋白质:蛋白质结合对的第一成员;(b)可检测标记;(c)点突变;(d)嵌合氨基酸序列,所述嵌合氨基酸序列包括其它例如第二AAV衣壳蛋白的可操作地连接到选自由所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合组成的组的所述衣壳蛋白的所述氨基酸序列的氨基酸序列的一部分;以及(e)(a)、(b)、(c)和(d)的任何组合。在本发明的一些实施例中,一种AAV病毒颗粒包括AAV衣壳,其中所述AAV衣壳或其一部分的至少一种AAV衣壳蛋白(例如,AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAVVP3衣壳蛋白)与选自由以下组成的组的衣壳蛋白具有显著序列同一性,例如至少95%同一性:非灵长类动物AAV的衣壳蛋白、非灵长类动物的衣壳蛋白的一部分、远程AAV的衣壳蛋白、远程AAV的衣壳蛋白的一部分以及其组合,并且其中所述AAV衣壳的所述至少一种AAV衣壳蛋白被修饰以包括:(a)至少一个蛋白质:蛋白质结合对的第一成员;(b)可检测标记;(c)点突变;(d)嵌合氨基酸序列,所述嵌合氨基酸序列包括其它例如第二AAV衣壳蛋白的可操作地连接到选自由所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合组成的组的所述衣壳蛋白的所述氨基酸序列的氨基酸序列的一部分;以及(e)(a)、(b)、(c)和(d)的任何组合。在本发明的一些实施例中,一种AAV病毒颗粒包括AAV衣壳,其中所述AAV衣壳的至少一种AAV衣壳蛋白(例如,AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAVVP3衣壳蛋白)包括非灵长类动物AAV的衣壳蛋白的氨基酸序列的至少一部分(例如,其中至少一种AAV衣壳蛋白包括与非灵长类动物AAV的衣壳蛋白具有显著序列同一性例如至少95%序列同一性的氨基酸序列),其中所述AAV衣壳的至少一种AAV衣壳蛋白被修饰以包括:(a)至少一个蛋白质:蛋白质结合对的第一成员;(b)可检测标记;(c)点突变;(d)嵌合氨基酸序列,所述嵌合氨基酸序列包括其它例如第二AAV衣壳蛋白的可操作地连接到所述非灵长类动物AAV的所述衣壳的所述氨基酸序列的氨基酸序列的一部分;以及(e)(a)、(b)、(c)和(d)的任何组合。
在本发明的一些实施例中,一种AAV病毒颗粒包括AAV衣壳,其中所述AAV衣壳的至少一种AAV衣壳蛋白(例如,AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白)包括远程AAV的衣壳蛋白的氨基酸序列的至少一部分(例如,其中至少一种AAV衣壳蛋白包括与远程AAV的衣壳蛋白具有显著序列同一性例如至少95%序列同一性的氨基酸序列),其中所述AAV衣壳的至少一种AAV衣壳蛋白被修饰以包括:(a)至少一个蛋白质:蛋白质结合对的第一成员;(b)可检测标记;(c)点突变;(d)嵌合氨基酸序列,所述嵌合氨基酸序列包括其它例如第二AAV衣壳蛋白的可操作地连接到所述远程AAV的所述衣壳蛋白的所述氨基酸序列的氨基酸序列的一部分;以及(e)(a)、(b)、(c)和(d)的任何组合。
在本发明的一些实施例中,一种AAV病毒颗粒包括:(A)至少一种AAV衣壳蛋白,例如,AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白,所述至少一种AAV衣壳蛋白包括与选自由以下组成的组的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列:(i)非灵长类动物AAV的衣壳蛋白的氨基酸序列,(ii)远程灵长类动物AAV的衣壳蛋白的氨基酸序列,以及(iii)其组合的氨基酸序列;以及(B)AAV基因组,所述AAV基因组包括所关注核苷酸和AAV ITR,所述AAV ITR包括其它例如第二AAV的ITR序列的至少一部分,其中所述其它AAV与所述非灵长类动物AAV不相同,并且也与所述远程灵长类动物AAV不相同。
在本发明的一些实施例中,一种AAV病毒颗粒包括:(A)至少一种AAV衣壳蛋白(例如,AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白),所述至少一种AAV衣壳蛋白包括与非灵长类动物AAV的衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列;以及(B)AAV基因组,所述AAV基因组包括所关注核苷酸和AAVITR,所述AAV ITR包括其它AAV例如第二AAV的ITR序列的至少一部分,其中所述其它AAV与所述非灵长类动物AAV不相同。
在本发明的一些实施例中,一种AAV病毒颗粒包括:(A)至少一种AAV衣壳蛋白,(例如,AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白),所述至少一种AAV衣壳蛋白包括与远程AAV的衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列;以及(B)AAV基因组,所述AAV基因组包括所关注核苷酸和AAV ITR,所述AAV ITR包括其它AAV例如第二AAV的ITR序列的至少一部分,其中所述其它AAV与所述远程灵长类动物AAV不相同。
在本发明的一些AAV病毒颗粒实施例中,所述衣壳蛋白包括与所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列,所述衣壳蛋白被修饰以包括:(a)至少一个蛋白质:蛋白质结合对的第一成员;(b)可检测标记;(c)点突变。
在本发明的一些AAV病毒颗粒实施例中,包括与所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列的所述衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列和/或所述远程AAV的VP3衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。在一些实施例中,包括与所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列的所述衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列和/或所述远程AAV的VP2衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。在一些实施例中,包括与所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列的所述衣壳蛋白包括与所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列和/或所述远程AAV的VP1衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。
在本发明的一些AAV病毒颗粒实施例中,所述颗粒的所述衣壳包括:(i)VP1衣壳蛋白,所述VP1衣壳蛋白是(a)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它例如第二AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u),或者(b)所述非灵长类动物AAV或所述远程AAV的VP1衣壳蛋白;(ii)VP2衣壳蛋白,所述VP2衣壳蛋白是(a)嵌合AAV VP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括其它例如第二AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP3区的VP1/VP2共同区,或者(b)所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;以及(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。在一些实施例中,所述颗粒的所述衣壳包括:(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它例如第二AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u);(ii)嵌合AAV VP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括其它例如第二AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP3区的VP1/VP2共同区;以及(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。在一些实施例中,所述颗粒的所述衣壳包括:(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它例如第二AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u);(ii)所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;以及(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。在一些实施例中,所述衣壳包括:(i)所述非灵长类动物AAV或所述远程AAV的VP1衣壳蛋白;(ii)所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;以及(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白,并且任选地其中所述颗粒包括AAV基因组,所述AAV基因组包括AAVITR,所述AAV ITR包括所述衣壳内的其它例如第二AAV的ITR序列的至少一部分。在一些实施例中,所述其它AAV与所述非灵长类动物AAV不同。
在一些重组AAV病毒颗粒实施例中,(i)所述VP1衣壳蛋白包括:(a)嵌合氨基酸序列,任选地其中嵌合AAV VP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;或者(b)与所述非灵长类动物AAV的所述VP1衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列,(ii)所述VP2衣壳蛋白包括:(a)嵌合氨基酸序列,任选地其中嵌合AAV VP2衣壳蛋白的VP1/VP2共同区包括与第二AAV的VP1/VP2共同区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合VP2衣壳蛋白的VP3区与所述非灵长类动物AAV的VP3区包括至少95%同一性;或者(b)与所述非灵长类动物AAV的所述VP2衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列,以及(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的所述VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。在一些实施例中,(i)所述VP1衣壳蛋白包括:嵌合氨基酸序列,任选地其中嵌合AAV VP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;(ii)所述VP2衣壳蛋白包括嵌合氨基酸序列,任选地其中嵌合AAV VP2衣壳蛋白的VP1/VP2共同区包括与第二AAV的VP1/VP2共同区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合VP2衣壳蛋白的VP3区与所述非灵长类动物AAV的VP3区包括至少95%同一性;以及(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的所述VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。在一些实施例中,(i)所述AAV VP1衣壳蛋白包括嵌合氨基酸序列,任选地其中所述嵌合AAV VP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中所述嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与所述非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;(ii)所述VP2衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;以及(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。在一些实施例中,(i)所述VP1衣壳蛋白包括与所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;(ii)所述VP2衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;以及(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且任选地其中所述颗粒包括AAV基因组,所述AAV基因组包括AAV ITR,所述AAV ITR包括所述衣壳内的其它例如第二AAV的ITR序列的至少一部分。在一些实施例中,所述其它AAV与所述非灵长类动物AAV不同。
在本发明的一些AAV病毒颗粒实施例中,所述其它例如第二AAV是灵长类动物AAV或灵长类动物AAV的组合。在一些实施例中,所述其它AAV选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13和其组合。在一些实施例中,所述其它AAV是AAV2。
在本发明的一些AAV病毒颗粒实施例中,所述非灵长类动物AAV是表2中所列的非灵长类动物AAV。在一些实施例中,所述非灵长类动物AAV是禽类AAV(AAAV)、海狮AAV或鬃狮蜥AAV。在一些实施例中,所述非灵长类动物AAV是AAAV,并且任选地AAAV衣壳蛋白的氨基酸序列包括AAAV的VP1衣壳蛋白的位置I444或I580处的修饰。在一些实施例中,所述非灵长类动物AAV是有鳞目动物AAV,例如,鬃狮蜥AAV,并且任选地鬃狮蜥AAV的氨基酸序列包括鬃狮蜥AAV的VP1衣壳蛋白的位置I573或I436处的修饰。在一些实施例中,所述非灵长类动物AAV是哺乳动物AAV,例如,海狮AAV,并且任选地海狮AAV的氨基酸序列包括海狮AAV的VP1衣壳蛋白的选自由以下组成的组的位置处的修饰:I429、I430、I431、I432、I433、I434、I436、I437和A565。
在本发明的一些AAV病毒颗粒实施例中,所述蛋白质:蛋白质结合对选自以下:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括包含如SEQ ID NO:44所示的序列的c-myc。在一些实施例中,所述可检测标记包括包含IGTRYLTR(SEQ ID NO:45)的氨基酸序列的B1表位。
在一些实施例中,本发明的AAV颗粒包括所述非灵长类动物AAV、所述远程AAV或其组合的VP3衣壳蛋白,其中所述VP3衣壳蛋白被修饰以包括:(a)至少一个蛋白质:蛋白质结合对的第一成员,任选地其中所述蛋白质:蛋白质结合对选自由以下组成的组:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002;(b)可检测标记,任选地其中所述可检测标记包括如SEQ ID NO:44所示的氨基酸序列或如SEQ ID NO:45所示的氨基酸序列;(c)点突变;或者(d)(a)、(b)和(c)的任何组合。在一些实施例中,所述非灵长类动物AAV、所述远程AAV或其组合的所述VP3衣壳蛋白被修饰以包括:(a)至少一种SpyTag,所述至少一种SpyTag包括如SEQ ID NO:43所示的氨基酸序列;和/或(b)可检测标记,所述可检测标记包括如SEQ ID NO:45所示的氨基酸序列。
在一些实施例中,本发明的AAV颗粒包括第一接头和/或第二接头,所述第一接头和/或所述第二接头将蛋白质:蛋白质结合对的第一成员和/或可检测标记可操作地连接到所述AAV颗粒的衣壳的衣壳蛋白。在一些实施例中,所述第一接头和所述第二接头不相同。在一些实施例中,所述第一接头和所述第二接头相同。在一些实施例中,所述第一接头和/或所述第二接头的长度为10个氨基酸。
在本发明的一些病毒颗粒实施例中,所述VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白,任选地,至少所述VP3衣壳被修饰以包括:(a)蛋白质:蛋白质结合对的第一成员;(b)可检测标记;(c)点突变;或者(d)(a)、(b)和/或(c)的任何组合。在一些实施例中,蛋白质:蛋白质结合对的第一成员和/或所述可检测标记或所述点突变置于所述衣壳蛋白的可变区内。在一些实施例中,蛋白质:蛋白质结合对的第一成员或所述可检测标记侧接有第一接头和/或第二接头。在一些实施例中,所述第一接头和/或所述第二接头的长度为1-10个氨基酸。在一些实施例中,所述第一接头和所述第二接头不相同。在一些实施例中,所述第一接头和所述第二接头相同。
在一些病毒颗粒实施例中,AAAV VP3衣壳蛋白包括修饰,任选地蛋白质:蛋白质结合对的第一成员,任选地其中所述修饰位于位置I444(例如,G444)和/或I580(例如,K580)处。在一些实施例中,AAAV VP3衣壳蛋白包括修饰,任选地蛋白质:蛋白质结合对的第一成员,任选地其中所述修饰位于位置I444(例如,G444)和/或I580(例如,K580)处。在一些实施例中,鬃狮蜥AAV VP3衣壳蛋白包括修饰,任选地蛋白质:蛋白质结合对的第一成员,任选地其中所述修饰位于位置I573(例如,T573)和/或I436(例如,G436)处。在一些实施例中,海狮VP3衣壳蛋白包括修饰,任选地蛋白质:蛋白质结合对的第一成员,任选地其中所述修饰位于选自由以下组成的组的位置处:I429(例如,N429)、I430(例如,P430)、I431(例如,T431)、I432(例如,G432)、I433(例如,S433)、I434(例如,T434)、I436(例如,R436)、I437(例如,D437)和I565(A565)。
在本发明的一些病毒颗粒实施例中,至少一种衣壳蛋白,任选地至少所述VP3衣壳被修饰以包括蛋白质:蛋白质结合对的第一成员。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括蛋白质:蛋白质结合对的第一成员。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括蛋白质:蛋白质结合对的第二同源成员。在一些实施例中,所述蛋白质:蛋白质结合对的所述第一成员和所述第二成员由共价键例如异肽键结合。在一些实施例中,所述蛋白质:蛋白质结合对的所述第一成员是SpyTag,并且任选地,所述蛋白质:蛋白质结合对的所述第二成员是SpyCatcher或KTag。在一些实施例中,所述蛋白质:蛋白质结合对的所述第一成员是KTag,并且任选地,所述蛋白质:蛋白质结合对的所述第二成员是SpyTag。在一些实施例中,所述蛋白质:蛋白质结合对的所述第一成员是SnoopTag并且所述蛋白质:蛋白质结合对的所述第二成员是SnoopCatcher。在一些实施例中,所述蛋白质:蛋白质结合对的所述第一成员是isopeptag并且所述蛋白质:蛋白质结合对的所述第二成员是Pilin-C。在一些实施例中,所述蛋白质:蛋白质结合对的所述第一成员是SpyTag002并且所述蛋白质:蛋白质结合对的所述第二成员是SpyCatcher002。在一些实施例中,所述蛋白质:蛋白质结合对的所述第二成员连接到靶向配体,例如,结合部分,例如,抗体或其片段。在一些实施例中,所述靶向配体可以任选地通过所述第二成员的C端处的接头与蛋白质:蛋白质结合对的第二成员例如SpyCatcher融合,并且所述接头在接头的C端处与SpyCatcher融合。在一些实施例中,所述接头包括序列GSGESG(SEQ ID NO:49)。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括所述可检测标记c-myc。
在本发明的一些病毒颗粒实施例中,至少一种衣壳蛋白,任选地至少所述VP3衣壳被修饰以包括可检测标记。在一些实施例中,所述可检测标记包括AAV B1表位,例如,氨基酸序列IGTRYLTR(SEQ ID NO:45)。
在本发明的一些病毒颗粒实施例中,至少一种衣壳蛋白,任选地至少所述VP3衣壳被修饰以包括:
(a)蛋白质:蛋白质结合对的第一成员,所述蛋白质:蛋白质结合对的所述第一成员包括至少一个蛋白质:蛋白质结合对的第一成员,任选地其中所述蛋白质:蛋白质结合对选自由以下组成的组:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher、SpyTag002:SpyCatcher002和c-myc:抗c-myc抗体;
(b)可检测标记,任选地其中所述可检测标记包括如SEQ ID NO:44所示的氨基酸序列或如SEQ ID NO:45所示的氨基酸序列;
(c)点突变;或者
(d)(a)、(b)和(c)的任何组合。
在本发明的一些病毒颗粒实施例中,至少一种衣壳蛋白,任选地至少所述VP3衣壳被修饰以包括:
(a)蛋白质:蛋白质结合对的第一成员,所述蛋白质:蛋白质结合对的所述第一成员包括至少SpyTag,所述至少SpyTag包括如SEQ ID NO:43所示的氨基酸序列;和/或
(b)可检测标记,所述可检测标记包括如SEQ ID NO:45所示的氨基酸序列。
在一些实施例中,本发明的AAV颗粒包括衣壳蛋白,所述衣壳蛋白包括选自由以下组成的组的氨基酸序列:(a)如SEQ ID NO:2所示的氨基酸序列;(b)如SEQ ID NO:4所示的氨基酸序列;
(c)如SEQ ID NO:6所示的氨基酸序列;(d)如SEQ ID NO:8所示的氨基酸序列;(e)如SEQ ID NO:10所示的氨基酸序列;(f)如SEQ ID NO:12所示的氨基酸序列;(g)如SEQ IDNO:14所示的氨基酸序列;(h)如SEQ ID NO:16所示的氨基酸序列;(i)如SEQ ID NO:18所示的氨基酸序列;(j)如SEQ ID NO:20所示的氨基酸序列;(k)如SEQ ID NO:22所示的氨基酸序列;(l)如SEQ ID NO:24所示的氨基酸序列;(m)如SEQ ID NO:26所示的氨基酸序列;(n)如SEQ ID NO:28所示的氨基酸序列;(o)如SEQ ID NO:30所示的氨基酸序列;(p)如SEQ IDNO:32所示的氨基酸序列;(q)如SEQ ID NO:34所示的氨基酸序列;(r)如SEQ ID NO:36所示的氨基酸序列;(s)如SEQ ID NO:53所示的氨基酸序列;(t)如SEQ ID NO:55所示的氨基酸序列;(u)如SEQ ID NO:57所示的氨基酸序列;(v)如SEQ ID NO:59所示的氨基酸序列;(w)如SEQ ID NO:61所示的氨基酸序列;(x)如SEQ ID NO:63所示的氨基酸序列;(y)如SEQ IDNO:65所示的氨基酸序列;(z)如SEQ ID NO:67所示的氨基酸序列;(aa)如SEQ ID NO:69所示的氨基酸序列;(bb)如SEQ ID NO:71所示的氨基酸序列;(cc)与以下具有至少95%同一性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ IDNO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71;以及(dd)(a)-(cc)中的任一项所示的氨基酸序列的任何VP2和/或VP3部分的氨基酸序列。
在本发明的一些病毒颗粒实施例中,其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括修饰,例如,蛋白质:蛋白质结合对的第一成员,所述病毒颗粒进一步包括参考衣壳蛋白,任选地除了修饰之外,与所述AAV VP1、VP2和VP3衣壳蛋白中的所述至少一种衣壳蛋白对应的衣壳蛋白,使得所述衣壳为镶嵌衣壳。在一些实施例中,镶嵌衣壳包括用蛋白质:蛋白质结合对的第一成员修饰的VP1衣壳蛋白和参考VP1衣壳蛋白。在一些实施例中,镶嵌衣壳包括用蛋白质:蛋白质结合对的第一成员修饰的VP2衣壳蛋白和参考VP2衣壳蛋白。在一些实施例中,镶嵌衣壳包括用蛋白质:蛋白质结合对的第一成员修饰的VP3衣壳蛋白和参考VP3衣壳蛋白。
还描述了本发明的病毒颗粒,所述病毒颗粒包括本发明的AAV衣壳蛋白。在本发明的一些实施例中,本发明的AAV衣壳蛋白包括与非灵长类动物AAV或远程AAV的衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列,其中所述AAV衣壳蛋白选自由以下组成的组:(a)嵌合AAV VP1衣壳蛋白,任选地其中嵌合动物AAV VP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;(b)非嵌合AAV VP1衣壳蛋白,所述非嵌合AAV VP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员和/或可检测标记;(c)嵌合VP2衣壳蛋白,任选地其中所述嵌合AAV VP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;(d)非嵌合AAV VP2衣壳蛋白,所述非嵌合AAV VP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;(e)嵌合AAV VP3衣壳蛋白,所述嵌合AAVVP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;以及(f)非嵌合AAV VP3衣壳蛋白,所述非嵌合AAV VP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变。
在本发明的一些AAV衣壳蛋白实施例中,所述蛋白质:蛋白质结合对的第一成员和/或可检测标记在一侧或两侧上分别侧接有第一接头和/或第二接头,所述第一接头和/或所述第二接头将蛋白质:蛋白质结合对的第一成员和/或可检测标记连接到所述衣壳蛋白,其中所述第一接头和/或所述第二接头的长度各自独立地为至少一个氨基酸。在一些实施例中,所述第一接头和所述第二接头不相同。在一些实施例中,所述第一接头和所述第二接头相同并且长度为10个氨基酸。
在一些实施例中,本发明的AAV衣壳蛋白包括可检测标记,任选地其中所述可检测标记包括包含如SEQ ID NO:45所示的氨基酸序列的B1表位。在一些实施例中,可检测标记包括c-myc。
在一些实施例中,本发明的AAV衣壳蛋白包括蛋白质:蛋白质结合对的第一成员和第二同源成员两者,任选地其中所述第一成员和所述第二成员通过共价键,任选地异肽键结合。在一些实施例中,蛋白质:蛋白质结合对的第一成员是SpyTag,并且任选地所述第二同源成员是SpyCatcher或KTag。在一些实施例中,所述第一成员是KTag并且所述第二同源成员是SpyTag。在一些实施例中,所述第一成员是SnoopTag并且所述第二同源成员是SnoopCatcher。在一些实施例中,所述第一成员是isopeptag并且所述第二同源成员是Pilin-C。在一些实施例中,所述第一成员是SpyTag002并且所述第二同源成员是SpyCatcher002。在一些实施例中,所述第一成员包括可检测标记,如但不限于c-myc,其中其结合对为抗c-myc抗体或其一部分。在一些实施例中,所述第二成员可操作地连接到靶向配体,任选地其中所述靶向配体是结合部分,其任选地靶向细胞标志物。在一些实施例中,所述结合部分是抗体或其一部分。在一些实施例中,所述结合部分可操作地连接到所述蛋白质:蛋白质结合对的第二成员,任选地通过共价键(如但不限于异肽键)或接头。在一些实施例中,所述结合部分通过在所述结合部分的C端处融合的接头与所述蛋白质:蛋白质结合对的第二成员融合,其中所述接头在所述接头的C端与所述第二成员融合,任选地其中所述接头包括如SEQ ID NO:49(GSGESG)所示的序列。在一些实施例中,所述蛋白质:蛋白质结合对的所述第一成员位于存在于所述衣壳蛋白的VR I、VR II、VR III、VR IV、VR V、VR VI、VRVII、VR VIII、VR IX或HI环中的氨基酸位置处,任选地所述衣壳蛋白的所述VR VIII或VRIV。
在本发明的一些AAV衣壳蛋白实施例中,所述非灵长类动物AAV是表2中所列的非灵长类动物AAV。在一些实施例中,所述非灵长类动物AAV是禽类AAV(AAAV)、海狮AAV或鬃狮蜥AAV。在一些实施例中,所述非灵长类动物AAV是AAAV,并且任选地AAAV衣壳蛋白的氨基酸序列包括AAAV的VP1衣壳蛋白的位置I444或I580处的修饰。在一些实施例中,所述非灵长类动物AAV是有鳞目动物AAV,例如,鬃狮蜥AAV,并且任选地鬃狮蜥AAV的氨基酸序列包括鬃狮蜥AAV的VP1衣壳蛋白的位置I573或I436处的修饰。在一些实施例中,所述非灵长类动物AAV是哺乳动物AAV,例如,海狮AAV,并且任选地海狮AAV的氨基酸序列包括海狮AAV的VP1衣壳蛋白的选自由以下组成的组的位置处的修饰:I429、I430、I431、I432、I433、I434、I436、I437和A565。
本发明的非灵长类动物VP3衣壳蛋白包含(a)使其它例如第二AAV的基因组衣壳化和/或(b)被突变的非灵长类动物VP3衣壳。在一些实施例中,本发明的非人动物AAV的VP3衣壳蛋白使不是所述非灵长类动物的第二AAV的基因组衣壳化。在一些实施例中,本发明的非灵长类动物AAV的VP3衣壳蛋白可以可操作地连接到蛋白质:蛋白质结合对的第一成员(任选地通过第一接头和/或第二接头)和/或包括点突变,例如使得所述衣壳蛋白的自然趋向性降低直至消除和/或使得所述衣壳蛋白包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括包含c-myc(SEQ ID NO:44)的所述可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括形成共价键的蛋白质:蛋白质结合对的第一成员以及任选地第二成员。在一些实施例中,所述蛋白质:蛋白质结合对选自由以下组成的组:(a)SpyTag:SpyCatcher、(b)SpyTag:KTag、(c)Isopeptag:pilin C、(d)SnoopTag:SnoopCatcher和ISpyTag002:SpyCatcher002。在一些实施例中,非灵长类动物AAV的VP3衣壳蛋白可以包括:(a)B1表位(SEQ ID NO:45);(b)SpyTag;(c)SpyCatcher;或者(a)-(c)的任何组合。
在一些实施例中,本发明的非灵长类动物AAV的VP3衣壳蛋白包括可操作地连接到其上的蛋白质:蛋白质结合对的第一成员,任选地通过第一接头或第二接头。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP3衣壳蛋白的可变区(VR)或其一部分中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP3衣壳,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP3衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP3衣壳蛋白的以下中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP3衣壳:VR I、VR II、VR III、VR IV、VR V、VR VI、VRVII、VR VIII、VR IX或HI环,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP3衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP3衣壳蛋白的VR VIII或VR IV中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP3衣壳,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP3衣壳。在一些实施例中,非灵长类动物AAV的VP3衣壳蛋白是选自表2中提供的所述非灵长类动物AAV的非灵长类动物AAV的VP3衣壳蛋白。在一些实施例中,非灵长类动物AAV的VP3衣壳蛋白是禽类AAV(AAAV)的VP3衣壳蛋白。在一些实施例中,AAAV的VP3衣壳蛋白包括在位置I444或I580处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,非灵长类动物AAV的VP3衣壳蛋白是鬃狮蜥AAV的VP3衣壳蛋白。在一些实施例中,鬃狮蜥AAV的VP3衣壳蛋白包括在位置I573或I436处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,非灵长类动物AAV的VP3衣壳蛋白是海狮AAV的VP3衣壳蛋白。在一些实施例中,海狮AAV的VP3衣壳蛋白包括在以下处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag):选自由以下组成的组的位置:I429、I430、I431、I432、I433、I434、I436、I437和I565,以及任选地选自由以下组成的组的位置:I429、I430、I431、I432、I433、I436和I437;任选地I432。
本发明的非灵长类动物VP2衣壳蛋白包含(a)使其它例如第二AAV的基因组衣壳化和/或(b)被突变的非灵长类动物VP2衣壳。在一些实施例中,本发明的非灵长类动物AAV的VP2衣壳蛋白使其它例如第二AAV的基因组衣壳化。在一些实施例中,本发明的非灵长类动物AAV的VP2衣壳蛋白可以可操作地连接到蛋白质:蛋白质结合对的第一成员和/或包括点突变,例如使得降低直至消除衣壳蛋白的自然趋向性和/或使得衣壳蛋白包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括包含c-myc(SEQ ID NO:44)的可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括形成共价键的蛋白质:蛋白质结合对的第一成员以及任选地第二成员。在一些实施例中,所述蛋白质:蛋白质结合对选自由以下组成的组:(a)SpyTag:SpyCatcher、(b)SpyTag:KTag、(c)Isopeptag:pilin C、(d)SnoopTag:SnoopCatcher和(e)SpyTag002:SpyCatcher002。在一些实施例中,非灵长类动物AAV的VP2衣壳蛋白可以包括:(a)B1表位(SEQ ID NO:45);(b)SpyTag;(c)SpyCatcher;或者(a)-(c)的任何组合。
在一些实施例中,本发明的非灵长类动物AAV的VP2衣壳蛋白包括可操作地连接到其上的蛋白质:蛋白质结合对的第一成员,任选地通过第一接头和第二接头。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP2衣壳蛋白的可变区(VR)或其一部分中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP2衣壳,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP2衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP2衣壳蛋白的以下中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP2衣壳:VR I、VR II、VR III、VR IV、VR V、VR VI、VRVII、VR VIII、VR IX或HI环,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP2衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP2衣壳蛋白的VR VIII或VR IV中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP2衣壳,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP2衣壳。在一些实施例中,非灵长类动物AAV的VP2衣壳蛋白是选自表2中提供的所述非灵长类动物AAV的非灵长类动物AAV的VP2衣壳蛋白。在一些实施例中,非灵长类动物AAV的VP2衣壳蛋白是禽类AAV(AAAV)的VP2衣壳蛋白。在一些实施例中,AAAV的VP2衣壳蛋白包括在位置I444或I580处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,非灵长类动物AAV的VP2衣壳蛋白是鬃狮蜥AAV的VP2衣壳蛋白。在一些实施例中,鬃狮蜥AAV的VP2衣壳蛋白包括在位置I573或I436处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,非灵长类动物AAV的VP2衣壳蛋白是海狮AAV的VP2衣壳蛋白。在一些实施例中,海狮AAV的VP2衣壳蛋白包括在以下处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag):选自由以下组成的组的位置:I429、I430、I431、I432、I433、I434、I436、I437和I565;任选地选自由以下组成的组的位置:I429、I430、I431、I432、I433、I436和I437;任选地I431。
在一些实施例中,本发明的VP2衣壳蛋白可以是嵌合VP2衣壳蛋白,所述嵌合VP2衣壳蛋白包括可操作地连接的非灵长类动物AAV的VP2衣壳蛋白的一部分和其它例如第二AAV的VP2衣壳蛋白的一部分。在一些实施例中,嵌合VP2衣壳蛋白从N端到C端包括可操作地连接的以下:(a)其它例如第二AAV的VP2衣壳蛋白的一部分,(b)非灵长类动物AAV的VP2衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP2衣壳蛋白从N端到C端可以包括可操作地连接的以下:(a)其它AAV的VP1/VP2共同区的氨基酸序列,(b)非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列。在一些实施例中,其它AAV是非灵长类动物AAV。在一些其它实施例中,其它AAV是灵长类动物AAV。
在一些实施例中,本发明的嵌合VP2衣壳蛋白包括可操作地连接的以下:(a)灵长类动物AAV的VP2衣壳蛋白的一部分,(b)非灵长类动物AAV的VP2衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP2衣壳蛋白从N端到C端可以包括可操作地连接的以下:(a)灵长类动物AAV的VP1/VP2共同区的氨基酸序列,(b)非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列。在一些实施例中,所述灵长类动物AAV是AAV1。在一些实施例中,所述灵长类动物AAV是AAV2。在一些实施例中,所述灵长类动物AAV是AAV3。在一些实施例中,所述灵长类动物AAV是AAV4。在一些实施例中,所述灵长类动物AAV是AAV5。在一些实施例中,所述灵长类动物AAV是AAV6。在一些实施例中,所述灵长类动物AAV是AAV7。在一些实施例中,所述灵长类动物AAV是AAV8。在一些实施例中,所述灵长类动物AAV是AAV9。在一些实施例中,所述非灵长类动物AAV选自表2中提供的非灵长类动物AAV的组。在一些实施例中,所述非灵长类动物AAV是禽类AAV、鬃狮蜥AAV或海狮AAV。
在一些实施例中,本发明的嵌合VP2衣壳蛋白包括可操作地连接的以下:(a)AAV2的VP2衣壳蛋白的一部分,(b)非-灵长类动物AAV的VP2衣壳的至少包括非-灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP2衣壳蛋白从N端到C端可以包括可操作地连接的以下:(a)AAV2的VP1/VP2共同区的氨基酸序列,(b)非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列。
在一些实施例中,本发明的嵌合AAV2/AAAV VP2衣壳蛋白包括可操作地连接的以下:(a)AAV2的VP2衣壳蛋白的一部分,(b)禽类AAV(AAAV)的VP2衣壳的至少包括AAAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/AAAV VP2衣壳蛋白从N端到C端可以包括可操作地连接的以下:(a)AAV2的VP1/VP2共同区的氨基酸序列,(b)AAAV的VP3衣壳蛋白的氨基酸序列。
在一些实施例中,本发明的嵌合AAV2/海狮AAV VP2衣壳蛋白包括可操作地连接的以下:(a)AAV2的VP2衣壳蛋白的一部分,(b)海狮AAV的VP2衣壳蛋白的至少包括海狮AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/海狮AAV VP2衣壳蛋白从N端到C端可以包括可操作地连接的以下:(a)AAV2的VP1/VP2共同区的氨基酸序列,(b)海狮AAV的VP3衣壳蛋白的氨基酸序列。
在一些实施例中,本发明的嵌合AAV2/鬃狮蜥AAV VP2衣壳蛋白包括可操作地连接的以下:(a)AAV2的VP2衣壳蛋白的一部分,(b)鬃狮蜥AAV的VP2衣壳的至少包括鬃狮蜥AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/鬃狮蜥AAV VP2衣壳蛋白从N端到C端可以包括可操作地连接的以下:(a)AAV2的VP1/VP2共同区的氨基酸序列,(b)鬃狮蜥AAV的VP3衣壳蛋白的氨基酸序列。
在一些实施例中,本发明的嵌合VP2衣壳蛋白可以可操作地连接到蛋白质:蛋白质结合对的第一成员和/或包括点突变,例如使得降低直至消除衣壳蛋白的自然趋向性和/或使得衣壳蛋白包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括包含c-myc(SEQ ID NO:44)的所述可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括形成共价键的蛋白质:蛋白质结合对的第一成员以及任选地第二成员。在一些实施例中,所述蛋白质:蛋白质结合对选自由以下组成的组:(a)SpyTag:SpyCatcher、(b)SpyTag:KTag、(c)Isopeptag:pilin C、(d)SnoopTag:SnoopCatcher和(e)SpyTag002:SpyCatcher002。在一些实施例中,嵌合VP2衣壳蛋白可以包括:(a)B1表位(SEQ ID NO:45);(b)SpyTag;(c)SpyCatcher;或者(a)-(c)的任何组合。
在一些实施例中,本发明的嵌合灵长类动物/非灵长类动物VP2衣壳蛋白(例如,嵌合AAV2/AAAV VP2衣壳蛋白、嵌合AAV2/海狮AAV VP2衣壳蛋白、嵌合AAV2/鬃狮蜥AAV VP2衣壳蛋白等)包括可操作地连接到其上的蛋白质:蛋白质:蛋白质结合对的第一成员,任选地通过第一接头或第二接头。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于嵌合灵长类动物/非灵长类动物VP2衣壳蛋白的可变区(VR)或其一部分中的氨基酸位置处可操作地连接到嵌合灵长类动物/非灵长类动物VP2衣壳蛋白(例如,嵌合AAV2/AAAV VP2衣壳蛋白、嵌合AAV2/海狮AAV VP2衣壳蛋白、嵌合AAV2/鬃狮蜥AAV VP2衣壳蛋白等),任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到嵌合灵长类动物/非灵长类动物VP2衣壳蛋白。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于嵌合灵长类动物/非灵长类动物VP2衣壳蛋白的以下中的氨基酸位置处可操作地连接到嵌合灵长类动物/非灵长类动物VP2衣壳蛋白:VR I、VR II、VR III、VR IV、VR V、VR VI、VRVII、VR VIII、VR IX或HI环,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP2衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于嵌合灵长类动物/非灵长类动物VP2衣壳蛋白的VR VIII或VR IV中的氨基酸位置处可操作地连接到嵌合灵长类动物/非灵长类动物VP2衣壳蛋白(例如,嵌合AAV2/AAAV VP2衣壳蛋白、嵌合AAV2/海狮AAV VP2衣壳蛋白、嵌合AAV2/鬃狮蜥AAV VP2衣壳蛋白等),任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到嵌合灵长类动物/非灵长类动物VP2衣壳蛋白。在一些实施例中,嵌合AAV2/AAAV VP2衣壳蛋白包括在位置I444或I580处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,嵌合AAV2/鬃狮蜥AAV VP2衣壳蛋白包括在位置I573或I436处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,嵌合AAV2/海狮AAV VP2衣壳蛋白包括在以下处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag):选自由以下组成的组的位置:I429、I430、I431、I432、I433、I434、I436、I437和I565;任选地选自由以下组成的组的位置:I429、I430、I431、I432、I433、I436和I437;任选地I431。
本发明的非灵长类动物VP1衣壳蛋白包含(a)使其它例如第二AAV的基因组衣壳化和/或(b)被突变的非灵长类动物VP1衣壳。在一些实施例中,本发明的非灵长类动物AAV的VP1衣壳蛋白使其它例如第二AAV的基因组衣壳化。在一些实施例中,本发明的非灵长类动物的VP1衣壳蛋白可以可操作地连接到蛋白质:蛋白质结合对的第一成员和/或包括点突变,例如使得降低直至消除衣壳蛋白的自然趋向性和/或使得衣壳蛋白包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括包含c-myc(SEQ ID NO:44)的所述可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括形成共价键的蛋白质:蛋白质结合对的第一成员以及任选地第二成员。在一些实施例中,所述蛋白质:蛋白质结合对选自由以下组成的组:(a)SpyTag:SpyCatcher、(b)SpyTag:KTag、(c)Isopeptag:pilin C、(d)SnoopTag:SnoopCatcher和(e)SpyTag002:SpyCatcher002。在一些实施例中,非灵长类动物AAV的VP3衣壳蛋白可以包括:(a)B1表位(SEQ ID NO:45);(b)SpyTag;(c)SpyCatcher;或者(a)-(c)的任何组合。
在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP1衣壳蛋白的可变区(VR)或其一部分中的氨基酸位置处可操作地连接到本发明的非灵长类动物AAV的VP1衣壳,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP1衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP1衣壳蛋白的以下中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP1衣壳:VR I、VR II、VR III、VR IV、VR V、VR VI、VR VII、VR VIII、VR IX或HI环,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP1衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于所述VP1衣壳蛋白的VR VIII或VR IV中的氨基酸位置处可操作地连接到非灵长类动物AAV的VP1衣壳,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到所述VP1衣壳。在一些实施例中,非灵长类动物AAV的VP1衣壳蛋白是选自表2中提供的非灵长类动物AAV的组的非灵长类动物AAV的VP1衣壳蛋白。在一些实施例中,非灵长类动物AAV的VP1衣壳蛋白是禽类AAV(AAAV)的VP1衣壳蛋白。在一些实施例中,AAAV的VP1衣壳蛋白包括在位置I444或I580处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,非灵长类动物AAV的VP1衣壳蛋白是鬃狮蜥AAV的VP31衣壳蛋白。在一些实施例中,鬃狮蜥AAV的VP1衣壳蛋白包括在位置I573或I436处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag)。在一些实施例中,非灵长类动物AAV的VP1衣壳蛋白是海狮AAV的VP1衣壳蛋白。在一些实施例中,海狮AAV的VP1衣壳蛋白包括在以下处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员(例如,SpyTag):选自由以下组成的组的位置:I429、I430、I431、I432、I433、I434、I436、I437和I565;任选地选自由以下组成的组的位置:I429、I430、I431、I432、I433、I436和I437;任选地I431。
在一些其它实施例中,本发明的VP1衣壳蛋白可以是嵌合VP1衣壳蛋白,所述嵌合VP1衣壳蛋白包括可操作地连接的非灵长类动物AAV的VP1衣壳蛋白的一部分和其它AAV的VP1衣壳蛋白的一部分,其中其它AAV不是非灵长类动物AAV。在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)其它AAV的VP1衣壳蛋白的至少包括其它AAV的PLA2结构域的一部分和(b)非灵长类动物AAV的VP1衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)其它AAV的VP1衣壳蛋白的至少包括其它AAV的VP1-u结构域的一部分和(b)非灵长类动物AAV的VP1衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)其它例如第二AAV的VP1-u结构域和VP1/VP2共同区的氨基酸序列和(b)非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列。在一些实施例中,其它AAV是非灵长类动物AAV。在一些其它实施例中,其它AAV是灵长类动物AAV。
在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)灵长类动物AAV的VP1衣壳蛋白的至少包括灵长类动物AAV的PLA2结构域的一部分和(b)非灵长类动物AAV的VP1衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)灵长类动物AAV的VP1衣壳蛋白的至少包括灵长类动物AAV的VP1-u结构域的一部分和(b)非灵长类动物AAV的VP1衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)灵长类动物AAV的VP1-u结构域和VP1/VP2共同区的氨基酸序列和(b)非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列。在一些实施例中,所述灵长类动物AAV是AAV1。在一些实施例中,所述灵长类动物AAV是AAV2。在一些实施例中,所述灵长类动物AAV是AAV3。在一些实施例中,所述灵长类动物AAV是AAV4。在一些实施例中,所述灵长类动物AAV是AAV5。在一些实施例中,所述灵长类动物AAV是AAV6。在一些实施例中,所述灵长类动物AAV是AAV7。在一些实施例中,所述灵长类动物AAV是AAV8。在一些实施例中,所述灵长类动物AAV是AAV9。在一些实施例中,所述非灵长类动物AAV选自表2中提供的非灵长类动物AAV的组。在一些实施例中,所述非灵长类动物AAV是禽类AAV、鬃狮蜥AAV或海狮AAV。
在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的PLA2结构域的一部分和(b)非灵长类动物AAV的VP1衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的VP1-u结构域的一部分和(b)非灵长类动物AAV的VP1衣壳的至少包括非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1-u结构域和VP1/VP2共同区的氨基酸序列和(b)非灵长类动物的VP3衣壳蛋白的氨基酸序列。
在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的PLA2结构域的一部分和(b)禽类AAV(AAAV)的VP1衣壳的至少包括AAAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的VP1-u结构域的一部分和(b)AAAV的VP1衣壳蛋白的至少包括AAAV的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1-u结构域和VP1/VP2共同区的氨基酸序列和(b)AAAV的VP3衣壳蛋白的氨基酸序列。在一些实施例中,AAV2/AAAV VP1衣壳蛋白包括如SEQ ID NO:2所示的氨基酸序列。
在一些实施例中,嵌合AAV2/海狮VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的PLA2结构域的一部分和(b)海狮AAV的VP1衣壳的至少包括海狮的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/海狮VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的VP1-u结构域的一部分和(b)海狮的VP1衣壳的至少包括海狮的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/海狮VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1-u结构域和VP1/VP2共同区的氨基酸序列和(b)海狮的VP3衣壳蛋白的氨基酸序列。在一些实施例中,嵌合AAV2/海狮VP1衣壳蛋白包括如SEQ ID NO:4所示的氨基酸序列。
在一些实施例中,嵌合AAV2/鬃狮蜥VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的PLA2结构域的一部分和(b)鬃狮蜥AAV的VP1衣壳的至少包括鬃狮蜥的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/鬃狮蜥VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1衣壳蛋白的至少包括AAV2的VP1-u结构域的一部分和(b)鬃狮蜥的VP1衣壳的至少包括鬃狮蜥的VP3衣壳蛋白的氨基酸序列的一部分。在一些实施例中,嵌合AAV2/鬃狮蜥VP1衣壳蛋白从N端到C端包括(a)AAV2的VP1-u结构域和VP1/VP2共同区的氨基酸序列和(b)鬃狮蜥的VP3衣壳蛋白的氨基酸序列。在一些实施例中,嵌合AAV2/鬃狮蜥VP1衣壳蛋白包括如SEQ ID NO:6所示的氨基酸序列。
在一些实施例中,嵌合VP1衣壳蛋白可以可操作地连接到蛋白质:蛋白质结合对的第一成员和/或包括点突变,例如使得降低直至消除衣壳蛋白的自然趋向性和/或使得衣壳蛋白包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括包含c-myc(SEQ ID NO:44)的所述可检测标记。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括形成共价键的蛋白质:蛋白质结合对的第一成员以及任选地第二成员。在一些实施例中,所述蛋白质:蛋白质结合对选自由以下组成的组:(a)SpyTag:SpyCatcher、(b)SpyTag:KTag、(c)Isopeptag:pilin C、(d)SnoopTag:SnoopCatcher和(e)SpyTag002:SpyCatcher002。在一些实施例中,嵌合VP1衣壳蛋白可以包括:(a)B1表位(SEQ ID NO:45);(b)SpyTag;(c)SpyCatcher;或者(a)-(c)的任何组合。
在一些实施例中,嵌合灵长类动物/非灵长类动物VP1衣壳蛋白(例如,嵌合AAV2/AAAV VP1衣壳蛋白、嵌合AAV2/海狮AAV VP1衣壳蛋白、嵌合AAV2/鬃狮蜥AAV VP1衣壳蛋白等)包括可操作地连接到其上的蛋白质:蛋白质结合对的第一成员,任选地通过第一接头或第二接头。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于嵌合灵长类动物/非灵长类动物VP1衣壳蛋白的可变区(VR)或其一部分中的氨基酸位置处可操作地连接到嵌合灵长类动物/非灵长类动物VP1衣壳蛋白(例如,嵌合AAV2/AAAV VP1衣壳蛋白、嵌合AAV2/海狮AAV VP1衣壳蛋白、嵌合AAV2/鬃狮蜥AAV VP1衣壳蛋白等),任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到嵌合灵长类动物/非灵长类动物VP1衣壳蛋白。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于嵌合灵长类动物/非灵长类动物VP1衣壳蛋白的以下中的氨基酸位置处可操作地连接到嵌合灵长类动物/非灵长类动物VP1衣壳蛋白的VP1衣壳:VR I、VR II、VR III、VR IV、VR V、VR VI、VR VII、VRVIII、VR IX或HI环,任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到嵌合灵长类动物/非灵长类动物VP1衣壳蛋白衣壳。在一些实施例中,蛋白质:蛋白质结合对的第一成员在存在于嵌合灵长类动物/非灵长类动物VP1衣壳蛋白的VR VIII或VR IV中的氨基酸位置处可操作地连接到嵌合灵长类动物/非灵长类动物VP1衣壳蛋白(例如,嵌合AAV2/AAAV VP1衣壳蛋白、嵌合AAV2/海狮AAV VP1衣壳蛋白、嵌合AAV2/鬃狮蜥AAVVP1衣壳蛋白等),任选地其中蛋白质:蛋白质结合对的第一成员通过第一接头和/或第二接头连接到嵌合灵长类动物/非灵长类动物VP1衣壳蛋白。
在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白包括在位置I444或I580处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员。在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白包括在位置I444处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白包括如SEQ ID NO:8所示的氨基酸序列。在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白包括在位置I580处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/AAAV VP1衣壳蛋白包括如SEQ ID NO:10所示的氨基酸序列。
在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在以下处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员:选自由以下组成的组的位置:I429、I430、I431、I432、I433、I434、I436、I437和I565;任选地选自由以下组成的组的位置:I429、I430、I431、I432、I433、I436和I437;任选地I432。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I432处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ IDNO:12所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I565处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:14所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I429处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQID NO:16所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I430处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:18所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I431处的通过第一接头和第二接头序列可操作地任选地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:20所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I433处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:22所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I434处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:24所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I435处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:26所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I436处的通过第一接头和第二接头序列可操作地任选地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:28所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I437处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:30所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括在位置I432处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:32所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:53所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:55所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:57所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAV VP1衣壳蛋白包括如SEQ ID NO:59所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAVVP1衣壳蛋白包括如SEQ ID NO:61所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAVVP1衣壳蛋白包括如SEQ ID NO:63所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAVVP1衣壳蛋白包括如SEQ ID NO:65所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAVVP1衣壳蛋白包括如SEQ ID NO:67所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAVVP1衣壳蛋白包括如SEQ ID NO:69所示的氨基酸序列。在一些实施例中,嵌合AAV2/海狮AAVVP1衣壳蛋白包括如SEQ ID NO:71所示的氨基酸序列。
在一些实施例中,嵌合AAV2/鬃狮蜥AAV VP1衣壳蛋白包括在位置I436或I573处的任选地通过第一接头和/或第二接头可操作地连接的蛋白质:蛋白质结合对的第一成员。在一些实施例中,嵌合AAV2/鬃狮蜥AAV VP1衣壳蛋白包括在位置I436处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/鬃狮蜥AAV VP1衣壳蛋白包括如SEQ ID NO:34所示的氨基酸序列。在一些实施例中,嵌合AAV2/鬃狮蜥AAVVP1衣壳蛋白包括在位置I573处的任选地通过第一接头和第二接头序列可操作地连接的SpyTag。在一些实施例中,嵌合AAV2/鬃狮蜥AAV VP1衣壳蛋白包括如SEQ ID NO:36所示的氨基酸序列。
在一些实施例中,本发明的衣壳蛋白进一步包括蛋白质:蛋白质结合对的第一成员和第二成员,任选地其中所述第二成员可操作地连接到靶向配体,任选地其中所述靶向配体是结合部分。在一些实施例中,所述结合部分是抗体或其一部分。在一些实施例中,所述抗体或其一部分与所述第二成员例如SpyCatcher融合。在一些实施例中,所述抗体或其一部分在其C端处与接头融合,任选地接头包括如SEQ ID NO:49(GSGESG)所示的序列,并且所述接头在所述接头的C端处与所述第二成员例如SpyCatcher融合。
在一些实施例中,本发明的衣壳蛋白可以包括可检测标记,所述可检测标记可以任选地充当蛋白质:蛋白质结合对的第一成员和/或用于所述衣壳蛋白的检测和/或分离。在一些实施例中,所述可检测标记是c-myc。在一些实施例中,所述可检测标记包括AAV B1表位,例如,氨基酸序列IGTRYLTR(SEQ ID NO:45)。
本发明的AAV颗粒可以包括选自由以下组成的组的氨基酸序列:(a)如SEQ ID NO:2所示的氨基酸序列;(b)如SEQ ID NO:4所示的氨基酸序列;(c)如SEQ ID NO:6所示的氨基酸序列;(d)如SEQ ID NO:8所示的氨基酸序列;(e)如SEQ ID NO:10所示的氨基酸序列;(f)如SEQ ID NO:12所示的氨基酸序列;(g)如SEQ ID NO:14所示的氨基酸序列;(h)如SEQ IDNO:16所示的氨基酸序列;(i)如SEQ ID NO:18所示的氨基酸序列;(j)如SEQ ID NO:20所示的氨基酸序列;(k)如SEQ ID NO:22所示的氨基酸序列;(l)如SEQ ID NO:24所示的氨基酸序列;(m)如SEQ ID NO:26所示的氨基酸序列;(n)如SEQ ID NO:28所示的氨基酸序列;(o)如SEQ ID NO:30所示的氨基酸序列;(p)如SEQ ID NO:32所示的氨基酸序列;(q)如SEQ IDNO:34所示的氨基酸序列;(r)如SEQ ID NO:36所示的氨基酸序列;(s)如SEQ ID NO:53所示的氨基酸序列;(t)如SEQ ID NO:55所示的氨基酸序列;(u)如SEQ ID NO:57所示的氨基酸序列;(v)如SEQ ID NO:59所示的氨基酸序列;(w)如SEQ ID NO:61所示的氨基酸序列;(x)如SEQ ID NO:63所示的氨基酸序列;(y)如SEQ ID NO:65所示的氨基酸序列;(z)如SEQ IDNO:67所示的氨基酸序列;(aa)如SEQ ID NO:69所示的氨基酸序列;(bb)如SEQ ID NO:71所示的氨基酸序列;(cc)与以下具有显著序列同一性,例如至少95%同一性的氨基酸序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQID NO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71;以及(dd)(a)-(cc)中的任一项所示的氨基酸序列的任何VP2和/或VP3部分的氨基酸序列。
在一些实施例中,本发明的衣壳蛋白由本发明的核酸分子编码。本文还提供了对本发明的衣壳蛋白进行编码的核酸分子。
本文描述了核酸分子,所述核酸分子包括对AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白进行编码的AAV cap基因,其中所述AAV cap基因或其一部分包括与非灵长类动物AAV或其一部分、或远程AAV或其一部分的cap基因的核酸序列具有显著序列同一性,例如至少95%同一性的核酸序列,并且其中所述AAV cap基因被进一步修饰以包括:(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;(b)对可检测标记进行编码的核苷酸序列;(c)点突变;(d)嵌合核苷酸序列;或者(e)(a)、(b)、(c)和(d)的任何组合。在一些核酸分子实施例中,所述核酸包括AAV rep基因和AAV cap基因,其中所述整个AAV cap基因包括与非灵长类动物AAV或远程AAV的cap基因的核酸序列具有显著序列同一性,例如至少95%同一性的第一核酸序列,并且其中所述AAV rep基因或其一部分包括与第二AAV或其一部分的rep基因的核酸序列具有显著序列同一性,例如至少95%同一性的第二核酸序列,其中所述非灵长类动物AAV与所述第二AAV不相同。在一些实施例中,本发明的核酸分子包括对AAV衣壳蛋白进行编码的AAV cap基因,其中所述AAV cap基因包括与选自由以下组成的组的cap基因的核苷酸序列的至少一部分相同或具有显著同一性例如至少95%序列同一性的核苷酸序列:(i)非灵长类动物AAV的cap基因,(ii)远程AAV的cap基因,或(iii)其组合,其中所述AAV cap基因被进一步修饰以包括:(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;(b)对可检测标记进行编码的核苷酸序列;(c)点突变;(d)嵌合核苷酸序列,所述嵌合核苷酸序列包括其它例如第二AAV cap基因的核苷酸序列的可操作地连接到选自由cap基因非灵长类动物AAV、远程AAV或其组合组成的组的AAV cap基因的所述核苷酸序列的一部分;(e)(a)、(b)、(c)和(d)的任何组合。
在一些实施例中,本发明的核酸分子包括对AAV衣壳蛋白进行编码的AAV cap基因,其中所述AAV cap基因包括与非灵长类动物AAV的cap基因的核苷酸序列的至少一部分相同或具有显著同一性例如至少95%序列同一性的核苷酸序列,其中所述AAV cap基因被进一步修饰以包括:(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;(b)对可检测标记进行编码的核苷酸序列;(c)点突变;(d)嵌合核苷酸序列,所述嵌合核苷酸序列包括例如第二AAV cap基因的核苷酸序列的可操作地连接到cap基因非灵长类动物AAV的所述核苷酸序列的一部分;(e)(a)、(b)、(c)和(d)的任何组合。
在一些实施例中,本发明的核酸分子包括对AAV衣壳蛋白进行编码的AAV cap基因,其中所述AAV cap基因包括与远程动物AAV的cap基因的核苷酸序列的至少一部分相同或具有显著同一性例如至少95%序列同一性的核苷酸序列,其中所述AAV cap基因被进一步修饰以包括:(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;(b)对可检测标记进行编码的核苷酸序列;(c)点突变;(d)嵌合核苷酸序列,所述嵌合核苷酸序列包括其它AAV cap基因的核苷酸序列的可操作地连接到cap基因远程动物AAV的所述核苷酸序列的一部分;(e)(a)、(b)、(c)和(d)的任何组合。
在一些实施例中,本发明的核酸分子包括AAV rep基因和AAV cap基因,其中所述AAV cap基因包括与选自由以下组成的组的cap基因的核苷酸序列相同或具有显著同一性例如至少95%序列同一性的第一核苷酸序列:(i)非灵长类动物AAV的cap基因,(ii)远程灵长类动物AAV的cap基因,以及(iv)其组合,其中所述AAV rep基因包括其它例如第二AAV的AAV rep基因的第二核苷酸序列。
在一些实施例中,本发明的核酸分子包括AAV rep基因和AAV cap基因,其中所述AAV cap基因包括与非灵长类动物AAV的cap基因的核苷酸序列相同或具有显著同一性例如至少95%序列同一性的第一核苷酸序列核苷酸序列,其中所述AAV rep基因包括与其它例如第二AAV的AAV rep基因的核苷酸序列相同或具有显著同一性例如至少95%序列同一性的第二核苷酸序列核苷酸序列。
在一些实施例中,本发明的核酸分子包括AAV rep基因和AAV cap基因,其中所述AAV cap基因包括与远程动物AAV的cap基因的第一核苷酸序列相同或具有显著同一性例如至少95%序列同一性的核苷酸序列,其中所述AAV rep基因包括与其它例如第二AAV的AAVrep基因的第二核苷酸序列相同或具有显著同一性例如至少95%序列同一性的核苷酸序列。
在本发明的一些核酸分子实施例中,cap基因的核苷酸序列包括与所述非灵长类动物AAV的核苷酸序列相同或具有显著同一性例如至少95%序列同一性的核苷酸序列,所述cap基因与所述远程AAV或其组合的核苷酸序列相同或具有显著同一性例如至少95%序列同一性的核苷酸序列,所述核苷酸序列被修饰以包括:(a)对至少一个蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;(b)对可检测标记进行编码的核苷酸序列;和/或(c)对点突变进行编码的核苷酸序列。
在一些核酸分子实施例中,所述蛋白质:蛋白质结合对选自以下:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002。在一些实施例中,蛋白质:蛋白质结合对的第一成员包括可检测标记,例如,包括如SEQ ID NO:44所示的序列的c-myc。
在一些核酸实施例中,所述非灵长类动物AAV的cap基因、所述远程AAV的所述cap基因或其组合的核苷酸序列被修饰以包括包含IGTRYLTR(SEQ ID NO:45)的氨基酸序列的B1表位。
在本发明的一些核酸分子实施例中,所述非灵长类动物AAV的cap基因、所述远程AAV的所述cap基因或其组合的核苷酸序列包括对VP3衣壳蛋白或其一部分进行编码的核苷酸序列,所述核苷酸序列包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列和/或所述远程AAV的VP3衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。在一些实施例中,所述非灵长类动物AAV的cap基因、所述远程AAV的所述cap基因或其组合的核苷酸序列包括对VP2衣壳蛋白或其一部分进行编码的核苷酸序列,所述核苷酸序列包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列和/或所述远程AAV的VP2衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。在一些实施例中,所述非灵长类动物AAV的cap基因、所述远程AAV的所述cap基因或其组合的核苷酸序列包括对VP1衣壳蛋白或其一部分进行编码的核苷酸序列,所述核苷酸序列包括与所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列和/或所述远程AAV的VP1衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。
在一些实施例中,本发明的核酸分子包括对本发明的非灵长类动物VP3衣壳蛋白进行编码的核苷酸序列。在一些实施例中,本发明的核酸分子包括对本发明的非灵长类动物VP3衣壳蛋白和本发明的非灵长类动物VP2衣壳蛋白进行编码的核苷酸序列。在一些实施例中,本发明的核酸分子包括对本发明的非灵长类动物VP3衣壳蛋白、本发明的VP2衣壳蛋白和本发明的VP1衣壳蛋白进行编码的核苷酸序列。
在一些实施例中,本发明的核酸分子的cap基因对以下进行编码:(i)VP1衣壳蛋白,所述VP1衣壳蛋白是(a)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括VP1独特区(VP1-u),所述VP1-u包括与其它例如第二AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列,可操作地连接到包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列的VP1/VP2共同区和VP3区,或者(b)VP1衣壳蛋白,所述VP1衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的VP1衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列;(ii)VP2衣壳蛋白,所述VP2衣壳蛋白是(a)嵌合AAV VP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括VP1/VP2共同区,所述VP1/VP2共同区包括与其它例如第二AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列,可操作地连接到包括与所述非灵长类动物AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列的VP3区,或(b)VP2衣壳蛋白,所述VP2衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列;和/或(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。
在一些实施例中,本发明的核酸分子的cap基因对以下进行编码:(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括VP1独特区(VP1-u),所述VP1-u包括与其它例如AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列,可操作地连接到包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列的VP1/VP2共同区和VP3区;(ii)嵌合AAVVP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括VP1/VP2共同区,所述VP1/VP2共同区包括与其它例如AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列,可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP3区;和/或(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。
在一些实施例中,本发明的核酸分子的cap基因对以下进行编码:(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括VP1独特区(VP1-u),所述VP1-u包括与其它AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列,可操作地连接到包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列的VP1/VP2共同区和VP3区;(ii)VP2衣壳蛋白,所述VP2衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列;以及(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。
在一些实施例中,本发明的核酸分子的cap基因对以下进行编码:(i)VP1衣壳蛋白,所述VP1衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列;(ii)VP2衣壳蛋白,所述VP2衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列;和/或(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV或所述远程AAV的氨基酸序列相同或具有显著同一性例如至少95%序列同一性的氨基酸序列。
在本发明的一些核酸分子实施例中,所述其它第二AAV是灵长类动物AAV或灵长类动物AAV的组合。在一些实施例中,所述其它AAV选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13和其组合。在一些实施例中,所述其它AAV是AAV2。
在本发明的一些核酸分子实施例中,所述非灵长类动物AAV是表2中所列的非灵长类动物AAV。在一些实施例中,所述非灵长类动物AAV是禽类AAV(AAAV)、海狮AAV或鬃狮蜥AAV。在一些实施例中,所述非灵长类动物AAV是AAAV,并且任选地AAAV衣壳蛋白的核苷酸序列包括AAAV的VP1衣壳蛋白的位置I444或I580处的修饰。在一些实施例中,所述非灵长类动物AAV是有鳞目动物AAV,例如,鬃狮蜥AAV,并且任选地鬃狮蜥AAV的核苷酸序列包括鬃狮蜥AAV的VP1衣壳蛋白的位置I573或I436处的修饰。在一些实施例中,所述非灵长类动物AAV是哺乳动物AAV,例如,海狮AAV,并且任选地海狮AAV的核苷酸序列包括海狮AAV的VP1衣壳蛋白的选自由以下组成的组的位置处的修饰:I429、I430、I431、I432、I433、I434、I436、I437和A565。
本发明的核酸分子实施例可以包括选自由以下组成的组的核苷酸序列:(a)如SEQID NO:1所示的核苷酸序列;(b)如SEQ ID NO:3所示的核苷酸序列;(c)如SEQ ID NO:5所示的核苷酸序列;(d)如SEQ ID NO:7所示的核苷酸序列;(e)如SEQ ID NO:9所示的核苷酸序列;(f)如SEQ ID NO:11所示的核苷酸序列;(g)如SEQ ID NO:13所示的核苷酸序列;(h)如SEQ ID NO:15所示的核苷酸序列;(i)如SEQ ID NO:17所示的核苷酸序列;(j)如SEQ IDNO:19所示的核苷酸序列;(k)如SEQ ID NO:21所示的核苷酸序列;(l)如SEQ ID NO:23所示的核苷酸序列;(m)如SEQ ID NO:25所示的核苷酸序列;(n)如SEQ ID NO:27所示的核苷酸序列;(o)如SEQ ID NO:29所示的核苷酸序列;(p)如SEQ ID NO:31所示的核苷酸序列;(q)如SEQ ID NO:33所示的核苷酸序列;(r)如SEQ ID NO:35所示的核苷酸序列;(s)如SEQ IDNO:52所示的核苷酸序列;(t)如SEQ ID NO:54所示的核苷酸序列;(u)如SEQ ID NO:56所示的核苷酸序列;(v)如SEQ ID NO:58所示的核苷酸序列;(w)如SEQ ID NO:60所示的核苷酸序列;(x)如SEQ ID NO:62所示的核苷酸序列;(y)如SEQ ID NO:64所示的核苷酸序列;(z)如SEQ ID NO:66所示的核苷酸序列;(aa)如SEQ ID NO:68所示的核苷酸序列;(bb)如SEQID NO:70所示的核苷酸序列;(cc)与如以下所示的核苷酸序列具有至少95%同一性的核苷酸序列:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68或SEQ ID NO:70;(dd)(a)-(cc)的对VP2衣壳蛋白和/或VP3衣壳蛋白进行编码的核苷酸序列的任何部分。
在一些实施例中,核酸分子包括如SEQ ID NO:1所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:3所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:5所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:7所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQID NO:9所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:11所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:13所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:15所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:17所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:19所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:21所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:23所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:25所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:27所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:29所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQID NO:31所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:33所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:35所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:52所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:54所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:56所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:58所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:60所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:62所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:64所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:66所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQID NO:68所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。在一些实施例中,核酸分子包括如SEQ ID NO:70所示的核苷酸序列,所述核苷酸序列的一部分对VP2和/或VP3衣壳蛋白进行编码,以及简并其变体。
在一些实施例中,对本发明的VP1衣壳蛋白和本发明的任选地VP2和/或VP3衣壳蛋白进行编码的所述核苷酸序列可操作地连接到启动子。在一些实施例中,所述启动子选自以下:病毒启动子、细菌启动子、哺乳动物启动子(例如,人或非人)、禽类启动子、鱼类启动子、昆虫启动子和其任何组合。在一些实施例中,所述启动子选自p40、SV40、EF、CMV、B19p6和CAG。在一些实施例中,所述启动子是AAV p40启动子。在一些实施例中,其中所述启动子指导衣壳蛋白在包装细胞中的表达。
在一些实施例中,本发明的核酸分子的cap基因包括可操作地连接到启动子。在一些实施例中,启动子指导衣壳蛋白在包装细胞中的表达。在一些实施例中,所述启动子选自p40、SV40、EF例如EF1αCMV、B19p6和CAG。
在一些实施例中,本发明的核酸分子进一步包括对一个或多个AAV Rep蛋白进行编码的第二核苷酸序列,任选地其中所述第二核苷酸序列可操作地连接到启动子。在一些实施例中,所述一种或多种Rep蛋白是灵长类动物AAV Rep蛋白。在一些实施例中,所述一种或多种Rep蛋白是非灵长类动物AAV Rep蛋白。在一些实施例中,所述一种或多种Rep蛋白选自Rep78、Rep68、Rep52和Rep40,任选地所述一种或多种Rep蛋白包括Rep78。在一些实施例中,可操作地连接到对一种或多种AAV Rep蛋白进行编码的第二核苷酸序列的所述启动子选自病毒启动子、细菌启动子、哺乳动物启动子(例如,人或非人)、禽类启动子、鱼类启动子、昆虫启动子和其任何组合。在一些实施例中,可操作地连接到对一种或多种AAV Rep蛋白进行编码的第二核苷酸序列的所述启动子选自p19、p5、p40、SV40、EF例如EF1αCMV、B19p6和CAG。在一些实施例中,所述启动子指导衣壳蛋白在包装细胞中的表达。在一些实施例中,可操作地连接到对一种或多种AAV Rep蛋白进行编码的第二核苷酸序列的所述启动子选自p19和/或p5。
包括由来自本发明的核酸分子编码的衣壳蛋白的组合物和包装细胞也是本发明的一部分。还描述了由本发明的包装细胞表达的病毒颗粒。
在一些实施例中,用于产生本发明的AAV病毒颗粒的组合物和包装细胞包括本发明的核酸分子,例如,包括对本发明的AAV衣壳蛋白进行编码的本发明的cap基因。在一些实施例中,本发明的组合物和/或包装细胞包括本发明的核酸分子。在一些实施例中,所述cap基因包括选自由以下组成的组的核苷酸序列:如SEQ ID NO:1所示的核苷酸序列、如SEQ IDNO:3所示的核苷酸序列、如SEQ ID NO:5所示的核苷酸序列、如SEQ ID NO:7所示的核苷酸序列、如SEQ ID NO:9所示的核苷酸序列、如SEQ ID NO:11所示的核苷酸序列、如SEQ IDNO:13所示的核苷酸序列、如SEQ ID NO:15所示的核苷酸序列、如SEQ ID NO:17所示的核苷酸序列、如SEQ ID NO:19所示的核苷酸序列、如SEQ ID NO:21所示的核苷酸序列、如SEQ IDNO:23所示的核苷酸序列、如SEQ ID NO:25所示的核苷酸序列、如SEQ ID NO:27所示的核苷酸序列、如SEQ ID NO:29所示的核苷酸序列、如SEQ ID NO:31所示的核苷酸序列、如SEQ IDNO:33所示的核苷酸序列、如SEQ ID NO:35所示的核苷酸序列、如SEQ ID NO:52所示的核苷酸序列、如SEQ ID NO:54所示的核苷酸序列、如SEQ ID NO:56所示的核苷酸序列、如SEQ IDNO:58所示的核苷酸序列、如SEQ ID NO:60所示的核苷酸序列、如SEQ ID NO:62所示的核苷酸序列、如SEQ ID NO:64所示的核苷酸序列、如SEQ ID NO:66所示的核苷酸序列、如SEQ IDNO:68所示的核苷酸序列、如SEQ ID NO:70所示的核苷酸序列、对VP2衣壳进行编码的如SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ IDNO:64、SEQ ID NO:66、SEQ ID NO:68或SEQ ID NO:70所示的核苷酸序列的任何部分、对VP3衣壳进行编码的如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68或SEQ ID NO:70所示的核苷酸序列的任何部分及其任何组合。
在一些实施例中,组合物和包装细胞进一步包括核酸分子,所述核酸分子包括对一种或多种AAV Rep蛋白进行编码的rep基因,其中所述rep基因可操作地连接到启动子,任选地其中所述rep基因和所述cap基因是两种不同的AAV。在一些实施例中,可操作地连接到所述rep基因的所述启动子指导rep蛋白在所述包装细胞中的表达,例如,所述启动子选自p5、p19 SV40、EF、CMV、B19p6和CAG。在一些实施例中,所述一种或多种Rep蛋白选自Rep78、Rep68、Rep52和Rep40,任选地所述一种或多种Rep蛋白包括Rep78。在一些实施例中,所述一种或多种Rep蛋白是灵长类动物AAV Rep蛋白。在一些其它实施例中,所述一种或多种Rep蛋白是非灵长类动物AAV Rep蛋白。在一些实施例中,所述一种或多种Rep蛋白包括两者。
在一些实施例中,本发明的组合物和包装细胞进一步包括核酸分子,所述核酸分子包括所关注核苷酸的核苷酸序列,所述所关注核苷酸在至少一侧上侧接有由所述一种或多种Rep蛋白识别的至少一个AAV反向末端重复序列(ITR)。在一些实施例中,所述所关注核苷酸在另一侧上侧接有第二ITR,所述第二ITR与所述至少一个ITR的AAV相同。在一些实施例中,所述所关注核苷酸在另一侧上侧接有第二ITR,其中所述第二ITR和所述至少一个ITR的AAV不同。
在一些实施例中,本发明的组合物和/或包装细胞进一步包括核酸分子,所述核酸分子包括侧接有5'和3'AAV反向末端重复序列(ITR)的所关注核苷酸(例如,转基因的核苷酸序列)使得所述所关注病毒颗粒进一步包括基因组,所述基因组包括侧接有5'和3'AAVITR的所关注核苷酸。
在一些实施例中,本发明的组合物和/或包装细胞进一步包括对参考衣壳蛋白进行编码的核苷酸序列。
因此,在一些实施例中,本发明的组合物、包装细胞和/或病毒颗粒进一步包括从5'到3'包含以下的基因组:5'ITR、所关注核苷酸和3'ITR。在一些实施例中,所述基因组进一步包括可操作地连接到所述所关注核苷酸的启动子。在一些实施例中,所述5'和3'ITR是来自同一物种的AAV。在一些实施例中,所述5'和3'ITR是来自两种不同物种的AAV。
在一些实施例中,所关注的核苷酸为报告基因。在一些实施例中,所述报告基因对以下进行编码:β-半乳糖苷酶、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、MmGFP、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、Emerald、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合。
在一些实施例中,所述所关注核苷酸对以下进行编码:治疗性蛋白、自杀基因、抗体或其片段、CRISPR/Cas系统或其一部分、反义寡核苷酸、核酶、RNAi分子或shRNA分子。
本文描述了一种制备本发明的AAV病毒颗粒的方法,所述方法包括在足以产生病毒颗粒的条件下培养包装细胞,所述包装细胞包括(1)对一种或多种AAV Rep蛋白进行编码的至少一个核苷酸序列,例如,rep基因,和(2)对AAV VP1衣壳蛋白进行编码的第一核苷酸序列、任选地对AAV VP2衣壳蛋白进行编码的第二核苷酸序列和对非灵长类动物AAV VP3衣壳蛋白进行编码的第三核苷酸序列(例如,本发明的第一核苷酸分子、第二核苷酸分子和第三核苷酸分子)以及任选地(3)侧接有第二AAV的第一和/或第二ITR的所关注核苷酸,其中所述一种或多种AAV Rep蛋白质识别所述第二AAV的所述第一和/或第二ITR的识别位点,其中所述第三核苷酸序列对本发明的非灵长类动物AAV VP3衣壳蛋白进行编码,并且任选地其中所述第一核苷酸序列对本发明的AAV VP1衣壳蛋白进行编码和/或所述第二核苷酸序列对本发明的AAV VP2衣壳蛋白进行编码。在一些实施例中,本发明的单个cap基因包括第一核苷酸序列、第二核苷酸序列和第三核苷酸序列。在一些实施例中,单个包装质粒包括对一种或多种AAV Rep蛋白进行编码的至少一个核苷酸序列以及分别对非灵长类动物的AAVVP1衣壳蛋白、AAV VP2衣壳蛋白和AAV VP3衣壳蛋白进行编码的第一核苷酸、第二核苷酸和第三核苷酸的任何组合。
在一些实施例中,所述方法包括培养本发明的包装细胞。在一些实施例中,所述方法包括培养本发明的包括本发明的核酸分子的包装细胞,其中所述包装细胞任选地进一步包括包含所关注核苷酸的辅助质粒和/或转移质粒。
一些方法实施例进一步包括从培养上清液和/或细胞裂解物中分离自互补腺相关病毒颗粒。一些方法实施例进一步包括裂解所述包装细胞并从培养上清液和/或细胞裂解物中分离单链腺相关病毒颗粒。一些实施例进一步包括以下:a.清除细胞碎片;b.用Benzonase或DNase I和MgCl2处理含有病毒颗粒的上清液;c.使病毒颗粒浓缩;d.使所述病毒颗粒纯化;以及e.a-d的任何组合。
在一些实施例中,通过将对VP衣壳蛋白进行编码的第一cap基因和对参考VP衣壳蛋白进行编码的至少一个参考cap基因的混合物以一定比率转染到包装细胞中来产生镶嵌病毒颗粒,所述VP衣壳蛋白包括蛋白质:蛋白质结合对的第一成员。在一些实施例中,本发明的镶嵌病毒颗粒可以用经修饰的cap基因:参考cap基因的混合物产生。在一些实施例中,经修饰的cap基因对包括修饰的AAV VP1、VP2和VP3衣壳蛋白中的至少一种进行编码,例如,蛋白质:蛋白质结合对的第一成员,并且参考cap基因对除所述修饰外的与经修饰的AAVVP1、VP2和VP3衣壳蛋白中的至少一种相对应的参考衣壳蛋白进行编码。在一些实施例中,经修饰的cap基因对用蛋白质:蛋白质结合对的第一成员修饰的VP1衣壳蛋白进行编码并且参考cap基因对缺乏所述修饰的参考VP1衣壳蛋白进行编码。在一些实施例中,经修饰的cap基因对用蛋白质:蛋白质结合对的第一成员修饰的VP2衣壳蛋白进行编码并且参考cap基因对缺乏所述修饰的参考VP2衣壳蛋白进行编码。在一些实施例中,经修饰的cap基因对用蛋白质:蛋白质结合对的第一成员修饰的VP3衣壳蛋白进行编码并且参考cap基因对缺乏所述修饰的参考VP3衣壳蛋白进行编码。
通常,如本文所描述的病毒颗粒包括包含如本文所描述的病毒衣壳蛋白的病毒衣壳,包含镶嵌病毒衣壳,其中所述病毒衣壳使所关注核苷酸衣壳化。在一些实施例中,所关注的核苷酸在选自由以下组成的群组的启动子的控制下:病毒启动子、细菌启动子、哺乳动物启动子、禽类启动子、鱼类启动子、昆虫启动子和其任何组合。在一些实施例中,所关注的核苷酸在非人类启动子的控制下。在一些实施例中,启动子为巨细胞病毒(CMV)启动子。在一些实施例中,所述启动子是EF例如EF1α启动子。在一些实施例中,所述启动子是CAG启动子。在一些实施例中,启动子为泛素C(UbC)启动子。
一般来说,所关注的核苷酸可为一种或多种基因,其可编码可检测标记,例如报告子,或治疗性多肽。在一些实施例中,所关注的核苷酸为报告基因。在一些实施例中,所关注的核苷酸为编码选自由以下组成的群组的可检测标记的报告基因:绿色荧光蛋白、荧光素酶、β-半乳糖苷酶等。在一些实施例中,可检测标记为绿色荧光蛋白。在其它实施例中,所关注的核苷酸选自由以下组成的群组:自杀基因、编码抗体或其片段的核苷酸、编码CRISPR/Cas系统或其部分的核苷酸、编码反义RNA的核苷酸、编码siRNA的核苷酸、分泌酶、编码治疗蛋白的基因等。在一个实施例中,所关注的核苷酸编码多域治疗剂,例如包括至少两个提供两种相异功能的域的蛋白质。
本文所描述的组合物通常包括包含如本文所描述的病毒衣壳蛋白的病毒颗粒,例如包括包含所述病毒衣壳蛋白的衣壳(包含镶嵌衣壳),其中所述衣壳使所关注核苷酸衣壳化。在一些实施例中,本文所描述的组合物包括(1)具有包括本文所描述的病毒衣壳蛋白的衣壳的病毒颗粒,以及(2)药学上可接受的载体。
本文还描述了使用病毒衣壳蛋白、包括所述病毒衣壳蛋白的病毒颗粒、组合物等的方法。在一些实施例中,所述方法包括使靶细胞(所述靶细胞可以在体外(例如,离体)或体内,例如,在人体内)与包括如本文所描述的病毒衣壳蛋白的病毒颗粒接触,其中所述病毒衣壳或病毒颗粒包括特异性地结合在所述靶细胞的表面上表达的蛋白质的靶向配体。
如本文所描述的病毒颗粒特别适于将所关注核苷酸靶向引入到特定细胞,因为本文所描述的病毒衣壳蛋白包括蛋白质:蛋白质结合对的第一成员到其同源第二成员,所述同源第二成员任选地连接到靶向配体。在一些实施例中,靶向配体可操作地连接于蛋白质(第二成员),例如与蛋白质融合,任选地通过接头。在一些实施例中,靶向配体可以是结合部分,例如,天然配体、抗体、多特异性结合分子等。在一些实施例中,靶向配体为抗体或其部分。在一些实施例中,靶向配体为包括结合靶细胞上的细胞表面蛋白的可变域和重链恒定域的抗体。在一些实施例中,靶向配体为包括结合靶细胞上的细胞表面蛋白的可变域和IgG重链恒定域的抗体。在一些实施例中,所述靶向配体是包括结合靶细胞上的细胞表面蛋白质的可变结构域和IgG重链恒定结构域的抗体,其中所述IgG重链恒定结构域例如通过接头可操作地连接到与所述第一成员形成异肽共价键的蛋白质(例如,蛋白质:蛋白质结合对的第二成员)。在一些实施例中,本文所描述的衣壳蛋白包括:第一成员,所述第一成员包括可操作地连接到所述病毒衣壳蛋白的SpyTag并共价地连接到所述SpyTag;第二成员,所述第二成员包括连接到包括抗体可变结构域和IgG重链结构域的靶向配体的SpyCatcher,其中SpyCatcher和所述IgG重链结构域通过氨基酸接头连接,例如,GSGESG(SEQ ID NO:49)。在一些实施例中,所述第二成员包括如SEQ ID NO:47所示的序列,其包括人IgG4重链的一部分,所述IgG4部分具有如SEQ ID NO:51所示的序列,通过接头(SEQ ID NO:49)连接到SpyCatcher(SEQ ID NO:43)。
一般来说,靶向配体特异性结合在哺乳动物(例如人类)真核细胞,例如靶细胞的表面上表达的细胞表面分子,例如低聚糖、受体、细胞表面标记等。
附图说明
图1提供了本发明的可以用于产生AAV嵌合病毒颗粒的Rep-Cap表达质粒的说明性(未按比例)非限制性和示例性实施例。灵长类动物AAV序列显示为未填充框并且非灵长类动物AAV序列显示在填充框中。仅出于说明目的,还描绘了用于以下的插入的示例性非限制性位置(未按比例):(1)用于指导包括经编码的VP1、VP2和VP3蛋白的组装衣壳的趋向性的蛋白质:蛋白质结合对的第一成员(非灵长类动物AAV的衣壳序列内的实线)和(2)用于检测经编码的VP1、VP2和VP3蛋白的可检测标记(非灵长类动物AAV的衣壳序列内的虚线)。如图1中所示的Rep-Cap表达质粒可以用于产生AAV病毒颗粒,所述AAV病毒颗粒包括侧接有灵长类动物AAV的5'和3'反向末端重复序列(ITR)的所关注核苷酸。
图2提供了使用B1抗体的蛋白质印迹,所述B1抗体识别被工程化到嵌合灵长类/非灵长类动物AAV cap基因(参见图1)中的B1表位,以分析所得嵌合灵长类/非灵长类动物AAVVP1蛋白、非灵长类动物AAV VP2蛋白和非灵长类动物AAV VP3蛋白。灵长类动物AAV是AAV2并且非灵长类动物AAV是(A)禽类AAV、(B)海狮AAV或(C)鬃狮蜥AAV。蛋白质印迹分析了在通过亲和色谱法纯化AAV颗粒的各个步骤期间收集的蛋白质样品,所述蛋白质样品包含输入样品、流通(FT)级分和来自亲和色谱柱的洗脱级分。
图3A提供了非限制性预测的禽类AAV VP3带状结构,突出显示了作为蛋白质:蛋白质结合对的第一成员的非限制性插入位点的K580和G444。图3B提供了从一组以下的粗病毒制剂中获得的病毒滴度的qPCR定量:无SpyTag或在指定位置处包括SpyTag插入的嵌合AAV2/禽类AAV病毒颗粒,或者包含无SpyTag的AAV2/禽类AAV颗粒与在指定位置处带有SpyTag肽插入的AAV2/禽类AAV颗粒的混合物的镶嵌颗粒。图3C提供了使用B1抗体的蛋白质印迹,所述B1抗体识别被工程化到嵌合AAV2/禽类AAV VP1、VP2和VP3衣壳蛋白中的线性表位,所述蛋白质印迹分析了与SpyCatcher融合的抗ASGR1抗体“SpyC-抗ASGR1 mAb”与一组以下之间的反应:缺乏或在指定位置处带有SpyTag插入的嵌合AAV2/禽类AAV病毒颗粒,或包括缺乏SpyTag的嵌合AAV2/禽类AAV颗粒与在指定位置处带有SpyTag肽插入的嵌合AAV2/禽类AAV颗粒的混合物的镶嵌颗粒。
图4A提供了非限制性预测的海狮AAV VP3带状结构,突出显示了作为蛋白质:蛋白质结合对的第一成员的非限制性插入位点的A565和G432。图4B提供了从一组以下的粗病毒制剂中获得的病毒滴度的qPCR定量:无SpyTag或在指定位置处包括SpyTag插入的嵌合AAV2/海狮AAV病毒颗粒,或者包含无SpyTag的AAV2/海狮AAV颗粒与在指定位置处带有SpyTag肽插入的AAV2/海狮AAV颗粒的混合物的镶嵌颗粒。图4C提供了使用B1抗体的蛋白质印迹,所述B1抗体识别被工程化到嵌合AAV2/海狮AAV VP1、VP2和VP3衣壳蛋白中的线性表位,所述蛋白质印迹分析了与SpyCatcher融合的抗HER2抗体“SpyC-抗HER2 mAb”
Figure BDA0003675143090000501
与一组以下之间的反应:缺乏或在指定位置处带有SpyTag插入的AAV2/海狮AAV病毒颗粒,或包括缺乏SpyTag的嵌合AAV2/海狮AAV颗粒与在指定位置处带有SpyTag肽插入的嵌合AAV2/海狮AAV颗粒的混合物的镶嵌AAV2/海狮AAV颗粒。
图5提供了(A)从无SpyTag或在指定位置处带有SpyTag插入的一组AAV2/海狮AAV病毒颗粒的粗病毒制剂中获得的病毒滴度的qPCR定量,和(B)使用B1抗体的蛋白质印迹,所述B1抗体识别被工程化到嵌合AAV2/海狮AAV VP1、VP2和VP3衣壳蛋白中的线性表位,所述蛋白质印迹分析了与SpyCatcher融合的抗HER2抗体“SpyC-mAb”
Figure BDA0003675143090000502
与无SpyTag或在指定位置处带有SpyTag插入的一组海狮AAV病毒颗粒之间的反应。
图6A提供了非限制性预测的鬃狮蜥AAV VP3带状结构,突出显示了作为蛋白质:蛋白质结合对的第一成员的非限制性插入位点的T573和G436。图6B提供了从一组以下的粗病毒制剂中获得的病毒滴度的qPCR定量:无SpyTag或在指定位置处包括SpyTag插入的嵌合AAV2/鬃狮蜥AAV病毒颗粒,或者包含无SpyTag的AAV2/鬃狮蜥AAV颗粒与在指定位置处带有SpyTag肽插入的AAV2/鬃狮蜥AAV颗粒的混合物的镶嵌颗粒。图6C提供了使用B1抗体的蛋白质印迹,所述B1抗体识别被工程化到嵌合AAV2/鬃狮蜥AAV VP1、VP2和VP3衣壳蛋白中的线性表位,所述蛋白质印迹分析了与SpyCatcher融合的抗HER2抗体“SpyC-抗HER2 mAb”
Figure BDA0003675143090000511
与一组以下之间的反应:缺乏或在指定位置处带有SpyTag插入的AAV2/鬃狮蜥AAV病毒颗粒,或包括缺乏SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒与在指定位置处带有SpyTag肽插入的嵌合AAV2/鬃狮蜥AAV颗粒的混合物的镶嵌AAV2/鬃狮蜥AAV颗粒。
图7A提供了从通过感染无SpyTag的嵌合AAV2/AAAV颗粒、嵌合AAV2/AAAV G444接头6SpyTag颗粒或嵌合AAV2/AAAV K580接头6SpyTag颗粒的HER2-阳性(+)293hErbB2细胞评估绿色荧光蛋白(GFP)表达的流式细胞术获得的散点图。嵌合AAV2/AAAV G444接头6SpyTag颗粒和嵌合AAV2/AAAV K580接头6SpyTag颗粒与通过SpyTag(SEQ ID NO:42)与SpyCatcher(SEQ ID NO:43)融合的针对GLP1R的无关同种型对照抗体或抗HER2抗体
Figure BDA0003675143090000512
缀合。病毒表达作为转导标记的GFP。图7B提供了从通过感染无SpyTag的嵌合AAV2/AAAV颗粒或嵌合AAV2/AAAV K580接头6SpyTag颗粒的亲代ASGR1-阴性(-)293细胞或ASGR1-阳性(+)293hASGR1细胞评估绿色荧光蛋白(GFP)表达的流式细胞术获得的散点图。嵌合AAV2/AAAV K580接头6SpyTag颗粒与通过SpyTag与SpyCatcher融合的针对GLP1R的无关同种型对照抗体缀合,或与通过SpyTag特异性地结合ASGR1的SpyCatcher融合抗体结合。病毒表达作为转导标记的GFP。
图8A提供了从通过感染无SpyTag的嵌合AAV2/海狮颗粒或嵌合AAV2/海狮G432接头6SpyTag颗粒的HER2-阳性(+)293hErbB2或HER2-阴性(-)293亲代细胞评估绿色荧光蛋白(GFP)表达的流式细胞术获得的散点图。嵌合AAV2/海狮G432接头6SpyTag颗粒与通过SpyTag与SpyCatcher融合的针对GLP1R的无关同种型对照抗体缀合,或与通过SpyTag与SpyCatcher(SEQ ID NO:43)融合的抗HER2抗体
Figure BDA0003675143090000521
缀合。病毒表达作为转导标记的GFP。图8B提供了从通过感染无SpyTag的嵌合AAV2/海狮颗粒的ASGR1-阳性(+)293hASGR1或ASGR1-阴性(-)293亲代细胞或感染嵌合AAV2/海狮G432接头6SpyTag颗粒的细胞评估绿色荧光蛋白(GFP)表达的流式细胞术获得的散点图。嵌合AAV2/海狮G432接头6SpyTag颗粒与通过SpyTag与SpyCatcher融合的针对GLP1R的无关同种型对照抗体缀合,或与通过SpyTag特异性地结合ASGR1的SpyCatcher融合抗体缀合。病毒表达作为转导标记的GFP。
图9提供了从通过感染无SpyTag或在指定位置处包括SpyTag插入的AAV2/海狮AAV颗粒的一组嵌合AAV2/海狮AAV病毒颗粒的HER2-阳性(+)293评估绿色荧光蛋白(GFP)表达的流式细胞术获得的散点图。插入到嵌合AAV2/海狮颗粒中的SpyTag与通过SpyTag与SpyCatcher(SEQ ID NO:43)融合的抗HER2抗体
Figure BDA0003675143090000522
缀合。病毒表达作为转导标记的GFP。
图10A提供了从通过“未感染”或感染缺乏SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒、嵌合AAV2/鬃狮蜥T573接头6SpyTag镶嵌颗粒或嵌合AAV2/鬃狮蜥G436接头6SpyTag镶嵌颗粒的HER2-阳性(+)293hErbB2细胞评估绿色荧光蛋白(GFP)表达的流式细胞术获得的散点图。嵌合AAV2/鬃狮蜥T573接头6SpyTag镶嵌颗粒和嵌合AAV2/鬃狮蜥G436接头6SpyTag镶嵌颗粒与通过SpyTag与SpyCatcher(SEQ ID NO:43)融合的抗HER2抗体
Figure BDA0003675143090000523
缀合。病毒表达作为转导标记的GFP。图10B提供了从通过感染无SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒、嵌合AAV2/鬃狮蜥T573接头6SpyTag颗粒或嵌合AAV2/鬃狮蜥T573接头6SpyTag抗ASGR1颗粒的ASGR1-阳性(+)293hASGR1细胞或ASGR1-阴性(-)293亲代细胞评估绿色荧光蛋白(GFP)表达的流式细胞术获得的散点图。嵌合AAV2/鬃狮蜥T573接头6SpyTag抗ASGR1颗粒与通过SpyTag特异性地结合ASGR1的SpyCatcher融合抗体缀合。病毒表达作为转导标记的GFP。
图11A提供了通过在存在经纯化的人IgG的指定浓度的情况下在感染“AAV2抗ASGR1”颗粒、嵌合AAV2/AAAV抗ASGR1颗粒或嵌合AAV2/海狮AAV抗ASGR1颗粒之后的hASGR1阳性(+)细胞评估Nanoluc报告基因表达的Nanoluc荧光素酶测定的结果。所有颗粒均与通过SpyTag特异性地结合ASGR1的SpyCatcher融合抗体缀合。病毒表达作为转导的标志物的Nanoluc。图11B提供了图11A中图表的定量,但相对于“仅PBS”条件归一化。图11C提供了中和指定病毒50%所需的IgG浓度的IC50值表。
图12提供了(A)静脉内注射磷酸盐缓冲盐水(PBS)或5.0×1011病毒基因组(vg)/动物的SpyTagged嵌合AAV2/AAAV颗粒后33天的肝细胞(ASGR1人源化小鼠)上表达人ASGR1的经基因修饰的小鼠的发光图像,所述SpyTagged嵌合AAV2/AAAV颗粒携带所关注萤火虫荧光素酶核苷酸,并经(1)SpyCatcher-抗人ASGR1抗体或(2)SpyCatcher-抗人GLP1R抗体(对照mAb)修饰。病毒表达作为转导标记的萤火虫荧光素酶。使用异氟醚将小鼠麻醉,注射荧光素底物,并使用IVIS光谱体内成像系统(珀金埃尔默公司(PerkinElmer))在10分钟后成像;(B)对图A中描绘的发光图像内的单个动物的平均辐射率进行了定量;以及(C)对图A中描绘的来自动物的解剖的器官(肝和肺)的平均辐射率进行了定量。
图13提供了(A)静脉内注射磷酸盐缓冲盐水(PBS)或5.0×1011病毒基因组(vg)/动物的SpyTagged嵌合AAV2/海狮AAV颗粒后33天的肝细胞(ASGR1人源化小鼠)上表达人ASGR1的经基因修饰的小鼠的发光图像,所述SpyTagged嵌合AAV2/海狮AAV颗粒携带所关注萤火虫荧光素酶核苷酸,并经(1)SpyCatcher-抗人ASGR1抗体或(2)SpyCatcher-抗人GLP1R抗体(对照mAb)修饰。病毒表达作为转导的标志物的萤火虫荧光素酶。使用异氟醚将小鼠麻醉,注射荧光素底物,并使用IVIS光谱体内成像系统(珀金埃尔默公司)在10分钟后成像;(B)对图A中描绘的发光图像内的单个动物的平均辐射率进行了定量;(C)对图A中描绘的来自动物的解剖器官(肝和肺)的平均辐射率进行了定量。
图14提供了感染缺乏SpyTag的嵌合AAV2/海狮AAV颗粒后3天的新生小鼠的柯蒂氏外植体培养物(corti explant culture)内耳器官的免疫荧光图像。病毒表达作为转导的标志物的GFP(绿色),并且毛细胞用检测Myo7a的抗体标记(红色)。
图15A提供了包括B1表位的修饰的AAV2或AAV2/海狮嵌合序列的C端16个氨基酸的比对,所述B1表位的修饰完全置换所述B1表位或仅在730残基处用同源海狮AAV序列置换所述B1表位。展示了B1单克隆抗体表位。图15B提供了从无SpyTag,或无SpyTag且包括B1表位的修饰的嵌合AAV2/海狮AAV颗粒的经纯化的病毒制剂中获得的病毒滴度的qPCR定量,所述B1表位的修饰完全置换所述B1表位或仅在730残基处用同源海狮AAV序列置换所述B1表位。图15C提供了使用分析无SpyTag,或无SpyTag且包括B1表位的修饰的嵌合AAV2/海狮AAV颗粒的VP1、VP2和VP3衣壳蛋白的表达的SYPRO Ruby的蛋白质凝胶染色,所述B1表位的修饰完全置换所述B1表位或仅在730残基处用同源海狮AAV序列置换所述B1表位。图15D提供了从以不同的感染倍数(MOI)感染无SpyTag,或无SpyTag且包括B1表位的修饰的嵌合AAV2/海狮AAV颗粒的HEK293T细胞裂解物的NanoLuc荧光素酶表达的发光评估中获得XY绘图,所述B1表位的修饰完全置换所述B1表位或仅在730残基处用同源海狮AAV序列置换所述B1表位。病毒表达作为转导的标志物的NanoLuc荧光素酶。
图16提供了来自静脉内注射磷酸盐缓冲盐水(PBS)或5.0×1011病毒基因组(vg)/动物的嵌合AAV2/海狮AAV颗粒后34天的小鼠的解剖器官的平均辐射率的定量,所述嵌合AAV2/海狮AAV颗粒携带所关注萤火虫荧光素酶核苷酸,并且通过无SpyTag进行修饰,或无SpyTag且包括B1表位的修饰,所述B1表位的修饰完全置换所述B1表位或仅在残基730处用同源海狮AAV序列置换所述B1表位。病毒表达作为转导的标志物的萤火虫荧光素酶。使用异氟醚将小鼠麻醉,注射荧光素底物且在10分钟后使用IVIS Spectrum In Vivo ImagingSystem(PerkinElmer)成像。
图17提供了本发明的可以用于产生AAV嵌合病毒颗粒的Rep-Cap表达质粒的说明性(未按比例)非限制性和示例性实施例。灵长类动物AAV序列显示为未填充框并且海狮AAV序列显示在填充框中。仅出于说明目的,还描绘了用于以下的示例性非限制性位置(未按比例):(1)灵长类动物与海狮衣壳序列之间的交替界面位置(灵长类动物AAV的衣壳序列内的黑色虚线)和(2)用于检测经编码的VP1、VP2和VP3蛋白的可检测标记(非灵长类动物AAV的衣壳序列内的虚线)。如图17中所示的Rep-Cap表达质粒可以用于产生AAV病毒颗粒,所述AAV病毒颗粒包括侧接有灵长类动物AAV的5'和3'反向末端重复序列(ITR)的所关注核苷酸。
图18A提供了从无SpyTag且包括AAV2与海狮衣壳序列之间的交替界面位置的嵌合AAV2/海狮AAV颗粒的经纯化的病毒制剂中获得的病毒滴度的qPCR定量。从细胞裂解物(v2-v4)或细胞裂解物和培养基(v5)两者中纯化制剂。图18B和图18C提供了从以不同的感染倍数(MOI)感染无SpyTag且具有AAV2与海狮衣壳序列之间的交替界面位置的AAV2/海狮AAV颗粒的HEK293T细胞裂解物的NanoLuc荧光素酶表达的发光评估中获得的XY绘图。AAV2/海狮AAV无SpyTag的历史数据集用作参考。病毒表达作为转导的标志物的NanoLuc荧光素酶。图18D提供了来自静脉内注射磷酸盐缓冲盐水(PBS)或5.0×1011病毒基因组(vg)/动物的AAV2/海狮AAV颗粒后56天的小鼠的解剖的器官的平均辐射率的定量,所述AAV2/海狮AAV颗粒携带所关注萤火虫荧光素酶核苷酸,并且通过无SpyTag进行修饰,或无SpyTag且无B1表位,所述B1表位的修饰在有或没有AAV2与海狮衣壳序列之间的交替界面位置的情况下被同源海狮AAV序列完全置换。病毒表达作为转导标记的萤火虫荧光素酶。使用异氟醚将小鼠麻醉,注射荧光素底物且在10分钟后使用IVIS Spectrum In Vivo Imaging System(PerkinElmer)成像。
具体实施方式
尽管近年来通过AAV基因疗法靶向特定细胞的重组方法有所改进,但目前用于开发AAV的重组方法仍然存在逃避预先存在的可能是在生命早期发育的抗体的检测和/或中和问题。本文描述了一种方法,所述方法利用(1)非灵长类动物AAV或远程AAV感染灵长类细胞的自然能力,(2)人类中缺乏针对非灵长类动物AAV衣壳蛋白的NAb,以及如果需要或必要的话(3)将蛋白质:蛋白质结合对的第一成员的适应性工程化到AAV衣壳蛋白中,以用于产生可用于定向基因疗法的AAV病毒颗粒,例如,将所关注核苷酸引入到所关注特定细胞。本文所描述的是核苷酸分子,所述核苷酸分子包括至少一种根据其期望的功能利用的AAVcap基因。本发明的核苷酸分子包括来自非灵长类动物和/或远程AAV的cap基因或其一部分(用于生产不易被预先存在的NAb识别的病毒衣壳)。非灵长类动物AAV的cap基因或其一部分可以用蛋白质:蛋白质结合对的第一成员进行修饰,包括靶向配体的第二成员可以与所述第一成员结合并指导所得AAV病毒颗粒的趋向性。
对于那些不能感染灵长类动物细胞的非灵长类动物AAV或远程AAV,cap基因可以被设计成嵌合cap基因,所述嵌合cap基因对灵长类动物AAV VP1衣壳蛋白的至少磷脂酶A2(PLA2)结构域和非人灵长类动物AAV或远程AAV的VP3衣壳蛋白的至少一部分进行编码。PLA2结构域由VP1衣壳蛋白(更具体地VP1衣壳的VP1独特(VP1-u)区)携带,并且被认为在AAV感染期间通过介导病毒基因组从晚期核内体/溶酶体转移到细胞核以启动复制而起重要作用(Zadori等人,2001,《发育细胞(Dev Cell)》,1(2):291-302)。VP3衣壳蛋白是AAV病毒颗粒的主要表面衣壳蛋白,并且因此,包括非灵长类动物AAV或远程AAV的VP3衣壳蛋白的至少一部分的病毒衣壳不太可能在灵长类动物AAV感染过程期间被针对从灵长类动物分离的AAV血清型产生的NAb识别。
图1提供了包括灵长类动物AAV的rep基因和嵌合cap基因的核酸分子的非限制性描述。对于那些能够感染灵长类动物细胞的非灵长类动物人AAV远程AAV,灵长类动物AAV的rep基因可以可操作地连接到如本文所描述的嵌合cap基因或非灵长类动物AAV的cap基因。本文的实例表明,当在具有辅助质粒和携带所关注核苷酸的灵长类动物AAV基因组的包装细胞系中表达时,此类核酸分子能够对适当的复制蛋白和衣壳蛋白进行编码,其功能是将灵长类动物AAV基因组分别复制到能够在体内感染细胞的病毒颗粒中并衣壳化为所述病毒颗粒。此外,实例表明,通过使用蛋白质:蛋白质结合对的第一成员和第二成员,此类AAV病毒颗粒的趋向性容易适应,并且此外,插入蛋白质:蛋白质结合对的第一成员和第二成员不会增加从针对灵长类动物AAV感染产生的NAb识别的可能性。因此,本文提供基因修饰的病毒粒子、包括其的组合物以及其制备和使用方法。
除非另外定义,否则本文使用的所有技术和科学术语都具有与本发明所属领域的普通技术人员通常所理解相同的含义。
除非上下文明确地另外指明,否则单数形式“一”和“所述”包括复数个指代物。因此,例如提及“一种方法”包括本文所述类型的和/或在阅读本公开后对所属领域的技术人员将变得显而易见的一种或多种方法和/或一个或多个步骤。
对于氨基酸或核苷酸序列,在蛋白质的全长或其一部分上,可以容易地确定“百分比(%)同一性”等。一部分的长度可以分别为至少约5个氨基酸或24个核苷酸,并且可以分别为至多约700个氨基酸或2100个核苷酸。通常,当提及两种不同的腺相关病毒之间的“同一性”、“同源性”或“类似性”时,参考“比对”序列来确定“同一性”、“同源性”或“类似性”。“比对”序列或“比对”是指与参考序列相比,通常含有对丢失的或另外的碱基或氨基酸的校正的多个核酸序列或蛋白质(氨基酸)序列。
可以使用多种公开或可商购获得的多序列比对程序中的任一种进行比对。序列比对程序可用于氨基酸序列,所述程序例如“Clustal X”、“MAP”、“PIMA”、“MSA”、“BLOCKMAKER”“MEME”以及“Match-Box”程序。通常,这些程序中的任何程序以默认设置使用,尽管本领域技术人员可以根据需要改变这些设置。可替代地,本领域技术人员可以利用另一种算法或计算机程序,所述算法或程序提供至少与通过参考算法和程序所提供的一样水平的同一性或比对。参见例如J.D.Thomson等人,《核酸研究(Nucl.acid Res.)》,“多个序列比对的全面比较(A comprehensive comparison of multiple sequencealignments)”,27(13):2682-2690(1999)。
多个序列比对程序也可用于核酸序列。此类程序的实例包含“Clustal W”、“CAP序列组装”、“MAP”和“MEME”,所述程序可通过因特网上的Web服务器进行访问。此类程序的其它来源是本领域技术人员已知的。可替代地,也使用了载体NTI实用程序。也存在本领域已知的可以用于测量核苷酸序列同一性的多种算法,包含上述程序中包含的那些。作为另一个实例,可以使用GCG 6.1版本的程序FASTATM比较多核苷酸序列。FastaTM提供了查询序列与搜索序列之间的最佳重叠区的比对和百分比序列同一性。例如,核酸序列之间的序列同一性百分比可以是使用如GCG 6.1版本中所提供的采用其默认参数(字号6和评分矩阵的NOPAM系数)的FASTATM所测定的,所述程序通过引用并入本文中。
“显著同一性”涵盖至少90%、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或例如至少100%相同的氨基酸或核酸序列比对。
术语“嵌合”涵盖功能性基因或多肽,所述功能性基因或多肽分别包括来自至少两个不同生物体的核酸序列或氨基酸序列,例如,至少第一AAV和至少第二AAV的基因或多肽的一部分,其中至少第一部分和至少第二部分可操作地连接。除非指定为嵌合的,否则核苷酸序列、基因、多肽和氨基酸被认为是非嵌合的,例如,包括仅单个生物体的核酸序列或氨基酸序列,例如,单个AAV。
术语“抗体”包含包括通过二硫键相互连接的四条多肽链(两条重链(H)和两条轻链(L))的免疫球蛋白分子。每条重链包括重链可变域(VH)和重链恒定区(CH)。重链恒定区包括至少三个域CH1、CH2、CH3和任选地CH4。每条轻链包括轻链可变域(CH)和轻链恒定区(CL)。重链和轻链可变域可以进一步细分成高变区,称为互补决定区(CDR),其间穿插有保守性更高的区域,称为构架区(FR)。每个重链和轻链可变域包含三个CDR和四个FR,其从氨基端到羧基端按以下顺序排列:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4(重链CDR可以缩写为HCDR1、HCDR2和HCDR3;轻链CDR可以缩写为LCDR1、LCDR2和LCDR3。典型的四聚体抗体结构包括两个相同的抗原结合结构域,抗原结合域中的每一个由VH和VL结构域缔合形成,并且抗原结合域中的每一个与相应CH和CL结构域一起形成抗体Fv区。单结构域抗体包括单个抗原结合结构域,例如,VH或VL。抗体的抗原结合结构域,例如,识别并结合到抗原的特异性结合对的第一成员的抗体的一部分也被称为“互补位”。其是抗体的Fv区的小区域(5个到10个氨基酸),片段抗原结合的一部分(Fab区),并且可以含有抗体的重链和/或轻链的一部分。当互补位以高亲和力结合特异性结合对的第一成员时,互补位特异性地结合特异性结合对的第一成员。术语“高亲和力”抗体是指相对于其特异性结合对的靶第一成员,KD为约10-9M或更低(例如,约1×10-9M、1×10-10M、1×10-11M或约1×10-12M)的抗体。在一个实施例中,通过表面等离子体共振,例如BIACORETM测量KD;在另一实施例中,通过ELISA测量KD
短语“互补决定区”或术语“CDR”包含由生物体的免疫球蛋白基因的核酸序列编码的氨基酸序列,其通常(即在野生型动物中)出现在免疫球蛋白分子(例如抗体或T细胞受体)的轻链或重链的可变区中的两个构架区之间。CDR可由例如种系序列或者重排或未重排序列,以及例如未处理或成熟的B细胞或T细胞编码。CDR可为体细胞突变的(例如,不同于动物的种系中编码的序列)、人源化的和/或用氨基酸取代、添加或缺失修饰的。在一些情况下(例如对于CDR3),CDR可由两个或更多个序列(例如,种系序列)编码,所述两个或更多个序列是不邻接的(例如,未重排的核酸序列中),但在B细胞核酸序列中是邻接的,例如由于剪接或连接序列(例如,V-D-J重组以形成重链CDR3)。
短语“轻链”包含来自任何生物体的免疫球蛋白轻链序列,并且除非另有说明,否则包含人类κ和λ轻链和VpreB以及替代轻链。除非另外说明,否则轻链可变域通常包括三个轻链CDR和四个构架(FR)区。通常,全长轻链从氨基端到羧基端包括可变域和轻链恒定区,所述可变域包括FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4。轻链可变域由轻链可变区基因序列编码,所述基因序列一般包括源自种系中存在的V和J区段储库的VL和JL区段。各种生物体的V和J轻链区段的序列、位置和命名法可见于IMGT数据库www.imgt.org中。轻链包含例如不选择性结合特异性结合对的第一或第二第一成员的那些,所述成员由它们在其中出现的特异性结合对结合蛋白的第一成员选择性结合。轻链还包含结合且识别特异性结合对的一个或多个第一成员,或帮助重链或另一轻链结合且识别所述一个或多个第一成员的那些,所述一个或多个第一成员由它们在其中出现的特异性结合对结合蛋白的第一成员选择性结合。常用或通用的轻链包含衍生自人类Vκ1-39Jκ基因或人类Vκ3-20Jκ基因的那些,且包含其体细胞突变的(例如亲和力成熟的)型式。示例性人VL片段包含人Vκ1-39基因区段、人Vκ3-20基因区段、人Vλ1-40基因区段、人Vλ1-44基因区段、人Vλ2-8基因区段、人Vλ2-14基因区段和人Vλ3-21基因区段,并且包含其体细胞突变(例如,亲和力成熟)版本。可制备包括来自一种生物体(例如人类或啮齿类动物,例如大鼠或小鼠;或禽类,例如鸡)的可变域和来自相同或不同生物体(例如人类或啮齿类动物,例如大鼠或小鼠;或禽类,例如鸡)的恒定区的轻链。
术语“约”或“大致”包含在值的统计上有意义的范围内。此类范围可在一定数量级内,优选在给定值或范围的50%内,更优选在20%内,更优选在10%内,且更优选在5%内。术语“约”或“大致”涵盖的可允许的变化取决于研究的特定系统,并且所属领域的普通技术人员可容易地理解。
短语“重链”或“免疫球蛋白重链”包含来自任何生物体的免疫球蛋白重链序列,包含免疫球蛋白重链恒定区序列。除非另外说明,否则重链可变结构域包括三个重链CDR和四个FR区。重链的片段包括CDR、CDR和FR以及其组合。典型重链在可变域之后具有(从N端到C端)CH1结构域、铰链、CH2结构域和CH3结构域。重链的功能片段包含能够特异性识别特异性结合对的第一成员(例如以微摩尔、纳摩尔或皮摩尔范围内的KD识别特异性结合对的第一成员),即能够由细胞表达和分泌,且包括至少一个CDR的片段。重链可变结构域由可变区核苷酸序列编码,所述可变区核苷酸序列通常包括源自存在于种系中的VH、DH和JH区段库的VH、DH和JH区段。用于各种生物体的V、D和J重链区段的序列、位置和命名法可在IMGT数据库中找到,所述数据库可通过万维网(www)上的因特网以URL“imgt.org”访问。
术语“仅重链的抗体”、“仅重链的抗原结合蛋白”、“单域抗原结合蛋白”、“单域结合蛋白”等是指包括免疫球蛋白样链的单体或同型二聚免疫球蛋白分子,所述免疫球蛋白样链包括可操作地连接于重链恒定区的可变域,重链恒定区不能与轻链结合,因为其通常缺乏功能性CH1域。因此,术语“仅重链的抗体”、“仅重链的抗原结合蛋白”、“单域抗原结合蛋白”、“单域结合蛋白”等涵盖(i)包括免疫球蛋白样链中的一条的单体单域抗原结合蛋白,所述免疫球蛋白样链包括可操作地连接于缺少功能性CH1域的重链恒定区的可变域,或(ii)包括两条免疫球蛋白样链的同型二聚单域抗原结合蛋白,每条免疫球蛋白样链包括可操作地连接于缺少功能性CH1域的重链恒定区的可变域。在各种方面中,同型二聚单域抗原结合蛋白包括两条相同的免疫球蛋白样链,每条免疫球蛋白样链包括可操作地连接于缺少功能性CH1域的相同重链恒定区的相同可变域。另外,单结构域抗原结合蛋白的每条免疫球蛋白样链包括可变结构域,所述可变结构域可以源自重链可变区基因区段(例如,VH、DH、JH)、轻链基因区段(例如,VL、JL)或其组合,连接到重链恒定区(CH)基因序列,所述CH基因序列包括重链恒定区基因的CH1编码序列(和任选地铰链区)中的缺失或失活性突变,例如,IgG、IgA、IgE、IgD或其组合。包括衍生自重链基因区段的可变域的单域抗原结合蛋白可称为“VH单域抗体”或“VH单域抗原结合蛋白”,参见例如美国专利第8,754,287号;美国专利公开案第20140289876号;第20150197553号;第20150197554号;第20150197555号;第20150196015号;第20150197556号;和第20150197557号,其中的每一个以全文引用的方式并入。包括衍生自轻链基因区段的可变域的单域抗原结合蛋白可称为或“VL单域抗原结合蛋白”,参见例如以全文引用的方式并入的美国公开案第20150289489号。
短语“轻链”包含来自任何生物体的免疫球蛋白轻链序列,且除非另有说明,否则包含人类kappa(κ)和lambda(λ)轻链和VpreB以及替代轻链。除非另外说明,否则轻链可变域通常包括三个轻链CDR和四个构架(FR)区。一般地,全长轻链从氨基末端到羧基末端包括可变结构域和轻链恒定区,所述可变结构域包含FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4和轻链恒定区氨基酸序列。轻链可变结构域由轻链可变区核苷酸序列编码,所述轻链可变区核苷酸序列一般包含源自种系中存在的轻链V和J基因区段储库的轻链VL和轻链JL基因区段。用于各种生物体的轻链V和J基因区段的序列、位置和命名法可在IMGT数据库中找到,所述数据库可通过万维网(www)上的因特网以URL“imgt.org”访问。轻链包含例如不选择性结合特异性结合对的第一或第二第一成员的那些,所述成员由它们在其中出现的特异性结合对结合蛋白的第一成员选择性结合。轻链还包含结合且识别特异性结合对的一个或多个第一成员,或帮助重链结合且识别所述一个或多个第一成员的那些,所述一个或多个第一成员由它们在其中出现的特异性结合对结合蛋白的第一成员选择性结合。轻链还包含结合且识别特异性结合对的一个或多个第一成员,或帮助重链结合且识别所述一个或多个第一成员的那些,所述一个或多个第一成员由它们在其中出现的特异性结合对结合蛋白的第一成员选择性结合。常用或通用的轻链包含衍生自人类Vκ1-39Jκ5基因或人类Vκ3-20Jκ1基因的那些,且包含其体细胞突变的(例如亲和力成熟的)型式。
如本文所用的短语“可操作地连接”包含组分或元件的物理并列(例如在三维空间中),所述组分或元件彼此直接或间接相互作用,或以其它方式彼此协调以参与生物事件,所述并列实现或准许此类相互作用和/或协调。仅举一个例子,当核酸中的控制序列(例如表达控制序列)相对于编码序列定位以使其存在或不存在影响编码序列的表达和/或活性时,将其称为“可操作地连接”于编码序列。在许多实施例中,“可操作连接”涉及相关组分或元件彼此共价连接。所属领域的技术人员将易于了解,在一些实施例中,实现有效的可操作连接不需要共价连接。例如,在一些实施例中,与核酸控制序列控制的编码序列可操作地连接的核酸控制序列与所关注的核苷酸邻接。或者或另外,在一些实施例中,一个或多个此类控制序列以反式或相隔一定距离起作用以控制所关注的编码序列。在一些实施例中,如本文所用的术语“表达控制序列”是指对于实现与其连接的编码序列的表达和加工而言必需和/或足够的聚核苷酸序列。在一些实施例中,表现控制序列可为或包括适当的转录起始、终止、启动子和/或增强子序列;有效的RNA加工信号,如剪接和聚腺苷酸化信号;使细胞质mRNA稳定的序列;增强翻译效率的序列(例如Kozak共同序列);增强蛋白质稳定性的序列;和/或在一些实施例中,增强蛋白质分泌的序列。在一些实施例中,一个或多个控制序列优先或仅仅在特定宿主细胞或生物体或其类型中具有活性。仅举一个例子,在原核生物中,控制序列通常包含启动子、核糖体结合位点和转录终止序列;在真核生物中,在许多实施例中,控制序列通常包含启动子、增强子和/或转录终止序列。所属领域的技术人员应从上下文了解,在许多实施例中,术语“控制序列”是指其存在对表达和加工而言为必需的组分,且在一些实施例中包含其存在对表达有利的组分(包含例如前导序列、靶向序列和/或融合搭配物序列)。
“重新靶向”或“重定向”可以包含这样一种情况,其中野生型颗粒靶向组织内的若干个细胞和/或生物体内的若干个器官,并且通过插入异源氨基酸来减少或消除对组织或器官的通常靶向,并且通过与由特定细胞表达的标志物结合的靶向配体(例如,通过靶向配体)结合来实现对组织中的更多特定细胞或生物体中的特定器官的重新靶向。此类重新靶向或重定向还可以包含这样一种情况,其中野生型颗粒靶向组织,并且通过插入异源氨基酸来减少或消除组织的靶向,并且用靶向配体实现对完全不同的组织的重新靶向。
“特异性结合对”、“蛋白质:蛋白质结合对”等包含相互作用以形成键的两种蛋白质(例如,第一成员(例如,第一多肽)和第二同源成员(例如,第二多肽))(例如,第一成员表位与识别所述表位的抗体的第二成员抗原结合部分之间的非共价键)或在能够或促进键形成的条件下的共价异肽键。在一些实施例中,术语“同源”是指共同起作用的组分。表位及其同源抗体,特别是也可以充当可检测标记(例如,c-myc)的表位在本领域是众所周知的。能够相互作用以形成共价异肽键的特定蛋白质:蛋白质结合对综述于Veggiani等人,(2014)《生物技术趋势(Trends Biotechnol.)》32:506中,且包含肽:肽结合对,如SpyTag:SpyCatcher、SpyTag002:SpyCatcher002、SpyTag:KTag、isopeptag:pilin C、SnoopTag:SnoopCatcher等。通常,蛋白质:蛋白质结合对的第一成员是指蛋白质:蛋白质结合对的成员,其长度通常小于30个氨基酸,并且所述成员与第二同源蛋白形成共价异肽键,其中第二同源蛋白通常较大,但长度也可以小于30个氨基酸,如在SpyTag:KTag系统中。
术语“异肽键”是指羧基或甲酰胺基与氨基之间的酰胺键,所述基团中的至少一个不衍生自蛋白质主链,或另一种观点,不是蛋白质主链的一部分。异肽键可形成于单一蛋白质内或可出现于两个肽或肽与蛋白质之间。因此,异肽键可分子内地形成于单一蛋白质内,或分子间,即形成于两个肽/蛋白质分子之间,例如两个肽接头之间。通常,异肽键可出现于赖氨酸残基与天冬酰胺、天冬氨酸、谷氨酰胺或谷氨酸残基或蛋白质或肽链的末端羧基之间,或可出现于蛋白质或肽链的α-氨基末端与天冬酰胺、天冬氨酸、谷氨酰胺或谷氨酸之间。异肽键中涉及的对的每个残基在本文中称为反应性残基。在本发明的优选实施例中,异肽键可形成于赖氨酸残基与天冬酰胺残基之间或赖氨酸残基与天冬氨酸残基之间。确切地说,异肽键可出现于赖氨酸的侧链胺与天冬酰胺的甲酰胺基或天冬氨酸的羧基之间。
SpyTag:SpyCatcher系统描述于美国专利第9,547,003号中,以及Zaveri等人,(2012)《美国国家科学院院刊(PNAS)》109:E690-E697,其中的每一个以全文引用的方式并入本文中,且衍生自酿脓链球菌(Streptococcus pyogenes)纤连蛋白结合蛋白FbaB的CnaB2域。通过分割结构域,Zakeri等人获得了具有序列AHIVMVDAYKPTK(SEQ ID NO:42)的肽“SpyTag”,所述序列AHIVMVDAYKPTK与其同源蛋白“SpyCatcher”形成酰胺键,所述SpyCatcher是一种具有SEQ ID NO:43中所示的氨基酸序列的112个氨基酸多肽。(Zakeri(2012),前述)。衍生自CnaB2域的另一特异性结合对为SpyTag:KTag,其在SpyLigase存在下形成异肽键。(Fierer(2014)《美国科学院院报(PNAS)》111:E1176-1181)SpyLigase是通过从含有反应性赖氨酸的SpyCatcher中切除β链而被工程化的,从而产生KTag,蛋白质:蛋白质结合对的具有氨基酸序列ATHIKFSKRD(SEQ ID NO:72)的10个残基第一成员。SpyTag002:SpyCatcher002系统描述于Keeble等人(2017)《应用化学国际英文版(Angew Chem Int EdEngl)》56:16521-25中,其以全文引用的方式并入本文中。SpyTag002具有氨基酸序列VPTIVMVDAYKRYK,如SEQ ID NO:73所示,并结合SpyCatcher002。
SnoopTag:SnoopCatcher系统描述于Veggiani(2016)《美国国家科学院院刊》113:1202-07中。RrgA的D4 Ig样结构域,来自肺炎链球菌(Streptococcus pneumoniae)的粘附物,被分割以形成SnoopTag(残基734-745)和SnoopCatcher(残基749-860)。培育SnoopTag和SnoopCatcher产生在互补蛋白之间具有特异性的自发异肽键。Veggiani(2016)),前述。
isopeptag:pilin-C特异性结合对衍生自来自酿脓链球菌的主要菌毛蛋白蛋白Spy0128。(Zakeir和Howarth(2010)《美国化学学会杂志(J.Am.Chem.Soc.)》132:4526-27)。Isopeptag具有氨基酸序列TDKDMTITFTNKKDAE,如SEQ ID NO:75所示,并结合pilin-C(Spy0128的残基18-299)。培育SnoopTag和SnoopCatcher产生在互补蛋白之间具有特异性的自发异肽键。Zakeir和Howarth(2010),前述。
术语“可检测标记”包含作为特异性结合对的成员的多肽序列,例如,其通过非共价键以高亲和力与另一多肽序列例如抗体互补位特异性结合。示例性和非限制性可检测标记包含六组氨酸标记、FLAG标记、Strep II标记、链霉亲和素结合肽(SBP)标记、钙调蛋白结合肽(CBP)、谷胱甘肽S-转移酶(GST)、麦芽糖结合蛋白(MBP)、S标记、HA标记和c-myc(SEQID NO:44)。(在Zhao等人(2013)J.Analytical Meth.Chem.1-8;中综述;所述参考文献以引用的方式并入本文)。灵长类动物AAV的常见可检测标记是B1表位(SEQ ID NO:45)。本发明的天然地不包括B1表位的非灵长类动物AAV衣壳蛋白在本文中可以被修饰以包括B1表位。一般而言,非灵长类动物AAV衣壳蛋白可以包括在衣壳蛋白最后10个氨基酸内与B1表位具有基本同源性的序列。因此,在一些实施例中,本发明的非灵长类动物AAV衣壳蛋白可以用衣壳蛋白的最后10个氨基酸内的一个但少于五个点突变进行修饰,使得AAV衣壳蛋白包括B1表位。
术语“靶细胞”包含在其中期望所关注的核苷酸的表达的任何细胞。优选地,靶细胞在其表面上展现允许细胞经靶向配体靶向的受体,如下所述。
术语“转导”或“感染”等是指通过病毒颗粒将核酸引入到靶细胞核中。与转导等相关的术语效率例如“转导效率”是指在与包括所关注核苷酸的一定数量的病毒颗粒温育后表达所关注核苷酸的细胞的分数(例如,百分比)。众所周知的测定转导效率的方法包含用荧光报告基因转导的细胞的流式细胞术、用于表达所关注核苷酸的RT-PCR等。
一般而言,“参考”病毒衣壳蛋白/衣壳/颗粒与测试病毒衣壳蛋白/衣壳/颗粒相同,但其效果的变化有待测试。例如,为了确定将特异性结合对的第一成员插入到测试病毒颗粒中例如对转导效率的影响,可以将测试病毒颗粒的转导效率(在不存在或存在适当的靶向配体的情况下)与参考病毒颗粒的转导效率(如果需要的话,在不存在或存在适当的靶向配体的情况下)进行比较,所述参考病毒颗粒的转导效率在除了存在特异性结合对的第一成员之外的每种情况下(例如,另外的点突变、所关注核苷酸、病毒颗粒和靶细胞的数量等)均与测试病毒颗粒的转导效率相同。在一些实施例中,参考病毒衣壳蛋白是能够与第二病毒衣壳蛋白形成衣壳的参考病毒衣壳蛋白,所述第二病毒衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员,其中所述参考病毒衣壳蛋白不包括蛋白质:蛋白质结合对的第一成员,优选地其中由参考病毒衣壳蛋白和经修饰的病毒衣壳蛋白形成的衣壳是镶嵌衣壳。
腺相关病毒(AAV)
“AAV”是腺相关病毒的缩写,并且可以用于指病毒本身或其衍生物。AAV为小的、无包膜的单链DNA病毒。一般而言,野生型AAV基因组为4.7kb,并且其特征在于两个反向末端重复序列(ITR)和两个开放阅读框(ORF)、rep和cap。野生型rep阅读框对分子量78kD(“Rep78”)、68kD(“Rep68”)、52kD(“Rep52”)和40kD(“Rep40”)的四种蛋白质进行编码。Rep78和Rep68由p5启动子转录,并且Rep52和Rep40由p19启动子转录。这些蛋白质主要用于调节AAV基因组的转录和复制。野生型cap阅读框对分子量为83-85kD(VP1)、72-73kD(VP2)和61-62kD(VP3)的三种结构(衣壳)病毒蛋白(VP)进行编码。AAV病毒粒子(衣壳)中80%以上的总蛋白包括VP3;在成熟的病毒粒子中发现VP1、VP2和VP3的相对丰度为约1:1:10,尽管已经报道比率为1:1:8。Padron等人,(2005)《病毒学杂志》79:5047-58。
各种血清型AAV的基因组序列以及天然反向末端重复序列(ITR)、Rep蛋白和衣壳亚基序列是本领域已知的。这种序列可以在文献或如GenBank等公共数据库中找到。参见例如,GenBank登录号NC_002077(AAV1)、AF063497(AAV1)、NC001401(AAV-2)、AF043303(AAV2)、NC_001729(AAV3)、NC_001829(AAV4)、U89790(AAV4)、NC_006152(AAV5)、AF513851(AAV7)、AF513852(AAV8)和NC_006261(AAV8);所述文献的公开内容通过引用并入本文中以教导AAV核酸和氨基酸序列。参见例如,Srivistava等人,(1983)《病毒学杂志》45:555;Chiorini等人,(1998)《病毒学杂志》71:6823;Chiorini等人,(1999)《病毒学杂志》73:1309;Bantel-Schaal等人,(1999)《病毒学杂志》73:939;Xiao等人,(1999)《病毒学杂志》73:3994;Muramatsu等人,(1996)《病毒学(Virology)》221:208;Shade等人,(1986)《病毒学杂志》58:921;Gao等人,(2002)《美国国家科学院院刊(Proc.Nat.Acad.Sci.USA)》99:11854;Moris等人,(2004)《病毒学》33:375-383;美国专利公开20170130245;国际专利公开WO00/28061、WO 99/61601和WO 98/11244;以及美国专利第6,156,303号,所述文献中的每个文献以全文引用的方式并入本文中。本文表2提供了各种非灵长类动物AAV的序列。
除非另有要求,否则“AAV”涵盖所有亚型以及天然存在的形式和经修饰的形式两者。AAV包含灵长类动物AAV(例如,AAV 1型(AAV1)、灵长类动物AAV 2型(AAV2)、灵长类动物AAV 3型(AAV3)、灵长类动物AAV 4型(AAV4)、灵长类动物AAV 5型(AAV5)、灵长类动物AAV 6型(AAV6)、灵长类动物AAV 7型(AAV7)、灵长类动物AAV 8型(AAV8)、非灵长类动物AAV(例如,禽类AAV(AAAV))和其它非灵长类动物AAV,如哺乳动物AAV(例如,蝙蝠AAV、海狮AAV、牛AAV、犬AAV、马AAV、羊AAV和绵羊AAV等)、有鳞目动物AAV(例如,蛇AAV、鬃狮蜥AAV等)和远程AAV等。“灵长类动物AAV”是指一般从灵长类动物中分离的AAV。类似地,“非灵长类动物AAV”是指从非灵长类动物中分离的AAV。如本文所使用的,“远程AAV”涵盖:
从通常与普通人群体接触有限的灵长类或非灵长类动物中分离的AAV,
从包括野生型VP1衣壳蛋白的灵长类动物中分离的AAV,例如,灵长类动物AAV,所述野生型VP1衣壳蛋白包括与以下中的每个的氨基酸序列同一性小于99%、例如小于95%、例如小于90%、例如小于85%的氨基酸序列:AAV1的VP1衣壳蛋白、AAV2的VP1衣壳蛋白、AAV3的VP1衣壳蛋白、AAV4的VP1衣壳蛋白、AAV5的VP1衣壳蛋白、AAV6的VP1衣壳蛋白、AAV7的VP1衣壳蛋白、AAV8的VP1衣壳蛋白、AAV9的VP1衣壳蛋白、AAV10的VP1衣壳蛋白、AAV11的VP1衣壳蛋白、AAV12的VP1衣壳蛋白和AAV13的VP1衣壳蛋白和/或
从包括野生型衣壳蛋白的非灵长类动物中分离的AAV,例如,非灵长类动物AAV,所述野生型衣壳蛋白包括与表2中所列AAV中的每个AAV的氨基酸序列同一性小于99%、例如小于95%、例如小于90%、例如小于85%的氨基酸序列。
可以使用众所周知的方法评估血清阳性。例如,可以通过酶联免疫吸附测定(ELISA)或其它众所周知的基于免疫的测定来进行IgG的不存在或存在。为了检测中和抗体,可以进行中和测定,其中将AAV颗粒与增加量(连续稀释)的(i)特定受试者的血清或多个受试者的混合血清或(ii)由单个样品或汇集的血清样品(例如,来自数十到数千名供体,在给定群体中表示免疫球蛋白的横截面)制备的经纯化的免疫球蛋白(IVIG或IgG)一起温育,然后进行细胞感染检测,例如,通过跟踪报告基因表达(例如,荧光素酶基因、GFP等)。然后将感染水平与未暴露于血清/IVIG/IgG的对照样品中的水平进行比较。参见例如实例8。中和滴度可以定义为,例如,与对照物相比,IVIG/IgG的浓度或导致报告基因表达抑制50%或更高的血清的最高稀释因子。在一个实施例中,与对照物相比,观察到感染细胞数量减少70%以上的血清稀释液被认为对中和活性呈阳性。可以使用例如免疫印迹测定研究与特定已知中和抗体的相互作用。
如本文所使用的,与基因(例如,rep,cap等)、衣壳蛋白(例如,VP1衣壳蛋白、VP2衣壳蛋白、VP3衣壳蛋白等)、特定AAV的衣壳蛋白区(例如,PLA2区、VP1-u区、VP1/VP2共同区、VP3区)、核苷酸序列(例如,ITR序列)相关的“[特定AAV]”,例如,AAV2等的cap基因或衣壳蛋白,除了分别包括本文所示的针对特定AAV的核酸序列或氨基酸序列的基因或多肽外,还涵盖所述基因或多肽的变体,包含包括需要保留一个或多个生物功能的核苷酸或氨基酸的最少数量的变体。如本文所使用的,变体基因或变体多肽包括与本文所示的特定AAV的基因或多肽的核酸序列或氨基酸序列不同的核酸序列或氨基酸序列,其中所述差异通常不会改变基因或多肽的至少一种生物功能,和/或基因或多肽的系统发育特征,例如,差异可能是由于遗传密码的简并性、分离变异、序列的长度等。例如,如此处使用的rep基因和cap基因可以涵盖不同于野生型基因的rep和cap基因,因为基因可以分别对一个或多个Rep蛋白和Cap蛋白进行编码。在一些实施例中,Rep基因对至少Rep78和/或Rep68进行编码。在一些实施例中,cap基因包含那些可以不同于野生型的基因,其中一个或多个替代性起始密码子或一个或多个替代性起始密码子之间的序列被去除,使得cap基因仅对单个cap蛋白进行编码,例如,其中VP2和/或VP3起始密码子被去除或取代,使得cap基因对功能性VP1衣壳蛋白而不是VP2衣壳蛋白或VP3衣壳蛋白进行编码。因此,如本文所使用的,rep基因涵盖对功能性rep蛋白进行编码的任何序列。cap基因涵盖对至少一个功能性cap基因进行编码的任何序列。
众所周知,野生型cap基因在存在于rep ORF中的p40启动子的控制下表达来自cap基因的单个开放阅读框的所有三种VP1、VP2和VP3衣壳蛋白。术语“衣壳蛋白”、“Cap蛋白”等包含作为病毒衣壳的一部分的蛋白质。对于腺相关病毒,衣壳蛋白通常被称为VP1、VP2和/或VP3,并且可以由单个cap基因编码。对于AAV,三种AAV衣壳蛋白本质上以cap ORF替代性翻译起始密码子使用的重叠方式产生,尽管所有三种蛋白质都使用共同的终止密码子。野生型cap基因的ORF从5'到3'对以下三个替代性起始密码子和一个“共同终止密码子”进行编码:“VP1起始密码子”、“VP2起始密码子”和“VP3起始密码子”。最大的病毒蛋白VP1通常从VP1起始密码子编码到“共同终止密码子”。VP2通常从VP2起始密码子编码到共同终止密码子。VP3通常从VP3起始密码子编码到共同终止密码子。因此,VP1在其N端包括不与VP2或VP3共享的序列,被称为VP1-独特区(VP1-u)。VP1-u区通常由野生型cap基因的序列进行编码,所述cap基因从VP1起始密码子开始直到“VP2起始密码子”。VP1-u包括对感染来说可能很重要的磷脂酶A2结构域(PLA2),以及可能帮助病毒靶向细胞核以进行脱壳和基因组释放的核定位信号。VP1、VP2和VP3衣壳蛋白共享构成整个VP3的相同C端序列,其在本文中也可以被称为VP3区。VP3区从VP3起始密码子编码到共同终止密码子。VP2具有与VP1共享的另外的约60个氨基酸。此区域被称为VP1/VP2共同区。
在一些实施例中,本发明的Cap蛋白中的一种或多种Cap蛋白可以由具有一个或多个ORF的一种或多种cap基因编码。在一些实施例中,本发明的VP蛋白可以通过使用单独核苷酸序列从包括对VP1、VP2和/或VP3的任何组合进行编码的核苷酸序列的多于一个ORF表达,所述单独核苷酸序列可操作地连接到至少一个表达控制序列以用于在包装细胞中表达,所述每个细胞产生本发明的VP1、VP2和/或VP3衣壳蛋白中的一个或多个。在一些实施例中,本发明的VP衣壳蛋白可以通过使用单独核苷酸序列从包括对VP1、VP2或VP3中的任一种进行编码的核苷酸序列的ORF单独地表达,所述单独核苷酸序列可操作地连接到一个表达控制序列以用于在病毒复制细胞中表达,所述每个细胞仅产生VP1、VP2或VP3衣壳蛋白中的一个。在另一个实施例中,VP蛋白可以从包括对VP1、VP2和VP3衣壳蛋白进行编码的核苷酸序列的一个ORF表达,所述核苷酸序列可操作地连接到至少一个表达控制序列以用于在病毒复制细胞中表达,所述每个细胞产生VP1、VP2和VP3衣壳蛋白。因此,尽管本文所提供的氨基酸位置可以相对于参考的AAV的VP1衣壳蛋白提供,但本领域技术人员将能够分别且容易地确定AAV的VP2和/或VP3衣壳蛋白内相同氨基酸的位置,以及不同AAV中的氨基酸的对应位置。
短语“反向末端重复序列”或“ITR”包含有效复制所需的腺相关病毒的基因组中的对称核酸序列。ITR序列位于AAV DNA基因组的每一端处。ITR充当病毒DNA合成的复制起点,并且是产生AAV颗粒例如包装成AAV颗粒重要的顺式组分。
AAV ITR包括复制蛋白Rep78或Rep68的识别位点。ITR的“D”区包括DNA复制在其处起始的DNA切口位点,并且为核酸复制步骤提供方向性。在哺乳动物细胞中复制的AAV通常包括两个ITR序列。
单个ITR可以在“A”区的两条链上和ITR回文的每一侧上的两个对称D区上用Rep结合位点进行工程化。此类双链环状DNA模板上的经工程化的构建体允许Rep78或Rep68启动的核酸复制在两个方向上进行。单个ITR足以进行圆形颗粒的AAV复制。在生产本发明的AAV病毒颗粒的方法中,rep编码序列对能够结合转移质粒上包括的ITR的Rep蛋白或Rep蛋白等效物进行编码。
当通过包装细胞用适当的Rep蛋白表达时,本发明的Cap蛋白可以使包括所关注核苷酸和偶数个两个或更多个ITR序列的转移质粒衣壳化。在一些实施例中,转移质粒包括一个ITR序列。在一些实施例中,转移质粒包括两个ITR序列。
Rep78和/或Rep68中的任一者结合到ITR发夹序列上的独特和已知的位点,并作用于破坏和解开AAV基因组的末端上的发夹结构,由此提供对病毒复制细胞的复制机制的访问。众所周知,Rep蛋白可以通过使用单独核苷酸序列从包括对Rep78、Rep68、Rep52和/或Rep40的任何组合进行编码的核苷酸序列的多于一个ORF表达,所述单独核苷酸序列可操作地连接到至少一个表达控制序列以用于在病毒复制细胞中表达,所述每个细胞产生Rep78、Rep68、Rep52和/或Rep40 Rep蛋白中的一个或多个。可替代地,Rep蛋白可以通过使用单独核苷酸序列从包括对Rep78、Rep68、Rep52或Rep40中的任一个进行编码的核苷酸序列的ORF中单独地表达,单独核苷酸序列可操作地连接到一个表达控制序列以用于在包装细胞中表达,每个所述细胞仅产生一个Rep78、Rep68、Rep 52或Rep40 Rep蛋白。在另一个实施例中,Rep蛋白可以从包括对Rep78和Rep52 Rep蛋白进行编码的核苷酸序列的一个ORF表达,所述核苷酸序列可操作地连接到至少一个表达控制序列以用于在病毒复制细胞中表达,所述每个细胞产生Rep78和Rep52Rep蛋白。
在产生本发明的AAV病毒粒子例如病毒颗粒的方法中,本发明的rep编码序列和cap基因可以提供单个包装质粒(参见例如图1)。然而,技术人员将认识到此类条件是不必要的。此类病毒颗粒可以包含也可以不包含基因组。
“嵌合AAV衣壳蛋白”包含AAV衣壳蛋白,所述AAV衣壳蛋白包括氨基酸序列,例如,来自两个或更多个不同AAV的部分并且能够形成和/或形成AAV病毒衣壳/病毒颗粒。嵌合AAV衣壳蛋白由嵌合AAV衣壳基因进行编码,例如,包括多个例如至少两个核酸序列的嵌合核苷酸,所述多个核酸序列中的每个核酸序列与对不同AAV的衣壳蛋白进行编码的衣壳基因的一部分相同,并且所述多个核酸序列一起对功能性嵌合AAV衣壳蛋白进行编码。嵌合衣壳蛋白与特定AAV的缔合表明衣壳蛋白包括来自所述AAV的衣壳蛋白的一个或多个部分以及来自不同AAV的衣壳蛋白的一个或多个部分。例如,嵌合AAV2衣壳蛋白包含衣壳蛋白,所述衣壳蛋白包括AAV2的VP1、VP2和/或VP3衣壳蛋白的一个或多个部分以及不同AAV的VP1、VP2和/或VP3衣壳蛋白的一个或多个部分。
术语“一部分”是指至少5个氨基酸或至少15个核苷酸,但少于全长多肽或核酸分子,与所述部分来源的序列具有100%同一性,参见Penzes(2015)《普通病毒学杂志(J.General Virol)》.2769“一部分”涵盖足以确定所述部分来源的多肽或核酸分子形式是“[特定的]AAV”或与特定AAV例如非灵长类动物AAV或远程AAV具有“显著同一性”的氨基酸或核苷酸的任何连续区段。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少5个氨基酸或15个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少10个氨基酸或30个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少15个氨基酸或45个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少20个氨基酸或60个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少25个氨基酸或75个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少30个氨基酸或90个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少35个氨基酸或105个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少40个氨基酸或120个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少45个氨基酸或135个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少50个氨基酸或150个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少60个氨基酸或180个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少70个氨基酸或210个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少80个氨基酸或240个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少90个氨基酸或270个核苷酸。在一些实施例中,一部分包括与特定AAV相关的序列具有100%同一性的至少100个氨基酸或300个核苷酸。
经修饰的病毒衣壳蛋白、病毒颗粒、核酸
在一些实施例中,本发明的Cap蛋白,例如,如本文所描述的VP1衣壳蛋白、如本文所描述的VP2衣壳蛋白和/或如本文所描述的VP3衣壳蛋白)被修饰以包括例如蛋白质:蛋白质结合对的第一成员、可检测标记、点突变等。
嵌合性是一种如本文所描述的修饰。一般而言,特定AAV的基因或多肽或其变体的修饰产生与本文所示的针对特定AAV的核酸序列或氨基酸序列不同的核酸序列或氨基酸序列,其中修饰改变、赋予或去除一种或多种生物学功能,但不改变基因或多肽的系统发育特征。修饰可以包含例如蛋白质:蛋白质结合对的第一成员和点突变的插入,例如使得降低直至消除衣壳蛋白的自然趋向性和/或使得衣壳蛋白包括可检测标记。优选的修饰包含那些不改变并且优选地降低通过存在于一般群体中的预先存在的抗体对经修饰的衣壳进行的低识别或不识别,所述抗体是在感染另一种AAV过程期间产生的,例如,感染血清型,如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAVDJ、Anc80L65、AAV2G9、AAV-LK03、基于此类血清型的病毒粒子、来自当前使用的AAV基因疗法模式的病毒粒子或其组合。如本文所描述的其它修饰包含衣壳蛋白的修饰,使得其包括蛋白质:蛋白质结合对的第一成员、可检测标记等,所述修饰通常由基因水平处的修饰引起,例如,通过cap基因的修饰。
在一些实施例中,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳是镶嵌衣壳,例如,包括至少两组VP1、VP2和/或VP3蛋白,每组蛋白由不同的cap基因进行编码。本文中的镶嵌衣壳通常是指被修饰以包括蛋白质:蛋白质结合对的第一成员的第一病毒衣壳蛋白的嵌合体以及缺乏蛋白质:蛋白质结合对的第一成员的第二对应病毒衣壳蛋白。关于镶嵌衣壳,缺乏蛋白质:蛋白质结合对的第一成员的第二病毒衣壳蛋白可以称为由参考cap基因编码的参考衣壳蛋白。在一些镶嵌衣壳实施例中,优选地当用蛋白质:蛋白质对的第一成员修饰的VP1、VP2和/或VP3衣壳蛋白不是嵌合衣壳蛋白时,VP1、VP2和/或VP3参考衣壳蛋白可以包括与用蛋白质:蛋白质结合对的第一成员修饰的病毒VP1、VP2和/或VP3衣壳蛋白的氨基酸序列相同的氨基酸序列,除了参考衣壳蛋白缺乏蛋白质:蛋白质结合对的第一成员。在一些镶嵌衣壳实施例中,VP1、VP2和/或VP3参考衣壳蛋白对应于用蛋白质:蛋白质结合对的第一成员修饰的病毒VP1、VP2和/或VP3衣壳蛋白,除了参考衣壳蛋白缺乏蛋白质:蛋白质结合对的第一成员。在一些实施例中,VP1参考衣壳蛋白对应于用蛋白质:蛋白质结合对的第一成员修饰的病毒VP1衣壳蛋白,除了参考衣壳蛋白缺乏蛋白质:蛋白质结合对的第一成员。在一些实施例中,VP2参考衣壳蛋白对应于用蛋白质:蛋白质结合对的第一成员修饰的病毒VP2衣壳蛋白,除了参考衣壳蛋白缺乏蛋白质:蛋白质结合对的第一成员。在一些实施例中,VP3参考衣壳蛋白对应于用蛋白质:蛋白质结合对的第一成员修饰的病毒VP3衣壳蛋白,除了参考衣壳蛋白缺乏蛋白质:蛋白质结合对的第一成员。在包括被进一步修饰以包括蛋白质:蛋白质结合对的第一成员的嵌合VP1、VP2和/或VP3衣壳蛋白的一些镶嵌衣壳实施例中,参考蛋白可以是对应的衣壳蛋白,来自所述对应的衣壳蛋白的一部分形成嵌合衣壳蛋白的一部分。作为一些实施例中的非限制性实例,包括被修饰以包括蛋白质:蛋白质结合对的第一成员的嵌合AAV2/AAAV VP1衣壳蛋白的镶嵌衣壳可以进一步包括作为参考衣壳蛋白:缺乏第一成员的AAV2 VP1衣壳蛋白、缺乏第一成员的AAAV VP1衣壳蛋白、缺乏第一成员的嵌合AAV2/AAAV VP1衣壳蛋白。类似地,在一些实施例中,包括被修饰以包括蛋白质:蛋白质结合对的第一成员的嵌合AAV2/AAAV VP2衣壳蛋白的镶嵌衣壳可以进一步包括作为参考衣壳蛋白:缺乏第一成员的AAV2 VP2衣壳蛋白、缺乏第一成员的AAAV VP1衣壳蛋白、缺乏第一成员的嵌合AAV2/AAAV VP2衣壳蛋白。在一些实施例中,包括被修饰以包括蛋白质:蛋白质结合对的第一成员的嵌合AAV2/AAAV VP3衣壳蛋白的镶嵌衣壳可以进一步包括作为参考衣壳蛋白:缺乏第一成员的AAV2 VP2衣壳蛋白、缺乏第一成员的AAAV VP1衣壳蛋白、缺乏第一成员的嵌合AAV2/AAAV VP3衣壳蛋白。在一些镶嵌衣壳实施例中,参考衣壳蛋白可以是任何衣壳蛋白,只要其缺少蛋白质:蛋白质结合对的第一成员并且能够与用蛋白质:蛋白质结合对的第一成员修饰的第一衣壳蛋白形成衣壳。
通常,可以通过将经修饰的cap基因和参考cap基因的混合物以指定比率转染到生产细胞中来产生镶嵌颗粒。颗粒中的蛋白质亚基比率例如经修饰的VP蛋白质:未经修饰的VP蛋白比率可以但不一定化学计量地反映对用蛋白质:蛋白质结合对的第一成员修饰的第一衣壳蛋白进行编码的cap基因与一个或多个参考cap基因的至少两个物种的比率,例如,转染到包装细胞中的经修饰的cap基因:参考cap基因的比率。在一些实施例中,颗粒中的蛋白质亚基比率不化学计量地反映转染到包装细胞中的经修饰的cap基因:参考cap基因的比率。
在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率处于约1:59到约59:1的范围内。在一些镶嵌病毒颗粒实施例中,蛋白质亚基为至少约1:1(例如,镶嵌病毒颗粒包括约30个经修饰的衣壳蛋白和约30个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:2(例如,镶嵌病毒颗粒包括约20个经修饰的衣壳蛋白和约40个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约3:5。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:3(例如,镶嵌病毒颗粒包括约15个经修饰的衣壳蛋白和约45个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:4(例如,镶嵌病毒颗粒包括约12个经修饰的衣壳蛋白和48个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:5(例如,镶嵌病毒颗粒包括约10个经修饰的衣壳蛋白和50个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:6。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:7。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:8。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:9(例如,镶嵌病毒颗粒包括约6个经修饰的衣壳蛋白和约54个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:10。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:11(例如,镶嵌病毒颗粒包括约5个经修饰的衣壳蛋白和约55个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:12。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:13。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:14(例如,镶嵌病毒颗粒包括约4个经修饰的衣壳蛋白和约56个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:15。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:19(例如,镶嵌病毒颗粒包括约3个经修饰的衣壳蛋白和约57个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:29(例如,镶嵌病毒颗粒包括约2个经修饰的衣壳蛋白和约58个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约1:59。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约2:1(例如,镶嵌病毒颗粒包括约40个经修饰的衣壳蛋白和约20个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约5:3。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约3:1(例如,镶嵌病毒颗粒包括约45个经修饰的衣壳蛋白和约15个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约4:1(例如,镶嵌病毒颗粒包括约48个经修饰的衣壳蛋白和12个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约5:1(例如,镶嵌病毒颗粒包括约50个经修饰的衣壳蛋白和10个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约6:1。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约7:1。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约8:1。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约9:1(例如,镶嵌病毒颗粒包括约54个经修饰的衣壳蛋白和约6个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约10:1。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约11:1(例如,镶嵌病毒颗粒包括约55个经修饰的衣壳蛋白和约5个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约12:1。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约13:1。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约14:1(例如,镶嵌病毒颗粒包括约56个经修饰的衣壳蛋白和约4个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约15:1。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约19:1(例如,镶嵌病毒颗粒包括约57个经修饰的衣壳蛋白和约3个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约29:1(例如,镶嵌病毒颗粒包括约58个经修饰的衣壳蛋白和约2个参考衣壳蛋白)。在一些镶嵌病毒颗粒实施例中,蛋白质亚基的比率为至少约59:1。
在一些非镶嵌病毒颗粒实施例中,蛋白质亚基的比率可以为1:0,其中非镶嵌病毒颗粒的每个衣壳蛋白用蛋白质:蛋白质结合对的第一成员进行修饰。在一些非镶嵌病毒颗粒实施例中,蛋白质亚基的比率可以为0:1,其中非镶嵌病毒颗粒的每个衣壳蛋白不用蛋白质:蛋白质结合对的第一成员进行修饰。
在一些实施例中,本发明的衣壳蛋白被修饰以包括可检测标记。许多可检测标记是本领域已知的。(参见例如:Nilsson等人,(1997)“用于检测、纯化和固定经修饰的蛋白质的亲和融合策略(Affinity fusion strategies for detection,purification,andimmobilization of modified proteins)”《蛋白质表达与纯化(Protein Expression andPurification)》11:1-16,Terpe等人,(2003)“标记蛋白融合概述:从分子和生化基础到商业系统(Overview of tag protein fusions:From molecular and biochemicalfundamentals to commercial systems)”《应用微生物学与生物技术(AppliedMicrobiology and Biotechnology)》60:523-533,以及其中的参考文献)。可检测标记包含但不限于以下:结合固定化的二价阳离子(例如,Ni2+)的多组氨酸可检测标记(例如,His-6、His-8或His-10)、结合固定化的亲和素的生物素部分(例如,在体内生物素化的多肽序列上)、结合固定化的谷胱甘肽的GST(谷胱甘肽S-转移酶)序列、结合固定化的S蛋白的S标记、结合固定化的抗体或其结构域或片段的抗原(包含例如结合对应抗体的T7、myc、FLAG和B标记)、FLASH标记(偶联到特定砷基部分的可高度检测标记)、结合固定化的配体的受体或受体结构域(或反之亦然)、结合固定化的IgG的蛋白质a或其衍生物(例如,Z)、结合固定化的直链淀粉的麦芽糖结合蛋白(MBP)、结合固定化的白蛋白的白蛋白结合蛋白、结合固定化的几丁质的几丁质结合结构域、结合固定化的钙调蛋白的钙调蛋白结合肽和结合固定化的纤维素的纤维素结合结构域。另一个示例性可检测标记是SNAP-tag,可从Covalys公司(www.Covalys.com)商购获得。在一些实施例中,本文所公开的可检测标记包括仅由抗体互补位识别的可检测标记。在一些实施例中,本文所公开的可检测标记包括由抗体互补位和其它特异性结合对识别的可检测标记。
在一些实施例中,可检测标记与免疫球蛋白恒定结构域形成结合对。在一些实施例中,所述可检测标记和/或可检测标记确实与金属离子形成结合对,例如,Ni2+、Co2+、Cu2+、Zn2+、Fe3+等。在一些实施例中,可检测标记选自由链霉亲和素、Strep II、HA、L14、4C-RGD、LH和蛋白质A组成的组。
在一些实施例中,可检测标记选自由FLAG、HA和c-myc(EQKLISEEDL;SEQ ID NO:44)组成的组。在一些实施例中,可检测标记是c-myc(SEQ ID NO:44)。
在一些实施例中,可检测标记是B细胞表位,例如,长度介于约1个氨基酸与约35个氨基酸之间,并且与抗体互补位例如免疫球蛋白可变结构域形成结合对。在一些实施例中,可检测标记包括B1表位(SEQ ID NO:45)。在一些实施例中,衣壳蛋白被修饰以在VP3区中包括B1表位。
在一些实施例中,本发明的衣壳蛋白至少包括肽:肽结合对的第一成员。
在一些实施例中,本发明的衣壳蛋白包括蛋白质:蛋白质结合对的包括可检测标记的第一成员,所述可检测标记也可以用于检测和/或分离Cap蛋白和/或作为蛋白质:蛋白质结合对的第一成员。在一些实施例中,可检测标记充当蛋白质:蛋白质结合对的用于结合包括多特异性结合蛋白的靶向配体的第一成员,所述多特异性结合蛋白可以结合可检测标记和由所关注细胞表达的靶标两者。在一些实施例中,本发明的Cap蛋白包括蛋白质:蛋白质结合对的包括c-myc(SEQ ID NO:44)的第一成员。可检测标记作为蛋白质:蛋白质结合对的第一成员的用途描述于例如WO 2019006043中,所述文献以全文引用的方式并入本文中。
在一些实施例中,衣壳蛋白包括蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对形成共价异肽键。在一些实施例中,肽:肽结合对的第一成员通过异肽键与肽:肽结合对的同源第二成员共价地结合,并且任选地其中肽:肽结合对的同源第二成员与靶向配体融合,所述靶向配体结合由所关注细胞表达的靶标。在一些实施例中,蛋白质:蛋白质结合对可选自由以下组成的群组:SpyTag:SpyCatcher、SpyTag002:SpyCatcher002、SpyTag:KTag、Isopeptag:pilin-C和SnoopTag:SnoopCatcher。在一些实施例中,其中第一成员是SpyTag(或其生物活性部分)并且蛋白质(第二同源成员)是SpyCatcher(或其生物活性部分)。在一些实施例中,其中第一成员是SpyTag(或其生物活性部分)并且蛋白质(第二同源成员)是KTag(或其生物活性部分)。在一些实施例中,其中第一成员是KTag(或其生物活性部分)并且蛋白质(第二同源成员)是SpyTag(或其生物活性部分)。在一些实施例中,其中第一成员是SnoopTag(或其生物活性部分)并且蛋白质(第二同源成员)是SnoopCatcher(或其生物活性部分)。在一些实施例中,其中第一成员是Isopeptag(或其生物活性部分)并且蛋白质(第二同源成员)是Pilin-C(或其生物活性部分)。在一些实施例中,其中第一成员是SpyTag002(或其生物活性部分)并且蛋白质(第二同源成员)是SpyCatcher002(或其生物活性部分)。在一些实施例中,本发明的Cap蛋白包括SpyTag。蛋白质:蛋白质结合对的第一成员的用途描述于WO 2019006046中,所述文献以全文引用的方式并入本文中。
在一些实施例中,蛋白质:蛋白质结合对的第一成员和/或可检测标记通过第一接头或第二接头,例如,长度为至少一个氨基酸的氨基酸间隔子,可操作地连接到本发明的Cap蛋白(用所述Cap蛋白在框中翻译、化学连接到所述Cap蛋白和/或通过所述Cap蛋白显示)。在一些实施例中,蛋白质:蛋白质结合对的第一成员侧接有第一接头和/或第二接头,例如,第一和/或第二氨基酸间隔子,其中每个间隔子的长度为至少一个氨基酸。
在一些实施例中,第一和/或第二接头不相同。在一些实施例中,第一和/或第二接头的长度各自独立地为一或两个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个或三个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个、三个或四个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个、三个、四个或五个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个、三个、四个或五个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个、三个、四个、五个或六个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个、三个、四个、五个、六个或七个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个、三个、四个、五个、六个、七个或八个氨基酸。在一些实施例中,第一和/或第二接头的长度各自独立地为一个、两个、三个、四个、五个、六个、七个、八个或九个氨基酸。在一些实施例中,第一和或第二接头的长度各自独立地为一个、两个、三个、四个、五个、六个、七个、八个、九个或十个氨基酸。在一些实施例中,第一和或第二接头的长度各自独立地为一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个氨基酸。
在一些实施例中,第一接头和第二接头的序列和/或长度相同,并且长度各自为一个氨基酸。在一些实施例中,第一和第二接头的长度相同,且长度各自为一个氨基酸。在一些实施例中,第一和第二接头的长度相同,且长度各自为两个氨基酸。在一些实施例中,第一和第二接头的长度相同,且长度各自为三个氨基酸。在一些实施例中,第一接头和第二接头的长度相同,并且长度各自为四个氨基酸,例如,接头为GLSG(SEQ ID NO:37)。在一些实施例中,第一和第二接头的长度相同,且长度各自为五个氨基酸。在一些实施例中,第一接头和第二接头的长度相同,并且长度各自为六个氨基酸,例如,第一接头和第二接头各自包括GLSGSG(SEQ ID NO:38)的序列。在一些实施例中,第一和第二接头的长度相同,且长度各自为七个氨基酸。在一些实施例中,第一接头和第二接头的长度相同,并且长度各自为八个氨基酸,例如,第一接头和第二接头各自包括GLSGLSGS(SEQ ID NO:39)的序列。在一些实施例中,第一和第二接头的长度相同,且长度各自为九个氨基酸。在一些实施例中,第一接头和第二接头的长度相同,并且长度各自为十个氨基酸,例如,第一接头和第二接头各自包括GLSGLSGLSG(SEQ ID NO:40)或GLSGGSGLSG(SEQ ID NO:41)的序列。在一些实施例中,第一和第二接头的长度相同,且长度各自为超过十个氨基酸。
通常,如本文所描述的蛋白质:蛋白质结合对氨基酸序列的第一成员,例如,包括特异性结合对的第一成员本身或与一个或多个接头的组合,其长度为约5个氨基酸到约50个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为至少5个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为6个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为7个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为8个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为9个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为10个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为11个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为12个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为13个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为14个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为15个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为16个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为17个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为18个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为19个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为20个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为21个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为22个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为23个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为24个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为25个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为26个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为27个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为28个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为29个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为30个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为31个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为32个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为33个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为34个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为35个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为36个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为37个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为38个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为39个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为40个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为41个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为42个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为43个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为44个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为45个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为46个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为47个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为48个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为49个氨基酸。在一些实施例中,蛋白质:蛋白质结合对氨基酸序列的第一成员的长度为50个氨基酸。
由于至少大区段的高保守度和紧密相关的家族成员的大成员,可以通过进行氨基酸比对或通过衣壳结构比较来鉴别除列举的AAV以外的AAV的对应插入位点。关于不同AAV衣壳蛋白的示例性比对,参见例如Rutledge等人(1998)《病毒学杂志》72:309-19;Mietzsch等人,(2019)《病毒学》11,362,1-34和美国专利第9,624,274号,用于不同AAV衣壳蛋白的示例性比对,所述参考文献中的每个参考文献以全文引用的方式并入本文中。例如,Mietzcsh等人,(2019)在图7处提供了来自不同依赖细小病毒的条带覆盖,描绘了可变区VR I到VRIX。使用本文所描述的此类结构分析和序列分析,技术人员可以确定可变区内的哪些氨基酸对应于AAV的氨基酸序列,所述AAV的氨基酸序列可以容纳蛋白质:蛋白质结合对的第一成员和/或可检测标记的插入。
因此,在一些实施例中,将蛋白质:蛋白质结合对的第一成员和/或可检测标记插入在非灵长类动物AAV的VP1衣壳蛋白中,插入在与选自由以下组成的组中的氨基酸位置相对应的氨基酸位置之后:AAV2衣壳蛋白VP1的G453、AAV2衣壳蛋白VP1的N587、AAV9衣壳蛋白VP1的G453和AAV9衣壳蛋白VP1的A589。在一些实施例中,蛋白质:蛋白质结合对的第一成员和/或可检测标记插入在非灵长类动物AAV的VP1衣壳蛋白中,介于与AAV2 VP1衣壳的N587和R588对应的氨基酸之间。非灵长类动物VP1衣壳蛋白的另外的合适的插入位点包含对应于AAV2的VP1衣壳蛋白的以下的那些插入位点:I-1、I-34、I-138、I-139、I-161、I-261、I-266、I-381、I-447,I-448、I-459、I-471、I-520、I-534、I-570、I-573、I-584、I-587、I-588、I-591,I-657、I-664、I-713和I-716(Wu等人,(2000)《病毒学杂志》74:8635-8647)。如本文所描述的经修饰的病毒衣壳蛋白可以是非灵长类动物衣壳蛋白,所述非灵长类动物衣壳蛋白包括插入到与选自由以下组成的组的AAV2衣壳蛋白的位置相对应的位置的蛋白质:蛋白质结合对的第一成员和/或可检测标记:I-1、I-34、I-138、I-139、I-161、I-261、I-266、I-381、I-447、I-448、I-459、I-471、I-520、I-534、I-570、I-573、I-584、I-587、I-588、I-591、I-657、I-664、I-713、I-716和其组合。非灵长类动物AAV的另外的合适的插入位点包含对应于以下的那些插入位点:AAV1的I-587、AAV1的I-589、AAV3的I-585、AAV4的I-585和AAV5的I-585。在一些实施例中,如本文所描述的经修饰的病毒衣壳蛋白可以是非灵长类动物衣壳蛋白,所述非灵长类动物衣壳蛋白包括插入到与选自由以下组成的组的位置相对应的位置的蛋白质:蛋白质结合对的第一成员和/或可检测标记:I-587(AAV1)、I-589(AAV1)、I-585(AAV3)、I-585(AAV4)、I-585(AAV5)和其组合。
在一些实施例中,将蛋白质:蛋白质结合对的第一成员和/或可检测标记插入在非灵长类动物AAV的VP1衣壳蛋白中,插入在与选自由以下组成的组的氨基酸位置相对应的氨基酸位置之后:禽类AAV衣壳蛋白VP1的I444、禽类AAV衣壳蛋白VP1的I580、鬃狮蜥AAV衣壳蛋白VP1的I573、鬃狮蜥AAV衣壳蛋白VP1的I436、海狮AAV衣壳蛋白VP1的I429、海狮AAV衣壳蛋白VP1的I430、海狮AAV衣壳蛋白VP1的I431、海狮AAV衣壳蛋白VP1的I432、海狮AAV衣壳蛋白VP1的I433、海狮AAV衣壳蛋白VP1的I434、海狮AAV衣壳蛋白VP1的I436、海狮AAV衣壳蛋白VP1的I437和海狮AAV衣壳蛋白VP1的I565。
本文中的命名法I-###、I#等是指用###命名相对于AAV衣壳蛋白的VP1蛋白的氨基酸编号的插入位点(I),然而,此类插入可以直接定位于N端或C端,优选地位于给定氨基酸的5个氨基酸的N端或C端,优选地给定氨基酸的3个、更优选地2个、尤其1个氨基酸的N端或C端的序列中的一个氨基酸的C端。另外,本文中所提及的位置是相对于由AAV衣壳基因编码的VP1蛋白的,并且可以通过进行由适当的AAV衣壳基因编码的VP1、VP2和VP3蛋白的序列比对而容易地鉴定由衣壳基因编码的VP2和VP3衣壳蛋白的对应位置(及其点突变)。
因此,插入至cap基因的这些位点之一的编码核酸的对应位置中使得插入至VP1、VP2和/或VP3中,因为衣壳蛋白由具有交错起始密码子的相同基因的重叠阅读框编码。因此,对于AAV2,举例来说,根据此命名法,插入在氨基酸1与138之间为仅插入至VP1中,插入在138与203之间为插入至VP1和VP2中,且插入在203与C端之间为插入至VP1、VP2和VP3中,对于插入位点I-587情况当然也是如此。因此,本发明涵盖在VP1、VP2和/或VP3蛋白中具有对应插入的AAV的结构基因。
本文还提供了对本发明的VP3衣壳蛋白进行编码的核酸。AAV衣壳蛋白可以但不一定由具有交错起始密码子的相同基因的重叠阅读框编码。在一些实施例中,对本发明的VP3衣壳蛋白进行编码的核酸不也对本发明的VP2衣壳蛋白或VP1衣壳蛋白也进行编码。在一些实施例中,对本发明的VP3衣壳蛋白进行编码的核酸也可以对本发明的VP2衣壳蛋白进行编码,但不也对本发明的VP1衣壳进行编码。在一些实施例中,对本发明的VP3衣壳蛋白进行编码的核酸也可以对本发明的VP2衣壳蛋白和本发明的VP1衣壳进行编码。
在一些实施例中,病毒衣壳包括经修饰的病毒衣壳蛋白,所述经修饰的病毒衣壳蛋白包括蛋白质:蛋白质结合对的第一成员和第二成员(例如,其中所述第二成员可操作地连接到靶向配体,包括多特异性结合蛋白等),所述病毒衣壳能够感染特定细胞,例如,与经修饰的病毒衣壳蛋白相同的对照病毒衣壳相比,具有增强的靶向和结合特定细胞的能力,除了所述对照病毒衣壳缺少蛋白质:蛋白质结合对的第一成员和第二成员中的一者或两者,例如包括对照衣壳蛋白。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出可检测的转导效率,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高10%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高20%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高30%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高40%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高50%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高60%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高70%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高75%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高80%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高85%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高90%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高95%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高99%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。
在一些实施例中,病毒衣壳包括经修饰的病毒衣壳蛋白,所述经修饰的病毒衣壳蛋白包括蛋白质:蛋白质结合对的第一成员和第二成员(例如,其中所述第二成员可操作地连接到靶向配体,包括多特异性结合蛋白等),所述病毒衣壳能够感染特定细胞,例如,与经修饰的病毒衣壳蛋白相同的对照病毒衣壳相比,具有增强的靶向和结合特定细胞的能力,除了所述对照病毒衣壳缺少蛋白质:蛋白质结合对的第一成员和第二成员中的一者或两者,例如包括对照衣壳蛋白。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出可检测的转导效率,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高10%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高20%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高30%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高40%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高50%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高60%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高70%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高75%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高80%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高85%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高90%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高95%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高99%,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少1.5倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少2倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少3倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少4倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少5倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少6倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少7倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少8倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少9倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少10倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少20倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少30倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的适当的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少40倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少50倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少60倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少70倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少80倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少90倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,与对照病毒衣壳的不可检测的转导效率相比,包括如本文所描述的经修饰的病毒衣壳蛋白的病毒衣壳表现出的转导效率高至少100倍,所述经修饰的病毒衣壳蛋白与连接到靶向配体的蛋白质:蛋白质结合对的第一成员和第二成员结合。在一些实施例中,本发明的病毒颗粒包括病毒衣壳蛋白,所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列,并且任选地包括蛋白质:蛋白质结合对的第一和第二成员(例如,其中所述第二成员可操作地连接到靶向配体,包括多特异性结合蛋白等),与适当的对照病毒颗粒(例如,包括AAV血清型的病毒衣壳,其中所述病毒衣壳的一部分包含在本发明的病毒衣壳中,例如,作为包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列的病毒衣壳蛋白的一部分)相比,所述病毒颗粒能够更好的逃避被从人患者分离的血清中的预先存在的抗体的中和,所述对照病毒颗粒还任选地包括蛋白质:蛋白质结合对的第一成员和第二成员(例如,其中所述第二成员可操作地连接到靶向配体,包括多特异性结合蛋白等)。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少2倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少2倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。
在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少3倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少3倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少4倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少4倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少5倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少5倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少6倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少6倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少7倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少7倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少8倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少8倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少9倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少9倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少10倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少10倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少20倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少20倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少30倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少30倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少40倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少40倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少50倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少50倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少60倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少60倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少70倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少70倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少80倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少80倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少90倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少90倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,与适当的对照病毒颗粒相比,本发明的包括病毒衣壳蛋白的病毒颗粒需要至少100倍以上的总IVIG或IgG进行中和(例如,50%或更高的感染抑制),例如,(例如,本发明的病毒颗粒的IC50值是对照病毒颗粒的IC50值的至少100倍),所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。在一些实施例中,本发明的包括病毒衣壳蛋白的病毒颗粒在与来自至少100个、10,000个、20,000个、30,000个、40,000个、50,000个、或更多个人供体的汇集的人血清Ig一起温育时具有不可检测的IC50,所述病毒衣壳蛋白包括非灵长类动物AAV、远程AAV或其组合的衣壳蛋白的氨基酸序列。
靶向配体
本文所描述的病毒颗粒可以进一步包括靶向配体。
在本发明的包括可检测标记的一些实施例中,靶向配体包括多特异性结合分子,所述多特异性结合分子包括(i)特异性地结合可检测标记的抗体互补位和(ii)特异性地结合受体的第二结合结构域,所述靶向配体可以与珠粒的(例如,用于纯化)表面缀合或由靶细胞表达。因此,包括(i)特异性地结合可检测标记的抗体互补位和(ii)特异性地结合受体的第二结合结构域的多特异性结合分子靶向病毒颗粒。此类“靶向”或“定向”可以包含这样一种情况:其中野生型病毒颗粒靶向组织内的若干个细胞和/或生物体内的若干个器官,通过插入可检测标记来减少直至消除对组织或器官的广泛靶向,并且利用多特异性结合分子实现对组织中更特定的细胞或生物体中更特定的器官的重新靶向。此类重新靶向或重定向也可以包含这样一种情况:其中野生型病毒颗粒靶向组织,通过插入可检测标记来减少直至消除对组织的靶向,并且利用多特异性结合分子实现对完全不同组织的重新靶向。如本文所描述的抗体互补位通常至少包括特异性地识别可检测标记的互补决定区(CDR),例如,重链和/或轻链可变结构域的CDR3区。在一些实施例中,多特异性结合分子包括抗体(或其一部分),所述抗体包括特异性地结合可检测标记的抗体互补位。例如,多特异性结合分子可以包括单结构域重链可变区或单结构域轻链可变区,其中单结构域重链可变区或单结构域轻链可变区包括特异性地结合可检测标记的抗体互补位。在一些实施例中,多特异性结合分子可以包括Fv区,例如,多特异性结合分子可以包括scFv,所述scFv包括特异性地结合可检测标记的抗体互补位。在一些实施例中,如本文所描述的多特异性结合分子包括特异性地结合c-myc(SEQ ID NO:44)的抗体互补位。
本发明的一个实施例为包括本发明的经修饰的病毒衣壳蛋白的多聚体结构。多聚体结构包括至少5个、优选地至少10个、更优选地至少30个、最优选地至少60个如本文所描述的经修饰的病毒衣壳蛋白,所述经修饰的病毒衣壳蛋白包括特异性结合对的第一成员。其可以形成常规病毒衣壳(空病毒颗粒)或病毒颗粒(使所关注核苷酸衣壳化的衣壳)。包括病毒基因组的病毒颗粒的形成是使用本文所描述的经修饰的病毒衣壳的高度优选特征。
本发明的另外的实施例是至少一种经修饰的病毒衣壳蛋白和/或对其进行编码的核酸的用途,优选地用于制造并用于将所关注核苷酸转移到靶细胞中的至少一种多聚体结构(例如,病毒颗粒)的用途。
使用和制造方法
本文所描述的经修饰的病毒衣壳蛋白的另外的实施例是其用于将所关注核苷酸例如报告基因或治疗性基因递送到靶细胞的用途。通常,所关注核苷酸可以是转移质粒,其通常可以包括侧接有报告基因或治疗性基因的5'和3'反向末端重复(ITR)序列(当涵盖在AAV颗粒内时,其可能处于病毒或非病毒启动子的控制下。在一个实施例中,所关注核苷酸是从5'到3'包括以下的转移质粒:5'ITR、启动子、基因(例如,报告基因和/或治疗性基因)和3'ITR。
适用启动子的非限制性实例包含例如巨细胞病毒(CMV)启动子、脾病灶形成病毒(SFFV)启动子、延长因子1α(EF1a)启动子(1.2kb的EFla启动子或0.2kb的EFla启动子)、嵌合EF 1a/IF4启动子和磷酸甘油酸激酶(PGK)启动子。内部增强子也可存在于病毒构筑体中,以增加所关注的基因的表达。例如,可使用CMV增强子(Karasuyama等人1989.《实验医学杂志(J.Exp.Med.)》169:13,其以全文引用的方式并入本文中)。在一些实施例中,CMV增强子可与鸡β-肌动蛋白启动子组合使用。
可以使多种报告基因(或可检测部分)衣壳化于包括本文所描述的经修饰的病毒衣壳蛋白的多聚体结构中。示例性报告基因包含例如β-半乳糖苷酶(所编码的lacZ基因)、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、MmGFP、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、Emerald、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合。本文所描述的方法展现了利用报告基因对绿色荧光蛋白进行编码的用途来构建靶向颗粒,然而,技术人员在阅读本公开后将理解,本文所描述的病毒颗粒可以在不存在报告基因的情况下或在具有本领域中已知的任何报告基因的情况下产生。
也可以使多种治疗性基因衣壳化于包括本文所描述的经修饰的病毒衣壳蛋白的多聚体结构中,例如,作为转移颗粒的一部分。治疗基因的非限制性实例包含编码毒素(例如自杀基因)、治疗抗体或其片段、CRISPR/Cas系统或其部分、反义RNA、siRNA、shRNA等的那些。
本发明的另外的实施例是一种制备经修饰的衣壳蛋白的方法,所述方法包括以下步骤:
a)在合适的条件下表达对经修饰的衣壳蛋白进行编码的核酸,以及
b)分离步骤a)的表达的衣壳蛋白。
在一些实施例中,如本文所述的病毒粒子包括嵌合衣壳,例如包括与参考衣壳蛋白呈某一比率的如本文所述地基因修饰(在不存在或存在与靶向配体的共价键的情况下)的衣壳蛋白的衣壳。一种用于制造此类嵌合病毒粒子的方法包括
a)在合适的条件下以至少约60:1到约1:60,例如,2:1、1:1、3:5、1:2、1:3等比率(wt/wt)表达对经修饰的衣壳蛋白进行编码的核酸和对参考衣壳蛋白进行编码的核苷酸,以及
b)分离步骤a)的表达的衣壳蛋白。
在一些实施例中,本文所描述的组合物包括以下,或本文所描述的方法将以下组合:经修饰的cap基因:参考cap基因(或参考cap基因的组合),其比率处于至少约1:60到约60:1,例如,2:1、1:1、3:5、1:2、1:3等的范围内的。在一些实施例中,所述比率为至少约1:2。在一些实施例中,所述比率为至少约1:3。在一些实施例中,所述比率为至少约1:4。在一些实施例中,所述比率为至少约1:5。在一些实施例中,所述比率为至少约1:6。在一些实施例中,所述比率为至少约1:7。在一些实施例中,所述比率为至少约1:8。在一些实施例中,所述比率为至少约1:9。在一些实施例中,所述比率为至少约1:10。在一些实施例中,所述比率为至少约1:11。在一些实施例中,所述比率为至少约1:12。在一些实施例中,所述比率为至少约1:13。在一些实施例中,所述比率为至少约1:14。在一些实施例中,所述比率为至少约1:15。在一些实施例中,所述比率为至少约1:16。在一些实施例中,所述比率为至少约1:17。在一些实施例中,所述比率为至少约1:18。在一些实施例中,所述比率为至少约1:19。在一些实施例中,所述比率为至少约1:20。在一些实施例中,所述比率为至少约1:25。在一些实施例中,所述比率为至少约1:30。在一些实施例中,所述比率为至少约1:35。在一些实施例中,所述比率为至少约1:40。在一些实施例中,所述比率为至少约1:45。在一些实施例中,所述比率为至少约1:50。在一些实施例中,所述比率为至少约1:55。在一些实施例中,所述比率为至少约1:60。在一些实施例中,所述比率为至少约2:1。在一些实施例中,所述比率为至少约3:1。在一些实施例中,所述比率为至少约4:1。在一些实施例中,所述比率为至少约5:1。在一些实施例中,所述比率为至少约6:1。在一些实施例中,所述比率为至少约7:1。在一些实施例中,所述比率为至少约8:1。在一些实施例中,所述比率为至少约9:1。在一些实施例中,所述比率为至少约10:1。在一些实施例中,所述比率为至少约11:1。在一些实施例中,所述比率为至少约12:1。在一些实施例中,所述比率为至少约13:1。在一些实施例中,所述比率为至少约14:1。在一些实施例中,所述比率为至少约15:1。在一些实施例中,所述比率为至少约16:1。在一些实施例中,所述比率为至少约17:1。在一些实施例中,所述比率为至少约18:1。在一些实施例中,所述比率为至少约19:1。在一些实施例中,所述比率为至少约20:1。在一些实施例中,所述比率为至少约25:1。在一些实施例中,所述比率为至少约30:1。在一些实施例中,所述比率为至少约35:1。在一些实施例中,所述比率为至少约40:1。在一些实施例中,所述比率为至少约45:1。在一些实施例中,所述比率为至少约50:1。在一些实施例中,所述比率为至少约55:1。在一些实施例中,所述比率为至少约60:1。
在一些实施例中,镶嵌病毒颗粒中的VP蛋白亚基的比率可以但不一定化学计量地反映经修饰的cap基因:参考cap基因的比率。作为非限制性示例性实施例,根据所述方法形成的镶嵌衣壳的经修饰的衣壳蛋白:参考衣壳蛋白比率可以被认为但不一定与用于产生镶嵌衣壳的对其进行编码的核酸的比率(wt:wt)类似。在一些实施例中,镶嵌衣壳包括约1:59到约59:1的蛋白质亚基比率。
本发明的另外的实施例是一种用于改变病毒的趋向性的方法,所述方法包括以下步骤:(a)将对氨基酸序列进行编码的核酸插入到对病毒衣壳蛋白进行编码的核酸序列中,以形成对包括氨基酸序列的经基因修饰的衣壳蛋白进行编码的核苷酸序列,和/或(b)在足以产生病毒颗粒的条件下培养包装细胞,其中包装细胞包括核酸。本发明的另外的实施例是一种用于在衣壳蛋白的表面上显示靶向配体的方法,所述方法包括以下步骤:(a)在合适的条件下表达对如本文所描述的经修饰的病毒衣壳蛋白进行编码的核酸(和任选地对参考衣壳蛋白进行编码的核苷酸),其中核酸对包括特异性结合对的第一成员的衣壳蛋白进行编码,(b)分离步骤(a)的包括特异性结合对的第一成员的经表达的衣壳蛋白或包括所述经表达的衣壳蛋白的衣壳,以及(c)在适于允许在第一成员与第二成员之间形成异肽键的条件下将衣壳蛋白或衣壳与特异性结合对的第二同源成员一起温育,其中特异性结合对的第二同源成员与靶向配体融合。
在一些实施例中,包装细胞进一步包括有包括所关注的核苷酸的辅助质粒和/或转移质粒。在一些实施例中,所述方法进一步包括从培养上清液分离自互补腺相关病毒颗粒。在一些实施例中,所述方法进一步包括裂解包装细胞以及从细胞裂解物中分离单链腺相关病毒颗粒。在一些实施例中,所述方法进一步包括(a)清除细胞碎片;(b)用核酸酶,例如DNase I和MgCl2处理含有病毒颗粒的上清液;(c)使病毒颗粒浓缩;(d)使病毒颗粒纯化;以及(e)(a)-(d)的任何组合。
可用于产生本文所描述的病毒颗粒的包装细胞包含例如允许病毒的动物细胞或被修饰以允许病毒的细胞;或包装细胞构建体,例如使用如磷酸钙的转化剂。可用于产生本文所描述的病毒颗粒的包装细胞系的非限制性实例包含例如人胚肾293(HEK-293)细胞(例如美国典型培养物保藏中心[ATCC]编号CRL-1573)、含有SV40大T-抗原的HEK-293细胞(HEK-293T或293T)、HEK293T/17细胞、人肉瘤细胞系HT-1080(CCL-121)、淋巴母细胞样细胞系Raji(CCL-86)、成胶质细胞瘤-星形细胞瘤上皮样细胞系U87-MG(HTB-14)、T-淋巴瘤细胞系HuT78(TIB-161)、NIH/3T3细胞、中国仓鼠卵巢细胞(CHO)(例如,ATCC编号CRL9618、CCL61、CRL9096)、HeLa细胞(例如,ATCC编号CCL-2)、Vero细胞、NIH 3T3细胞(例如,ATCC编号CRL-1658)、Huh-7细胞、BHK细胞(例如,ATCC编号CCL10)、PC12细胞(ATCC编号CRL1721)、COS细胞、COS-7细胞(ATCC编号CRL1651)、RATI细胞、小鼠L细胞(ATCC编号CCLI.3)、HLHepG2细胞、CAP细胞、CAP-T细胞等。
L929细胞、概述于Cosset等人(1995)《病毒学杂志》69,7430-7436中的FLY病毒包装细胞系统、NS0(鼠类骨髓瘤)细胞、人羊水细胞(例如CAP、CAP-T)、酵母细胞(包含但不限于酿酒酵母(S.cerevisiae)、甲醇酵母(Pichia pastoris))、植物细胞(包含但不限于烟草NTl、BY-2)、昆虫细胞(包含但不限于SF9、S2、SF21、Tni(例如High 5))或细菌细胞(包含但不限于大肠杆菌(E.coli))。
对于另外的包装细胞和系统、用于将核酸基因组包装到假型病毒颗粒中的包装技术和颗粒,参见例如,Polo等人,《美国国家科学院院刊》,(1999)96:4598-4603。包装方法包含使用永久性表达病毒组分的包装细胞,或通过用质粒瞬时转染细胞。
另外的实施例包含将病毒重定向到靶细胞和/或将报告基因或治疗性基因递送到所述靶细胞的方法,所述方法包括用于在体外(例如离体)或在体内转导细胞的方法,所述方法包括以下步骤:使所述靶细胞与包括本文所描述的衣壳的病毒颗粒接触,其中衣壳包括特异性地结合由靶细胞表达的受体的靶向配体。在一些实施例中,靶细胞处于体外(例如,离体)。在其它实施例中,靶细胞在个体,例如人的体内。
靶细胞
可以靶向多种细胞以使用如本文所公开的经修饰的病毒颗粒递送所关注核苷酸。靶细胞一般将基于所关注的核苷酸和所需的效果来选择。
在一些实施例中,可递送所关注的核苷酸以使得靶细胞能够产生蛋白质,所述蛋白质补偿生物体中的缺陷,如酶缺陷或免疫缺陷,如X连锁重症综合性免疫缺陷。因此,在一些实施例中,通常将在动物中产生蛋白质的细胞被靶向。在其它实施例中,在其中蛋白质将最有益的区域中的细胞被靶向。
在其它实施例中,所关注的核苷酸,如编码siRNA的基因可抑制靶细胞中特定基因的表达。所关注的核苷酸可例如抑制病原体生命周期中涉及的基因的表达。因此,可以靶向易受病原体感染或被病原体感染的细胞。在其它实施例中,所关注的核苷酸可抑制负责在靶细胞中产生毒素的基因的表达。
在其它实施例中,所关注的核苷酸可编码杀灭细胞的毒性蛋白,所关注的核苷酸表达于所述细胞中。在此情况下,可靶向肿瘤细胞或其它非所需的细胞。
在其它实施例中,所关注的核苷酸编码治疗蛋白。
一旦鉴别出在其中期望所关注的核苷酸的表达的特定靶细胞群体,选择特异性表达于靶细胞群体上的靶受体。靶受体可仅表达于细胞群体上或在比其它细胞群体更大的程度上表达于细胞群体上。表达越有特异性,则可将越有特异性的递送定向至靶细胞。取决于上下文,标记(以及因此基因递送)的特异性的所需量可变化。例如,为了引入毒性基因,高特异性为最优选的,以避免杀死非靶向细胞。为了表达用于收获的蛋白质,或表达在其中期望全域影响的分泌产物,可能需要较少的标记特异性。
如上文所论述,靶受体可为任何受体,可针对所述受体鉴别或产生靶向配体。优选地,靶受体为肽或多肽,如受体。但是,在其它实施例中,靶受体可为碳水化合物或其它可由结合搭配物识别的分子。如果已知用于靶受体的结合搭配物,例如配体,则其可用作亲和分子。但是,如果未知结合分子,则可使用标准程序产生靶受体的抗体。抗体可接着用作靶向配体。
因此,可以基于多种因素选择靶细胞,包含例如,(1)应用(例如,疗法、要收集的蛋白质的表达和赋予抗病性)和(2)具有所期望的特异性的量的标志物的表达。
靶细胞不以任何方式限制且包含种系细胞和细胞系以及体细胞和细胞系。靶细胞可为源自任何来源的干细胞。当靶细胞为种系细胞时,靶细胞优选地选自由单细胞胚胎和胚胎干细胞(ES)组成的群组。
药物组合物、剂型和施用
另外的实施例提供一种药物,所述药物包括至少一种根据本发明的经修饰的病毒衣壳蛋白和适当的靶向配体和/或根据本发明的核酸。优选地,此类药物可用于基因转移颗粒。
本文还公开包括本文所述的病毒粒子和药学上可接受的载体和/或赋形剂的药物组合物。另外,本文公开包括本文所述的病毒粒子的药物剂型。
如本文所论述,本文所述的病毒粒子可用于各种治疗应用(体内和离体)和用作研究工具。
本文公开的基于病毒粒子的药物组合物可使用一种或多种生理学上可接受的载体和/或赋形剂以任何常规方式配制。病毒粒子可被配制成用于通过例如注射、吸入或隔离(通过口腔或鼻子)施用,或通过经口、经颊、非经肠或经直肠施用,或通过直接施用至肿瘤。
药物组合物可被配制成用于多种施用模式,包含全身、局部或局部化施用。技术和配制物可见于例如《雷明顿氏药物科学(Remrnington's Pharmaceutical Sciences)》,Meade Publishing Co.,Easton,Pa中。对于全身施用,注射为优选的,包含肌肉内、静脉内、腹膜内和皮下。出于注射目的,药物组合物可在液体溶液中,优选地在生理学上相容的缓冲液,如汉克氏溶液(Hank's solution)或林格氏溶液(Ringer's solution)中配制。另外,药物组合物可以固体形式配制且在使用前立即再溶解或悬浮。药物组合物的冻干形式也是合适的。
对于经口施用,药物组合物可呈例如通过常规方式用药学上可接受的赋形剂制备的片剂或胶囊形式,所述赋形剂例如粘合剂(例如预胶凝玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素);填充剂(例如乳糖、微晶纤维素或磷酸氢钙);润滑剂(例如硬脂酸镁、滑石或二氧化硅);崩解剂(例如马铃薯淀粉或乙醇酸淀粉钠);或润湿剂(例如月桂基硫酸钠)。片剂也可通过所属领域中众所周知的方法包覆。用于经口施用的液体制剂可呈例如溶液、糖浆或悬浮液形式,或其可以干燥产品形式呈现,在使用之前用水或其它合适的媒剂复原。此类液体制剂可以通过常规方式用药学上可接受的添加剂,如悬浮剂制备,(例如,山梨糖醇糖浆、纤维素衍生物或氢化食用脂肪);乳化剂(例如,卵磷脂或阿拉伯胶);非水性媒剂(例如,油、油性酯、乙醇或馏分的植物油);和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。所述制剂在适当时还可含有缓冲盐、调味剂、着色剂和甜味剂。
药物组合物可被配制成用于通过注射,例如通过快速注射或连续输注进行非经肠施用。用于注射的配制物可以单位剂型呈现于例如安瓿或多剂量容器中,其中任选地添加有防腐剂。药物组合物可进一步配制为油性或水性媒剂中的悬浮液、溶液或乳液,且可含有其它试剂,包含悬浮剂、稳定剂和/或分散剂。
另外,药物组合物还可配制为积存制剂。这些长效配制物可通过植入(例如皮下或肌肉内)或通过肌肉内注射施用。因此,举例来说,所述化合物可用合适的聚合材料或疏水性材料(例如呈可接受的油中的乳液形式)或离子交换树脂,或呈微溶性衍生物形式,例如呈微溶性盐形式配制。其它合适的递送系统包含微球,其使得有可能在长时段内局部非侵入性递送药物。此技术可包含具有前毛细管尺寸的微球,其可通过冠状动脉导管注射至器官的任何选定部分中而不引起发炎或缺血。施用的治疗剂从微球缓慢释放且由所选组织中存在的周围细胞吸收。
全身施用还可通过经粘膜或经皮方式进行。对于经粘膜或经皮施用,在配制物中使用适于渗透屏障的渗透剂。此类渗透剂为所属领域中一般已知的,且例如对于经粘膜施用包含胆盐和梭链孢酸衍生物。此外,清洁剂可用于促进渗透。经粘膜施用可使用鼻喷雾剂或栓剂进行。对于局部施用,本文所述的病毒粒子可配制成所属领域中一般已知的软膏、药膏、凝胶或乳膏。也可局部使用洗涤溶液来治疗损伤或发炎,以加速愈合。
适合于注射使用的药物形式可包含无菌水溶液或分散液;包含芝麻油、花生油或水性丙二醇的配制物;和用于无菌可注射溶液或分散液的即用型制剂的无菌粉末。在所有情况下,所述形式必须为无菌的却必须为流体。其必须在制造条件和某些储存参数(例如制冷和冷冻)下稳定,且必须保藏免受微生物,如细菌和真菌的污染作用。
如果本文公开的配制物用作增强个体的免疫反应的治疗剂,则治疗剂可配制成中性或盐形式的组合物。药学上可接受的盐包含酸加成盐(由蛋白质的游离氨基形成),并且其由例如盐酸或磷酸的无机酸,或如乙酸、草酸、酒石酸、扁桃酸等有机酸形成。由游离羧基形成的盐也可源自无机碱,如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁,和有机碱,如异丙胺、三甲胺、组氨酸、普鲁卡因等。
载体也可为含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)、其合适的混合物和植物油的溶剂或分散介质。可例如通过使用如卵磷脂的涂层、通过在分散液的情况下维持所需的粒度和通过使用表面活性剂来维持适当的流动性。可通过所属领域中已知的各种抗细菌剂和抗真菌剂实现微生物作用的预防。在许多情况下,将优选地包含等渗剂,例如糖或氯化钠。通过在组合物中使用延迟吸收剂,例如单硬脂酸铝和明胶,可实现可注射组合物的长期吸收。
可通过将所需量的活性化合物或构筑体与上文列举的各种其它成分一起并入适当溶剂中,视需要接着过滤灭菌来制备无菌可注射溶液。
在配制后,溶液可以与剂量配制物相容的方式并且以治疗有效的量施用。配制物易于以多种剂型施用,如上文所述的可注射溶液的类型,但也可采用缓释胶囊或微粒和微球等。
例如,对于在水溶液中的非经肠施用,必要时应适当地缓冲溶液,且首先用足够生理盐水或葡糖使液体稀释剂呈现等渗。这些特定水溶液尤其适合于静脉内、瘤内、肌肉内、皮下和腹膜内施用。在此上下文中,可采用的无菌水性介质将为所属领域的技术人员鉴于本公开所已知的。例如,一个剂量可溶解于1ml等渗NaCl溶液中,且添加至1000ml皮下输液流体或注射于提出的输注部位。
负责施用的人员将在任何情况下确定个别个体的合适剂量。例如,取决于需要或暴露于病原生物体或个体的病况(例如癌症),可持续一定时段每天或每周,或每月、每年两次或每年向个体施用本文所述的病毒粒子。
除了被调配成用于不经肠施用,如静脉内、瘤内、皮内或肌肉内注射的化合物以外,其它药学上可接受的形式包含例如片剂或用于经口施用的其它固体;脂质体配制物;定时释放胶囊;可生物降解和当前使用任何其它形式。
还可使用鼻内或可吸入溶液或喷雾、气溶胶或吸入剂。鼻用溶液可为被设计成以滴剂或喷雾向鼻通道施用的水溶液。可制备鼻用溶液,以使其在许多方面类似于鼻分泌物。因此,水性鼻用溶液通常为等渗的且被略微缓冲以维持5.5至7.5的pH。另外,必要时可在配制物中包含抗微生物防腐剂(与用于眼用制剂的那些类似)和适当的药物稳定剂。各种商业鼻用制剂为已知的,且可包含例如抗生素和抗组织胺且用于预防哮喘。
口服配制物可包含赋形剂,如药物级的甘露糖醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素、碳酸镁等。这些组合物采用溶液、悬浮液、片剂、丸剂、胶囊、持续释放配制物或粉末的形式。在某些限定的实施例中,口服药物组合物将包含惰性稀释剂或可吸收的可食用载体,或其可封闭于硬壳或软壳明胶胶囊中,或其可压缩成片剂,或其可直接与饮食合并。对于口服治疗施用,活性化合物可与赋形剂合并且以可摄取的片剂、口含片、糖衣片、胶囊、酏剂、悬浮液、糖浆、粉片等形式使用。
片剂、糖衣片、丸剂、胶囊等还可含有以下:粘合剂,例如黄芪胶、阿拉伯胶、玉米淀粉或明胶;赋形剂,例如磷酸二钙;崩解剂,例如玉米淀粉、马铃薯淀粉、褐藻酸等;润滑剂,例如硬脂酸镁;且可添加甜味剂,例如蔗糖、乳糖或糖精;或调味剂,例如胡椒薄荷、冬青油或樱桃调味剂。当单位剂型为胶囊时,除了上述类型的材料之外,其可含有液体载体。各种其它材料可以涂层形式存在或用来以其它方式调节剂量单位的物理形式。例如,片剂、丸剂或胶囊可用虫胶、糖或两者包覆。酏剂的糖浆可含有活性化合物、作为甜味剂的蔗糖、作为防腐剂的对羟基苯甲酸甲酯和对羟基苯甲酸丙酯、染料以及调味剂,如樱桃或橙味调味剂。
本文公开的其它实施例可涉及与方法和组合物一起使用的试剂盒。试剂盒还可包含合适的容器,例如小瓶、管、微型或微量离心管、试管、烧瓶、瓶、注射器或其它容器。当提供额外的组分或试剂时,试剂盒可含有一个或多个可将此试剂或组分放入其中的额外容器。本文的试剂盒通常还将包含用于容纳病毒粒子的装置和任何其它密闭的试剂容器以供商业销售。此类容器可包含注射或吹塑成型塑料容器,其中可存留所需小瓶。任选地,所述组合物可能需要一种或多种额外活性剂,如消炎剂、抗病毒剂、抗真菌剂或抗细菌剂或抗肿瘤剂。
本文公开的组合物可通过所属领域中已知的任何方式施用。例如,组合物可包含静脉内、瘤内、皮内、动脉内、腹膜内、病灶内、颅内、关节内、前列腺内、胸膜内、气管内、鼻内、玻璃体内、阴道内、直肠内、局部、瘤内、肌肉内、鞘内、皮下、结膜下、囊泡内、经粘膜、心包内、脐内、眼内、经口、局部、通过吸入、通过注射、通过输注、通过连续输注、通过局部灌注、通过导管、通过灌洗、在乳膏中或在脂质组合物中向个体施用。
所属领域的技术人员已知的任何方法可用于大规模产生本文所述的病毒粒子、包装细胞和粒子构筑体。例如,可在GMP条件下在合格的原代CEF中或通过其它方法制备母液和工作种子储备液。包装细胞可涂铺于大表面积的烧瓶上,生长至接近汇合且纯化病毒粒子。可收获细胞且将病毒粒子释放至培养基中,分离且纯化,或通过机械破坏释放细胞内病毒粒子(细胞碎片可通过大孔深度过滤去除且用核酸内切酶消化宿主细胞DNA)。病毒粒子可随后通过切向流过滤,接着透滤来纯化和浓缩。所得浓缩的块体可通过用含有稳定剂的缓冲液稀释来配制,填充至小瓶中且冻干。组合物和配制物可储存以供后续使用。为了使用,冻干的病毒粒子可通过添加稀释剂复原。
用于组合疗法的某些额外药剂可通过所属领域中已知的任何方法来配制和施用。
如本文中所公开的组合物还可包含佐剂(如铝盐和其它矿物质佐剂)、表面活性剂、细菌衍生物、媒剂和细胞因子。佐剂还可具有拮抗免疫调节特性。例如,佐剂可刺激Th1或Th2免疫性。如本文中所公开的组合物和方法还可包含辅助疗法。
非限制性和示例性实施例在以下列出。
实施例1.一种AAV病毒颗粒,其包括AAV衣壳,
其中所述AAV衣壳的至少一种AAV衣壳蛋白包括选自由以下组成的组的衣壳蛋白的氨基酸序列的至少一部分:
非灵长类动物AAV的衣壳蛋白,
远程AAV的衣壳蛋白,和
其组合,并且
其中所述AAV衣壳的至少一种AAV衣壳蛋白被修饰以包括:
(a)至少一个蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;
(c)点突变;
(d)嵌合氨基酸序列,所述嵌合氨基酸序列包括其它AAV衣壳蛋白的氨基酸序列的可操作地连接到选自由所述非灵长类动物AAV的衣壳蛋白、所述远程AAV的衣壳蛋白或其组合组成的组的所述衣壳蛋白的所述氨基酸序列的一部分;以及
(e)(a)、(b)、(c)和(d)的任何组合。
实施例2.一种AAV病毒颗粒,其包括AAV衣壳,
其中所述AAV衣壳的至少一种AAV衣壳蛋白包括非灵长类动物AAV的衣壳蛋白的氨基酸序列的至少一部分,
其中所述AAV衣壳的至少一种AAV衣壳蛋白被修饰以包括:
(a)至少一个蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;
(c)点突变;
(d)嵌合氨基酸序列,所述嵌合氨基酸序列包括其它AAV衣壳蛋白的氨基酸序列可操作地连接到所述非灵长类动物AAV的所述衣壳的所述氨基酸序列的一部分;以及
(e)(a)、(b)、(c)和(d)的任何组合。
实施例3.一种AAV病毒颗粒,其包括AAV衣壳,
其中所述AAV衣壳的至少一种AAV衣壳蛋白包括远程AAV的衣壳蛋白的氨基酸序列的至少一部分,
其中所述AAV衣壳的至少一种AAV衣壳蛋白被修饰以包括:
(a)至少一个蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;
(c)点突变;
(d)嵌合氨基酸序列,所述嵌合氨基酸序列包括其它AAV衣壳蛋白的氨基酸序列的可操作地连接到所述远程AAV的所述衣壳的所述氨基酸序列的一部分;以及
(e)(a)、(b)、(c)和(d)的任何组合。
实施例4.一种AAV病毒颗粒,其包括:
(A)至少一种AAV衣壳蛋白,所述至少一种AAV衣壳蛋白包括选自由以下组成的组的氨基酸序列:
(i)非灵长类动物AAV的衣壳蛋白的氨基酸序列,
(ii)远程AAV的衣壳蛋白的氨基酸序列,和
(iii)其组合的氨基酸序列;以及
(B)AAV基因组,所述AAV基因组包括所关注核苷酸和AAV ITR,所述AAV ITR包括其它AAV的ITR序列的至少一部分。
实施例5.一种AAV病毒颗粒,其包括:
(A)至少一种AAV衣壳蛋白,所述至少一种AAV衣壳蛋白包括非灵长类动物AAV的衣壳蛋白的氨基酸序列;以及
(B)AAV基因组,所述AAV基因组包括所关注核苷酸和AAV ITR,所述AAV ITR包括其它AAV的ITR序列的至少一部分。
实施例6.一种AAV病毒颗粒,其包括:
(A)至少一种AAV衣壳蛋白,所述至少一种AAV衣壳蛋白包括远程AAV的衣壳蛋白的氨基酸序列;以及
(B)AAV基因组,所述AAV基因组包括所关注核苷酸和AAV ITR,所述AAV ITR包括其它AAV的ITR序列的至少一部分。
实施例7.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的所述氨基酸序列被修饰以包括:
(a)至少一个蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;
(c)点突变。
实施例8.根据实施例7所述的AAV颗粒,其中所述蛋白质:蛋白质结合对选自以下:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002。
实施例9.根据实施例7所述的AAV颗粒,其中所述蛋白质:蛋白质结合对的第一成员包括包含如SEQ ID NO:44所示的序列的c-myc。
实施例10.根据前述实施例中任一项所述的AAV颗粒,其中所述可检测标记包括包含IGTRYLTR(SEQ ID NO:45)的氨基酸序列的B1表位。
实施例11.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的所述氨基酸序列包括所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列和/或所述远程AAV的VP3衣壳蛋白的氨基酸序列。
实施例12.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV的所述衣壳蛋白所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的所述氨基酸序列包括所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列和/或所述远程AAV的VP2衣壳蛋白的氨基酸序列。
实施例13.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV的所述衣壳蛋白的所述衣壳蛋白、所述远程AAV的所述衣壳蛋白或其组合的所述氨基酸序列包括所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列和/或所述远程AAV的VP1衣壳蛋白的氨基酸序列。
实施例14.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述颗粒的所述衣壳包括:
(i)VP1衣壳蛋白,所述VP1衣壳蛋白是
嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u),或者
所述非灵长类动物AAV或所述远程AAV的VP1衣壳蛋白;
(ii)VP2衣壳蛋白,所述VP2衣壳蛋白是
嵌合AAV VP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP3区的VP1/VP2共同区,或者
所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;以及
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例15.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述颗粒的所述衣壳包括:
(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u);
(ii)嵌合AAV VP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP3区的VP1/VP2共同区;以及
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例16.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述颗粒的所述衣壳包括:
(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u);
(ii)所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;以及
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例17.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述衣壳包括:
(i)所述非灵长类动物AAV或所述远程AAV的VP1衣壳蛋白;
(ii)所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;以及
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例18.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述其它AAV是灵长类动物AAV或灵长类动物AAV的组合。
实施例19.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述其它AAV选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和其组合。
实施例20.根据前述实施例中任一项所述的AAV病毒颗粒,其中所述其它AAV是AAV2。
实施例21.根据实施例1到2、4到5和7到20中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV是表2中所列的非灵长类动物AAV。
实施例22.根据实施例1到2、4到5和7到21中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV是禽类AAV、海狮AAV或鬃狮蜥AAV。
实施例23.根据实施例1到2、4到5和7到22中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV是AAAV。
实施例24.根据实施例1到2、4到5和7到23中任一项所述的AAV病毒颗粒,其中所述修饰位于AAAV的VP1衣壳蛋白的位置I444或I580处。
实施例25.根据实施例1到2、4到5和7到22中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV是有鳞目动物AAV。
实施例26.根据实施例1到2、4到5、7到22和25中任一项所述的AAV病毒颗粒,其中所述有鳞目动物AAV是鬃狮蜥AAV。
实施例27.根据实施例1到2、4到5、7到22和25到26中任一项所述的AAV病毒颗粒,其中所述修饰位于鬃狮蜥AAV的VP1衣壳蛋白的位置I573或I436处。
实施例28.根据实施例1到2、4到5和7到22中任一项所述的AAV病毒颗粒,其中所述非灵长类动物AAV是哺乳动物AAV。
实施例29.根据实施例1到2、4到5、7到22和28中任一项所述的AAV病毒颗粒,其中所述哺乳动物AAV是海狮AAV。
实施例30.根据实施例1到2、4到5、7到22和28到29中任一项所述的AAV病毒颗粒,其中修饰位于海狮AAV的VP1的选自由以下组成的组的位置处:I429、I430、I431、I432、I433、I434、I436、I437和A565。
实施例31.根据前述实施例中任一项所述的AAV颗粒,其包括所述非灵长类动物AAV、所述远程AAV或其组合的VP3衣壳蛋白,其中所述VP3衣壳蛋白被修饰以包括:
(a)至少一个蛋白质:蛋白质结合对的第一成员,任选地其中所述蛋白质:蛋白质结合对选自由以下组成的组:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002;
(b)可检测标记,任选地其中所述可检测标记包括如SEQ ID NO:44所示的氨基酸序列或如SEQ ID NO:45所示的氨基酸序列;
(c)点突变;或者
(d)(a)、(b)和(c)的任何组合。
实施例32.根据实施例31所述的AAV颗粒,其中所述非灵长类动物AAV、所述远程AAV或其组合的所述VP3衣壳蛋白被修饰以包括:
(a)至少SpyTag,所述至少SpyTag包括如SEQ ID NO:42所示的氨基酸序列;和/或
(b)可检测标记,所述可检测标记包括如SEQ ID NO:45所示的氨基酸序列。
实施例33.根据前述实施例中任一项所述的AAV颗粒,其包括第一接头和/或第二接头,所述第一接头和/或所述第二接头将蛋白质:蛋白质结合对的第一成员和/或可检测标记可操作地连接到所述AAV颗粒的衣壳的衣壳蛋白。
实施例34.根据实施例33所述的AAV颗粒,其中所述第一接头和所述第二接头不相同。
实施例35.根据实施例33或实施例34所述的AAV颗粒,其中所述第一接头和所述第二接头相同。
实施例36.根据实施例33到35中任一项所述的AAV颗粒,其中所述第一接头和/或所述第二接头的长度为10个氨基酸。
实施例37.根据前述实施例中任一项所述的AAV颗粒,其包括蛋白质:蛋白质结合对的第一成员和/或可检测标记,所述蛋白质:蛋白质结合对的第一成员和/或所述可检测标记可操作地连接到所述AAV颗粒的衣壳的衣壳蛋白的可变区。
实施例38.根据实施例1或实施例2所述的AAV颗粒,其包括衣壳蛋白,所述衣壳蛋白包括选自由以下组成的组的氨基酸序列:
(a)如SEQ ID NO:2所示的氨基酸序列;
(b)如SEQ ID NO:4所示的氨基酸序列;
(c)如SEQ ID NO:6所示的氨基酸序列;
(d)如SEQ ID NO:8所示的氨基酸序列;
(e)如SEQ ID NO:10所示的氨基酸序列;
(f)如SEQ ID NO:12所示的氨基酸序列;
(g)如SEQ ID NO:14所示的氨基酸序列;
(h)如SEQ ID NO:16所示的氨基酸序列;
(i)如SEQ ID NO:18所示的氨基酸序列;
(j)如SEQ ID NO:20所示的氨基酸序列;
(k)如SEQ ID NO:22所示的氨基酸序列;
(l)如SEQ ID NO:24所示的氨基酸序列;
(m)如SEQ ID NO:26所示的氨基酸序列;
(n)如SEQ ID NO:28所示的氨基酸序列;
(o)如SEQ ID NO:30所示的氨基酸序列;
(p)如SEQ ID NO:32所示的氨基酸序列;
(q)如SEQ ID NO:34所示的氨基酸序列;
(r)如SEQ ID NO:36所示的氨基酸序列;
(s)如SEQ ID NO:53所示的氨基酸序列;
(t)如SEQ ID NO:55所示的氨基酸序列;
(u)如SEQ ID NO:57所示的氨基酸序列;
(v)如SEQ ID NO:59所示的氨基酸序列;
(w)如SEQ ID NO:61所示的氨基酸序列;
(x)如SEQ ID NO:63所示的氨基酸序列;
(y)如SEQ ID NO:65所示的氨基酸序列;
(z)如SEQ ID NO:67所示的氨基酸序列;
(aa)如SEQ ID NO:69所示的氨基酸序列;
(bb)如SEQ ID NO:71所示的氨基酸序列;
(cc)与以下具有显著序列同一性,例如至少95%同一性的氨基酸序列:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71;以及
(dd)(a)-(cc)中的任一项所示的氨基酸序列的任何VP2和/或VP3部分的氨基酸序列。
实施例39.根据前述实施例中任一项所述的AAV颗粒,其进一步包括参考衣壳蛋白,使得所述衣壳为镶嵌衣壳。
实施例40.根据前述实施例中任一项所述的AAV颗粒,其包括镶嵌衣壳,所述镶嵌衣壳包括用蛋白质:蛋白质结合对的第一成员修饰的所述VP3衣壳蛋白和参考VP3衣壳蛋白。
实施例41.一种腺相关病毒(AAV)衣壳蛋白,其包括非灵长类动物AAV或远程AAV的衣壳蛋白的氨基酸序列,其中所述AAV衣壳蛋白选自由以下组成的组:
(a)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合动物AAV VP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;
(b)非嵌合AAV VP1衣壳蛋白,所述非嵌合AAV VP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员和/或可检测标记;
(c)嵌合VP2衣壳蛋白,任选地其中所述嵌合AAV VP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;
(d)非嵌合AAV VP2衣壳蛋白,所述非嵌合AAV VP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;
(e)嵌合AAV VP3衣壳蛋白,所述嵌合AAV VP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变;以及
(f)非嵌合AAV VP3衣壳蛋白,所述非嵌合AAV VP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变。
实施例42.根据实施例41所述的AAV衣壳蛋白,其中所述蛋白质:蛋白质结合对的第一成员侧接有第一接头和/或第二接头,所述第一接头和/或所述第二接头将蛋白质:蛋白质结合对的第一成员连接到所述衣壳蛋白,并且其中所述第一接头和/或所述第二接头的长度各自独立地为至少一个氨基酸。
实施例43.根据实施例42所述的AAV衣壳蛋白,其中所述第一接头和所述第二接头不相同。
实施例44.根据实施例42所述的AAV衣壳蛋白,其中所述第一接头和所述第二接头相同并且长度为10个氨基酸。
实施例45.根据实施例41到44中任一项所述的AAV衣壳蛋白,其中所述衣壳蛋白进一步包括所述蛋白质:蛋白质结合对的第二同源成员,任选地其中所述第一成员和所述第二成员通过共价键,任选地异肽键结合。
实施例46.根据实施例41到45中任一项所述的AAV衣壳蛋白,其中所述蛋白质:蛋白质结合对的第一成员包括SpyTag。
实施例47.根据实施例45或实施例46所述的AAV衣壳蛋白,其中所述第二同源成员包括SpyCatcher。
实施例48.根据实施例45到47中任一项所述的AAV衣壳蛋白,其中所述第二同源成员包括KTag。
实施例49.根据实施例45所述的AAV衣壳蛋白,其中所述第一成员是KTag并且所述第二同源成员包括SpyTag。
实施例50.根据实施例45所述的AAV衣壳蛋白,其中所述第一成员是SnoopTag并且所述第二同源成员包括SnoopCatcher。
实施例51.根据实施例45所述的AAV衣壳蛋白,其中所述第一成员是isopeptag并且所述第二同源成员包括Pilin-C。
实施例52.根据实施例45所述的AAV衣壳蛋白,其中所述第一成员是SpyTag002并且所述第二同源成员包括SpyCatcher002。
实施例53.根据实施例45到52中任一项所述的AAV衣壳蛋白,其中所述第二成员可操作地连接到靶向配体,任选地其中所述靶向配体是结合部分。
实施例54.根据实施例53所述的AAV衣壳蛋白,其中所述结合部分是抗体或其一部分。
实施例55.根据实施例54所述的AAV衣壳蛋白,其中所述抗体或其一部分与SpyCatcher融合。
实施例56.根据实施例54或实施例55所述的AAV衣壳蛋白,其中所述抗体或其一部分在C端处与接头融合,并且所述接头在所述接头的C端处与SpyCatcher融合。
实施例57.根据实施例56所述的AAV衣壳蛋白,其中所述接头包括如SEQ ID NO:49(GSGESG)所示的序列。
实施例58.根据实施例41到57中任一项所述的AAV衣壳蛋白,其中所述可检测标记包括包含如SEQ ID NO:45所示的氨基酸序列的B1表位。
实施例59.根据实施例41到58中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是表2中所列的非灵长类动物AAV。
实施例60.根据实施例41到59中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是禽类AAV、海狮AAV或鬃狮蜥AAV。
实施例61.根据实施例41到60中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是AAAV。
实施例62.根据实施例41到61中任一项所述的AAV衣壳蛋白,其中所述修饰位于AAAV的VP1衣壳蛋白的位置I444或I580处。
实施例63.根据实施例41到60中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是有鳞目动物AAV。
实施例64.根据实施例41到60和63中任一项所述的AAV衣壳蛋白,其中所述有鳞目动物AAV是鬃狮蜥AAV。
实施例65.根据实施例41到60和63到64中任一项所述的AAV衣壳蛋白,其中所述修饰位于鬃狮蜥AAV的VP1衣壳蛋白的位置I573或I436处。
实施例66.根据实施例41到60中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是哺乳动物AAV。
实施例67.根据实施例41到60和66中任一项所述的AAV衣壳蛋白,其中所述哺乳动物AAV是海狮AAV。
实施例68.根据实施例41到60和66到67中任一项所述的AAV衣壳蛋白,其中修饰位于海狮AAV的VP1的选自由以下组成的组的位置处:I429、I430、I431、I432、I433、I434、I436、I437和A565。
实施例69.根据实施例41到68中任一项所述的AAV衣壳蛋白,其包括选自由以下组成的组的氨基酸序列:
(a)如SEQ ID NO:2所示的氨基酸序列;
(b)如SEQ ID NO:4所示的氨基酸序列;
(c)如SEQ ID NO:6所示的氨基酸序列;
(d)如SEQ ID NO:8所示的氨基酸序列;
(e)如SEQ ID NO:10所示的氨基酸序列;
(f)如SEQ ID NO:12所示的氨基酸序列;
(g)如SEQ ID NO:14所示的氨基酸序列;
(h)如SEQ ID NO:16所示的氨基酸序列;
(i)如SEQ ID NO:18所示的氨基酸序列;
(j)如SEQ ID NO:20所示的氨基酸序列;
(k)如SEQ ID NO:22所示的氨基酸序列;
(l)如SEQ ID NO:24所示的氨基酸序列;
(m)如SEQ ID NO:26所示的氨基酸序列;
(n)如SEQ ID NO:28所示的氨基酸序列;
(o)如SEQ ID NO:30所示的氨基酸序列;
(p)如SEQ ID NO:32所示的氨基酸序列;
(q)如SEQ ID NO:34所示的氨基酸序列;
(r)如SEQ ID NO:36所示的氨基酸序列;
(s)如SEQ ID NO:53所示的氨基酸序列;
(t)如SEQ ID NO:55所示的氨基酸序列;
(u)如SEQ ID NO:57所示的氨基酸序列;
(v)如SEQ ID NO:59所示的氨基酸序列;
(w)如SEQ ID NO:61所示的氨基酸序列;
(x)如SEQ ID NO:63所示的氨基酸序列;
(y)如SEQ ID NO:65所示的氨基酸序列;
(z)如SEQ ID NO:67所示的氨基酸序列;
(aa)如SEQ ID NO:69所示的氨基酸序列;
(bb)如SEQ ID NO:71所示的氨基酸序列;
(cc)与以下具有显著序列同一性,例如至少95%同一性的氨基酸序列:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71;以及
(dd)(a)-(cc)中的任一项所示的氨基酸序列的任何VP2和/或VP3部分的氨基酸序列。
实施例70.根据实施例41到69中任一项所述的AAV衣壳蛋白,其中所述蛋白质:蛋白质结合对的第一成员包括可检测标记。
实施例71.根据实施例70所述的AAV衣壳蛋白,其中所述可检测标记包括c-myc(SEQ ID NO:44)。
实施例72.一种AAV颗粒,其包括根据实施例41到71中任一项所述的AAV衣壳蛋白。
实施例73.一种核酸分子,其包括对根据实施例41到71中任一项所述的AAV衣壳蛋白进行编码的cap基因。
实施例74.一种核酸分子,其包括对AAV衣壳蛋白进行编码的AAV cap基因,
其中所述AAV cap基因包括选自由以下组成的组的cap基因的核苷酸序列的至少一部分:
(i)非灵长类动物AAV的cap基因,
(ii)远程AAV的cap基因,或
(iii)其组合,
其中所述AAV cap基因被进一步修饰以包括:
(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;
(b)对可检测标记进行编码的核苷酸序列;
(c)点突变;
(d)嵌合核苷酸序列,所述嵌合核苷酸序列包括其它AAV cap基因的核苷酸序列的一部分,所述AAV cap基因可操作地连接到选自由以下组成的组的AAV cap基因的所述核苷酸序列:cap基因非灵长类动物AAV、远程AAV或其组合;
(e)(a)、(b)、(c)和(d)的任何组合。
实施例75.一种核酸分子,其包括对AAV衣壳蛋白进行编码的AAV cap基因,
其中所述AAV cap基因包括非灵长类动物AAV的cap基因的核苷酸序列的至少一部分,
其中所述AAV cap基因被进一步修饰以包括:
(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;
(b)对可检测标记进行编码的核苷酸序列;
(c)点突变;
(d)嵌合核苷酸序列,所述嵌合核苷酸序列包括其它AAV cap基因的核苷酸序列的可操作地连接到所述cap基因非灵长类动物AAV的所述核苷酸序列的一部分;
(e)(a)、(b)、(c)和(d)的任何组合。
实施例76.一种核酸分子,其包括对AAV衣壳蛋白进行编码的AAV cap基因,
其中所述AAV cap基因包括远程动物AAV的cap基因的核苷酸序列的至少一部分,
其中所述AAV cap基因被进一步修饰以包括:
(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;
(b)对可检测标记进行编码的核苷酸序列;
(c)点突变;
(d)嵌合核苷酸序列,所述嵌合核苷酸序列包括其它AAV cap基因的核苷酸序列的可操作地连接到所述cap基因远程动物AAV的所述核苷酸序列的一部分;
(e)(a)、(b)、(c)和(d)的任何组合。
实施例77.一种核酸分子,其包括AAV rep基因和AAV cap基因,
其中所述AAV cap基因包括选自由以下组成的组的cap基因的第一核苷酸序列:
(i)非灵长类动物AAV的cap基因,
(ii)远程AAV的cap基因,以及
(iii)其组合,
其中所述AAV rep基因包括其它AAV的AAV rep基因的第二核苷酸序列。
实施例78.一种核酸分子,其包括AAV rep基因和AAV cap基因,
其中所述AAV cap基因包括非灵长类动物AAV的cap基因的第一核苷酸序列,
其中所述AAV rep基因包括其它AAV的AAV rep基因的第二核苷酸序列。
实施例79.一种核酸分子,其包括AAV rep基因和AAV cap基因,
其中所述AAV cap基因包括远程动物AAV的cap基因的第一核苷酸序列,
其中所述AAV rep基因包括其它AAV的AAV rep基因的第二核苷酸序列。
实施例80.根据实施例73到79中任一项所述的核酸分子,其中所述cap基因可操作地连接到启动子。
实施例81.根据实施例80所述的核酸分子,其中所述启动子指导衣壳蛋白在包装细胞中的表达。
实施例82.根据实施例80或实施例81所述的核酸分子,其中所述启动子选自p40、SV40、EF、CMV、B19p6和CAG。
实施例83.根据实施例73到82中任一项所述的核酸分子,其中所述非灵长类动物AAV的cap基因、所述远程AAV的所述cap基因或其组合的所述核苷酸序列被修饰以包括:
(a)对至少一个蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;
(b)对可检测标记进行编码的核苷酸序列;和/或
(c)对点突变进行编码的核苷酸序列。
实施例84.根据实施例83所述的核酸分子,其中所述蛋白质:蛋白质结合对选自以下:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002。
实施例85.根据实施例83所述的核酸分子,其中所述蛋白质:蛋白质结合对的第一成员包括包含如SEQ ID NO:44所示的序列的c-myc。
实施例86.根据实施例83到85中任一项所述的核酸分子,其中所述可检测标记包括包含IGTRYLTR(SEQ ID NO:45)的氨基酸序列的B1表位。
实施例87.根据实施例73到86中任一项所述的核酸分子,其中所述非灵长类动物AAV的所述cap基因、所述远程AAV的所述cap基因或其组合的所述核苷酸序列包括对所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列和/或所述远程AAV的VP3衣壳蛋白的氨基酸序列进行编码的核苷酸序列。
实施例88.根据实施例73到87中任一项所述的核酸分子,其中所述非灵长类动物AAV的所述cap基因、所述远程AAV的所述cap基因或其组合的所述核苷酸序列包括对所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列和/或所述远程AAV的VP2衣壳蛋白的氨基酸序列进行编码的核苷酸序列。
实施例89.根据实施例73到87中任一项所述的核酸分子,其中所述非灵长类动物AAV的所述cap基因、所述远程AAV的所述cap基因或其组合的所述核苷酸序列包括对所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列和/或所述远程AAV的VP1衣壳蛋白的氨基酸序列进行编码的核苷酸序列。
实施例90.根据实施例73到89中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)VP1衣壳蛋白,所述VP1衣壳蛋白是
嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u),或者
所述非灵长类动物AAV或所述远程AAV的VP1衣壳蛋白;
(ii)VP2衣壳蛋白,所述VP2衣壳蛋白是
嵌合AAV VP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP3区的VP1/VP2共同区,或者
所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;和/或
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例91.根据实施例73到90中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u);
(ii)嵌合AAV VP2衣壳蛋白,任选地其中所述嵌合VP2衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP3区的VP1/VP2共同区;和/或
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例92.根据实施例73到90中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合VP1衣壳蛋白包括其它AAV的可操作地连接到所述非灵长类动物AAV或所述远程AAV的VP1/VP2共同区和VP3区的VP1独特区(VP1-u);
(ii)所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;以及
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例93.根据实施例73到90中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)所述非灵长类动物AAV或所述远程AAV的VP1衣壳蛋白;
(ii)所述非灵长类动物AAV或所述远程AAV的VP2衣壳蛋白;和/或
(iii)所述非灵长类动物AAV或所述远程AAV的VP3衣壳蛋白。
实施例94.根据实施例73到93中任一项所述的核酸分子,其中所述其它AAV是灵长类动物AAV或灵长类动物AAV的组合。
实施例95.根据实施例73到94中任一项所述的核酸分子,其中所述其它AAV选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9及其组合。
实施例96.根据实施例73到95中任一项所述的核酸分子,其中所述其它AAV是AAV2。
实施例97.根据实施例73到75、77到78和80到96中任一项所述的核酸分子,其中所述非灵长类动物AAV是表2中所列的非灵长类动物AAV。
实施例98.根据实施例73到75、77到78和80到97中任一项所述的核酸分子,其中所述非灵长类动物AAV是禽类AAV、海狮AAV或鬃狮蜥AAV。
实施例99.根据实施例73到75、77到78和80到98中任一项所述的核酸分子,其中所述非灵长类动物AAV是AAAV。
实施例100.根据实施例73到75、77到78和80到99中任一项所述的核酸分子,其中所述修饰位于AAAV的VP1衣壳蛋白的密码子编码位置I444或I580处。
实施例101.根据实施例73到75、77到78和80到98中任一项所述的核酸分子,其中所述非灵长类动物AAV是有鳞目动物AAV。
实施例102.根据实施例73到75、77到78、80到98和101中任一项所述的核酸分子,其中所述有鳞目动物AAV是鬃狮蜥AAV。
实施例103.根据实施例73到75、76到77、和80到98以及101到102中任一项所述的核酸分子,其中所述修饰位于鬃狮蜥AAV的VP1衣壳蛋白的密码子编码位置I573或I436处。
实施例104.根据实施例73到75、76到77和80到98中任一项所述的核酸分子,其中所述非灵长类动物AAV是哺乳动物AAV。
实施例105.根据实施例73到75、77到78、80到98和104中任一项所述的核酸分子,其中所述哺乳动物AAV是海狮AAV。
实施例106.根据实施例73到75、77到78、80到98和105中任一项所述的核酸分子,其中修饰位于海狮AAV的VP1的选自由以下组成的组的位置处:I429、I430、I431、I432、I433、I434、I436、I437和A565。
实施例107.根据实施例73到106中任一项所述的核酸分子,其包括选自由以下组成的组的核苷酸序列:
(a)如SEQ ID NO:1所示的核苷酸序列;
(b)如SEQ ID NO:3所示的核苷酸序列;
(c)如SEQ ID NO:5所示的核苷酸序列;
(d)如SEQ ID NO:7所示的核苷酸序列;
(e)如SEQ ID NO:9所示的核苷酸序列;
(f)如SEQ ID NO:11所示的核苷酸序列;
(g)如SEQ ID NO:13所示的核苷酸序列;
(h)如SEQ ID NO:15所示的核苷酸序列;
(i)如SEQ ID NO:17所示的核苷酸序列;
(j)如SEQ ID NO:19所示的核苷酸序列;
(k)如SEQ ID NO:21所示的核苷酸序列;
(l)如SEQ ID NO:23所示的核苷酸序列;
(m)如SEQ ID NO:25所示的核苷酸序列;
(n)如SEQ ID NO:27所示的核苷酸序列;
(o)如SEQ ID NO:29所示的核苷酸序列;
(p)如SEQ ID NO:31所示的核苷酸序列;
(q)如SEQ ID NO:33所示的核苷酸序列;
(r)如SEQ ID NO:35所示的核苷酸序列;
(s)如SEQ ID NO:52所示的核苷酸序列;
(t)如SEQ ID NO:54所示的核苷酸序列;
(u)如SEQ ID NO:56所示的核苷酸序列;
(v)如SEQ ID NO:58所示的核苷酸序列;
(w)如SEQ ID NO:60所示的核苷酸序列;
(x)如SEQ ID NO:62所示的核苷酸序列;
(y)如SEQ ID NO:64所示的核苷酸序列;
(z)如SEQ ID NO:66所示的核苷酸序列;
(aa)如SEQ ID NO:68所示的核苷酸序列;
(bb)如SEQ ID NO:70所示的核苷酸序列;
(cc)与如以下所示的核苷酸序列具有显著序列同一性,例如至少95%同一性的核苷酸序列:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70,或对VP2衣壳进行编码的任何核苷酸序列;
(dd)(a)-(s)的对VP2衣壳蛋白和/或VP3衣壳蛋白进行编码的核苷酸序列的任何部分。
实施例108.根据实施例73到107中任一项所述的核酸分子,其进一步包括AAV rep基因,所述AAV rep基因对一种或多种AAV Rep蛋白进行编码并可操作地连接到启动子。
实施例109.根据实施例108所述的核酸分子,其中所述启动子选自由以下组成的组:p5、p19、SV40、EF、CMV、B19p6和CAG。
实施例110.根据实施例108或实施例109所述的核酸分子,其中所述一种或多种Rep蛋白选自Rep78、Rep68、Rep52和Rep40。
实施例111.根据实施例108到110中任一项所述的核酸分子,其中所述一种或多种Rep蛋白包括Rep78。
实施例112.根据实施例108到110中任一项所述的核酸分子,其中所述一种或多种Rep蛋白是灵长类动物AAV Rep蛋白。
实施例113.一种AAV衣壳蛋白,其包括根据实施例73到112中的核酸分子中的任一个核酸分子的氨基酸序列。
实施例114.一种AAV颗粒,其包括根据实施例113所述的衣壳蛋白。
实施例115.一种用于产生AAV颗粒的包装细胞,所述包装细胞包括根据实施例73到112中任一项所述的包括cap基因的核酸分子。
实施例116.根据实施例115所述的包装细胞,其进一步包括核酸分子,所述核酸分子包括对一种或多种AAV Rep蛋白进行编码的rep基因,其中所述rep基因可操作地连接到启动子,任选地其中所述rep基因和所述cap基因是两种不同的AAV。
实施例117.根据实施例116所述的包装细胞,其中可操作地连接到所述rep基因的所述启动子指导所述Rep蛋白在所述包装细胞中的表达。
实施例118.根据实施例116或实施例117所述的包装细胞,其中所述启动子选自p5、p19、SV40、EF、CMV、B19p6和CAG。
实施例119.根据实施例116到118中任一项所述的包装细胞,其中所述一种或多种Rep蛋白选自Rep78、Rep68、Rep52和Rep40。
实施例120.根据实施例116到119中任一项所述的包装细胞,其中所述一种或多种Rep蛋白包括Rep78。
实施例121.根据实施例116到120中任一项所述的包装细胞,其中所述一种或多种Rep蛋白是灵长类动物AAV Rep蛋白。
实施例122.根据实施例116到120中任一项所述的包装细胞,其中所述一种或多种Rep蛋白是非灵长类动物AAV Rep蛋白。
实施例123.根据实施例116到122中任一项所述的包装细胞,其进一步包括核酸分子,所述核酸分子包括所关注核苷酸的核苷酸序列,所述所关注核苷酸在至少一侧上侧接有由所述一种或多种Rep蛋白识别的至少一个AAV反向末端重复序列(ITR)。
实施例124.根据实施例123所述的包装细胞,其中所述核苷酸在另一侧上侧接有第二ITR,所述第二ITR与所述至少一个ITR的AAV相同。
实施例125.根据实施例124所述的包装细胞,其中所述核苷酸在另一侧上侧接有第二ITR,其中所述第二ITR和所述至少一个ITR的AAV不同。
实施例126.根据实施例123到125中任一项所述的包装细胞,其中所述所关注核苷酸是报告基因。
实施例127.根据实施例126所述的包装细胞,其中所述报告基因对以下进行编码:β-半乳糖苷酶、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、MmGFP、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、Emerald、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合。
实施例128.根据实施例123到125中任一项所述的包装细胞,其中所述所关注核苷酸对以下进行编码:治疗性蛋白、自杀基因、抗体或其片段、CRISPR/Cas系统或其一部分、反义寡核苷酸、核酶、RNAi分子或shRNA分子。
实施例129.根据实施例115到133中任一项所述的包装细胞,其进一步包括核苷酸序列,所述核苷酸序列对参考衣壳蛋白进行编码。
实施例130.一种产生病毒颗粒的方法,所述方法包括在足以产生病毒颗粒的条件下培养根据实施例115到129中任一项所述的包装细胞。
实施例131.根据实施例130所述的方法,其中所述包装细胞进一步包括包含所关注核苷酸的辅助质粒和/或转移质粒。
实施例132.根据实施例130或实施例131所述的方法,其进一步包括以下步骤中的一个或多个:
a.清除细胞碎片,
b.用Benzonase或DNase I和MgCl2处理含有病毒颗粒的上清液;
c.浓缩病毒粒子,
d.纯化所述病毒粒子,和
e.a-d的任何组合,
任选地其中所述病毒颗粒是自补腺相关病毒颗粒和/或从培养上清液中分离的。
实施例133.一种根据实施例130到132中任一项所述的方法制备的AAV颗粒。
实施例134.根据实施例1到40、72、114和133中任一项所述的AAV颗粒,其进一步包括所关注核苷酸。
实施例135.根据实施例134所述的AAV颗粒,其中所述所关注核苷酸是报告基因。
实施例136.根据实施例135所述的AAV颗粒,其中所述报告基因对以下进行编码:β-半乳糖苷酶、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、MmGFP、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、Emerald、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合。
实施例137.根据实施例134所述的AAV颗粒,其中所述所关注核苷酸对以下进行编码:治疗性蛋白、自杀基因、抗体或其片段、CRISPR/Cas系统或其一部分、反义寡核苷酸、核酶、RNAi分子或shRNA分子。
实施例138.一种药物组合物,其包括:(a)根据实施例1到40、72、114和133中任一项所述的AAV颗粒,AAV颗粒包括根据实施例41到71和113中任一项所述的AAV衣壳蛋白或根据实施例130到132中任一项所述的方法制备的AAV颗粒;以及(b)药学上可接受的载体或赋形剂。
实施例139.一种将所关注核苷酸递送到靶细胞的方法,所述方法包括使所述靶细胞与以下接触:(a)根据实施例1到40、72、114和133中任一项所述的AAV颗粒;或者(b)根据实施例138所述的组合物。
实施例140.根据实施例139所述的方法,其中所述AAV颗粒的衣壳包括靶向配体,所述靶向配体特异性地结合在所述靶细胞的表面上表达的蛋白质。
实施例141.根据实施例139或实施例140所述的方法,其中所述接触离体进行。
实施例142.根据实施例139或实施例140所述的方法,其中所述靶细胞处于受试者中。
实施例143.根据实施例142所述的方法,其中所述受试者是人。
实施例144.根据实施例139到143中任一项所述的方法,其中所述靶细胞是人细胞。
实施例145.根据实施例139到144中任一项所述的方法,其中所述所关注核苷酸对以下进行编码:治疗性蛋白、自杀基因、抗体或其片段、CRISPR/Cas系统或其一部分、反义寡核苷酸、核酶、RNAi分子或shRNA分子。
本发明提供的各个方面的实施方案也通过以下任意一个段落进行了描述。
实施方案1.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分、或远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAVVP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,
其中
I.所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳
蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:
蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,和/或
II.所述ITR序列或其一部分包括与第二AAV的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV或所述远程AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
实施方案2.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,并且
其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白
质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,
其中整个ITR序列或所述ITR序列的一部分包括与所述非灵长类动物AAV的ITR具有显著序列同一性,例如至少95%同一性的核酸序列,任选地其中所述ITR序列包括嵌合核酸序列,并且其中所述嵌合核酸序列的与所述非灵长类动物AAV的ITR具有显著序列同一性,例如至少95%同一性的一部分可操作地连接到所述嵌合核酸序列的与第二AAV的ITR具有显著序列同一性,例如至少95%同一性的一部分,其中所述第二AAV与所述非灵长类动物AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
实施方案3.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,任选地其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;以及
(d)(a)-(c)的任何组合,
其中所述ITR序列或其一部分包括与第二AAV的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
实施方案4.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAVVP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分中的至少一种包括嵌合氨基酸序列,所述嵌合氨基酸序列包括可操作地连接的以下:(A)与非灵长类动物AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;(B)与第二AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,
其中所述第二AAV与所述非灵长类动物AAV不同,
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主,并且任选地
其中包括嵌合氨基酸序列的所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳的任何部分中的所述至少一种进一步包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;以及
(c)(a)和(b)的组合。
实施方案5.根据前述实施方案中任一项所述的重组AAV颗粒,其中所述蛋白质:蛋白质结合对选自以下:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002。
实施方案6.根据前述实施方案中任一项所述的重组AAV颗粒,其中所述蛋白质:蛋白质结合对的第一成员包括包含如SEQ ID NO:44所示的序列的c-myc。
实施方案7.根据前述实施方案中任一项所述的重组AAV颗粒,其中所述可检测标记包括包含IGTRYLTR(SEQ ID NO:45)的氨基酸序列的B1表位。
实施方案8.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述衣壳蛋白或其一部分包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案9.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述衣壳蛋白或其一部分包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案10.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述衣壳蛋白或其一部分包括与所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案11.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中
(i)所述VP1衣壳蛋白包括:
嵌合氨基酸序列,任选地其中嵌合AAV VP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与所述非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;或者
与所述非灵长类动物AAV的VP1衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列,
(ii)所述VP2衣壳蛋白包括:
嵌合氨基酸序列,任选地其中嵌合AAV VP2衣壳蛋白的VP1/VP2共同区包括与第二AAV的VP1/VP2共同区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合VP2衣壳蛋白的VP3区与所述非灵长类动物AAV的VP3区包括至少95%同一性;或者
与所述非灵长类动物AAV的VP2衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且
(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案12.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中
(i)所述VP1衣壳蛋白包括嵌合氨基酸序列,任选地其中嵌合AAV VP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与所述非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,
(ii)所述VP2衣壳蛋白包括嵌合氨基酸序列,任选地其中嵌合AAV VP2衣壳蛋白的VP1/VP2共同区包括与第二AAV的VP1/VP2共同区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合VP2衣壳蛋白的VP3区与所述非灵长类动物AAV的VP3区包括至少95%同一性,并且
(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案13.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中
(i)所述AAV VP1衣壳蛋白包括嵌合氨基酸序列,任选地其中嵌合AAV VP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与所述非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,
(ii)所述VP2衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且
(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案14.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中
(i)所述VP1衣壳蛋白包括与所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,
(ii)所述VP2衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且
(iii)所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案15.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述第二AAV是灵长类动物AAV或灵长类动物AAV的组合。
实施方案16.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述第二AAV选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和其组合。
实施方案17.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述第二AAV是AAV2。
实施方案18.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述非灵长类动物AAV是选自表2中所列的组的非灵长类动物AAV。
实施方案19.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述非灵长类动物AAV是禽类AAV(AAAV)、海狮AAV或鬃狮蜥AAV。
实施方案20.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述非灵长类动物AAV是AAAV。
实施方案21.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述修饰位于AAAV的VP1衣壳蛋白的位置I444或I580处。
实施方案22.根据实施方案1到19中任一项所述的重组AAV病毒颗粒,其中所述非灵长类动物AAV是有鳞目动物AAV。
实施方案23.根据实施方案1到19和22中任一项所述的重组AAV病毒颗粒,其中所述有鳞目动物AAV是鬃狮蜥AAV。
实施方案24.根据实施方案1到19和22到23中任一项所述的重组AAV病毒颗粒,其中所述修饰位于鬃狮蜥AAV的VP1衣壳蛋白的位置I573或I436处。
实施方案25.根据实施方案1到19中任一项所述的重组AAV病毒颗粒,其中所述非灵长类动物AAV是哺乳动物AAV。
实施方案26.根据实施方案1到19和25中任一项所述的重组AAV病毒颗粒,其中所述哺乳动物AAV是海狮AAV。
实施方案27.根据实施方案1到19和25到26中任一项所述的重组AAV病毒颗粒,其中修饰位于海狮AAV的VP1的选自由以下组成的组的位置处:I429、I430、I431、I432、I433、I434、I436、I437和A565。
实施方案28.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述VP3衣壳蛋白被修饰以包括:
(a)至少一个蛋白质:蛋白质结合对的第一成员,任选地其中所述蛋白质:蛋白质结合对选自由以下组成的组:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002;
(b)可检测标记,任选地其中所述可检测标记包括如SEQ ID NO:44所示的氨基酸序列或如SEQ ID NO:45所示的氨基酸序列;
(c)点突变;或者
(d)(a)、(b)和(c)的任何组合。
实施方案29.根据实施方案28所述的重组AAV病毒颗粒,其中所述VP3衣壳蛋白被修饰以包括:
(a)至少一种SpyTag,所述至少一种SpyTag包括如SEQ ID NO:42所示的氨基酸序列;和/或
(b)可检测标记,所述可检测标记包括如SEQ ID NO:45所示的氨基酸序列。
实施方案30.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其包括第一接头和/或第二接头,所述第一接头和/或所述第二接头将蛋白质:蛋白质结合对的第一成员和/或可检测标记可操作地连接到所述AAV颗粒的衣壳的衣壳蛋白。
实施方案31.根据实施方案30所述的重组AAV病毒颗粒,其中所述第一接头和所述第二接头不相同。
实施方案32.根据实施方案30所述的重组AAV病毒颗粒,其中所述第一接头和所述第二接头相同。
实施方案33.根据实施方案30到32中任一项所述的重组AAV病毒颗粒,其中所述第一接头和/或所述第二接头的长度为10个氨基酸。
实施方案34.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其包括蛋白质:蛋白质结合对的第一成员和/或可检测标记,所述蛋白质:蛋白质结合对的第一成员和/或所述可检测标记可操作地连接到所述AAV颗粒的衣壳的衣壳蛋白的可变区。
实施方案35.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其包括衣壳蛋白,所述衣壳蛋白包括选自由以下组成的组的氨基酸序列:
(a)如SEQ ID NO:2所示的氨基酸序列;
(b)如SEQ ID NO:4所示的氨基酸序列;
(c)如SEQ ID NO:6所示的氨基酸序列;
(d)如SEQ ID NO:8所示的氨基酸序列;
(e)如SEQ ID NO:10所示的氨基酸序列;
(f)如SEQ ID NO:12所示的氨基酸序列;
(g)如SEQ ID NO:14所示的氨基酸序列;
(h)如SEQ ID NO:16所示的氨基酸序列;
(i)如SEQ ID NO:18所示的氨基酸序列;
(j)如SEQ ID NO:20所示的氨基酸序列;
(k)如SEQ ID NO:22所示的氨基酸序列;
(l)如SEQ ID NO:24所示的氨基酸序列;
(m)如SEQ ID NO:26所示的氨基酸序列;
(n)如SEQ ID NO:28所示的氨基酸序列;
(o)如SEQ ID NO:30所示的氨基酸序列;
(p)如SEQ ID NO:32所示的氨基酸序列;
(q)如SEQ ID NO:34所示的氨基酸序列;
(r)如SEQ ID NO:36所示的氨基酸序列;
(s)如SEQ ID NO:53所示的氨基酸序列;
(t)如SEQ ID NO:55所示的氨基酸序列;
(u)如SEQ ID NO:57所示的氨基酸序列;
(v)如SEQ ID NO:59所示的氨基酸序列;
(w)如SEQ ID NO:61所示的氨基酸序列;
(x)如SEQ ID NO:63所示的氨基酸序列;
(y)如SEQ ID NO:65所示的氨基酸序列;
(z)如SEQ ID NO:67所示的氨基酸序列;
(aa)如SEQ ID NO:69所示的氨基酸序列;
(bb)如SEQ ID NO:71所示的氨基酸序列;
(cc)与以下具有显著序列同一性,例如至少95%同一性的氨基酸序列:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71;以及
(dd)(a)-(cc)中的任一项所示的氨基酸序列的任何VP2和/或VP3部分的氨基酸序列。
实施方案36.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其进一步包括参考衣壳蛋白,使得所述衣壳为镶嵌衣壳。
实施方案37.根据前述实施方案中任一项所述的重组AAV病毒颗粒,其中所述VP3衣壳蛋白包括具有蛋白质:蛋白质结合对的第一成员的修饰,其中所述衣壳进一步包括缺乏所述蛋白质:蛋白质结合对的第一成员的参考VP3衣壳蛋白。
实施方案38.一种腺相关病毒(AAV)衣壳蛋白,其包括氨基酸序列,其中所述氨基酸序列或其一部分与非灵长类动物AAV或其一部分或远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性,
其中所述AAV衣壳蛋白选自由以下组成的组:
(a)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合AAV VP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(b)所述非灵长类动物AAV或所述远程AAV的非嵌合AAV VP1衣壳蛋白,所述非嵌合AAV VP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(c)嵌合VP2衣壳蛋白,任选地其中所述嵌合AAV VP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)所述非灵长类动物AAV或所述远程AAV的非嵌合AAV VP2衣壳蛋白,所述非嵌合AAV VP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(e)嵌合AAV VP3衣壳蛋白,所述嵌合AAV VP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;以及
(f)所述非人AAV或远程AAV的非嵌合AAV VP3衣壳蛋白,所述非嵌合AAV VP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记。
实施方案39.根据实施方案38所述的AAV衣壳蛋白,其中所述蛋白质:蛋白质结合对的第一成员侧接有第一接头和/或第二接头,所述第一接头和/或所述第二接头将蛋白质:蛋白质结合对的第一成员连接到所述衣壳蛋白,并且其中所述第一接头和/或所述第二接头的长度各自独立地为至少一个氨基酸。
实施方案40.根据实施方案39所述的AAV衣壳蛋白,其中所述第一接头和所述第二接头不相同。
实施方案41.根据实施方案39所述的AAV衣壳蛋白,其中所述第一接头和所述第二接头相同并且长度为10个氨基酸。
实施方案42.根据实施方案38到41中任一项所述的AAV衣壳蛋白,其中所述衣壳蛋白进一步包括所述蛋白质:蛋白质结合对的第二同源成员,任选地其中所述第一成员和所述第二成员通过共价键,任选地异肽键结合。
实施方案43.根据实施方案38到42中任一项所述的AAV衣壳蛋白,其中所述蛋白质:蛋白质结合对的第一成员包括SpyTag。
实施方案44.根据实施方案42或实施方案43所述的AAV衣壳蛋白,其中所述第二同源成员包括SpyCatcher。
实施方案45.根据实施方案42到44中任一项所述的AAV衣壳蛋白,其中所述第二同源成员包括KTag。
实施方案46.根据实施方案42所述的AAV衣壳蛋白,其中所述第一成员是KTag并且所述第二同源成员包括SpyTag。
实施方案47.根据实施方案42所述的AAV衣壳蛋白,其中所述第一成员是SnoopTag并且所述第二同源成员包括SnoopCatcher。
实施方案48.根据实施方案42所述的AAV衣壳蛋白,其中所述第一成员是isopeptag并且所述第二同源成员包括Pilin-C。
实施方案49.根据实施方案42所述的AAV衣壳蛋白,其中所述第一成员是SpyTag002并且所述第二同源成员包括SpyCatcher002。
实施方案50.根据实施方案42到49中任一项所述的AAV衣壳蛋白,其中所述第二成员可操作地连接到靶向配体,任选地其中所述靶向配体是结合部分。
实施方案51.根据实施方案50所述的AAV衣壳蛋白,其中所述结合部分是抗体或其一部分。
实施方案52.根据实施方案51所述的AAV衣壳蛋白,其中所述抗体或其一部分与SpyCatcher融合。
实施方案53.根据实施方案51或实施方案52所述的AAV衣壳蛋白,其中所述抗体或其一部分在C端处与接头融合,并且所述接头在所述接头的C端处与SpyCatcher融合。
实施方案54.根据实施方案53所述的AAV衣壳蛋白,其中所述接头包括如SEQ IDNO:49(GSGESG)所示的序列。
实施方案55.根据实施方案38到54中任一项所述的AAV衣壳蛋白,其中所述可检测标记包括如SEQ ID NO:45所示的氨基酸序列的B1表位。
实施方案56.根据实施方案38到55中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是表2中所列的非灵长类动物AAV。
实施方案57.根据实施方案38到56中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是禽类AAV(AAAV)、海狮AAV或鬃狮蜥AAV。
实施方案58.根据实施方案38到57中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是AAAV。
实施方案59.根据实施方案38到58中任一项所述的AAV衣壳蛋白,其中所述修饰位于AAAV的VP1衣壳蛋白的位置I444或I580处。
实施方案60.根据实施方案38到56中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是有鳞目动物AAV。
实施方案61.根据实施方案38到56和60中任一项所述的AAV衣壳蛋白,其中所述有鳞目动物AAV是鬃狮蜥AAV。
实施方案62.根据实施方案38到56和60到61中任一项所述的AAV衣壳蛋白,其中所述修饰位于鬃狮蜥AAV的VP1衣壳蛋白的位置I573或I436处。
实施方案63.根据实施方案38到56中任一项所述的AAV衣壳蛋白,其中所述非灵长类动物AAV是哺乳动物AAV。
实施方案64.根据实施方案38到56和63中任一项所述的AAV衣壳蛋白,其中所述哺乳动物AAV是海狮AAV。
实施方案65.根据实施方案38到56和63到64中任一项所述的AAV衣壳蛋白,其中修饰位于海狮AAV的VP1的选自由以下组成的组的位置处:I429、I430、I431、I432、I433、I434、I436、I437和A565。
实施方案66.根据实施方案38到65中任一项所述的AAV衣壳蛋白,其包括选自由以下组成的组的氨基酸序列:
(a)如SEQ ID NO:2所示的氨基酸序列;
(b)如SEQ ID NO:4所示的氨基酸序列;
(c)如SEQ ID NO:6所示的氨基酸序列;
(d)如SEQ ID NO:8所示的氨基酸序列;
(e)如SEQ ID NO:10所示的氨基酸序列;
(f)如SEQ ID NO:12所示的氨基酸序列;
(g)如SEQ ID NO:14所示的氨基酸序列;
(h)如SEQ ID NO:16所示的氨基酸序列;
(i)如SEQ ID NO:18所示的氨基酸序列;
(j)如SEQ ID NO:20所示的氨基酸序列;
(k)如SEQ ID NO:22所示的氨基酸序列;
(l)如SEQ ID NO:24所示的氨基酸序列;
(m)如SEQ ID NO:26所示的氨基酸序列;
(n)如SEQ ID NO:28所示的氨基酸序列;
(o)如SEQ ID NO:30所示的氨基酸序列;
(p)如SEQ ID NO:32所示的氨基酸序列;
(q)如SEQ ID NO:34所示的氨基酸序列;
(r)如SEQ ID NO:36所示的氨基酸序列;
(s)如SEQ ID NO:53所示的氨基酸序列;
(t)如SEQ ID NO:55所示的氨基酸序列;
(u)如SEQ ID NO:57所示的氨基酸序列;
(v)如SEQ ID NO:59所示的氨基酸序列;
(w)如SEQ ID NO:61所示的氨基酸序列;
(x)如SEQ ID NO:63所示的氨基酸序列;
(y)如SEQ ID NO:65所示的氨基酸序列;
(z)如SEQ ID NO:67所示的氨基酸序列;
(aa)如SEQ ID NO:69所示的氨基酸序列;
(bb)如SEQ ID NO:71所示的氨基酸序列;
(cc)与以下具有显著序列同一性,例如至少95%同一性的氨基酸序列:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69或SEQ ID NO:71;以及
(dd)(a)-(cc)中的任一项所示的氨基酸序列的任何VP2和/或VP3部分的氨基酸序列。
实施方案67.根据实施方案38到66中任一项所述的AAV衣壳蛋白,其中所述蛋白质:蛋白质结合对的第一成员包括可检测标记。
实施方案68.根据实施方案67所述的AAV衣壳蛋白,其中所述可检测标记包括c-myc(SEQ ID NO:44)。
实施方案69.一种AAV颗粒,其包括根据实施方案38到68中任一项所述的AAV衣壳蛋白。
实施方案70.一种核酸分子,其包括对根据实施方案38到68中任一项所述的AAV衣壳蛋白进行编码的cap基因。
实施方案71.一种核酸分子,其包括对AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白进行编码的AAV cap基因,
其中所述AAV cap基因或其一部分包括与非灵长类动物AAV或其一部分、或远程AAV或其一部分的cap基因的核酸序列具有显著序列同一性,例如至少95%同一性的核酸序列,并且
其中所述AAV cap基因被进一步修饰以包括:
(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;
(b)对可检测标记进行编码的核苷酸序列;
(c)点突变;
(d)嵌合核苷酸序列;或者
(e)(a)、(b)、(c)和(d)的任何组合。
实施方案72.一种核酸分子,其包括AAV rep基因和AAV cap基因,
其中整个AAV cap基因包括与非灵长类动物AAV或远程AAV的cap基因的核酸序列具有显著序列同一性,例如至少95%同一性的第一核酸序列,并且
其中所述AAV rep基因或其一部分包括与第二AAV或其一部分的rep基因的核酸序列具有显著序列同一性,例如至少95%同一性的第二核酸序列,并且
其中所述非灵长类动物AAV与所述第二AAV不相同。
实施方案73.根据实施方案70到72中任一项所述的核酸分子,其中所述cap基因可操作地连接到启动子。
实施方案74.根据实施方案73所述的核酸分子,其中所述启动子指导衣壳蛋白在包装细胞中的表达。
实施方案75.根据实施方案73或实施方案74所述的核酸分子,其中所述启动子选自p40、SV40、EF、CMV、B19p6和CAG。
实施方案76.根据实施方案70到75中任一项所述的核酸分子,其中所述AAV cap基因被修饰以包括:
(a)对至少一个蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;
(b)对可检测标记进行编码的核苷酸序列;和/或
(c)对点突变进行编码的核苷酸序列。
实施方案77.根据实施方案76所述的核酸分子,其中所述蛋白质:蛋白质结合对选自以下:SpyTag:SpyCatcher、SpyTag:KTag、Isopeptag:pilin-C、SnoopTag:SnoopCatcher和SpyTag002:SpyCatcher002。
实施方案78.根据实施方案76所述的核酸分子,其中所述蛋白质:蛋白质结合对的第一成员包括包含如SEQ ID NO:44所示的序列的c-myc。
实施方案79.根据实施方案76到78中任一项所述的核酸分子,其中所述可检测标记包括包含IGTRYLTR(SEQ ID NO:45)的氨基酸序列的B1表位。
实施方案80.根据实施方案70到79中任一项所述的核酸分子,其中所述cap基因对VP3衣壳蛋白进行编码,其中所述VP3衣壳蛋白或其一部分包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案81.根据实施方案70到80中任一项所述的核酸分子,其中所述cap基因对VP2衣壳蛋白进行编码,其中所述VP2衣壳蛋白或其一部分包括与所述非灵长类动物AAV的VP2衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案82.根据实施方案70到81中任一项所述的核酸分子,其中所述cap基因对VP1衣壳蛋白进行编码,其中所述VP1衣壳蛋白或其一部分包括与所述非灵长类动物AAV的VP1衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案83.根据实施方案70到82中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)VP1衣壳蛋白,所述VP1衣壳蛋白包括:
嵌合氨基酸序列,任选地其中嵌合AAV VP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与所述非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;或者
与所述非灵长类动物AAV的VP1衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列,
(ii)VP2衣壳蛋白,所述VP2衣壳蛋白包括:
嵌合氨基酸序列,任选地其中嵌合AAV VP2衣壳蛋白的VP1/VP2共同区包括与第二AAV的VP1/VP2共同区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合VP2衣壳蛋白的VP3区包括与所述非灵长类动物AAV的VP3区具有显著序列同一性,例如至少95%同一性的氨基酸序列;或者
与所述非灵长类动物AAV的VP2衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列;和/或
(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案84.根据实施方案70到83中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)VP1衣壳蛋白,所述VP1衣壳蛋白包括嵌合氨基酸序列,任选地其中嵌合AAVVP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与所述非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;
(ii)VP2衣壳蛋白,所述VP2衣壳蛋白包括嵌合氨基酸序列,任选地其中嵌合AAVVP2衣壳蛋白的VP1/VP2共同区包括与第二AAV的VP1/VP2共同区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合VP2衣壳蛋白的VP3区包括与所述非灵长类动物AAV的VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;和/或
(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案85.根据实施方案70到84中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)VP1衣壳蛋白,所述VP1衣壳蛋白包括嵌合氨基酸序列,任选地其中嵌合AAVVP1衣壳蛋白的VP1独特区(VP1-u)包括与第二AAV的VP1-u的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,并且其中嵌合AAV VP1衣壳的VP1/VP2共同区和VP3区包括与所述非灵长类动物AAV的VP1/VP2共同区和VP3区的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;
(ii)VP2衣壳蛋白,所述VP2衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列;以及
(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案86.根据实施方案70到83中任一项所述的核酸分子,其中cap基因对以下进行编码:
(i)VP1衣壳蛋白,所述VP1衣壳蛋白包括与所述非灵长类动物AAV的VP1衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列;
(ii)VP2衣壳蛋白,所述VP2衣壳蛋白包括与所述非灵长类动物AAV的VP2衣壳蛋白具有显著序列同一性,例如至少95%同一性的氨基酸序列;以及
(iii)VP3衣壳蛋白,所述VP3衣壳蛋白包括与所述非灵长类动物AAV的VP3衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列。
实施方案87.根据实施方案70到86中任一项所述的核酸分子,其中所述第二AAV是灵长类动物AAV或灵长类动物AAV的组合。
实施方案88.根据实施方案70到87中任一项所述的核酸分子,其中所述第二AAV选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和其组合。
实施方案89.根据实施方案70到88中任一项所述的核酸分子,其中所述第二AAV是AAV2。
实施方案90.根据实施方案70到89中任一项所述的核酸分子,其中所述非灵长类动物AAV是选自表2中所列的非灵长类动物AAV的非灵长类动物AAV。
实施方案91.根据实施方案70到90中任一项所述的核酸分子,其中所述非灵长类动物AAV是禽类AAV、海狮AAV或鬃狮蜥AAV。
实施方案92.根据实施方案70到91中任一项所述的核酸分子,其中所述非灵长类动物AAV是AAAV。
实施方案93.根据实施方案70到92中任一项所述的核酸分子,其中所述修饰位于AAAV的VP1衣壳蛋白的密码子编码位置I444或I580处。
实施方案94.根据实施方案70到91中任一项所述的核酸分子,其中所述非灵长类动物AAV是有鳞目动物AAV。
实施方案95.根据实施方案70到91和94中任一项所述的核酸分子,其中所述有鳞目动物AAV是鬃狮蜥AAV。
实施方案96.根据实施方案70到91和94到95中任一项所述的核酸分子,其中所述修饰位于鬃狮蜥AAV的VP1衣壳蛋白的密码子编码位置I573或I436处。
实施方案97.根据实施方案70到91中任一项所述的核酸分子,其中所述非灵长类动物AAV是哺乳动物AAV。
实施方案98.根据实施方案70到91和97中任一项所述的核酸分子,其中所述哺乳动物AAV是海狮AAV。
实施方案99.根据实施方案70到91和97到98中任一项所述的核酸分子,其中修饰位于海狮AAV的VP1的选自由以下组成的组的位置处:I429、I430、I431、I432、I433、I434、I436、I437和A565。
实施方案100.根据实施方案70到99中任一项所述的核酸分子,其包括选自由以下组成的组的核苷酸序列:
(a)如SEQ ID NO:1所示的核苷酸序列;
(b)如SEQ ID NO:3所示的核苷酸序列;
(c)如SEQ ID NO:5所示的核苷酸序列;
(d)如SEQ ID NO:7所示的核苷酸序列;
(e)如SEQ ID NO:9所示的核苷酸序列;
(f)如SEQ ID NO:11所示的核苷酸序列;
(g)如SEQ ID NO:13所示的核苷酸序列;
(h)如SEQ ID NO:15所示的核苷酸序列;
(i)如SEQ ID NO:17所示的核苷酸序列;
(j)如SEQ ID NO:19所示的核苷酸序列;
(k)如SEQ ID NO:21所示的核苷酸序列;
(l)如SEQ ID NO:23所示的核苷酸序列;
(m)如SEQ ID NO:25所示的核苷酸序列;
(n)如SEQ ID NO:27所示的核苷酸序列;
(o)如SEQ ID NO:29所示的核苷酸序列;
(p)如SEQ ID NO:31所示的核苷酸序列;
(q)如SEQ ID NO:33所示的核苷酸序列;
(r)如SEQ ID NO:35所示的核苷酸序列;
(s)如SEQ ID NO:52所示的核苷酸序列;
(t)如SEQ ID NO:54所示的核苷酸序列;
(u)如SEQ ID NO:56所示的核苷酸序列;
(v)如SEQ ID NO:58所示的核苷酸序列;
(w)如SEQ ID NO:60所示的核苷酸序列;
(x)如SEQ ID NO:62所示的核苷酸序列;
(y)如SEQ ID NO:64所示的核苷酸序列;
(z)如SEQ ID NO:66所示的核苷酸序列;
(aa)如SEQ ID NO:68所示的核苷酸序列;
(bb)如SEQ ID NO:70所示的核苷酸序列;
(cc)与如以下所示的核苷酸序列具有显著序列同一性,例如至少95%同一性的核苷酸序列:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ IDNO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70,或对VP2衣壳进行编码的任何核苷酸序列;
(dd)(a)-(s)的对VP2衣壳蛋白和/或VP3衣壳蛋白进行编码的核苷酸序列的任何部分。
实施方案101.根据实施方案70到100中任一项所述的核酸分子,其进一步包括AAVrep基因,所述AAV rep基因对一种或多种AAV Rep蛋白进行编码并可操作地连接到启动子。
实施方案102.根据实施方案101所述的核酸分子,其中所述启动子选自由以下组成的组:p5、p19、SV40、EF、CMV、B19p6和CAG。
实施方案103.根据实施方案101或实施方案102所述的核酸分子,其中所述一种或多种Rep蛋白选自Rep78、Rep68、Rep52和Rep40。
实施方案104.根据实施方案101到103中任一项所述的核酸分子,其中所述一种或多种Rep蛋白包括Rep78。
实施方案105.根据实施方案101到104中任一项所述的核酸分子,其中所述一种或多种Rep蛋白是灵长类动物AAV Rep蛋白。
实施方案106.一种AAV衣壳蛋白,其包括由根据实施方案70到105中任一项所述的核酸分子编码的氨基酸序列。
实施方案107.一种AAV颗粒,其包括根据实施方案106所述的衣壳蛋白。
实施方案108.一种用于产生AAV颗粒的包装细胞,所述包装细胞包括根据实施方案70到105中任一项所述的核酸分子。
实施方案109.根据实施方案108所述的包装细胞,其包括核酸分子,所述核酸分子包括对一种或多种AAV Rep蛋白进行编码的rep基因,其中所述rep基因可操作地连接到启动子,任选地其中所述rep基因和所述cap基因是两种不同的AAV。
实施方案110.根据实施方案109所述的包装细胞,其中可操作地连接到所述rep基因的所述启动子指导所述Rep蛋白在所述包装细胞中的表达。
实施方案111.根据实施方案109或实施方案110所述的包装细胞,其中所述启动子选自p5、p19、SV40、EF、CMV、B19p6和CAG。
实施方案112.根据实施方案109到111中任一项所述的包装细胞,其中所述一种或多种Rep蛋白选自Rep78、Rep68、Rep52和Rep40。
实施方案113.根据实施方案109到112中任一项所述的包装细胞,其中所述一种或多种Rep蛋白包括Rep78。
实施方案114.根据实施方案109到113中任一项所述的包装细胞,其中所述一种或多种Rep蛋白是灵长类动物AAV Rep蛋白。
实施方案115.根据实施方案109到114中任一项所述的包装细胞,其中所述一种或多种Rep蛋白是非灵长类动物AAV Rep蛋白。
实施方案116.根据实施方案109到115中任一项所述的包装细胞,其进一步包括核酸分子,所述核酸分子包括所关注核苷酸的核苷酸序列,所述所关注核苷酸在至少一侧上侧接有由所述一种或多种Rep蛋白识别的至少一个AAV反向末端重复序列(ITR)。
实施方案117.根据实施方案116所述的包装细胞,其中所述核苷酸在另一侧上侧接有第二ITR,所述第二ITR与所述至少一个ITR的AAV相同。
实施方案118.根据实施方案117所述的包装细胞,其中所述核苷酸在另一侧上侧接有第二ITR,其中所述第二ITR和所述至少一个ITR的AAV不同。
实施方案119.根据实施方案116到118中任一项所述的包装细胞,其中所述所关注核苷酸是报告基因。
实施方案120.根据实施方案119所述的包装细胞,其中所述报告基因对以下进行编码:β-半乳糖苷酶、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、MmGFP、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、Emerald、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合。
实施方案121.根据实施方案116到118中任一项所述的包装细胞,其中所述所关注核苷酸对以下进行编码:治疗性蛋白、自杀基因、抗体或其片段、CRISPR/Cas系统或其一部分、反义寡核苷酸、核酶、RNAi分子或shRNA分子。
实施方案122.根据实施方案108到121中任一项所述的包装细胞,其进一步包括核苷酸序列,所述核苷酸序列对参考衣壳蛋白进行编码。
实施方案123.一种产生病毒颗粒的方法,所述方法包括在足以产生病毒颗粒的条件下培养根据实施方案108到122中任一项所述的包装细胞。
实施方案124.根据实施方案123所述的方法,其中所述包装细胞进一步包括包含所关注核苷酸的辅助质粒和/或转移质粒。
实施方案125.根据实施方案123或实施方案124所述的方法,其进一步包括以下步骤中的一个或多个:
a.清除细胞碎片;
b.用Benzonase或DNase I和MgCl2处理含有病毒颗粒的上清液;
c.使病毒颗粒浓缩;
d.使所述病毒颗粒纯化;以及
e.a-d的任何组合,
任选地其中所述病毒颗粒是自补腺相关病毒颗粒和/或从培养上清液中分离的。
实施方案126.一种根据实施方案123到125中任一项所述的方法制备的AAV颗粒。
实施方案127.一种根据实施方案1到37、69、107和126中任一项所述的AAV颗粒,其包括所关注核苷酸。
实施方案128.根据实施方案127所述的AAV颗粒,其中所述所关注核苷酸是报告基因。
实施方案129.根据实施方案128所述的AAV颗粒,其中所述报告基因对以下进行编码:β-半乳糖苷酶、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、MmGFP、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、Emerald、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合。
实施方案130.根据实施方案127所述的AAV颗粒,其中所述所关注核苷酸对以下进行编码:治疗性蛋白、自杀基因、抗体或其片段、CRISPR/Cas系统或其一部分、反义寡核苷酸、核酶、RNAi分子或shRNA分子。
实施方案131.一种药物组合物,其包括:(a)根据实施方案1到37、69、107和126到130中任一项所述的AAV颗粒,AAV颗粒包括根据实施方案38到68和106中任一项所述的AAV衣壳蛋白或根据实施方案123到125中任一项所述的方法制备的AAV颗粒;以及(b)药学上可接受的载体或赋形剂。
实施方案132.一种将所关注核苷酸递送到靶细胞的方法,所述方法包括使所述靶细胞与以下接触:(a)根据实施方案1到37、69、107和126到130中任一项所述的AAV颗粒,所述AAV颗粒包括根据实施方案38到68和106中任一项所述的AAV衣壳蛋白或根据实施方案123到125中任一项所述的方法制备的AAV颗粒;或者(b)根据实施方案131所述的组合物。
实施方案133.根据实施方案132所述的方法,其中所述AAV颗粒的衣壳包括靶向配体,所述靶向配体特异性地结合在所述靶细胞的表面上表达的蛋白质。
实施方案134.根据实施方案132或实施方案133所述的方法,其中所述接触离体进行。
实施方案135.根据实施方案132或实施方案133所述的方法,其中所述靶细胞处于受试者中。
实施方案136.根据实施方案135所述的方法,其中所述受试者是灵长类动物,优选地人。
实施方案137.根据实施方案132到136中任一项所述的方法,其中所述靶细胞是人细胞。
实施方案138.根据实施方案132到137中任一项所述的方法,其中所述所关注核苷酸对以下进行编码:治疗性蛋白、自杀基因、抗体或其片段、CRISPR/Cas系统或其一部分、反义寡核苷酸、核酶、RNAi分子或shRNA分子。
表2
Figure BDA0003675143090001441
表2-续
Figure BDA0003675143090001451
表2-续
Figure BDA0003675143090001461
表2-续
Figure BDA0003675143090001471
表2-续
Figure BDA0003675143090001481
实例
仅出于说明性目的提供以下实例并且不打算限制本发明的范围。
材料和方法
细胞系和抗体
将所有293和293T细胞系维持在补充有10%FBS、1%Pen/Strep和1%L-谷氨酰胺的DMEM中。通过用表达对应cDNA的颗粒对亲本293细胞系进行慢病毒转导来产生293hErbB2和293hASGR1/2细胞系。所有细胞系均获自Regeneron TC核心设施。B1抗体识别由AAV VP1、VP2和VP3共用的线性表位。
AAV衣壳蛋白构筑体
包含SpyTag插入、侧接接头氨基酸以及另外的点突变的对期望的AAV衣壳序列进行编码的基因块或用于期望的AAV衣壳序列的聚合酶链反应扩增的引物是从IDT购买的,并且根据制造商的方案使用Gibson组装(NEB)将其克隆到pAAV R2C2中。
SpyCatcher与抗体的融合
对SpyCatcher进行编码的基因块从IDT购买,并且Gibson组装用于将框内的编码序列克隆到每个构建体的C端处的抗体重链的表达质粒中,由柔性氨基酸接头GSGESG(SEQID NO:49)分离。
AAV病毒颗粒的制备
在具有或不具有对scFv或抗体的重链和轻链进行编码的另外的质粒的情况下,通过使用具有以下质粒的PEI Pro或PEI Max转染293T包装细胞来产生病毒:pAd辅助物、对报告蛋白进行编码的含AAV2ITR的基因组质粒和对AAV Rep和Cap基因进行编码的pAAV-CAP质粒。scFv和抗体重链构筑体全部在其C末端与SpyCatcher融合,如上文所述。在OptiMEM中进行转染,且在8小时之后将培养基变为补充有10%FBS、1%Pen/Strep和1%L-Glut的DMEM。在转染后不交换培养基的情况下,在150mM NaCl中进行替代转染方案。
将转染的包装细胞在37℃下培育3天,接着使用标准冻融方案自细胞溶解物收集病毒。简单来说,通过刮削使包装细胞剥落且对其进行粒化。将上清液去除,并将细胞重悬于以下溶液中:50mM Tris-HCl;150mM NaCl;和2mM MgCl2[pH 8.0]或25mM Tris-HCl;100mM NaCl;1mM MgCl2;2.5mM KCl;0.001%普朗尼克(Pluronic)F68[pH7.4]。通过经由三个连续冻融循环诱导细胞溶解来释放细胞内病毒粒子,所述冻融循环由在剧烈涡旋下使细胞悬浮液在干冰/乙醇浴与37℃水浴之间穿梭组成。通过在37℃下在偶尔混合下用EMDMillipore Benzonase(50U/ml细胞溶解物)处理溶解物60分钟来降低粘度。然后将碎片通过离心沉淀,并且处理所得上清液以进行粗裂解物制备或另外的碘克沙醇梯度纯化。对于粗裂解物制备,将上清液通过0.22μmPVDF Millex-GV过滤器过滤,直接进入到具有Ultracel-100膜(100KDa MWCO)滤筒的Amicon Ultra-15离心过滤器单元(CentrifugalFilter Unit)的上室中。将过滤装置以5-10分钟时间间隔离心,直到在上室中达到期望的体积,然后将浓缩的粗病毒用移液管吸取到低蛋白结合管中并在4℃下储存。对于碘克沙醇梯度纯化,将裂解物通过0.2μmPES Nalgene Rapid-Flow过滤器过滤。通过切向流过滤和渗滤用补充有0.001%普朗尼克F-68的1x PBS分别将含有AAV的培养基浓缩。将澄清的裂解物或浓缩的培养基加载到不连续的碘克沙醇梯度上,并使用SW 32Ti转子在10℃下以29,600rpm离心16到18小时。从处于40%与60%碘克沙醇溶液之间的界面去除病毒级分,并使用标称分子量极限为100KDa的Amicon超离心过滤器交换到补充有0.001%普朗尼克F-68的1x PBS中。使用浓度已知的病毒的标准曲线通过qPCR测定滴度(每毫升载体基因组vg/mL)。
细胞感染/转导和流式细胞术/发光分析
为了感染细胞,将病毒粒子直接添加至培养细胞的培养基中,且将混合物在37℃下培育过夜。对于用粗裂解物转导,24小时后更换每个孔中的培养基,并且将细胞温育3-5天。为了评估GFP表达,在感染后第3天、第4天或第5天,使细胞胰蛋白酶化,并将其重悬于含有2%FBS的PBS中,并在BD FACSCanto流式细胞仪上收集GFP+细胞的百分比并使用FlowJo软件进行分析。为了评估NanoLuc表达,在感染后第2天或第3天,将细胞在1x被动裂解缓冲液(普洛麦格公司(Promega))中裂解并与Nano-Glo荧光素酶测定试剂一起温育。使用SpectraMax读板仪评估发光。
在存在IgG的情况下的中和测定
将病毒颗粒与在PBS中制备的浓度逐渐增加的经纯化的人IgG混合,并将病毒颗粒和IgG的混合物在37℃下温育30分钟以允许结合。为了感染细胞,将病毒颗粒直接添加到培养细胞的培养基中,并将混合物在37℃下温育2天。在感染后第2天,使用Nanoglo荧光素酶测定(普洛麦格公司)和在读板仪(珀金埃尔默公司(PerkinElmer))上收集的RLU数据测量Nanoluc表达。
蛋白质印迹分析
通过蛋白质印迹分析来监测SpyTagged AAV蛋白VP1、VP2和VP3与SpyCatcher标记的抗体或scFv之间的反应。将具有还原剂的
Figure BDA0003675143090001501
Tris-甘氨酸SDS样品缓冲液添加至相等体积的粗病毒制备物中,且将样品加热至85℃后维持5分钟,接着冷却至室温且装载至预制的4-12%Tris-甘氨酸凝胶(Invitrogen)上。蛋白质通过还原性SDS-PAGE分离且通过湿转印在PVDF上产生印迹。将膜用5%牛奶封闭,并用小鼠单克隆B1抗体(ARP美国研究产品公司(ARP American Research Products,Inc.))在4℃下在TBST中以1:100稀释过夜进行探测。将印迹在TBST中洗涤,用抗小鼠HRP缀合抗体探测,并使用化学发光检测试剂在Bio-Rad ChemiDoc MP成像仪上进行检测。
蛋白质染色分析
AAV蛋白VP1、VP2和VP3的相对表达通过SDS-PAGE凝胶的蛋白质染色分析进行监测。根据制造商的说明,使用NuPAGE LDS样品缓冲液和还原剂(英杰公司(Invitrogen))制备AAV样品。将样品加热到95℃持续10分钟,然后冷却到室温并加载到预制的4-12%NuPAGEBis-Tris凝胶(英杰公司)上。在蛋白质分离后,将凝胶固定在50%甲醇;7%乙酸中,在SYPRO Ruby凝胶染色剂(英杰公司)中染色,并且在10%甲醇;7%乙酸中洗涤。在Bio-RadChemiDoc MP成像仪上捕获凝胶图像。
实施例1.非灵长类动物AAV嵌合颗粒可以通过亲和色谱法产生并纯化。
如上文所述地通过用以下质粒和量转染293T包装细胞的一块15cm板来产生每种病毒:
pAd辅助物 8μg
pAAV-UbC-萤火虫荧光素酶 4μg
pRep Cap质粒构建体 4μg
Rep Cap质粒构建体包含:
pRep2 Cap AAV2 VP1 AAAV VP2 VP3
pRep2 Cap AAV2 VP1海狮VP2 VP3
pRep2 Cap AAV2 VP1鬃狮蜥VP2 VP3
然后将粗病毒制剂通过亲和色谱法纯化,并且通过蛋白质印迹(图2)评估存在于输入、流通(FT)和洗脱级分中的衣壳蛋白。来自所有三种病毒的衣壳蛋白均存在于色谱柱输入中,在流通中减少,并存在于洗脱级分中,这表明用于纯化灵长类动物源性衣壳如AAV2的亲和柱色谱法的方法也可以用于纯化非灵长类动物AAV。
在以下实例的每个实例中,包括AAV2的rep基因和AAV2的对包括VP1-u区的嵌合VP1衣壳蛋白进行编码的嵌合cap基因的pRep2Cap AAV2 VP1 AAAV VP2 VP3质粒用“pAAVR2Cap AAV2/AAAV”表示,所述VP1-u区与AAAV、AAAV VP2衣壳蛋白和AAAV VP3衣壳蛋白的VP1/VP2共同区可操作地连接。包括AAV2的rep基因和AAV2的对包括VP1-u区的嵌合VP1衣壳蛋白进行编码的嵌合cap基因的pRep2 Cap AAV2 VP1海狮VP2 VP3质粒用“pAAV R2CapAAV2/海狮”表示,所述VP1-u区与海狮AAV、海狮VP2衣壳蛋白和海狮VP3衣壳蛋白的VP1/VP2共同区可操作地连接。包括AAV2的rep基因和AAV2的对包括VP1-u区的嵌合VP1衣壳蛋白进行编码的嵌合cap基因的pRep2 Cap AAV2 VP1鬃狮蜥VP2 VP3质粒用“pAAV R2Cap AAV2/鬃狮蜥”表示,所述VP1-u区与鬃狮蜥AAV、鬃狮蜥VP2衣壳蛋白和鬃狮蜥VP3衣壳蛋白的VP1/VP2共同区可操作地连接。
实施例2.进入到禽类AAV衣壳的VP3区中的肽插入具有良好的耐受性,并且可以通过SpyCatcher-SpyTag介导抗体与病毒颗粒的共价连接。
使用PyMol建模(图3A)预测了位于禽类AAV的假定可变环IV和可变环VIII内的潜在肽插入位点,并且克隆了对应的SpyTag插入构建体。如上文所述地通过用以下质粒和量转染293T包装细胞的一块15cm板来产生每种病毒:
pAd辅助物 16μg
pAAV-CAG-GFP 8μg
pAAV R2CapX 8μg
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/AAAV无SpyTag
pAAV R2Cap AAV2/AAAV G444接头6SpyTag
pAAV R2Cap AAV2/AAAV K580接头6SpyTag
pAd辅助物 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/AAAV无SpyTag 6.7ug
具有
pAAV R2Cap AAV2/AAAV G444接头6SpyTag 1.3μg
pAAV R2Cap AAV2/AAAV K580接头6SpyTag 1.3μg
如上所列的缺乏SpyTag插入的嵌合AAV2/AAAV颗粒以及在衣壳内的各个位置处携带SpyTag插入的嵌合AAV2/AAAV颗粒与含ITR2的AAV基因组一起包装。为了了解嵌合AAV2/AAAV衣壳是否能够成功地形成并且与含有AAV2 ITR的基因组一起包装,进行了定量PCR以测量相对于缺乏SpyTag插入的嵌合AAV2/AAAV颗粒的携带SpyTag插入的嵌合AAV2/AAAV颗粒的滴度(每毫升基因组数或vg/mL)(图3B)。所测量的滴度表明嵌合AAV2/AAAV颗粒可以与AAV2 ITR基因组一起包装。嵌合AAV2/AAAV颗粒的滴度在缺乏SpyTag插入的嵌合AAV2/AAAV颗粒与携带SpyTag插入的嵌合AAV2/AAAV颗粒之间类似。
接下来,将缺乏SpyTag插入的嵌合AAV2/AAAV颗粒和携带SpyTag插入的嵌合AAV2/AAAV颗粒与结合到ASGR1的SpyCatcher标记的抗体或不与所述抗体一起温育。通过蛋白质印迹监测SpyTagged嵌合AAV2/AAAV蛋白VP1、VP2和VP3与SpyCatcher标记的抗ASGR1重链之间的反应;与SpyCatcher标记的抗体反应的SpyTagged衣壳蛋白通过SDS-PAGE显示出大小增加。在存在SpyCatcher标记的抗ASGR1 mAb的情况下,与单独的SpyTagged AAAV衣壳蛋白相比,SpyTagged嵌合AAV2/AAAV衣壳蛋白通过蛋白质印迹显示出表观大小增加(图3C)。这表明SpyTagged嵌合AAV2/AAAV颗粒能够成功地与SpyCatcher标记的抗ASGR1 mAb形成共价键。
实施例3.进入到海狮AAV衣壳的VP3区中的肽插入具有良好的耐受性,并且可以通过SpyCatcher-SpyTag介导抗体与病毒颗粒的共价连接。
使用PyMol建模(图4A)预测了位于海狮AAV的假定可变环IV和可变环VIII内的潜在肽插入位点,并且克隆了对应的SpyTag插入构建体。如上文所述地通过用以下质粒和量转染293T包装细胞的一块15cm板来产生每种病毒:
pAd辅助物 8μg
pAAV-CAG-GFP 4μg
pAAV R2CapX 4μg
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/海狮无SpyTag
pAAV R2Cap AAV2/海狮N429接头6SpyTag
pAAV R2Cap AAV2/海狮P430接头6SpyTag
pAAV R2Cap AAV2/海狮T431接头6SpyTag
pAAV R2Cap AAV2/海狮G432接头6SpyTag
pAAV R2Cap AAV2/海狮S433接头6SpyTag
pAAV R2Cap AAV2/海狮T434接头6SpyTag
pAAV R2Cap AAV2/海狮R436接头6SpyTag
pAAV R2Cap AAV2/海狮D437接头6SpyTag
pAAV R2Cap AAV2/海狮A565接头6SpyTag
pAd辅助物 8μg
pAAV-CMV-GFP 4μg
pAAV R2Cap AAV2/海狮无SpyTa 3.3ug
具有
pAAV R2Cap AAV2/海狮G432接头6SpyTag 0.7μg
pAAV R2Cap AAV2/海狮A565接头6SpyTag 0.7μg
如上所列的缺乏SpyTag插入的嵌合AAV2/海狮AAV颗粒以及在衣壳内的各个位置处携带SpyTag插入的嵌合AAV2/海狮AAV颗粒与含ITR2的AAV基因组一起包装。为了了解嵌合AAV2/海狮AAV衣壳是否能够成功地形成并且与含有AAV2 ITR的基因组一起包装,进行了定量PCR以测量相对于缺乏SpyTag插入的嵌合AAV2/海狮AAV颗粒的携带SpyTag插入的嵌合AAV2/海狮AAV颗粒的滴度(每毫升基因组数或vg/mL)(图4B、5A)。所测量的滴度表明缺乏SpyTag插入的嵌合AAV2/海狮AAV颗粒可以与AAV2 ITR基因组一起包装。缺乏SpyTag的嵌合AAV2/海狮AAV颗粒与在位置N429、P430、T431、G432、S433、R436和D437中携带SpyTag插入的嵌合AAV2/海狮AAV颗粒之间的滴度类似,但在位置T434或位置A565中的SpyTag插入不被嵌合AAV2/海狮AAV颗粒所耐受并产生较差的滴度。
接下来,将缺乏SpyTag的嵌合AAV2/海狮AAV颗粒和携带SpyTag插入的嵌合AAV2/海狮AAV颗粒与结合到HER2的SpyCatcher标记的抗体或不与所述抗体一起温育。通过蛋白质印迹监测SpyTagged嵌合AAV2/海狮AAV蛋白VP1、VP2和VP3与SpyCatcher标记的抗HER2重链之间的反应;与SpyCatcher标记的抗体反应的SpyTagged衣壳蛋白通过SDS-PAGE显示出大小增加。在存在SpyCatcher标记的抗HER2mAb的情况下,与单独的SpyTagged嵌合AAV2/海狮AAV衣壳蛋白相比,所有可检测SpyTagged嵌合AAV2/海狮AAV衣壳蛋白通过蛋白质印迹法显示出表观大小增加(图4C、5B)。这表明SpyTagged嵌合AAV2/海狮AAV颗粒能够成功地与SpyCatcher标记的抗HER2 mAb形成共价键。所测量的滴度低的SpyTagged嵌合AAV2/海狮AAV颗粒(在T434和A565处的SpyTag插入)在蛋白质印迹上不具有任何可检测蛋白质(图4C、5B)。
实施例4.进入到鬃狮蜥AAV衣壳的VP3区中的肽插入具有良好的耐受性,并且可以通过SpyCatcher-SpyTag介导抗体与病毒颗粒的共价连接。
使用PyMol建模(图6A)预测了位于禽类AAV的假定可变环IV和可变环VIII内的潜在肽插入位点,并且克隆了对应的SpyTag插入构建体。如上文所述地通过用以下质粒和量转染293T包装细胞的一块15cm板来产生每种病毒:
pAd辅助物 8μg
pAAV-CMV-GFP 4μg
pAAV R2CapX 4μg
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/鬃狮蜥无SpyTag
pAAV R2Cap AAV2/鬃狮蜥G436接头6SpyTag
pAAV R2Cap AAV2/鬃狮蜥T573接头6SpyTag
pAd辅助物 8μg
pAAV-CMV-GFP 4μg
pAAV R2Cap AAV2/鬃狮蜥无SpyTag 3.3ug具有
pAAV R2Cap AAV2/鬃狮蜥G436接头6SpyTag 0.7μg
pAAV R2Cap AAV2/鬃狮蜥T573接头6SpyTag 0.7μg
如上所列的缺乏SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒以及在衣壳内的各个位置处携带SpyTag插入的嵌合AAV2/鬃狮蜥AAV颗粒与含ITR2的AAV基因组一起包装。为了了解嵌合AAV2/鬃狮蜥衣壳是否能够成功地形成并且与含有AAV2 ITR的基因组一起包装,进行了定量PCR以测量相对于缺乏SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒的携带SpyTag插入的嵌合AAV2/鬃狮蜥AAV颗粒的滴度(每毫升基因组数或vg/mL)(图6B)。所测量的滴度表明嵌合AAV2/鬃狮蜥AAV颗粒可以与AAV2 ITR基因组一起包装。携带SpyTag插入的嵌合AAV2/鬃狮蜥AAV颗粒的滴度小于缺乏SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒的滴度。
接下来,将缺乏SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒与携带SpyTag插入的嵌合AAV2/鬃狮蜥AAV颗粒与结合到HER2的SpyCatcher标记的抗体或不与所述抗体一起温育。通过蛋白质印迹法监测SpyTagged嵌合AAV2/鬃狮蜥AAV蛋白VP1、VP2和VP3与SpyCatcher标记的抗HER2重链之间的反应;与SpyCatcher标记的抗体反应的SpyTagged衣壳蛋白通过SDS-PAGE显示出大小增加。在存在SpyCatcher标记的抗HER2 mAb的情况下,与单独的SpyTagged嵌合AAV2/鬃狮蜥AAV衣壳蛋白相比,SpyTagged嵌合AAV2/鬃狮蜥AAV衣壳蛋白通过蛋白质印迹显示出表观大小增加(图6C)。这表明SpyTagged嵌合AAV2/鬃狮蜥AAV颗粒能够成功地与SpyCatcher标记的抗HER2 mAb形成共价键。
实施例5.抗体与在残基G444或K580处插入到禽类AAV衣壳中的肽的缀合指导体外抗原特异性靶向。
如上文所述地通过用以下质粒和量转染293T包装细胞的一块15cm板来产生每种病毒:
pAd辅助物 16μg
pAAV-CAG-GFP 8μg
pAAV R2CapX 8μg
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/AAAV无SpyTag
pAAV R2Cap AAV2/AAAV G444接头6SpyTag
pAAV R2Cap AAV2/AAAV K580接头6SpyTag
具有或不具有
SpyCatcher融合的Vh重链质粒 1.5μg
Vk轻链质粒 3μg
缺乏SpyTag的嵌合AAV2/禽类AAV颗粒以及如上所列在衣壳内的各个位置处携带SpyTag插入的嵌合AAV2/禽类AAV颗粒是在存在或不存在对以下进行编码的抗体重链和轻链的情况下产生的:SpyCatcher抗GLP1R,结合GLP1R并在重链C端处与SpyCatcher融合的抗体;SpyCatcher Herceptin,结合HER2并在重链C端处与SpyCatcher融合的抗体;或SpyCatcher抗ASGR1,结合ASGR1并在重链C端处与SpyCatcher融合的抗体。通过流式细胞分析评估如上文所述的被病毒粒子感染的细胞,以监测转导。与HER2靶向抗体缀合的嵌合AAV2/AAAV特异性地感染HER2+细胞(图7A)并且与对照非靶向抗GLP1R抗体缀合的嵌合AAV2/AAAV在任何细胞类型中显示出很少的背景感染(图7A、7B)。与ASGR1靶向抗体缀合的嵌合AAV2/AAAV特异性地感染ASGR1+细胞,并对ASGR1-细胞显示出很少的背景感染(图7B)。
实施例6.抗体与在残基G432处插入到海狮AAV衣壳中的肽的缀合指导体外抗原特异性靶向。
如上文所述地通过用以下质粒和量转染293T包装细胞的一块15cm板来产生每种病毒:
pAd辅助物 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/海狮无SpyTag 8ug
pAd辅助物 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/海狮无SpyTag 4ug
具有
pAAV R2CapX 4ug
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/海狮N429接头6SpyTag
pAAV R2Cap AAV2/海狮P430接头6SpyTag
pAAV R2Cap AAV2/海狮T431接头6SpyTag
pAAV R2Cap AAV2/海狮G432接头6SpyTag
pAAV R2Cap AAV2/海狮S433接头6SpyTag
pAAV R2Cap AAV2/海狮R436接头6SpyTag
pAAV R2Cap AAV2/海狮D437接头6SpyTag
具有或不具有
SpyCatcher融合的Vh重链质粒 1.5μg
Vk轻链质粒 3μg
如上所列的缺乏SpyTag的嵌合AAV2/海狮AAV颗粒以及在衣壳内的G432位置处携带SpyTag插入的嵌合AAV2/海狮AAV颗粒是在存在或不存在对以下进行编码的抗体重链和轻链的情况下产生:SpyCatcher抗GLP1R,结合GLP1R并在重链C端处与SpyCatcher融合的抗体;SpyCatcher Herceptin,结合HER2并在重链C端处与SpyCatcher融合的抗体;或SpyCatcher抗ASGR1,结合ASGR1并在重链C端处与SpyCatcher融合的抗体。通过流式细胞分析评估如上文所述的被病毒粒子感染的细胞,以监测转导。在G432处携带SpyTag并与HER2靶向抗体缀合的嵌合AAV2/海狮AAV特异性地感染HER2+细胞,并且对HER2-细胞显示出很少的背景感染(图8A),而与对照非靶向抗GLP1R抗体缀合的嵌合AAV2/AAAV在任何细胞类型中显示出很少的背景感染(图8A、8B)。在G432处携带SpyTag并与ASGR1靶向抗体缀合的嵌合AAV2/海狮AAV特异性地感染ASGR1+细胞,并对ASGR1-细胞显示出很少的背景感染(图8B)。
如上所列的缺乏SpyTag的嵌合AAV2/海狮AAV颗粒以及在衣壳的预测可变环4内的各个位置处携带SpyTag插入的一组嵌合AAV2/海狮AAV颗粒是在存在或不存在抗体重链和轻链的情况下产生的,所述抗体重链和轻链对SpyCatcher Herceptin,结合HER2并在重链C端处与SpyCatcher融合的抗体进行编码。通过流式细胞分析评估如上文所述的被病毒粒子感染的细胞,以监测转导。在衣壳内的许多不同位置处携带SpyTag插入,并与HER2靶向抗体缀合的嵌合AAV2/海狮AAV颗粒特异性地感染HER2+细胞,而没有SpyTag的嵌合AAV2/海狮AAV颗粒对HER2+细胞显示出很少的背景感染(图9)。这表明嵌合AAV2/海狮AAV衣壳内的多个位点适合使用SpyCatcher融合抗体方法进行SpyTag插入和重新靶向。
实施例7.抗体与在残基G436或T573处插入到鬃狮蜥AAV衣壳中的肽的缀合指导体外抗原特异性靶向。
如上文所述地通过用以下质粒和量转染293T包装细胞的一块15cm板来产生每种病毒:
pAd辅助物 8μg
pAAV-CMV-GFP 4μg
pAAV R2CapX 4μg
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/鬃狮蜥无SpyTag
pAAV R2Cap AAV2/鬃狮蜥G436接头6SpyTag
pAAV R2Cap AAV2/鬃狮蜥T573接头6SpyTag
pAd辅助物 8μg
pAAV-CMV-GFP 4μg
pAAV R2Cap AAV2/鬃狮蜥无SpyTag 3.4ug
具有
pAAV R2Cap AAV2/鬃狮蜥G436接头6SpyTag 0.6μg
pAAV R2Cap AAV2/鬃狮蜥T573接头6SpyTag 0.6μg
具有或不具有 1.5μg
Vk轻链质粒 3μg
如上所列的缺乏SpyTag的嵌合AAV2/鬃狮蜥AAV颗粒以及在衣壳内的各个位置处携带SpyTag插入的嵌合AAV2/鬃狮蜥AAV颗粒是在存在或不存在对以下进行编码的抗体重链和轻链的情况下产生的:SpyCatcher Herceptin,结合HER2并在重链C端处与SpyCatcher融合的抗体;或SpyCatcher抗ASGR1,结合ASGR1并在重链C端处与SpyCatcher融合的抗体。通过流式细胞分析评估如上文所述的被病毒粒子感染的细胞,以监测转导。与HER2靶向抗体缀合的嵌合AAV2/鬃狮蜥AAV感染HER2+细胞(图10A)。与ASGR1靶向抗体缀合的嵌合AAV2/鬃狮蜥AAV特异性地感染ASGR1+细胞,并对ASGR1-细胞显示出很少的背景感染(图10B)。
实施例8.抗体缀合的禽类AAV和海狮AAV在存在比AAV2更高水平的经纯化的人免疫球蛋白的情况下可以感染细胞。
为了探测嵌合AAV2/AAAV和嵌合AAV2/海狮AAV颗粒对存在于人血清中的抗体中和的敏感性,进行了中和测定,其中AAV颗粒与由来自数十到数千名人供体的汇集的血清样品制备的增加量的IgG(hIgG)一起温育,并且表示人群体中的免疫球蛋白的横截面。
如上文所述地通过用以下质粒和量转染293T包装细胞的15cm板来产生每种病毒:
Figure BDA0003675143090001591
具有:
pAAV R2C2 N587 Myc 7.5μg
pAAV R2C2 G453接头10SpyTag 0.5μg
或:
pAAV R2Cap AAV2/AAAV无SpyTag 5μg
pAAV R2Cap AAV2/AAAV K580接头6SpyTag 3μg
或:
pAAV R2Cap AAV2/海狮无SpyTag 5μg
pAAV R2Cap AAV2/海狮G432接头10SpyTag 3μg
如上所列的镶嵌AAV2、在衣壳内携带SpyTag插入的镶嵌嵌合AAV2/AAAV颗粒以及在衣壳内携带SpyTag插入的镶嵌嵌合AAV2/海狮AAV颗粒均是在存在抗体重链和轻链的情况下产生的,所述抗体重链和轻链对SpyCatcher抗ASGR1,结合hASGR1并在重链C端处与SpyCatcher融合的抗体进行编码。然后将颗粒在存在浓度不断增加的hIgG的情况下在37℃下温育30分钟,然后将病毒颗粒和hIgG的混合物添加到表达hASGR1的细胞。用上述病毒颗粒感染的细胞通过Nanoglo荧光素酶测定来进行评估以监测转导。
图11A示出了在存在指示的浓度的hIgG的情况下,用指示的病毒颗粒感染的ASGR1+细胞的原始Nanoluc荧光素酶活性。相较于与抗ASGR1抗体缀合的镶嵌AAV2颗粒,需要更高量的hIgG来抑制与抗ASGR1抗体缀合的镶嵌嵌合AAV2/AAAV颗粒的感染,并且需要甚至更高量的hIgG来抑制与抗ASGR1抗体缀合的镶嵌嵌合AAV2/海狮AAV颗粒的感染。图11B示出了针对每种AAV血清型的来自图11A的相对于仅PBS(无hIgG)条件归一化的Nanoluc荧光素酶数据,以便将三种AAV血清型彼此直接地进行比较。需要更高浓度的hIgG来降低与抗ASGR1抗体缀合的镶嵌嵌合AAV2/AAAV颗粒和与抗ASGR1抗体缀合的镶嵌嵌合AAV2/海狮AAV颗粒两者的Nanoluc荧光素酶表达。图11C示出了两个独立实验中抑制感染50%(IC50值)所需的每孔hIgG浓度。与抗ASGR1抗体缀合的镶嵌嵌合AAV2/AAAV颗粒的hIgG IC50值和与抗ASGR1抗体缀合的镶嵌嵌合AAV2/海狮AAV颗粒的hIgG IC50值远远大于与抗ASGR1抗体缀合的镶嵌AAV2颗粒的hIgG Ic50值。具体地,镶嵌嵌合AAV2/海狮AAV颗粒似乎完全不受人抗体的影响,但测试的最高浓度的hIgG除外。
实施例9.禽类AAV可以在体内重新靶向ASGR1。
为了确定与对ASGR1具有特异性的抗体缀合的病毒颗粒是否可以在体内重新靶向表达hASGR1的肝细胞,将经基因修饰以使其肝细胞在C57BL/6背景下表达hASGR1的小鼠静脉注射携带萤火虫荧光素酶报告基因的镶嵌嵌合AAV2/AAAV病毒颗粒,并通过SpyCatcherSpyTag与对hASGR1具有特异性的抗体或靶向人GLP1R的对照抗体缀合。用磷酸盐缓冲盐水(PBS)注射的小鼠充当另外的对照。
如上文所述地通过用以下质粒和量转染293T包装细胞的15cm板来产生每种病毒:
禽类AAV抗人GLP1R/抗人ASGR1荧光素酶
Figure BDA0003675143090001601
具有或不具有
p抗hGLP1R或抗hASGR1 SpyCatcher Vh 2.5μg
p抗hGLP1R或抗hASGR1 Vk 5μg
图12示出了在用PBS或用如上文所描述的与靶向hASGR1或作为非靶向对照的hGLP1R的抗体缀合的镶嵌嵌合AAV2/AAAV病毒颗粒注射后33天的动物的发光。使用异氟醚将活体动物麻醉,注射荧光素底物,并使用IVIS光谱体内成像系统(珀金埃尔默公司)在10分钟后成像。图12A示出了仅在注射了hASGR1重新靶向的镶嵌嵌合AAV2/AAAV的表达hASGR1的小鼠的肝中检测到镶嵌嵌合AAV2/AAAV-SpyTag-SpyCatcher-Vh复合物的感染,并且在注射了PBS或对照非靶向hGLP1R的镶嵌嵌合AAV2/AAAV的表达hASGR1的小鼠的肝中未检测到感染。在图12B中对使用IVIS光谱体内成像系统(珀金埃尔默公司)从活小鼠中检测到的萤火虫荧光素酶信号的平均辐射率进行定量,并且在图12C中对感染的小鼠解剖后离体成像的单独器官的平均辐射率进行定量。这些图表明了镶嵌嵌合AAV2/AAAV仅在与hASGR1特异性抗体缀合时才特异性地转导表达hASGR1的小鼠的肝。
实施例10.海狮AAV在小鼠体内转导肝和肺。
为了确定与对ASGR1具有特异性的抗体缀合的病毒颗粒是否可以在体内重新靶向表达hASGR1的肝细胞,将经基因修饰以使其肝细胞在C57BL/6背景下表达hASGR1的小鼠静脉内注射携带萤火虫荧光素酶报告基因的镶嵌嵌合AAV2/海狮AAV病毒颗粒静脉,并通过SpyCatcher SpyTag与对hASGR1具有特异性的抗体或靶向人GLP1R的对照抗体缀合。用磷酸盐缓冲盐水(PBS)注射的小鼠充当另外的对照。
如上文所述地通过用以下质粒和量转染293T包装细胞的15cm板来产生每种病毒:
海狮AAV抗人GLP1R/抗人ASGR1荧光素酶
Figure BDA0003675143090001611
具有或不具有
p抗hGLP1R或抗hASGR1 SpyCatcher Vh 2.5μg
p抗hGLP1R或抗hASGR1 Vk 5μg
图13示出了在用PBS或用如上文所描述的与靶向hASGR1或作为非靶向对照的hGLP1R的抗体缀合的镶嵌嵌合AAV2/海狮AAV病毒颗粒注射后33天的动物的发光。使用异氟醚将活体动物麻醉,注射荧光素底物,并使用IVIS光谱体内成像系统(珀金埃尔默公司)在10分钟后成像。图13A示出了在注射了hASGR1重新靶向的嵌合AAV2/海狮AAV和对照非靶向hGLP1R重新靶向的镶嵌嵌合AAV2/海狮AAV两者的表达hASGR1的小鼠中检测到镶嵌嵌合AAV2/海狮AAV-SpyTag-SpyCatcher-Vh复合物的感染。这表明了嵌合AAV2/海狮AAV能够在不借助重新靶向抗体的情况下自然地转导小鼠肝和其它器官。在图13B中对使用IVIS光谱体内成像系统(珀金埃尔默公司)从活小鼠中检测到的萤火虫荧光素酶信号的平均辐射率进行定量,并且在图13C中对感染的小鼠解剖后离体成像的单独器官的平均辐射率进行定量。这些图表明,当与hASGR1特异性抗体或非靶向对照hGLP1R特异性对照抗体缀合时,镶嵌嵌合AAV2/海狮AAV转导表达hASGR1的小鼠的肝和肺。
实施例11.嵌合AAV2/海狮AAV在小鼠内耳中显示出一些自然趋向性。
如上文所述地通过用以下质粒和量转染293T包装细胞的15cm板来产生每种病毒:
pAd辅助物 16μg
pAAV-CAG-GFP 8μg
pAAV R2Cap AAV2/海狮无SpyTag 8μg
为了确定嵌合AAV2/海狮AAV是否对小鼠中的特定组织具有自然趋向性,从新生小鼠中解剖柯蒂氏器官,离体培养,然后使用AAV2/海狮AAV病毒颗粒感染培养物。感染后三天,用Myo7a将耳蜗毛细胞染成红色,并且病毒表达作为转导标记物的GFP。观察到多种细胞类型的强健转导(图14),表明嵌合AAV2/海狮AAV颗粒能够自然地转导内耳。
实施例12.来自海狮AAV的同源序列对嵌合AAV2/海狮AAV衣壳的B1表位的部分地或完全地置换具有良好的耐受性,并且提高了转导效率。
修饰在AAV2/海狮嵌合体的B1表位内进行(图15A),并且B1表位序列在Y730处或从I705到H712处被同源海狮衣壳序列置换。如上文所述地通过每个板用以下质粒和量转染HEK 293T包装细胞的五个、十个或二十个15cm板来产生每种病毒:
pAd辅助物 12μg
pAAV-CMV-X 6μg
pAAV-CMV-X构建体包含:
pAAV-CMV-NanoLuc荧光素酶
pAAV-CMV-萤火虫荧光素酶
pAAV R2CapX 10μgpAAV R2CapX构建体包含:
pAAV R2Cap AAV2/海狮AAV无SpyTag
pAAV R2Cap AAV2/海狮AAV无SpyTag/Y730F
pAAV R2Cap AAV2/海狮AAV无SpyTag/无B1
如上所列的缺乏SpyTag插入并且含有衣壳内的B1表位序列的修饰的嵌合AAV2/海狮AAV颗粒与含ITR2的AAV基因组一起包装。为了了解具有经修饰的B1表位的嵌合AAV2/海狮衣壳是否能够成功地形成并且与含有AAV2 ITR的基因组一起包装,进行了定量PCR以测量相对于具有B1表位修饰的嵌合AAV2/海狮AAV颗粒的具有B1表位的嵌合AAV2/海狮AAV颗粒的滴度(每毫升载体基因组数或vg/mL)(图15B)。所测量的滴度表明具有B1表位修饰的嵌合AAV2/海狮AAV颗粒可以与AAV2 ITR基因组一起包装。嵌合AAV2/海狮AAV颗粒的滴度在具有或不具有B1表位修饰的嵌合AAV2/海狮颗粒之间类似。
通过SDS-PAGE和蛋白质染色监测VP1、VP2和VP3的存在,所述VP1、VP2和VP3组装到具有经修饰的B1表位的嵌合AAV2/海狮AAV颗粒中。结果表明,与具有B1表位或B1表位中的Y730F突变的AAV2/海狮AAV病毒颗粒相比,VP1表达相对于VP2表达和VP3表达的比例在其中B1表位被同源海狮AAV衣壳序列完全置换的AAV2/海狮AAV病毒颗粒中更大(图15C)。此观察结果与如通过NanoLuc荧光素酶活性测定的HEK 293T细胞的转导效率的增加相关(图15D)。
为了测定B1表位被AAV海狮序列完全置换的AAV2/海狮AAV颗粒的转导效率的增加是否在体内重现,将C57BL/6小鼠静脉内注射携带萤火虫荧光素酶报告基因的嵌合AAV2/海狮颗粒。用磷酸盐缓冲盐水(PBS)注射的小鼠充当另外的对照。
图16示出了在注射PBS或如上文所描述的嵌合AAV2/海狮病毒颗粒后34天的动物的发光数据。使用异氟醚将活体动物麻醉,注射荧光素底物,并使用IVIS光谱体内成像系统(珀金埃尔默公司(PerkinElmer))在10分钟后成像。在解剖感染的小鼠后,对离体成像的单独器官的平均辐射率进行定量。附图示出了嵌合AAV2/海狮AAV转导肝和肺。含有B1表位的修饰的AAV2/海狮AAV扩大了对心脏的趋向性并略微改善了肝和肺的转导,其中所述B1表位被同源海狮AAV衣壳序列完全置换。
实施例13.AAV2与海狮AAV衣壳序列之间的嵌合界面的调整或完全由AAV海狮组成的衣壳序列的使用具有良好的耐受性。
进行修饰以调整AAV2与海狮衣壳序列之间的嵌合界面以生成转录物,其中VP1和VP2独特序列源自AAV2或海狮AAV或其组合(图17)。如上文所述地通过每个板用以下质粒和量转染HEK 293T包装细胞的五个、十个或二十个15cm板来产生每种病毒:
pAd辅助物 12μg
pAAV-CMV-NanoLuc荧光素酶 6μg
pAAV R2CapX 10μg
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/海狮AAV无SpyTag
pAAV R2Cap AAV2/海狮AAV无SpyTag v2
pAAV R2Cap AAV2/海狮AAV无SpyTag v3
pAAV R2Cap AAV2/海狮AAV无SpyTag v4
pAAV R2Cap AAV2/海狮AAV无SpyTag v5
如上所列的具有嵌合AAV2与AAV海狮衣壳序列之间的替代性界面的嵌合AAV2/海狮AAV颗粒与含ITR2的AAV基因组一起包装。为了了解这些替代性嵌合AAV2/海狮衣壳是否能够成功地形成并且与含有AAV2 ITR的基因组一起包装,进行了定量PCR以测量从裂解物或上清液中纯化的病毒颗粒的滴度(每毫升载体基因组的数量或vg/mL)(图18A)。所测量的滴度表明具有替代性嵌合界面的嵌合AAV2/海狮AAV颗粒可以与AAV2 ITR基因组一起包装。除v3外,嵌合AAV2/海狮AAV颗粒的滴度与在从裂解物中纯化的嵌合AAV2/海狮颗粒之间的滴度类似。与从裂解物中纯化相比,从培养基中纯化的AAV2/海狮AAV无SpyTag v5颗粒的滴度略高。如通过嵌合AAV2/海狮AAV颗粒的NanoLuc荧光素酶活性测定的HEK 293T细胞的转导效率在替代性界面位置之间相当(图18B和18C)。
将B1表位序列修饰为具有替代性界面位点的AAV2/海狮嵌合体中的完全同源的海狮衣壳序列,以确定B1修饰是否会像对AAV2/海狮AAV无SpyTag所做的那样类似地增强转导。如上文所述地通过每个板用以下质粒和量转染HEK 293T包装细胞的五个、十个或二十个15cm板来产生每种病毒:
pAd辅助物 12μg
pAAV-CMV-萤火虫荧光素酶 6μg
pAAV R2CapX 10μg
pAAV R2CapX构建体包含:
pAAV R2Cap AAV2/海狮AAV无SpyTag
pAAV R2Cap AAV2/海狮AAV无SpyTag/无B1 v2
pAAV R2Cap AAV2/海狮AAV无SpyTag/无B1 v3
pAAV R2Cap AAV2/海狮AAV无SpyTag/无B1 v4
pAAV R2Cap AAV2/海狮AAV无SpyTag/无B1 v5
为了测定B1表位被AAV海狮序列完全置换的替代性嵌合AAV2/海狮AAV颗粒的转导效率的增加是否导致体内转导增强,将C57BL/6小鼠静脉内注射携带萤火虫荧光素酶报告基因的嵌合AAV2/海狮颗粒。用磷酸盐缓冲盐水(PBS)注射的小鼠充当另外的对照。
图18D示出了注射PBS或如上文所描述的嵌合AAV2/海狮病毒颗粒后46天的动物的发光数据。使用异氟醚将活体动物麻醉,注射荧光素底物,并使用IVIS光谱体内成像系统(珀金埃尔默公司(PerkinElmer))在10分钟后成像。在解剖感染的小鼠后,对离体成像的单独器官的辐射率进行定量。附图示出了嵌合AAV2/海狮AAV转导肝、肺和心脏。AAV2/海狮AAV无SpyTag/无B1 v5(SEQ ID NO:71)转导组织的能力表明,除了嵌合AAV2/海狮AAV衣壳颗粒外,包含海狮衣壳(非嵌合衣壳蛋白)的AAV衣壳颗粒可以充当基因转移载体。
尽管已参照多个实施方案具体地显示和描述本发明,但本领域的技术人员应理解,可在不脱离本发明的精神和范围的情况下对本文所公开的各种实施方案的形式和细节作出修改,并且本文所公开的各种实施方案不打算用作对权利要求书范围的限制。尽管可使用与本文所述的方法和材料类似或等效的任何方法和材料实践或测试本发明,但现描述一些优选的方法和材料。本文引用的所有出版物都以全文引用的方式并入本文进行描述。除非另外定义,否则本文使用的所有技术和科学术语都具有与本发明所属领域的普通技术人员通常所理解相同的含义。
序列表
<110> 瑞泽恩制药公司
L·萨宾
C·基拉索斯
S·莫勒-谭克
<120> 经修饰的病毒颗粒和其用途
<130> 10364WO01
<150> 62/852,791
<151> 2019-05-24
<160> 73
<170> PatentIn版本3.5
<210> 1
<211> 2190
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1 AAAV VP2 VP3
<400> 1
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccggg 420
accggggaga agcgtcccga acgcgtcgac gactttttcc cgaaaaagaa gaaggccaag 480
accgagcaag gcaaagcccc tgctcaaacg ggcgaagacc ccggagaagg aacctcttcc 540
aacgctggat caagcgcccc ctctagtgtg ggatcatctg tcatggctga aggaggtggc 600
ggtccaatgg gcgatgcagg ccaaggtgcc gacggagtgg gcaattcctc gggaaattgg 660
cattgcgatt cccaatggct ggacaacgga gtcgttaccc gaaccactcg aacctgggtc 720
ctgcccagct acaacaacca cttgtacaag cggatccaag gaccgggagg aaccgacccc 780
aacaataaat tctttggatt cagcaccccc tgggggtact ttgactacaa ccgattccac 840
tgccacttct ccccccgaga ctggcaacga ctcatcaaca acaactgggg catccgaccc 900
aaagcgatgc gctttagact ctttaacatc caggttaaag aagtcactgt ccaagactcc 960
aacaccacca tcgccaacaa cctcaccagc acggtccaag tctttgcgga caaggactac 1020
cagctgccgt acgtcctcgg atcggctaca gagggcacct tcccgccgtt cccagcggat 1080
atctacacga tcccgcagta tggttactgc acgctaaact acaacaacga ggcggtggat 1140
cgttcggcct tctactgtct agactatttc ccctcagaca tgctgcggac aggaaataac 1200
tttgaattca cttacacgtt cgaggacgtt cctttccata gcatgtttgc tcacaaccag 1260
acgctagacc ggctgatgaa tcctctcgtc gatcagtacc tgtgggcttt cagttccgtc 1320
agccaaacag gctcgtctgg acgggcactc aattattcac gcgcgaccaa aaccaatatg 1380
gcaacccagt acagaaactg gttacctgga cccttcgtcc gggatcagca aatctttacg 1440
ggggctagca acatcaccca aaacaacgtg ttcaacgttt gggataaagg caagcagtgg 1500
gtgatagaca atcggatcaa tatgatgcag cccggccctg cagcagcgac cacctttagc 1560
ggagaacccg accgtcaagc catgcaaaac acgctggcct ttagtcggac ggtctacgac 1620
cagacaacca gtacgaccga tcgtaaccag ttgctcatta ccaacgaaga tgaaatcaga 1680
cccaccaact cggtcggcat cgacacgtgg ggagtagttc ccaacaacaa ccagtccaag 1740
gtgaccgccg gcactcgcgc ggccatcaac aaccaagggg cgcttcccgg gatggtgtgg 1800
caaaacagag acatttacct ccaaggaccc atttgggcca aaatccccga cacagacaat 1860
cacttccatc cgtccccgct tattggcggg tttggctgca agcatccccc tccccagatt 1920
ttcattaaaa acacacccgt cccggccaac ccttcggaaa cgttccagac ggccaaggtg 1980
gcctccttca tcaaccagta ctcgaccgga cagtgcaccg tcgaaatctt ttgggaactc 2040
aagaaggaaa cctccaagcg ctggaacccc gaaatccagt tcacctccaa ctttggcaac 2100
gcggccgaca tccagtttgc tgtctccgac accggatcct attccgaacc tcgtcccatt 2160
ggcaccagat acctgactcg tcctctgtaa 2190
<210> 2
<211> 729
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1 AAAV VP2 VP3
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Gly Thr Gly Glu Lys
130 135 140
Arg Pro Glu Arg Val Asp Asp Phe Phe Pro Lys Lys Lys Lys Ala Lys
145 150 155 160
Thr Glu Gln Gly Lys Ala Pro Ala Gln Thr Gly Glu Asp Pro Gly Glu
165 170 175
Gly Thr Ser Ser Asn Ala Gly Ser Ser Ala Pro Ser Ser Val Gly Ser
180 185 190
Ser Val Met Ala Glu Gly Gly Gly Gly Pro Met Gly Asp Ala Gly Gln
195 200 205
Gly Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser
210 215 220
Gln Trp Leu Asp Asn Gly Val Val Thr Arg Thr Thr Arg Thr Trp Val
225 230 235 240
Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Ile Gln Gly Pro Gly
245 250 255
Gly Thr Asp Pro Asn Asn Lys Phe Phe Gly Phe Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Tyr Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Ala Met Arg
290 295 300
Phe Arg Leu Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Asn Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala
325 330 335
Asp Lys Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala Thr Glu Gly
340 345 350
Thr Phe Pro Pro Phe Pro Ala Asp Ile Tyr Thr Ile Pro Gln Tyr Gly
355 360 365
Tyr Cys Thr Leu Asn Tyr Asn Asn Glu Ala Val Asp Arg Ser Ala Phe
370 375 380
Tyr Cys Leu Asp Tyr Phe Pro Ser Asp Met Leu Arg Thr Gly Asn Asn
385 390 395 400
Phe Glu Phe Thr Tyr Thr Phe Glu Asp Val Pro Phe His Ser Met Phe
405 410 415
Ala His Asn Gln Thr Leu Asp Arg Leu Met Asn Pro Leu Val Asp Gln
420 425 430
Tyr Leu Trp Ala Phe Ser Ser Val Ser Gln Thr Gly Ser Ser Gly Arg
435 440 445
Ala Leu Asn Tyr Ser Arg Ala Thr Lys Thr Asn Met Ala Thr Gln Tyr
450 455 460
Arg Asn Trp Leu Pro Gly Pro Phe Val Arg Asp Gln Gln Ile Phe Thr
465 470 475 480
Gly Ala Ser Asn Ile Thr Gln Asn Asn Val Phe Asn Val Trp Asp Lys
485 490 495
Gly Lys Gln Trp Val Ile Asp Asn Arg Ile Asn Met Met Gln Pro Gly
500 505 510
Pro Ala Ala Ala Thr Thr Phe Ser Gly Glu Pro Asp Arg Gln Ala Met
515 520 525
Gln Asn Thr Leu Ala Phe Ser Arg Thr Val Tyr Asp Gln Thr Thr Ser
530 535 540
Thr Thr Asp Arg Asn Gln Leu Leu Ile Thr Asn Glu Asp Glu Ile Arg
545 550 555 560
Pro Thr Asn Ser Val Gly Ile Asp Thr Trp Gly Val Val Pro Asn Asn
565 570 575
Asn Gln Ser Lys Val Thr Ala Gly Thr Arg Ala Ala Ile Asn Asn Gln
580 585 590
Gly Ala Leu Pro Gly Met Val Trp Gln Asn Arg Asp Ile Tyr Leu Gln
595 600 605
Gly Pro Ile Trp Ala Lys Ile Pro Asp Thr Asp Asn His Phe His Pro
610 615 620
Ser Pro Leu Ile Gly Gly Phe Gly Cys Lys His Pro Pro Pro Gln Ile
625 630 635 640
Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Glu Thr Phe Gln
645 650 655
Thr Ala Lys Val Ala Ser Phe Ile Asn Gln Tyr Ser Thr Gly Gln Cys
660 665 670
Thr Val Glu Ile Phe Trp Glu Leu Lys Lys Glu Thr Ser Lys Arg Trp
675 680 685
Asn Pro Glu Ile Gln Phe Thr Ser Asn Phe Gly Asn Ala Ala Asp Ile
690 695 700
Gln Phe Ala Val Ser Asp Thr Gly Ser Tyr Ser Glu Pro Arg Pro Ile
705 710 715 720
Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725
<210> 3
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3
<400> 3
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145
<210> 4
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu
705 710
<210> 5
<211> 2187
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1蜥蜴VP2 VP3
<400> 5
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccgaa 420
aagcgaaaga cacccgaaga gtggttagct caagaaaaga ctccaaccaa acaaaggttc 480
cagataccag ctccaggaca atctggatca gattctcctt ccacctcagg atccggcggt 540
actgcaggct ccagttctag cgcatcaaat acaatggctc aaggaggtgg cggaccaatg 600
gcagacgata accaaggcgc cgagggagtg ggtaatgcct cgggagattg gcattgcgat 660
acccaatggc tgggcgacca cgtcattaca aaatctacca gaacttgggt tctgccctct 720
tacgggaatc atctctactc gcccatcaac tttgatggaa ccacagggaa cggaacccaa 780
gccgcttact gcggatacgc taccccctgg gcctactttg actttaaccg attccactgc 840
cacttttccc cccgagactg gcaaagactc attaacaacc ataccggaat acgaccagtc 900
ggactcaaat tcaagctgtt caacatccag gtcaaggaaa tcacagtaca agattcgacc 960
aaaacgatcg ccaacaatct caccagcacc gtacaggtct ttgcggacac ggagcaccag 1020
ctcccgtacg tattaggaaa tgccacgcag ggcacgtttc ctccctttcc ggctgaagtc 1080
tttcagttgc ctcagtacgg ctactgtacc atccaaggcc ctcagggtaa gtttaccgac 1140
agaagtgcct tctactgctt ggagtacttt ccttccaaga tgctgagaac ggggaataac 1200
tttgaattta cttacaagtt cgagaaggtt cccttccatt ctggctgggc tcaaagccag 1260
tcgttggatc gattgatgaa tcccttgatc ccacagtacc tgttggccga ttatggtacg 1320
accgccagta gtgccataac atactatcgg ccaaacagca cagacttgag ctggtacttt 1380
aaaaactggc tgcctgggcc agtggaaagg cgacagcaaa tcaattctga agactcgacg 1440
aaaaaccatg ccaatttgaa cgggaatgca cacaccaaca aatacagcat ccagcacaga 1500
caaaccaaga tgatgccagg ggtggctctc agtagtaaat acacaggtgc tgctgaagga 1560
acgtcgttac tgaacggggt attgaccttt gataagatcg ccaatgacaa tactaacatc 1620
acggatacaa ataatgtcaa tcggacgatc gaagatgaaa ttcaaggtac caatccttat 1680
ggaaacgacg tacccattac cgtcgctgtc aatacacaaa acgcgaccac ttctcctacc 1740
atgcaaaaca gcagcacgta tgaactatta cctggtgctg tctggtccaa cagagatatt 1800
tacctgcaag gtcccatctg ggctaaaata cccgataccg atggacactt tcacccgtct 1860
ccacaaatgg gtggtttcgg acttaaaaac ccaccaccga tgatcctcat caaaaacaca 1920
cccgttcccg ccgatccacc aacgaccttc aaaccgactc cgatgaacag cttcatcagc 1980
gaatacagta ccggtcaggt gactgtagag atgctgtggg aggtccggaa agaagactcc 2040
aagagatgga acccggaaat ccagtttacc tccaattttg gattgtccga tcctcagatc 2100
gacggtatac cctttggtat taccaaattg ggtaattacg aggaaccacg tcctattggc 2160
accagatacc tgactcgtca tttgtaa 2187
<210> 6
<211> 728
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1蜥蜴VP2 VP3
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Glu Lys Arg Lys Thr
130 135 140
Pro Glu Glu Trp Leu Ala Gln Glu Lys Thr Pro Thr Lys Gln Arg Phe
145 150 155 160
Gln Ile Pro Ala Pro Gly Gln Ser Gly Ser Asp Ser Pro Ser Thr Ser
165 170 175
Gly Ser Gly Gly Thr Ala Gly Ser Ser Ser Ser Ala Ser Asn Thr Met
180 185 190
Ala Gln Gly Gly Gly Gly Pro Met Ala Asp Asp Asn Gln Gly Ala Glu
195 200 205
Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Thr Gln Trp Leu
210 215 220
Gly Asp His Val Ile Thr Lys Ser Thr Arg Thr Trp Val Leu Pro Ser
225 230 235 240
Tyr Gly Asn His Leu Tyr Ser Pro Ile Asn Phe Asp Gly Thr Thr Gly
245 250 255
Asn Gly Thr Gln Ala Ala Tyr Cys Gly Tyr Ala Thr Pro Trp Ala Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn His Thr Gly Ile Arg Pro Val Gly Leu Lys Phe
290 295 300
Lys Leu Phe Asn Ile Gln Val Lys Glu Ile Thr Val Gln Asp Ser Thr
305 310 315 320
Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp
325 330 335
Thr Glu His Gln Leu Pro Tyr Val Leu Gly Asn Ala Thr Gln Gly Thr
340 345 350
Phe Pro Pro Phe Pro Ala Glu Val Phe Gln Leu Pro Gln Tyr Gly Tyr
355 360 365
Cys Thr Ile Gln Gly Pro Gln Gly Lys Phe Thr Asp Arg Ser Ala Phe
370 375 380
Tyr Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn Asn
385 390 395 400
Phe Glu Phe Thr Tyr Lys Phe Glu Lys Val Pro Phe His Ser Gly Trp
405 410 415
Ala Gln Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Pro Gln
420 425 430
Tyr Leu Leu Ala Asp Tyr Gly Thr Thr Ala Ser Ser Ala Ile Thr Tyr
435 440 445
Tyr Arg Pro Asn Ser Thr Asp Leu Ser Trp Tyr Phe Lys Asn Trp Leu
450 455 460
Pro Gly Pro Val Glu Arg Arg Gln Gln Ile Asn Ser Glu Asp Ser Thr
465 470 475 480
Lys Asn His Ala Asn Leu Asn Gly Asn Ala His Thr Asn Lys Tyr Ser
485 490 495
Ile Gln His Arg Gln Thr Lys Met Met Pro Gly Val Ala Leu Ser Ser
500 505 510
Lys Tyr Thr Gly Ala Ala Glu Gly Thr Ser Leu Leu Asn Gly Val Leu
515 520 525
Thr Phe Asp Lys Ile Ala Asn Asp Asn Thr Asn Ile Thr Asp Thr Asn
530 535 540
Asn Val Asn Arg Thr Ile Glu Asp Glu Ile Gln Gly Thr Asn Pro Tyr
545 550 555 560
Gly Asn Asp Val Pro Ile Thr Val Ala Val Asn Thr Gln Asn Ala Thr
565 570 575
Thr Ser Pro Thr Met Gln Asn Ser Ser Thr Tyr Glu Leu Leu Pro Gly
580 585 590
Ala Val Trp Ser Asn Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Ala
595 600 605
Lys Ile Pro Asp Thr Asp Gly His Phe His Pro Ser Pro Gln Met Gly
610 615 620
Gly Phe Gly Leu Lys Asn Pro Pro Pro Met Ile Leu Ile Lys Asn Thr
625 630 635 640
Pro Val Pro Ala Asp Pro Pro Thr Thr Phe Lys Pro Thr Pro Met Asn
645 650 655
Ser Phe Ile Ser Glu Tyr Ser Thr Gly Gln Val Thr Val Glu Met Leu
660 665 670
Trp Glu Val Arg Lys Glu Asp Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Phe Thr Ser Asn Phe Gly Leu Ser Asp Pro Gln Ile Asp Gly Ile Pro
690 695 700
Phe Gly Ile Thr Lys Leu Gly Asn Tyr Glu Glu Pro Arg Pro Ile Gly
705 710 715 720
Thr Arg Tyr Leu Thr Arg His Leu
725
<210> 7
<211> 2265
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1 AAAV VP2 VP3 G444接头6 SpyTag
<400> 7
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccggg 420
accggggaga agcgtcccga acgcgtcgac gactttttcc cgaaaaagaa gaaggccaag 480
accgagcaag gcaaagcccc tgctcaaacg ggcgaagacc ccggagaagg aacctcttcc 540
aacgctggat caagcgcccc ctctagtgtg ggatcatctg tcatggctga aggaggtggc 600
ggtccaatgg gcgatgcagg ccaaggtgcc gacggagtgg gcaattcctc gggaaattgg 660
cattgcgatt cccaatggct ggacaacgga gtcgttaccc gaaccactcg aacctgggtc 720
ctgcccagct acaacaacca cttgtacaag cggatccaag gaccgggagg aaccgacccc 780
aacaataaat tctttggatt cagcaccccc tgggggtact ttgactacaa ccgattccac 840
tgccacttct ccccccgaga ctggcaacga ctcatcaaca acaactgggg catccgaccc 900
aaagcgatgc gctttagact ctttaacatc caggttaaag aagtcactgt ccaagactcc 960
aacaccacca tcgccaacaa cctcaccagc acggtccaag tctttgcgga caaggactac 1020
cagctgccgt acgtcctcgg atcggctaca gagggcacct tcccgccgtt cccagcggat 1080
atctacacga tcccgcagta tggttactgc acgctaaact acaacaacga ggcggtggat 1140
cgttcggcct tctactgtct agactatttc ccctcagaca tgctgcggac aggaaataac 1200
tttgaattca cttacacgtt cgaggacgtt cctttccata gcatgtttgc tcacaaccag 1260
acgctagacc ggctgatgaa tcctctcgtc gatcagtacc tgtgggcttt cagttccgtc 1320
agccaaacag gcggcctgag cggcagcggc gcccacatcg tgatggtgga cgcctacaag 1380
ccgacgaagg gcctgagcgg cagcggctcg tctggacggg cactcaatta ttcacgcgcg 1440
accaaaacca atatggcaac ccagtacaga aactggttac ctggaccctt cgtccgggat 1500
cagcaaatct ttacgggggc tagcaacatc acccaaaaca acgtgttcaa cgtttgggat 1560
aaaggcaagc agtgggtgat agacaatcgg atcaatatga tgcagcccgg ccctgcagca 1620
gcgaccacct ttagcggaga acccgaccgt caagccatgc aaaacacgct ggcctttagt 1680
cggacggtct acgaccagac aaccagtacg accgatcgta accagttgct cattaccaac 1740
gaagatgaaa tcagacccac caactcggtc ggcatcgaca cgtggggagt agttcccaac 1800
aacaaccagt ccaaggtgac cgccggcact cgcgcggcca tcaacaacca aggggcgctt 1860
cccgggatgg tgtggcaaaa cagagacatt tacctccaag gacccatttg ggccaaaatc 1920
cccgacacag acaatcactt ccatccgtcc ccgcttattg gcgggtttgg ctgcaagcat 1980
ccccctcccc agattttcat taaaaacaca cccgtcccgg ccaacccttc ggaaacgttc 2040
cagacggcca aggtggcctc cttcatcaac cagtactcga ccggacagtg caccgtcgaa 2100
atcttttggg aactcaagaa ggaaacctcc aagcgctgga accccgaaat ccagttcacc 2160
tccaactttg gcaacgcggc cgacatccag tttgctgtct ccgacaccgg atcctattcc 2220
gaacctcgtc ccattggcac cagatacctg actcgtcctc tgtaa 2265
<210> 8
<211> 754
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1 AAAV VP2 VP3 G444接头6 SpyTag
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Gly Thr Gly Glu Lys
130 135 140
Arg Pro Glu Arg Val Asp Asp Phe Phe Pro Lys Lys Lys Lys Ala Lys
145 150 155 160
Thr Glu Gln Gly Lys Ala Pro Ala Gln Thr Gly Glu Asp Pro Gly Glu
165 170 175
Gly Thr Ser Ser Asn Ala Gly Ser Ser Ala Pro Ser Ser Val Gly Ser
180 185 190
Ser Val Met Ala Glu Gly Gly Gly Gly Pro Met Gly Asp Ala Gly Gln
195 200 205
Gly Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser
210 215 220
Gln Trp Leu Asp Asn Gly Val Val Thr Arg Thr Thr Arg Thr Trp Val
225 230 235 240
Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Ile Gln Gly Pro Gly
245 250 255
Gly Thr Asp Pro Asn Asn Lys Phe Phe Gly Phe Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Tyr Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Ala Met Arg
290 295 300
Phe Arg Leu Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Asn Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala
325 330 335
Asp Lys Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala Thr Glu Gly
340 345 350
Thr Phe Pro Pro Phe Pro Ala Asp Ile Tyr Thr Ile Pro Gln Tyr Gly
355 360 365
Tyr Cys Thr Leu Asn Tyr Asn Asn Glu Ala Val Asp Arg Ser Ala Phe
370 375 380
Tyr Cys Leu Asp Tyr Phe Pro Ser Asp Met Leu Arg Thr Gly Asn Asn
385 390 395 400
Phe Glu Phe Thr Tyr Thr Phe Glu Asp Val Pro Phe His Ser Met Phe
405 410 415
Ala His Asn Gln Thr Leu Asp Arg Leu Met Asn Pro Leu Val Asp Gln
420 425 430
Tyr Leu Trp Ala Phe Ser Ser Val Ser Gln Thr Gly Gly Leu Ser Gly
435 440 445
Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly
450 455 460
Leu Ser Gly Ser Gly Ser Ser Gly Arg Ala Leu Asn Tyr Ser Arg Ala
465 470 475 480
Thr Lys Thr Asn Met Ala Thr Gln Tyr Arg Asn Trp Leu Pro Gly Pro
485 490 495
Phe Val Arg Asp Gln Gln Ile Phe Thr Gly Ala Ser Asn Ile Thr Gln
500 505 510
Asn Asn Val Phe Asn Val Trp Asp Lys Gly Lys Gln Trp Val Ile Asp
515 520 525
Asn Arg Ile Asn Met Met Gln Pro Gly Pro Ala Ala Ala Thr Thr Phe
530 535 540
Ser Gly Glu Pro Asp Arg Gln Ala Met Gln Asn Thr Leu Ala Phe Ser
545 550 555 560
Arg Thr Val Tyr Asp Gln Thr Thr Ser Thr Thr Asp Arg Asn Gln Leu
565 570 575
Leu Ile Thr Asn Glu Asp Glu Ile Arg Pro Thr Asn Ser Val Gly Ile
580 585 590
Asp Thr Trp Gly Val Val Pro Asn Asn Asn Gln Ser Lys Val Thr Ala
595 600 605
Gly Thr Arg Ala Ala Ile Asn Asn Gln Gly Ala Leu Pro Gly Met Val
610 615 620
Trp Gln Asn Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
625 630 635 640
Pro Asp Thr Asp Asn His Phe His Pro Ser Pro Leu Ile Gly Gly Phe
645 650 655
Gly Cys Lys His Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val
660 665 670
Pro Ala Asn Pro Ser Glu Thr Phe Gln Thr Ala Lys Val Ala Ser Phe
675 680 685
Ile Asn Gln Tyr Ser Thr Gly Gln Cys Thr Val Glu Ile Phe Trp Glu
690 695 700
Leu Lys Lys Glu Thr Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr
705 710 715 720
Ser Asn Phe Gly Asn Ala Ala Asp Ile Gln Phe Ala Val Ser Asp Thr
725 730 735
Gly Ser Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
740 745 750
Pro Leu
<210> 9
<211> 2265
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1 AAAV VP2 VP3 K580接头6 SpyTag
<400> 9
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccggg 420
accggggaga agcgtcccga acgcgtcgac gactttttcc cgaaaaagaa gaaggccaag 480
accgagcaag gcaaagcccc tgctcaaacg ggcgaagacc ccggagaagg aacctcttcc 540
aacgctggat caagcgcccc ctctagtgtg ggatcatctg tcatggctga aggaggtggc 600
ggtccaatgg gcgatgcagg ccaaggtgcc gacggagtgg gcaattcctc gggaaattgg 660
cattgcgatt cccaatggct ggacaacgga gtcgttaccc gaaccactcg aacctgggtc 720
ctgcccagct acaacaacca cttgtacaag cggatccaag gaccgggagg aaccgacccc 780
aacaataaat tctttggatt cagcaccccc tgggggtact ttgactacaa ccgattccac 840
tgccacttct ccccccgaga ctggcaacga ctcatcaaca acaactgggg catccgaccc 900
aaagcgatgc gctttagact ctttaacatc caggttaaag aagtcactgt ccaagactcc 960
aacaccacca tcgccaacaa cctcaccagc acggtccaag tctttgcgga caaggactac 1020
cagctgccgt acgtcctcgg atcggctaca gagggcacct tcccgccgtt cccagcggat 1080
atctacacga tcccgcagta tggttactgc acgctaaact acaacaacga ggcggtggat 1140
cgttcggcct tctactgtct agactatttc ccctcagaca tgctgcggac aggaaataac 1200
tttgaattca cttacacgtt cgaggacgtt cctttccata gcatgtttgc tcacaaccag 1260
acgctagacc ggctgatgaa tcctctcgtc gatcagtacc tgtgggcttt cagttccgtc 1320
agccaaacag gctcgtctgg acgggcactc aattattcac gcgcgaccaa aaccaatatg 1380
gcaacccagt acagaaactg gttacctgga cccttcgtcc gggatcagca aatctttacg 1440
ggggctagca acatcaccca aaacaacgtg ttcaacgttt gggataaagg caagcagtgg 1500
gtgatagaca atcggatcaa tatgatgcag cccggccctg cagcagcgac cacctttagc 1560
ggagaacccg accgtcaagc catgcaaaac acgctggcct ttagtcggac ggtctacgac 1620
cagacaacca gtacgaccga tcgtaaccag ttgctcatta ccaacgaaga tgaaatcaga 1680
cccaccaact cggtcggcat cgacacgtgg ggagtagttc ccaacaacaa ccagtccaag 1740
ggcctgagcg gcagcggcgc ccacatcgtg atggtggacg cctacaagcc gacgaagggc 1800
ctgagcggca gcggcgtgac cgccggcact cgcgcggcca tcaacaacca aggggcgctt 1860
cccgggatgg tgtggcaaaa cagagacatt tacctccaag gacccatttg ggccaaaatc 1920
cccgacacag acaatcactt ccatccgtcc ccgcttattg gcgggtttgg ctgcaagcat 1980
ccccctcccc agattttcat taaaaacaca cccgtcccgg ccaacccttc ggaaacgttc 2040
cagacggcca aggtggcctc cttcatcaac cagtactcga ccggacagtg caccgtcgaa 2100
atcttttggg aactcaagaa ggaaacctcc aagcgctgga accccgaaat ccagttcacc 2160
tccaactttg gcaacgcggc cgacatccag tttgctgtct ccgacaccgg atcctattcc 2220
gaacctcgtc ccattggcac cagatacctg actcgtcctc tgtaa 2265
<210> 10
<211> 754
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1 AAAV VP2 VP3 K580接头6 SpyTag
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Gly Thr Gly Glu Lys
130 135 140
Arg Pro Glu Arg Val Asp Asp Phe Phe Pro Lys Lys Lys Lys Ala Lys
145 150 155 160
Thr Glu Gln Gly Lys Ala Pro Ala Gln Thr Gly Glu Asp Pro Gly Glu
165 170 175
Gly Thr Ser Ser Asn Ala Gly Ser Ser Ala Pro Ser Ser Val Gly Ser
180 185 190
Ser Val Met Ala Glu Gly Gly Gly Gly Pro Met Gly Asp Ala Gly Gln
195 200 205
Gly Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser
210 215 220
Gln Trp Leu Asp Asn Gly Val Val Thr Arg Thr Thr Arg Thr Trp Val
225 230 235 240
Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Ile Gln Gly Pro Gly
245 250 255
Gly Thr Asp Pro Asn Asn Lys Phe Phe Gly Phe Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Tyr Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Ala Met Arg
290 295 300
Phe Arg Leu Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Asn Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala
325 330 335
Asp Lys Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala Thr Glu Gly
340 345 350
Thr Phe Pro Pro Phe Pro Ala Asp Ile Tyr Thr Ile Pro Gln Tyr Gly
355 360 365
Tyr Cys Thr Leu Asn Tyr Asn Asn Glu Ala Val Asp Arg Ser Ala Phe
370 375 380
Tyr Cys Leu Asp Tyr Phe Pro Ser Asp Met Leu Arg Thr Gly Asn Asn
385 390 395 400
Phe Glu Phe Thr Tyr Thr Phe Glu Asp Val Pro Phe His Ser Met Phe
405 410 415
Ala His Asn Gln Thr Leu Asp Arg Leu Met Asn Pro Leu Val Asp Gln
420 425 430
Tyr Leu Trp Ala Phe Ser Ser Val Ser Gln Thr Gly Ser Ser Gly Arg
435 440 445
Ala Leu Asn Tyr Ser Arg Ala Thr Lys Thr Asn Met Ala Thr Gln Tyr
450 455 460
Arg Asn Trp Leu Pro Gly Pro Phe Val Arg Asp Gln Gln Ile Phe Thr
465 470 475 480
Gly Ala Ser Asn Ile Thr Gln Asn Asn Val Phe Asn Val Trp Asp Lys
485 490 495
Gly Lys Gln Trp Val Ile Asp Asn Arg Ile Asn Met Met Gln Pro Gly
500 505 510
Pro Ala Ala Ala Thr Thr Phe Ser Gly Glu Pro Asp Arg Gln Ala Met
515 520 525
Gln Asn Thr Leu Ala Phe Ser Arg Thr Val Tyr Asp Gln Thr Thr Ser
530 535 540
Thr Thr Asp Arg Asn Gln Leu Leu Ile Thr Asn Glu Asp Glu Ile Arg
545 550 555 560
Pro Thr Asn Ser Val Gly Ile Asp Thr Trp Gly Val Val Pro Asn Asn
565 570 575
Asn Gln Ser Lys Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val
580 585 590
Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Val Thr Ala
595 600 605
Gly Thr Arg Ala Ala Ile Asn Asn Gln Gly Ala Leu Pro Gly Met Val
610 615 620
Trp Gln Asn Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
625 630 635 640
Pro Asp Thr Asp Asn His Phe His Pro Ser Pro Leu Ile Gly Gly Phe
645 650 655
Gly Cys Lys His Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val
660 665 670
Pro Ala Asn Pro Ser Glu Thr Phe Gln Thr Ala Lys Val Ala Ser Phe
675 680 685
Ile Asn Gln Tyr Ser Thr Gly Gln Cys Thr Val Glu Ile Phe Trp Glu
690 695 700
Leu Lys Lys Glu Thr Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr
705 710 715 720
Ser Asn Phe Gly Asn Ala Ala Asp Ile Gln Phe Ala Val Ser Asp Thr
725 730 735
Gly Ser Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
740 745 750
Pro Leu
<210> 11
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 G432接头6 SpyTag
<400> 11
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggaggcc tgagcggcag cggcgcccac 1320
atcgtgatgg tggacgccta caagccgacg aagggcctga gcggcagcgg ctcaacaacg 1380
agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 12
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 G432接头6 SpyTag
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys
435 440 445
Pro Thr Lys Gly Leu Ser Gly Ser Gly Ser Thr Thr Arg Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 13
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 A565接头6 SpyTag
<400> 13
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaggcct gagcggcagc ggcgcccaca tcgtgatggt ggacgcctac 1740
aagccgacga agggcctgag cggcagcggc acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 14
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 A565接头6 SpyTag
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Gly Leu Ser Gly Ser Gly Ala His Ile Val Met
565 570 575
Val Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 15
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 N429接头6 SpyTag
<400> 15
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacggc ctgagcggca gcggcgccca catcgtgatg 1320
gtggacgcct acaagccgac gaagggcctg agcggcagcg gcccgactgg atcaacaacg 1380
agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 16
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 N429接头6 SpyTag
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Gly Leu Ser
420 425 430
Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
435 440 445
Gly Leu Ser Gly Ser Gly Pro Thr Gly Ser Thr Thr Arg Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 17
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 P430接头6 SpyTag
<400> 17
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg ggcctgagcg gcagcggcgc ccacatcgtg 1320
atggtggacg cctacaagcc gacgaagggc ctgagcggca gcggcactgg atcaacaacg 1380
agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 18
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 P430接头6 SpyTag
<400> 18
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Gly Leu
420 425 430
Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr
435 440 445
Lys Gly Leu Ser Gly Ser Gly Thr Gly Ser Thr Thr Arg Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 19
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 T431接头6 SpyTag
<400> 19
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggcctga gcggcagcgg cgcccacatc 1320
gtgatggtgg acgcctacaa gccgacgaag ggcctgagcg gcagcggcgg atcaacaacg 1380
agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 20
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 T431接头6 SpyTag
<400> 20
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys Pro
435 440 445
Thr Lys Gly Leu Ser Gly Ser Gly Gly Ser Thr Thr Arg Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 21
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 S433接头6 SpyTag
<400> 21
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcag gcctgagcgg cagcggcgcc 1320
cacatcgtga tggtggacgc ctacaagccg acgaagggcc tgagcggcag cggcacaacg 1380
agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 22
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 S433接头6 SpyTag
<400> 22
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr
435 440 445
Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Thr Arg Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 23
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 T434接头6 SpyTag
<400> 23
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caggcctgag cggcagcggc 1320
gcccacatcg tgatggtgga cgcctacaag ccgacgaagg gcctgagcgg cagcggcacg 1380
agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 24
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 T434接头6 SpyTag
<400> 24
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala
435 440 445
Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Arg Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 25
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 T435接头6 SpyTag
<400> 25
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgggcct gagcggcagc 1320
ggcgcccaca tcgtgatggt ggacgcctac aagccgacga agggcctgag cggcagcggc 1380
agagacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 26
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 T435接头6 SpyTag
<400> 26
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp
435 440 445
Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Arg Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 27
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 R436 接头6 SpyTag
<400> 27
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagagg cctgagcggc 1320
agcggcgccc acatcgtgat ggtggacgcc tacaagccga cgaagggcct gagcggcagc 1380
ggcgacttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 28
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 R436 接头6 SpyTag
<400> 28
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val
435 440 445
Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Asp Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 29
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 D437接头6 SpyTag
<400> 29
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cggcctgagc 1320
ggcagcggcg cccacatcgt gatggtggac gcctacaagc cgacgaaggg cctgagcggc 1380
agcggcttaa aatttatcaa gaacaaagtt cccaattttg cacattatgg aaaaaattgg 1440
cttcctggac cttttattag acaacagggg tggacaacac aaaatattaa taatagtgtt 1500
gttaatttta atgacatgct gggaaaaaat tcgacattta ctttggacac tagatggagt 1560
tcattagcgc ctggtccgtg tatgggggat gacggacgaa ctccatccac caccaagttc 1620
tcaaatgctc agctcatgtt tggatctgga acacaaccca ccgaaggcgg tgaagatgct 1680
gtacatatta catccgagtc ggaggtcaag gcaaccaacc caactgcaat cgatgaatac 1740
ggacgagtgg ccgataatac gcaaaatgca acaaccgccc caaccacagt gggaaatgct 1800
gcaatggggg ccatgcctgg gatggtgtgg caagataggg atatctatct tcaaggaccc 1860
atctggggaa aaatacccca tacagacgga cattttcatc cgtctcctct catggggggg 1920
tttggataca gaaaaccccc tccgcaaatt tttattaaaa acacccccgt tcctggaaat 1980
ccggcaacta cattttctcc aaatagaata aacaatttca ttactcaata ctcaacggga 2040
caagtgaccg ttactattga ctgggagctg caaaaggaaa actcaaagag atggaaccca 2100
gaagtacaat ttacatcaaa ttttggcacg gtcgattcac taaactgggc accggacaac 2160
gcgggaaact acaaagaacc aagggtgatt ggcaccagat acctgactcg tatactataa 2220
<210> 30
<211> 739
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 D437接头6 SpyTag
<400> 30
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Gly Leu Ser Gly Ser Gly Ala His Ile Val Met
435 440 445
Val Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly Leu Lys
450 455 460
Phe Ile Lys Asn Lys Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Phe Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile
485 490 495
Asn Asn Ser Val Val Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr
500 505 510
Phe Thr Leu Asp Thr Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met
515 520 525
Gly Asp Asp Gly Arg Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln
530 535 540
Leu Met Phe Gly Ser Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala
545 550 555 560
Val His Ile Thr Ser Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala
565 570 575
Ile Asp Glu Tyr Gly Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr
580 585 590
Ala Pro Thr Thr Val Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met
595 600 605
Val Trp Gln Asp Arg Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys
610 615 620
Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly
625 630 635 640
Phe Gly Tyr Arg Lys Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro
645 650 655
Val Pro Gly Asn Pro Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn
660 665 670
Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp
675 680 685
Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe
690 695 700
Thr Ser Asn Phe Gly Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn
705 710 715 720
Ala Gly Asn Tyr Lys Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr
725 730 735
Arg Ile Leu
<210> 31
<211> 2244
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 G432接头10 SpyTag
<400> 31
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggaggcc tggggagcgg cggaggcctg 1320
agcggcgccc acatcgtgat ggtggacgcc tacaagccga cgaagggcct gagcggcggc 1380
agcggcctgg ggggctcaac aacgagagac ttaaaattta tcaagaacaa agttcccaat 1440
tttgcacatt atggaaaaaa ttggcttcct ggacctttta ttagacaaca ggggtggaca 1500
acacaaaata ttaataatag tgttgttaat tttaatgaca tgctgggaaa aaattcgaca 1560
tttactttgg acactagatg gagttcatta gcgcctggtc cgtgtatggg ggatgacgga 1620
cgaactccat ccaccaccaa gttctcaaat gctcagctca tgtttggatc tggaacacaa 1680
cccaccgaag gcggtgaaga tgctgtacat attacatccg agtcggaggt caaggcaacc 1740
aacccaactg caatcgatga atacggacga gtggccgata atacgcaaaa tgcaacaacc 1800
gccccaacca cagtgggaaa tgctgcaatg ggggccatgc ctgggatggt gtggcaagat 1860
agggatatct atcttcaagg acccatctgg ggaaaaatac cccatacaga cggacatttt 1920
catccgtctc ctctcatggg ggggtttgga tacagaaaac cccctccgca aatttttatt 1980
aaaaacaccc ccgttcctgg aaatccggca actacatttt ctccaaatag aataaacaat 2040
ttcattactc aatactcaac gggacaagtg accgttacta ttgactggga gctgcaaaag 2100
gaaaactcaa agagatggaa cccagaagta caatttacat caaattttgg cacggtcgat 2160
tcactaaact gggcaccgga caacgcggga aactacaaag aaccaagggt gattggcacc 2220
agatacctga ctcgtatact ataa 2244
<210> 32
<211> 747
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 G432接头10 SpyTag
<400> 32
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Gly Leu Gly Ser Gly Gly Gly Leu Ser Gly Ala His Ile Val Met Val
435 440 445
Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Gly Ser Gly Leu Gly
450 455 460
Gly Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn
465 470 475 480
Phe Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln
485 490 495
Gln Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn
500 505 510
Asp Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser
515 520 525
Ser Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser
530 535 540
Thr Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln
545 550 555 560
Pro Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu
565 570 575
Val Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala
580 585 590
Asp Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala
595 600 605
Ala Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr
610 615 620
Leu Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe
625 630 635 640
His Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro
645 650 655
Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr
660 665 670
Phe Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly
675 680 685
Gln Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys
690 695 700
Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp
705 710 715 720
Ser Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg
725 730 735
Val Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu
740 745
<210> 33
<211> 2262
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1蜥蜴VP2 VP3 G436接头6 SpyTag
<400> 33
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccgaa 420
aagcgaaaga cacccgaaga gtggttagct caagaaaaga ctccaaccaa acaaaggttc 480
cagataccag ctccaggaca atctggatca gattctcctt ccacctcagg atccggcggt 540
actgcaggct ccagttctag cgcatcaaat acaatggctc aaggaggtgg cggaccaatg 600
gcagacgata accaaggcgc cgagggagtg ggtaatgcct cgggagattg gcattgcgat 660
acccaatggc tgggcgacca cgtcattaca aaatctacca gaacttgggt tctgccctct 720
tacgggaatc atctctactc gcccatcaac tttgatggaa ccacagggaa cggaacccaa 780
gccgcttact gcggatacgc taccccctgg gcctactttg actttaaccg attccactgc 840
cacttttccc cccgagactg gcaaagactc attaacaacc ataccggaat acgaccagtc 900
ggactcaaat tcaagctgtt caacatccag gtcaaggaaa tcacagtaca agattcgacc 960
aaaacgatcg ccaacaatct caccagcacc gtacaggtct ttgcggacac ggagcaccag 1020
ctcccgtacg tattaggaaa tgccacgcag ggcacgtttc ctccctttcc ggctgaagtc 1080
tttcagttgc ctcagtacgg ctactgtacc atccaaggcc ctcagggtaa gtttaccgac 1140
agaagtgcct tctactgctt ggagtacttt ccttccaaga tgctgagaac ggggaataac 1200
tttgaattta cttacaagtt cgagaaggtt cccttccatt ctggctgggc tcaaagccag 1260
tcgttggatc gattgatgaa tcccttgatc ccacagtacc tgttggccga ttatggtggc 1320
ctgagcggca gcggcgccca catcgtgatg gtggacgcct acaagccgac gaagggcctg 1380
agcggcagcg gcacgaccgc cagtagtgcc ataacatact atcggccaaa cagcacagac 1440
ttgagctggt actttaaaaa ctggctgcct gggccagtgg aaaggcgaca gcaaatcaat 1500
tctgaagact cgacgaaaaa ccatgccaat ttgaacggga atgcacacac caacaaatac 1560
agcatccagc acagacaaac caagatgatg ccaggggtgg ctctcagtag taaatacaca 1620
ggtgctgctg aaggaacgtc gttactgaac ggggtattga cctttgataa gatcgccaat 1680
gacaatacta acatcacgga tacaaataat gtcaatcgga cgatcgaaga tgaaattcaa 1740
ggtaccaatc cttatggaaa cgacgtaccc attaccgtcg ctgtcaatac acaaaacgcg 1800
accacttctc ctaccatgca aaacagcagc acgtatgaac tattacctgg tgctgtctgg 1860
tccaacagag atatttacct gcaaggtccc atctgggcta aaatacccga taccgatgga 1920
cactttcacc cgtctccaca aatgggtggt ttcggactta aaaacccacc accgatgatc 1980
ctcatcaaaa acacacccgt tcccgccgat ccaccaacga ccttcaaacc gactccgatg 2040
aacagcttca tcagcgaata cagtaccggt caggtgactg tagagatgct gtgggaggtc 2100
cggaaagaag actccaagag atggaacccg gaaatccagt ttacctccaa ttttggattg 2160
tccgatcctc agatcgacgg tatacccttt ggtattacca aattgggtaa ttacgaggaa 2220
ccacgtccta ttggcaccag atacctgact cgtcatttgt aa 2262
<210> 34
<211> 753
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1蜥蜴VP2 VP3 G436接头6 SpyTag
<400> 34
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Glu Lys Arg Lys Thr
130 135 140
Pro Glu Glu Trp Leu Ala Gln Glu Lys Thr Pro Thr Lys Gln Arg Phe
145 150 155 160
Gln Ile Pro Ala Pro Gly Gln Ser Gly Ser Asp Ser Pro Ser Thr Ser
165 170 175
Gly Ser Gly Gly Thr Ala Gly Ser Ser Ser Ser Ala Ser Asn Thr Met
180 185 190
Ala Gln Gly Gly Gly Gly Pro Met Ala Asp Asp Asn Gln Gly Ala Glu
195 200 205
Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Thr Gln Trp Leu
210 215 220
Gly Asp His Val Ile Thr Lys Ser Thr Arg Thr Trp Val Leu Pro Ser
225 230 235 240
Tyr Gly Asn His Leu Tyr Ser Pro Ile Asn Phe Asp Gly Thr Thr Gly
245 250 255
Asn Gly Thr Gln Ala Ala Tyr Cys Gly Tyr Ala Thr Pro Trp Ala Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn His Thr Gly Ile Arg Pro Val Gly Leu Lys Phe
290 295 300
Lys Leu Phe Asn Ile Gln Val Lys Glu Ile Thr Val Gln Asp Ser Thr
305 310 315 320
Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp
325 330 335
Thr Glu His Gln Leu Pro Tyr Val Leu Gly Asn Ala Thr Gln Gly Thr
340 345 350
Phe Pro Pro Phe Pro Ala Glu Val Phe Gln Leu Pro Gln Tyr Gly Tyr
355 360 365
Cys Thr Ile Gln Gly Pro Gln Gly Lys Phe Thr Asp Arg Ser Ala Phe
370 375 380
Tyr Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn Asn
385 390 395 400
Phe Glu Phe Thr Tyr Lys Phe Glu Lys Val Pro Phe His Ser Gly Trp
405 410 415
Ala Gln Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Pro Gln
420 425 430
Tyr Leu Leu Ala Asp Tyr Gly Gly Leu Ser Gly Ser Gly Ala His Ile
435 440 445
Val Met Val Asp Ala Tyr Lys Pro Thr Lys Gly Leu Ser Gly Ser Gly
450 455 460
Thr Thr Ala Ser Ser Ala Ile Thr Tyr Tyr Arg Pro Asn Ser Thr Asp
465 470 475 480
Leu Ser Trp Tyr Phe Lys Asn Trp Leu Pro Gly Pro Val Glu Arg Arg
485 490 495
Gln Gln Ile Asn Ser Glu Asp Ser Thr Lys Asn His Ala Asn Leu Asn
500 505 510
Gly Asn Ala His Thr Asn Lys Tyr Ser Ile Gln His Arg Gln Thr Lys
515 520 525
Met Met Pro Gly Val Ala Leu Ser Ser Lys Tyr Thr Gly Ala Ala Glu
530 535 540
Gly Thr Ser Leu Leu Asn Gly Val Leu Thr Phe Asp Lys Ile Ala Asn
545 550 555 560
Asp Asn Thr Asn Ile Thr Asp Thr Asn Asn Val Asn Arg Thr Ile Glu
565 570 575
Asp Glu Ile Gln Gly Thr Asn Pro Tyr Gly Asn Asp Val Pro Ile Thr
580 585 590
Val Ala Val Asn Thr Gln Asn Ala Thr Thr Ser Pro Thr Met Gln Asn
595 600 605
Ser Ser Thr Tyr Glu Leu Leu Pro Gly Ala Val Trp Ser Asn Arg Asp
610 615 620
Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Asp Thr Asp Gly
625 630 635 640
His Phe His Pro Ser Pro Gln Met Gly Gly Phe Gly Leu Lys Asn Pro
645 650 655
Pro Pro Met Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro
660 665 670
Thr Thr Phe Lys Pro Thr Pro Met Asn Ser Phe Ile Ser Glu Tyr Ser
675 680 685
Thr Gly Gln Val Thr Val Glu Met Leu Trp Glu Val Arg Lys Glu Asp
690 695 700
Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr Ser Asn Phe Gly Leu
705 710 715 720
Ser Asp Pro Gln Ile Asp Gly Ile Pro Phe Gly Ile Thr Lys Leu Gly
725 730 735
Asn Tyr Glu Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg His
740 745 750
Leu
<210> 35
<211> 2262
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1蜥蜴VP2 VP3 T573接头6 SpyTag
<400> 35
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggccgaa 420
aagcgaaaga cacccgaaga gtggttagct caagaaaaga ctccaaccaa acaaaggttc 480
cagataccag ctccaggaca atctggatca gattctcctt ccacctcagg atccggcggt 540
actgcaggct ccagttctag cgcatcaaat acaatggctc aaggaggtgg cggaccaatg 600
gcagacgata accaaggcgc cgagggagtg ggtaatgcct cgggagattg gcattgcgat 660
acccaatggc tgggcgacca cgtcattaca aaatctacca gaacttgggt tctgccctct 720
tacgggaatc atctctactc gcccatcaac tttgatggaa ccacagggaa cggaacccaa 780
gccgcttact gcggatacgc taccccctgg gcctactttg actttaaccg attccactgc 840
cacttttccc cccgagactg gcaaagactc attaacaacc ataccggaat acgaccagtc 900
ggactcaaat tcaagctgtt caacatccag gtcaaggaaa tcacagtaca agattcgacc 960
aaaacgatcg ccaacaatct caccagcacc gtacaggtct ttgcggacac ggagcaccag 1020
ctcccgtacg tattaggaaa tgccacgcag ggcacgtttc ctccctttcc ggctgaagtc 1080
tttcagttgc ctcagtacgg ctactgtacc atccaaggcc ctcagggtaa gtttaccgac 1140
agaagtgcct tctactgctt ggagtacttt ccttccaaga tgctgagaac ggggaataac 1200
tttgaattta cttacaagtt cgagaaggtt cccttccatt ctggctgggc tcaaagccag 1260
tcgttggatc gattgatgaa tcccttgatc ccacagtacc tgttggccga ttatggtacg 1320
accgccagta gtgccataac atactatcgg ccaaacagca cagacttgag ctggtacttt 1380
aaaaactggc tgcctgggcc agtggaaagg cgacagcaaa tcaattctga agactcgacg 1440
aaaaaccatg ccaatttgaa cgggaatgca cacaccaaca aatacagcat ccagcacaga 1500
caaaccaaga tgatgccagg ggtggctctc agtagtaaat acacaggtgc tgctgaagga 1560
acgtcgttac tgaacggggt attgaccttt gataagatcg ccaatgacaa tactaacatc 1620
acggatacaa ataatgtcaa tcggacgatc gaagatgaaa ttcaaggtac caatccttat 1680
ggaaacgacg tacccattac cgtcgctgtc aatacacaaa acgcgaccgg cctgagcggc 1740
agcggcgccc acatcgtgat ggtggacgcc tacaagccga cgaagggcct gagcggcagc 1800
ggcacttctc ctaccatgca aaacagcagc acgtatgaac tattacctgg tgctgtctgg 1860
tccaacagag atatttacct gcaaggtccc atctgggcta aaatacccga taccgatgga 1920
cactttcacc cgtctccaca aatgggtggt ttcggactta aaaacccacc accgatgatc 1980
ctcatcaaaa acacacccgt tcccgccgat ccaccaacga ccttcaaacc gactccgatg 2040
aacagcttca tcagcgaata cagtaccggt caggtgactg tagagatgct gtgggaggtc 2100
cggaaagaag actccaagag atggaacccg gaaatccagt ttacctccaa ttttggattg 2160
tccgatcctc agatcgacgg tatacccttt ggtattacca aattgggtaa ttacgaggaa 2220
ccacgtccta ttggcaccag atacctgact cgtcatttgt aa 2262
<210> 36
<211> 753
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1蜥蜴VP2 VP3 T573接头6 SpyTag
<400> 36
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Glu Lys Arg Lys Thr
130 135 140
Pro Glu Glu Trp Leu Ala Gln Glu Lys Thr Pro Thr Lys Gln Arg Phe
145 150 155 160
Gln Ile Pro Ala Pro Gly Gln Ser Gly Ser Asp Ser Pro Ser Thr Ser
165 170 175
Gly Ser Gly Gly Thr Ala Gly Ser Ser Ser Ser Ala Ser Asn Thr Met
180 185 190
Ala Gln Gly Gly Gly Gly Pro Met Ala Asp Asp Asn Gln Gly Ala Glu
195 200 205
Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Thr Gln Trp Leu
210 215 220
Gly Asp His Val Ile Thr Lys Ser Thr Arg Thr Trp Val Leu Pro Ser
225 230 235 240
Tyr Gly Asn His Leu Tyr Ser Pro Ile Asn Phe Asp Gly Thr Thr Gly
245 250 255
Asn Gly Thr Gln Ala Ala Tyr Cys Gly Tyr Ala Thr Pro Trp Ala Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn His Thr Gly Ile Arg Pro Val Gly Leu Lys Phe
290 295 300
Lys Leu Phe Asn Ile Gln Val Lys Glu Ile Thr Val Gln Asp Ser Thr
305 310 315 320
Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp
325 330 335
Thr Glu His Gln Leu Pro Tyr Val Leu Gly Asn Ala Thr Gln Gly Thr
340 345 350
Phe Pro Pro Phe Pro Ala Glu Val Phe Gln Leu Pro Gln Tyr Gly Tyr
355 360 365
Cys Thr Ile Gln Gly Pro Gln Gly Lys Phe Thr Asp Arg Ser Ala Phe
370 375 380
Tyr Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn Asn
385 390 395 400
Phe Glu Phe Thr Tyr Lys Phe Glu Lys Val Pro Phe His Ser Gly Trp
405 410 415
Ala Gln Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Pro Gln
420 425 430
Tyr Leu Leu Ala Asp Tyr Gly Thr Thr Ala Ser Ser Ala Ile Thr Tyr
435 440 445
Tyr Arg Pro Asn Ser Thr Asp Leu Ser Trp Tyr Phe Lys Asn Trp Leu
450 455 460
Pro Gly Pro Val Glu Arg Arg Gln Gln Ile Asn Ser Glu Asp Ser Thr
465 470 475 480
Lys Asn His Ala Asn Leu Asn Gly Asn Ala His Thr Asn Lys Tyr Ser
485 490 495
Ile Gln His Arg Gln Thr Lys Met Met Pro Gly Val Ala Leu Ser Ser
500 505 510
Lys Tyr Thr Gly Ala Ala Glu Gly Thr Ser Leu Leu Asn Gly Val Leu
515 520 525
Thr Phe Asp Lys Ile Ala Asn Asp Asn Thr Asn Ile Thr Asp Thr Asn
530 535 540
Asn Val Asn Arg Thr Ile Glu Asp Glu Ile Gln Gly Thr Asn Pro Tyr
545 550 555 560
Gly Asn Asp Val Pro Ile Thr Val Ala Val Asn Thr Gln Asn Ala Thr
565 570 575
Gly Leu Ser Gly Ser Gly Ala His Ile Val Met Val Asp Ala Tyr Lys
580 585 590
Pro Thr Lys Gly Leu Ser Gly Ser Gly Thr Ser Pro Thr Met Gln Asn
595 600 605
Ser Ser Thr Tyr Glu Leu Leu Pro Gly Ala Val Trp Ser Asn Arg Asp
610 615 620
Ile Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Asp Thr Asp Gly
625 630 635 640
His Phe His Pro Ser Pro Gln Met Gly Gly Phe Gly Leu Lys Asn Pro
645 650 655
Pro Pro Met Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro
660 665 670
Thr Thr Phe Lys Pro Thr Pro Met Asn Ser Phe Ile Ser Glu Tyr Ser
675 680 685
Thr Gly Gln Val Thr Val Glu Met Leu Trp Glu Val Arg Lys Glu Asp
690 695 700
Ser Lys Arg Trp Asn Pro Glu Ile Gln Phe Thr Ser Asn Phe Gly Leu
705 710 715 720
Ser Asp Pro Gln Ile Asp Gly Ile Pro Phe Gly Ile Thr Lys Leu Gly
725 730 735
Asn Tyr Glu Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg His
740 745 750
Leu
<210> 37
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 4接头
<400> 37
Gly Leu Ser Gly
1
<210> 38
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 6接头
<400> 38
Gly Leu Ser Gly Ser Gly
1 5
<210> 39
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 8接头
<400> 39
Gly Leu Ser Gly Leu Ser Gly Ser
1 5
<210> 40
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 10接头
<400> 40
Gly Leu Ser Gly Leu Ser Gly Leu Ser Gly
1 5 10
<210> 41
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 10接头
<400> 41
Gly Leu Ser Gly Gly Ser Gly Leu Ser Gly
1 5 10
<210> 42
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> SpyTag
<400> 42
Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys
1 5 10
<210> 43
<211> 113
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Spycatcher
<400> 43
Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp
1 5 10 15
Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg
20 25 30
Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp
35 40 45
Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys
50 55 60
Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala
65 70 75 80
Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu
85 90 95
Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His
100 105 110
Ile
<210> 44
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> c-myc
<400> 44
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 45
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> B1
<400> 45
Ile Gly Thr Arg Tyr Leu Thr Arg
1 5
<210> 46
<211> 1341
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人IgG4重链-接头-SpyCatcher
<400> 46
gcctccacca agggcccatc ggtcttcccc ctggcgccct gctccaggag cacctccgag 60
agcacagccg ccctgggctg cctggtcaag gactacttcc ccgaaccggt gacggtgtcg 120
tggaactcag gcgccctgac cagcggcgtg cacaccttcc cggctgtcct acagtcctca 180
ggactctact ccctcagcag cgtggtgacc gtgccctcca gcagcttggg cacgaagacc 240
tacacctgca acgtagatca caagcccagc aacaccaagg tggacaagag agttgagtcc 300
aaatatggtc ccccatgccc accctgccca gcacctgagt tcctgggggg accatcagtc 360
ttcctgttcc ccccaaaacc caaggacact ctcatgatct cccggacccc tgaggtcacg 420
tgcgtggtgg tggacgtgag ccaggaagac cccgaggtcc agttcaactg gtacgtggat 480
ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagttcaa cagcacgtac 540
cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaacggcaa ggagtacaag 600
tgcaaggtct ccaacaaagg cctcccgtcc tccatcgaga aaaccatctc caaagccaaa 660
gggcagcccc gagagccaca ggtgtacacc ctgcccccat cccaggagga gatgaccaag 720
aaccaggtca gcctgacctg cctggtcaaa ggcttctacc ccagcgacat cgccgtggag 780
tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 840
gacggctcct tcttcctcta cagcaggctc accgtggaca agagcaggtg gcaggagggg 900
aatgtcttct catgctccgt gatgcatgag gctctgcaca accactacac acagaagtcc 960
ctctccctgt ctctgggtaa aggaagcggc gaaagcggcg tggataccct gtccggactg 1020
agcagtgagc aaggccagtc cggagatatg acaattgaag aagatagcgc cacccatatt 1080
aaattctcca aaagagatga ggacggcaaa gagctggctg gagcaacaat ggagctgaga 1140
gattcctctg gaaagactat tagtacatgg atctctgatg gccaagtgaa agatttctat 1200
ctgtatccag gaaagtacac atttgtcgaa accgctgcac cagacggata tgaggtggct 1260
acagctatta cctttacagt gaatgagcaa ggacaggtga ctgttaatgg caaagctact 1320
aaaggagacg ctcatattta a 1341
<210> 47
<211> 446
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人IgG4重链-接头-SpyCatcher
<400> 47
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg
1 5 10 15
Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr
65 70 75 80
Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro
100 105 110
Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
115 120 125
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
130 135 140
Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp
145 150 155 160
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe
165 170 175
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
180 185 190
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu
195 200 205
Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
210 215 220
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys
225 230 235 240
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
245 250 255
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
260 265 270
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
275 280 285
Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser
290 295 300
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
305 310 315 320
Leu Ser Leu Ser Leu Gly Lys Gly Ser Gly Glu Ser Gly Val Asp Thr
325 330 335
Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp Met Thr Ile
340 345 350
Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp
355 360 365
Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly
370 375 380
Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr
385 390 395 400
Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly
405 410 415
Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln
420 425 430
Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His Ile
435 440 445
<210> 48
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> IgG-SpyCatcher接头
<400> 48
ggaagcggcg aaagcggc 18
<210> 49
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IgG-SpyCatcher接头
<400> 49
Gly Ser Gly Glu Ser Gly
1 5
<210> 50
<211> 981
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> hIgG4
<400> 50
gcctccacca agggcccatc ggtcttcccc ctggcgccct gctccaggag cacctccgag 60
agcacagccg ccctgggctg cctggtcaag gactacttcc ccgaaccggt gacggtgtcg 120
tggaactcag gcgccctgac cagcggcgtg cacaccttcc cggctgtcct acagtcctca 180
ggactctact ccctcagcag cgtggtgacc gtgccctcca gcagcttggg cacgaagacc 240
tacacctgca acgtagatca caagcccagc aacaccaagg tggacaagag agttgagtcc 300
aaatatggtc ccccatgccc accctgccca gcacctgagt tcctgggggg accatcagtc 360
ttcctgttcc ccccaaaacc caaggacact ctcatgatct cccggacccc tgaggtcacg 420
tgcgtggtgg tggacgtgag ccaggaagac cccgaggtcc agttcaactg gtacgtggat 480
ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagttcaa cagcacgtac 540
cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaacggcaa ggagtacaag 600
tgcaaggtct ccaacaaagg cctcccgtcc tccatcgaga aaaccatctc caaagccaaa 660
gggcagcccc gagagccaca ggtgtacacc ctgcccccat cccaggagga gatgaccaag 720
aaccaggtca gcctgacctg cctggtcaaa ggcttctacc ccagcgacat cgccgtggag 780
tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 840
gacggctcct tcttcctcta cagcaggctc accgtggaca agagcaggtg gcaggagggg 900
aatgtcttct catgctccgt gatgcatgag gctctgcaca accactacac acagaagtcc 960
ctctccctgt ctctgggtaa a 981
<210> 51
<211> 327
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> hIgG4
<400> 51
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg
1 5 10 15
Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr
65 70 75 80
Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro
100 105 110
Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
115 120 125
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
130 135 140
Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp
145 150 155 160
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe
165 170 175
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
180 185 190
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu
195 200 205
Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg
210 215 220
Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys
225 230 235 240
Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp
245 250 255
Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys
260 265 270
Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser
275 280 285
Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser
290 295 300
Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser
305 310 315 320
Leu Ser Leu Ser Leu Gly Lys
325
<210> 52
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 Y730F
<400> 52
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tgattggcac cagattcctg actcgtatac tataa 2145
<210> 53
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 Y730F
<400> 53
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Ile Gly Thr Arg Phe Leu Thr Arg Ile Leu
705 710
<210> 54
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 B1
<400> 54
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aaccctctca gccagattcg 420
tcctcggaca acacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145
<210> 55
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 B1
<400> 55
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Ser Gln Pro Asp Ser Ser Ser Asp Asn
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Val Gly Ser Arg Phe Leu Thr His Ile Leu
705 710
<210> 56
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v2
<400> 56
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145
<210> 57
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v2
<400> 57
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu
705 710
<210> 58
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v3
<400> 58
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145
<210> 59
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v3
<400> 59
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu
705 710
<210> 60
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v4
<400> 60
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tgattggcac cagatacctg actcgtatac tataa 2145
<210> 61
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v4
<400> 61
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu
705 710
<210> 62
<211> 2157
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v5
<400> 62
atgtcttctt tgtttaaaga gtacctgcag agtaccggac tggtgggtat ccagtcggga 60
gcgccgaagc caaaggccgg ccagcagaag caggatacag ggtcctttga gtggaaaaag 120
aaggaggaca cagccagagg gctggtcctt cccggttaca agtacctcgg gcccttcaac 180
ggtctagagc ggggcgagcc tgtgaatgcc gcggacgccg cggcccagcg acacgaccga 240
cagtacgatc gtattctaca acaagggggt aatccatacc tcacgtacaa ccacgccgac 300
cgagagttcc aggaggagct ccagtctgac gagtcttttg ggggaaatct tggcaaggct 360
gtgtttcagg ccaagaagcg aatcctagag cccctcggtc tggttgaaga ggatccctct 420
cagccagatt cgtcctcgga caacacggcg ccacccgtga aaaagtcccg tctcgaagaa 480
gcccagccca ttcaaagtcc agacgtttcc agcagcactg gcggaggaat tgccgacgtc 540
atgtctggag atgctgaaat ggctgcagtg ggcgggggag caccgggcgt cgacggccag 600
ggtgccgagg gagtgggtac ttcctcgggt aattggcatt gcgattccca gtggtcagaa 660
ggacacgtca gaaccaccag caccagaacc tgggtgttgc ccagctacaa caaccacctg 720
tataaacggc ttggaagtag cgcacaatcc aatacctaca acggattctc caccccctgg 780
ggatacctcg acttcaatag atggcactgt cacttcagtc ctcggaactg gcaacgtctc 840
atcaacaaca actggggcat cagaccaaaa agacttaatg ttaaattgtt caacatacaa 900
gtcaaagagg tcacgacgga aggggggacg acgaccgtcg ccaataacct taccagcacg 960
attcaggtgt ttgcggacaa cgcgtacgaa ctcccgtatg ttgtcgacgc gggtcacgag 1020
ggggcattgc cgccgttccc aaacgacgtg tttatgattc cccaatacgg atactgcggg 1080
ctggtgtctg gtcaaagtca ggctcagtcg gacttgtgtt cgttttattg cctggagtat 1140
tttccatccc agatgctgag aacaggaaac aattttgaaa tgaatttcag gtttgaagac 1200
gttccatttc actccatgta cgcccacagc cagtctctag acaggctcat gaatccttta 1260
attgatcagt atctgtggag tctaaaacaa acaggaaacc cgactggatc aacaacgaga 1320
gacttaaaat ttatcaagaa caaagttccc aattttgcac attatggaaa aaattggctt 1380
cctggacctt ttattagaca acaggggtgg acaacacaaa atattaataa tagtgttgtt 1440
aattttaatg acatgctggg aaaaaattcg acatttactt tggacactag atggagttca 1500
ttagcgcctg gtccgtgtat gggggatgac ggacgaactc catccaccac caagttctca 1560
aatgctcagc tcatgtttgg atctggaaca caacccaccg aaggcggtga agatgctgta 1620
catattacat ccgagtcgga ggtcaaggca accaacccaa ctgcaatcga tgaatacgga 1680
cgagtggccg ataatacgca aaatgcaaca accgccccaa ccacagtggg aaatgctgca 1740
atgggggcca tgcctgggat ggtgtggcaa gatagggata tctatcttca aggacccatc 1800
tggggaaaaa taccccatac agacggacat tttcatccgt ctcctctcat gggggggttt 1860
ggatacagaa aaccccctcc gcaaattttt attaaaaaca cccccgttcc tggaaatccg 1920
gcaactacat tttctccaaa tagaataaac aatttcatta ctcaatactc aacgggacaa 1980
gtgaccgtta ctattgactg ggagctgcaa aaggaaaact caaagagatg gaacccagaa 2040
gtacaattta catcaaattt tggcacggtc gattcactaa actgggcacc ggacaacgcg 2100
ggaaactaca aagaaccaag ggtgattggc accagatacc tgactcgtat actataa 2157
<210> 63
<211> 718
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cap AAV2 VP1海狮VP2 VP3 v5
<400> 63
Met Ser Ser Leu Phe Lys Glu Tyr Leu Gln Ser Thr Gly Leu Val Gly
1 5 10 15
Ile Gln Ser Gly Ala Pro Lys Pro Lys Ala Gly Gln Gln Lys Gln Asp
20 25 30
Thr Gly Ser Phe Glu Trp Lys Lys Lys Glu Asp Thr Ala Arg Gly Leu
35 40 45
Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Glu Arg
50 55 60
Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Gln Arg His Asp Arg
65 70 75 80
Gln Tyr Asp Arg Ile Leu Gln Gln Gly Gly Asn Pro Tyr Leu Thr Tyr
85 90 95
Asn His Ala Asp Arg Glu Phe Gln Glu Glu Leu Gln Ser Asp Glu Ser
100 105 110
Phe Gly Gly Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Ile
115 120 125
Leu Glu Pro Leu Gly Leu Val Glu Glu Asp Pro Ser Gln Pro Asp Ser
130 135 140
Ser Ser Asp Asn Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu
145 150 155 160
Ala Gln Pro Ile Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly
165 170 175
Ile Ala Asp Val Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly
180 185 190
Gly Ala Pro Gly Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser
195 200 205
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg
210 215 220
Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu
225 230 235 240
Tyr Lys Arg Leu Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe
245 250 255
Ser Thr Pro Trp Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe
260 265 270
Ser Pro Arg Asn Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg
275 280 285
Pro Lys Arg Leu Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val
290 295 300
Thr Thr Glu Gly Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr
305 310 315 320
Ile Gln Val Phe Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp
325 330 335
Ala Gly His Glu Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met
340 345 350
Ile Pro Gln Tyr Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala
355 360 365
Gln Ser Asp Leu Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
370 375 380
Met Leu Arg Thr Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp
385 390 395 400
Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu
405 410 415
Met Asn Pro Leu Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly
420 425 430
Asn Pro Thr Gly Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys
435 440 445
Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe
450 455 460
Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val
465 470 475 480
Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr
485 490 495
Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg
500 505 510
Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser
515 520 525
Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser
530 535 540
Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly
545 550 555 560
Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val
565 570 575
Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg
580 585 590
Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp
595 600 605
Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys
610 615 620
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro
625 630 635 640
Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr
645 650 655
Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu
660 665 670
Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly
675 680 685
Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys
690 695 700
Glu Pro Arg Val Ile Gly Thr Arg Tyr Leu Thr Arg Ile Leu
705 710 715
<210> 64
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v2 B1
<400> 64
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggacggcgcc acccgtgaaa aagtcccgtc tcgaagaagc ccagcccatt 480
caaagtccag acgtttccag cagcactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145
<210> 65
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v2 B1
<400> 65
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu Ala Gln Pro Ile
145 150 155 160
Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Val Gly Ser Arg Phe Leu Thr His Ile Leu
705 710
<210> 66
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v3 B1
<400> 66
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145
<210> 67
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v3 B1
<400> 67
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Val Gly Ser Arg Phe Leu Thr His Ile Leu
705 710
<210> 68
<211> 2145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v4 B1
<400> 68
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaactggc ggaggaattg ccgacgtcat gtctggagat 540
gctgaaatgg ctgcagtggg cgggggagca ccgggcgtcg acggccaggg tgccgaggga 600
gtgggtactt cctcgggtaa ttggcattgc gattcccagt ggtcagaagg acacgtcaga 660
accaccagca ccagaacctg ggtgttgccc agctacaaca accacctgta taaacggctt 720
ggaagtagcg cacaatccaa tacctacaac ggattctcca ccccctgggg atacctcgac 780
ttcaatagat ggcactgtca cttcagtcct cggaactggc aacgtctcat caacaacaac 840
tggggcatca gaccaaaaag acttaatgtt aaattgttca acatacaagt caaagaggtc 900
acgacggaag gggggacgac gaccgtcgcc aataacctta ccagcacgat tcaggtgttt 960
gcggacaacg cgtacgaact cccgtatgtt gtcgacgcgg gtcacgaggg ggcattgccg 1020
ccgttcccaa acgacgtgtt tatgattccc caatacggat actgcgggct ggtgtctggt 1080
caaagtcagg ctcagtcgga cttgtgttcg ttttattgcc tggagtattt tccatcccag 1140
atgctgagaa caggaaacaa ttttgaaatg aatttcaggt ttgaagacgt tccatttcac 1200
tccatgtacg cccacagcca gtctctagac aggctcatga atcctttaat tgatcagtat 1260
ctgtggagtc taaaacaaac aggaaacccg actggatcaa caacgagaga cttaaaattt 1320
atcaagaaca aagttcccaa ttttgcacat tatggaaaaa attggcttcc tggacctttt 1380
attagacaac aggggtggac aacacaaaat attaataata gtgttgttaa ttttaatgac 1440
atgctgggaa aaaattcgac atttactttg gacactagat ggagttcatt agcgcctggt 1500
ccgtgtatgg gggatgacgg acgaactcca tccaccacca agttctcaaa tgctcagctc 1560
atgtttggat ctggaacaca acccaccgaa ggcggtgaag atgctgtaca tattacatcc 1620
gagtcggagg tcaaggcaac caacccaact gcaatcgatg aatacggacg agtggccgat 1680
aatacgcaaa atgcaacaac cgccccaacc acagtgggaa atgctgcaat gggggccatg 1740
cctgggatgg tgtggcaaga tagggatatc tatcttcaag gacccatctg gggaaaaata 1800
ccccatacag acggacattt tcatccgtct cctctcatgg gggggtttgg atacagaaaa 1860
ccccctccgc aaatttttat taaaaacacc cccgttcctg gaaatccggc aactacattt 1920
tctccaaata gaataaacaa tttcattact caatactcaa cgggacaagt gaccgttact 1980
attgactggg agctgcaaaa ggaaaactca aagagatgga acccagaagt acaatttaca 2040
tcaaattttg gcacggtcga ttcactaaac tgggcaccgg acaacgcggg aaactacaaa 2100
gaaccaaggg tggtggggtc tcgattcctt acgcatatac tataa 2145
<210> 69
<211> 714
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v4 B1
<400> 69
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Thr Gly Gly Gly Ile Ala Asp Val
165 170 175
Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly Gly Ala Pro Gly
180 185 190
Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser Ser Gly Asn Trp
195 200 205
His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg Thr Thr Ser Thr
210 215 220
Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu Tyr Lys Arg Leu
225 230 235 240
Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp
245 250 255
Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe Ser Pro Arg Asn
260 265 270
Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg Pro Lys Arg Leu
275 280 285
Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Glu Gly
290 295 300
Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe
305 310 315 320
Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp Ala Gly His Glu
325 330 335
Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met Ile Pro Gln Tyr
340 345 350
Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala Gln Ser Asp Leu
355 360 365
Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr
370 375 380
Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp Val Pro Phe His
385 390 395 400
Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu
405 410 415
Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly Asn Pro Thr Gly
420 425 430
Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys Val Pro Asn Phe
435 440 445
Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe Ile Arg Gln Gln
450 455 460
Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val Asn Phe Asn Asp
465 470 475 480
Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr Arg Trp Ser Ser
485 490 495
Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg Thr Pro Ser Thr
500 505 510
Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser Gly Thr Gln Pro
515 520 525
Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser Glu Ser Glu Val
530 535 540
Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly Arg Val Ala Asp
545 550 555 560
Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val Gly Asn Ala Ala
565 570 575
Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg Asp Ile Tyr Leu
580 585 590
Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp Gly His Phe His
595 600 605
Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys Pro Pro Pro Gln
610 615 620
Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro Ala Thr Thr Phe
625 630 635 640
Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr Ser Thr Gly Gln
645 650 655
Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg
660 665 670
Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly Thr Val Asp Ser
675 680 685
Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys Glu Pro Arg Val
690 695 700
Val Gly Ser Arg Phe Leu Thr His Ile Leu
705 710
<210> 70
<211> 2157
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v5 B1
<400> 70
atgtcttctt tgtttaaaga gtacctgcag agtaccggac tggtgggtat ccagtcggga 60
gcgccgaagc caaaggccgg ccagcagaag caggatacag ggtcctttga gtggaaaaag 120
aaggaggaca cagccagagg gctggtcctt cccggttaca agtacctcgg gcccttcaac 180
ggtctagagc ggggcgagcc tgtgaatgcc gcggacgccg cggcccagcg acacgaccga 240
cagtacgatc gtattctaca acaagggggt aatccatacc tcacgtacaa ccacgccgac 300
cgagagttcc aggaggagct ccagtctgac gagtcttttg ggggaaatct tggcaaggct 360
gtgtttcagg ccaagaagcg aatcctagag cccctcggtc tggttgaaga ggatccctct 420
cagccagatt cgtcctcgga caacacggcg ccacccgtga aaaagtcccg tctcgaagaa 480
gcccagccca ttcaaagtcc agacgtttcc agcagcactg gcggaggaat tgccgacgtc 540
atgtctggag atgctgaaat ggctgcagtg ggcgggggag caccgggcgt cgacggccag 600
ggtgccgagg gagtgggtac ttcctcgggt aattggcatt gcgattccca gtggtcagaa 660
ggacacgtca gaaccaccag caccagaacc tgggtgttgc ccagctacaa caaccacctg 720
tataaacggc ttggaagtag cgcacaatcc aatacctaca acggattctc caccccctgg 780
ggatacctcg acttcaatag atggcactgt cacttcagtc ctcggaactg gcaacgtctc 840
atcaacaaca actggggcat cagaccaaaa agacttaatg ttaaattgtt caacatacaa 900
gtcaaagagg tcacgacgga aggggggacg acgaccgtcg ccaataacct taccagcacg 960
attcaggtgt ttgcggacaa cgcgtacgaa ctcccgtatg ttgtcgacgc gggtcacgag 1020
ggggcattgc cgccgttccc aaacgacgtg tttatgattc cccaatacgg atactgcggg 1080
ctggtgtctg gtcaaagtca ggctcagtcg gacttgtgtt cgttttattg cctggagtat 1140
tttccatccc agatgctgag aacaggaaac aattttgaaa tgaatttcag gtttgaagac 1200
gttccatttc actccatgta cgcccacagc cagtctctag acaggctcat gaatccttta 1260
attgatcagt atctgtggag tctaaaacaa acaggaaacc cgactggatc aacaacgaga 1320
gacttaaaat ttatcaagaa caaagttccc aattttgcac attatggaaa aaattggctt 1380
cctggacctt ttattagaca acaggggtgg acaacacaaa atattaataa tagtgttgtt 1440
aattttaatg acatgctggg aaaaaattcg acatttactt tggacactag atggagttca 1500
ttagcgcctg gtccgtgtat gggggatgac ggacgaactc catccaccac caagttctca 1560
aatgctcagc tcatgtttgg atctggaaca caacccaccg aaggcggtga agatgctgta 1620
catattacat ccgagtcgga ggtcaaggca accaacccaa ctgcaatcga tgaatacgga 1680
cgagtggccg ataatacgca aaatgcaaca accgccccaa ccacagtggg aaatgctgca 1740
atgggggcca tgcctgggat ggtgtggcaa gatagggata tctatcttca aggacccatc 1800
tggggaaaaa taccccatac agacggacat tttcatccgt ctcctctcat gggggggttt 1860
ggatacagaa aaccccctcc gcaaattttt attaaaaaca cccccgttcc tggaaatccg 1920
gcaactacat tttctccaaa tagaataaac aatttcatta ctcaatactc aacgggacaa 1980
gtgaccgtta ctattgactg ggagctgcaa aaggaaaact caaagagatg gaacccagaa 2040
gtacaattta catcaaattt tggcacggtc gattcactaa actgggcacc ggacaacgcg 2100
ggaaactaca aagaaccaag ggtggtgggg tctcgattcc ttacgcatat actataa 2157
<210> 71
<211> 718
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 被置换的Cap AAV2 VP1海狮VP2 VP3 v5 B1
<400> 71
Met Ser Ser Leu Phe Lys Glu Tyr Leu Gln Ser Thr Gly Leu Val Gly
1 5 10 15
Ile Gln Ser Gly Ala Pro Lys Pro Lys Ala Gly Gln Gln Lys Gln Asp
20 25 30
Thr Gly Ser Phe Glu Trp Lys Lys Lys Glu Asp Thr Ala Arg Gly Leu
35 40 45
Val Leu Pro Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Glu Arg
50 55 60
Gly Glu Pro Val Asn Ala Ala Asp Ala Ala Ala Gln Arg His Asp Arg
65 70 75 80
Gln Tyr Asp Arg Ile Leu Gln Gln Gly Gly Asn Pro Tyr Leu Thr Tyr
85 90 95
Asn His Ala Asp Arg Glu Phe Gln Glu Glu Leu Gln Ser Asp Glu Ser
100 105 110
Phe Gly Gly Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Ile
115 120 125
Leu Glu Pro Leu Gly Leu Val Glu Glu Asp Pro Ser Gln Pro Asp Ser
130 135 140
Ser Ser Asp Asn Thr Ala Pro Pro Val Lys Lys Ser Arg Leu Glu Glu
145 150 155 160
Ala Gln Pro Ile Gln Ser Pro Asp Val Ser Ser Ser Thr Gly Gly Gly
165 170 175
Ile Ala Asp Val Met Ser Gly Asp Ala Glu Met Ala Ala Val Gly Gly
180 185 190
Gly Ala Pro Gly Val Asp Gly Gln Gly Ala Glu Gly Val Gly Thr Ser
195 200 205
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Ser Glu Gly His Val Arg
210 215 220
Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Leu
225 230 235 240
Tyr Lys Arg Leu Gly Ser Ser Ala Gln Ser Asn Thr Tyr Asn Gly Phe
245 250 255
Ser Thr Pro Trp Gly Tyr Leu Asp Phe Asn Arg Trp His Cys His Phe
260 265 270
Ser Pro Arg Asn Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Ile Arg
275 280 285
Pro Lys Arg Leu Asn Val Lys Leu Phe Asn Ile Gln Val Lys Glu Val
290 295 300
Thr Thr Glu Gly Gly Thr Thr Thr Val Ala Asn Asn Leu Thr Ser Thr
305 310 315 320
Ile Gln Val Phe Ala Asp Asn Ala Tyr Glu Leu Pro Tyr Val Val Asp
325 330 335
Ala Gly His Glu Gly Ala Leu Pro Pro Phe Pro Asn Asp Val Phe Met
340 345 350
Ile Pro Gln Tyr Gly Tyr Cys Gly Leu Val Ser Gly Gln Ser Gln Ala
355 360 365
Gln Ser Asp Leu Cys Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
370 375 380
Met Leu Arg Thr Gly Asn Asn Phe Glu Met Asn Phe Arg Phe Glu Asp
385 390 395 400
Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu
405 410 415
Met Asn Pro Leu Ile Asp Gln Tyr Leu Trp Ser Leu Lys Gln Thr Gly
420 425 430
Asn Pro Thr Gly Ser Thr Thr Arg Asp Leu Lys Phe Ile Lys Asn Lys
435 440 445
Val Pro Asn Phe Ala His Tyr Gly Lys Asn Trp Leu Pro Gly Pro Phe
450 455 460
Ile Arg Gln Gln Gly Trp Thr Thr Gln Asn Ile Asn Asn Ser Val Val
465 470 475 480
Asn Phe Asn Asp Met Leu Gly Lys Asn Ser Thr Phe Thr Leu Asp Thr
485 490 495
Arg Trp Ser Ser Leu Ala Pro Gly Pro Cys Met Gly Asp Asp Gly Arg
500 505 510
Thr Pro Ser Thr Thr Lys Phe Ser Asn Ala Gln Leu Met Phe Gly Ser
515 520 525
Gly Thr Gln Pro Thr Glu Gly Gly Glu Asp Ala Val His Ile Thr Ser
530 535 540
Glu Ser Glu Val Lys Ala Thr Asn Pro Thr Ala Ile Asp Glu Tyr Gly
545 550 555 560
Arg Val Ala Asp Asn Thr Gln Asn Ala Thr Thr Ala Pro Thr Thr Val
565 570 575
Gly Asn Ala Ala Met Gly Ala Met Pro Gly Met Val Trp Gln Asp Arg
580 585 590
Asp Ile Tyr Leu Gln Gly Pro Ile Trp Gly Lys Ile Pro His Thr Asp
595 600 605
Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Tyr Arg Lys
610 615 620
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Gly Asn Pro
625 630 635 640
Ala Thr Thr Phe Ser Pro Asn Arg Ile Asn Asn Phe Ile Thr Gln Tyr
645 650 655
Ser Thr Gly Gln Val Thr Val Thr Ile Asp Trp Glu Leu Gln Lys Glu
660 665 670
Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Phe Gly
675 680 685
Thr Val Asp Ser Leu Asn Trp Ala Pro Asp Asn Ala Gly Asn Tyr Lys
690 695 700
Glu Pro Arg Val Val Gly Ser Arg Phe Leu Thr His Ile Leu
705 710 715
<210> 72
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> KTag
<400> 72
Ala Thr His Ile Lys Phe Ser Lys Arg Asp
1 5 10
<210> 73
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> SpyTag002
<400> 73
Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys
1 5 10

Claims (16)

1.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAV VP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分、或远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAVVP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,
其中
I.所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,和/或
II.所述ITR序列或其一部分包括与第二AAV的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV或所述远程AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
2.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAV VP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAVVP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,并且
其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)嵌合氨基酸序列;以及
(e)(a)、(b)、(c)和(d)的任何组合,
其中整个ITR序列或所述ITR序列的一部分包括与所述非灵长类动物AAV的ITR具有显著序列同一性,例如至少95%同一性的核酸序列,任选地其中所述ITR序列包括嵌合核酸序列,并且其中所述嵌合核酸序列的与所述非灵长类动物AAV的ITR具有显著序列同一性,例如至少95%同一性的一部分可操作地连接到所述嵌合核酸序列的与第二AAV的ITR具有显著序列同一性,例如至少95%同一性的一部分,其中所述第二AAV与所述非灵长类动物AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
3.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAV VP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中以下中的至少一种包括与非灵长类动物AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列:所述AAV VP1衣壳蛋白、所述AAVVP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分,任选地其中所述AAV VP1、VP2和VP3衣壳蛋白中的至少一种衣壳蛋白包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员,其中所述蛋白质:蛋白质结合对指导所述AAV病毒颗粒的趋向性;
(b)可检测标记;
(c)点突变,优选地其中所述点突变降低所述AAV病毒颗粒的自然趋向性和/或产生可检测标记;以及
(d)(a)-(c)的任何组合,
其中所述ITR序列或其一部分包括与第二AAV的ITR序列具有显著序列同一性,例如至少95%同一性的核酸序列,其中所述第二AAV与所述非灵长类动物AAV不同,并且
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主。
4.一种重组AAV病毒颗粒,其包括:(i)AAV衣壳,所述AAV衣壳包括AAV VP1、VP2和VP3衣壳蛋白;以及(ii)包装在所述AAV衣壳内的核酸序列,所述核酸序列包括AAV反向末端重复序列(ITR)序列,
其中所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳蛋白的任何部分中的至少一种包括嵌合氨基酸序列,所述嵌合氨基酸序列包括可操作地连接的以下:(A)与非灵长类动物AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列;(B)与第二AAV衣壳蛋白或其一部分的氨基酸序列具有显著序列同一性,例如至少95%同一性的氨基酸序列,
其中所述第二AAV与所述非灵长类动物AAV不同,
其中所述重组AAV病毒颗粒能够感染哺乳动物宿主,优选地灵长类动物宿主,并且任选地
其中包括嵌合氨基酸序列的所述AAV VP1衣壳蛋白、所述AAV VP1衣壳蛋白的任何部分、所述AAV VP2衣壳蛋白、所述AAV VP2衣壳蛋白的任何部分、所述AAV VP3衣壳蛋白和所述AAV VP3衣壳的任何部分中的所述至少一种进一步包括选自由以下组成的组的修饰:
(a)蛋白质:蛋白质结合对的第一成员;
(b)可检测标记;以及
(c)(a)和(b)的组合。
5.一种腺相关病毒(AAV)衣壳蛋白,其包括氨基酸序列,其中所述氨基酸序列或其一部分与非灵长类动物AAV或其一部分或远程AAV或其一部分的衣壳蛋白的氨基酸序列具有显著序列同一性,例如至少95%同一性,
其中所述AAV衣壳蛋白选自由以下组成的组:
(a)嵌合AAV VP1衣壳蛋白,任选地其中所述嵌合AAV VP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(b)所述非灵长类动物AAV或所述远程AAV的非嵌合AAV VP1衣壳蛋白,所述非嵌合AAVVP1衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(c)嵌合VP2衣壳蛋白,任选地其中所述嵌合AAV VP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(d)所述非灵长类动物AAV或所述远程AAV的非嵌合AAV VP2衣壳蛋白,所述非嵌合AAVVP2衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;
(e)嵌合AAV VP3衣壳蛋白,所述嵌合AAV VP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记;以及
(f)所述非人AAV或远程AAV的非嵌合AAV VP3衣壳蛋白,所述非嵌合AAV VP3衣壳蛋白被修饰以至少包括蛋白质:蛋白质结合对的第一成员、可检测标记和/或点突变,所述点突变降低AAV病毒颗粒的自然趋向性和/或产生可检测标记。
6.一种AAV颗粒,其包括根据权利要求5所述的AAV衣壳蛋白。
7.一种核酸分子,其包括对根据权利要求5所述的AAV衣壳蛋白进行编码的cap基因。
8.一种核酸分子,其包括对AAV VP1衣壳蛋白、AAV VP2衣壳蛋白和/或AAV VP3衣壳蛋白进行编码的AAV cap基因,
其中所述AAV cap基因或其一部分包括与非灵长类动物AAV或其一部分、或远程AAV或其一部分的cap基因的核酸序列具有显著序列同一性,例如至少95%同一性的核酸序列,并且
其中所述AAV cap基因被进一步修饰以包括:
(a)对蛋白质:蛋白质结合对的第一成员进行编码的核苷酸序列;
(b)对可检测标记进行编码的核苷酸序列;
(c)点突变;
(d)嵌合核苷酸序列;或者
(e)(a)、(b)、(c)和(d)的任何组合。
9.一种核酸分子,其包括AAV rep基因和AAV cap基因,
其中整个AAV cap基因包括与非灵长类动物AAV或远程AAV的cap基因的核酸序列具有显著序列同一性,例如至少95%同一性的第一核酸序列,并且
其中所述AAV rep基因或其一部分包括与第二AAV或其一部分的rep基因的核酸序列具有显著序列同一性,例如至少95%同一性的第二核酸序列,并且
其中所述非灵长类动物AAV与所述第二AAV不相同。
10.一种AAV衣壳蛋白,其包括由根据权利要求7到9中任一项所述的核酸分子编码的氨基酸序列。
11.一种AAV颗粒,其包括根据权利要求10所述的衣壳蛋白。
12.一种用于产生AAV颗粒的包装细胞,所述包装细胞包括根据权利要求7到9中任一项所述的核酸分子。
13.一种产生病毒颗粒的方法,所述方法包括在足以产生病毒颗粒的条件下培养根据权利要求12所述的包装细胞。
14.一种根据权利要求13所述的方法制备的AAV颗粒。
15.一种药物组合物,其包括:(a)根据权利要求1到4、6、11和14中任一项所述的AAV颗粒,AAV颗粒包括根据权利要求5或10所述的AAV衣壳蛋白或根据权利要求13所述的方法制备的AAV颗粒;以及(b)药学上可接受的载体或赋形剂。
16.一种将所关注核苷酸递送到靶细胞的方法,所述方法包括使所述靶细胞与以下接触:(a)根据权利要求1到4、6、11和14中任一项所述的AAV颗粒,所述AAV颗粒包括根据权利要求5或10所述的AAV衣壳蛋白或根据权利要求13所述的方法制备的AAV颗粒;或者(b)根据权利要求15所述的组合物。
CN202210622571.3A 2019-05-24 2020-05-22 经修饰的病毒颗粒和其用途 Pending CN114989267A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962852791P 2019-05-24 2019-05-24
US62/852,791 2019-05-24
CN202080038612.3A CN113874386A (zh) 2019-05-24 2020-05-22 经修饰的病毒颗粒和其用途
PCT/US2020/034328 WO2020242984A1 (en) 2019-05-24 2020-05-22 Modified viral particles and uses thereof

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202080038612.3A Division CN113874386A (zh) 2019-05-24 2020-05-22 经修饰的病毒颗粒和其用途

Publications (1)

Publication Number Publication Date
CN114989267A true CN114989267A (zh) 2022-09-02

Family

ID=71094822

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202080038612.3A Pending CN113874386A (zh) 2019-05-24 2020-05-22 经修饰的病毒颗粒和其用途
CN202210622571.3A Pending CN114989267A (zh) 2019-05-24 2020-05-22 经修饰的病毒颗粒和其用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202080038612.3A Pending CN113874386A (zh) 2019-05-24 2020-05-22 经修饰的病毒颗粒和其用途

Country Status (18)

Country Link
US (1) US20220241430A1 (zh)
EP (1) EP3976631A1 (zh)
JP (1) JP2022533438A (zh)
KR (1) KR20220011664A (zh)
CN (2) CN113874386A (zh)
AR (2) AR118997A1 (zh)
AU (1) AU2020283537A1 (zh)
BR (1) BR112021023692A2 (zh)
CA (1) CA3140386A1 (zh)
CL (2) CL2021003096A1 (zh)
CO (1) CO2021017692A2 (zh)
IL (1) IL288233A (zh)
MA (1) MA56035A (zh)
MX (1) MX2021014338A (zh)
PE (1) PE20212357A1 (zh)
SG (1) SG11202112917PA (zh)
TW (1) TW202110869A (zh)
WO (1) WO2020242984A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3976631A1 (en) * 2019-05-24 2022-04-06 Regeneron Pharmaceuticals, Inc. Modified viral particles and uses thereof
WO2022187377A1 (en) * 2021-03-02 2022-09-09 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Adeno-associated viruses and methods and materials for making and using adeno-associated viruses
EP4314021A1 (en) * 2021-04-30 2024-02-07 Duke University Compositions comprising adeno-associated virus chimera capsid proteins and methods of using the same
CN117957325A (zh) * 2021-06-23 2024-04-30 迪诺治疗公司 衣壳变体及其使用方法
WO2023220603A1 (en) 2022-05-09 2023-11-16 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2023240124A1 (en) 2022-06-07 2023-12-14 Regeneron Pharmaceuticals, Inc. Pseudotyped viral particles for targeting tcr-expressing cells

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105671005A (zh) * 2001-11-13 2016-06-15 宾夕法尼亚大学托管会 检测和/或鉴定腺伴随病毒(aav)序列以及分离所鉴定的新型序列的方法
CN106459984A (zh) * 2014-03-10 2017-02-22 优尼科Ip有限公司 昆虫细胞中产生的进一步改善的aav载体
US20170130245A1 (en) * 2014-06-09 2017-05-11 Voyager Therapeutics, Inc. Chimeric capsids
WO2019006046A2 (en) * 2017-06-27 2019-01-03 Regeneron Pharmaceuticals, Inc. RECOMBINANT VIRAL PARTICLES WITH MODIFIED TROPISM AND USES THEREOF FOR TARGETED INTRODUCTION OF GENETIC MATERIAL INTO HUMAN CELLS
CN113874386A (zh) * 2019-05-24 2021-12-31 瑞泽恩制药公司 经修饰的病毒颗粒和其用途

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0840797B1 (en) 1995-07-25 2014-09-03 Crucell Holland B.V. Methods and means for targeted gene delivery
AU4645697A (en) 1996-09-11 1998-04-02 Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The Aav4 vector and uses thereof
US6156303A (en) 1997-06-11 2000-12-05 University Of Washington Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom
JP4060531B2 (ja) 1998-05-28 2008-03-12 アメリカ合衆国 Aav5ベクターおよびその使用
JP4573437B2 (ja) 1998-11-05 2010-11-04 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア アデノ随伴ウイルス血清型1核酸配列、ベクターおよび同一物を含有する宿主細胞
US20100203083A1 (en) 2007-05-31 2010-08-12 Medigene Ag Mutated structural protein of a parvovirus
LT2954779T (lt) 2009-12-10 2019-05-27 Regeneron Pharmaceuticals, Inc. Pelės, gaminančios sunkiosios grandinės antikūnus
GB201002362D0 (en) 2010-02-11 2010-03-31 Isis Innovation Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds
KR20210088756A (ko) 2014-03-21 2021-07-14 리제너론 파마슈티칼스 인코포레이티드 단일 도메인 결합 단백질을 생산하는 비-인간 동물
JP7372154B2 (ja) 2017-06-27 2023-10-31 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 遺伝物質をヒト細胞に標的化して導入するための指向性改変組換えウイルスベクターおよびその使用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105671005A (zh) * 2001-11-13 2016-06-15 宾夕法尼亚大学托管会 检测和/或鉴定腺伴随病毒(aav)序列以及分离所鉴定的新型序列的方法
CN106459984A (zh) * 2014-03-10 2017-02-22 优尼科Ip有限公司 昆虫细胞中产生的进一步改善的aav载体
US20170130245A1 (en) * 2014-06-09 2017-05-11 Voyager Therapeutics, Inc. Chimeric capsids
WO2019006046A2 (en) * 2017-06-27 2019-01-03 Regeneron Pharmaceuticals, Inc. RECOMBINANT VIRAL PARTICLES WITH MODIFIED TROPISM AND USES THEREOF FOR TARGETED INTRODUCTION OF GENETIC MATERIAL INTO HUMAN CELLS
CN113874386A (zh) * 2019-05-24 2021-12-31 瑞泽恩制药公司 经修饰的病毒颗粒和其用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IOANNIS BOSSIS 等: "Cloning of an avian adeno-associated virus (AAAV) and generation of recombinant AAAV particles", JOURNAL OF VIROLOGY, 31 July 2003 (2003-07-31), pages 6799 - 6810 *
SCHMIDT MICHAEL等: "Cloning and characterization of a bovine adeno-associated virus", JOURNAL OF VIROLOGY, 1 June 2004 (2004-06-01), pages 6509 - 6516, XP002335522, DOI: 10.1128/JVI.78.12.6509-6516.2004 *

Also Published As

Publication number Publication date
KR20220011664A (ko) 2022-01-28
BR112021023692A2 (pt) 2022-01-04
CL2021003096A1 (es) 2022-09-20
AR124119A2 (es) 2023-02-15
TW202110869A (zh) 2021-03-16
US20220241430A1 (en) 2022-08-04
CL2023000629A1 (es) 2023-10-20
MX2021014338A (es) 2022-01-06
WO2020242984A1 (en) 2020-12-03
AU2020283537A1 (en) 2021-12-16
WO2020242984A9 (en) 2021-01-14
MA56035A (fr) 2022-04-06
JP2022533438A (ja) 2022-07-22
AR118997A1 (es) 2021-11-17
SG11202112917PA (en) 2021-12-30
PE20212357A1 (es) 2021-12-17
IL288233A (en) 2022-01-01
CO2021017692A2 (es) 2022-01-17
CN113874386A (zh) 2021-12-31
CA3140386A1 (en) 2020-12-03
EP3976631A1 (en) 2022-04-06

Similar Documents

Publication Publication Date Title
CN114989267A (zh) 经修饰的病毒颗粒和其用途
CN110997699A (zh) 向性修饰的重组病毒粒子和其用于将遗传物质靶向引入至人类细胞中的用途
KR20220012231A (ko) 완전-인간 번역 후 변형된 항체 치료제
AU2022203494A1 (en) Adeno-Associated Virus Variant Capsids And Use For Inhibiting Angiogenesis
AU2018290882B2 (en) Tropism-modified recombinant viral vectors and uses thereof for the targeted introduction of genetic material into human cells
KR20140019385A (ko) 이중특이성 및 단일특이성, 비대칭성 항체 및 이의 제조방법
JP7410522B2 (ja) 抗fam19a5抗体のアデノ関連ウイルス(aav)伝達
JP6731933B2 (ja) Pcsk9抗体、及び医薬組成物とその使用
KR102017217B1 (ko) 중동호흡기증후군 코로나바이러스에 대한 항체 및 이를 이용한 항체역가 측정방법
KR20230093437A (ko) 안구 적응증을 위한 벡터화된 항-TNF-α 항체
US20110150861A1 (en) Sorf constructs and multiple gene expression
WO2022156653A1 (en) Expression vector for anti-sars-cov-2 neutralizing antibodies
US20230399385A1 (en) Neutralizing antibodies against sars-cov-2
KR20230154074A (ko) 이중 바이러스 벡터 시스템을 이용한 항체 전달
RU2811426C2 (ru) Рекомбинантные вирусные частицы с модифицированным тропизмом и пути их применения для нацеленного введения генетического материала в клетки человека
CA3233698A1 (en) Viral particles retargeted to skeletal muscle
CN115772544B (zh) 抗vegf-a和ang-2的aav载体
WO2024026494A1 (en) Viral particles retargeted to transferrin receptor 1
WO2020243659A1 (en) Vector-based therapy for thyroid disease
CN116925234A (zh) 一种编码抗vegf-a和ang-2双特异性抗体的aav载体
CN114790239A (zh) 一种抗冠状病毒n蛋白的抗体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination