CN116419974A - 重组aav的制备方法 - Google Patents

重组aav的制备方法 Download PDF

Info

Publication number
CN116419974A
CN116419974A CN202180067893.XA CN202180067893A CN116419974A CN 116419974 A CN116419974 A CN 116419974A CN 202180067893 A CN202180067893 A CN 202180067893A CN 116419974 A CN116419974 A CN 116419974A
Authority
CN
China
Prior art keywords
gly
pro
ala
asn
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180067893.XA
Other languages
English (en)
Inventor
R·卡伍德
伟恒·苏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford University Innovation Ltd
Oxford Genetics Ltd
Original Assignee
Oxford University Innovation Ltd
Oxford Genetics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford University Innovation Ltd, Oxford Genetics Ltd filed Critical Oxford University Innovation Ltd
Publication of CN116419974A publication Critical patent/CN116419974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10041Use of virus, viral particle or viral elements as a vector
    • C12N2710/10044Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10344Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • C12N2830/005Vector systems having a special element relevant for transcription controllable enhancer/promoter combination repressible enhancer/promoter combination, e.g. KRAB
    • C12N2830/006Vector systems having a special element relevant for transcription controllable enhancer/promoter combination repressible enhancer/promoter combination, e.g. KRAB tet repressible

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及一种生产重组腺相关病毒(AAV)颗粒的方法,本文称为反式假型化。该方法包括在第一宿主细胞和第二宿主细胞中生产重组AAV颗粒,其中,第一AAV cap基因和第二AAV cap基因分别在第一宿主细胞和第二宿主细胞中表达,从而生产被第一AAV衣壳多肽包裹的第一重组AAV颗粒和被第二AAV衣壳多肽包裹的第二重组AAV颗粒。第一重组AAV颗粒和第二重组AAV颗粒具有不同的细胞趋向性,优选地分别针对生产细胞系(用于AAV的高效生产)和与治疗适应症相关的细胞(用于治疗此类适应症)。

Description

重组AAV的制备方法
技术领域
本发明涉及一种生产重组腺相关病毒(AAV)颗粒的方法,本文称为反式假型化(trans-pseudotyping)。所述方法包括在第一宿主细胞和第二宿主细胞中生产重组AAV颗粒,其中,第一AAV cap基因和第二AAV cap基因分别在第一宿主细胞和第二宿主细胞中表达,从而产生被第一AAV衣壳多肽包裹的第一重组AAV颗粒和被第二AAV衣壳多肽包裹的第二重组AAV颗粒。所述第一重组AAV颗粒和所述第二重组AAV颗粒具有不同的细胞趋向性,优选地分别针对生产细胞系(用于AAV的高效生产)和与治疗适应症相关的细胞(用于治疗此类适应症)。
背景技术
腺相关病毒(AAV)是属于细小病毒科的单链DNA病毒。其是一种非致病性病毒,在大多数患者中只产生有限的免疫反应。该病毒的细胞和组织趋向性由AAV颗粒表面的衣壳决定。一些衣壳能感染多种宿主细胞,包括分裂细胞和非分裂细胞,而其他衣壳则受到相当多的限制。一些衣壳不感染标准的生产或制造细胞系,如HEK293细胞。
在过去的几年中,来源于AAV的载体已经成为一种非常有用且有前景的基因递送方式。这是由于这些载体的以下特性:
-AAV是小型、无包膜病毒,其只有两个内源基因(rep和cap)。因此可以很容易地对其进行改进以开发用于不同基因疗法的载体。这是通过去除AAV基因组中的rep和cap基因并将这些序列替换成可以为患者提供治疗益处的外源序列(转基因)而实现。
-AAV颗粒不易被剪切力、酶或溶剂降解。这有助于这些病毒载体的简单纯化和最终配制。
-AAV是非致病性的且具有低免疫原性。使用这些载体进一步降低了不良炎症反应的风险。与其他病毒载体(如慢病毒、疱疹病毒和腺病毒)不同,AAV被认为是无害的,并且不会引起任何人类疾病。
-使用AAV载体可将高达约4500bp的基因序列递送到患者体内。
-虽然已证明野生型AAV载体有时会将遗传物质插入到人类19号染色体中,但大多数AAV基因治疗载体通常通过去除病毒基因组中的rep和cap基因来消除该特性。在这种情况下,病毒在宿主细胞内保持游离形式。这些游离体在非分裂细胞中保持完整,而在分裂细胞中的细胞分裂过程中丢失。
天然AAV基因组包含两个基因,每个基因编码多个开放阅读框(ORF):rep基因编码AAV生命周期和病毒基因组位点特异性整合所需的非结构蛋白;cap基因编码结构衣壳蛋白。此外,这两个基因的两侧是由145个碱基组成的反向末端重复序列(ITR),该反向末端重复序列具有形成发夹结构的能力。这些发夹序列是第二DNA链的引物酶非依赖性合成以及病毒DNA整合到宿主细胞基因组中所必需的。
为了消除病毒的整合能力,重组AAV载体从病毒基因组的DNA中去除rep和cap。为了生产此类载体,将所需的转基因和启动转基因转录的启动子一起插入到反向末端重复序列(ITR)之间;并且rep和cap基因是由编码rep和/或cap基因的第二质粒或辅助病毒以反式形式提供。辅助基因(如腺病毒E4、E2a和VA基因)也由质粒或辅助病毒提供。rep、cap和辅助基因可以由转染到细胞中的额外质粒或通过辅助病毒提供。
通常,AAV载体的生产通过多种不同的途径实现。
最初,AAV是使用野生型(WT)腺病毒血清型5、同时用编码rep和cap基因以及AAV基因组的质粒转染细胞生成的。这使WT腺病毒提供许多促进病毒复制的反式因子。然而,该方法也有很多局限性:例如,为了提供纯产物并确保所有的Ad5已被去除,每批AAV在制造后必须与腺病毒(AV)颗粒分离是具有挑战性的。此外,在生产过程中细胞将大量资源用于生产腺病毒颗粒而非AAV的事实也是不被期望的。
在其他系统中,表达rep和cap基因的稳定包装细胞系已经被使用。在这类系统中,rep和cap基因被整合到细胞基因组中,因此,不需要基于质粒的rep和cap基因。然而,由于其固有的毒性,这些基因通常仅以低频率整合(例如,每个细胞1-2个拷贝)。这些系统需要腺病毒载体的感染。
最近,在AAV载体的制备中,编码AAV生产所需的腺病毒基因组部分的质粒已经取代了基于腺病毒的系统。虽然这解决了在最终的病毒产品中存在腺病毒颗粒的困扰,但仍存在一些问题。这些问题包括需要预先制备足够的质粒以转染到生产细胞系中,以及转染过程本身存在的低效性。
在当前所有生产AAV的方法中,每次要制备更多的AAV时,都需要通过质粒转染、细胞系整合或辅助病毒以反式方式提供AAV基因组。
本发明人现已发现,通过将表达rep和cap基因的腺病毒和已经通过上述任一方法生产的感染性AAV颗粒共同感染细胞,可以制备含有AAV基因组的AAV颗粒。
然而,在AAV颗粒表面使用的一些AAV衣壳对靶治疗组织(例如视网膜神经元或肝细胞)具有选择性,因此,这种连续生长AAV的新方法仅在所生产的AAV能够感染生产细胞系(例如HEK293细胞)时有效。在很多情况下,该感染是不可能的或仅在低效率下发生(例如,对于HEK293细胞中的AAV6和AAV9)。
发明内容
本发明人在本文描述了一种通过新命名的反式假型化过程来解决上述问题的方法。
根据cap基因编码的衣壳多肽,每个AAV颗粒对一系列细胞具有趋向性。一些cap基因能够高效感染生产细胞系(例如HEK293细胞中的AAV2衣壳);而其他衣壳则不能高效感染生产细胞系(例如HEK293细胞中的AAV9衣壳)。如上文所述,发明人开发了一种生产AAV的新方法,该方法通过使用AAV感染生产细胞系,并且以反式方式提供cap基因。因此,AAV最初通过提供cap基因来连续生长AAV,该基因使“种子储用物(seed stock)”AAV颗粒具有感染生产细胞系的能力(例如用于HEK293细胞的AAV2)。一旦产生了足够的种子储用物AAV材料,将其包裹在感染生产细胞系的衣壳中,并在最终的生产步骤中以反式形式提供不同的衣壳,以生产具有所需新趋向性的AAV。携带该可选择的第二cap基因生产的AAV颗粒可以不感染生产细胞系,并且可以用于感染与治疗适应症相关的细胞。AAV颗粒表面上的衣壳可以赋予其在感染靶细胞或组织时的选择性或高度特异性,但可以不为生产细胞系提供任何或降低的感染性。这个过程在本文中被称为反式假型化。
因此,本发明的一个目的是提供一种生产重组AAV颗粒的方法,其中,在第一宿主细胞中生产第一重组AAV颗粒,所述第一重组AAV颗粒具有对第二宿主细胞(例如生产细胞系)的趋向性;然后在生产具有感染所需治疗靶组织或器官细胞的趋向性的第二重组AAV颗粒的条件下培养所述第二宿主细胞。
在一个实施方案中,本发明提供了一种生产重组腺相关病毒(AAV)颗粒的方法,所述方法包括以下步骤:
(a)培养第一宿主细胞群,每个第一宿主细胞包含:
(i)编码重组AAV基因组的核酸分子;
(ii)编码第一AAV cap基因的核酸分子,所述第一AAV cap基因编码第一AAV衣壳多肽,其中所述第一AAV衣壳多肽赋予包含所述多肽的AAV颗粒对第二宿主细胞的趋向性;
(iii)编码AAV rep基因的核酸分子;
(iv)编码辅助病毒基因的核酸分子;
所述培养是在使(i)-(iv)中的每一个在所述第一宿主细胞中的表达足以在所述第一宿主细胞中生产包含AAV基因组的第一重组AAV颗粒的条件下进行,其中所述第一重组AAV颗粒被第一AAV衣壳多肽包裹;
(b)用步骤(a)生产的所述第一重组AAV颗粒感染第二宿主细胞群;
(c)在所述第二宿主细胞群中表达:
(i)编码第二AAV cap基因的核酸分子,所述第二AAV cap基因编码第二AAV衣壳多肽,其中所述第二AAV衣壳多肽赋予包含所述多肽的AAV颗粒对第三宿主细胞的趋向性;
(ii)编码AAV rep基因的核酸分子;
(iii)编码辅助病毒基因的核酸分子;
其中所有(i)-(iii)独立地存在于所述第二宿主细胞中或随后被引入所述第二宿主细胞中,
使得(i)-(iii)中的每一个在所述第二宿主细胞中的表达足以在所述第二宿主细胞中生产包含所述重组AAV基因组的第二重组AAV颗粒,其中所述第二重组AAV颗粒被所述第二AAV衣壳多肽包裹;
(d)在使包含所述重组AAV基因组的第二重组AAV颗粒产生的条件下,在培养基中培养所述第二宿主细胞,每个所述第二重组AAV颗粒被包含所述第二衣壳多肽的衣壳包裹;
并且可选地,
(e)从所述第二宿主细胞或所述培养基中纯化和/或分离第二重组AAV颗粒。
具体序列
以下序列在构成本专利申请的说明书的一部分的序列表中给出。
Figure BDA0004158622470000031
Figure BDA0004158622470000041
Figure BDA0004158622470000051
腺相关病毒(AAV)是一种小型(约20nm)、复制缺陷性的无包膜病毒。在一些实施方案中,AAV是腺相关依赖细小病毒A。在其他实施方案中,AAV是腺相关依赖细小病毒B。
AAV颗粒由包裹ssDNA AAV基因组的衣壳蛋白形成。野生型AAV基因组包含两个基因,每个基因编码多个开放阅读框(ORF):rep基因编码AAV生命周期和病毒基因组位点特异性整合所需的非结构蛋白;cap基因编码结构衣壳蛋白。如本文所用,术语“重组AAV颗粒”是指包含重组AAV基因组的AAV颗粒。
如本文所用,术语“重组AAV基因组”是指包含侧接于间隔序列的AAV反向末端重复序列(ITR)的AAV基因组,优选地,其中所述间隔序列大于100bp。所述间隔序列不包含AAVrep或cap基因。优选地,所述间隔序列包含转基因。
优选地,术语“重组AAV基因组”是指包含侧接AAV反向末端重复序列(ITR)的转基因(代替rep和cap基因)的AAV基因组。
如本文所用,术语“AAV基因组”、“AAV转移载体”和“转移质粒”在本文中可交换使用。它们都是指包含侧接间隔序列的5’端和3’端的病毒(优选AAV)反向末端重复序列(ITR)的载体。
所述转基因可以是编码序列或非编码序列。其可以为基因组DNA或cDNA。优选地,所述转基因编码多肽或其片段。
优选地,所述转基因与一个或多个转录和/或翻译控制元件(例如增强子、启动子、终止子序列等)可操作地关联。
在一些实施方案中,所述转基因编码治疗多肽或其片段。优选的治疗多肽的实例包括抗体、CAR-T分子、scFV、BiTE、DARPins和T细胞受体。在一些实施方案中,所述治疗多肽是G蛋白偶联受体(GPCR),例如DRD1。在一些实施方案中,所述治疗多肽是免疫治疗靶点,例如CD19、CD40或CD38。在一些实施方案中,所述治疗多肽是涉及人类视觉或视网膜功能的基因的功能拷贝,例如RPE65或REP。在一些实施方案中,所述治疗多肽是涉及人体血液生产或血液组分的基因的功能拷贝,例如因子IX,或涉及在β和α地中海贫血或镰状细胞贫血的基因的功能拷贝。在一些实施方案中,所述治疗多肽是涉及免疫功能(如严重联合免疫缺陷病(SCID)或腺苷脱氨酶缺乏症(ADA-SCID))的基因的功能拷贝。在一些实施方案中,所述治疗多肽是增加/减少细胞增殖的蛋白质,例如生长因子受体。在一些实施方案中,所述治疗多肽是离子通道多肽。
在一些优选实施方案中,所述治疗多肽是免疫检查点分子。优选地,所述免疫检查点分子是肿瘤坏死因子(TNF)受体超家族的成员(例如CD27、CD40、OX40、GITR或CD137)或B7-CD28超家族的成员(例如CD28、CTLA4或ICOS)。优选地,所述免疫检查点分子是PD1、PDL1、CTLA4、Lag1或GITR。在一些优选实施方案中,所述转基因编码CRISPR酶(例如Cas9、dCas9、Cpf1或其变体或衍生物)或CRISPR sgRNA。
步骤(a)包括培养第一宿主细胞群,每个第一宿主细胞包含(i)编码重组AAV基因组的核酸分子。
本文所指的所述核酸分子可以是DNA或RNA,优选DNA。
在一个实施方案中,所述核酸分子可以是载体或质粒的形式,其包含编码重组AAV基因组的核酸分子。
在另一个实施方案中,所述核酸分子可以是重组AAV颗粒的形式,其包含编码重组AAV基因组的核酸分子。
在该实施方案中,所述重组AAV颗粒被AAV衣壳多肽包裹,所述AAV衣壳多肽使该重组AAV颗粒具有对所述第一宿主细胞的趋向性。
所述重组AAV颗粒可以通过适当的方法制备。生产重组AAV颗粒的一般方法是本领域众所周知的。
在另一个实施方案中,所述核酸分子可以是重组腺病毒(AV)颗粒的形式,其包含编码重组AAV基因组的核酸分子(例如在WO2019/020922和本文中进一步描述的)。
在另一个实施方案中,编码所述重组AAV基因组的所述核酸分子可以稳定地整合至所述第一宿主细胞的基因组中。
在本发明的一些实施方案中,在步骤(a)之前,还包括将编码重组AAV基因组的核酸分子引入至所述第一宿主细胞中的步骤。所述编码重组AAV基因组的核酸分子可以是上述的任一形式。
如本文所用,术语“引入(introducing)”包括转化和任何形式的电穿孔、缀合、感染、转导或转染等。术语“被引入(introduced)”的解释类似,并进行适当变更。
所述第一重组AAV颗粒包含第一AAV衣壳多肽,其赋予对第二宿主细胞的趋向性。第二重组AAV颗粒包含第二AAV衣壳多肽,其赋予对第三宿主细胞的趋向性。
AAV衣壳多肽由AAV cap基因编码。如本文所用,术语“cap基因”是指编码一个或多个开放阅读框(ORF)的基因,其中每个所述ORF编码一个AAV Cap结构蛋白或其变体或衍生物。这些AAV Cap结构蛋白(或其变体或衍生物)形成AAV衣壳。
三种Cap蛋白分别为VP1、VP2和VP3,其大小通常分别为87kDa、72kDa和62kDa。因此,AAV cap基因是能编码三种Cap蛋白VP1、VP2和VP3的基因。在野生型AAV中,这三种蛋白由p40启动子翻译形成单个mRNA。该mRNA合成后,切除长或短的内含子,从而形成2.3kb或2.6kb的mRNA。AAV衣壳由60个衣壳蛋白亚基(VP1、VP2和VP3)组成,亚基VP1、VP2和VP3以1:1:10的比例呈二十面体对称排列,大小约为3.9MDa。如本文所用,术语“cap基因”包括野生型cap基因及其衍生物,以及具有等效功能的人工cap基因。
AAV血清型1-9中的AAV cap基因序列和Cap多肽序列分别在本文的SEQ ID NO:1-18中给出。如本文所用,术语“cap基因”或Cap多肽编码序列优选包括但不限于:
(a)一种多核苷酸分子,其核苷酸序列包含或由SEQ ID NO:1、3、5、7、9、11、13、15或17中给出的任一个核苷酸序列(优选SEQ ID NO:17)组成;
(b)一种多核苷酸分子,其核苷酸序列包含或由SEQ ID NO:1、3、5、7、9、11、13、15或17中给出的任一个核苷酸序列(优选SEQ ID NO:17)的变体组成,所述变体与序列SEQ IDNO:1、3、5、7、9、11、13、15或17中的任一个(优选SEQ ID NO:17)具有至少40%、50%、60%、70%、80%、85%、90%、95%或99%(优选至少95%)的序列同一性;和
(c)一种多核苷酸分子,其核苷酸序列包含或由编码如下序列的核苷酸序列组成:
(i)一种多肽,其氨基酸序列为SEQ ID NO:2、4、6、8、10、12、14、16或18中给出的任一个(优选SEQ ID NO:18),或
(ii)(i)的变体,所述变体与SEQ ID NO:2、4、6、8、10、12、14、16或18中的任一个(优选SEQ ID NO:18)具有至少50%、60%、70%、80%、85%、90%、95%或99%(优选至少95%)的序列同一性。
优选地,所述变体是一种或多种VP1、VP2和VP3多肽或编码一种或多种VP1、VP2和VP3多肽。
所述第一重组AAV颗粒被衣壳包裹,所述衣壳包含第一AAV衣壳多肽,其赋予对所述第二宿主细胞以及任选地所述第一宿主细胞的趋向性。因此,所述第二宿主细胞是能够被由第一AAV衣壳多肽包裹的AAV颗粒感染的那些。
所述第二重组AAV颗粒被衣壳包裹,所述衣壳包含第二AAV衣壳多肽,其赋予对所述第三宿主细胞(靶细胞)的趋向性。因此,所述第三宿主细胞(靶细胞)是能够被由第二AAV衣壳多肽包裹的AAV颗粒感染的那些。
优选地,所述第二AAV衣壳多肽不赋予对第二宿主细胞的趋向性,即,所述第二重组AAV颗粒不能高效地感染所述第二宿主细胞。对此,术语“高效”可以被定义为每个细胞需要100个以上的病毒颗粒以获得可检测的转基因表达。
因此,所述第一AAV衣壳多肽和所述第二AAV衣壳多肽具有不同的氨基酸序列。优选地,所述第一AAV衣壳多肽和所述第二AAV衣壳多肽的氨基酸序列同一性小于99.5%,例如小于99%、小于98%、小于97%、小于96%、小于95%或小于90%;并且至少为50%。优选地,所述第一AAV衣壳多肽和所述第二AAV衣壳多肽的氨基酸序列的同一性在80%和95%之间。优选地,所述第一AAV衣壳多肽和所述第二AAV衣壳多肽的氨基酸序列至少存在1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸(例如1-5个、5-10个或10-20个氨基酸)的不同。
所述第一AAV cap基因不在所述第二宿主细胞中表达。所述第二AAV cap基因不在所述第一宿主细胞中表达。
AAV血清型由AAV宿主细胞的趋向性决定。血清型是一种病毒的不同变异。这些病毒根据其细胞表面(即衣壳)抗原分类在一起,使病毒的流行病学分类达到亚种水平。
AAV衣壳蛋白包含12个高变表面区域。天然存在的衣壳多肽的氨基酸序列彼此不同。变异的主要区域被认为是在衣壳基因的VP3区域内。然而,VP3区域与VP1和VP2编码序列共享。因此,更准确地说,Cap多肽的可变区更常见于cap基因的C末端的一半,因此,所有衣壳编码序列通常都有这种变异。因此,优选地,所述第一重组AAV颗粒和所述第二重组AAV颗粒具有不同的血清型。
目前,已知有11种不同的AAV血清型。所有已知的血清型都可以感染来自多种不同宿主细胞类型的细胞。所述第一重组AAV颗粒和所述第二重组AAV颗粒的血清型可以选自由血清型1、2、3、4、5、6、7、8、9、10和11,或这些血清型的修饰或突变形式组成的组。优选地,所述第一重组AAV颗粒和所述第二重组AAV颗粒的血清型选自由血清型1、2、5、6、7、8或9,或这些血清型的修饰或突变形式组成的组。
最优选地,所述第一重组AAV颗粒为血清型2(即AAV2)。最优选地,所述第二重组AAV颗粒为血清型9(即AAV9)。
甚至更优选地,所述第二重组AAV颗粒为血清型或血清型的修饰或突变衍生物,与对AAV1-9的趋向性相比,所述第二重组AAV颗粒具有对所述第三宿主细胞(靶细胞)增加的趋向性。
如本文所用,术语“rep基因”是指编码一个或多个开放阅读框(ORF)的基因,其中每个所述ORF编码一个AAV Rep非结构蛋白或其变体或衍生物。这些AAV Rep非结构蛋白(或其变体或衍生物)参与AAV基因组复制和/或AAV基因组包装。
野生型rep基因包含三个启动子:p5、p19和p40。
两种不同长度的重叠信使核糖核酸(mRNA)可以产生自p5和p19。这些mRNA的每个都含有一个内含子,该内含子既可以被剪接,也可以不被单个剪接供体位点和两个不同的剪接受体位点剪接。因此,可以形成六种不同的mRNA,其中只有四种是功能性的。没有去除内含子的两个mRNA(一个由p5转录,一个由p19转录)通读到一个共享的终止子序列,并分别编码Rep78和Rep52。内含子的去除和5’端剪接受体位点的使用不会导致任何功能性Rep蛋白的产生——由于序列其余部分的框架发生了移位,不能产生正确的Rep68或Rep40蛋白;而且因为其终止子被剪接,也不能产生Rep78或Rep52的正确C-末端。相反,内含子的去除和3'剪接受体的使用将包括Rep68和Rep40的正确C-末端,同时剪接Rep78和Rep52的终止子。因此,唯一的功能性剪接要么避免完全剪接内含子(产生Rep78和Rep52),要么使用3'剪接受体(以产生Rep68和Rep40)。因此,可以由这些启动子合成具有重叠序列的四种不同功能性Rep蛋白。
在野生型rep基因中,p40启动子位于3'端。Cap蛋白(VP1、VP2和VP3)的转录由野生型AAV基因组中的该启动子启动。
四种野生型Rep蛋白是Rep78、Rep68、Rep52和Rep40。因此野生型rep基因编码四种Rep蛋白Rep78、Rep68、Rep52和Rep40。
如本文所用,术语“rep基因”包括野生型rep基因及其衍生物;以及具有等效功能的人工rep基因。所述野生型rep基因编码Rep78、Rep68、Rep52和Rep40多肽。
野生型AAV(血清型2)rep基因的全长核苷酸序列在SEQ ID NO:19中给出。野生型AAV(血清型2)Rep78、Rep68、Rep52和Rep40核苷酸序列分别在SEQ ID NO:20、22、24和26中给出。野生型AAV(血清型2)Rep78、Rep68、Rep52和Rep40氨基酸序列分别在SEQ ID NO:21、23、25和27中给出。
如本文所用,术语“rep基因”或Rep多肽编码序列优选包括但不限于:
(a)一种多核苷酸分子,其核苷酸序列包含或由SEQ ID NO:19、20、22、24或26中给出的任一个核苷酸序列(优选SEQ ID NO:19)组成;和
(b)一种多核苷酸分子,其核苷酸序列包含或由SEQ ID NO:19、20、22、24或26中给出任一个核苷酸序列(优选SEQ ID NO:19)的变体组成,所述变体与SEQ ID NO:29、20、23、24或24中的任一个(优选SEQ ID NO:19)具有至少80%、85%、90%、95%或99%(优选至少95%)的序列同一性;和
(c)一种多核苷酸分子,其核苷酸序列包含或由编码如下序列的核苷酸序列组成:
(i)一种多肽,其氨基酸序列为SEQ ID NO:21、23、25或27中给出的任一个(优选SEQ ID NO:21),或
(ii)(i)的变体,所述变体与SEQ ID NO:21、23、25或27中的任一个(优选SEQ IDNO:21)具有至少80%、85%、90%、95%或99%(优选至少95%)的序列同一性。
优选地,所述变体是一种或多种Rep78、Rep68、Rep52和Rep40多肽或编码一种或多种Rep78、Rep68、Rep52和Rep40多肽。
rep和cap基因(以及其中的每个蛋白编码ORF)可以来自一种或多种不同的病毒(例如2种、3种或4种不同的病毒)。例如,rep基因可以来自AAV2,而cap基因可以来自AAV5。
本领域技术人员认识到,AAV的rep和cap基因因分化枝和分离株而异。来自所有此类分化枝和分离株的这些基因的序列及其衍生物均包含在本文中。
编码辅助病毒基因的核酸分子也在宿主细胞中表达。需要辅助基因来帮助AAV基因组的复制和感染性AAV颗粒的生产。合适的辅助病毒基因包括E1A、E1B、E4和VA RNA中的一种或多种或全部,以及可选地E2A基因。辅助基因是辅助病毒基因,优选地来自腺病毒、疱疹病毒或痘病毒。更优选地,所述辅助基因是腺病毒辅助基因。一些宿主细胞(例如HEK293细胞)具有稳定整合到其基因组中的E1A和E1B基因,因此没有必要将这些后者基因的进一步拷贝引入这些宿主细胞中。
为了生产包含重组AAV基因组的重组AAV颗粒,所述AAV基因组必须进入宿主细胞,并且Rep和Cap多肽必须在宿主细胞内产生或以反式形式提供。此外,还需要足够的辅助病毒基因(例如腺病毒E4、E1A、E1B和VA RNA,以及可选地E2A基因)。
如本文所用,术语“引入”包括转化和任何形式的电穿孔、缀合、感染、转导或转染等。术语“被引入”的解释类似,并进行适当变更。
编码AAV cap和rep基因以及辅助病毒基因的核酸分子可以独立地存在于第一宿主细胞和/或第二宿主细胞中,或者以如下形式的一种或多种独立地被引入到第一宿主细胞和/或者第二宿主细胞中:
(i)稳定地整合到宿主细胞的基因组中;
(ii)游离地存在于宿主细胞内;
(iii)存在于宿主细胞中的重组腺病毒中;
(iv)在重组腺病毒中被引入宿主细胞;或
(v)在载体或质粒中被引入宿主细胞。
所述第一宿主细胞和所述第二宿主细胞中编码AAV cap和rep基因以及辅助病毒基因的核酸分子的形式可以相同或不同。
在步骤(a)中,在将上述(iv)或(v)引入宿主细胞的实施方案中,该引入可以在引入编码重组AAV基因组的核酸之前或之后。
优选地,独立于所述第一宿主细胞和所述第二宿主细胞,编码AAV cap基因的核酸分子是载体或质粒或在重组腺病毒中的形式。
优选地,在引入编码重组AAV基因组的核酸或用重组AAV颗粒转染之前或之后,将载体、质粒或重组腺病毒引入宿主细胞。
最优选地,编码第一AAV cap基因的核酸分子以质粒或在AV重组基因组(例如在WO2019/020922以及本文中进一步描述)中的形式引入第一宿主细胞。
最优选地,编码第二AAV cap基因的核酸分子以在AV重组基因组(例如在WO2019/020922以及本文中进一步描述)中的形式引入第二宿主细胞。
优选地,编码AAV rep基因的核酸分子以质粒或在AV重组基因组(例如在WO2019/020922以及本文中进一步描述)中的形式引入第一宿主细胞。优选地,编码AAV rep基因的核酸分子在AV重组基因组(例如在WO2019/020922以及本文中进一步描述)中被引入第二宿主细胞。
优选地,编码辅助病毒基因的核酸分子是辅助腺病毒的形式。优选地,AV E1a和E1b基因被整合至宿主细胞基因组中(例如在HEK293细胞中)。
最优选地,步骤(a)的组分(i)-(iv)将同时递送。
如上所述,AAV rep基因和/或AAV cap基因可以在一种或多种重组腺病毒中被独立地引入(例如转染)宿主细胞,或存在于已经在所述宿主细胞中的一种或多种重组腺病毒中。
为了容纳AAV rep基因和/或AAV cap基因,一个或多个腺病毒基因的部分或全部可以缺失。这些可以包括整合至宿主细胞基因组中(例如HEK293细胞中)的辅助基因,如E1a和E1b。
例如,AAV rep基因和/或AAV cap基因可以插入到腺病毒早期基因之一中,或者插入到已从腺病毒缺失的早期基因位点中。在后续一个实例中,缺失的早期基因可以通过包含缺失基因的细胞系(例如含有腺病毒E1A和E1B区域的HEK293细胞)反式补充。
AAV rep基因和/或AAV cap基因可以插入到包含E1缺失的腺病毒基因组的区域中。在其他情况下,也可以缺失对腺病毒非必需的基因,并且可以使用这些位点插入本发明的核酸分子。例如,AAV rep基因和/或AAV cap基因可以插入到腺病毒的E3区,因为大多数E3基因可以在腺病毒载体中缺失。
AAV rep基因和/或AAV cap基因可以以正向或反向(相对于腺病毒基因的转录方向)插入到腺病毒基因中。在本发明的优选实施方案中,当AAV rep基因和/或AAV cap基因插入E1区时,其转录方向将与E4、E2A和E2B表达盒相同。这是为了防止E1A启动子(其经常保留在E1缺失的AV中)作为启动子来驱动rep基因表达。E1A启动子不能被移除,因为其包含AV包装信号。
在本发明的优选实施方案中,Rep编码序列不包含上游启动子。
在一些优选实施方案中,将AAV rep基因和/或AAV cap基因插入腺病毒E1基因中,优选地其中E1基因的部分缺失。优选地,E1基因是E1A和/或E1B。
rep和cap基因以及辅助病毒基因可以独立地与启动子(例如组成型启动子、诱导型启动子、抑制型启动子、最小启动子或无启动子)可操作地关联。如本文所用,在启动子和基因上下文的术语“可操作地关联”是指启动子和所讨论的基因位于彼此相距的距离内,该距离足以使启动子促进基因的转录。在一些实施方案中,启动子和基因并列或相邻。
优选地,与AAV cap基因可操作地关联的启动子为组成型或诱导型启动子,更优选地为组成型启动子,如最小CMV启动子。在一些实施方案中,第一AAV cap基因和/或第二AAVcap基因不与启动子可操作地关联或与最小启动子可操作地关联。
优选地,当在重组AV内编码与AAV cap基因可操作地关联的启动子时,将基于cap基因对腺病毒的毒性和所需的表达水平来选择所用的启动子。发明人已经发现,一些cap基因可以在CMV启动子下表达并且对AV复制几乎没有影响,例如AAV9。相反,如果由相对低表达的最小CMV启动子(例如AAV6)驱动,则一些cap基因只能插入AV中。因此,驱动cap基因的启动子优选地是基于实验测试低表达和高表达启动子,其中高表达启动子是CMV启动子,低表达启动子是来自同一启动子的最小启动子区域。
在一些实施方案中,Rep多肽以低、基线或最低水平表达。在一些实施方案中,AAVrep基因不与任何功能性启动子可操作地关联。如本文所用,术语“低、基线或最低水平”是指Rep78多肽的表达水平低于与野生型p5启动子(在野生型AAV rep基因中)可操作地关联的野生型Rep78多肽的表达水平的50%、40%、30%、20%或10%。这样,提供了足够的Rep多肽以便于能够产生至少一些AAV,但是Rep多肽的表达水平不足以完全抑制腺病毒的复制。
优选地,与辅助基因可操作地关联的启动子为组成型或诱导型启动子,更优选地为组成型启动子。
组成型启动子的实例包括CMV、SV40、PGK(人或小鼠)、HSV TK、SFFV、泛素、延伸因子α、CHEF-1、FerH、Grp78、RSV、腺病毒E1A、CAG或CMV-β球蛋白启动子,或其衍生启动子。
优选地,rep基因启动子为SV40启动子,或其衍生启动子,或者与人细胞和人细胞系(例如HEK-293细胞)中的SV40启动子相比强度相等或降低的启动子。
在一些实施方案中,启动子通过包含可诱导或可抑制调节(启动子)元件而是可诱导的或可抑制的。例如,启动子可以是由强力霉素、四环素、IPTG或乳糖诱导的启动子。
rep基因和cap基因也可以独立地与终止子(例如SV40多腺苷酸化信号)可操作地关联。
在本发明的实施方案中,其中编码重组AAV基因组的核酸分子为重组AAV颗粒的形式,所述重组AAV颗粒被赋予对第一宿主细胞的趋向性的AAV衣壳多肽包裹。第二宿主细胞是能够被由第一AAV衣壳多肽包裹的AAV颗粒感染的那些。第三宿主细胞(靶细胞)是能够被由第二AAV衣壳多肽包裹的AAV颗粒感染的那些。
步骤(a)的目的是生产大量用于步骤(b)的重组AAV颗粒。因此第一宿主细胞优选地是能够产生高滴度的第一重组AAV颗粒的那些。在一些实施方案中,第一宿主细胞来自AAV生产细胞系或AAV制造细胞系,即包含AAV衣壳产生和AAV成熟所需的所有多肽细胞系。第一宿主细胞可以包括一种或多种不同类型的细胞(例如HEK293和PerC6细胞的混合物)。优选地,第一宿主细胞均为相同类型。
第一宿主细胞优选为哺乳动物细胞。哺乳动物细胞的实例包括来自人类、小鼠、大鼠、仓鼠、猴、兔、驴、马、羊、牛和猿的器官或组织的那些。优选地,所述细胞是人类细胞。所述细胞为原代细胞或永生化细胞。
优选地,第一宿主细胞包括HEK-293、HEK 293T、HEK-293E、HEK-293FT、HEK-293S、HEK-293SG、HEK-293FTM、HEK-293SGGD、HEK-293A、MDCK、C127、A549、HeLa、CHO、小鼠骨髓瘤、PerC6、911和Vero细胞系。HEK-293细胞已被修饰以含有E1A和E1B蛋白,这避免了在辅助质粒上提供这些蛋白的需求。类似地,PerC6和911细胞包含类似的修饰,也可以被使用。最优选地,人类细胞为HEK293、HEK293T、HEK293A、PerC6、911或HeLaRC32。其他优选的细胞包括Hela、CHO和VERO细胞。最优选地,第一宿主细胞为HEK293、HEK293T、HEK293A、PerC6或911细胞。
步骤(a)的目的是生产大量用于步骤(b)的第一重组AAV颗粒。步骤(b)包括用步骤(a)生产的第一重组AAV颗粒感染第二宿主细胞群。
在该步骤中,所述重组AAV颗粒与所述第二宿主细胞群接触,以便所述第一重组AAV颗粒感染所述第二宿主细胞群。这些第二宿主细胞能够被所述第一重组AAV颗粒感染是因为包裹第一重组AAV颗粒的AAV衣壳赋予对第二宿主细胞的趋向性。
优选地,步骤(b)中的感染步骤是使用包含纯化的AAV颗粒的组合物来进行的,即其中所述组合物不包含任何第一宿主细胞,优选地其中所述组合物不包含任何细胞。
步骤(d)的目的是生产大量用于后续治疗用途的重组AAV颗粒。因此第二宿主细胞优选地是能够产生高滴度的第二重组AAV颗粒的那些。
第二宿主细胞可以为第一宿主细胞的任何类型,或其混合物。最优选地,第二宿主细胞为HEK293、HEK293T、HEK293A、PerC6或911细胞。
第一宿主细胞的类型可以与第二宿主细胞的类型相同或不同。
第一/第二宿主细胞和对这些宿主细胞具有趋向性的特定血清型的AAV颗粒的优选组合在下表中给出:
第一宿主细胞或第二宿主细胞 第一重组AAV颗粒的AAV血清型
HEK293或其衍生物 AAV1、AAV2、AAV3,、AAV6
PerC6或其衍生物 AAV2
911或其衍生物 AAV2
HeLa或其衍生物 AAV1、AAV2,、AAV3、AAV6
A549或其衍生物 AAV2
第一和/或第二宿主细胞可以为重组宿主细胞。
步骤(c)包括:
(c)在多个第二宿主细胞中表达:
(i)编码第二AAV cap基因的核酸分子,所述第二AAV cap基因编码第二AAV衣壳多肽,其中所述第二AAV cap衣壳多肽赋予包含所述多肽的AAV颗粒对第三宿主细胞的趋向性;
(ii)编码AAV rep基因的核酸分子;
(iii)编码辅助病毒基因的核酸分子;
其中(i)-(iii)均独立地存在于所述第二宿主细胞中,或随后被引入所述第二宿主细胞中,
使得(i)-(iii)中的每一个的表达足以在所述第二宿主细胞中生产包含重组AAV基因组的第二重组AAV颗粒,
其中所述第二重组AAV颗粒被所述第二AAV衣壳多肽包裹。
在步骤(c)中,第二(即不同的)AAV cap基因与AAV rep基因和辅助病毒基因一起表达(与步骤(a)相比),以促进AAV基因组的复制并产生被第二AAV衣壳多肽包裹的第二重组AAV颗粒,从而产生对第三宿主细胞具有趋向性的重组AAV颗粒。
第二AAV cap基因在第二宿主细胞中表达。第二AAV cap基因与第一AAV cap基因不同。第二AAV cap基因如上文所定义。第一AAV cap基因不在第二宿主细胞中表达。
编码AAV rep基因的核酸分子如上文所定义。步骤(a)和(c)中使用的编码AAV rep基因的核酸分子可以相同或不同。
编码辅助病毒基因的核酸分子如上文所定义。步骤(a)和(c)中使用的编码辅助病毒基因的核酸分子可以相同或不同。
步骤(d)包括,在使包含重组AAV基因组的第二重组AAV颗粒产生的条件下,在培养基中培养第二宿主细胞,每个所述第二重组AAV颗粒被包含第二衣壳多肽的衣壳包裹。培养用于生产AAV的宿主细胞的条件是本领域众所周知的。在培养步骤期间,将产生Rep多肽和第二Cap多肽,以及辅助病毒多肽。不会产生第一Cap多肽(因为第二宿主细胞不表达第一AAV cap基因)。重组AAV基因组将被复制并被第二Cap(衣壳)多肽包裹,从而产生第二重组AAV颗粒。
步骤(e)是可选的。其包括从第二宿主细胞或从培养基中纯化和/或分离第二重组AAV颗粒。从宿主细胞和培养基中纯化和/或分离重组AAV颗粒的方法是本领域众所周知的。
第二AAV衣壳多肽赋予第二重组AAV颗粒对第三宿主细胞(靶细胞)的趋向性。优选地,第三宿主细胞是不具有与高效生产/制造细胞系(例如HEK293、PerC6、911)相同AAV受体的细胞。优选地,第一AAV衣壳多肽不会赋予被此类多肽包裹的AAV颗粒对第三宿主细胞的有效趋向性。第二重组AAV颗粒对第三宿主细胞的趋向性强于对第一或第二宿主细胞的趋向性。优选地,第三宿主细胞与第一或第二宿主细胞的类型不同。
优选地,第三宿主细胞(靶细胞)包括但不限于神经元(优选视网膜神经元)、肝细胞、肌肉细胞、干细胞(例如造血干细胞、间充质干细胞、胚胎干细胞、脂肪干细胞和诱导性多能干细胞及其衍生物)、免疫细胞(包括B和T淋巴细胞、自然杀伤细胞、单核细胞和巨噬细胞以及粒细胞)、内皮细胞、心血管细胞、上皮细胞、间充质细胞、胰腺a细胞和胰腺b细胞、心肌细胞、脾细胞、脂肪细胞、胶质细胞、成纤维细胞、库普弗细胞和癌细胞(例如白血病、淋巴瘤、骨髓瘤、癌(carcinoma)、肉瘤、黑色素瘤细胞)。
在一些实施方案中,所述方法还包括步骤(f):使用本发明的第二重组AAV颗粒感染第三宿主细胞。所述第二重组AAV颗粒被第二衣壳多肽包裹,因此使第二重组AAV颗粒对第三宿主细胞具有趋向性。这促进了第二重组AAV颗粒对第三宿主细胞的感染。
优选地,所述方法步骤按照特定的顺序实施。
本发明还提供了通过本发明的方法获得的或可获得的第二重组AAV颗粒。
本发明还提供了一种假型化重组AAV颗粒改变其宿主细胞趋向性范围的方法,所述方法包括本发明的步骤(a)-(d),以及可选地步骤(e)。
WO2019/020992公开了晚期腺病毒基因的转录可以通过将阻遏元件插入主要晚期启动子来调节(例如抑制)。通过“关闭(switching off)”腺病毒晚期基因的表达,细胞的蛋白质制造能力可以转向生产所需的重组蛋白或重组AAV颗粒。WO2019/020992的全部内容被具体地并入本文。
因此,在一些实施方案中,重组腺病毒(即腺病毒载体)包含可抑制的主要晚期启动子(MLP)和多个腺病毒晚期基因,其中MLP包含一个或多个能够调节或控制腺病毒晚期基因转录的阻遏元件,并且其中一个或多个所述阻遏元件被插入MLP TATA框的下游。
在其他实施方案中,重组腺病毒(即腺病毒载体)包含(a)多个腺病毒早期基因,和(b)受主要晚期启动子(MLP)调控的多个腺病毒晚期基因,以及(c)转基因(例如包含AAVrep和cap基因),其中MLP包含一个或多个能够调节或控制腺病毒晚期基因转录的阻遏元件,并且其中一个或多个所述阻遏元件被插入MLP TATA框的下游。
用于生产病毒(优选AAV)颗粒的优选特征包括以下:
-其中所述一个或多个阻遏元件插入MLP TATA框和转录的+1位置之间。
-其中所述阻遏元件是能够被阻遏蛋白结合的元件。
-其中编码能够结合阻遏元件的阻遏蛋白的基因被编码在腺病毒基因组内。
-其中阻遏蛋白在MLP的控制下转录。
-其中阻遏蛋白为四环素阻遏物、乳糖阻遏物或蜕皮激素阻遏物,优选为四环素阻遏物(TetR)。
-其中阻遏元件是四环素阻遏物结合位点,其包含或由SEQ ID NO:28所示的序列组成。
-其中MLP的核苷酸序列包含或由SEQ ID NO:29或30中所示的序列组成。
-其中阻遏元件的存在不影响腺病毒E2B蛋白的产生。
-其中腺病毒载体编码腺病毒L4 100K蛋白,并且其中所述L4 100K蛋白不受MLP调控。
-其中转基因被插入到腺病毒早期区域内,优选地插入到腺病毒E1区域内,而不是转移质粒中。
-其中转基因的5'-UTR中包含三联体前导序列(TPL)。
-其中转基因编码治疗多肽。
-其中转基因编码病毒蛋白,优选地编码能够在细胞内或细胞外组装以生产病毒样颗粒的蛋白,优选地其中所述转基因编码诺如病毒VP1或乙型肝炎病毒HBsAG。
优选地,一个或多个阻遏元件插入MLP TATA框的下游。优选地所述转基因包含AAVrep和cap基因。
有许多已建立的算法可用于比对两个氨基酸或核酸序列。通常,一个序列作为参考序列,可以将测试序列与其进行比较。序列比较算法是基于指定的程序参数计算测试序列相对于参考序列的序列同一性百分比。用于比较的氨基酸或核酸序列的比对可以例如通过计算机执行的算法(例如GAP、BESTFIT、FASTA或TFASTA)或BLAST和BLAST 2.0算法进行。
可以使用BLAST比对方法获得氨基酸序列和核苷酸序列的同一性百分比(Altschul等(1997),"Gapped BLAST and PSI-BLAST:a new generation of proteindatabase search programs",Nucleic Acids Res.25:3389-3402;以及http://www.ncbi.nlm.nih.gov/BLAST)。优选地使用标准或默认比对参数。
标准蛋白-蛋白BLAST(blastp)可用于在蛋白质数据库中查找类似序列。与其他BLAST程序一样,blastp旨在查找相似的局部区域。当序列相似性跨越整个序列时,blastp也会报告全局比对,这是用于蛋白质鉴定目的的首选结果。优选地使用标准或默认比对参数。在某些情况下,可以取消“低复杂度过滤器”。
也可以使用BLASTX程序进行BLAST蛋白质搜索,得分=50,字长=3。为了获得用于比较目的的间隙比对,可以使用如Altschul等人(1997)Nucleic Acids Res.25:3389中所描述的间隙BLAST(在BLAST 2.0中)。或者,PSI-BLAST(在BLAST 2.0中)可以用于执行迭代搜索,以检测分子之间的远距离关系。(见上文Altschul等人(1997))。当使用BLAST、间隙BLAST、PSI-BLAST时,可以使用各个程序的默认参数。
关于核苷酸序列的比较,MEGABLAST、不连续的megablast和blastn可用于实现该目标。优选地使用标准或默认比对参数。MEGABLAST专为高效查找非常相似的序列之间的长比对而设计。不连续的MEGABAST可用于查找与本发明的核酸相似但不相同的核苷酸序列。
BLAST核苷酸算法通过将查询分解为称为单词的短子序列来找到相似的序列。该程序首先识别与查询词的精确匹配(单词命中)。BLAST程序随后在多个步骤中扩展这些单词命中以生成最终的间隔比对。在一些实施方案中,BLAST核苷酸搜索可以用BLASTN程序执行,得分=100,字长=12。
控制BLAST搜索灵敏度的重要参数之一是字长。blastn比MEGABLAST更灵敏的最重要原因是其使用了更短的默认字长(11)。正因为如此,在寻找与其他生物体相关核苷酸序列的比对方面,blastn比MEGABLAST更好。字长在blastn中是可调整的,其可以从默认值减小到最小值7以提高搜索灵敏度。
通过使用新引入的不连续megablast页面(www.ncbi.nlm.nih.gov/Web/Newstr/FallWinter02/blastlab.html),可以实现更灵敏的搜索。该页面使用的算法与Ma等人(生物信息学,2002年3月;18(3):440-5)报道的相似。不连续megablast不需要以精确的单词匹配作为比对扩展的前提,而是在较长的模板窗口内使用不连续的单词。在编码模式中,通过专注于在第一和第二密码子位置寻找匹配而忽略在第三位置的错配来考虑第三碱基摆动。与使用相同字长的标准blastn相比,使用相同的字长在不连续MEGABLAST中进行搜索更为敏感和高效。不连续megablast的独特参数是:字长:11或12;模板:16、18或21;模板类型:编码(0)、非编码(1)或两者(2)。
在一些实施方案中,可以使用默认参数来使用BLASTP 2.5.0+算法(例如可从NCBI中获得的算法)。
在其他实施方案中,可以使用具有间隙罚分(存在(Existence)11和延伸(Extension)1)的两个蛋白质序列的Needleman-Wunsch比对来使用BLAST全局比对程序(例如可从NCBI中获得)。
本发明的核酸分子、质粒和载体可以通过任何合适的技术制备。用于生产本发明核酸分子和生产细胞系的重组方法在本领域是众所周知的(例如“Molecular Cloning:ALaboratory Manual”(第四版),Green,MR和Sambrook,J.,(2014年更新)).
本文中列出的每篇参考文献的公开内容通过引用其全部具体并入本文。
附图说明
图1显示了通过将AAV2、AAV5、AAV6或AAV9与编码AAV Rep和Cap2基因的四环素激活的抑制腺病毒(TERA-RepCap2)共感染,在HEK293细胞中产生重组AAV2载体。
图2显示了通过将重组AAV2或重组AAV9与编码AAV Rep和Cap9基因的四环素激活的抑制腺病毒(TERA-RepCap9)共感染,在HEK293细胞中产生重组AAV 9载体。
具体实施方式
本发明通过以下实施例进一步说明,除非另有说明,其中的份数和百分比均以重量计,温度是摄氏度。应当理解,这些实施例虽然为本发明的优选实施方案,但仅以说明的方式给出。从以上讨论和这些实施例中,本领域技术人员可以确定本发明的基本特征,并且在不脱离其精神和范围的情况下,可以对本发明进行各种变化和修改以使其适应各种用途和条件。因此,根据前面的描述,除了本文所示和描述的那些之外,本发明的各种修改对于本领域技术人员来说将是显而易见的。这样的修改也旨在落入所附权利要求的范围内。
实验方法
包含AAV组分的腺病毒载体的回收
在HEK293细胞中,所有重组腺病毒载体最初都是从编码每个病毒基因组的质粒DNA中回收的。使用SwaI限制酶对质粒(20μg)进行线性化以从细菌质粒骨架中释放病毒ITR,并使用基因组Pureline DNA提取试剂盒(Invitrogen,加利福尼亚州,美国)进行纯化。在转染前,HEK293细胞以每瓶2×106个细胞的密度接种于T25组织培养瓶中培养24小时。根据制造商的方案,使用Lipofectamine 2000(Invitrogen),以2.5μg线性化DNA转染每个培养瓶。4小时后,将转染培养基更换为含有2% FBS的新鲜DMEM(添加有0.5μg/mL强力霉素或DMSO)。在转染约12天后,当观察到完全CPE时,从生长培养基中收获重组病毒。通过两轮连续稀释分离单个克隆,并在HEK293细胞中进一步增殖(并用0.5μg/mL强力霉素或DMSO培养)。在感染后第3天,通过三轮冻融收获病毒。通过离心,细胞碎片聚集成颗粒,上清液通过0.2μm过滤器。为了大规模的病毒扩增和纯化,将HEK293细胞接种于
Figure BDA0004158622470000161
(Sigma Aldrich,MO,美国)中培养48小时,使其在感染前大约有95%的融合。对于含有rep和cap基因的腺病毒载体,以MOI为3的病毒原液感染每个HYPERFlask 3天。对于包含由tetR蛋白调控的经修饰的主要晚期启动子的腺病毒载体,细胞培养物添加0.5μg/mL强力霉素。在显示完全CPE并通过三轮冻融释放病毒后收获细胞。通过两轮CsCl梯度条带纯化病毒,在第一轮后加入苯并酶250U/mL(Sigma-Aldrich,MO,美国)以降解游离DNA。
AAV转导测定
可以使用改良的TCID50测定法测量具有转导能力的AAV。HEK293细胞可以以每孔1×104个细胞的密度接种于96孔组织培养板中培养24小时。然后可以在总体积为1.2mL并含有2% FBS的DMEM中,对每种AAV粗裂解物原液进行八次10倍的连续稀释。然后,可以将每种稀释样品(1×10-2至1×10-10)的十个重复以每孔100uL的体积添加至每个板的孔中。可以将100uL含有2% FBS的DMEM添加到最后两列作为阴性对照。然后可以通过使用荧光显微镜(EVOS FL成像系统,ThermoFisher Scientific,MA,美国),观察板中96hpi的每个孔中EGFP表达细胞的存在。可以使用
Figure BDA0004158622470000171
统计方法对每毫升的转导单位进行计算。
使用qPCR对病毒基因组和基因表达的定量
为了定量HEK293细胞中的总腺病毒基因组,使用Pureline基因组DNA小量制备试剂盒(Invitrogen,加利福尼亚州,美国)从培养基和细胞裂解物中提取总DNA。在StepOnePlus实时PCR系统(Applied Biosystems,加利福尼亚州,美国)中,使用TaqManFast Advanced Mix(Applied Biosystems,加利福尼亚州,美国),将五微升DNA洗脱液用于qPCR反应。
为了定量基因组被包裹的AAV和腺病毒颗粒,将从培养基或细胞裂解物中收获的2μL病毒样品在20μL的反应体系中,于37℃下用1U的TURBO核酸酶(ThermoFisherScientific,MA,美国)处理2小时。将TURBO核酸酶在75℃下热灭活10分钟。在PCR反应中,使用无核酸酶水以1:200稀释的五微升样品,并使用Ad5六邻体引物和探针以定量被包裹的Ad5,而EGFP引物和探针用于对被包裹的AAV基因组进行定量。使用辅助腺病毒产生的总AAV载体的滴度是通过减去基因组被包裹的腺病毒来确定的。用悬浮在无核酸酶水中的gBLOCK基因片段(Integrated DNA Technologies,IA,美国)生成用于qPCR分析的标准曲线,PCR反应的CT值用于通过外推到标准曲线来计算DNA拷贝数(3×108-3×101个拷贝/孔的qPCR标准品)。
使用ELISA对AAV衣壳进行定量
根据制造商的说明,使用AAV2滴定ELISA试剂盒(Progen,海德堡,德国)检测组装的AAV2衣壳。
实施例1:通过质粒或腺病毒途径在第一宿主细胞中产生AAV
根据Takara AAVpro Helper Free System(Clontech,加利福尼亚州,美国)进行无辅助AAV2和AAV9的生产。对于在6孔组织培养处理板中生产AAV2和AAV9,在转染前24小时,以每孔7.5×104个细胞的密度接种HEK293细胞。为了进行无辅助生产,每孔均转染2.5μg质粒DNA,所述质粒DNA含有pHelper、pAAV-CMV-EGFP和pRepCap2或pRepCap9,使用Opti-MEM(Gibco,马萨诸塞州,美国)以1:1:1的DNA质量比进行稀释,并使用线性PEI 25kDA(Polysciences)以1:3的DNA与PEI质量比进行复配。
对于使用含有AAV rep和cap基因的腺病毒载体生产AAV,在生产前24小时,将HEK293细胞以每孔7.5×104个细胞的密度接种于48孔组织培养板中。每个孔都用包含编码EGFP的AAV基因组的AAV和含有rep和cap基因的腺病毒共同感染。处理后4小时,将感染培养基更换为含有2% FBS的新鲜DMEM(添加有0.5μg/mL强力霉素或DMSO)。为了确定DNA酶反应在降解游离DNA中的效率,每个实验都包括无辅助生产对照,其中使用填充质粒pUC19代替pRepCap2或pRepCap9。将悬浮于生长培养基中的细胞进行三轮冻融,收获AAV载体。通过3000g离心20分钟使细胞沉淀,上清液通过0.2μm过滤器。
实施例2:使用不同AAV血清型感染第二宿主细胞以产生AAV2
图1显示了通过将AAV2、AAV5、AAV6或AAV9与编码AAV Rep和Cap2基因的四环素激活的抑制腺病毒(TERA-RepCap2)共感染,在HEK293细胞中产生重组AAV2载体。数据表明,使用相同浓度、不同血清型AAV可以显著影响随后从第二宿主细胞产生的AAV的数量。已知AAV2和AAV6可有效感染HEK293细胞,而已知AAV9和AAV AAV5感染HEK293细胞的效率较低。这种感染效率直接影响每种血清型的产量。然后将这些生产水平与无辅助质粒转染方法进行直接比较。
在本实施例中,以9e4个细胞/孔的的密度将HEK293细胞接种于48孔组织培养板中培养24小时。用无辅助质粒三重转染HEK293细胞,或使用编码AAV Rep和Cap2的四环素激活的抑制腺病毒与编码EGFP报告子的重组AAV2、AAV5、AA6或AAV9,以每个细胞50个基因组拷贝共感染。
转导96小时后收获AAV载体,并通过QPCR对被包裹的AAV颗进行定量。
实施例3:使用AAV2和AAV9感染第二宿主细胞以产生AAV9
图2显示了通过将重组AAV2或重组AAV9与编码AAV Rep和Cap9基因的四环素激活的抑制腺病毒(TERA-RepCap9)共感染,在HEK293细胞中产生重组AAV 9载体。将重组AAV的生产与无辅助质粒转染方法进行比较。数据显示,用MOI为50的AAV2和MOI为75的TERA-RepCap9感染HEK293细胞产生的AAV9,比使用MOI为750的AAV9和MOI为75的TERA-RepCap9时多4.69倍。因此,在HEK293细胞中,对于每个AAV分子,使用AAV2制备AAV9的效率是使用AAV9制备AAV9的约70倍。这代表了本发明的基本示例。
在本实施例中,以9e4个细胞/孔的密度将HEK293细胞接种于48孔组织培养板中培养24小时。使用无辅助质粒三重转染HEK293细胞,或在一定的MOI下,使用编码AAV Rep和Cap9的TERA-RepCap9病毒和编码EGFP报告子的重组AAV2或AAV9载体共感染HEK293细胞。转导96小时后收获AAV载体,并通过QPCR对被包裹的AAV颗粒进行定量。
实施例4:靶细胞的感染
以来自第二宿主细胞的AAV对靶细胞进行转导。这是通过一系列适合所治疗疾病状况的方法实现的。递送至第三宿主细胞是通过针头注射至患者的直接体内递送实现的。这直接进入治疗靶组织,或在静脉内递送,其中第二衣壳多肽能够感染靶细胞。
通过将AAV应用于已从患者中分离的细胞,该细胞也可被离体感染。这些被感染的细胞被重新施用于患者。
序列表自由文本
Figure BDA0004158622470000181
Figure BDA0004158622470000191
/>
序列表
<110> 牛津基因有限公司
牛津大学创新有限公司
<120> 重组AAV的制备方法
<130> FSP1V230298ZX
<160> 30
<170> PatentIn version 3.5
<210> 1
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> AAV1 - 衣壳核苷酸序列 (AF063497.1)
<400> 1
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211
<210> 2
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV1 - 衣壳蛋白序列
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 3
<211> 2208
<212> DNA
<213> 腺相关病毒2
<400> 3
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 4
<211> 735
<212> PRT
<213> 腺相关病毒2
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 2211
<212> DNA
<213> 腺相关病毒3
<400> 5
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaagg gggctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg agactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
agaggggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgactg gaactgtcaa tcatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttgtg a 2211
<210> 6
<211> 736
<212> PRT
<213> 腺相关病毒3
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly
130 135 140
Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 2205
<212> DNA
<213> 腺相关病毒4
<400> 7
atgactgacg gttaccttcc agattggcta gaggacaacc tctctgaagg cgttcgagag 60
tggtgggcgc tgcaacctgg agcccctaaa cccaaggcaa atcaacaaca tcaggacaac 120
gctcggggtc ttgtgcttcc gggttacaaa tacctcggac ccggcaacgg actcgacaag 180
ggggaacccg tcaacgcagc ggacgcggca gccctcgagc acgacaaggc ctacgaccag 240
cagctcaagg ccggtgacaa cccctacctc aagtacaacc acgccgacgc ggagttccag 300
cagcggcttc agggcgacac atcgtttggg ggcaacctcg gcagagcagt cttccaggcc 360
aaaaagaggg ttcttgaacc tcttggtctg gttgagcaag cgggtgagac ggctcctgga 420
aagaagagac cgttgattga atccccccag cagcccgact cctccacggg tatcggcaaa 480
aaaggcaagc agccggctaa aaagaagctc gttttcgaag acgaaactgg agcaggcgac 540
ggaccccctg agggatcaac ttccggagcc atgtctgatg acagtgagat gcgtgcagca 600
gctggcggag ctgcagtcga gggcggacaa ggtgccgatg gagtgggtaa tgcctcgggt 660
gattggcatt gcgattccac ctggtctgag ggccacgtca cgaccaccag caccagaacc 720
tgggtcttgc ccacctacaa caaccacctc tacaagcgac tcggagagag cctgcagtcc 780
aacacctaca acggattctc caccccctgg ggatactttg acttcaaccg cttccactgc 840
cacttctcac cacgtgactg gcagcgactc atcaacaaca actggggcat gcgacccaaa 900
gccatgcggg tcaaaatctt caacatccag gtcaaggagg tcacgacgtc gaacggcgag 960
acaacggtgg ctaataacct taccagcacg gttcagatct ttgcggactc gtcgtacgaa 1020
ctgccgtacg tgatggatgc gggtcaagag ggcagcctgc ctccttttcc caacgacgtc 1080
tttatggtgc cccagtacgg ctactgtgga ctggtgaccg gcaacacttc gcagcaacag 1140
actgacagaa atgccttcta ctgcctggag tactttcctt cgcagatgct gcggactggc 1200
aacaactttg aaattacgta cagttttgag aaggtgcctt tccactcgat gtacgcgcac 1260
agccagagcc tggaccggct gatgaaccct ctcatcgacc agtacctgtg gggactgcaa 1320
tcgaccacca ccggaaccac cctgaatgcc gggactgcca ccaccaactt taccaagctg 1380
cggcctacca acttttccaa ctttaaaaag aactggctgc ccgggccttc aatcaagcag 1440
cagggcttct caaagactgc caatcaaaac tacaagatcc ctgccaccgg gtcagacagt 1500
ctcatcaaat acgagacgca cagcactctg gacggaagat ggagtgccct gacccccgga 1560
cctccaatgg ccacggctgg acctgcggac agcaagttca gcaacagcca gctcatcttt 1620
gcggggccta aacagaacgg caacacggcc accgtacccg ggactctgat cttcacctct 1680
gaggaggagc tggcagccac caacgccacc gatacggaca tgtggggcaa cctacctggc 1740
ggtgaccaga gcaacagcaa cctgccgacc gtggacagac tgacagcctt gggagccgtg 1800
cctggaatgg tctggcaaaa cagagacatt tactaccagg gtcccatttg ggccaagatt 1860
cctcataccg atggacactt tcacccctca ccgctgattg gtgggtttgg gctgaaacac 1920
ccgcctcctc aaatttttat caagaacacc ccggtacctg cgaatcctgc aacgaccttc 1980
agctctactc cggtaaactc cttcattact cagtacagca ctggccaggt gtcggtgcag 2040
attgactggg agatccagaa ggagcggtcc aaacgctgga accccgaggt ccagtttacc 2100
tccaactacg gacagcaaaa ctctctgttg tgggctcccg atgcggctgg gaaatacact 2160
gagcctaggg ctatcggtac ccgctacctc acccaccacc tgtaa 2205
<210> 8
<211> 734
<212> PRT
<213> 腺相关病毒4
<400> 8
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser
180 185 190
Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly
195 200 205
Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu
245 250 255
Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn
370 375 380
Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser
405 410 415
Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile
420 425 430
Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu
435 440 445
Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn
450 455 460
Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln
465 470 475 480
Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr
485 490 495
Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly
500 505 510
Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro
515 520 525
Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys
530 535 540
Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser
545 550 555 560
Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly
565 570 575
Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp
580 585 590
Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg
595 600 605
Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu
675 680 685
Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly
690 695 700
Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr
705 710 715 720
Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu
725 730
<210> 9
<211> 2175
<212> DNA
<213> 人工序列
<220>
<223> AAV5 - 衣壳核苷酸序列 (AF085716.1)
<400> 9
atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60
tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120
gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg tctcgatcga 180
ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240
cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300
gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360
aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420
ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480
aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540
ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600
ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660
gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720
agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780
aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840
cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900
tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960
accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020
ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080
tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140
gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200
aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260
cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320
acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380
tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440
gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500
agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560
tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620
acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680
gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740
gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800
gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860
tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920
acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980
cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040
aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100
tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160
acccgacccc tttaa 2175
<210> 10
<211> 724
<212> PRT
<213> 人工序列
<220>
<223> AAV5 - 衣壳蛋白序列
<400> 10
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 11
<211> 2211
<212> DNA
<213> 人工序列
<220>
<223> AAV6 - 衣壳核苷酸序列 (AF028704.1)
<400> 11
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 12
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> AAV6 - 衣壳蛋白序列
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 13
<211> 2214
<212> DNA
<213> 人工序列
<220>
<223> AAV7 - 衣壳核苷酸序列 (AF513851.1)
<400> 13
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtcattt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
gcaaagaaga gaccggtaga gccgtcacct cagcgttccc ccgactcctc cacgggcatc 480
ggcaagaaag gccagcagcc cgccagaaag agactcaatt tcggtcagac tggcgactca 540
gagtcagtcc ccgaccctca acctctcgga gaacctccag cagcgccctc tagtgtggga 600
tctggtacag tggctgcagg cggtggcgca ccaatggcag acaataacga aggtgccgac 660
ggagtgggta atgcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720
attaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccagtg aaactgcagg tagtaccaac gacaacacct acttcggcta cagcaccccc 840
tgggggtatt ttgactttaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggccc aagaagctgc ggttcaagct cttcaacatc 960
caggtcaagg aggtcacgac gaatgacggc gttacgacca tcgctaataa ccttaccagc 1020
acgattcagg tattctcgga ctcggaatac cagctgccgt acgtcctcgg ctctgcgcac 1080
cagggctgcc tgcctccgtt cccggcggac gtcttcatga ttcctcagta cggctacctg 1140
actctcaaca atggcagtca gtctgtggga cgttcctcct tctactgcct ggagtacttc 1200
ccctctcaga tgctgagaac gggcaacaac tttgagttca gctacagctt cgaggacgtg 1260
cctttccaca gcagctacgc acacagccag agcctggacc ggctgatgaa tcccctcatc 1320
gaccagtact tgtactacct ggccagaaca cagagtaacc caggaggcac agctggcaat 1380
cgggaactgc agttttacca gggcgggcct tcaactatgg ccgaacaagc caagaattgg 1440
ttacctggac cttgcttccg gcaacaaaga gtctccaaaa cgctggatca aaacaacaac 1500
agcaactttg cttggactgg tgccaccaaa tatcacctga acggcagaaa ctcgttggtt 1560
aatcccggcg tcgccatggc aactcacaag gacgacgagg accgcttttt cccatccagc 1620
ggagtcctga tttttggaaa aactggagca actaacaaaa ctacattgga aaatgtgtta 1680
atgacaaatg aagaagaaat tcgtcctact aatcctgtag ccacggaaga atacgggata 1740
gtcagcagca acttacaagc ggctaatact gcagcccaga cacaagttgt caacaaccag 1800
ggagccttac ctggcatggt ctggcagaac cgggacgtgt acctgcaggg tcccatctgg 1860
gccaagattc ctcacacgga tggcaacttt cacccgtctc ctttgatggg cggctttgga 1920
cttaaacatc cgcctcctca gatcctgatc aagaacactc ccgttcccgc taatcctccg 1980
gaggtgttta ctcctgccaa gtttgcttcg ttcatcacac agtacagcac cggacaagtc 2040
agcgtggaaa tcgagtggga gctgcagaag gaaaacagca agcgctggaa cccggagatt 2100
cagtacacct ccaactttga aaagcagact ggtgtggact ttgccgttga cagccagggt 2160
gtttactctg agcctcgccc tattggcact cgttacctca cccgtaatct gtaa 2214
<210> 14
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> AAV7 - 衣壳蛋白序列
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala
435 440 445
Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln
450 455 460
Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu
545 550 555 560
Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala
580 585 590
Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 15
<211> 2217
<212> DNA
<213> 人工序列
<220>
<223> AAV8 - 衣壳核苷酸序列 (AF513852.1)
<400> 15
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540
gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600
cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020
agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080
caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140
ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200
tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260
gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320
attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380
cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440
ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500
agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560
aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620
gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680
atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740
atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800
cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920
ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980
ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040
gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100
atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160
ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 16
<211> 738
<212> PRT
<213> 人工序列
<220>
<223> AAV8 - 衣壳蛋白序列
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 17
<211> 2214
<212> DNA
<213> 人工序列
<220>
<223> AAV9 - 衣壳核苷酸序列 (AY530556.1)
<400> 17
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacggcaa ggcctacgac 240
cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540
gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600
cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660
ggagtgggta attcctcggg aaattggcat tgcgattcca catggctggg ggacagagtc 720
atcaccacca gcacccgaac ctgggcattg cccacctaca acaaccacct ctacaagcaa 780
atctccaatg gaacatcggg aggaagcacc aacgacaaca cctactttgg ctacagcacc 840
ccctgggggt attttgactt caacagattc cactgccact tctcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg ccaaagagac tcaacttcaa gctgttcaac 960
atccaggtca aggaggttac gacgaacgaa ggcaccaaga ccatcgccaa taaccttacc 1020
agcaccgtcc aggtctttac ggactcggag taccagctac cgtacgtcct aggctctgcc 1080
caccaaggat gcctgccacc gtttcctgca gacgtcttca tggttcctca gtacggctac 1140
ctgacgctca acaatggaag tcaagcgtta ggacgttctt ctttctactg tctggaatac 1200
ttcccttctc agatgctgag aaccggcaac aactttcagt tcagctacac tttcgaggac 1260
gtgcctttcc acagcagcta cgcacacagc cagagtctag atcgactgat gaaccccctc 1320
atcgaccagt acctatacta cctggtcaga acacagacaa ctggaactgg gggaactcaa 1380
actttggcat tcagccaagc aggccctagc tcaatggcca atcaggctag aaactgggta 1440
cccgggcctt gctaccgtca gcagcgcgtc tccacaacca ccaaccaaaa taacaacagc 1500
aactttgcgt ggacgggagc tgctaaattc aagctgaacg ggagagactc gctaatgaat 1560
cctggcgtgg ctatggcatc gcacaaagac gacgaggacc gcttctttcc atcaagtggc 1620
gttctcatat ttggcaagca aggagccggg aacgatggag tcgactacag ccaggtgctg 1680
attacagatg aggaagaaat taaagccacc aaccctgtag ccacagagga atacggagca 1740
gtggccatca acaaccaggc cgctaacacg caggcgcaaa ctggacttgt gcataaccag 1800
ggagttattc ctggtatggt ctggcagaac cgggacgtgt acctgcaggg ccctatttgg 1860
gctaaaatac ctcacacaga tggcaacttt cacccgtctc ctctgatggg tggatttgga 1920
ctgaaacacc cacctccaca gattctaatt aaaaatacac cagtgccggc agatcctcct 1980
cttaccttca atcaagccaa gctgaactct ttcatcacgc agtacagcac gggacaagtc 2040
agcgtggaaa tcgagtggga gctgcagaaa gaaaacagca agcgctggaa tccagagatc 2100
cagtatactt caaactacta caaatctaca aatgtggact ttgctgtcaa taccgaaggt 2160
gtttactctg agcctcgccc cattggtact cgttacctca cccgtaattt gtaa 2214
<210> 18
<211> 737
<212> PRT
<213> 人工序列
<220>
<223> AAV9 - 衣壳蛋白序列
<400> 18
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Gly Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Thr Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Leu Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Val Arg Thr Gln Thr Thr Gly Thr Gly Gly Thr Gln Thr Leu Ala Phe
450 455 460
Ser Gln Ala Gly Pro Ser Ser Met Ala Asn Gln Ala Arg Asn Trp Val
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Asn Gln
485 490 495
Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Ala Lys Phe Lys Leu
500 505 510
Asn Gly Arg Asp Ser Leu Met Asn Pro Gly Val Ala Met Ala Ser His
515 520 525
Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile Phe
530 535 540
Gly Lys Gln Gly Ala Gly Asn Asp Gly Val Asp Tyr Ser Gln Val Leu
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ala Val Ala Ile Asn Asn Gln Ala Ala Asn Thr Gln Ala
580 585 590
Gln Thr Gly Leu Val His Asn Gln Gly Val Ile Pro Gly Met Val Trp
595 600 605
Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asp Pro Pro Leu Thr Phe Asn Gln Ala Lys Leu Asn Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 19
<211> 1866
<212> DNA
<213> 腺相关病毒2
<400> 19
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caatag 1866
<210> 20
<211> 1866
<212> DNA
<213> 腺相关病毒2
<400> 20
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacgg gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtacctcag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caatag 1866
<210> 21
<211> 621
<212> PRT
<213> 腺相关病毒2
<400> 21
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Gly His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 22
<211> 1589
<212> DNA
<213> 腺相关病毒2
<400> 22
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtacctcag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacagtag 1589
<210> 23
<211> 528
<212> PRT
<213> 腺相关病毒2
<400> 23
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
<210> 24
<211> 1195
<212> DNA
<213> 腺相关病毒2
<400> 24
catggagctg gtcgggtggc tcgtggacaa ggggattacc tcggagaagc agtggatcca 60
ggaggaccag gcctcataca tctccttcaa tgcggcctcc aactcgcggt cccaaatcaa 120
ggctgccttg gacaatgcgg gaaagattat gagcctgact aaaaccgccc ccgactacct 180
ggtgggccag cagcccgtgg aggacatttc cagcaatcgg atttataaaa ttttggaact 240
aaacgggtac gatccccaat atgcggcttc cgtctttctg ggatgggcca cgaaaaagtt 300
cggcaagagg aacaccatct ggctgtttgg gcctgcaact accgggaaga ccaacatcgc 360
ggaggccata gcccacactg tgcccttcta cgggtgcgta aactggacca atgagaactt 420
tcccttcaac gactgtgtcg acaagatggt gatctggtgg gaggagggga agatgaccgc 480
caaggtcgtg gagtcggcca aagccattct cggaggaagc aaggtgcgcg tggaccagaa 540
atgcaagtcc tcggcccaga tagacccgac tcccgtgatc gtcacctcca acaccaacat 600
gtgcgccgtg attgacggga actcaacgac cttcgaacac cagcagccgt tgcaagaccg 660
gatgttcaaa tttgaactca cccgccgtct ggatcatgac tttgggaagg tcaccaagca 720
ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg gttgaggtgg agcatgaatt 780
ctacgtcaaa aagggtggag ccaagaaaag acccgccccc agtgacgcag atataagtga 840
gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg tcagacgcgg aagcttcgat 900
caactacgca gacaggtacc aaaacaaatg ttctcgtcac gtgggcatga atctgatgct 960
gtttccctgc agacaatgcg agagaatgaa tcagaattca aatatctgct tcactcacgg 1020
acagaaagac tgtttagagt gctttcccgt gtcagaatct caacccgttt ctgtcgtcaa 1080
aaaggcgtat cagaaactgt gctacattca tcatatcatg ggaaaggtgc cagacgcttg 1140
cactgcctgc gatctggtca atgtggattt ggatgactgc atctttgaac aatag 1195
<210> 25
<211> 397
<212> PRT
<213> 腺相关病毒2
<400> 25
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
325 330 335
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
340 345 350
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
355 360 365
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
370 375 380
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 26
<211> 939
<212> DNA
<213> 腺相关病毒2
<400> 26
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag acagattggc tcgaggacac tctctctag 939
<210> 27
<211> 312
<212> PRT
<213> 腺相关病毒2
<400> 27
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Leu Ala Arg Gly His Ser Leu
305 310
<210> 28
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> TetR结合位点
<400> 28
tccctatcag tgatagaga 19
<210> 29
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 修饰的MLP
<400> 29
cgccctcttc ggcatcaagg aaggtgattg gtttgtaggt gtaggccacg tgaccgggtg 60
ttcctgaagg ggggctataa aaggtcccta tcagtgatag agactca 107
<210> 30
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 修饰的MLP
<400> 30
cgccctcttc ggcatcaagg aaggtgattg gtttgtaggt gtaggccacg tgactcccta 60
tcagtgatag agaactataa aaggtcccta tcagtgatag agactca 107

Claims (12)

1.一种生产重组腺相关病毒(AAV)颗粒的方法,所述方法包括以下步骤:
(a)培养第一宿主细胞群,其中每个第一宿主细胞包含:
(i)编码重组AAV基因组的核酸分子;
(ii)编码第一AAV cap基因的核酸分子,所述第一AAV cap基因编码第一AAV衣壳多肽,其中所述第一AAV衣壳多肽赋予包含所述多肽的AAV颗粒对第二宿主细胞的趋向性;
(iii)编码AAV rep基因的核酸分子;
(iv)编码辅助病毒基因的核酸分子;
使得(i)-(iv)中的每一个在所述第一宿主细胞中的表达足以在所述第一宿主细胞中生产包含AAV基因组的第一重组AAV颗粒,其中所述第一重组AAV颗粒被第一AAV衣壳多肽包裹;
(b)用步骤(a)生产的所述第一重组AAV颗粒感染第二宿主细胞群;
(c)在所述第二宿主细胞群中表达:
(i)编码第二AAV cap基因的核酸分子,所述第二AAV cap基因编码第二AAV衣壳多肽,其中所述第二AAV衣壳多肽赋予包含所述多肽的AAV颗粒对第三宿主细胞的趋向性;
(ii)编码AAV rep基因的核酸分子;
(iii)编码辅助病毒基因的核酸分子;
其中所有(i)-(iii)均独立地存在于所述第二宿主细胞中,或随后被引入所述第二宿主细胞中,
使得(i)-(iii)中的每一个在所述第二宿主细胞中的表达足以在所述第二宿主细胞中生产包含所述重组AAV基因组的第二重组AAV颗粒,其中所述第二重组AAV颗粒被所述第二AAV衣壳多肽包裹;
(d)在使包含所述重组AAV基因组的第二重组AAV颗粒产生的条件下,在培养基中培养所述第二宿主细胞,每个所述第二重组AAV颗粒被包含所述第二衣壳多肽的衣壳包裹;
并且可选地,
(e)从所述第二宿主细胞或所述培养基中纯化和/或分离第二重组AAV颗粒。
2.根据权利要求1所述的方法,其中步骤(a)还包括将编码重组AAV基因组的核酸分子引入第一宿主细胞的在先步骤。
3.根据权利要求1或2所述的方法,其中所述第一宿主细胞和/或第二宿主细胞为HEK293、HEK293T、HEK293A、PerC6或911细胞。
4.根据前述权利要求中任意一项所述的方法,其中引入所述第一宿主细胞的编码重组AAV基因组的核酸分子是质粒、重组腺病毒的形式,或者整合到细胞或重组AAV颗粒的基因组中。
5.根据前述权利要求中任意一项所述的方法,其中编码第一AAV cap基因的核酸分子和/或编码rep基因的核酸以质粒或在AV重组基因组中的形式引入第一宿主细胞。
6.根据前述权利要求中任意一项所述的方法,其中编码第二AAV cap基因的核酸分子和/或编码rep基因的核酸以质粒或在AV重组基因组中的形式引入第二宿主细胞。
7.根据前述权利要求中任意一项所述的方法,其中所述第一AAV衣壳多肽和所述第二AAV衣壳多肽之间的氨基酸序列同一性小于99.5%,优选地小于99%、小于98%、小于97%、小于96%、小于95%或小于90%;并且至少为50%。
8.根据前述权利要求中任意一项所述的方法,其中所述第一重组AAV颗粒为血清型2(AAV2)。
9.根据前述权利要求中任意一项所述的方法,其中所述第二重组AAV颗粒为血清型9(AAV9),或为血清型9的修饰或突变衍生物。
10.根据前述权利要求中任意一项所述的方法,其中所述第三宿主细胞选自由神经元(例如视网膜神经元)、肝细胞、肌肉细胞、干细胞(优选间充质干细胞、造血干细胞、胚胎干细胞、脂肪干细胞和诱导性多能干细胞及其衍生物)、免疫细胞(包括B和T淋巴细胞、自然杀伤细胞、单核细胞和巨噬细胞以及粒细胞)、内皮细胞、心血管细胞、上皮细胞、间充质细胞、胰腺a细胞或b细胞、心肌细胞、脾细胞、脂肪细胞、胶质细胞、成纤维细胞、库普弗细胞和癌细胞(优选白血病、淋巴瘤、骨髓瘤、癌、肉瘤或黑色素瘤细胞)组成的组。
11.根据前述权利要求中任意一项所述的方法,其中编码第一cap基因和/或第二cap基因和/或rep基因的核酸分子存在于重组腺病毒(AV)中,其中所述重组腺病毒包含可抑制的主要晚期启动子(MLP)和多个腺病毒晚期基因,其中所述MLP包含一个或多个能够调节或控制腺病毒晚期基因转录的阻遏元件,并且其中一个或多个所述阻遏元件被插入所述MLPTATA框的下游。
12.通过前述权利要求中任意一项所述的方法获得或可获得的第二重组AAV颗粒。
CN202180067893.XA 2020-08-21 2021-08-20 重组aav的制备方法 Pending CN116419974A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB2013057.1A GB202013057D0 (en) 2020-08-21 2020-08-21 Method of making recombinant aavs
GB2013057.1 2020-08-21
PCT/GB2021/052162 WO2022038369A1 (en) 2020-08-21 2021-08-20 Method of making recombinant aavs

Publications (1)

Publication Number Publication Date
CN116419974A true CN116419974A (zh) 2023-07-11

Family

ID=72660685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180067893.XA Pending CN116419974A (zh) 2020-08-21 2021-08-20 重组aav的制备方法

Country Status (10)

Country Link
US (1) US20240026378A1 (zh)
EP (1) EP4200428A1 (zh)
JP (1) JP2023538409A (zh)
KR (1) KR20230074485A (zh)
CN (1) CN116419974A (zh)
AU (1) AU2021327855A1 (zh)
CA (1) CA3189844A1 (zh)
GB (1) GB202013057D0 (zh)
MX (1) MX2023001936A (zh)
WO (1) WO2022038369A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070015238A1 (en) * 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
SG11201911572YA (en) 2017-07-25 2020-02-27 Oxford Genetics Ltd Adenoviral vectors
FR3069668B1 (fr) 2017-07-27 2021-02-12 Safran Procede et dispositif de recherche d'un defaut susceptible d'affecter un dispositif mecanique tournant de transmission de puissance

Also Published As

Publication number Publication date
US20240026378A1 (en) 2024-01-25
AU2021327855A9 (en) 2023-07-13
GB202013057D0 (en) 2020-10-07
CA3189844A1 (en) 2022-02-24
EP4200428A1 (en) 2023-06-28
JP2023538409A (ja) 2023-09-07
AU2021327855A1 (en) 2023-05-04
MX2023001936A (es) 2023-04-10
WO2022038369A1 (en) 2022-02-24
KR20230074485A (ko) 2023-05-30

Similar Documents

Publication Publication Date Title
US10752915B2 (en) Compositions and methods for generating adeno-associated viral vectors with undetectable capsid gene contamination
US7943379B2 (en) Production of rAAV in vero cells using particular adenovirus helpers
JP7140830B2 (ja) Aav粒子の産生を目的としたベクター
CA2698011C (en) Porcine adeno-associated viruses
US20230257770A1 (en) Process for Making Adenoassociated Viral Vectors
US20040087026A1 (en) Host cells for packing a recombinant adeno-associated virus (raav), method for the production and use thereof
WO2004075861A2 (en) Recombinant adeno-associated virus production
JP2023138527A (ja) スペーサーを含む核酸分子およびその使用の方法
US11549125B2 (en) Closed-ended, linear, duplex adenoassociated virus DNA, and uses thereof
US20230076955A1 (en) DNA Amplification Method
AU1096699A (en) Transcriptionally-activated aav inverted terminal repeats (itrs) for use with recombinant aav vectors
EP4112731A1 (en) System for high-level raav production
CN116419974A (zh) 重组aav的制备方法
CN117396610A (zh) 使用care元件的dna扩增方法
EP4200316A1 (en) Process for making a recombinant aav library
AU2003203790B2 (en) Transcriptionally-activated AAV inverted terminal repeats (ITRs) for use with recombinant AAV vectors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination