CN118103517A

CN118103517A - 包括腺病毒相关病毒多核苷酸的真核细胞

Info

Publication number: CN118103517A
Application number: CN202280069671.6A
Authority: CN
Inventors: M·格伦; Y·赵; A·斯特里库迪斯; D·布拉科夫; 陈刚
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2021-10-18
Filing date: 2022-10-18
Publication date: 2024-05-28
Also published as: IL312124A; AU2022373653A1; WO2023069926A1; US20230193312A1; TW202323529A; CA3234939A1

Abstract

本发明提供了真核细胞，如哺乳动物细胞，所述真核细胞包括腺相关病毒(AAV)多核苷酸，包含AAV衣壳蛋白(Cap)，并且能够表达由所述AAV多核苷酸编码的多肽，并且由此能够产生AAV，包含重组AAV。所述真核细胞也可以包括腺病毒(Ad)多核苷酸。本发明还提供了在真核细胞如CHO细胞、HEK 293细胞和BHK细胞中表达AAV多核苷酸以及Ad多核苷酸的方法。本发明进一步提供了本文所描述的其它产物和方法。

Description

包括腺病毒相关病毒多核苷酸的真核细胞

本申请要求于2021年10月18日提交的美国申请序列号63/256,730的优先权，所述美国申请特此通过引用整体并入。

技术领域

本发明提供了真核细胞，所述真核细胞包括腺相关病毒(AAV)多核苷酸，包含AAV衣壳蛋白(Cap)。所述细胞能够表达由所述AAV多核苷酸编码的多肽，并且由此能够产生AAV，包含重组AAV。所述真核细胞也可以包括腺病毒(Ad)多核苷酸。本发明还提供了在真核细胞中表达AAV多核苷酸以及Ad多核苷酸的方法。本发明还提供了用于利用真核细胞产生重组腺相关病毒的方法，所述真核细胞表达由多核苷酸编码的AAV和Ad多肽以及通过这些发明方法产生的重组AAV。本发明进一步提供了本文所描述的其它产物和方法。

对电子序列表的引用

本申请含有已经以.XML格式电子提交并且特此通过引用以其整体并入的序列表。创建于2022年10月5日的所述.XML副本命名为135975-61702.xml并且大小为229,879字节。此.XML文件中含有的序列表是说明书的一部分，并且特此通过引用整体并入本文。

背景技术

腺相关病毒(AAV)是一种无包膜的单链DNA病毒，并且被用作研究和治疗两者的基因递送载体。Weitzman和Linden,《腺相关病毒生物学(Adeno-Associated VirusBiology)》(第1章),《分子生物学方法(Meth.Molec.Biol.)》807:1-23(2011)。基于AAV的基因转移载体基于其安全性和在动物模型中实现长期功效的潜力，已被证明有望用于人类基因疗法。Wang等人,《自然(Nature)》,18:358-78(2019)。将基于AAV的疗法推进到临床开发的一个主要挑战是通过瞬时方法产生足够量的AAV的难度和成本。

AAV已在HEK 293、BHK、人羊膜(例如，上皮细胞如HAEpiC)和SF9系中产生。然而，由于使用了含有必需的AAV和辅助病毒基因的质粒载体，表达是瞬时的。例如，使用腺病毒辅助基因产物在HEK 293细胞中产生重组AAV利用了腺病毒E2A、E4、VA RNA以及AAV Rep和Cap，连同侧接所关注的多核苷酸的AAV反向末端重复序列(ITR)。对非整合质粒载体的依赖意味着必需的基因产物会随着时间的推移而丢失，并且需要不断地重建。

AAV基因组包含被称为“Cap”或“CAP”的衣壳基因。自然界中的Cap通过替代性起始密码子和转录剪接产生三种大小不同的结构蛋白，被称为VP1(约90kDa)、VP2(约72kDa)和VP3(约60kDa)。AAV衣壳含有总共60个VP蛋白亚基。1:1:10的比率被认为是VP1:VP2:VP3的最典型比率，这是5个VP1亚基:5个VP2亚基:50个VP3亚基的化学计量比。然而，可能会有变化。等人,《自然通讯(Nature Communications)》12:1642(2021)。AAV多核苷酸和蛋白质，包含CAP，可以选自任何血清型。

因此，需要开发改进的细胞和产生方法，以避免非整合质粒载体的瞬时性质。

发明内容

本发明提供了稳定的真核细胞，如哺乳动物细胞(例如，灵长类动物、啮齿动物和犬细胞)，所述真核细胞包括整合的AAV多核苷酸和Ad多核苷酸。Ad多核苷酸的蛋白质和VARNA产物起辅助作用。根据本发明，所有AAV和Ad类型都适于使用。本发明可以有利地采用位点特异性整合到细胞基因组中，这是指预先选择的基因组位点，用于将外源DNA插入到细胞基因组中。也可以采用随机插入。

本文描述了多核苷酸，其中每个多核苷酸可以包括(i)启动子，(ii)内含子，(iii)内部核糖体进入位点，(iv)编码腺相关病毒(AAV)Cap蛋白的多核苷酸，以及(v)聚腺苷酸化位点。例如，所述多核苷酸可以处于CHO细胞中，并且具有可以可操作地连接的(i)启动子、(ii)内含子、(iii)内部核糖体进入位点和(iv)编码AAV Cap蛋白的多核苷酸。所述多核苷酸可以被整合到CHO细胞基因组如CHO染色体中。可替代地，所述多核苷酸可以处于HEK 293细胞中，并且具有可操作地连接的(i)启动子、(ii)内含子、(iii)内部核糖体进入位点和(iv)编码AAV Cap蛋白的多核苷酸。所述多核苷酸可以被整合到HEK 293细胞基因组如HEK293细胞染色体中。另一种替代方案是多核苷酸可以处于BHK细胞中，并且具有可操作地连接的(i)启动子、(ii)内含子、(iii)内部核糖体进入位点和(iv)编码AAV Cap蛋白的多核苷酸。所述多核苷酸可以被整合到BHK细胞基因组如BHK细胞染色体中。在又另一种替代方案中，多核苷酸可以处于人羊膜细胞中，并且具有可操作地连接的(i)启动子、(ii)内含子、(iii)内部核糖体进入位点和(iv)编码AAV Cap蛋白的多核苷酸。所述多核苷酸可以被整合到人羊膜细胞基因组如人羊膜细胞染色体中。另外，如本领域技术人员所知，多核苷酸可以被整合到非染色体位置，如游离体中。

所述多核苷酸可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。AAV蛋白和多核苷酸，包含CAP，可以选自任何血清型。当Cap来自血清型5(“Cap5”)并在CHO细胞中表达时，多核苷酸允许产生AAV Cap5 VP2和VP3蛋白，其中产生的VP3的量大于产生的VP2的量。VP1的产量可以低于VP2产量水平的1％。产生比率可以基于实验条件和分析技术而变化。

另外，描述了多核苷酸，其中每个多核苷酸可以包括(i)启动子，(ii)内含子，(iii)第一内部核糖体进入位点，(iv)编码AAV Cap蛋白的第一多核苷酸，(v)第二内部核糖体进入位点，(vi)编码AAV Cap蛋白的第二多核苷酸以及(vii)聚腺苷酸化位点。例如，所述多核苷酸可以处于CHO细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可以可操作地连接。所述多核苷酸可以被整合到CHO细胞基因组中。可替代地，所述多核苷酸可以处于HEK 293细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可操作地连接。所述多核苷酸可以被整合到HEK 293细胞基因组中。在另一个替代方案中，所述多核苷酸可以处于BHK细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可操作地连接。所述多核苷酸可以被整合到BHK细胞基因组中。在另一个替代方案中，所述多核苷酸可以处于人羊膜细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可操作地连接。所述多核苷酸可以被整合到人羊膜细胞基因组中。所述多核苷酸可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。AAV蛋白和多核苷酸，包含CAP，可以选自任何血清型。当Cap来自血清型5(“Cap5”)并在CHO细胞中表达时，多核苷酸允许产生AAV Cap5蛋白VP1、VP2和VP3。VP3的产量可以大于VP1得产量和VP2的产量。VP2的产量可以大于VP1的产量。产生比率可以基于实验条件和分析技术而变化。

此外，描述了多核苷酸，其中每个多核苷酸可以包括(i)启动子，(ii)内含子，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点，其中所述多核苷酸允许在被表达时产生AAV Cap VP1蛋白。例如，所述多核苷酸可以处于CHO细胞中，并且所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到CHO细胞基因组中。可替代地，所述多核苷酸可以处于HEK 293细胞中，并且所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到HEK 293细胞基因组中。在另一个替代方案中，所述多核苷酸可以处于BHK细胞中，并且所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到BHK细胞基因组中。在仍另一个替代方案中，所述多核苷酸可以处于人羊膜细胞中，并且所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到人羊膜细胞基因组中。所述多核苷酸可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。

此外，描述了多核苷酸，其中每个多核苷酸可以包括(i)启动子，(ii)内部核糖体结合位点，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点，其中所述多核苷酸允许在被表达时产生AAV VP1 Cap蛋白。所述多核苷酸可以处于CHO细胞中，并且所述(i)启动子、所述(ii)内部核糖体结合位点和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到CHO基因组中。可替代地，所述多核苷酸可以处于HEK293细胞中，并且所述(i)启动子、所述(ii)内部核糖体结合位点和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到HEK 293细胞基因组中。在另一个替代方案中，所述多核苷酸可以处于BHK细胞中，并且所述(i)启动子、所述(ii)内部核糖体结合位点和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到BHK细胞基因组中。在又另一个替代方案中，所述多核苷酸可以处于人羊膜细胞中，并且所述(i)启动子、所述(ii)内部核糖体结合位点和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到人羊膜细胞基因组中。所述多核苷酸可以包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。

另外，描述了真核细胞，其中每个细胞可以包括多核苷酸，所述多核苷酸包括(i)启动子，(ii)内含子，(iii)第一内部核糖体进入位点，(iv)编码AAV Cap蛋白的第一多核苷酸，(v)第二内部核糖体进入位点，(vi)编码AAV Cap蛋白的第二多核苷酸，以及(vii)聚腺苷酸化位点。所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAVCap蛋白的第二多核苷酸可以可操作地连接。所述多核苷酸可以被整合到细胞基因组中。所述细胞可以是CHO细胞、HEK 293细胞、BHK细胞、人羊膜细胞或其它真核细胞。所述细胞可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。所述细胞可以进一步包括：编码AAV Rep的多核苷酸、编码Ad E1A的多核苷酸、编码Ad E1B的多核苷酸、编码Ad E2A或E2A orf的多核苷酸、编码Ad E4或E4 orf 6的多核苷酸、编码VA RNA的多核苷酸以及编码AAV ITR和所关注蛋白的多核苷酸。

还描述了真核细胞，其中每个细胞可以包括(A)第一多核苷酸，所述第一多核苷酸包括(i)启动子，(ii)内含子，(iii)内部核糖体进入位点，(iv)编码AAV Cap蛋白的多核苷酸，以及(v)聚腺苷酸化位点；以及(B)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内含子，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点。(A)第一多核苷酸的所述(i)启动子、所述(ii)内含子、所述(iii)内部核糖体进入位点和所述(iv)编码AAV Cap蛋白的多核苷酸可以可操作地连接，并且其中(B)第二多核苷酸的所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述细胞可以具有整合到细胞基因组中的至少一个多核苷酸。所述细胞可以是CHO细胞、HEK 293细胞、BHK细胞、人羊膜细胞或其它真核细胞。所述细胞可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。所述细胞可以进一步包括：编码AAV Rep的多核苷酸、编码Ad E1A的多核苷酸、编码Ad E1B的多核苷酸、编码Ad E2A或E2A orf的多核苷酸、编码E4或E4 orf 6的多核苷酸、编码VA RNA的多核苷酸以及编码AAV ITR和所关注蛋白的多核苷酸。

另外，描述了真核细胞，其中每个细胞可以包括：(A)第一多核苷酸，所述第一多核苷酸包括(i)启动子，(ii)内含子，(iii)内部核糖体进入位点，(iv)编码AAV Cap蛋白的多核苷酸，以及(v)聚腺苷酸化位点；以及(B)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内部核糖体进入位点，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点。所述细胞可以具有(A)第一多核苷酸的可操作地连接的所述(i)启动子、所述(ii)内含子、所述(iii)内部核糖体进入位点和所述(iv)编码AAV Cap蛋白的多核苷酸；以及(B)第二多核苷酸的可操作地连接的所述(i)启动子、所述(ii)内部核糖体进入位点和所述(iii)编码AAV Cap蛋白的多核苷酸。至少一个多核苷酸可以被整合到细胞基因组中。所述细胞可以是CHO细胞、HEK 293细胞、BHK细胞、人羊膜细胞或其它真核细胞。所述细胞可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。所述细胞可以进一步包括：编码AAV Rep的多核苷酸、编码Ad E1A的多核苷酸、编码Ad E1B的多核苷酸、编码Ad E2A或E2A orf的多核苷酸、编码Ad E4或E4 orf 6的多核苷酸、编码VA RNA的多核苷酸以及编码AAV ITR和所关注蛋白的多核苷酸。

还描述了细胞培养物，所述细胞培养物在任何类型的培养基中包括上述细胞中的任一种，所述培养基包含生长培养基和维持培养基。另外，还描述了产生AAV蛋白包含Cap蛋白的方法，以及可以使得产生重组AAV的方法。

描述了在细胞培养物中产生腺相关病毒(AAV)Cap蛋白的方法，其中方法包括以下步骤：提供真核细胞，其中细胞包括多核苷酸，所述多核苷酸包括(i)启动子，(ii)内含子，(iii)第一内部核糖体进入位点，(iv)编码AAV Cap蛋白的第一多核苷酸，(v)第二内部核糖体进入位点，(vi)编码AAV Cap蛋白的第二多核苷酸，以及(vii)聚腺苷酸化位点；以及在培养基中培养所述细胞以允许所述细胞产生AAV Cap蛋白，其中所述多核苷酸允许产生AAVCap蛋白VP1、VP2和VP3。所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可以可操作地连接。所述多核苷酸可以被整合到细胞基因组中。所述细胞可以是CHO细胞、HEK 293细胞、BHK细胞、人羊膜细胞或其它真核细胞。所述细胞可以进一步包括操纵子。所述细胞可以进一步包括：编码AAV Rep的多核苷酸、编码Ad E1A的多核苷酸、编码Ad E1B的多核苷酸、编码Ad E2A或E2A orf的多核苷酸、编码Ad E4或E4orf 6的多核苷酸、编码VA RNA的多核苷酸以及编码AAV ITR和所关注蛋白的多核苷酸，其中所述细胞可以产生重组AAV。

还描述了在细胞培养物中产生腺相关病毒(AAV)Cap蛋白的方法，其中方法包括以下步骤：提供真核细胞，其中细胞包括(a)第一多核苷酸，所述第一多核苷酸包括(i)启动子，(ii)内含子，(iii)内部核糖体进入位点，(iv)编码AAV Cap蛋白的多核苷酸，以及(v)聚腺苷酸化位点；以及(b)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内含子，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点；以及在培养基中培养所述细胞以允许所述细胞产生AAV Cap蛋白，其中所述多核苷酸允许产生AAV Cap蛋白VP1、VP2和VP3。(a)第一多核苷酸的所述(i)启动子、所述(ii)内含子、所述(iii)内部核糖体进入位点和所述(iv)编码AAV Cap蛋白的多核苷酸可以可操作地连接，并且(b)第二多核苷酸的所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到细胞基因组中。所述细胞可以是CHO细胞、HEK 293细胞、BHK细胞、人羊膜细胞或其它真核细胞。所述细胞可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。所述细胞可以进一步包括：编码AAV Rep的多核苷酸、编码Ad E1A的多核苷酸、编码Ad E1B的多核苷酸、编码Ad E2A或E2A orf的多核苷酸、编码Ad E4或E4 orf 6的多核苷酸、编码VA RNA的多核苷酸以及编码AAV ITR和所关注蛋白的多核苷酸，其中所述细胞可以产生重组AAV。

还描述了在细胞培养物中产生腺相关病毒(AAV)Cap蛋白的方法，其中方法包括以下步骤：提供真核细胞，其中细胞包括(a)第一多核苷酸，所述第一多核苷酸包括(i)启动子，(ii)内含子，(iii)内部核糖体进入位点，(iv)编码AAV Cap蛋白的多核苷酸，以及(v)聚腺苷酸化位点；以及(b)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内部核糖体进入位点，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点；以及在培养基中培养所述细胞以允许所述细胞产生AAV Cap蛋白，其中所述多核苷酸允许产生AAV Cap蛋白VP1、VP2和VP3。(a)第一多核苷酸的所述(i)启动子、所述(ii)内含子、所述(iii)内部核糖体进入位点和所述(iv)编码AAV Cap蛋白的多核苷酸可以可操作地连接，并且(b)第二多核苷酸的所述(i)启动子、所述(ii)内部核糖体进入位点和所述(iii)编码AAV Cap蛋白的多核苷酸可以可操作地连接。所述多核苷酸可以被整合到细胞基因组中。所述细胞可以是CHO细胞、HEK 293细胞、BHK细胞、人羊膜细胞或其它真核细胞。所述细胞可以进一步包括操纵子。所述启动子可以是CMV启动子，并且所述操纵子可以是Tet操纵子。所述细胞可以进一步包括：编码AAV Rep的多核苷酸、编码Ad E1A的多核苷酸、编码Ad E1B的多核苷酸、编码AdE2A或E2A orf的多核苷酸、编码Ad E4或E4 orf 6的多核苷酸、编码VA RNA的多核苷酸以及编码AAV ITR和所关注蛋白的多核苷酸，其中所述细胞可以产生重组AAV。

附图说明

图1是包括启动子、内含子、内部核糖体进入位点(IRES)、编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点(poly A)的多核苷酸的示意图。

图2是包括启动子、内含子、两个内部核糖体进入位点、两个编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点的多核苷酸的示意图。

图3是包括启动子、内含子、编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点的多核苷酸的示意图。

图4是包括启动子、内部核糖体进入位点、编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点的多核苷酸的示意图。

图5是包括带有操纵子(Op)的启动子、内含子、内部核糖体进入位点、编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点的多核苷酸的示意图。

图6是包括带有操纵子(Op)的启动子、内含子、两个内部核糖体进入位点、两个编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点的多核苷酸的示意图。

图7是包括带有操纵子(Op)的启动子、内含子、编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点的多核苷酸的示意图。

图8是包括带有操纵子(Op)的启动子、内部核糖体进入位点、编码AAV Cap蛋白的多核苷酸以及聚腺苷酸化位点的多核苷酸的示意图。

具体实施方式

除非另外定义，否则本文所使用的所有技术术语和科学术语的含义与这些发明所属领域的普通技术人员通常所理解的含义相同。

定义

在数值和范围的上下文中，术语“约”是指近似于或接近于所叙述值或范围，使得本发明可以进行的值或范围，如具有所寻求的速率、量、程度、增加、减少或表达的程度、浓度或时间，如从本文所包含的教导中显而易见的。因此，此术语包含超出了简单地由系统误差引起的那些值的值。例如，“约”可以表示在大约+/-10％或者更多或更少(取决于执行能力)的范围内高于或低于所述值的值。

“内含子”是位于外显子之间的DNA区段。将内含子去除以形成成熟的信使RNA。优选的内含子是可以影响翻译起点的内含子，例如hCMV-IE内含子(人巨细胞病毒立即早期蛋白)和FMDV内含子(口蹄疫病毒)。据报道，珠蛋白基因内含子也被用于表达。

“核酸部分”包含单链或双链核苷酸序列的任何布置。核酸部分可以包含但不限于多核苷酸、启动子、增强子、操纵子、阻遏物、转录终止信号、核糖体进入位点和腺苷酸化信号。

“DNA盒”或“盒”是一种核酸部分，所述核酸部分包括至少一个启动子、至少一个开放阅读框和任选地聚腺苷酸化信号，例如SV40聚腺苷酸化信号。其它核酸部分，如操纵子，也是任选的。因此，DNA盒是包括两个或更多个较短多核苷酸的多核苷酸。

“可操作地连接”是指一个或多个核苷酸序列与一个或多个其它核苷酸序列具有功能关系。此类功能关系可以根据选定的设计直接或间接地控制、引起、调节、增强、促进、允许、减弱、抑制或阻止动作或活动。实例包含单链或双链核酸部分，并且可以包括布置在给定部分内的两个或更多个核苷酸序列，布置方式使得序列可以对其它序列施加至少一种功能效应。例如，与DNA多核苷酸序列的编码区可操作地连接的启动子可以促进编码区的转录。其它元件，如增强子、操纵子、阻遏物、转录终止信号、核糖体进入位点和聚腺苷酸化信号也可以与所关注的多核苷酸可操作地连接以控制其表达。实现可操作连接的布置和间隔可以通过本领域技术人员可获得的方法来确定，如使用蛋白质印迹和RT-PCR进行筛选。

“操纵子”指示以这样的方式引入多核苷酸序列中或其附近的DNA序列，所述方式使得多核苷酸序列可以通过能够与操纵子结合的分子的相互作用来调节，并且因此根据情况阻止或允许多核苷酸序列的转录。本领域技术人员将认识到操纵子必须位于足够靠近启动子，使得它能够控制或影响由启动子进行的转录，这可以被认为是一种可操作的连接。操纵子可以被置于启动子的下游或上游。这些包含但不限于大肠杆菌的Lex A基因的操纵子区，所述操纵子区与Lex A肽和乳糖以及45色氨酸操纵子结合，所述操纵子与由大肠杆菌的Lad和trpR基因编码的阻遏蛋白结合。噬菌体操纵子来自λPi和噬菌体P22 Mnt和Arc。优选的操纵子是Tet(四环素)操纵子和Arc操纵子。操纵子可以具有天然序列或突变序列。例如，Tet操纵子的突变序列公开于Wissmann等人,《核酸研究(Nucleic Acids Res.)》14:4253-66(1986)。

当描述序列时，各种语法形式的短语“同一性百分比”或“％相同”意指包含在相邻同源区显示所述同一性的同源序列，但是在计算同一性百分比时不考虑在所较序列中没有同源物的缺口、缺失或插入的存在。如本文所使用的，同源物之间的“同一性百分比”或“％相同”确定不包含同源物在比对中没有同源序列可比较的序列比较。因此，“同一性百分比”和“％相同”不包含对缺口、缺失和插入的罚分。

在核酸序列上下文中，“同源序列”是指与参考核酸序列基本上同源的序列。在一些实施例中，如果两个序列的对应核苷酸的至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多在相关的残基段上是相同的，则它们被视为基本上同源的。在一些实施例中，相关序列段为完全(即，全)序列。

“多核苷酸”包含共价接合的核苷酸序列，并且包含RNA和DNA。寡核苷酸被认为是较短的多核苷酸。基因是最终编码多肽的DNA多核苷酸(聚脱氧核糖核酸)，所述多肽由通常由DNA转录的RNA(聚核糖核酸)翻译而来。DNA多核苷酸也可以编码不翻译的RNA多核苷酸，而是用作RNA“产物”。多核苷酸的类型(即，DNA或RNA)从所述术语的使用上下文中显而易见。由其编码的多肽所指或鉴定的多核苷酸根据密码子简并性列出并涵盖所有合适的序列。多核苷酸(包含本文所公开的多核苷酸)在指明时包含同一性百分比序列和同源序列。

“多肽”或“肽”是指共价接合的氨基酸序列。多肽包含天然的、半合成的和合成的蛋白质和蛋白质片段。“多肽”和“蛋白质”可以互换使用。寡肽被认为是较短的多肽。

“所关注蛋白质”或“所关注多肽”可以具有任何氨基酸序列，并且包含任何蛋白质、多肽或肽以及其衍生物、组分、结构域、链和片段。包含但不限于病毒蛋白、细菌蛋白、真菌蛋白、植物蛋白和动物(包含人)蛋白。蛋白质类型可以包含但不限于抗体、双特异性抗体、多特异性抗体、抗体链(包含重链和轻链)、抗体片段、Fv片段、Fc片段、含Fc的蛋白质、Fc融合蛋白、受体Fc融合蛋白、受体、受体结构域、trap和微型trap蛋白、酶、因子、阻遏物、激活物、配体、报告蛋白、选择蛋白、蛋白激素、蛋白毒素、结构蛋白、储存蛋白、转运蛋白、神经递质和收缩蛋白。以上的衍生物、组分、链和片段也包含在内。序列可以是天然的、半合成的或合成的。所关注蛋白质和所关注多肽由“所关注基因”编码，也可以称为“所关注多核苷酸”。在多个基因(相同或不同)被整合的情况下，它们可以被称为“第一”、“第二”、“第三”、“第四”、“第五”、“第六”、“第七”、“第八”、“第九”、“第十”等，这从使用的上下文中是显而易见的。

“启动子”指示引起与其可操作地连接(即，当合适的信号存在而阻遏物不存在时，以允许所关注核苷酸序列转录的方式连接)的DNA序列转录的DNA序列。所关注多核苷酸的表达可以置于本领域已知的任何启动子或增强子元件的控制之下。真核启动子可以与TATA盒可操作地连接。TATA盒通常位于转录起始位点的上游。

可以使用的有用启动子包含但不限于SV40早期启动子区、SV40 E/L(早期晚期)启动子、包含在劳斯肉瘤病毒的3'长末端重复序列中的启动子、金属硫蛋白基因的调节序列、小鼠或人巨细胞病毒主要立即早期(CMV-MIE)启动子和其它CMV启动子，包含CMVmin启动子。植物表达载体包括胭脂碱合成酶启动子区、花椰菜花叶病毒35S RNA启动子和光合酶二磷酸核酮糖羧化酶启动子；来自酵母或其它真菌的启动子元件，如Gal 4启动子、ADC(乙醇脱氢酶)启动子、PGK(磷酸甘油激酶)启动子、碱性磷酸酶启动子和以下动物转录控制区，所述动物转录控制区表现出组织特异性并且已用于转基因动物：弹性蛋白酶I；胰岛素；免疫球蛋白；小鼠乳腺肿瘤病毒；白蛋白；C.-胎蛋白；C.1-抗胰蛋白酶；3-珠蛋白和肌球蛋白轻链-2。根据本发明，可以使用各种形式的CMV启动子。

最小启动子，如CMVmin启动子，可以是截短的启动子或核心启动子，并且优选用于受控表达系统。最小启动子和开发方法是众所周知的，并且公开于例如Saxena等人等人,《分子生物学方法(Methods Molec.Biol.)》1651:263-73(2017)；Ede等人,《ACS合成生物学(ACS Synth Biol.)》5:395-404(2016)；Brown等人,《生物技术与生物工程(BiotechBioeng.)》111:1638-47(2014)；Morita等人,《生物技术(Biotechniques)》0:1-5(2012)；Lagrange等人,《基因与发育(Genes Dev.)》12:34-44(1998)。本领域描述了许多CMVmin启动子。

如本文所使用的，“报告蛋白”是指能够产生可检测信号的任何蛋白质。报告蛋白通常发荧光或者催化比色或荧光反应，并且通常被称为“荧光蛋白”或“颜色蛋白”。然而，报告蛋白也可以是非酶和非荧光的，只要它可以被另一种蛋白或部分检测到，如用荧光配体检测到的细胞表面蛋白。报告蛋白也可以是通过与另一种发荧光或催化反应的蛋白质相互作用而具有功能的无活性蛋白。因此，如本领域技术人员所理解的，可以使用任何合适的报告蛋白。在一些方面，报告蛋白可以选自荧光蛋白、荧光素酶、碱性磷酸酶、β-半乳糖苷酶、β-内酰胺酶、二氢叶酸还原酶、泛素以及其变体。视情况而定，荧光蛋白可用于识别已成功插入和/或替代或未成功插入和/或替代的基因盒。流式细胞术和荧光激活的细胞分类适用于检测。荧光蛋白的实例在本领域是众所周知的，包含但不限于红色香菇珊瑚(DsRed)、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、氰基荧光蛋白(CFP)、增强型氰基荧光蛋白(eCFP)、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)和远红色荧光蛋白(例如，mKate、mKate2、mPlum、mRaspberry或E2-crimson)。参见例如美国专利第9,816,110号。报告蛋白由多核苷酸编码，并且在本文中被称为“报告基因”或“报告蛋白基因”。报告基因可以被认为是一种标志物。呈其各种语法形式的“颜色”或“荧光”也可以用来更具体地指报告蛋白或基因。

“阻遏蛋白”也被称为“阻遏物”，是一种可以与DNA结合以阻遏转录的蛋白质。阻遏物具有真核和原核来源。原核阻遏物是优选的。阻遏物家族的实例包含TetR、LysR、LacI、ArsR、IcIR、MerR、AsnC、MarR、DeoR、GntR和Crp家族。TetR家族中的阻遏蛋白包含：ArcR、ActII、AmeR、AmrR、ArpR、BpeR、EnvR、EthR、HemR、HydR、IfeR、LanK、LfrR、LmrA、MtrR、Pip、PqrA、QacR、RifQ、RmrR、SimReg2、SmeT、SrpR、TcmR、TetR、TtgR、TrgW、UrdK、VarR YdeS、ArpA.、BarA、Aur1B、CalR1、CprB、FarA、JadR*、JadR2、MphB、NonG、PhlF、TylQ、VanT、TarA、TylP、BM1P1、Bm3R1、ButR、CampR、CamR、DhaR、KstR、LexA样、AcnR、PaaRR、PsbI、Th1R、UidR、YDH1、BetI、McbR、MphR、PhaD、Q9ZF45、TtK、Yhgd、YixD、CasR、IcaR、LitR、LuxR、LuxT、OpaR、Orf2、SmcR、HapR、Ef0113、HlyIIR、BarB、ScbR、MmfR、AmtR、PsrA和YjdC蛋白。参见Ramos等人,《微生物学和分子生物学评论(Microbiol.Mol.Biol.Rev.)》,69:326-56(2005)。其它阻遏物包含PurR、LacR、MetJ和PadR，阻遏蛋白由被称为“阻遏基因”或“阻遏蛋白基因”的基因编码。

“可选择”或“选择”标志物蛋白包含赋予某些性状的蛋白质，包含但不限于药物抗性或其它选择优势。选择标志物可以赋予接受可选择标志物基因的细胞对某种毒素、药物、抗生素或其它化合物的抗性，并且允许细胞在存在毒素、药物、抗生素或其它化合物的情况下产生蛋白质和繁殖，并且通常被称为“阳性可选择标志物”。抗生素抗性标志物的合适实例包含但不限于赋予对各种抗生素的抗性的蛋白质，所述抗生素如卡那霉素、壮观霉素、新霉素、庆大霉素(G418)、氨苄青霉素、四环素、氯霉素、嘌呤霉素、潮霉素、吉欧霉素和/或杀稻瘟菌素。还有其它可选择标志物，通常被称为“阴性可选择标志物”，其导致细胞停止繁殖、停止蛋白质产生和/或在存在阴性可选择标志物蛋白的情况下对细胞是致命的。胸苷激酶和某些融合蛋白可以用作阴性可选择标志物，包含但不限于GyrB-PKR。参见White等人,《生物技术(Biotechniques)》,50:303-309(2011年5月)。可选择标志物蛋白和对应的基因可以一般地被称为第一(1)、第二(2)、第三(3)、第四(4)、第五(5)、第六(6)、第七(7)、第八(8)、第九(9)、第十(10)等，这从使用上下文中是显而易见的。

本文所述的所有数值限制和范围包含与范围或限制的数字有关或在所述数字之间的所有数字或值。本文所描述的范围和限制明确地命名并列出了范围或限制中定义和包含的所有整数、小数和分数值。

描述

本发明提供了包括AAV和任选地Ad多核苷酸序列的细胞，以允许产生包括所关注多核苷酸的重组AAV，所述所关注多核苷酸如编码所关注多肽的基因或其它序列。AAV和Ad多核苷酸提供了AAV生产所需的必要结构和辅助产物。

例如，可以使用重组酶介导的盒交换(RMCE)整合AAV多核苷酸和任选地Ad多核苷酸。在细胞整合的上下文中，“稳定的”是指引入到细胞的基因组的所关注多核苷酸，如基因，并且可以传递给细胞的后续世代，并且由此可以提供在一段时间内遗传上同质的细胞系。

本领域技术人员可以容易地选择适于与本发明一起使用的细胞。在一些实施例中，细胞系是真核细胞系，如酵母细胞系、昆虫细胞系(例如，Sf9和Sf21细胞)或哺乳动物细胞系。优选的哺乳动物细胞包含灵长类动物细胞(包含人)、犬细胞和啮齿动物细胞。细胞可以是原代细胞或永生化细胞。合适的细胞可以选自Vero细胞、COS细胞、HEK 293细胞、HeLa细胞、CHO细胞、BHK细胞、MDCK细胞、羊膜细胞(人)、胚胎细胞、用病毒基因例如AD5 E1转染的细胞系，包含但不限于用腺病毒基因转染的永生化人视网膜细胞，例如PER.C6细胞或NSO细胞。在一些实施例中，细胞是中国仓鼠卵巢(CHO)细胞系。CHO细胞的一些实例包含但不限于CHO-ori、CHO-K1、CHO-s、CHO-DHB11、CHO-DXB11、CHO-K1SV以及其突变体和变体。在其它实施例中，所述细胞是HEK293细胞。HEK293细胞的一些实例包含但不限于HEK293、HEK293A、HEK293E、HEK293F、HEK293FT、HEK293FTM、HEK293H、HEK293MSR、HEK293S、HEK293SG、HEK293SGGD、HEK293T以及其突变体和变体。

对于仓鼠细胞如CHO和BHK，整合可以通过美国专利第7,771,997号(“稳定位点1”)和第9,816,110号(“稳定位点2”)中公开的发明来完成，所述美国专利特此通过引用并入，包含序列信息。再生元公司(Regeneron)提供一套被称为的商品和服务。在US2019/0233544 A1中公开了在稳定位点1和稳定位点2中具有整合序列的CHO细胞，所述文献通过特此引用并入，包含序列信息。根据本文所描述和描绘的发明，可以使用这些专利和实例14和15中示出的序列。另外，根据本发明可以使用仓鼠细胞中的AAVS1样区和COSMC基因座。

在采用人细胞的情况下，可以整合到腺相关病毒整合位点1(AAVS1)中。参见Lou等人,《人类基因疗法方法(Human Gene Therapy Methods)》,28:124-38(2017)；Liu等人,《BMC研究笔记(BMC Research Note)》,7:626(2014)。据报告，AAVS1位于19号染色体上。也可以使用人细胞中的其它整合位点，如CCR5和hROSA26。

细胞基因组的修饰可以用已知的方法进行，如Cre/Lox、Flp/Frt、转录激活因子样效应物核酸酶(TALEN)、TAL效应物结构域融合蛋白、锌指核酸酶(ZFN)、ZFN二聚体或RNA引导的DNA核酸内切酶系统，如CRISPR/Cas9。参见美国专利第9,816,110号第17-18栏。也可以在人、小鼠和大鼠细胞中使用Bxb1整合酶进行整合。Russell等人,《生物技术》40:460-64(2006)。

为了最大化稳定性和效率并促进本发明的整合和控制，根据美国序列号63/256,675的教导，可以在多种细胞类型和细胞系中使用基因组安全港等创建稳定整合位点(SIS)。提供由美国序列号63/256,675的方法产生的方法和细胞的描述(包含实例)和附图特此通过引用并入。

为了产生重组AAV，本发明提供了AAV Cap的整合以产生大小变体VP1(约90kDa)、VP2(约72kDa)和VP3(约60kDa)。这些变体在其N末端不同。

通常，重组AAV将含有侧接AAV ITR(反向末端重复序列)的所关注基因(GOI)。为了产生重组AAV，通常采用七种另外的多核苷酸，即腺病毒E1A、E1B、E4、E2A、VA RNA以及AAVRep和Cap来产生。

图1-4描绘了允许Cap蛋白的组成型表达的构建体。图5-8描述了通过在启动子下游包含操纵子来允许Cap蛋白的受控表达的构建体。优选的操纵子是四环素操纵子(TetO)，所述TetO与四环素阻遏物(TetR)结合。四环素、多西环素以及其衍生物可以与TetR结合，使得TetR不再与TetO结合，并且因此允许转录。CMV启动子和TetO的实例在实例13中示出。

本发明通过以下实例进一步描述，所述实例说明了本发明的许多方面，但不以任何方式限制本发明。

实例1-CHO细胞

根据图1-8的一个或多个含Cap多核苷酸被稳定地插入到CHO基因组中。优选的启动子是hCMV-IE启动子，并且任选地，tet操纵子可以与启动子可操作地连接以进行表达控制。任选地，内含子可以位于启动子的3'端。优选的内含子是hCMV-IE内含子。AAV Cap、Rep和ITR可以从任何AAV血清型获得。优选的AAV血清型是AAV2和AAV5。实例11中示出了AAV多核苷酸序列。实例13中示出了启动子、操纵子、IRES和内含子序列。

侧接所关注基因的AAV ITR、AAV Rep以及Ad E1A、E1B、E2A(或E2A部分序列(E2Aorf))、E4(或E4部分序列(E4 orf 6))和VA RNA可以随机整合、位点特异性整合或保留在质粒上。腺病毒多核苷酸序列是可获得的，并且在实例12中例示。腺病毒(Ad)蛋白质和多核苷酸可以选自任何血清型。

实例2-HEK 293细胞

根据图1-8的一个或多个含Cap多核苷酸被稳定地插入到HEK 293基因组中。优选的启动子是hCMV-IE启动子，并且任选地，tet操纵子可以与启动子可操作地连接以进行表达控制。任选地，内含子可以位于启动子的3'端。优选的内含子是hCMV-IE内含子。AAV Cap、Rep和ITR可以从任何AAV血清型获得。AAV2和AAV5的优选AAV血清型。实例11中示出了AAV多核苷酸序列。

AAV ITR和Rep以及Ad E1A、E1B、E2A(或E2A部分序列(E2A orf))、E4(或E4部分序列(E4 orf 6))和VA RNA可以随机整合、位点特异性整合或保留在质粒上。腺病毒多核苷酸序列是可获得的，并且在实例12中例示。

实例3-BHK细胞

BHK细胞是来自幼仓鼠肾的成纤维细胞。存在可以在悬浮液中繁殖的贴壁BHK系和BHK系。Wentz和Schügerl,《酶与微生物技术(Enzyme Microbial Tech.)》14:68-75(1992)。

根据图1-8的一个或多个含Cap多核苷酸被稳定地插入到BHK基因组中。优选的启动子是hCMV-IE启动子，并且任选地，tet操纵子可以与启动子可操作地连接以进行表达控制。任选地，内含子可以位于启动子的3'端。优选的内含子是hCMV-IE内含子。AAV Cap、Rep和ITR可以从任何AAV血清型获得。AAV2和AAV5的优选AAV血清型。实例11中示出了AAV多核苷酸序列。

实例4-内含子IRES CAP

在图1(组成型)和图5(可控型)中描绘了此构建体的实施例。在细胞中，两个实施例都可以主要产生VP2和VP3，其中产生的VP3比VP2多。在使用Cap5的CHO细胞的实验中，通过对蛋白质印迹进行光密度分析，观察到VP2与VP3的平均比率为约1:5.7。也可以产生一些VP1，但观察到的水平通常低于所产生的VP2的水平的1％。因此，此构建体可以与主要产生VP1的构建体一起使用。参见实例6和7。产生比率可以基于实验条件和分析技术而变化。优选的IRES是脑心肌炎病毒(被称为“EMCV”或“ECMV”)IRES。

实例5-内含子IRES CAP IRES CAP

在图2(组成型)和图6(可控型)中描绘了此构建体的实施例。此构建体含有两个IRES多核苷酸和两个Cap多核苷酸。在细胞中，两个实施例都可以产生VP1、VP2和VP3。VP3的产量可以大于VP1得产量和VP2的产量。VP2的产量可以大于VP1的产量。在使用含有Cap5的CHO细胞的实验中，通过对蛋白质印迹进行光密度分析，观察到VP1与VP2与VP3的平均比率为约1:2:9.3。产生比率可以基于实验条件和分析技术而变化。优选的IRES是脑心肌炎病毒(被称为“EMCV”或“ECMV”)IRES。

实例6-内含子CAP

在图3(组成型)和图7(可控型)中描绘了此构建体的实施例。此构建体含有内含子和Cap多核苷酸，并且主要产生VP1，并且可以与实例4的构建体一起使用以及产生VP1、VP2和VP3。

实例7-IRES CAP

在图4(组成型)和图8(可控型)中描绘了此构建体的实施例。此构建体含有内含子和Cap多核苷酸，并且主要产生VP1，并且可以与实例4的构建体一起使用以及产生VP1、VP2和VP3。优选的IRES是脑心肌炎病毒(被称为“EMCV”或“ECMV”)IRES。

实例8-包括Cap构建体的CHO细胞

实例1的CHO细胞可以包括实例5的内含子IRES CAP IRES CAP多核苷酸(图2或6)。在实验中，通过对蛋白质印迹进行光密度测定分析，含有Cap5的CHO细胞以观察到的约1:2:9.3的比率表达VP1:VP2:VP3。

作为替代方案，实例1的CHO细胞可以包括实例4(图1或5)和实例6(图3或7)或6(图4和8)的CAP多核苷酸。此类细胞将表达VP1、VP2和VP3，尽管可能以与根据实例5的比率不同的比率。

实例9-包括Cap构建体的HEK 293细胞

实例2的HEK 293细胞可以包括实例5的内含子IRES CAP IRES CAP多核苷酸(图2或6)。

作为替代方案，实例2的HEK 293细胞可以包括实例4(图1或5)和实例6(图3或7)或7(图4和8)的CAP多核苷酸。此类细胞将表达VP1、VP2和VP3，尽管可能以与根据实例5的比率不同的比率。

实例10-包括Cap构建体的BHK细胞

实例3的BHK细胞可以包括实例5的内含子IRES CAP IRES CAP多核苷酸(图2或6)。

作为替代方案，实例3的BHK细胞可以包括实例4(图1或5)和实例6(图3或7)或7(图4和8)的CAP多核苷酸。此类细胞将表达VP1、VP2和VP3，尽管可能以与根据实例5的比率不同的比率。

实例11-AAV多核苷酸序列

AAV Rep序列、Cap序列和ITR序列是本领域已知的。本发明适于所有AAV血清型。不同AAV血清型的AAV序列如下文所示。这些序列中的许多序列可从美国国家生物技术信息中心(NCBI)获得。

AAV-1

全基因组：NC_002077

CapVP1：(SEQ ID NO:1)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACTTGAAACCTGGAGCCCCGAAGCCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGGCGCTAAGACGGCTCCTGGAAAGAAACGTCCGGTAGAGCAGTCGCCACAAGAGCCAGACTCCTCCTCGGGCATCGGCAAGACAGGCCAGCAGCCCGCTAAAAAGAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTCCCCGATCCACAACCTCTCGGAGAACCTCCAGCAACCCCCGCTGCTGTGGGACCTACTACAATGGCTTCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAATGCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGCACCTGGGCCTTGCCCACCTACAATAACCACCTCTACAAGCAAATCTCCAGTGCTTCAACGGGGGCCAGCAACGACAACCACTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAGCGACTCATCAACAACAATTGGGGATTCCGGCCCAAGAGACTCAACTTCAAACTCTTCAACATCCAAGTCAAGGAGGTCACGACGAATGATGGCGTCACAACCATCGCTAATAACCTTACCAGCACGGTTCAAGTCTTCTCGGACTCGGAGTACCAGCTTCCGTACGTCCTCGGCTCTGCGCACCAGGGCTGCCTCCCTCCGTTCCCGGCGGACGTGTTCATGATTCCGCAATACGGCTACCTGACGCTCAACAATGGCAGCCAAGCCGTGGGACGTTCATCCTTTTACTGCCTGGAATATTTCCCTTCTCAGATGCTGAGAACGGGCAACAACTTTACCTTCAGCTACACCTTTGAGGAAGTGCCTTTCCACAGCAGCTACGCGCACAGCCAGAGCCTGGACCGGCTGATGAATCCTCTCATCGACCAATACCTGTATTACCTGAACAGAACTCAAAATCAGTCCGGAAGTGCCCAAAACAAGGACTTGCTGTTTAGCCGTGGGTCTCCAGCTGGCATGTCTGTTCAGCCCAAAAACTGGCTACCTGGACCCTGTTATCGGCAGCAGCGCGTTTCTAAAACAAAAACAGACAACAACAACAGCAATTTTACCTGGACTGGTGCTTCAAAATATAACCTCAATGGGCGTGAATCCATCATCAACCCTGGCACTGCTATGGCCTCACACAAAGACGACGAAGACAAGTTCTTTCCCATGAGCGGTGTCATGATTTTTGGAAAAGAGAGCGCCGGAGCTTCAAACACTGCATTGGACAATGTCATGATTACAGACGAAGAGGAAATTAAAGCCACTAACCCTGTGGCCACCGAAAGATTTGGGACCGTGGCAGTCAATTTCCAGAGCAGCAGCACAGACCCTGCGACCGGAGATGTGCATGCTATGGGAGCATTACCTGGCATGGTGTGGCAAGATAGAGACGTGTACCTGCAGGGTCCCATTTGGGCCAAAATTCCTCACACAGATGGACACTTTCACCCGTCTCCTCTTATGGGCGGCTTTGGACTCAAGAACCCGCCTCCTCAGATCCTCATCAAAAACACGCCTGTTCCTGCGAATCCTCCGGCGGAGTTTTCAGCTACAAAGTTTGCTTCATTCATCACCCAATACTCCACAGGACAAGTGAGTGTGGAAATTGAATGGGAGCTGCAGAAAGAAAACAGCAAGCGCTGGAATCCCGAAGTGCAGTACACATCCAATTATGCAAAATCTGCCAACGTTGATTTTACTGTGGACAACAATGGACTTTATACTGAGCCTCGCCCCATTGGCACCCGTTACCTTACCCGTCCCCTGTAA

Rep78：(SEQ ID NO:2)

ATGCCGGGCTTCTACGAGATCGTGATCAAGGTGCCGAGCGACCTGGACGAGCACCTGCCGGGCATTTCTGACTCGTTTGTGAGCTGGGTGGCCGAGAAGGAATGGGAGCTGCCCCCGGATTCTGACATGGATCTGAATCTGATTGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGACTTCCTGGTCCAATGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTCTTTGTTCAGTTCGAGAAGGGCGAGTCCTACTTCCACCTCCATATTCTGGTGGAGACCACGGGGGTCAAATCCATGGTGCTGGGCCGCTTCCTGAGTCAGATTAGGGACAAGCTGGTGCAGACCATCTACCGCGGGATCGAGCCGACCCTGCCCAACTGGTTCGCGGTGACCAAGACGCGTAATGGCGCCGGAGGGGGGAACAAGGTGGTGGACGAGTGCTACATCCCCAACTACCTCCTGCCCAAGACTCAGCCCGAGCTGCAGTGGGCGTGGACTAACATGGAGGAGTATATAAGCGCCTGTTTGAACCTGGCCGAGCGCAAACGGCTCGTGGCGCAGCACCTGACCCACGTCAGCCAGACCCAGGAGCAGAACAAGGAGAATCTGAACCCCAATTCTGACGCGCCTGTCATCCGGTCAAAAACCTCCGCGCGCTACATGGAGCTGGTCGGGTGGCTGGTGGACCGGGGCATCACCTCCGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCCGCTTCCAACTCGCGGTCCCAGATCAAGGCCGCTCTGGACAATGCCGGCAAGATCATGGCGCTGACCAAATCCGCGCCCGACTACCTGGTAGGCCCCGCTCCGCCCGCGGACATTAAAACCAACCGCATCTACCGCATCCTGGAGCTGAACGGCTACGAACCTGCCTACGCCGGCTCCGTCTTTCTCGGCTGGGCCCAGAAAAGGTTCGGGAAGCGCAACACCATCTGGCTGTTTGGGCCGGCCACCACGGGCAAGACCAACATCGCGGAAGCCATCGCCCACGCCGTGCCCTTCTACGGCTGCGTCAACTGGACCAATGAGAACTTTCCCTTCAATGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACGGCCAAGGTCGTGGAGTCCGCCAAGGCCATTCTCGGCGGCAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCGTCCGCCCAGATCGACCCCACCCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACAGCACCACCTTCGAGCACCAGCAGCCGTTGCAGGACCGGATGTTCAAATTTGAACTCACCCGCCGTCTGGAGCATGACTTTGGCAAGGTGACAAAGCAGGAAGTCAAAGAGTTCTTCCGCTGGGCGCAGGATCACGTGACCGAGGTGGCGCATGAGTTCTACGTCAGAAAGGGTGGAGCCAACAAAAGACCCGCCCCCGATGACGCGGATAAAAGCGAGCCCAAGCGGGCCTGCCCCTCAGTCGCGGATCCATCGACGTCAGACGCGGAAGGAGCTCCGGTGGACTTTGCCGACAGGTACCAAAACAAATGTTCTCGTCACGCGGGCATGCTTCAGATGCTGTTTCCCTGCAAGACATGCGAGAGAATGAATCAGAATTTCAACATTTGCTTCACGCACGGGACGAGAGACTGTTCAGAGTGCTTCCCCGGCGTGTCAGAATCTCAACCGGTCGTCAGAAAGAGGACGTATCGGAAACTCTGTGCCATTCATCATCTGCTGGGGCGGGCTCCCGAGATTGCTTGCTCGGCCTGCGATCTGGTCAACGTGGACCTGGATGACTGTGTTTCTGAGCAATAA

AAV-2

全基因组：NC_001401

Rep78：(SEQ ID NO:3)

ATGCCGGGGTTTTACGAGATTGTGATTAAGGTCCCCAGCGACCTTGACGAGCATCTGCCCGGCATTTCTGACAGCTTTGTGAACTGGGTGGCCGAGAAGGAATGGGAGTTGCCGCCAGATTCTGACATGGATCTGAATCTGATTGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGACTTTCTGACGGAATGGCGCCGTGTGAGTAAGGCCCCGGAGGCCCTTTTCTTTGTGCAATTTGAGAAGGGAGAGAGCTACTTCCACATGCACGTGCTCGTGGAAACCACCGGGGTGAAATCCATGGTTTTGGGACGTTTCCTGAGTCAGATTCGCGAAAAACTGATTCAGAGAATTTACCGCGGGATCGAGCCGACTTTGCCAAACTGGTTCGCGGTCACAAAGACCAGAAATGGCGCCGGAGGCGGGAACAAGGTGGTGGATGAGTGCTACATCCCCAATTACTTGCTCCCCAAAACCCAGCCTGAGCTCCAGTGGGCGTGGACTAATATGGAACAGTATTTAAGCGCCTGTTTGAATCTCACGGAGCGTAAACGGTTGGTGGCGCAGCATCTGACGCACGTGTCGCAGACGCAGGAGCAGAACAAAGAGAATCAGAATCCCAATTCTGATGCGCCGGTGATCAGATCAAAAACTTCAGCCAGGTACATGGAGCTGGTCGGGTGGCTCGTGGACAAGGGGATTACCTCGGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCATACATCTCCTTCAATGCGGCCTCCAACTCGCGGTCCCAAATCAAGGCTGCCTTGGACAATGCGGGAAAGATTATGAGCCTGACTAAAACCGCCCCCGACTACCTGGTGGGCCAGCAGCCCGTGGAGGACATTTCCAGCAATCGGATTTATAAAATTTTGGAACTAAACGGGTACGATCCCCAATATGCGGCTTCCGTCTTTCTGGGATGGGCCACGAAAAAGTTCGGCAAGAGGAACACCATCTGGCTGTTTGGGCCTGCAACTACCGGGAAGACCAACATCGCGGAGGCCATAGCCCACACTGTGCCCTTCTACGGGTGCGTAAACTGGACCAATGAGAACTTTCCCTTCAACGACTGTGTCGACAAGATGGTGATCTGGTGGGAGGAGGGGAAGATGACCGCCAAGGTCGTGGAGTCGGCCAAAGCCATTCTCGGAGGAAGCAAGGTGCGCGTGGACCAGAAATGCAAGTCCTCGGCCCAGATAGACCCGACTCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACTCAACGACCTTCGAACACCAGCAGCCGTTGCAAGACCGGATGTTCAAATTTGAACTCACCCGCCGTCTGGATCATGACTTTGGGAAGGTCACCAAGCAGGAAGTCAAAGACTTTTTCCGGTGGGCAAAGGATCACGTGGTTGAGGTGGAGCATGAATTCTACGTCAAAAAGGGTGGAGCCAAGAAAAGACCCGCCCCCAGTGACGCAGATATAAGTGAGCCCAAACGGGTGCGCGAGTCAGTTGCGCAGCCATCGACGTCAGACGCGGAAGCTTCGATCAACTACGCAGACAGGTACCAAAACAAATGTTCTCGTCACGTGGGCATGAATCTGATGCTGTTTCCCTGCAGACAATGCGAGAGAATGAATCAGAATTCAAATATCTGCTTCACTCACGGACAGAAAGACTGTTTAGAGTGCTTTCCCGTGTCAGAATCTCAACCCGTTTCTGTCGTCAAAAAGGCGTATCAGAAACTGTGCTACATTCATCATATCATGGGAAAGGTGCCAGACGCTTGCACTGCCTGCGATCTGGTCAATGTGGATTTGGATGACTGCATCTTTGAACAATAA

Rep52：(SEQ ID NO:4)

ATGGAGCTGGTCGGGTGGCTCGTGGACAAGGGGATTACCTCGGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCATACATCTCCTTCAATGCGGCCTCCAACTCGCGGTCCCAAATCAAGGCTGCCTTGGACAATGCGGGAAAGATTATGAGCCTGACTAAAACCGCCCCCGACTACCTGGTGGGCCAGCAGCCCGTGGAGGACATTTCCAGCAATCGGATTTATAAAATTTTGGAACTAAACGGGTACGATCCCCAATATGCGGCTTCCGTCTTTCTGGGATGGGCCACGAAAAAGTTCGGCAAGAGGAACACCATCTGGCTGTTTGGGCCTGCAACTACCGGGAAGACCAACATCGCGGAGGCCATAGCCCACACTGTGCCCTTCTACGGGTGCGTAAACTGGACCAATGAGAACTTTCCCTTCAACGACTGTGTCGACAAGATGGTGATCTGGTGGGAGGAGGGGAAGATGACCGCCAAGGTCGTGGAGTCGGCCAAAGCCATTCTCGGAGGAAGCAAGGTGCGCGTGGACCAGAAATGCAAGTCCTCGGCCCAGATAGACCCGACTCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACTCAACGACCTTCGAACACCAGCAGCCGTTGCAAGACCGGATGTTCAAATTTGAACTCACCCGCCGTCTGGATCATGACTTTGGGAAGGTCACCAAGCAGGAAGTCAAAGACTTTTTCCGGTGGGCAAAGGATCACGTGGTTGAGGTGGAGCATGAATTCTACGTCAAAAAGGGTGGAGCCAAGAAAAGACCCGCCCCCAGTGACGCAGATATAAGTGAGCCCAAACGGGTGCGCGAGTCAGTTGCGCAGCCATCGACGTCAGACGCGGAAGCTTCGATCAACTACGCAGACAGGTACCAAAACAAATGTTCTCGTCACGTGGGCATGAATCTGATGCTGTTTCCCTGCAGACAATGCGAGAGAATGAATCAGAATTCAAATATCTGCTTCACTCACGGACAGAAAGACTGTTTAGAGTGCTTTCCCGTGTCAGAATCTCAACCCGTTTCTGTCGTCAAAAAGGCGTATCAGAAACTGTGCTACATTCATCATATCATGGGAAAGGTGCCAGACGCTTGCACTGCCTGCGATCTGGTCAATGTGGATTTGGATGACTGCATCTTTGAACAATAA

CapVP1：(SEQ ID NO:5)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACACTCTCTCTGAAGGAATAAGACAGTGGTGGAAGCTCAAACCTGGCCCACCACCACCAAAGCCCGCAGAGCGGCATAAGGACGACAGCAGGGGTCTTGTGCTTCCTGGGTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGAGAGCCGGTCAACGAGGCAGACGCCGCGGCCCTCGAGCACGACAAAGCCTACGACCGGCAGCTCGACAGCGGAGACAACCCGTACCTCAAGTACAACCACGCCGACGCGGAGTTTCAGGAGCGCCTTAAAGAAGATACGTCTTTTGGGGGCAACCTCGGACGAGCAGTCTTCCAGGCGAAAAAGAGGGTTCTTGAACCTCTGGGCCTGGTTGAGGAACCTGTTAAGACGGCTCCGGGAAAAAAGAGGCCGGTAGAGCACTCTCCTGTGGAGCCAGACTCCTCCTCGGGAACCGGAAAGGCGGGCCAGCAGCCTGCAAGAAAAAGATTGAATTTTGGTCAGACTGGAGACGCAGACTCAGTACCTGACCCCCAGCCTCTCGGACAGCCACCAGCAGCCCCCTCTGGTCTGGGAACTAATACGATGGCTACAGGCAGTGGCGCACCAATGGCAGACAATAACGAGGGCGCCGACGGAGTGGGTAATTCCTCGGGAAATTGGCATTGCGATTCCACATGGATGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAACAAATTTCCAGCCAATCAGGAGCCTCGAACGACAATCACTACTTTGGCTACAGCACCCCTTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCGGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAAGGATGCCTCCCGCCGTTCCCAGCAGACGTCTTCATGGTGCCACAGTATGGATACCTCACCCTGAACAACGGGAGTCAGGCAGTAGGACGCTCTTCATTTTACTGCCTGGAGTACTTTCCTTCTCAGATGCTGCGTACCGGAAACAACTTTACCTTCAGCTACACTTTTGAGGACGTTCCTTTCCACAGCAGCTACGCTCACAGCCAGAGTCTGGACCGTCTCATGAATCCTCTCATCGACCAGTACCTGTATTACTTGAGCAGAACAAACACTCCAAGTGGAACCACCACGCAGTCAAGGCTTCAGTTTTCTCAGGCCGGAGCGAGTGACATTCGGGACCAGTCTAGGAACTGGCTTCCTGGACCCTGTTACCGCCAGCAGCGAGTATCAAAGACATCTGCGGATAACAACAACAGTGAATACTCGTGGACTGGAGCTACCAAGTACCACCTCAATGGCAGAGACTCTCTGGTGAATCCGGGCCCGGCCATGGCAAGCCACAAGGACGATGAAGAAAAGTTTTTTCCTCAGAGCGGGGTTCTCATCTTTGGGAAGCAAGGCTCAGAGAAAACAAATGTGGACATTGAAAAGGTCATGATTACAGACGAAGAGGAAATCAGGACAACCAATCCCGTGGCTACGGAGCAGTATGGTTCTGTATCTACCAACCTCCAGAGAGGCAACAGACAAGCAGCTACCGCAGATGTCAACACACAAGGCGTTCTTCCAGGCATGGTCTGGCAGGACAGAGATGTGTACCTTCAGGGGCCCATCTGGGCAAAGATTCCACACACGGACGGACATTTTCACCCCTCTCCCCTCATGGGTGGATTCGGACTTAAACACCCTCCTCCACAGATTCTCATCAAGAACACCCCGGTACCTGCGAATCCTTCGACCACCTTCAGTGCGGCAAAGTTTGCTTCCTTCATCACACAGTACTCCACGGGACAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAACGCTGGAATCCCGAAATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTGGACACTAATGGCGTGTATTCAGAGCCTCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA

CapVP2：(SEQ ID NO:6)

ACGGCTCCGGGAAAAAAGAGGCCGGTAGAGCACTCTCCTGTGGAGCCAGACTCCTCCTCGGGAACCGGAAAGGCGGGCCAGCAGCCTGCAAGAAAAAGATTGAATTTTGGTCAGACTGGAGACGCAGACTCAGTACCTGACCCCCAGCCTCTCGGACAGCCACCAGCAGCCCCCTCTGGTCTGGGAACTAATACGATGGCTACAGGCAGTGGCGCACCAATGGCAGACAATAACGAGGGCGCCGACGGAGTGGGTAATTCCTCGGGAAATTGGCATTGCGATTCCACATGGATGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAACAAATTTCCAGCCAATCAGGAGCCTCGAACGACAATCACTACTTTGGCTACAGCACCCCTTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCGGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAAGGATGCCTCCCGCCGTTCCCAGCAGACGTCTTCATGGTGCCACAGTATGGATACCTCACCCTGAACAACGGGAGTCAGGCAGTAGGACGCTCTTCATTTTACTGCCTGGAGTACTTTCCTTCTCAGATGCTGCGTACCGGAAACAACTTTACCTTCAGCTACACTTTTGAGGACGTTCCTTTCCACAGCAGCTACGCTCACAGCCAGAGTCTGGACCGTCTCATGAATCCTCTCATCGACCAGTACCTGTATTACTTGAGCAGAACAAACACTCCAAGTGGAACCACCACGCAGTCAAGGCTTCAGTTTTCTCAGGCCGGAGCGAGTGACATTCGGGACCAGTCTAGGAACTGGCTTCCTGGACCCTGTTACCGCCAGCAGCGAGTATCAAAGACATCTGCGGATAACAACAACAGTGAATACTCGTGGACTGGAGCTACCAAGTACCACCTCAATGGCAGAGACTCTCTGGTGAATCCGGGCCCGGCCATGGCAAGCCACAAGGACGATGAAGAAAAGTTTTTTCCTCAGAGCGGGGTTCTCATCTTTGGGAAGCAAGGCTCAGAGAAAACAAATGTGGACATTGAAAAGGTCATGATTACAGACGAAGAGGAAATCAGGACAACCAATCCCGTGGCTACGGAGCAGTATGGTTCTGTATCTACCAACCTCCAGAGAGGCAACAGACAAGCAGCTACCGCAGATGTCAACACACAAGGCGTTCTTCCAGGCATGGTCTGGCAGGACAGAGATGTGTACCTTCAGGGGCCCATCTGGGCAAAGATTCCACACACGGACGGACATTTTCACCCCTCTCCCCTCATGGGTGGATTCGGACTTAAACACCCTCCTCCACAGATTCTCATCAAGAACACCCCGGTACCTGCGAATCCTTCGACCACCTTCAGTGCGGCAAAGTTTGCTTCCTTCATCACACAGTACTCCACGGGACAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAACGCTGGAATCCCGAAATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTGGACACTAATGGCGTGTATTCAGAGCCTCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA

CapVP3：(SEQ ID NO:7)

ATGGCTACAGGCAGTGGCGCACCAATGGCAGACAATAACGAGGGCGCCGACGGAGTGGGTAATTCCTCGGGAAATTGGCATTGCGATTCCACATGGATGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAACAAATTTCCAGCCAATCAGGAGCCTCGAACGACAATCACTACTTTGGCTACAGCACCCCTTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCGGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAAGGATGCCTCCCGCCGTTCCCAGCAGACGTCTTCATGGTGCCACAGTATGGATACCTCACCCTGAACAACGGGAGTCAGGCAGTAGGACGCTCTTCATTTTACTGCCTGGAGTACTTTCCTTCTCAGATGCTGCGTACCGGAAACAACTTTACCTTCAGCTACACTTTTGAGGACGTTCCTTTCCACAGCAGCTACGCTCACAGCCAGAGTCTGGACCGTCTCATGAATCCTCTCATCGACCAGTACCTGTATTACTTGAGCAGAACAAACACTCCAAGTGGAACCACCACGCAGTCAAGGCTTCAGTTTTCTCAGGCCGGAGCGAGTGACATTCGGGACCAGTCTAGGAACTGGCTTCCTGGACCCTGTTACCGCCAGCAGCGAGTATCAAAGACATCTGCGGATAACAACAACAGTGAATACTCGTGGACTGGAGCTACCAAGTACCACCTCAATGGCAGAGACTCTCTGGTGAATCCGGGCCCGGCCATGGCAAGCCACAAGGACGATGAAGAAAAGTTTTTTCCTCAGAGCGGGGTTCTCATCTTTGGGAAGCAAGGCTCAGAGAAAACAAATGTGGACATTGAAAAGGTCATGATTACAGACGAAGAGGAAATCAGGACAACCAATCCCGTGGCTACGGAGCAGTATGGTTCTGTATCTACCAACCTCCAGAGAGGCAACAGACAAGCAGCTACCGCAGATGTCAACACACAAGGCGTTCTTCCAGGCATGGTCTGGCAGGACAGAGATGTGTACCTTCAGGGGCCCATCTGGGCAAAGATTCCACACACGGACGGACATTTTCACCCCTCTCCCCTCATGGGTGGATTCGGACTTAAACACCCTCCTCCACAGATTCTCATCAAGAACACCCCGGTACCTGCGAATCCTTCGACCACCTTCAGTGCGGCAAAGTTTGCTTCCTTCATCACACAGTACTCCACGGGACAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAACGCTGGAATCCCGAAATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTGGACACTAATGGCGTGTATTCAGAGCCTCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA

CapAAP：(SEQ ID NO:8)

CTGGAGACGCAGACTCAGTACCTGACCCCCAGCCTCTCGGACAGCCACCAGCAGCCCCCTCTGGTCTGGGAACTAATACGATGGCTACAGGCAGTGGCGCACCAATGGCAGACAATAACGAGGGCGCCGACGGAGTGGGTAATTCCTCGGGAAATTGGCATTGCGATTCCACATGGATGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAACAAATTTCCAGCCAATCAGGAGCCTCGAACGACAATCACTACTTTGGCTACAGCACCCCTTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCGGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAAGGATGCCTCCCGCCGTTCCCAGCAGACGTCTTCATGGTGCCACAGTATGGATACCTCACCCTGA

AAV-3

全基因组：NC_001729

Rep78：(SEQ ID NO:9)

ATGCCGGGGTTCTACGAGATTGTCCTGAAGGTCCCGAGTGACCTGGACGAGCGCCTGCCGGGCATTTCTAACTCGTTTGTTAACTGGGTGGCCGAGAAGGAATGGGACGTGCCGCCGGATTCTGACATGGATCCGAATCTGATTGAGCAGGCACCCCTGACCGTGGCCGAAAAGCTTCAGCGCGAGTTCCTGGTGGAGTGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTTTTTGTCCAGTTCGAAAAGGGGGAGACCTACTTCCACCTGCACGTGCTGATTGAGACCATCGGGGTCAAATCCATGGTGGTCGGCCGCTACGTGAGCCAGATTAAAGAGAAGCTGGTGACCCGCATCTACCGCGGGGTCGAGCCGCAGCTTCCGAACTGGTTCGCGGTGACCAAAACGCGAAATGGCGCCGGGGGCGGGAACAAGGTGGTGGACGACTGCTACATCCCCAACTACCTGCTCCCCAAGACCCAGCCCGAGCTCCAGTGGGCGTGGACTAACATGGACCAGTATTTAAGCGCCTGTTTGAATCTCGCGGAGCGTAAACGGCTGGTGGCGCAGCATCTGACGCACGTGTCGCAGACGCAGGAGCAGAACAAAGAGAATCAGAACCCCAATTCTGACGCGCCGGTCATCAGGTCAAAAACCTCAGCCAGGTACATGGAGCTGGTCGGGTGGCTGGTGGACCGCGGGATCACGTCAGAAAAGCAATGGATTCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCCCAGATCAAGGCCGCGCTGGACAATGCCTCCAAGATCATGAGCCTGACAAAGACGGCTCCGGACTACCTGGTGGGCAGCAACCCGCCGGAGGACATTACCAAAAATCGGATCTACCAAATCCTGGAGCTGAACGGGTACGATCCGCAGTACGCGGCCTCCGTCTTCCTGGGCTGGGCGCAAAAGAAGTTCGGGAAGAGGAACACCATCTGGCTCTTTGGGCCGGCCACGACGGGTAAAACCAACATCGCGGAAGCCATCGCCCACGCCGTGCCCTTCTACGGCTGCGTAAACTGGACCAATGAGAACTTTCCCTTCAACGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACGGCCAAGGTCGTGGAGAGCGCCAAGGCCATTCTGGGCGGAAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCATCGGCCCAGATCGAACCCACTCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACAGCACCACCTTCGAGCATCAGCAGCCGCTGCAGGACCGGATGTTTGAATTTGAACTTACCCGCCGTTTGGACCATGACTTTGGGAAGGTCACCAAACAGGAAGTAAAGGACTTTTTCCGGTGGGCTTCCGATCACGTGACTGACGTGGCTCATGAGTTCTACGTCAGAAAGGGTGGAGCTAAGAAACGCCCCGCCTCCAATGACGCGGATGTAAGCGAGCCAAAACGGGAGTGCACGTCACTTGCGCAGCCGACAACGTCAGACGCGGAAGCACCGGCGGACTACGCGGACAGGTACCAAAACAAATGTTCTCGTCACGTGGGCATGAATCTGATGCTTTTTCCCTGTAAAACATGCGAGAGAATGAATCAAATTTCCAATGTCTGTTTTACGCATGGTCAAAGAGACTGTGGGGAATGCTTCCCTGGAATGTCAGAATCTCAACCCGTTTCTGTCGTCAAAAAGAAGACTTATCAGAAACTGTGTCCAATTCATCATATCCTGGGAAGGGCACCCGAGATTGCCTGTTCGGCCTGCGATTTGGCCAATGTGGACTTGGATGACTGTGTTTCTGAGCAATAA

CapVP1：(SEQ ID NO:10)

ATGGCTGCTGACGGTTATCTTCCAGATTGGCTCGAGGACAACCTTTCTGAAGGCATTCGTGAGTGGTGGGCTCTGAAACCTGGAGTCCCTCAACCCAAAGCGAACCAACAACACCAGGACAACCGTCGGGGTCTTGTGCTTCCGGGTTACAAATACCTCGGACCCGGTAACGGACTCGACAAAGGAGAGCCGGTCAACGAGGCGGACGCGGCAGCCCTCGAACACGACAAAGCTTACGACCAGCAGCTCAAGGCCGGTGACAACCCGTACCTCAAGTACAACCACGCCGACGCCGAGTTTCAGGAGCGTCTTCAAGAAGATACGTCTTTTGGGGGCAACCTTGGCAGAGCAGTCTTCCAGGCCAAAAAGAGGATCCTTGAGCCTCTTGGTCTGGTTGAGGAAGCAGCTAAAACGGCTCCTGGAAAGAAGGGGGCTGTAGATCAGTCTCCTCAGGAACCGGACTCATCATCTGGTGTTGGCAAATCGGGCAAACAGCCTGCCAGAAAAAGACTAAATTTCGGTCAGACTGGAGACTCAGAGTCAGTCCCAGACCCTCAACCTCTCGGAGAACCACCAGCAGCCCCCACAAGTTTGGGATCTAATACAATGGCTTCAGGCGGTGGCGCACCAATGGCAGACAATAACGAGGGTGCCGATGGAGTGGGTAATTCCTCAGGAAATTGGCATTGCGATTCCCAATGGCTGGGCGACAGAGTCATCACCACCAGCACCAGAACCTGGGCCCTGCCCACTTACAACAACCATCTCTACAAGCAAATCTCCAGCCAATCAGGAGCTTCAAACGACAACCACTACTTTGGCTACAGCACCCCTTGGGGGTATTTTGACTTTAACAGATTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATTAACAACAACTGGGGATTCCGGCCCAAGAAACTCAGCTTCAAGCTCTTCAACATCCAAGTTAGAGGGGTCACGCAGAACGATGGCACGACGACTATTGCCAATAACCTTACCAGCACGGTTCAAGTGTTTACGGACTCGGAGTATCAGCTCCCGTACGTGCTCGGGTCGGCGCACCAAGGCTGTCTCCCGCCGTTTCCAGCGGACGTCTTCATGGTCCCTCAGTATGGATACCTCACCCTGAACAACGGAAGTCAAGCGGTGGGACGCTCATCCTTTTACTGCCTGGAGTACTTCCCTTCGCAGATGCTAAGGACTGGAAATAACTTCCAATTCAGCTATACCTTCGAGGATGTACCTTTTCACAGCAGCTACGCTCACAGCCAGAGTTTGGATCGCTTGATGAATCCTCTTATTGATCAGTATCTGTACTACCTGAACAGAACGCAAGGAACAACCTCTGGAACAACCAACCAATCACGGCTGCTTTTTAGCCAGGCTGGGCCTCAGTCTATGTCTTTGCAGGCCAGAAATTGGCTACCTGGGCCCTGCTACCGGCAACAGAGACTTTCAAAGACTGCTAACGACAACAACAACAGTAACTTTCCTTGGACAGCGGCCAGCAAATATCATCTCAATGGCCGCGACTCGCTGGTGAATCCAGGACCAGCTATGGCCAGTCACAAGGACGATGAAGAAAAATTTTTCCCTATGCACGGCAATCTAATATTTGGCAAAGAAGGGACAACGGCAAGTAACGCAGAATTAGATAATGTAATGATTACGGATGAAGAAGAGATTCGTACCACCAATCCTGTGGCAACAGAGCAGTATGGAACTGTGGCAAATAACTTGCAGAGCTCAAATACAGCTCCCACGACTGGAACTGTCAATCATCAGGGGGCCTTACCTGGCATGGTGTGGCAAGATCGTGACGTGTACCTTCAAGGACCTATCTGGGCAAAGATTCCTCACACGGATGGACACTTTCATCCTTCTCCTCTGATGGGAGGCTTTGGACTGAAACATCCGCCTCCTCAAATCATGATCAAAAATACTCCGGTACCGGCAAATCCTCCGACGACTTTCAGCCCGGCCAAGTTTGCTTCATTTATCACTCAGTACTCCACTGGACAGGTCAGCGTGGAAATTGAGTGGGAGCTACAGAAAGAAAACAGCAAACGTTGGAATCCAGAGATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTAGACACTAATGGTGTTTATAGTGAACCTCGCCCTATTGGAACCCGGTATCTCACACGAAACTTGTGA

AAV-4

全基因组：NC_001829

Rep78：(SEQ ID NO:11)

ATGCCGGGGTTCTACGAGATCGTGCTGAAGGTGCCCAGCGACCTGGACGAGCACCTGCCCGGCATTTCTGACTCTTTTGTGAGCTGGGTGGCCGAGAAGGAATGGGAGCTGCCGCCGGATTCTGACATGGACTTGAATCTGATTGAGCAGGCACCCCTGACCGTGGCCGAAAAGCTGCAACGCGAGTTCCTGGTCGAGTGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTCTTTGTCCAGTTCGAGAAGGGGGACAGCTACTTCCACCTGCACATCCTGGTGGAGACCGTGGGCGTCAAATCCATGGTGGTGGGCCGCTACGTGAGCCAGATTAAAGAGAAGCTGGTGACCCGCATCTACCGCGGGGTCGAGCCGCAGCTTCCGAACTGGTTCGCGGTGACCAAGACGCGTAATGGCGCCGGAGGCGGGAACAAGGTGGTGGACGACTGCTACATCCCCAACTACCTGCTCCCCAAGACCCAGCCCGAGCTCCAGTGGGCGTGGACTAACATGGACCAGTATATAAGCGCCTGTTTGAATCTCGCGGAGCGTAAACGGCTGGTGGCGCAGCATCTGACGCACGTGTCGCAGACGCAGGAGCAGAACAAGGAAAACCAGAACCCCAATTCTGACGCGCCGGTCATCAGGTCAAAAACCTCCGCCAGGTACATGGAGCTGGTCGGGTGGCTGGTGGACCGCGGGATCACGTCAGAAAAGCAATGGATCCAGGAGGACCAGGCGTCCTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCACAAATCAAGGCCGCGCTGGACAATGCCTCCAAAATCATGAGCCTGACAAAGACGGCTCCGGACTACCTGGTGGGCCAGAACCCGCCGGAGGACATTTCCAGCAACCGCATCTACCGAATCCTCGAGATGAACGGGTACGATCCGCAGTACGCGGCCTCCGTCTTCCTGGGCTGGGCGCAAAAGAAGTTCGGGAAGAGGAACACCATCTGGCTCTTTGGGCCGGCCACGACGGGTAAAACCAACATCGCGGAAGCCATCGCCCACGCCGTGCCCTTCTACGGCTGCGTGAACTGGACCAATGAGAACTTTCCGTTCAACGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACGGCCAAGGTCGTAGAGAGCGCCAAGGCCATCCTGGGCGGAAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCATCGGCCCAGATCGACCCAACTCCCGTGATCGTCACCTCCAACACCAACATGTGCGCGGTCATCGACGGAAACTCGACCACCTTCGAGCACCAACAACCACTCCAGGACCGGATGTTCAAGTTCGAGCTCACCAAGCGCCTGGAGCACGACTTTGGCAAGGTCACCAAGCAGGAAGTCAAAGACTTTTTCCGGTGGGCGTCAGATCACGTGACCGAGGTGACTCACGAGTTTTACGTCAGAAAGGGTGGAGCTAGAAAGAGGCCCGCCCCCAATGACGCAGATATAAGTGAGCCCAAGCGGGCCTGTCCGTCAGTTGCGCAGCCATCGACGTCAGACGCGGAAGCTCCGGTGGACTACGCGGACAGGTACCAAAACAAATGTTCTCGTCACGTGGGTATGAATCTGATGCTTTTTCCCTGCCGGCAATGCGAGAGAATGAATCAGAATGTGGACATTTGCTTCACGCACGGGGTCATGGACTGTGCCGAGTGCTTCCCCGTGTCAGAATCTCAACCCGTGTCTGTCGTCAGAAAGCGGACGTATCAGAAACTGTGTCCGATTCATCACATCATGGGGAGGGCGCCCGAGGTGGCCTGCTCGGCCTGCGAACTGGCCAATGTGGACTTGGATGACTGTGACATGGAACAATAA

CapVP1：(SEQ ID NO:12)

ATGACTGACGGTTACCTTCCAGATTGGCTAGAGGACAACCTCTCTGAAGGCGTTCGAGAGTGGTGGGCGCTGCAACCTGGAGCCCCTAAACCCAAGGCAAATCAACAACATCAGGACAACGCTCGGGGTCTTGTGCTTCCGGGTTACAAATACCTCGGACCCGGCAACGGACTCGACAAGGGGGAACCCGTCAACGCAGCGGACGCGGCAGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAGGCCGGTGACAACCCCTACCTCAAGTACAACCACGCCGACGCGGAGTTCCAGCAGCGGCTTCAGGGCGACACATCGTTTGGGGGCAACCTCGGCAGAGCAGTCTTCCAGGCCAAAAAGAGGGTTCTTGAACCTCTTGGTCTGGTTGAGCAAGCGGGTGAGACGGCTCCTGGAAAGAAGAGACCGTTGATTGAATCCCCCCAGCAGCCCGACTCCTCCACGGGTATCGGCAAAAAAGGCAAGCAGCCGGCTAAAAAGAAGCTCGTTTTCGAAGACGAAACTGGAGCAGGCGACGGACCCCCTGAGGGATCAACTTCCGGAGCCATGTCTGATGACAGTGAGATGCGTGCAGCAGCTGGCGGAGCTGCAGTCGAGGGCGGACAAGGTGCCGATGGAGTGGGTAATGCCTCGGGTGATTGGCATTGCGATTCCACCTGGTCTGAGGGCCACGTCACGACCACCAGCACCAGAACCTGGGTCTTGCCCACCTACAACAACCACCTCTACAAGCGACTCGGAGAGAGCCTGCAGTCCAACACCTACAACGGATTCTCCACCCCCTGGGGATACTTTGACTTCAACCGCTTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGCATGCGACCCAAAGCCATGCGGGTCAAAATCTTCAACATCCAGGTCAAGGAGGTCACGACGTCGAACGGCGAGACAACGGTGGCTAATAACCTTACCAGCACGGTTCAGATCTTTGCGGACTCGTCGTACGAACTGCCGTACGTGATGGATGCGGGTCAAGAGGGCAGCCTGCCTCCTTTTCCCAACGACGTCTTTATGGTGCCCCAGTACGGCTACTGTGGACTGGTGACCGGCAACACTTCGCAGCAACAGACTGACAGAAATGCCTTCTACTGCCTGGAGTACTTTCCTTCGCAGATGCTGCGGACTGGCAACAACTTTGAAATTACGTACAGTTTTGAGAAGGTGCCTTTCCACTCGATGTACGCGCACAGCCAGAGCCTGGACCGGCTGATGAACCCTCTCATCGACCAGTACCTGTGGGGACTGCAATCGACCACCACCGGAACCACCCTGAATGCCGGGACTGCCACCACCAACTTTACCAAGCTGCGGCCTACCAACTTTTCCAACTTTAAAAAGAACTGGCTGCCCGGGCCTTCAATCAAGCAGCAGGGCTTCTCAAAGACTGCCAATCAAAACTACAAGATCCCTGCCACCGGGTCAGACAGTCTCATCAAATACGAGACGCACAGCACTCTGGACGGAAGATGGAGTGCCCTGACCCCCGGACCTCCAATGGCCACGGCTGGACCTGCGGACAGCAAGTTCAGCAACAGCCAGCTCATCTTTGCGGGGCCTAAACAGAACGGCAACACGGCCACCGTACCCGGGACTCTGATCTTCACCTCTGAGGAGGAGCTGGCAGCCACCAACGCCACCGATACGGACATGTGGGGCAACCTACCTGGCGGTGACCAGAGCAACAGCAACCTGCCGACCGTGGACAGACTGACAGCCTTGGGAGCCGTGCCTGGAATGGTCTGGCAAAACAGAGACATTTACTACCAGGGTCCCATTTGGGCCAAGATTCCTCATACCGATGGACACTTTCACCCCTCACCGCTGATTGGTGGGTTTGGGCTGAAACACCCGCCTCCTCAAATTTTTATCAAGAACACCCCGGTACCTGCGAATCCTGCAACGACCTTCAGCTCTACTCCGGTAAACTCCTTCATTACTCAGTACAGCACTGGCCAGGTGTCGGTGCAGATTGACTGGGAGATCCAGAAGGAGCGGTCCAAACGCTGGAACCCCGAGGTCCAGTTTACCTCCAACTACGGACAGCAAAACTCTCTGTTGTGGGCTCCCGATGCGGCTGGGAAATACACTGAGCCTAGGGCTATCGGTACCCGCTACCTCACCCACCACCTGTAA

AAV-5

全基因组：NC_006152

Rep78：(SEQ ID NO:13)

ATGGCTACCTTCTATGAAGTCATTGTTCGCGTCCCATTTGACGTGGAGGAACATCTGCCTGGAATTTCTGACAGCTTTGTGGACTGGGTAACTGGTCAAATTTGGGAGCTGCCTCCAGAGTCAGATTTAAATTTGACTCTGGTTGAACAGCCTCAGTTGACGGTGGCTGATAGAATTCGCCGCGTGTTCCTGTACGAGTGGAACAAATTTTCCAAGCAGGAGTCCAAATTCTTTGTGCAGTTTGAAAAGGGATCTGAATATTTTCATCTGCACACGCTTGTGGAGACCTCCGGCATCTCTTCCATGGTCCTCGGCCGCTACGTGAGTCAGATTCGCGCCCAGCTGGTGAAAGTGGTCTTCCAGGGAATTGAACCCCAGATCAACGACTGGGTCGCCATCACCAAGGTAAAGAAGGGCGGAGCCAATAAGGTGGTGGATTCTGGGTATATTCCCGCCTACCTGCTGCCGAAGGTCCAACCGGAGCTTCAGTGGGCGTGGACAAACCTGGACGAGTATAAATTGGCCGCCCTGAATCTGGAGGAGCGCAAACGGCTCGTCGCGCAGTTTCTGGCAGAATCCTCGCAGCGCTCGCAGGAGGCGGCTTCGCAGCGTGAGTTCTCGGCTGACCCGGTCATCAAAAGCAAGACTTCCCAGAAATACATGGCGCTCGTCAACTGGCTCGTGGAGCACGGCATCACTTCCGAGAAGCAGTGGATCCAGGAAAATCAGGAGAGCTACCTCTCCTTCAACTCCACCGGCAACTCTCGGAGCCAGATCAAGGCCGCGCTCGACAACGCGACCAAAATTATGAGTCTGACAAAAAGCGCGGTGGACTACCTCGTGGGGAGCTCCGTTCCCGAGGACATTTCAAAAAACAGAATCTGGCAAATTTTTGAGATGAATGGCTACGACCCGGCCTACGCGGGATCCATCCTCTACGGCTGGTGTCAGCGCTCCTTCAACAAGAGGAACACCGTCTGGCTCTACGGACCCGCCACGACCGGCAAGACCAACATCGCGGAGGCCATCGCCCACACTGTGCCCTTTTACGGCTGCGTGAACTGGACCAATGAAAACTTTCCCTTTAATGACTGTGTGGACAAAATGCTCATTTGGTGGGAGGAGGGAAAGATGACCAACAAGGTGGTTGAATCCGCCAAGGCCATCCTGGGGGGCTCAAAGGTGCGGGTCGATCAGAAATGTAAATCCTCTGTTCAAATTGATTCTACCCCTGTCATTGTAACTTCCAATACAAACATGTGTGTGGTGGTGGATGGGAATTCCACGACCTTTGAACACCAGCAGCCGCTGGAGGACCGCATGTTCAAATTTGAACTGACTAAGCGGCTCCCGCCAGATTTTGGCAAGATTACTAAGCAGGAAGTCAAGGACTTTTTTGCTTGGGCAAAGGTCAATCAGGTGCCGGTGACTCACGAGTTTAAAGTTCCCAGGGAATTGGCGGGAACTAAAGGGGCGGAGAAATCTCTAAAACGCCCACTGGGTGACGTCACCAATACTAGCTATAAAAGTCTGGAGAAGCGGGCCAGGCTCTCATTTGTTCCCGAGACGCCTCGCAGTTCAGACGTGACTGTTGATCCCGCTCCTCTGCGACCGCTCAATTGGAATTCAAGGTATGATTGCAAATGTGACTATCATGCTCAATTTGACAACATTTCTAACAAATGTGATGAATGTGAATATTTGAATCGGGGCAAAAATGGATGTATCTGTCACAATGTAACTCACTGTCAAATTTGTCATGGGATTCCCCCCTGGGAAAAGGAAAACTTGTCAGATTTTGGGGATTTTGACGATGCCAATAAAGAACAGTAA

CapVP1：(SEQ ID NO:14)

ATGTCTTTTGTTGATCACCCTCCAGATTGGTTGGAAGAAGTTGGTGAAGGTCTTCGCGAGTTTTTGGGCCTTGAAGCGGGCCCACCGAAACCAAAACCCAATCAGCAGCATCAAGATCAAGCCCGTGGTCTTGTGCTGCCTGGTTATAACTATCTCGGACCCGGAAACGGTCTCGATCGAGGAGAGCCTGTCAACAGGGCAGACGAGGTCGCGCGAGAGCACGACATCTCGTACAACGAGCAGCTTGAGGCGGGAGACAACCCCTACCTCAAGTACAACCACGCGGACGCCGAGTTTCAGGAGAAGCTCGCCGACGACACATCCTTCGGGGGAAACCTCGGAAAGGCAGTCTTTCAGGCCAAGAAAAGGGTTCTCGAACCTTTTGGCCTGGTTGAAGAGGGTGCTAAGACGGCCCCTACCGGAAAGCGGATAGACGACCACTTTCCAAAAAGAAAGAAGGCTCGGACCGAAGAGGACTCCAAGCCTTCCACCTCGTCAGACGCCGAAGCTGGACCCAGCGGATCCCAGCAGCTGCAAATCCCAGCCCAACCAGCCTCAAGTTTGGGAGCTGATACAATGTCTGCGGGAGGTGGCGGCCCATTGGGCGACAATAACCAAGGTGCCGATGGAGTGGGCAATGCCTCGGGAGATTGGCATTGCGATTCCACGTGGATGGGGGACAGAGTCGTCACCAAGTCCACCCGAACCTGGGTGCTGCCCAGCTACAACAACCACCAGTACCGAGAGATCAAAAGCGGCTCCGTCGACGGAAGCAACGCCAACGCCTACTTTGGATACAGCACCCCCTGGGGGTACTTTGACTTTAACCGCTTCCACAGCCACTGGAGCCCCCGAGACTGGCAAAGACTCATCAACAACTACTGGGGCTTCAGACCCCGGTCCCTCAGAGTCAAAATCTTCAACATTCAAGTCAAAGAGGTCACGGTGCAGGACTCCACCACCACCATCGCCAACAACCTCACCTCCACCGTCCAAGTGTTTACGGACGACGACTACCAGCTGCCCTACGTCGTCGGCAACGGGACCGAGGGATGCCTGCCGGCCTTCCCTCCGCAGGTCTTTACGCTGCCGCAGTACGGTTACGCGACGCTGAACCGCGACAACACAGAAAATCCCACCGAGAGGAGCAGCTTCTTCTGCCTAGAGTACTTTCCCAGCAAGATGCTGAGAACGGGCAACAACTTTGAGTTTACCTACAACTTTGAGGAGGTGCCCTTCCACTCCAGCTTCGCTCCCAGTCAGAACCTGTTCAAGCTGGCCAACCCGCTGGTGGACCAGTACTTGTACCGCTTCGTGAGCACAAATAACACTGGCGGAGTCCAGTTCAACAAGAACCTGGCCGGGAGATACGCCAACACCTACAAAAACTGGTTCCCGGGGCCCATGGGCCGAACCCAGGGCTGGAACCTGGGCTCCGGGGTCAACCGCGCCAGTGTCAGCGCCTTCGCCACGACCAATAGGATGGAGCTCGAGGGCGCGAGTTACCAGGTGCCCCCGCAGCCGAACGGCATGACCAACAACCTCCAGGGCAGCAACACCTATGCCCTGGAGAACACTATGATCTTCAACAGCCAGCCGGCGAACCCGGGCACCACCGCCACGTACCTCGAGGGCAACATGCTCATCACCAGCGAGAGCGAGACGCAGCCGGTGAACCGCGTGGCGTACAACGTCGGCGGGCAGATGGCCACCAACAACCAGAGCTCCACCACTGCCCCCGCGACCGGCACGTACAACCTCCAGGAAATCGTGCCCGGCAGCGTGTGGATGGAGAGGGACGTGTACCTCCAAGGACCCATCTGGGCCAAGATCCCAGAGACGGGGGCGCACTTTCACCCCTCTCCGGCCATGGGCGGATTCGGACTCAAACACCCACCGCCCATGATGCTCATCAAGAACACGCCTGTGCCCGGAAATATCACCAGCTTCTCGGACGTGCCCGTCAGCAGCTTCATCACCCAGTACAGCACCGGGCAGGTCACCGTGGAGATGGAGTGGGAGCTCAAGAAGGAAAACTCCAAGAGGTGGAACCCAGAGATCCAGTACACAAACAACTACAACGACCCCCAGTTTGTGGACTTTGCCCCGGACAGCACCGGGGAATACAGAACCACCAGACCTATCGGAACCCGATACCTTACCCGACCCCTTTAA

AAV-6

全基因组：AF028704

Rep78：(SEQ ID NO:15)

ATGCCGGGGTTTTACGAGATTGTGATTAAGGTCCCCAGCGACCTTGACGAGCATCTGCCCGGCATTTCTGACAGCTTTGTGAACTGGGTGGCCGAGAAGGAATGGGAGTTGCCGCCAGATTCTGACATGGATCTGAATCTGATTGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGACTTCCTGGTCCAGTGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTCTTTGTTCAGTTCGAGAAGGGCGAGTCCTACTTCCACCTCCATATTCTGGTGGAGACCACGGGGGTCAAATCCATGGTGCTGGGCCGCTTCCTGAGTCAGATTAGGGACAAGCTGGTGCAGACCATCTACCGCGGGATCGAGCCGACCCTGCCCAACTGGTTCGCGGTGACCAAGACGCGTAATGGCGCCGGAGGGGGGAACAAGGTGGTGGACGAGTGCTACATCCCCAACTACCTCCTGCCCAAGACTCAGCCCGAGCTGCAGTGGGCGTGGACTAACATGGAGGAGTATATAAGCGCGTGTTTAAACCTGGCCGAGCGCAAACGGCTCGTGGCGCACGACCTGACCCACGTCAGCCAGACCCAGGAGCAGAACAAGGAGAATCTGAACCCCAATTCTGACGCGCCTGTCATCCGGTCAAAAACCTCCGCACGCTACATGGAGCTGGTCGGGTGGCTGGTGGACCGGGGCATCACCTCCGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCCCAGATCAAGGCCGCTCTGGACAATGCCGGCAAGATCATGGCGCTGACCAAATCCGCGCCCGACTACCTGGTAGGCCCCGCTCCGCCCGCCGACATTAAAACCAACCGCATTTACCGCATCCTGGAGCTGAACGGCTACGACCCTGCCTACGCCGGCTCCGTCTTTCTCGGCTGGGCCCAGAAAAGGTTCGGAAAACGCAACACCATCTGGCTGTTTGGGCCGGCCACCACGGGCAAGACCAACATCGCGGAAGCCATCGCCCACGCCGTGCCCTTCTACGGCTGCGTCAACTGGACCAATGAGAACTTTCCCTTCAACGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACGGCCAAGGTCGTGGAGTCCGCCAAGGCCATTCTCGGCGGCAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCGTCCGCCCAGATCGATCCCACCCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACAGCACCACCTTCGAGCACCAGCAGCCGTTGCAGGACCGGATGTTCAAATTTGAACTCACCCGCCGTCTGGAGCATGACTTTGGCAAGGTGACAAAGCAGGAAGTCAAAGAGTTCTTCCGCTGGGCGCAGGATCACGTGACCGAGGTGGCGCATGAGTTCTACGTCAGAAAGGGTGGAGCCAACAAGAGACCCGCCCCCGATGACGCGGATAAAAGCGAGCCCAAGCGGGCCTGCCCCTCAGTCGCGGATCCATCGACGTCAGACGCGGAAGGAGCTCCGGTGGACTTTGCCGACAGGTACCAAAACAAATGTTCTCGTCACGCGGGCATGCTTCAGATGCTGTTTCCCTGCAAAACATGCGAGAGAATGAATCAGAATTTCAACATTTGCTTCACGCACGGGACCAGAGACTGTTCAGAATGTTTCCCCGGCGTGTCAGAATCTCAACCGGTCGTCAGAAAGAGGACGTATCGGAAACTCTGTGCCATTCATCATCTGCTGGGGCGGGCTCCCGAGATTGCTTGCTCGGCCTGCGATCTGGTCAACGTGGATCTGGATGACTGTGTTTCTGAGCAATAA

CapVP1：(SEQ ID NO:16)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACTTGAAACCTGGAGCCCCGAAACCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGATGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGAGGGTTCTCGAACCTTTTGGTCTGGTTGAGGAAGGTGCTAAGACGGCTCCTGGAAAGAAACGTCCGGTAGAGCAGTCGCCACAAGAGCCAGACTCCTCCTCGGGCATTGGCAAGACAGGCCAGCAGCCCGCTAAAAAGAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTCCCCGACCCACAACCTCTCGGAGAACCTCCAGCAACCCCCGCTGCTGTGGGACCTACTACAATGGCTTCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAATGCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACATGGGCCTTGCCCACCTATAACAACCACCTCTACAAGCAAATCTCCAGTGCTTCAACGGGGGCCAGCAACGACAACCACTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGATTTCAACAGATTCCACTGCCATTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAATTGGGGATTCCGGCCCAAGAGACTCAACTTCAAGCTCTTCAACATCCAAGTCAAGGAGGTCACGACGAATGATGGCGTCACGACCATCGCTAATAACCTTACCAGCACGGTTCAAGTCTTCTCGGACTCGGAGTACCAGTTGCCGTACGTCCTCGGCTCTGCGCACCAGGGCTGCCTCCCTCCGTTCCCGGCGGACGTGTTCATGATTCCGCAGTACGGCTACCTAACGCTCAACAATGGCAGCCAGGCAGTGGGACGGTCATCCTTTTACTGCCTGGAATATTTCCCATCGCAGATGCTGAGAACGGGCAATAACTTTACCTTCAGCTACACCTTCGAGGACGTGCCTTTCCACAGCAGCTACGCGCACAGCCAGAGCCTGGACCGGCTGATGAATCCTCTCATCGACCAGTACCTGTATTACCTGAACAGAACTCAGAATCAGTCCGGAAGTGCCCAAAACAAGGACTTGCTGTTTAGCCGGGGGTCTCCAGCTGGCATGTCTGTTCAGCCCAAAAACTGGCTACCTGGACCCTGTTACCGGCAGCAGCGCGTTTCTAAAACAAAAACAGACAACAACAACAGCAACTTTACCTGGACTGGTGCTTCAAAATATAACCTTAATGGGCGTGAATCTATAATCAACCCTGGCACTGCTATGGCCTCACACAAAGACGACAAAGACAAGTTCTTTCCCATGAGCGGTGTCATGATTTTTGGAAAGGAGAGCGCCGGAGCTTCAAACACTGCATTGGACAATGTCATGATCACAGACGAAGAGGAAATCAAAGCCACTAACCCCGTGGCCACCGAAAGATTTGGGACTGTGGCAGTCAATCTCCAGAGCAGCAGCACAGACCCTGCGACCGGAGATGTGCATGTTATGGGAGCCTTACCTGGAATGGTGTGGCAAGACAGAGACGTATACCTGCAGGGTCCTATTTGGGCCAAAATTCCTCACACGGATGGACACTTTCACCCGTCTCCTCTCATGGGCGGCTTTGGACTTAAGCACCCGCCTCCTCAGATCCTCATCAAAAACACGCCTGTTCCTGCGAATCCTCCGGCAGAGTTTTCGGCTACAAAGTTTGCTTCATTCATCACCCAGTATTCCACAGGACAAGTGAGCGTGGAGATTGAATGGGAGCTGCAGAAAGAAAACAGCAAACGCTGGAATCCCGAAGTGCAGTATACATCTAACTATGCAAAATCTGCCAACGTTGATTTCACTGTGGACAACAATGGACTTTATACTGAGCCTCGCCCCATTGGCACCCGTTACCTCACCCGTCCCCTGTAA

AAV-7

全基因组：NC_006260

Rep78：(SEQ ID NO:17)

ATGCCGGGTTTCTACGAGATCGTGATCAAGGTGCCGAGCGACCTGGACGAGCACCTGCCGGGCATTTCTGACTCGTTTGTGAACTGGGTGGCCGAGAAGGAATGGGAGCTGCCCCCGGATTCTGACATGGATCTGAATCTGATCGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGACTTCCTGGTCCAATGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTGTTCTTTGTTCAGTTCGAGAAGGGCGAGAGCTACTTCCACCTTCACGTTCTGGTGGAGACCACGGGGGTCAAGTCCATGGTGCTAGGCCGCTTCCTGAGTCAGATTCGGGAGAAGCTGGTCCAGACCATCTACCGCGGGGTCGAGCCCACGCTGCCCAACTGGTTCGCGGTGACCAAGACGCGTAATGGCGCCGGCGGGGGGAACAAGGTGGTGGACGAGTGCTACATCCCCAACTACCTCCTGCCCAAGACCCAGCCCGAGCTGCAGTGGGCGTGGACTAACATGGAGGAGTATATAAGCGCGTGTTTGAACCTGGCCGAACGCAAACGGCTCGTGGCGCAGCACCTGACCCACGTCAGCCAGACGCAGGAGCAGAACAAGGAGAATCTGAACCCCAATTCTGACGCGCCCGTGATCAGGTCAAAAACCTCCGCGCGCTACATGGAGCTGGTCGGGTGGCTGGTGGACCGGGGCATCACCTCCGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCCCAGATCAAGGCCGCGCTGGACAATGCCGGCAAGATCATGGCGCTGACCAAATCCGCGCCCGACTACCTGGTGGGGCCCTCGCTGCCCGCGGACATTAAAACCAACCGCATCTACCGCATCCTGGAGCTGAACGGGTACGATCCTGCCTACGCCGGCTCCGTCTTTCTCGGCTGGGCCCAGAAAAAGTTCGGGAAGCGCAACACCATCTGGCTGTTTGGGCCCGCCACCACCGGCAAGACCAACATTGCGGAAGCCATCGCCCACGCCGTGCCCTTCTACGGCTGCGTCAACTGGACCAATGAGAACTTTCCCTTCAACGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACGGCCAAGGTCGTGGAGTCCGCCAAGGCCATTCTCGGCGGCAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCGTCCGCCCAGATCGACCCCACCCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACAGCACCACCTTCGAGCACCAGCAGCCGTTGCAGGACCGGATGTTCAAATTTGAACTCACCCGCCGTCTGGAGCACGACTTTGGCAAGGTGACGAAGCAGGAAGTCAAAGAGTTCTTCCGCTGGGCCAGTGATCACGTGACCGAGGTGGCGCATGAGTTCTACGTCAGAAAGGGCGGAGCCAGCAAAAGACCCGCCCCCGATGACGCGGATATAAGCGAGCCCAAGCGGGCCTGCCCCTCAGTCGCGGATCCATCGACGTCAGACGCGGAAGGAGCTCCGGTGGACTTTGCCGACAGGTACCAAAACAAATGTTCTCGTCACGCGGGCATGATTCAGATGCTGTTTCCCTGCAAAACGTGCGAGAGAATGAATCAGAATTTCAACATTTGCTTCACACACGGGGTCAGAGACTGTTTAGAGTGTTTCCCCGGCGTGTCAGAATCTCAACCGGTCGTCAGAAAAAAGACGTATCGGAAACTCTGCGCGATTCATCATCTGCTGGGGCGGGCGCCCGAGATTGCTTGCTCGGCCTGCGACCTGGTCAACGTGGACCTGGACGACTGCGTTTCTGAGCAATAA

CapVP1：(SEQ ID NO:18)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACCTGAAACCTGGAGCCCCGAAACCCAAAGCCAACCAGCAAAAGCAGGACAACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCATTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGGCGCTAAGACGGCTCCTGCAAAGAAGAGACCGGTAGAGCCGTCACCTCAGCGTTCCCCCGACTCCTCCACGGGCATCGGCAAGAAAGGCCAGCAGCCCGCCAGAAAGAGACTCAATTTCGGTCAGACTGGCGACTCAGAGTCAGTCCCCGACCCTCAACCTCTCGGAGAACCTCCAGCAGCGCCCTCTAGTGTGGGATCTGGTACAGTGGCTGCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGTGCCGACGGAGTGGGTAATGCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATTACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAGCAAATCTCCAGTGAAACTGCAGGTAGTACCAACGACAACACCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGACTTTAACAGATTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAAGCTGCGGTTCAAGCTCTTCAACATCCAGGTCAAGGAGGTCACGACGAATGACGGCGTTACGACCATCGCTAATAACCTTACCAGCACGATTCAGGTATTCTCGGACTCGGAATACCAGCTGCCGTACGTCCTCGGCTCTGCGCACCAGGGCTGCCTGCCTCCGTTCCCGGCGGACGTCTTCATGATTCCTCAGTACGGCTACCTGACTCTCAACAATGGCAGTCAGTCTGTGGGACGTTCCTCCTTCTACTGCCTGGAGTACTTCCCCTCTCAGATGCTGAGAACGGGCAACAACTTTGAGTTCAGCTACAGCTTCGAGGACGTGCCTTTCCACAGCAGCTACGCACACAGCCAGAGCCTGGACCGGCTGATGAATCCCCTCATCGACCAGTACTTGTACTACCTGGCCAGAACACAGAGTAACCCAGGAGGCACAGCTGGCAATCGGGAACTGCAGTTTTACCAGGGCGGGCCTTCAACTATGGCCGAACAAGCCAAGAATTGGTTACCTGGACCTTGCTTCCGGCAACAAAGAGTCTCCAAAACGCTGGATCAAAACAACAACAGCAACTTTGCTTGGACTGGTGCCACCAAATATCACCTGAACGGCAGAAACTCGTTGGTTAATCCCGGCGTCGCCATGGCAACTCACAAGGACGACGAGGACCGCTTTTTCCCATCCAGCGGAGTCCTGATTTTTGGAAAAACTGGAGCAACTAACAAAACTACATTGGAAAATGTGTTAATGACAAATGAAGAAGAAATTCGTCCTACTAATCCTGTAGCCACGGAAGAATACGGGATAGTCAGCAGCAACTTACAAGCGGCTAATACTGCAGCCCAGACACAAGTTGTCAACAACCAGGGAGCCTTACCTGGCATGGTCTGGCAGAACCGGGACGTGTACCTGCAGGGTCCCATCTGGGCCAAGATTCCTCACACGGATGGCAACTTTCACCCGTCTCCTTTGATGGGCGGCTTTGGACTTAAACATCCGCCTCCTCAGATCCTGATCAAGAACACTCCCGTTCCCGCTAATCCTCCGGAGGTGTTTACTCCTGCCAAGTTTGCTTCGTTCATCACACAGTACAGCACCGGACAAGTCAGCGTGGAAATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAGCGCTGGAACCCGGAGATTCAGTACACCTCCAACTTTGAAAAGCAGACTGGTGTGGACTTTGCCGTTGACAGCCAGGGTGTTTACTCTGAGCCTCGCCCTATTGGCACTCGTTACCTCACCCGTAATCTGTAA

AAV-8

全基因组：NC_006261

Rep78：(SEQ ID NO:19)

ATGCCGGGCTTCTACGAGATCGTGATCAAGGTGCCGAGCGACCTGGACGAGCACCTGCCGGGCATTTCTGACTCGTTTGTGAACTGGGTGGCCGAGAAGGAATGGGAGCTGCCCCCGGATTCTGACATGGATCGGAATCTGATCGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGACTTCCTGGTCCAATGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTCTTTGTTCAGTTCGAGAAGGGCGAGAGCTACTTTCACCTGCACGTTCTGGTCGAGACCACGGGGGTCAAGTCCATGGTGCTAGGCCGCTTCCTGAGTCAGATTCGGGAAAAGCTTGGTCCAGACCATCTACCCGCGGGGTCGAGCCCCACCTTGCCCAACTGGTTCGCGGTGACCAAAGACGCGGTAATGGCGCCGGCGGGGGGGAACAAGGTGGTGGACGAGTGCTACATCCCCAACTACCTCCTGCCCAAGACTCAGCCCGAGCTGCAGTGGGCGTGGACTAACATGGAGGAGTATATAAGCGCGTGCTTGAACCTGGCCGAGCGCAAACGGCTCGTGGCGCAGCACCTGACCCACGTCAGCCAGACGCAGGAGCAGAACAAGGAGAATCTGAACCCCAATTCTGACGCGCCCGTGATCAGGTCAAAAACCTCCGCGCGCTATATGGAGCTGGTCGGGTGGCTGGTGGACCGGGGCATCACCTCCGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCCCAGATCAAGGCCGCGCTGGACAATGCCGGCAAGATCATGGCGCTGACCAAATCCGCGCCCGACTACCTGGTGGGGCCCTCGCTGCCCGCGGACATTACCCAGAACCGCATCTACCGCATCCTCGCTCTCAACGGCTACGACCCTGCCTACGCCGGCTCCGTCTTTCTCGGCTGGGCTCAGAAAAAGTTCGGGAAACGCAACACCATCTGGCTGTTTGGACCCGCCACCACCGGCAAGACCAACATTGCGGAAGCCATCGCCCACGCCGTGCCCTTCTACGGCTGCGTCAACTGGACCAATGAGAACTTTCCCTTCAATGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACGGCCAAGGTCGTGGAGTCCGCCAAGGCCATTCTCGGCGGCAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCGTCCGCCCAGATCGACCCCACCCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACAGCACCACCTTCGAGCACCAGCAGCCTCTCCAGGACCGGATGTTTAAGTTCGAACTCACCCGCCGTCTGGAGCACGACTTTGGCAAGGTGACAAAGCAGGAAGTCAAAGAGTTCTTCCGCTGGGCCAGTGATCACGTGACCGAGGTGGCGCATGAGTTTTACGTCAGAAAGGGCGGAGCCAGCAAAAGACCCGCCCCCGATGACGCGGATAAAAGCGAGCCCAAGCGGGCCTGCCCCTCAGTCGCGGATCCATCGACGTCAGACGCGGAAGGAGCTCCGGTGGACTTTGCCGACAGGTACCAAAACAAATGTTCTCGTCACGCGGGCATGCTTCAGATGCTGTTTCCCTGCAAAACGTGCGAGAGAATGAATCAGAATTTCAACATTTGCTTCACACACGGGGTCAGAGACTGCTCAGAGTGTTTCCCCGGCGTGTCAGAATCTCAACCGGTCGTCAGAAAGAGGACGTATCGGAAACTCTGTGCGATTCATCATCTGCTGGGGCGGGCTCCCGAGATTGCTTGCTCGGCCTGCGATCTGGTCAACGTGGACCTGGATGACTGTGTTTCTGAGCAATAA

CapVP1：(SEQ ID NO:20)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGCGCTGAAACCTGGAGCCCCGAAGCCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTGCAGGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGGCGCTAAGACGGCTCCTGGAAAGAAGAGACCGGTAGAGCCATCACCCCAGCGTTCTCCAGACTCCTCTACGGGCATCGGCAAGAAAGGCCAACAGCCCGCCAGAAAAAGACTCAATTTTGGTCAGACTGGCGACTCAGAGTCAGTTCCAGACCCTCAACCTCTCGGAGAACCTCCAGCAGCGCCCTCTGGTGTGGGACCTAATACAATGGCTGCAGGCGGTGGCGCACCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAGTTCCTCGGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAGCAAATCTCCAACGGGACATCGGGAGGAGCCACCAACGACAACACCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGACTTTAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAGACTCAGCTTCAAGCTCTTCAACATCCAGGTCAAGGAGGTCACGCAGAATGAAGGCACCAAGACCATCGCCAATAACCTCACCAGCACCATCCAGGTGTTTACGGACTCGGAGTACCAGCTGCCGTACGTTCTCGGCTCTGCCCACCAGGGCTGCCTGCCTCCGTTCCCGGCGGACGTGTTCATGATTCCCCAGTACGGCTACCTAACACTCAACAACGGTAGTCAGGCCGTGGGACGCTCCTCCTTCTACTGCCTGGAATACTTTCCTTCGCAGATGCTGAGAACCGGCAACAACTTCCAGTTTACTTACACCTTCGAGGACGTGCCTTTCCACAGCAGCTACGCCCACAGCCAGAGCTTGGACCGGCTGATGAATCCTCTGATTGACCAGTACCTGTACTACTTGTCTCGGACTCAAACAACAGGAGGCACGGCAAATACGCAGACTCTGGGCTTCAGCCAAGGTGGGCCTAATACAATGGCCAATCAGGCAAAGAACTGGCTGCCAGGACCCTGTTACCGCCAACAACGCGTCTCAACGACAACCGGGCAAAACAACAATAGCAACTTTGCCTGGACTGCTGGGACCAAATACCATCTGAATGGAAGAAATTCATTGGCTAATCCTGGCATCGCTATGGCAACACACAAAGACGACGAGGAGCGTTTTTTTCCCAGTAACGGGATCCTGATTTTTGGCAAACAAAATGCTGCCAGAGACAATGCGGATTACAGCGATGTCATGCTCACCAGCGAGGAAGAAATCAAAACCACTAACCCTGTGGCTACAGAGGAATACGGTATCGTGGCAGATAACTTGCAGCAGCAAAACACGGCTCCTCAAATTGGAACTGTCAACAGCCAGGGGGCCTTACCCGGTATGGTCTGGCAGAACCGGGACGTGTACCTGCAGGGTCCCATCTGGGCCAAGATTCCTCACACGGACGGCAACTTCCACCCGTCTCCGCTGATGGGCGGCTTTGGCCTGAAACATCCTCCGCCTCAGATCCTGATCAAGAACACGCCTGTACCTGCGGATCCTCCGACCACCTTCAACCAGTCAAAGCTGAACTCTTTCATCACGCAATACAGCACCGGACAGGTCAGCGTGGAAATTGAATGGGAGCTGCAGAAGGAAAACAGCAAGCGCTGGAACCCCGAGATCCAGTACACCTCCAACTACTACAAATCTACAAGTGTGGACTTTGCTGTTAATACAGAAGGCGTGTACTCTGAACCCCGCCCCATTGGCACCCGTTACCTCACCCGTAATCTGTAA

AAV-9

仅Cap：AY530579

CapVP1：(SEQ ID NO:21)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTTAGTGAAGGAATTCGCGAGTGGTGGGCTTTGAAACCTGGAGCCCCTCAACCCAAGGCAAATCAACAACATCAAGACAACGCTCGAGGTCTTGTGCTTCCGGGTTACAAATACCTTGGACCCGGCAACGGACTCGACAAGGGGGAGCCGGTCAACGCAGCAGACGCGGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAGGCCGGAGACAACCCGTACCTCAAGTACAACCACGCCGACGCCGAGTTCCAGGAGCGGCTCAAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAAAAGAGGCTTCTTGAACCTCTTGGTCTGGTTGAGGAAGCGGCTAAGACGGCTCCTGGAAAGAAGAGGCCTGTAGAGCAGTCTCCTCAGGAACCGGACTCCTCCGCGGGTATTGGCAAATCGGGTGCACAGCCCGCTAAAAAGAGACTCAATTTCGGTCAGACTGGCGACACAGAGTCAGTCCCAGACCCTCAACCAATCGGAGAACCTCCCGCAGCCCCCTCAGGTGTGGGATCTCTTACAATGGCTTCAGGTGGTGGCGCACCAGTGGCAGACAATAACGAAGGTGCCGATGGAGTGGGTAGTTCCTCGGGAAATTGGCATTGCGATTCCCAATGGCTGGGGGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAATCACCTCTACAAGCAAATCTCCAACAGCACATCTGGAGGATCTTCAAATGACAACGCCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCTAAGCGACTCAACTTCAAGCTCTTCAACATTCAGGTCAAAGAGGTTACGGACAACAATGGAGTCAAGACCATCGCCAATAACCTTACCAGCACGGTCCAGGTCTTCACGGACTCAGACTATCAGCTCCCGTACGTGCTCGGGTCGGCTCACGAGGGCTGCCTCCCGCCGTTCCCAGCGGACGTTTTCATGATTCCTCAGTACGGGTATCTGACGCTTAATGATGGAAGCCAGGCCGTGGGTCGTTCGTCCTTTTACTGCCTGGAATATTTCCCGTCGCAAATGCTAAGAACGGGTAACAACTTCCAGTTCAGCTACGAGTTTGAGAACGTACCTTTCCATAGCAGCTACGCTCACAGCCAAAGCCTGGACCGACTAATGAATCCACTCATCGACCAATACTTGTACTATCTCTCAAAGACTATTAACGGTTCTGGACAGAATCAACAAACGCTAAAATTCAGTGTGGCCGGACCCAGCAACATGGCTGTCCAGGGAAGAAACTACATACCTGGACCCAGCTACCGACAACAACGTGTCTCAACCACTGTGACTCAAAACAACAACAGCGAATTTGCTTGGCCTGGAGCTTCTTCTTGGGCTCTCAATGGACGTAATAGCTTGATGAATCCTGGACCTGCTATGGCCAGCCACAAAGAAGGAGAGGACCGTTTCTTTCCTTTGTCTGGATCTTTAATTTTTGGCAAACAAGGAACTGGAAGAGACAACGTGGATGCGGACAAAGTCATGATAACCAACGAAGAAGAAATTAAAACTACTAACCCGGTAGCAACGGAGTCCTATGGACAAGTGGCCACAAACCACCAGAGTGCCCAAGCACAGGCGCAGACCGGCTGGGTTCAAAACCAAGGAATACTTCCGGGTATGGTTTGGCAGGACAGAGATGTGTACCTGCAAGGACCCATTTGGGCCAAAATTCCTCACACGGACGGCAACTTTCACCCTTCTCCGCTGATGGGAGGGTTTGGAATGAAGCACCCGCCTCCTCAGATCCTCATCAAAAACACACCTGTACCTGCGGATCCTCCAACGGCCTTCAACAAGGACAAGCTGAACTCTTTCATCACCCAGTATTCTACTGGCCAAGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAGCGCTGGAACCCGGAGATCCAGTACACTTCCAACTATTACAAGTCTAATAATGTTGAATTTGCTGTTAATACTGAAGGTGTATATAGTGAACCCCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA

AAV-10

部分基因组：AY631965

Rep78：(SEQ ID NO:22)

ATGCCGGGCTTCTACGAGATCGTGATCAAGGTGCCGAGCGACCTGGACGAGCACCTGCCGGGCATTTCTGACTCGTTTGTGAACTGGGTGGCCGAGAAGGAATGGGAGCTGCCCCCGGATTCTGACATGGATCGGAATCTGATCGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGACTTCCTGGTCCACTGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTCTTTGTTCAGTTCGAGAAGGGCGAGTCCTACTTTCACCTGCACGTTCTGGTCGAGACCACGGGGGTCAAGTCCATGGTCCTGGGCCGCTTCCTGAGTCAGATCAGAGACAGGCTGGTGCAGACCATCTACCGCGGGGTAGAGCCCACGCTGCCCAACTGGTTCGCGGTGACCAAGACGCGAAATGGCGCCGGCGGGGGGAACAAGGTGGTGGACGAGTGCTACATCCCCAACTACCTCCTGCCCAAGACGCAGCCCGAGCTGCAGTGGGCGTGGACTAACATGGAGGAGTATATAAGCGCGTGTCTGAACCTCGCGGAGCGTAAACGGCTCGTGGCGCAGCACCTGACCCACGTCAGCCAGACGCAGGAGCAGAACAAGGAGAATCTGAACCCGAATTCTGACGCGCCCGTGATCAGGTCAAAAACCTCCGCGCGCTACATGGAGCTGGTCGGGTGGCTGGTGGACCGGGGCATCACCTCCGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCCCAGATCAAGGCCGCGCTGGACAATGCCGGAAAGATCATGGCGCTGACCAAATCCGCGCCCGACTACCTGGTAGGCCCGTCCTTACCCGCGGACATTAAGGCCAACCGCATCTACCGCATCCTGGAGCTCAACGGCTACGACCCCGCCTACGCCGGCTCCGTCTTCCTGGGCTGGGCGCAGAAAAAGTTCGGTAAAAGGAATACAATTTGGCTGTTCGGGCCCGCCACCACCGGCAAGACCAACATCGCGGAAGCCATCGCCCACGCCGTGCCCTTCTACGGCTGCGTCAACTGGACCAATGAGAACTTTCCCTTCAACGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACCGCCAAGGTCGTGGAGTCCGCCAAGGCCATTCTGGGCGGAAGCAAGGTGCGCGTCGACCAAAAGTGCAAGTCCTCGGCCCAGATCGACCCCACGCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATCGACGGGAACAGCACCACCTTCGAGCACCAGCAGCCCCTGCAGGACCGCATGTTCAAGTTCGAGCTCACCCGCCGTCTGGAGCACGACTTTGGCAAGGTGACCAAGCAGGAAGTCAAAGAGTTCTTCCGCTGGGCTCAGGATCACGTGACTGAGGTGACGCATGAGTTCTACGTCAGAAAGGGCGGAGCCACCAAAAGACCCGCCCCCAGTGACGCGGATATAAGCGAGCCCAAGCGGGCCTGCCCCTCAGTTGCGGAGCCATCGACGTCAGACGCGGAAGCACCGGTGGACTTTGCGGACAGGTACCAAAACAAATGTTCTCGTCACGCGGGCATGCTTCAGATGCTGTTTCCCTGCAAGACATGCGAGAGAATGAATCAGAATTTCAACGTCTGCTTCACGCACGGGGTCAGAGACTGCTCAGAGTGCTTCCCCGGCGCGTCAGAATCTCAACCTGTCGTCAGAAAAAAGACGTATCAGAAACTGTGCGCGATTCATCATCTGCTGGGGCGGGCACCCGAGATTGCGTGTTCGGCCTGCGATCTCGTCAACGTGGACTTGGATGACTGTGTTTCTGAGCAATAA

CapVP1：(SEQ ID NO:23)

ATGGCTGCTGACGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACCTGAAACCTGGAGCCCCCAAGCCCAAGGCCAACCAGCAGAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGCTGCTAAGACGGCTCCTGGAAAGAAGAGACCGGTAGAACCGTCACCTCAGCGTTCCCCCGACTCCTCCACGGGCATCGGCAAGAAAGGCCAGCAGCCCGCTAAAAAGAGACTGAACTTTGGGCAGACTGGCGAGTCAGAGTCAGTCCCCGACCCTCAACCAATCGGAGAACCACCAGCAGGCCCCTCTGGTCTGGGATCTGGTACAATGGCTGCAGGCGGTGGCGCTCCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAGTTCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAGCAAATCTCCAACGGGACATCGGGAGGAAGCACCAACGACAACACCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCAAAAAGACTCAGCTTCAAGCTCTTCAACATCCAGGTCAAGGAGGTCACGCAGAATGAAGGCACCAAGACCATCGCCAATAACCTTACCAGCACGATTCAGGTATTTACGGACTCGGAATACCAGCTGCCGTACGTCCTCGGCTCCGCGCACCAGGGCTGCCTGCCTCCGTTCCCGGCGGATGTCTTCATGATTCCCCAGTACGGCTACCTGACACTGAACAATGGAAGTCAAGCCGTAGGCCGTTCCTCCTTCTACTGCCTGGAATATTTTCCATCTCAAATGCTGCGAACTGGAAACAATTTTGAATTCAGCTACACCTTCGAGGACGTGCCTTTCCACAGCAGCTACGCACACAGCCAGAGCTTGGACCGACTGATGAATCCTCTCATTGACCAGTACCTGTACTACTTATCCAGAACTCAGTCCACAGGAGGAACTCAAGGTACCCAGCAATTGTTATTTTCTCAAGCTGGGCCTGCAAACATGTCGGCTCAGGCCAAGAACTGGCTGCCTGGACCTTGCTACCGGCAGCAGCGAGTCTCCACGACACTGTCGCAAAACAACAACAGCAACTTTGCTTGGACTGGTGCCACCAAATATCACCTGAACGGAAGAGACTCTCTGGTGAATCCCGGTGTCGCCATGGCAACCCACAAGGACGACGAGGAACGCTTCTTCCCGTCGAGCGGAGTCCTGATGTTTGGAAAACAGGGTGCTGGAAGAGACAATGTGGACTACAGCAGCGTTATGCTAACAAGCGAAGAAGAAATTAAAACCACTAACCCTGTAGCCACAGAACAATACGGCGTGGTGGCTGACAACTTGCAGCAAGCCAATACAGGGCCTATTGTGGGAAATGTCAACAGCCAAGGAGCCTTACCTGGCATGGTCTGGCAGAACCGAGACGTGTACCTGCAGGGTCCCATCTGGGCCAAGATTCCTCACACGGACGGCAACTTTCACCCGTCTCCTCTGATGGGCGGCTTTGGACTTAAACACCCGCCTCCACAGATCCTGATCAAGAACACGCCGGTACCTGCGGATCCTCCAACAACGTTCAGCCAGGCGAAATTGGCTTCCTTCATCACGCAGTACAGCACCGGACAGGTCAGCGTGGAAATCGAGTGGGAGCTGCAGAAGGAGAACAGCAAACGCTGGAACCCAGAGATTCAGTACACTTCAAACTACTACAAATCTACAAATGTGGACTTTGCTGTCAATACAGAGGGAACTTATTCTGAGCCTCGCCCCATTGGTACTCGTTATCTGACACGTAATCTGTAA

AAV-11

部分基因组：AY631966

Rep78：(SEQ ID NO:24)

ATGCCGGGCTTCTACGAGATCGTGATCAAGGTGCCGAGCGACCTGGACGAGCACCTGCCGGGCATTTCTGACTCGTTTGTGAACTGGGTGGCCGAGAAGGAATGGGAGCTGCCCCCGGATTCTGACATGGATCGGAATCTGATCGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGACTTCCTGGTCCACTGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTCTTTGTTCAGTTCGAGAAGGGCGAGTCCTACTTCCACCTCCACGTTCTCGTCGAGACCACGGGGGTCAAGTCCATGGTCCTGGGCCGCTTCCTGAGTCAGATCAGAGACAGGCTGGTGCAGACCATCTACCGCGGGGTCGAGCCCACGCTGCCCAACTGGTTCGCGGTGACCAAGACGCGAAATGGCGCCGGCGGGGGGAACAAGGTGGTGGACGAGTGCTACATCCCCAACTACCTCCTGCCCAAGACCCAGCCCGAGCTGCAGTGGGCGTGGACTAACATGGAGGAGTATATAAGCGCGTGTCTAAACCTCGCGGAGCGTAAACGGCTCGTGGCGCAGCACCTGACCCACGTCAGCCAGACGCAGGAGCAGAACAAGGAGAATCTGAACCCGAATTCTGACGCGCCCGTGATCAGGTCAAAAACCTCCGCGCGCTACATGGAGCTGGTCGGGTGGCTGGTGGACCGGGGCATCACCTCCGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCCCAGATCAAGGCCGCGCTGGACAATGCCGGAAAGATCATGGCGCTGACCAAATCCGCGCCCGACTACCTGGTAGGCCCGTCCTTACCCGCGGACATTAAGGCCAACCGCATCTACCGCATCCTGGAGCTCAACGGCTACGACCCCGCCTACGCCGGCTCCGTCTTCCTGGGCTGGGCGCAGAAAAAGTTCGGTAAACGCAACACCATCTGGCTGTTTGGGCCCGCCACCACCGGCAAGACCAACATCGCGGAAGCCATAGCCCACGCCGTGCCCTTCTACGGCTGCGTGAACTGGACCAATGAGAACTTTCCCTTCAACGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACCGCCAAGGTCGTGGAGTCCGCCAAGGCCATTCTGGGCGGAAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCCTCGGCCCAGATCGACCCCACGCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATCGACGGGAACAGCACCACCTTCGAGCACCAGCAGCCGCTGCAGGACCGCATGTTCAAGTTCGAGCTCACCCGCCGTCTGGAGCACGACTTTGGCAAGGTGACCAAGCAGGAAGTCAAAGAGTTCTTCCGCTGGGCTCAGGATCACGTGACTGAGGTGGCGCATGAGTTCTACGTCAGAAAGGGCGGAGCCACCAAAAGACCCGCCCCCAGTGACGCGGATATAAGCGAGCCCAAGCGGGCCTGCCCCTCAGTTCCGGAGCCATCGACGTCAGACGCGGAAGCACCGGTGGACTTTGCGGACAGGTACCAAAACAAATGTTCTCGTCACGCGGGCATGCTTCAGATGCTGTTTCCCTGCAAGACATGCGAGAGAATGAATCAGAATTTCAACGTCTGCTTCACGCACGGGGTCAGAGACTGCTCAGAGTGCTTCCCCGGCGCGTCAGAATCTCAACCCGTCGTCAGAAAAAAGACGTATCAGAAACTGTGCGCGATTCATCATCTGCTGGGGCGGGCACCCGAGATTGCGTGTTCGGCCTGCGATCTCGTCAACGTGGACTTGGATGACTGTGTTTCTGAGCAATAA

CapVP1：(SEQ ID NO:25)

ATGGCTGCTGACGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACCTGAAACCTGGAGCCCCGAAGCCCAAGGCCAACCAGCAGAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGAGGGTACTCGAACCTCTGGGCCTGGTTGAAGAAGGTGCTAAAACGGCTCCTGGAAAGAAGAGACCGTTAGAGTCACCACAAGAGCCCGACTCCTCCTCGGGCATCGGCAAAAAAGGCAAACAACCAGCCAGAAAGAGGCTCAACTTTGAAGAGGACACTGGAGCCGGAGACGGACCCCCTGAAGGATCAGATACCAGCGCCATGTCTTCAGACATTGAAATGCGTGCAGCACCGGGCGGAAATGCTGTCGATGCGGGACAAGGTTCCGATGGAGTGGGTAATGCCTCGGGTGATTGGCATTGCGATTCCACCTGGTCTGAGGGCAAGGTCACAACAACCTCGACCAGAACCTGGGTCTTGCCCACCTACAACAACCACTTGTACCTGCGTCTCGGAACAACATCAAGCAGCAACACCTACAACGGATTCTCCACCCCCTGGGGATATTTTGACTTCAACAGATTCCACTGTCACTTCTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGACTACGACCAAAAGCCATGCGCGTTAAAATCTTCAATATCCAAGTTAAGGAGGTCACAACGTCGAACGGCGAGACTACGGTCGCTAATAACCTTACCAGCACGGTTCAGATATTTGCGGACTCGTCGTATGAGCTCCCGTACGTGATGGACGCTGGACAAGAGGGGAGCCTGCCTCCTTTCCCCAATGACGTGTTCATGGTGCCTCAATATGGCTACTGTGGCATCGTGACTGGCGAGAATCAGAACCAAACGGACAGAAACGCTTTCTACTGCCTGGAGTATTTTCCTTCGCAAATGTTGAGAACTGGCAACAACTTTGAAATGGCTTACAACTTTGAGAAGGTGCCGTTCCACTCAATGTATGCTCACAGCCAGAGCCTGGACAGACTGATGAATCCCCTCCTGGACCAGTACCTGTGGCACTTACAGTCGACTACCTCTGGAGAGACTCTGAATCAAGGCAATGCAGCAACCACATTTGGAAAAATCAGGAGTGGAGACTTTGCCTTTTACAGAAAGAACTGGCTGCCTGGGCCTTGTGTTAAACAGCAGAGATTCTCAAAAACTGCCAGTCAAAATTACAAGATTCCTGCCAGCGGGGGCAACGCTCTGTTAAAGTATGACACCCACTATACCTTAAACAACCGCTGGAGCAACATCGCGCCCGGACCTCCAATGGCCACAGCCGGACCTTCGGATGGGGACTTCAGTAACGCCCAGCTTATATTCCCTGGACCATCTGTTACCGGAAATACAACAACTTCAGCCAACAATCTGTTGTTTACATCAGAAGAAGAAATTGCTGCCACCAACCCAAGAGACACGGACATGTTTGGCCAGATTGCTGACAATAATCAGAATGCTACAACTGCTCCCATAACCGGCAACGTGACTGCTATGGGAGTGCTGCCTGGCATGGTGTGGCAAAACAGAGACATTTACTACCAAGGGCCAATTTGGGCCAAGATCCCACACGCGGACGGACATTTTCATCCTTCACCGCTGATTGGTGGGTTTGGACTGAAACACCCGCCTCCCCAGATATTCATCAAGAACACTCCCGTACCTGCCAATCCTGCGACAACCTTCACTGCAGCCAGAGTGGACTCTTTCATCACACAATACAGCACCGGCCAGGTCGCTGTTCAGATTGAATGGGAAATTGAAAAGGAACGCTCCAAACGCTGGAATCCTGAAGTGCAGTTTACTTCAAACTATGGGAACCAGTCTTCTATGTTGTGGGCTCCTGATACAACTGGGAAGTATACAGAGCCGCGGGTTATTGGCTCTCGTTATTTGACTAATCATTTGTAA

AAV-12

部分基因组：DQ813647

Rep78：(SEQ ID NO:26)

ATGCCGGGGTTCTACGAGGTGGTGATCAAGGTGCCCAGCGACCTGGACGAGCACCTGCCCGGCATTTCTGACTCCTTTGTGAACTGGGTGGCCGAGAAGGAATGGGAGTTGCCCCCGGATTCTGACATGGATCAGAATCTGATTGAGCAGGCACCCCTGACCGTGGCCGAGAAGCTGCAGCGCGAGTTCCTGGTGGAATGGCGCCGAGTGAGTAAATTTCTGGAGGCCAAGTTTTTTGTGCAGTTTGAAAAGGGGGACTCGTACTTTCATTTGCATATTCTGATTGAAATTACCGGCGTGAAATCCATGGTGGTGGGCCGCTACGTGAGTCAGATTAGGGATAAACTGATCCAGCGCATCTACCGCGGGGTCGAGCCCCAGCTGCCCAACTGGTTCGCGGTCACAAAGACCCGAAATGGCGCCGGAGGCGGGAACAAGGTGGTGGACGAGTGCTACATCCCCAACTACCTGCTCCCCAAGGTCCAGCCCGAGCTTCAGTGGGCGTGGACTAACATGGAGGAGTATATAAGCGCCTGTTTGAACCTCGCGGAGCGTAAACGGCTCGTGGCGCAGCACCTGACGCACGTCTCCCAGACCCAGGAGGGCGACAAGGAGAATCTGAACCCGAATTCTGACGCGCCGGTGATCCGGTCAAAAACCTCCGCCAGGTACATGGAGCTGGTCGGGTGGCTGGTGGACAAGGGCATCACGTCCGAGAAGCAGTGGATCCAGGAGGACCAGGCCTCGTACATCTCCTTCAACGCGGCCTCCAACTCCCGGTCGCAGATCAAGGCGGCCCTGGACAATGCCTCCAAAATCATGAGCCTCACCAAAACGGCTCCGGACTATCTCATCGGGCAGCAGCCCGTGGGGGACATTACCACCAACCGGATCTACAAAATCCTGGAACTGAACGGGTACGACCCCCAGTACGCCGCCTCCGTCTTTCTCGGCTGGGCCCAGAAAAAGTTTGGAAAGCGCAACACCATCTGGCTGTTTGGGCCCGCCACCACCGGCAAGACCAACATCGCGGAAGCCATCGCCCACGCGGTCCCCTTCTACGGCTGCGTCAACTGGACCAATGAGAACTTTCCCTTCAACGACTGCGTCGACAAAATGGTGATTTGGTGGGAGGAGGGCAAGATGACCGCCAAGGTCGTAGAGTCCGCCAAGGCCATTCTGGGCGGCAGCAAGGTGCGCGTGGACCAAAAATGCAAGGCCTCTGCGCAGATCGACCCCACCCCCGTGATCGTCACCTCCAACACCAACATGTGCGCCGTGATTGACGGGAACAGCACCACCTTCGAGCACCAGCAGCCCCTGCAGGACCGGATGTTCAAGTTTGAACTCACCCGCCGCCTCGACCACGACTTTGGCAAGGTCACCAAGCAGGAAGTCAAGGACTTTTTCCGGTGGGCGGCTGATCACGTGACTGACGTGGCTCATGAGTTTTACGTCACAAAGGGTGGAGCTAAGAAAAGGCCCGCCCCCTCTGACGAGGATATAAGCGAGCCCAAGCGGCCGCGCGTGTCATTTGCGCAGCCGGAGACGTCAGACGCGGAAGCTCCCGGAGACTTCGCCGACAGGTACCAAAACAAATGTTCTCGTCACGCGGGTATGCTGCAGATGCTCTTTCCCTGCAAGACGTGCGAGAGAATGAATCAGAATTCCAACGTCTGCTTCACGCACGGTCAGAAAGATTGCGGGGAGTGCTTTCCCGGGTCAGAATCTCAACCGGTTTCTGTCGTCAGAAAAACGTATCAGAAACTGTGCATCCTTCATCAGCTCCGGGGGGCACCCGAGATCGCCTGCTCTGCTTGCGACCAACTCAACCCCGATTTGGACGATTGCCAATTTGAGCAATAA

CapVP1：(SEQ ID NO:27)

ATGGCTGCTGACGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAAGGCATTCGCGAGTGGTGGGCGCTGAAACCTGGAGCTCCACAACCCAAGGCCAACCAACAGCATCAGGACAACGGCAGGGGTCTTGTGCTTCCTGGGTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGAGAGCCGGTCAACGAGGCAGACGCCGCGGCCCTCGAGCACGACAAGGCCTACGACAAGCAGCTCGAGCAGGGGGACAACCCGTATCTCAAGTACAACCACGCCGACGCCGAGTTCCAGCAGCGCTTGGCGACCGACACCTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAAAAGAGGATTCTCGAGCCTCTGGGTCTGGTTGAAGAGGGCGTTAAAACGGCTCCTGGAAAGAAACGCCCATTAGAAAAGACTCCAAATCGGCCGACCAACCCGGACTCTGGGAAGGCCCCGGCCAAGAAAAAGCAAAAAGACGGCGAACCAGCCGACTCTGCTAGAAGGACACTCGACTTTGAAGACTCTGGAGCAGGAGACGGACCCCCTGAGGGATCATCTTCCGGAGAAATGTCTCATGATGCTGAGATGCGTGCGGCGCCAGGCGGAAATGCTGTCGAGGCGGGACAAGGTGCCGATGGAGTGGGTAATGCCTCCGGTGATTGGCATTGCGATTCCACCTGGTCAGAGGGCCGAGTCACCACCACCAGCACCCGAACCTGGGTCCTACCCACGTACAACAACCACCTGTACCTGCGAATCGGAACAACGGCCAACAGCAACACCTACAACGGATTCTCCACCCCCTGGGGATACTTTGACTTTAACCGCTTCCACTGCCACTTTTCCCCACGCGACTGGCAGCGACTCATCAACAACAACTGGGGACTCAGGCCGAAATCGATGCGTGTTAAAATCTTCAACATACAGGTCAAGGAGGTCACGACGTCAAACGGCGAGACTACGGTCGCTAATAACCTTACCAGCACGGTTCAGATCTTTGCGGATTCGACGTATGAACTCCCATACGTGATGGACGCCGGTCAGGAGGGGAGCTTTCCTCCGTTTCCCAACGACGTCTTTATGGTTCCCCAATACGGATACTGCGGAGTTGTCACTGGAAAAAACCAGAACCAGACAGACAGAAATGCCTTTTACTGCCTGGAATACTTTCCATCCCAAATGCTAAGAACTGGCAACAATTTTGAAGTCAGTTACCAATTTGAAAAAGTTCCTTTCCATTCAATGTACGCGCACAGCCAGAGCCTGGACAGAATGATGAATCCTTTACTGGATCAGTACCTGTGGCATCTGCAATCGACCACTACCGGAAATTCCCTTAATCAAGGAACAGCTACCACCACGTACGGGAAAATTACCACTGGAGACTTTGCCTACTACAGGAAAAACTGGTTGCCTGGAGCCTGCATTAAACAACAAAAATTTTCAAAGAATGCCAATCAAAACTACAAGATTCCCGCCAGCGGGGGAGACGCCCTTTTAAAGTATGACACGCATACCACTCTAAATGGGCGATGGAGTAACATGGCTCCTGGACCTCCAATGGCAACCGCAGGTGCCGGGGACTCGGATTTTAGCAACAGCCAGCTGATCTTTGCCGGACCCAATCCGAGCGGTAACACGACCACATCTTCAAACAATTTGTTGTTTACCTCAGAAGAGGAGATTGCCACAACAAACCCACGAGACACGGACATGTTTGGACAGATTGCAGATAATAATCAAAATGCCACCACCGCCCCTCACATCGCTAACCTGGACGCTATGGGAATTGTTCCCGGAATGGTCTGGCAAAACAGAGACATCTACTACCAGGGCCCTATTTGGGCCAAGGTCCCTCACACGGACGGACACTTTCACCCTTCGCCGCTGATGGGAGGATTTGGACTGAAACACCCGCCTCCACAGATTTTCATCAAAAACACCCCCGTACCCGCCAATCCCAATACTACCTTTAGCGCTGCAAGGATTAATTCTTTTCTGACGCAGTACAGCACCGGACAAGTTGCCGTTCAGATCGACTGGGAAATTCAGAAGGAGCATTCCAAACGCTGGAATCCCGAAGTTCAATTTACTTCAAACTACGGCACTCAAAATTCTATGCTGTGGGCTCCCGACAATGCTGGCAACTACCACGAACTCCGGGCTATTGGGTCCCGTTTCCTCACCCACCACTTGTAA

AAV-13

部分基因组：EU285562

Rep78：(SEQ ID NO:28)

ATGCCGGGATTCTACGAGATTGTCCTGAAGGTGCCCAGCGACCTGGACGAGCACCTGCCTGGCATTTCTGACTCTTTTGTAAACTGGGTGGCGGAGAAGGAATGGGAGCTGCCGCCGGATTCTGACATGGATCTGAATCTGATTGAGCAGGCACCCCTAACCGTGGCCGAAAAGCTGCAACGCGAATTCCTGGTCGAGTGGCGCCGCGTGAGTAAGGCCCCGGAGGCCCTCTTCTTTGTTCAGTTCGAGAAGGGGGACAGCTACTTCCACCTACACATTCTGGTGGAGACCGTGGGCGTGAAATCCATGGTGGTGGGCCGCTACGTGAGCCAGATTAAAGAGAAGCTGGTGACCCGCATCTACCGCGGGGTCGAGCCGCAGCTTCCGAACTGGTTCGCGGTGACCAAGACGCGTAATGGCGCCGGAGGCGGGAACAAGGTGGTGGACGACTGCTACATCCCCAACTACCTGCTCCCCAAGACCCAGCCCGAGCTCCAGTGGGCGTGGACTAATATGGACCAGTATTTAAGCGCCTGTTTGAATCTCGCGGAGCGTAAACGGCTGGTGGCGCAGCATCTGACGCACGTGTCGCAGACGCAGGAGCAGAACAAAGAGAACCAGAATCCCAATTCTGACGCGCCGGTGATCAGATCAAAAACCTCCGCGAGGTACATGGAGCTGGTCGGGTGGCTGGTGGACCGCGGGATCACGTCAGAAAAGCAATGGATCCAGGAGGACCAGGCCTCTTACATCTCCTTCAACGCCGCCTCCAACTCGCGGTCACAAATCAAGGCCGCACTGGACAATGCCTCCAAATTTATGAGCCTGACAAAAACGGCTCCGGACTACCTGGTGGGAAACAACCCGCCGGAGGACATTACCAGCAACCGGATCTACAAAATCCTCGAGATGAACGGGTACGATCCGCAGTACGCGGCCTCCGTCTTCCTGGGCTGGGCGCAAAAGAAGTTCGGGAAGAGGAACACCATCTGGCTCTTTGGGCCGGCCACGACGGGTAAAACCAACATCGCTGAAGCTATCGCCCACGCCGTGCCCTTTTACGGCTGCGTGAACTGGACCAATGAGAACTTTCCGTTCAACGATTGCGTCGACAAGATGGTGATCTGGTGGGAGGAGGGCAAGATGACGGCCAAGGTCGTGGAGTCCGCCAAGGCCATTCTGGGCGGAAGCAAGGTGCGCGTGGACCAAAAGTGCAAGTCATCGGCCCAGATCGACCCAACTCCCGTCATCGTCACCTCCAACACCAACATGTGCGCGGTCATCGACGGAAATTCCACCACCTTCGAGCACCAACAACCACTCCAAGACCGGATGTTCAAGTTCGAGCTCACCAAGCGCCTGGAGCACGACTTTGGCAAGGTCACCAAGCAGGAAGTCAAGGACTTTTTCCGGTGGGCGTCAGATCACGTGACTGAGGTGTCTCACGAGTTTTACGTCAGAAAGGGTGGAGCTAGAAAGAGGCCCGCCCCCAATGACGCAGATATAAGTGAGCCCAAGCGGGCCTGTCCGTCAGTTGCGCAGCCATCGACGTCAGACGCGGAAGCTCCGGTGGACTACGCGGACAGGTACCAAAACAAATGTTCTCGTCACGTGGGCATGAATCTGATGCTTTTTCCCTGCCGGCAATGCGAGAGAATGAATCAGAATGTGGACATTTGCTTCACGCACGGGGTCATGGACTGTGCCGAGTGCTTCCCCGTGTCAGAATCTCAACCCGTGTCTGTCGTCAGAAAGCGGACATATCAGAAACTGTGTCCGATTCATCACATCATGGGGAGGGCGCCCGAGGTGGCTTGTTCGGCCTGCGATCTGGCCAATGTGGACTTGGATGACTGTGACATGGAGCAATAA

CapVP1：(SEQ ID NO:29)

ATGACTGACGGTTACCTTCCAGATTGGCTAGAGGACAACCTCTCTGAAGGCGTTCGAGAGTGGTGGGCGCTGCAACCTGGAGCCCCTAAACCCAAGGCAAATCAACAACATCAGGACAACGCTCGGGGTCTTGTGCTTCCGGGTTACAAATACCTCGGACCCGGCAACGGACTTGACAAGGGGGAACCCGTCAACGCAGCGGACGCGGCAGCCCTCGAACACGACAAGGCCTACGACCAGCAGCTCAAGGCCGGTGACAACCCCTACCTCAAGTACAACCACGCCGACGCCGAGTTTCAGGAGCGTCTTCAAGAAGATACGTCTTTTGGGGGCAACCTCGGACGAGCAGTCTTCCAGGCCAAAAAGAGGATCCTTGAGCCTCTGGGTCTGGTTGAGGAAGCGGCTAAGACGGCTCCTGGAAAAAAGAGACCTGTAGAGCAATCTCCAGCAGAACCGGACTCCTCTTCGGGCATCGGCAAATCAGGCCAGCAGCCCGCTAGAAAAAGACTGAATTTTGGTCAGACTGGCGACACAGAGTCAGTCCCAGACCCTCAACCACTCGGACAACCTCCCGCAGCCCCCTCTGGTGTGGGATCTACTACAATGGCTTCAGGCGGTGGCGCACCAATGGCAGACAATAACGAGGGTGCCGATGGAGTGGGTAATTCCTCAGGAAATTGGCATTGCGATTCCCAATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGCACCTGGGCCCTGCCCACCTACAACAATCACCTCTACAAGCAAATCTCCAGCCAATCAGGAGCCACCAACGACAACCACTACTTTGGCTACAGCACCCCCTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCCGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAGGGATGCCTCCCGCCGTTCCCAGCAGACGTCTTCATGGTCCCACAGTATGGATACCTCACCCTGAACAACGGGAGTCAGGCGGTAGGACGCTCTTCCTTTTACTGCCTGGAGTACTTTCCTTCTCAGATGCTGCGTACTGGAAACAACTTTCAGTTTAGCTACACTTTTGAAGACGTGCCTTTCCACAGCAGCTACGCTCACAGCCAAAGTCTGGACCGTCTCATGAATCCTCTGATCGACCAGTACCTGTACTATCTGAACAGGACACAAACAGCCAGTGGAACTCAGCAGTCTCGGCTACTGTTTAGCCAAGCTGGACCCACCAGTATGTCTCTTCAAGCTAAAAACTGGCTGCCTGGACCTTGCTACAGACAGCAGCGTCTGTCAAAGCAGGCAAACGACAACAACAACAGCAACTTTCCCTGGACTGGTGCCACCAAATATCATCTGAATGGCCGGGACTCATTGGTGAACCCGGGCCCTGCTATGGCCAGTCACAAGGATGACAAAGAAAAGTTTTTCCCCATGCATGGAACCCTGATATTTGGTAAAGAAGGAACAAATGCCAACAACGCGGATTTGGAAAATGTCATGATTACAGATGAAGAAGAAATCCGCACCACCAATCCCGTGGCTACGGAGCAGTACGGGACTGTGTCAAATAATTTGCAAAACTCAAACGCTGGTCCAACTACTGGAACTGTCAATCACCAAGGAGCGTTACCTGGTATGGTGTGGCAGGATCGAGACGTGTACCTGCAGGGACCCATTTGGGCCAAGATTCCTCACACCGATGGACACTTTCATCCTTCTCCACTGATGGGAGGTTTTGGGCTCAAACACCCGCCTCCTCAGATCATGATCAAAAACACTCCCGTTCCAGCCAATCCTCCCACAAACTTTAGTGCGGCAAAGTTTGCTTCCTTCATCACACAGTACTCCACGGGGCAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAGAACAGCAAACGCTGGAATCCCGAAATTCAGTACACTTCCAACTACAACAAATCTGTTAATGTGGACTTTACTGTGGACACTAATGGTGTGTATTCAGAGCCTCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA

ITR序列(SEQ ID NO:30)

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT

Rep2序列–含有Rep78和Rep52(起始密码子带下划线)(SEQ ID NO:31)

Cap2序列–依次含有VP1、VP2、AAP、VP3(起始密码子带下划线)(SEQ ID NO:32)

ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACACTCTCTCTGAAGGAATAAGACAGTGGTGGAAGCTCAAACCTGGCCCACCACCACCAAAGCCCGCAGAGCGGCATAAGGACGACAGCAGGGGTCTTGTGCTTCCTGGGTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGAGAGCCGGTCAACGAGGCAGACGCCGCGGCCCTCGAGCACGACAAAGCCTACGACCGGCAGCTCGACAGCGGAGACAACCCGTACCTCAAGTACAACCACGCCGACGCGGAGTTTCAGGAGCGCCTTAAAGAAGATACGTCTTTTGGGGGCAACCTCGGACGAGCAGTCTTCCAGGCGAAAAAGAGGGTTCTTGAACCTCTGGGCCTGGTTGAGGAACCTGTTAAGACGGCTCCGGGAAAAAAGAGGCCGGTAGAGCACTCTCCTGTGGAGCCAGACTCCTCCTCGGGAACCGGAAAGGCGGGCCAGCAGCCTGCAAGAAAAAGATTGAATTTTGGTCAGACTGGAGACGCAGACTCAGTACCTGACCCCCAGCCTCTCGGACAGCCACCAGCAGCCCCCTCTGGTCTGGGAACTAATACGAT GGCTACAGGCAGTGGCGCACCAATGGCAGACAATAACGAGGGCGCCGACGGAGTGGGTAATTCCTCGGGAAATTGGCATTGCGATTCCACATGGATGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTGCCCACCTACAACAACCACCTCTACAAACAAATTTCCAGCCAATCAGGAGCCTCGAACGACAATCACTACTTTGGCTACAGCACCCCTTGGGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGACTGGCAAAGACTCATCAACAACAACTGGGGATTCCGACCCAAGAGACTCAACTTCAAGCTCTTTAACATTCAAGTCAAAGAGGTCACGCAGAATGACGGTACGACGACGATTGCCAATAACCTTACCAGCACGGTTCAGGTGTTTACTGACTCGGAGTACCAGCTCCCGTACGTCCTCGGCTCGGCGCATCAAGGATGCCTCCCGCCGTTCCCAGCAGACGTCTTCATGGTGCCACAGTATGGATACCTCACCCTGAACAACGGGAGTCAGGCAGTAGGACGCTCTTCATTTTACTGCCTGGAGTACTTTCCTTCTCAGATGCTGCGTACCGGAAACAACTTTACCTTCAGCTACACTTTTGAGGACGTTCCTTTCCACAGCAGCTACGCTCACAGCCAGAGTCTGGACCGTCTCATGAATCCTCTCATCGACCAGTACCTGTATTACTTGAGCAGAACAAACACTCCAAGTGGAACCACCACGCAGTCAAGGCTTCAGTTTTCTCAGGCCGGAGCGAGTGACATTCGGGACCAGTCTAGGAACTGGCTTCCTGGACCCTGTTACCGCCAGCAGCGAGTATCAAAGACATCTGCGGATAACAACAACAGTGAATACTCGTGGACTGGAGCTACCAAGTACCACCTCAATGGCAGAGACTCTCTGGTGAATCCGGGCCCGGCCATGGCAAGCCACAAGGACGATGAAGAAAAGTTTTTTCCTCAGAGCGGGGTTCTCATCTTTGGGAAGCAAGGCTCAGAGAAAACAAATGTGGACATTGAAAAGGTCATGATTACAGACGAAGAGGAAATCAGGACAACCAATCCCGTGGCTACGGAGCAGTATGGTTCTGTATCTACCAACCTCCAGAGAGGCAACAGACAAGCAGCTACCGCAGATGTCAACACACAAGGCGTTCTTCCAGGCATGGTCTGGCAGGACAGAGATGTGTACCTTCAGGGGCCCATCTGGGCAAAGATTCCACACACGGACGGACATTTTCACCCCTCTCCCCTCATGGGTGGATTCGGACTTAAACACCCTCCTCCACAGATTCTCATCAAGAACACCCCGGTACCTGCGAATCCTTCGACCACCTTCAGTGCGGCAAAGTTTGCTTCCTTCATCACACAGTACTCCACGGGACAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAAAACAGCAAACGCTGGAATCCCGAAATTCAGTACACTTCCAACTACAACAAGTCTGTTAATGTGGACTTTACTGTGGACACTAATGGCGTGTATTCAGAGCCTCGCCCCATTGGCACCAGATACCTGACTCGTAATCTGTAA

Cap5序列–依次含有VP1、VP2、AAP、VP3(起始密码子带下划线)(SEQ ID NO:33)

ATGGCTTTTGTTGATCACCCTCCAGATTGGTTGGAAGAAGTTGGTGAAGGTCTTCGCGAGTTTTTGGGCCTTGAAGCGGGCCCACCGAAACCAAAACCCAATCAGCAGCATCAAGATCAAGCCCGTGGTCTTGTGCTGCCTGGTTATAACTATCTCGGACCCGGAAACGGTCTCGATCGAGGAGAGCCTGTCAACAGGGCAGACGAGGTCGCGCGAGAGCACGACATCTCGTACAACGAGCAGCTTGAGGCGGGAGACAACCCCTACCTCAAGTACAACCACGCGGACGCCGAGTTTCAGGAGAAGCTCGCCGACGACACATCCTTCGGGGGAAACCTCGGAAAGGCAGTCTTTCAGGCCAAGAAAAGGGTTCTCGAACCTTTTGGCCTGGTTGAAGAGGGTGCTAAGACGGCCCCTACCGGAAAGCGGATAGACGACCACTTTCCAAAAAGAAAGAAGGCTCGGACCGAAGAGGACTCCAAGCCTTCCACCTCGTCAGACGCCGAAGCTGGACCCAGCGGATCCCAGCAGCTGCAAATCCCAGCCCAACCAGCCTCAAGTTTGGGAGCTGATACAATGTCTGCGGGAGGTGGCGGCCCATTGGGCGACAATAACCAAGGTGCCGATGGAGTGGGCAATGCCTCGGGAGATTGGCATTGCGATTCCACGTGGATGGGGGACAGAGTCGTCACCAAGTCCACCCGAACCTGGGTGCTGCCCAGCTACAACAACCACCAGTACCGAGAGATCAAAAGCGGCTCCGTCGACGGAAGCAACGCCAACGCCTACTTTGGATACAGCACCCCCTGGGGGTACTTTGACTTTAACCGCTTCCACAGCCACTGGAGCCCCCGAGACTGGCAAAGACTCATCAACAACTACTGGGGCTTCAGACCCCGGTCCCTCAGAGTCAAAATCTTCAACATTCAAGTCAAAGAGGTCACGGTGCAGGACTCCACCACCACCATCGCCAACAACCTCACCTCCACCGTCCAAGTGTTTACGGACGACGACTACCAGCTGCCCTACGTCGTCGGCAACGGGACCGAGGGATGCCTGCCGGCCTTCCCTCCGCAGGTCTTTACGCTGCCGCAGTACGGTTACGCGACGCTGAACCGCGACAACACAGAAAATCCCACCGAGAGGAGCAGCTTCTTCTGCCTAGAGTACTTTCCCAGCAAGATGCTGAGAACGGGCAACAACTTTGAGTTTACCTACAACTTTGAGGAGGTGCCCTTCCACTCCAGCTTCGCTCCCAGTCAGAACCTCTTCAAGCTGGCCAACCCGCTGGTGGACCAGTACTTGTACCGCTTCGTGAGCACAAATAACACTGGCGGAGTCCAGTTCAACAAGAACCTGGCCGGGAGATACGCCAACACCTACAAAAACTGGTTCCCGGGGCCCATGGGCCGAACCCAGGGCTGGAACCTGGGCTCCGGGGTCAACCGCGCCAGTGTCAGCGCCTTCGCCACGACCAATAGGATGGAGCTCGAGGGCGCGAGTTACCAGGTGCCCCCGCAGCCGAACGGCATGACCAACAACCTCCAGGGCAGCAACACCTATGCCCTGGAGAACACTATGATCTTCAACAGCCAGCCGGCGAACCCGGGCACCACCGCCACGTACCTCGAGGGCAACATGCTCATCACCAGCGAGAGCGAGACGCAGCCGGTGAACCGCGTGGCGTACAACGTCGGCGGGCAGATGGCCACCAACAACCAGAGCTCCACCACTGCCCCCGCGACCGGCACGTACAACCTCCAGGAAATCGTGCCCGGCAGCGTGTGGATGGAGAGGGACGTGTACCTCCAAGGACCCATCTGGGCCAAGATCCCAGAGACGGGGGCGCACTTTCACCCCTCTCCGGCCATGGGCGGATTCGGACTCAAACACCCACCGCCCATGATGCTCATCAAGAACACGCCTGTGCCCGGAAATATCACCAGCTTCTCGGACGTGCCCGTCAGCAGCTTCATCACCCAGTACAGCACCGGGCAGGTCACCGTGGAGATGGAGTGGGAGCTCAAGAAGGAAAACTCCAAGAGGTGGAACCCAGAGATCCAGTACACAAACAACTACAACGACCCCCAGTTTGTGGACTTTGCCCCGGACAGCACCGGGGAATACAGAAGCACCAGACCTATCGGAACCCGATACCTTACCCGACCCCTTTAA

实例12-腺病毒多核苷酸序列

腺病毒(Ad)多核苷酸可以选自任何血清型，并且代表性多核苷酸在下文例示。

E2A全序列(SEQ ID NO:34)

CGACCGCACCCTGTGACGAAAGCCGCCCGCAAGCTGCGCCCCTGAGTTAGTCATCTGAACTTCGGCCTGGGCGTCTCTGGGAAGTACCACAGTGGTGGGAGCGGGACTTTCCTGGTACACCAGGGCAGCGGGCCAACTACGGGGATTAAGGTTATTACGAGGTGTGGTGGTAATAGCCGCCTGTTCGAGGAGAATTCGGTTTCGGTGGGCGCGGATTCCGTTGACCCGGGATATCATGTGGGGTCCCGCGCTCATGTAGTTTATTCGGGTTGAGTAGTCTTGGGCAGCTCCAGCCGCAAGTCCCATTTGTGGCTGGTAACTCCACATGTAGGGCGTGGGAATTTCCTTGCTCATAATGGCGCTGACGACAGGTGCTGGCGCCGGGTGTGGCCGCTGGAGATGACGTAGTTTTCGCGCTTAAATTTGAGAAAGGGCGCGAAACTAGTCCTTAAGAGTCAGCGCGCAGTATTTGCTGAAGAGAGCCTCCGCGTCTTCCAGCGTGCGCCGAAGCTGATCTTCGCTTTTGTGATACAGGCAGCTGCGGGTGAGGGAGCGCAGAGACCTGTTTTTTATTTTCAGCTCTTGTTCTTGGCCCCTGCTTTGTTGAAATATAGCATACAGAGTGGGAAAAATCCTATTTCTAAGCTCGCGGGTCGATACGGGTTCGTTGGGCGCCAGACGCAGCGCTCCTCCTCCTGCTGCTGCCGCCGCTGTGGATTTCTTGGGCTTTGTCAGAGTCTTGCTATCCGGTCGCCTTTGCTTCTGTGTGACCGCTGCTGTTGCTGCCGCTGCCGCTGCCGCCGGTGCAGTAGGGGCTGTAGAGATGACGGTAGTAATGCAGGATGTTACGGGGGAAGGCCACGCCGTGATGGTAGAGAAGAAAGCGGCGGGCGAAGGAGATGTTGCCCCCACAGTCTTGCAAGCAAGCAACTATGGCGTTCTTGTGCCCGCGCCACGAGCGGTAGCCTTGGCGCTGTTGTTGCTCTTGGGCTAACGGCGGCGGCTGCTTAGACTTACCGGCCCTGGTTCCAGTGGTGTCCCATCTACGGTTGGGTCGGCGAACAGGCAGTGCCGGCGGCGCCTGAGGAGCGGAGGTTGTAGCGATGCTGGGAACGGTTGCCAATTTCTGGGGCGCCGGCGAGGGGAATGCGACCGAGGGTGACGGTGTTTCGTCTGACACCTCTTCGGCCTCGGAAGCTTCGTCTAGGCTGTCCCAGTCTTCCATCATCTCCTCCTCCTCGTCCAAAACCTCCTCTGCCTGACTGTCCCAGTATTCCTCCTCGTCCGTGGGTGGCGGCGGCGGCAGCTGCAGCTTCTTTTTGGGTGCCATCCTGGGAAGCAAGGGCCCGCGGCTGCTGATAGGGCTGCGGCGGCGGGGGGATTGGGTTGAGCTCCTCGCCGGACTGGGGGTCCAGGTAAACCCCCCGTCCCTTTCGTAGCAGAAACTCTTGGCGGGCTTTGTTGATGGCTTGCAATTGGCCAAGGATGTGGCCCTGGGTAATGACGCAGGCGGTAAGCTCCGCATTTGGCGGGCGGGATTGGTCTTCGTAGAACCTAATCTCGTGGGCGTGGTAGTCCTCAGGTACAAATTTGCGAAGGTAAGCCGACGTCCACAGCCCCGGAGTGAGTTTCAACCCCGGAGCCGCGGACTTTTCGTCAGGCGAGGGACCCTGCAGCTCAAAGGTACCGATAATTTGACTTTCGCTAAGCAGTTGCGAATTGCAGACCAGGGAGCGGTGCGGGGTGCATAGGTTGCAGCGACAGTGACACTCCAGTAGGCCGTCACCGCTCACGTCTTCCATGATGTCGGAGTGGTAGGCAAGGTAGTTGGCTAGCTGCAGAAGGTAGCAGTGACCCCAAAGCGGCGGAGGGCATTCACGGTACTTAATGGGCACAAAGTCGCTAGGAAGCGCACAGCAGGTGGCGGGCAGAATTCCTGAACGCTCTAGGATAAAGTTCCTAAAGTTTTGCAACATGCTTTGACTGGTGAAGTCTGGCAGACCCTGTTGCAGGGTTTTAAGCAGGCGTTCGGGGAAGATAATGTCCGCCAGGTGCGCGGCCACGGAGCGCTCGTTGAAGGCCGTCCATAGGTCCTTCAAGTTTTGCTTTAGCAGCTTCTGCAGCTCCTTTAGGTTGCGCTCCTCCAGGCATTGCTGCCACACGCCCATGGCCGTTTGCCAGGTGTAGCACAGAAATAAGTAAACGCAGTCGCGGACGTAGTCGCGGCGCGCCTCGCCCTTGAGCGTGGAATGAAGCACGTTTTGCCCGAGGCGGTTTTCGTGCAAAATTCCAAGGTAGGAGACCAGGTTGCAGAGCTCCACGTTGGAAATTTTGCAGGCCTGGCGCACGTAGCCCTGGCGAAAGGTGTAGTGCAACGTTTCCTCTAGCTTGCGCTGCATCTCCGGGTCAGCAAAGAACCGCTGCATGCACTCAAGCTCCACGGTAACAAGCACTGCGGCCATCATTAGCTTGCGTCGCTCCTCCAAGTCGGCAGGCTCGCGCGTCTCAAGCCAGCGCGCCAGCTGCTCATCGCCAACTGCGGGTAGGCCCTCCTCGGTTTGTTCTTGCAAGTTTGCATCCCTCTCCAGGGGTCGTGCACGGCGCACGATCAGCTCGCTCATGACTGTGCTCATAACCTTGGGGGGTAGGTTAAGTGCCGGGTAGGCAAAGTGGGTGACCTCGATGCTGCGTTTCAGCACGGCTAGGCGCGCGTTGTCACCCTCAAGTTCCACCAGCACTCCACAGTGACTTTCATTTTCGCTGTTTTCTTGTTGCAGAGCGTTTGCCGCGCGTTTCTCGTCGCGTCCAAGACCCTCAAAGATTTTTGGCACTTCGTCGAGCGAGGCGATATCAGGTATGACAGCGCCCTGCCGCAAGGCCAGCTGCTTGTCCGCTCGGCTGCGGTTGGCACGGCAGGATAGGGGTATCTTGCAGTTTTGGAAAAAGATGTGATAGGTGGCAAGCACCTCTGGCACGGCAAATACGGGGTAGAAGTTGAGGCGCGGGTTGGGCTCGCATGTGCCGTTTTCTTGGCGTTTGGGGGGTACGCGCGGTGAGAACAGGTGGCGTTCGTAGGCAAGGCTGACATCCGCTATGGCGAGGGGCACATCGCTGCGCTCTTGCAACGCGTCGCAGATAATGGCGCACTGGCGCTGCAGATGCTTCAACAGCACGTCGTCTCCCACATCTAGGTAGTCGCCATGCCTTTGGTCCCCCCGCCCGACTTGTTCCTCGTTTGCCTCTGCGTCGTCCTGGTCTTGCTTTTTATCCTCTGTTGGTACTGAGCGATCCTCGTCGTCTTCGCTTACAAAACCTGGGTCCTGCTCGATAATCACTTCCTCCTCCTCAAGCGGGGGTGCCTCGACGGGGAAGGTGGTAGGCGCGTTGGCGGCATCGGTGGAGGCGGTGGTGGCGAACTCAAAGGGGGCGGTTAGGCTGTCCTCCTTCTCGACTGACTCCATGATCTTTTTCTGCCTATAGGAGAAGGAAATGGCCAGTCGGGAAGAGGAGCAGCGCGAAACCACCCCCGAGCGCGGACGCGGTGCGGCGCGACGTCCACCAACCATGGAGGACGTGTCGTCCCCGTCGCCGTCGCCGCCGCCTCCCCGCGCGCCCCCAAAAAAGCGGCTGAGGCGGCGTCTCGAGTCCGAGGACGAAGAAGACTCGTCACAAGATGCGCTGGTGCCGCGCACACCCAGCCCGCGGCCATCGACCTCGACGGCGGATTTGGCCATTGCGTCCAAAAAGAAAAAGAAGCGCCCCTCTCCCAAGCCCGAGCGCCCGCCATCCCCAGAGGTGATCGTGGACAGCGAGGAAGAAAGAGAAGATGTGGCGCTACAAATGGTGGGTTTCAGCAACCCACCGGTGCTAATCAAGCACGGCAAGGGAGGTAAGCGCACGGTGCGGCGGCTGAATGAAGACGACCCAGTGGCGCGGGGTATGCGGACGCAAGAGGAAAAGGAAGAGTCCAGTGAAGCGGAAAGTGAAAGCACGGTGATAAACCCGCTGAGCCTGCCGATCGTGTCTGCGTGGGAGAAGGGCATGGAGGCTGCGCGCGCGTTGATGGACAAGTACCACGTGGATAACGATCTAAAGGCAAACTTCAAGCTACTGCCTGACCAAGTGGAAGCTCTGGCGGCCGTATGCAAGACCTGGCTAAACGAGGAGCACCGCGGGTTGCAGCTGACCTTCACCAGCAACAAGACCTTTGTGACGATGATGGGGCGATTCCTGCAGGCGTACCTGCAGTCGTTTGCAGAGGTAACCTACAAGCACCACGAGCCCACGGGCTGCGCGTTGTGGCTGCACCGCTGCGCTGAGATCGAAGGCGAGCTTAAGTGTCTACACGGGAGCATTATGATAAATAAGGAGCACGTGATTGAAATGGATGTGACGAGCGAAAACGGGCAGCGCGCGCTGAAGGAGCAGTCTAGCAAGGCCAAGATCGTGAAGAACCGGTGGGGCCGAAATGTGGTGCAGATCTCCAACACCGACGCAAGGTGCTGCGTGCATGACGCGGCCTGTCCGGCCAATCAGTTTTCCGGCAAGTCTTGCGGCATGTTCTTCTCTGAAGGCGCAAAGGCTCAGGTGGCTTTTAAGCAGATCAAGGCTTTCATGCAGGCGCTGTATCCTAACGCCCAGACCGGGCACGGTCACCTTCTGATGCCACTACGGTGCGAGTGCAACTCAAAGCCTGGGCATGCACCCTTTTTGGGAAGGCAGCTACCAAAGTTGACTCCGTTCGCCCTGAGCAACGCGGAGGACCTGGACGCGGATCTGATCTCCGACAAGAGCGTGCTGGCCAGCGTGCACCACCCGGCGCTGATAGTGTTCCAGTGCTGCAACCCTGTGTATCGCAACTCGCGCGCGCAGGGCGGAGGCCCCAACTGCGACTTCAAGATATCGGCGCCCGACCTGCTAAACGCGTTGGTGATGGTGCGCAGCCTGTGGAGTGAAAACTTCACCGAGCTGCCGCGGATGGTTGTGCCTGAGTTTAAGTGGAGCACTAAACACCAGTATCGCAACGTGTCCCTGCCAGTGGCGCATAGCGATGCGCGGCAGAACCCCTTTGATTTTTAAACGGCGCAGACGGCAAGGGTGGGGGGTAAATAATCACCCGAGAGTGTACAAATAAAAACATTTGCCTTTATTGAAAGTGTCTCCTAGTACATTATTTTTACATGTTTTTCAAGTGACAAAAAGAAGTGGCGCTCCTAATCTGCGCACTGTGGCTGCGGAAGTAGGGCGAGTGGCGCTCCAGGAAGCTGTAGAGCTGTTCCTGGTTGCGACGCAGGGTGGGCTGTACCTGGGGACTGTTAAGCATGGAGTTGGGTACC

E2A ORF序列(SEQ ID NO:35)

ATGGCCAGTCGGGAAGAGGAGCAGCGCGAAACCACCCCCGAGCGCGGACGCGGTGCGGCGCGACGTCCACCAACCATGGAGGACGTGTCGTCCCCGTCGCCGTCGCCGCCGCCTCCCCGCGCGCCCCCAAAAAAGCGGCTGAGGCGGCGTCTCGAGTCCGAGGACGAAGAAGACTCGTCACAAGATGCGCTGGTGCCGCGCACACCCAGCCCGCGGCCATCGACCTCGACGGCGGATTTGGCCATTGCGTCCAAAAAGAAAAAGAAGCGCCCCTCTCCCAAGCCCGAGCGCCCGCCATCCCCAGAGGTGATCGTGGACAGCGAGGAAGAAAGAGAAGATGTGGCGCTACAAATGGTGGGTTTCAGCAACCCACCGGTGCTAATCAAGCACGGCAAGGGAGGTAAGCGCACGGTGCGGCGGCTGAATGAAGACGACCCAGTGGCGCGGGGTATGCGGACGCAAGAGGAAAAGGAAGAGTCCAGTGAAGCGGAAAGTGAAAGCACGGTGATAAACCCGCTGAGCCTGCCGATCGTGTCTGCGTGGGAGAAGGGCATGGAGGCTGCGCGCGCGTTGATGGACAAGTACCACGTGGATAACGATCTAAAGGCAAACTTCAAGCTACTGCCTGACCAAGTGGAAGCTCTGGCGGCCGTATGCAAGACCTGGCTAAACGAGGAGCACCGCGGGTTGCAGCTGACCTTCACCAGCAACAAGACCTTTGTGACGATGATGGGGCGATTCCTGCAGGCGTACCTGCAGTCGTTTGCAGAGGTAACCTACAAGCACCACGAGCCCACGGGCTGCGCGTTGTGGCTGCACCGCTGCGCTGAGATCGAAGGCGAGCTTAAGTGTCTACACGGGAGCATTATGATAAATAAGGAGCACGTGATTGAAATGGATGTGACGAGCGAAAACGGGCAGCGCGCGCTGAAGGAGCAGTCTAGCAAGGCCAAGATCGTGAAGAACCGGTGGGGCCGAAATGTGGTGCAGATCTCCAACACCGACGCAAGGTGCTGCGTGCATGACGCGGCCTGTCCGGCCAATCAGTTTTCCGGCAAGTCTTGCGGCATGTTCTTCTCTGAAGGCGCAAAGGCTCAGGTGGCTTTTAAGCAGATCAAGGCTTTCATGCAGGCGCTGTATCCTAACGCCCAGACCGGGCACGGTCACCTTCTGATGCCACTACGGTGCGAGTGCAACTCAAAGCCTGGGCATGCACCCTTTTTGGGAAGGCAGCTACCAAAGTTGACTCCGTTCGCCCTGAGCAACGCGGAGGACCTGGACGCGGATCTGATCTCCGACAAGAGCGTGCTGGCCAGCGTGCACCACCCGGCGCTGATAGTGTTCCAGTGCTGCAACCCTGTGTATCGCAACTCGCGCGCGCAGGGCGGAGGCCCCAACTGCGACTTCAAGATATCGGCGCCCGACCTGCTAAACGCGTTGGTGATGGTGCGCAGCCTGTGGAGTGAAAACTTCACCGAGCTGCCGCGGATGGTTGTGCCTGAGTTTAAGTGGAGCACTAAACACCAGTATCGCAACGTGTCCCTGCCAGTGGCGCATAGCGATGCGCGGCAGAACCCCTTTGATTTTTAA

E4全序列(SEQ ID NO:36)

CCCGGGCGTTTTAGGGCGGAGTAACTTGCATGTATTGGGAATTGTAGTTTTTTTAAAATGGGAAGTGACGTATCGTGGGAAAACGGAAGTGAAGATTTGAGGAAGTTGTGGGTTTTTTGGCTTTCGTTTCTGGGCGTAGGTTCGCGTGCGGTTTTCTGGGTGTTTTTTGTGGACTTTAACCGTTACGTCATTTTTTAGTCCTATATATACTCGCTCTGTACTTGGCCCTTTTTACACTGTGACTGATTGAGCTGGTGCCGTGTCGAGTGGTGTTTTTTAATAGGTTTTTTTACTGGTAAGGCTGACTGTTATGGCTGCCGCTGTGGAAGCGCTGTATGTTGTTCTGGAGCGGGAGGGTGCTATTTTGCCTAGGCAGGAGGGTTTTTCAGGTGTTTATGTGTTTTTCTCTCCTATTAATTTTGTTATACCTCCTATGGGGGCTGTAATGTTGTCTCTACGCCTGCGGGTATGTATTCCCCCGGGCTATTTCGGTCGCTTTTTAGCACTGACCGATGTTAACCAACCTGATGTGTTTACCGAGTCTTACATTATGACTCCGGACATGACCGAGGAACTGTCGGTGGTGCTTTTTAATCACGGTGACCAGTTTTTTTACGGTCACGCCGGCATGGCCGTAGTCCGTCTTATGCTTATAAGGGTTGTTTTTCCTGTTGTAAGACAGGCTTCTAATGTTTAAATGTTTTTTTTTTTGTTATTTTATTTTGTGTTTAATGCAGGAACCCGCAGACATGTTTGAGAGAAAAATGGTGTCTTTTTCTGTGGTGGTTCCGGAACTTACCTGCCTTTATCTGCATGAGCATGACTACGATGTGCTTGCTTTTTTGCGCGAGGCTTTGCCTGATTTTTTGAGCAGCACCTTGCATTTTATATCGCCGCCCATGCAACAAGCTTACATAGGGGCTACGCTGGTTAGCATAGCTCCGAGTATGCGTGTCATAATCAGTGTGGGTTCTTTTGTCATGGTTCCTGGCGGGGAAGTGGCCGCGCTGGTCCGTGCAGACCTGCACGATTATGTTCAGCTGGCCCTGCGAAGGGACCTACGGGATCGCGGTATTTTTGTTAATGTTCCGCTTTTGAATCTTATACAGGTCTGTGAGGAACCTGAATTTTTGCAATCATGATTCGCTGCTTGAGGCTGAAGGTGGAGGGCGCTCTGGAGCAGATTTTTACAATGGCCGGACTTAATATTCGGGATTTGCTTAGAGACATATTGATAAGGTGGCGAGATGAAAATTATTTGGGCATGGTTGAAGGTGCTGGAATGTTTATAGAGGAGATTCACCCTGAAGGGTTTAGCCTTTACGTCCACTTGGACGTGAGGGCAGTTTGCCTTTTGGAAGCCATTGTGCAACATCTTACAAATGCCATTATCTGTTCTTTGGCTGTAGAGTTTGACCACGCCACCGGAGGGGAGCGCGTTCACTTAATAGATCTTCATTTTGAGGTTTTGGATAATCTTTTGGAATAAAAAAAAAAAAACATGGTTCTTCCAGCTCTTCCCGCTCCTCCCGTGTGTGACTCGCAGAACGAATGTGTAGGTTGGCTGGGTGTGGCTTATTCTGCGGTGGTGGATGTTATCAGGGCAGCGGCGCATGAAGGAGTTTACATAGAACCCGAAGCCAGGGGGCGCCTGGATGCTTTGAGAGAGTGGATATACTACAACTACTACACAGAGCGAGCTAAGCGACGAGACCGGAGACGCAGATCTGTTTGTCACGCCCGCACCTGGTTTTGCTTCAGGAAATATGACTACGTCCGGCGTTCCATTTGGCATGACACTACGACCAACACGATCTCGGTTGTCTCGGCGCACTCCGTACAGTAGGGATCGCCTACCTCCTTTTGAGACAGAGACCCGCGCTACCATACTGGAGGATCATCCGCTGCTGCCCGAATGTAACACTTTGACAATGCACAACGTGAGTTACGTGCGAGGTCTTCCCTGCAGTGTGGGATTTACGCTGATTCAGGAATGGGTTGTTCCCTGGGATATGGTTCTGACGCGGGAGGAGCTTGTAATCCTGAGGAAGTGTATGCACGTGTGCCTGTGTTGTGCCAACATTGATATCATGACGAGCATGATGATCCATGGTTACGAGTCCTGGGCTCTCCACTGTCATTGTTCCAGTCCCGGTTCCCTGCAGTGCATAGCCGGCGGGCAGGTTTTGGCCAGCTGGTTTAGGATGGTGGTGGATGGCGCCATGTTTAATCAGAGGTTTATATGGTACCGGGAGGTGGTGAATTACAACATGCCAAAAGAGGTAATGTTTATGTCCAGCGTGTTTATGAGGGGTCGCCACTTAATCTACCTGCGCTTGTGGTATGATGGCCACGTGGGTTCTGTGGTCCCCGCCATGAGCTTTGGATACAGCGCCTTGCACTGTGGGATTTTGAACAATATTGTGGTGCTGTGCTGCAGTTACTGTGCTGATTTAAGTGAGATCAGGGTGCGCTGCTGTGCCCGGAGGACAAGGCGTCTCATGCTGCGGGCGGTGCGAATCATCGCTGAGGAGACCACTGCCATGTTGTATTCCTGCAGGACGGAGCGGCGGCGGCAGCAGTTTATTCGCGCGCTGCTGCAGCACCACCGCCCTATCCTGATGCACGATTATGACTCTACCCCCATGTAGGCGTGGACTTCCCCTTCGCCGCCCGTTGAGCAACCGCAAGTTGGACAGCAGCCTGTGGCTCAGCAGCTGGACAGCGACATGAACTTAAGCGAGCTGCCCGGGGAGTTTATTAATATCACTGATGAGCGTTTGGCTCGACAGGAAACCGTGTGGAATATAACACCTAAGAATATGTCTGTTACCCATGATATGATGCTTTTTAAGGCCAGCCGGGGAGAAAGGACTGTGTACTCTGTGTGTTGGGAGGGAGGTGGCAGGTTGAATACTAGGGTTCTGTGAGTTTGATTAAGGTACGGTGATCAATATAAGCTATGTGGTGGTGGGGCTATACTACTGAATGAAAAATGACTTGAAATTTTCTGCAATTGAAAAATAAACACGTTGAAACATAACATGCAACAGGTTCACGATTCTTTATTCCTGGGCAATGTAGGAGAAGGTGTAAGAGTTGGTAGCAAAAGTTTCAGTGGTGTATTTTCCACTTTCCCAGGACCATGTAAAAGACATAGAGTAAGTGCTTACCTCGCTAGTTTCTGTGGATTCACTAGAA

E4 Orf6序列(SEQ ID NO:37)

ATGACTACGTCCGGCGTTCCATTTGGCATGACACTACGACCAACACGATCTCGGTTGTCTCGGCGCACTCCGTACAGTAGGGATCGCCTACCTCCTTTTGAGACAGAGACCCGCGCTACCATACTGGAGGATCATCCGCTGCTGCCCGAATGTAACACTTTGACAATGCACAACGTGAGTTACGTGCGAGGTCTTCCCTGCAGTGTGGGATTTACGCTGATTCAGGAATGGGTTGTTCCCTGGGATATGGTTCTGACGCGGGAGGAGCTTGTAATCCTGAGGAAGTGTATGCACGTGTGCCTGTGTTGTGCCAACATTGATATCATGACGAGCATGATGATCCATGGTTACGAGTCCTGGGCTCTCCACTGTCATTGTTCCAGTCCCGGTTCCCTGCAGTGCATAGCCGGCGGGCAGGTTTTGGCCAGCTGGTTTAGGATGGTGGTGGATGGCGCCATGTTTAATCAGAGGTTTATATGGTACCGGGAGGTGGTGAATTACAACATGCCAAAAGAGGTAATGTTTATGTCCAGCGTGTTTATGAGGGGTCGCCACTTAATCTACCTGCGCTTGTGGTATGATGGCCACGTGGGTTCTGTGGTCCCCGCCATGAGCTTTGGATACAGCGCCTTGCACTGTGGGATTTTGAACAATATTGTGGTGCTGTGCTGCAGTTACTGTGCTGATTTAAGTGAGATCAGGGTGCGCTGCTGTGCCCGGAGGACAAGGCGTCTCATGCTGCGGGCGGTGCGAATCATCGCTGAGGAGACCACTGCCATGTTGTATTCCTGCAGGACGGAGCGGCGGCGGCAGCAGTTTATTCGCGCGCTGCTGCAGCACCACCGCCCTATCCTGATGCACGATTATGACTCTACCCCCATGTAG

VA序列(VA转录物I和II带下划线)(SEQ ID NO:38)

CGTAATCCGTAGATGTACCTGGACATCCAGGTGATGCCGGCGGCGGTGGTGGAGGCGCGCGGAAAGTCGCGGACGCGGTTCCAGATGTTGCGCAGCGGCAAAAAGTGCTCCATGGTCGGGACGCTCTGGCCGGTGAGGCGTGCGCAGTCGTTGACGCTCTAGACCGTGCAAAAGGAGAGCCTGTAAGCGGGCACTCTTCCGTGGTCTGGTGGATAAATTC GCAAGGGTATCATGGCGGACGACCGGGGTTCGAACCCCGGATCCGGCCGTCCGCCGTGATCCATGCGGTTACCGCC CGCGTGTCGAACCCAGGTGTGCGACGTCAGACAACGGGGGAGCGCTCCTTTTGGCTTCCTTCCAGGCGCGGCGGCTGCTGCGCTAGCTTTTTTGGCCACTGGCCGCGCGCGGCGTAAGCGGTTAGGCTGGAAAGCGAAAGCATTAAGTGGCT CGCTCCCTGTAGCCGGAGGGTTATTTTCCAAGGGTTGAGTCGCAGGACCCCCGGTTCGAGTCTCGGGCCGGCCGGA CTGCGGCGAACGGGGGTTTGCCTCCCCGTCATGCAAGACCCCGCTTGCAAATTCCTCCGGAAACAGGGACGAGCCC CTTTTTTGCTTTTCCCAGATGCATCCGGTGCTGCGGCAGATGCGCCCCCCTCCTCAGCAGCGGCAAGAGCAAGAGCAGCGGCAGACATGCAGGGCACCCTCCCCTTCTCCTACCGCGTCAGGAGGGGCAACATCCTACATCGAE1A和E1B的序列均包含在登录号AY339865.1中

Ad5 E1A

可以转录两种蛋白，32kDa蛋白(第一登录号)和27kDa蛋白(第二登录号)。这些均是转录物的剪接变体：

登录1：AAQ19284.1

登录2：AAQ19285.1

(SEQ ID NO:39)ATGAGACATATTATCTGCCACGGAGGTGTTATTACCGAAGAAATGGCCGCCAGTCTTTTGGACCAGCTGATCGAAGAGGTACTGGCTGATAATCTTCCACCTCCTAGCCATTTTGAACCACCTACCCTTCACGAACTGTATGATTTAGACGTGACGGCCCCCGAAGATCCCAACGAGGAGGCGGTTTCGCAGATTTTTCCCGACTCTGTAATGTTGGCGGTGCAGGAAGGGATTGACTTACTCACTTTTCCGCCGGCGCCCGGTTCTCCGGAGCCGCCTCACCTTTCCCGGCAGCCCGAGCAGCCGGAGCAGAGAGCCTTGGGTCCGGTTTCTATGCCAAACCTTGTACCGGAGGTGATCGATCTTACCTGCCACGAGGCTGGCTTTCCACCCAGTGACGACGAGGATGAAGAGGGTGAGGAGTTTGTGTTAGATTATGTGGAGCACCCCGGGCACGGTTGCAGGTCTTGTCATTATCACCGGAGGAATACGGGGGACCCAGATATTATGTGTTCGCTTTGCTATATGAGGACCTGTGGCATGTTTGTCTACAGTCCTGTGTCTGAACCTGAGCCTGAGCCCGAGCCAGAACCGGAGCCTGCAAGACCTACCCGCCGTCCTAAAATGGCGCCTGCTATCCTGAGACGCCCGACATCACCTGTGTCTAGAGAATGCAATAGTAGTACGGATAGCTGTGACTCCGGTCCTTCTAACACACCTCCTGAGATACACCCGGTGGTCCCGCTGTGCCCCATTAAACCAGTTGCCGTGAGAGTTGGTGGGCGTCGCCAGGCTGTGGAATGTATCGAGGACTTGCTTAACGAGCCTGGGCAACCTTTGGACTTGAGCTGTAAACGCCCCAGGCCATAA

(SEQ ID NO:40)

ATGAGACATATTATCTGCCACGGAGGTGTTATTACCGAAGAAATGGCCGCCAGTCTTTTGGACCAGCTGATCGAAGAGGTACTGGCTGATAATCTTCCACCTCCTAGCCATTTTGAACCACCTACCCTTCACGAACTGTATGATTTAGACGTGACGGCCCCCGAAGATCCCAACGAGGAGGCGGTTTCGCAGATTTTTCCCGACTCTGTAATGTTGGCGGTGCAGGAAGGGATTGACTTACTCACTTTTCCGCCGGCGCCCGGTTCTCCGGAGCCGCCTCACCTTTCCCGGCAGCCCGAGCAGCCGGAGCAGAGAGCCTTGGGTCCGGTTTCTATGCCAAACCTTGTACCGGAGGTGATCGATCTTACCTGCCACGAGGCTGGCTTTCCACCCAGTGACGACGAGGATGAAGAGGGTCCTGTGTCTGAACCTGAGCCTGAGCCCGAGCCAGAACCGGAGCCTGCAAGACCTACCCGCCGTCCTAAAATGGCGCCTGCTATCCTGAGACGCCCGACATCACCTGTGTCTAGAGAATGCAATAGTAGTACGGATAGCTGTGACTCCGGTCCTTCTAACACACCTCCTGAGATACACCCGGTGGTCCCGCTGTGCCCCATTAAACCAGTTGCCGTGAGAGTTGGTGGGCGTCGCCAGGCTGTGGAATGTATCGAGGACTTGCTTAACGAGCCTGGGCAACCTTTGGACTTGAGCTGTAAACGCCCCAGGCCATAA

Ad5 E1B_19K

登录：AAQ19286.1

(SEQ ID NO:41)

ATGGAGGCTTGGGAGTGTTTGGAAGATTTTTCTGCTGTGCGTAACTTGCTGGAACAGAGCTCTAACAGTACCTCTTGGTTTTGGAGGTTTCTGTGGGGCTCATCCCAGGCAAAGTTAGTCTGCAGAATTAAGGAGGATTACAAGTGGGAATTTGAAGAGCTTTTGAAATCCTGTGGTGAGCTGTTTGATTCTTTGAATCTGGGTCACCAGGCGCTTTTCCAAGAGAAGGTCATCAAGACTTTGGATTTTTCCACACCGGGGCGCGCTGCGGCTGCTGTTGCTTTTTTGAGTTTTATAAAGGATAAATGGAGCGAAGAAACCCATCTGAGCGGGGGGTACCTGCTGGATTTTCTGGCCATGCATCTGTGGAGAGCGGTTGTGAGACACAAGAATCGCCTGCTACTGTTGTCTTCCGTCCGCCCGGCGATAATACCGACGGAGGAGCAGCAGCAGCAGCAGGAGGAAGCCAGGCGGCGGCGGCAGGAGCAGAGCCCATGGAACCCGAGAGCCGGCCTGGACCCTCGGGAATGA

Ad5 E1B_55K

登录：AAQ19287.1

(SEQ ID NO:42)

ATGGAGCGAAGAAACCCATCTGAGCGGGGGGTACCTGCTGGATTTTCTGGCCATGCATCTGTGGAGAGCGGTTGTGAGACACAAGAATCGCCTGCTACTGTTGTCTTCCGTCCGCCCGGCGATAATACCGACGGAGGAGCAGCAGCAGCAGCAGGAGGAAGCCAGGCGGCGGCGGCAGGAGCAGAGCCCATGGAACCCGAGAGCCGGCCTGGACCCTCGGGAATGAATGTTGTACAGGTGGCTGAACTGTATCCAGAACTGAGACGCATTTTGACAATTACAGAGGATGGGCAGGGGCTAAAGGGGGTAAAGAGGGAGCGGGGGGCTTGTGAGGCTACAGAGGAGGCTAGGAATCTAGCTTTTAGCTTAATGACCAGACACCGTCCTGAGTGTATTACTTTTCAACAGATCAAGGATAATTGCGCTAATGAGCTTGATCTGCTGGCGCAGAAGTATTCCATAGAGCAGCTGACCACTTACTGGCTGCAGCCAGGGGATGATTTTGAGGAGGCTATTAGGGTATATGCAAAGGTGGCACTTAGGCCAGATTGCAAGTACAAGATCAGCAAACTTGTAAATATCAGGAATTGTTGCTACATTTCTGGGAACGGGGCCGAGGTGGAGATAGATACGGAGGATAGGGTGGCCTTTAGATGTAGCATGATAAATATGTGGCCGGGGGTGCTTGGCATGGACGGGGTGGTTATTATGAATGTAAGGTTTACTGGCCCCAATTTTAGCGGTACGGTTTTCCTGGCCAATACCAACCTTATCCTACACGGTGTAAGCTTCTATGGGTTTAACAATACCTGTGTGGAAGCCTGGACCGATGTAAGGGTTCGGGGCTGTGCCTTTTACTGCTGCTGGAAGGGGGTGGTGTGTCGCCCCAAAAGCAGGGCTTCAATTAAGAAATGCCTCTTTGAAAGGTGTACCTTGGGTATCCTGTCTGAGGGTAACTCCAGGGTGCGCCACAATGTGGCCTCCGACTGTGGTTGCTTCATGCTAGTGAAAAGCGTGGCTGTGATTAAGCATAACATGGTATGTGGCAACTGCGAGGACAGGGCCTCTCAGATGCTGACCTGCTCGGACGGCAACTGTCACCTGCTGAAGACCATTCACGTAGCCAGCCACTCTCGCAAGGCCTGGCCAGTGTTTGAGCATAACATACTGACCCGCTGTTCCTTGCATTTGGGTAACAGGAGGGGGGTGTTCCTACCTTACCAATGCAATTTGAGTCACACTAAGATATTGCTTGAGCCCGAGAGCATGTCCAAGGTGAACCTGAACGGGGTGTTTGACATGACCATGAAGATCTGGAAGGTGCTGAGGTACGATGAGACCCGCACCAGGTGCAGACCCTGCGAGTGTGGCGGTAAACATATTAGGAACCAGCCTGTGATGCTGGATGTGACCGAGGAGCTGAGGCCCGATCACTTGGTGCTGGCCTGCACCCGCGCTGAGTTTGGCTCTAGCGATGAAGATACAGATTGA

E2A和E4A的序列均包含在登录号MN088492中

Ad5 E2A orf：

登录：QHX41645.1

(SEQ ID NO:43)

Ad5 E4A：

此ORF中存在两种蛋白质。第一种是包含在ORF中的剪接变体。第二种是存在于ORF中的非剪接转录物。登录1：QHX41659.1

登录2：QHX41660.1

(SEQ ID NO:44)

ATGACTACGTCCGGCGTTCCATTTGGCATGACACTACGACCAACACGATCTCGGTTGTCTCGGCGCACTCCGTACAGTAGGGATCGCCTACCTCCTTTTGAGACAGAGACCCGCGCTACCATACTGGAGGATCATCCGCTGCTGCCCGAATGTAACACTTTGACAATGCACAACGCGTGGACTTCCCCTTCGCCGCCCGTTGAGCAACCGCAAGTTGGACAGCAGCCTGTGGCTCAGCAGCTGGACAGCGACATGAACTTAAGCGAGCTGCCCGGGGAGTTTATTAATATCACTGATGAGCGTTTGGCTCGACAGGAAACCGTGTGGAATATAACACCTAAGAATATGTCTGTTACCCATGATATGATGCTTTTTAAGGCCAGCCGGGGAGAAAGGACTGTGTACTCTGTGTGTTGGGAGGGAGGTGGCAGGTTGAATACTAGGGTTCTGTGA

(SEQ ID NO:45)

Ad5 VA：

登录：AF369965.1

(SEQ ID NO:46)

TCGATGTAGGATGTTGCCCCTCCTGACGCGGTAGGAGAAGGGGAGGGTGCCCTGCATGTCTGCCGCTGCTCTTGCTCTTGCCGCTGCTGAGGAGGGGGGCGCATCTGCCGCAGCACCGGATGCATCTGGGAAAAGCAAAAAAGGGGCTCGTCCCTGTTTCCGGAGGAATTTGCAAGCGGGGTCTTGCATGACGGGGAGGCAAACCCCCGTTCGCCGCAGTCCGGCCGGCCCGAGACTCGAACCGGGGGTCCTGCGACTCAACCCTTGGAAAATAACCCTCCGGCTACAGGGAGCGAGCCACTTAATGCTTTCGCTTTCCAGCCTAACCGCTTACGCCGCGCGCGGCCAGTGGCCAAAAAAGCTAGCGCAGCAGCCGCCGCGCCTGGAAGGAAGCCAAAAGGAGCGCTCCCCCGTTGTCTGACGTCGCACACCTGGGTTCGACACGCGGGCGGTAACCGCATGGATCACGGCGGACGGCCGGATCCGGGGTTCGAACCCCGGTCGTCCGCCATGATACCCTTGCGAATTTATCCACCAGACCACGGAAGAGTGCCCGCTTACAGGCTCTCCTTTTGCACGGTCTAGAGCGTCAACGACTGCGCACGCCTCACCGGCCAGAGCGTCCCGACCATGGAGCACTTTTTGCCGCTGCGCAACATCTGGAACCGCGTCCGCGACTTTCCGCGCGCCTCCACCACCGCCGCCGGCATCACCTGGATGTCCAGGTACATCTACGGATTACG

实例13-启动子、操纵子、IRES和内含子序列

CMV启动子(SEQ ID NO:47)

TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCGTCGACGTTTAGTGAACCG

2xTet操纵子序列(SEQ ID NO:48)

TCCCTATCAGTGATAGAGATCTCCCTATCAGTGATAGAGA

hCMV内含子序列(SEQ ID NO:49)

GTAAGTACCGCCTATAGAGTCTATAGGCCCACCCCCTTGGCTTCTTATGCATGCTATACTGTTTTTGGCTTGGGGTCTATACACCCCCGCTTCCTCATGTTATAGGTGATGGTATAGCTTAGCCTATAGGTGTGGGTTATTGACCATTATTGACCACTCCCCTATTGGTGACGATACTTTCCATTACTAATCCATAACATGGCTCTTTGCCACAACTCTCTTTATTGGCTATATGCCAATACACTGTCCTTCAGAGACTGACACGGACTCTGTATTTTTACAGGATGGGGTCTCATTTATTATTTACAAATTCACATATACAACACCACCGTCCCCAGTGCCCGCAGTTTTTATTAAACATAACGTGGGATCTCCACGCGAATCTCGGGTACGTGTTCCGGACATGGTCTCTTCTCCGGTAGCGGCGGAGCTTCTACATCCGAGCCCTGCTCCCATGCCTCCAGCGACTCATGGTCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGGCCAGACTTAGGCACAGCACGATGCCCACCACCACCAGTGTGCCGCACAAGGCCGTGGCGGTAGGGTATGTGTCTGAAAATGAGCTCGGGGAGCGGGCTTGCACCGCTGACGCATTTGGAAGACTTAAGGCAGCGGCAGAAGAAGATGCAGGCAGCTGAGTTGTTGTGTTCTGATAAGAGTCAGAGGTAACTCCCGTTGCGGTGCTGTTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGCCGCGCGCGCCACCAGACATAATAGCTGACAGACTAACAGACTGTTCCTTTCCATGGGTCTTTTCTGCAG

ECMV IRES序列(SEQ ID NO:50)

CCCCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATTGCTCGAATCACC

FMDVIRES(SEQ ID NO:51)

AGCAGGTTTCCCCAACTGACACAAAACGTGCAACTTGAAACTCCGCCTGGTCTTTCCAGGTCTAGAGGGGTAACACTTTGTACTGTGTTTGGCTCCACGCTCGATCCACTGGCGAGTGTTAGTAACAGCACTGTTGCTTCGTAGCGGAGCATGACGGCCGTGGGAACTCCTCCTTGGTAACAAGGACCCACGGGGCCAAAAGCCACGCCCACACGGGCCCGTCATGTGTGCAACCCCAGCACGGCGACTTTACTGCGAAACCCACTTTAAAGTGACATTGAAACTGGTACCCACACACTGGTGACAGGCTAAGGATGCCCTTCAGGTACCCCGAGGTAACACGCGACACTCGGGATCTGAGAAGGGGACTGGGGCTTCTATAAAAGCGCTCGGTTTAAAAAGCTTCTATGCCTGAATAGGTGACCGGAGGTCGGCACCTTTCCTTTACAATTAATGACCCT

实例14-CHO和小鼠稳定位点1序列-美国专利第7,771,997号

211>6473

<212>DNA

<213>中国地鼠(Cricetulus griseus)

<400>1

(SEQ ID NO:52)

/>

<211>7045

<212>DNA

<213>中国地鼠

<400>2

(SEQ ID NO:53)

/>

<211>6473

<212>DNA

<213>中国地鼠

<400>3

(SEQ ID NO:54)

/>

<211>7045

<212>DNA

<213>中国地鼠

<400>4

(SEQ ID NO:55)

/>

<211>13515

<212>DNA

<213>中国地鼠

<400>5

(SEQ ID NO:56)

/>

<211>14553

<212>DNA

<213>小家鼠(Mus musculus)

<400>6

(SEQ ID NO:57)

/>

实例15-CHO稳定位点2序列-美国专利第9,816,110号

<211>4001

<212>DNA

<213>中国地鼠

<400>1

(SEQ ID NO:58)

/>

<211>14931

<212>DNA

<213>中国地鼠

<220>

<221>misc_feature

<222>(2176)..(2239)

<223>n是a、c、g、t或者核苷酸丢失

<400>4

(SEQ ID NO:59)

/>

应当理解，描述、具体实例和数据虽然指示了示例性实施例，但是以说明的方式给出的，并不旨在限制本发明。根据本文所包含的讨论、公开和数据，本发明内的各种改变和修改，包含整体和部分地组合实施例，对本领域技术人员来说将变得显而易见，并且因此被认为是本发明的一部分。

Claims

1.一种多核苷酸，其包括(i)启动子，(ii)内含子，(iii)内部核糖体进入位点，(iv)编码腺相关病毒(AAV)Cap蛋白的多核苷酸，以及(v)聚腺苷酸化位点，其中所述多核苷酸允许产生AAV Cap VP2和VP3。

2.根据权利要求1所述的多核苷酸，其中所述多核苷酸处于CHO细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)内部核糖体进入位点和所述(iv)编码AAV Cap蛋白的多核苷酸可操作地连接。

3.根据权利要求2所述的多核苷酸，其中所述多核苷酸被整合到CHO细胞基因组或BHK细胞基因组中。

4.根据权利要求1所述的多核苷酸，其中所述多核苷酸处于HEK 293细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)内部核糖体进入位点和所述(iv)编码AAV Cap蛋白的多核苷酸可操作地连接。

5.根据权利要求2所述的多核苷酸，其中所述多核苷酸被整合到HEK 293细胞基因组或人羊膜细胞基因组中。

6.根据权利要求1所述的多核苷酸，其进一步包括操纵子。

7.根据权利要求6所述的多核苷酸，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

8.一种多核苷酸，其包括(i)启动子，(ii)内含子，(iii)第一内部核糖体进入位点，(iv)编码AAV Cap蛋白的第一多核苷酸，(v)第二内部核糖体进入位点，(vi)编码AAV Cap蛋白的第二多核苷酸，以及(vii)聚腺苷酸化位点。

9.根据权利要求8所述的多核苷酸，其中所述多核苷酸处于CHO细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可操作地连接。

10.根据权利要求9所述的多核苷酸，其中所述多核苷酸被整合到CHO细胞基因组或BHK细胞基因组中。

11.根据权利要求8所述的多核苷酸，其中所述多核苷酸处于HEK 293细胞中，并且所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可操作地连接。

12.根据权利要求11所述的多核苷酸，其中所述多核苷酸被整合到HEK 293细胞基因组或人羊膜细胞基因组中。

13.根据权利要求8所述的多核苷酸，其进一步包括操纵子。

14.根据权利要求13所述的多核苷酸，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

15.一种多核苷酸，其包括(i)启动子，(ii)内含子，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点，其中所述多核苷酸允许在被表达时产生AAV Cap VP1蛋白。

16.根据权利要求15所述的多核苷酸，其中所述多核苷酸处于CHO细胞中，并且所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可操作地连接。

17.根据权利要求16所述的多核苷酸，其中所述多核苷酸被整合到CHO细胞基因组或BHK细胞基因组中。

18.根据权利要求15所述的多核苷酸，其中所述多核苷酸处于HEK 293细胞中，并且所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可操作地连接。

19.根据权利要求16所述的多核苷酸，其中所述多核苷酸被整合到HEK 293细胞基因组或人羊膜细胞基因组中。

20.根据权利要求15所述的多核苷酸，其进一步包括操纵子。

21.根据权利要求20所述的多核苷酸，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

22.一种多核苷酸，其包括(i)启动子，(ii)内部核糖体结合位点，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点，其中所述多核苷酸允许在被表达时产生AAV VP1Cap蛋白。

23.根据权利要求22所述的多核苷酸，其中所述多核苷酸处于CHO细胞中，并且所述(i)启动子、所述(ii)内部核糖体结合位点和所述(iii)编码AAV Cap蛋白的多核苷酸可操作地连接。

24.根据权利要求23所述的多核苷酸，其中所述多核苷酸被整合到CHO基因组或BHK细胞基因组中。

25.根据权利要求22所述的多核苷酸，其中所述多核苷酸处于HEK 293细胞中，并且所述(i)启动子、所述(ii)内部核糖体结合位点和所述(iii)编码AAV Cap蛋白的多核苷酸可操作地连接。

26.根据权利要求25所述的多核苷酸，其中所述多核苷酸被整合到HEK 293细胞基因组或人羊膜细胞基因组中。

27.根据权利要求22所述的多核苷酸，其进一步包括操纵子。

28.根据权利要求27所述的多核苷酸，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

29.一种包括多核苷酸的真核细胞，所述多核苷酸包括(i)启动子，(ii)内含子，(iii)第一内部核糖体进入位点，(iv)编码AAV Cap蛋白的第一多核苷酸，(v)第二内部核糖体进入位点，(vi)编码AAV Cap蛋白的第二多核苷酸，以及(vii)聚腺苷酸化位点。

30.根据权利要求29所述的细胞，其中所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可操作地连接。

31.根据权利要求30所述的细胞，其中所述多核苷酸被整合到细胞基因组中。

32.根据权利要求29所述的细胞，其中所述细胞是CHO细胞或BHK细胞。

33.根据权利要求29所述的细胞，其中所述细胞是HEK 293细胞或人羊膜细胞。

34.根据权利要求29所述的细胞，其进一步包括操纵子。

35.根据权利要求34所述的细胞，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

36.根据权利要求29所述的细胞，其进一步包括：

编码AAV Rep的多核苷酸；

编码Ad E1A的多核苷酸；

编码Ad E1B的多核苷酸；

编码Ad E2A或E2A orf的多核苷酸；

编码Ad E4或E4 orf 6的多核苷酸；

编码VA RNA的多核苷酸；以及

编码AAV ITR和所关注蛋白的多核苷酸。

37.一种真核细胞，其包括

(A)第一多核苷酸，所述第一多核苷酸包括(i)启动子，(ii)内含子，(iii)内部核糖体进入位点，(iv)编码AAV Cap蛋白的多核苷酸，以及(v)聚腺苷酸化位点；以及

(B)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内含子，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点。

38.根据权利要求37所述的细胞，其中

(A)第一多核苷酸的所述(i)启动子、所述(ii)内含子、所述(iii)内部核糖体进入位点和所述(iv)编码AAV Cap蛋白的多核苷酸可操作地连接，并且其中

(B)第二多核苷酸的所述(i)启动子、所述(ii)内含子和所述(iii)编码AAV Cap蛋白的多核苷酸可操作地连接。

39.根据权利要求38所述的细胞，其中至少一个多核苷酸被整合到细胞基因组中。

40.根据权利要求37所述的细胞，其中所述细胞是CHO细胞或BHK细胞。

41.根据权利要求37所述的细胞，其中所述细胞是HEK 293细胞或人羊膜细胞。

42.根据权利要求37所述的细胞，其进一步包括操纵子。

43.根据权利要求42所述的细胞，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

44.根据权利要求37所述的细胞，其进一步包括：

编码AAV Rep的多核苷酸；

编码Ad E1A的多核苷酸；

编码Ad E1B的多核苷酸；

编码Ad E2A或E2A orf的多核苷酸；

编码Ad E4或E4 orf 6的多核苷酸；

编码VA RNA的多核苷酸；以及

编码AAV ITR和所关注蛋白的多核苷酸。

45.一种真核细胞，其包括

(B)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内部核糖体进入位点，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点。

46.根据权利要求45所述的细胞，其中

(B)第二多核苷酸的所述(i)启动子、所述(ii)内部核糖体进入位点和所述(iii)编码AAV Cap蛋白的多核苷酸可操作地连接。

47.根据权利要求46所述的细胞，其中至少一个多核苷酸被整合到细胞基因组中。

48.根据权利要求45所述的细胞，其中所述细胞是CHO细胞或BHK细胞。

49.根据权利要求45所述的细胞，其中所述细胞是HEK 293细胞或人羊膜细胞。

50.根据权利要求45所述的细胞，其进一步包括操纵子。

51.根据权利要求50所述的细胞，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

52.根据权利要求45所述的细胞，其进一步包括：

编码AAV Rep的多核苷酸；

编码Ad E1A的多核苷酸；

编码Ad E1B的多核苷酸；

编码Ad E2A或E2A orf的多核苷酸；

编码E4或E4 orf 6的多核苷酸；

编码VA RNA的多核苷酸；以及

编码AAV ITR和所关注蛋白的多核苷酸。

53.一种细胞培养物，其包括培养基中的多于一个根据权利要求29至36所述的细胞。

54.一种细胞培养物，其包括培养基中的多于一个根据权利要求37至44所述的细胞。

55.一种细胞培养物，其包括培养基中的多于一个根据权利要求45至52所述的细胞。

56.一种在细胞培养物中产生腺相关病毒(AAV)Cap蛋白的方法，其中所述方法包括以下步骤：

提供真核细胞，其中细胞包括多核苷酸，所述多核苷酸包括(i)启动子，(ii)内含子，(iii)第一内部核糖体进入位点，(iv)编码AAV Cap蛋白的第一多核苷酸，(v)

第二内部核糖体进入位点，(vi)编码AAV Cap蛋白的第二多核苷酸，以及(vii)聚腺苷酸化位点；以及

在培养基中培养所述细胞以允许所述细胞产生AAV Cap蛋白。

57.根据权利要求56所述的方法，其中所述(i)启动子、所述(ii)内含子、所述(iii)第一内部核糖体进入位点、所述(iv)编码AAV Cap蛋白的第一多核苷酸、(v)第二内部核糖体进入位点和所述(vi)编码AAV Cap蛋白的第二多核苷酸可操作地连接。

58.根据权利要求57所述的方法，其中所述多核苷酸被整合到细胞基因组中。

59.根据权利要求56所述的方法，其中所述细胞是CHO细胞或BHK细胞。

60.根据权利要求56所述的方法，其中所述细胞是HEK 293细胞或人羊膜细胞。

61.根据权利要求56所述的方法，其中所述细胞进一步包括操纵子。

62.根据权利要求61所述的方法，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

63.根据权利要求56所述的方法，其中所述细胞进一步包括：

编码AAV Rep的多核苷酸；

编码Ad E1A的多核苷酸；

编码Ad E1B的多核苷酸；

编码Ad E2A或E2A orf的多核苷酸；

编码E4或E4 orf 6的多核苷酸；

编码VA RNA的多核苷酸；以及

编码AAV ITR和所关注蛋白的多核苷酸，其中所述细胞能够产生重组AAV。

64.一种在细胞培养物中产生腺相关病毒(AAV)Cap蛋白的方法，其中所述方法包括以下步骤：

提供真核细胞，其中细胞包括

(b)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内含子，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点；以及

在培养基中培养所述细胞以允许所述细胞产生AAV Cap蛋白，其中所述多核苷酸允许产生AAV Cap蛋白VP1、VP2和VP3。

65.根据权利要求64所述的方法，其中

66.根据权利要求64所述的方法，其中所述多核苷酸被整合到细胞基因组中。

67.根据权利要求64所述的方法，其中所述细胞是CHO细胞或BHK细胞。

68.根据权利要求64所述的方法，其中所述细胞是HEK 293细胞或人羊膜细胞。

69.根据权利要求64所述的方法，其中所述细胞进一步包括操纵子。

70.根据权利要求69所述的方法，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

71.根据权利要求64所述的方法，其中所述细胞进一步包括：

编码AAV Rep的多核苷酸；

编码Ad E1A的多核苷酸；

编码Ad E1B的多核苷酸；

编码Ad E2A或E2A orf的多核苷酸；

编码Ad E4或E4 orf 6的多核苷酸；

编码VA RNA的多核苷酸；以及

72.一种在细胞培养物中产生腺相关病毒(AAV)Cap蛋白的方法，其中所述方法包括以下步骤：

提供真核细胞，其中细胞包括

(b)第二多核苷酸，所述第二多核苷酸包括(i)启动子，(ii)内部核糖体进入位点，(iii)编码AAV Cap蛋白的多核苷酸，以及(iv)聚腺苷酸化位点；以及

73.根据权利要求72所述的方法，其中

74.根据权利要求72所述的方法，其中所述多核苷酸被整合到细胞基因组中。

75.根据权利要求72所述的方法，其中所述细胞是CHO细胞或BHK细胞。

76.根据权利要求72所述的方法，其中所述细胞是HEK 293细胞或人羊膜细胞。

77.根据权利要求72所述的方法，其中所述细胞进一步包括操纵子。

78.根据权利要求77所述的方法，其中所述启动子是CMV启动子，并且所述操纵子是Tet操纵子。

79.根据权利要求72所述的方法，其中所述细胞进一步包括：

编码AAV Rep的多核苷酸；

编码Ad E1A的多核苷酸；

编码Ad E1B的多核苷酸；

编码Ad E2A或E2A orf的多核苷酸；

编码Ad E4或E4 orf 6的多核苷酸；

编码VA RNA的多核苷酸；以及

80.一种根据前述方法中的任一种方法的细胞。

81.一种使用前述细胞中的任一种细胞的方法。